大学英语成绩测试中单项技能的性别差异研究

大学英语成绩测试中单项技能的性别差异研究

摘  要:本研究采用随机抽样,对大学英语成绩测试中的男女语言能力差异进行研究,运用SPSS对数据样本进行相关,配对样本T检验,回归和因素分析,结果发现:(1) 男女生的总成绩成边际性差异,男女生分项成绩在词汇语法、翻译方面有显著性差异;(2)对男生成绩预测最强的是阅读和听力,对女生成绩预测最强的是阅读和完型;(3) 该测试中,男生主要体现了“一般语言能力”(总要体现在词汇语法和阅读上)和“产生性运用技能”(表现在写作和翻译上),女生主要体现了“一般语言能力”(主要体现在完型和写作上)和“理解判断能力”(表现在阅读和听力上)。

关键词:成绩测试;性别差异;语言能力

      测试是教学中的一个重要环节。测试的目的之一就是对参加测试考生的英语能力做出判定。测试所得分数能否准确的反映被试者的的真实水平取决于测试效度的高低。而效度是指“一个考试对其所测得语言能力能够测到的程度,它是针对某一目的,正确的解释和使用分数的问题”(邹申[1],1998:254)。而“证明效度的过程首先要从分数反映出来的推论和使用开始”(修旭东[2],2002:46)。所以要对考生能力进行准确的判断,就要对测试成绩进行推论和分析。

      成绩测试(achievement test)是以教学大纲为依据,以教材为参照,检测教师的教学内容,检查学生在一段时间内对所学课程的掌握情况。成绩测试虽然不像高考和其它全国性大规模测试那样可以直接影响考生的命运,但它在一定程度上影响着学生的生活和学习,影响着学生能否获得奖学金和是否重修甚至退学,成绩测试的结果甚至直接影响着学习动机和学习兴趣,所以研究大学英语成绩测试也是必要的。近些年也有一些英语成绩测试的研究(王天发,钟凌[3],2006;田禾,薛荷仙[4],2004;马雪梅[5],2006;赵其娟,赵其顺[6],2006;杨晓慧[7],2002;路岱玲[8],2006;周越美,张艳莉[9],2002),但将英语成绩测试和性别差异结合的研究尚不多见。

      一 性别差异研究

      自Holmes[10](1991)发表“语言与性别”以来,在外语教育领域,与性别相关的研究不断增加,而且范围不断扩大。国外在该领域的研究主要集中在语言学习、语言能力、二语习得、学习动机、学习投入、学习风格、学习策略、课堂互动、教学内容、语言测试、教师行动和教师教育等方面(Sunderland[11], 2000:204)。而国内的相关研究多集中在性别与语言(许力生[12],1997;刘莹[13],2001)、性别与语言学习(杨超美[14],1999;张萍[15],2002;姚本先,陶龙泽[16],2004;)、学习风格和学习策略中的性别差异(徐亮[17],2001;张立帆[18],2004;闵祖传[19],2003;文秋芳, 王立非[20],2004)、课堂教学(吴静,王瑞东[21],1997;秦泗武[22],2002;黄崇岭[23],2004;袁凤识[24][25],2003,2004)等方面。

      可以看出,研究者对男女生成绩差异的研究多从学习者的因素来探讨,而结合试卷的构成来分析性别差异的研究并不多。张彬[26]等(2004)研究了性别与成绩的相关关系表明性别与成绩有显著性的差异,但该研究没有对单项技能的差异进行探讨。聂建中[27](1998)对英语专业四级考试与语言技能进行了分析;李菡[28](2002)对博士研究生的口语、听力、阅读、写作、翻译的自我评价和实际测试的相关性进行了分析;杨斐翡[29]等(2000)研究了115名被试的英语专业八级考试分项成绩与总成绩的相关关系,但这三项研究都没从性别的角度探讨差异性。许保芳[30]等(2007)对TEM4中单项技能和性别差异进行了研究,但大学英语校内成绩测试又如何呢?本研究对大学英语成绩测试中的单项技能和性别差异进行了研究,具体回答的问题是:(1)在大学英语成绩测试中,男女生在单项技能方面是否有差异?如果有,差异程度如何?(2)男女生在该测试中所表现出来的语言能力是否有差异?

      二 研究方法

      (一)研究对象

      本研究采取随机抽样,抽取中国农业大学(烟台)2007级英语四级班共106名学生,其中男生66名,女生40名分别来自全校四个学院不同专业。

      (二)研究工具

      本研究的研究工具包括本校2008年一套大学英语四级期末考试试题和其成绩,用SPSS统计软件对数据进行分析。该试题的考试内容、考试形式在期末教研室会议上讨论过,题型和权重分布如下:写作15%,听力25%,词汇语法15%,阅读30%,完型10%,翻译5%,其中选择题90道,占80%,主观题6道,占20%。

      (三)数据收集和处理

      将学生的总成绩和每道大题的分项成绩输入电脑,用SPSS统计软件进行处理。

      三  结果与讨论

      (一) 男女生分项相关分析

      表 1 男生成绩测试各项相关系数

      Table 1 Correlations of items for males

      写作 听力 词汇语法 阅读 完型 翻译 总分

      写作 1      

      听力 .321 1     

             .068      

      词汇

      语法 .176 .499** 1    

 .326 .003     

      阅读 .294 .405* .527** 1   

 .097 .019 .002    

      完型 .082 .332 .606** .410* 1  #p#分页标题#e#

 .651 .059 .000 .018   

      翻译 .441* .349* .445** .281 .365* 1 

 .010 .047 .010 .113 .037  

      总分 .427* .707** .780** .871** .614** .517** 1

 .013 .000 .000 .000 .000 .002 

      * Correlation is significant at the 0.05 level;

      ** Correlation is significant at the 0.01 level

      表2 女生成绩测试各项相关系数

      Table 2 Correlations of items for females

 写作 听力 词汇语法 阅读 完型 翻译 总分

      写作 1      

      听力 .095 1     

 .559      

      词汇

      语法 .301 -.022 1    

 .059 .891     

      阅读 .166 .394* .259 1   

 .306 .012 .106    

      完型 .488** .323* .306* .272 1  

 .001 .042 .023 .090   

      翻译 .436** -.041 .224 -.247 .298 1 

 .005 .803 .165 .124 .062  

      总分 .393* .610** .439** .902** .547** -.008 1

 .012 .000 .005 .000 .000 .961 

      * Correlation is significant at the 0.05 level;

      ** Correlation is significant at the 0.01 level

      一般来讲,在一个试题内部,如果两个单项之间的相关系数太大,则说明两部分考得是相同的能力,是不必要的重复,所以可以删除一部分;如果两个单项的相关系数太低,则又表明两者之间测的是完全不同的能力。杨惠中[31](1999:61)认为“就语言测试而言,各部分之间的相关系数在0.3—0.7之间是合适的”。该成绩测试中男女生各单项的相关内部系数分析见表1和表2。

      表1和表2表明,男女生在写作、听力、词汇语法、阅读、完型和翻译六项内部相关系数均在0.3-0.7之间。男生各单项与总成绩的相关系数由高到低依次是:阅读、词汇语法、听力、完型、翻译和写作;女生各单项与总成绩的相关系数由高到低依次是:阅读、听力、完型、词汇语法和写作,奇怪的是,女生的翻译分数和总分数不相关,将试卷进行分析发现,该部分由五个句子组成,将其中的部分汉语译成英语,满分为5份,该部分女生有60%得5分,10%得4.5分,30%得4分。由此可见,对女生来言,该题项的区分度和难度都较低,这会影响整个试卷的信度。

      需要指出的是,无论男女,写作与总成绩的相关系数都低于其他各项与总成绩的相关系数,这与杨斐翡等(2000)和许保芳等(2007)的研究成果相一致,说明写作对总成绩的影响最弱。杨斐翡等(2000)认为原因有二:一是写作体现的是考生的综合素质,某些考生综合素质与单项技能没有得到同时发展;二是写作作为主观测试题目,评卷教师的个体差异与试卷标准掌握的细微差别也可能导致这种偏差。就此次成绩测试而言,作者更倾向于第二种解释。因为校内成绩测试都是任课教师自行改卷,而写作作为主观测试,要求评分员在短时间内作出评判,这些会导致试卷的信度降低。作为主观测试的的写作,就同一篇作文而言,不同的评分员从不同的角度出发,可以得到不同的分数,即使有详细的评分标准,在实施过程中,也会因为时间、工作量以及评分员的侧重不一样而发生改变。所以为保证写作测试的信度和效度、提高阅卷的质量,在评分时应至少采取两人轮流单独评分,对于分差在3分以内的可以直接计算二者的平均分,若分差超过三分以上,可请第三评分员单独评分或者二者商量再一次评分。

      (二) 分项成绩的性别差异 

      表 3 男女生分项成绩T检验结果

      Table 3 Paired Sampled Tests of items for testees

      性 别

      项 目 男生 女生 

      T 值 

      显著性

 平均分 标准差 平均分 标准差  

      写作 11.667 1.0801 12.100 .9679 -1.381 .177

      听力 13.485 3.0936 14.300 2.5152 -1.378 .178

      词汇语法 8.864 2.6258 11.100 1.5009 -3.667 .001

      阅读 18.121 6.0403 19.500 6.2197 -.803 .428

      完型 4.500 1.4142 4.975 1.1757 -1.530 .136

      翻译 4.167 .9071 4.650 .4617 -2.617 .013#p#分页标题#e#

      总分 60.803 11.2909 66.625 8.8256 -1.992 .055

      表3显示了男女生的分项成绩配对样本T检验结果,女生的平均成绩比男生的平均成绩高5.822分,女生其它分项成绩均高于男生,除阅读外,女生分项成绩的标准差比男生的标准差低,说明女生整体表现要比男生好,而且成绩比男生的成绩更加集中。但是T检验结果表明,男女生的总成绩成边际性差异(t=-1.992,P=.055),男女生分项成绩有显著性差异是词汇语法(t=-3.667,P<.01)、翻译(t=-2.617,P<.05),在其它单项上没有统计上的显著性差异。这说明该测试男女生成绩间的差异主要是由词汇语法和翻译引起的。

      (三) 回归分析

      表4 男生分项成绩与总成绩回归结果

      Table 4 Regression results of items for males

      Model R R

      Square Std. Error of the Estimate R Square Change F

      Change Unstandardized

      Coefficients   B

      1 .871 .758 5.6458 .758 96.984 31.316

      2 .953 .908 3.5349 .150 49.079 16.261

      3 .986 .972 1.9874 .064 65.912 13.662

      4 .993 .986 1.4352 .014 27.608 9.713

      5 .997 .993 .9968 .008 31.045 8.904

      6 1.000 1.000 .0000 .007  4.848

      说明:1. Predictors:(constant),阅读

            2. Predictors:(constant),阅读,听力

            3. Predictors:(constant),阅读,听力,词汇语法

            4. Predictors:(constant),阅读,听力,词汇语法,翻译

            5. Predictors:(constant),阅读,听力,词汇语法,翻译,完型

            6. Predictors:(constant),阅读,听力,词汇语法,翻译,完型,写作

      表5 女生分项成绩与总成绩回归结果

      Table 5 Regression results of items for males

      Model R R

      Square Std. Error of the Estimate R Square Change F

      Change Unstandardized

      Coefficients   B

      1 .902 .814 3.9056 .814 79.023 41.653

      2 .955 .913 2.7548 .098 19.179 31.928

      3 .978 .956 2.0279 .043 15.374 24.435

      4 .993 .986 1.1826 .030 32.049 13.399

      5 .999 .998 .4350 .012 96.878 2.119

      6 1.000 1.000 .0000 .002  1.599

      说明:1. Predictors:(constant),阅读

      2. Predictors:(constant),阅读,完型

      3. Predictors:(constant),阅读,完型,听力

      4. Predictors:(constant),阅读,完型,听力,词汇语法,

      5. Predictors:(constant),阅读,完型,听力,词汇语法,写作

      6. Predictors:(constant),阅读,完型,听力,词汇语法,写作,翻译

      本研究采用逐步进入法(stepwise)对男女生分项成绩和总成绩进行了回归分析。表4、表5显示了分项成绩和总成绩的回归分析结果。

      表4显示,阅读理解作为第一个变量进入回归方程,可解释男生成绩变异的75.8%,听力作为第二个变量进入方程,对男生英语成绩变异的解释增加了15%,阅读和听力共解释男生英语成绩变异的90.8%,也就是说,男生英语成绩中有90.8%是由阅读和听力两个部分引起的,其他各项的预测效果较小。表5显示,阅读作为第一个变量进入回归方程,可解释女生成绩变异的81.4%,完型作为第二个变量进入方程,对女生英语成绩变异的解释增加了9.8%,阅读和完型共解释女生英语成绩变异91.3%,也就是说,女生英语成绩中有91.3%是由阅读和完型两个部分引起的。

      由上可见,阅读理解成绩对于男女生成绩的影响都很高,这与表1、表2研究相一致。影响男生英语成绩的主要因素是阅读,其次是听力和词汇语法,而影响女生英语成绩的主要因素是阅读,其次是完型和听力。

      (四) 因素分析

      本研究采用主成分分析法对男女成绩进行了因子分析。表6是男女生的总方差分析结果。结果显示,对于男女生而言,都只有两个因素的特征值大于1,说明该测试只测了考生两种能力。表7显示,在被试六个部分的考试内容中,因素1的负荷最大,各部分分别在0.4-0.8之间,可以看作是“一般语言能力”(杨惠中, 1999:61)。在因素2中,男女生之间存在差异。男生因素2仅表现在写作和翻译上,写作是一种输出型技能测试,它不仅测试了考生的词汇语法等要素,还考察了考生的组织、分析、表达和综合等能力,写作测试测量的是考生“产生性运用技能”(刘润清,韩宝成[32],2004:186)。本次翻译试题采用的是没有短文上下文的单句、短语或常用表达的汉译英。如:People from the South of China find it difficult to (适应北方的气候),(参考答案是adapt themselves to the climate in Northern China)。这种题目看似是翻译题,实际上测试的并非翻译能力,而更像一种变相的书面表达能力,该题主要是用汉语作为引子,测试学生是否能用一定的英语语法和词汇结构进行书面表达。如上例中主要用来测试学生是否会用adapt to这一结构的用法。因此,这种脱离了篇章的翻译实际上不是一种真正的翻译测试,而主要测试学生的词汇、表达能力。所以,男生因素2可定义为“产生性运用技能”。#p#分页标题#e#

      女生因素2仅表现在阅读和听力上,“人们倾向将阅读能力看成是一个由众多不同类型、不同层次的小能力或次能力组合而成的概念…主要包括掌握所读材料的主旨和大意…理解上下文的逻辑关系;根据所读材料进行一定的判断、推论”(刘润清,韩宝成,2004:106),而听力测试同阅读一样“是获取信息的一种手段…包括掌握所听材料的中心思想和重要环节…判判断说话人的观点和态度” (刘润清,韩宝成,2004:138)。虽然不能对女生因素2进行准确的命名,但是阅读和听力体现出来的似乎应该是“理解和判断能力”。

      总的说来,该试题测试男女生的能力上有差异。男生因素1所代表的“一般语言能力”可解释总方差的48.026%,主要体现在词汇语法和阅读上,女生因素1所代表的“一般语言能力”可解释总方差的36.726%,主要体现在完型和写作上。男生的因素2所代表的“产生性运用技能”可解释方差的17.676%,仅表现在写作和翻译上, 女生的因素2所代表的“理解判断能力”可解释方差的24.782%,仅表现在阅读和听力上。

      表 6 男女生总方差分析结果

      Table 6 Total variance explained for testees

      男生 女生

      Component Total % of Variance Cumulative % Component Total % of Variance Cumulative %

      1 2.882 48.026 48.026 1 2.204 36.726 36.726

      2 1.061 17.676 65.702 2 1.487 24.782 61.507

      3 .711 11.854 77.557 3 .913 15.210 76.717

      4 .599 9.978 87.534 4 .576 9.595 86.312

      5 .420 7.001 94.536 5 .472 7.865 94.178

      6 .328 5.464 100.000 6 .349 5.822 100.000

      表 7 男女生因子分析矩阵

      Table 7 Component matrix for testees

      男生 女生

 Component  Component

 1 2  1 2

      写作 .499 .774 写作 .753 -.278

      听力 .706 7.621E-02 听力 .399 .622

      词汇语法 .819 -.322 词汇语法 .612 -.104

      阅读 .713 -.117 阅读 .451 .727

      完型 .698 -.470 完型 .817 3.835E-02

      翻译 .683 .344 翻译 .483 -.694

      四 结语

      本研究对大学英语成绩测试中的男女语言能力差异程度进行了分析,结果发现:

      (1) 男女生的总成绩成边际性差异,男女生分项成绩有显著性差异是词汇语法、翻译,在其它单项上没有统计上的显著性差异;(2)对男生成绩预测最强的是阅读和听力,对女生成绩预测最强的是阅读和完型;(3) 该测试中,男生主要体现了“一般语言能力”(总要体现在词汇语法和阅读上)和“产生性运用技能”(表现在写作和翻译上),女生主要体现了“一般语言能力”(主要体现在完型和写作上)和“理解判断能力”(表现在阅读和听力上)。

      本研究的启示:(1)英语测试中,主观试题的评分尤其是作文的评分,应该至少两人评分,对分差在1-2分之间的,计算其平均分,分差在3分以上的,再由其共同评定;(2)英语测试中,加强性别差异与语言测试的效度和信度的研究,应减少性别差异对测试的影响;(3)加强试题效度的检验和研究,减少除语言因素外其他因素对考生成绩的的影响。

      本研究的限制:本研究受样本和研究工具的限制。尽管样本是通过随机抽样,但样本较少,会对研究结果产生影响,以后可以扩大样本加强英语考试的效度检验;本研究对男女生在语言测试中体现出来的差异进行了分析,但这种差异到底多大程度由男女生语言能力等因素引起的还未探讨,以后可通过访谈、有声思维实验等对考生和试卷进行研究。

参考文献:

[1]邹申.英语语言测试——理论与操作[M].上海:上海外语教育出版社,1998:254

[2]修旭东.中外语言测试基本理论与实践[M].青岛:青岛海洋大学出版社,2002:46

[3]王天发,钟凌.大学英语成绩考试结构效度研究[J].海南大学学报人文社会科学版,2006,(2): 274-280

[4]田禾,薛荷仙.对大学英语四级模拟试题的效度分析[J].西华大学学报(哲学社会科学版),2004,(2):56-57

[5]马雪梅.大学英语成绩测试的设计与思考[D].上海:上海外国语大学, 2006:29-90

[6] 赵其娟,赵其顺.大学英语成绩测试中的信度和效度[J].吉首大学学报(社会科学版),2006,(3):159-162

[7]杨晓慧.英语测试的试卷设计[J].太原大学学报,2002,(2):17-20

[8]路岱玲.校内英语水平测试效度实证研究[D].长春:东北师范大学,2006:28-38

[9]周越美,张艳莉.透视大学英语教学考试质量——案例分析[J].外语界,2002,(6):71-78

[10] Holmes, J. Language and gender [J]. Language Teaching, 1991, (24):207-220#p#分页标题#e#