差生考试总结范例6篇

差生考试总结

差生考试总结范文1

独立学院CET4成绩英语入学测试一、前言

大学英语四级考试是一种尺度相关——常模参照考试,自1987年诞生以来,它始终是语言测试领域备受关注和研究的热点。迄今为止,仅就四级成绩而言,已有不少学者对它进行了大量研究,如刘春鱼对大学生英语四、六级考试成绩性别差异的研究;刘旭东分析了高考英语成绩、主干课程成绩和性别与CET4成绩的关系;邵华对大学英语四级统考成绩与研考英语成绩关系的定量研究;万波对湖北省江汉大学2002级四级成绩进行了多因素分析;李红燕分析了大学英语四级首次通过率和高考入学重点率之间的关系;张其香对学生高考英语成绩与大学英语四级成绩进行了相关性分析。但运用SPSS社会科学统计软件对独立学院学生CET4成绩的研究较少,我院教务人员每年虽对四级成绩进行分析,也只是统计各系过级人数和过级比率。本研究着眼于独立学院学生四级成绩,运用SPSS社会科学统计软件,纵向分析学生四级单项和四级总分的关系,男女生和各系学生四级及四级单项成绩差异,并横向探讨学生入学测试成绩与CET4成绩的关系。

二、研究设计

1.研究对象。本文以北京工业大学耿丹学院2009级和2010级非英语、非艺术专业1610名本科生为研究对象,其中男生908名,女生702名,09级学生867名,10级学生743名,这些学生都在开学参加了入学测试,且在第四学期第一次参加CET4考试。

2.数据来源及统计。我院每级新生入学后,都要参加有教务处统一组织的英语入学测试,测试题目由北京市教委高教处和北京市大学英语研究会专门组编,试题难易适中,考试结果具有真实性、可比性的特点;四级成绩是每级学生首次参加大学英语四级考试的成绩,数据由我院教务处提供;所有数据都输入SPSS13.0统计软件进行分析。

3.研究问题。学生入学测试成绩与CET4成绩及单项成绩关系怎样?学生入学测试成绩怎样影响其CET4总分?学生CET4单项成绩对其CET4总成绩影响程度如何?男女生入学测试成绩,CET4成绩及CET4单项成绩有无显著差别。四个系学生之间和三个实验班学生之间的入学测试成绩,CET4成绩及CET4单项成绩有无显著差别。

三、研究结果及分析

1.相关分析。相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度。利用SPSS依次分析学生入学测试成绩与CET4总分及单项得分,统计结果见表1。

表1表明学生入学测试成绩与CET4总分及单项得分相关系数都达到了0.01水平(双尾),且都是正值,这说明它们之间高度正相关,其相关度强弱依次为CET4总分、CET4听力、CET4阅读、CET4写作和CET4综合测试。

2.回归分析。利用SPSS回归分析可以得到研究因变量和自变量因素的经验线性函数,该函数关系可以反映两变量之间的关系,也可以用来预测。把入学测试作为自变量,CET4总分作为因变量,统计结果见表2。用Y表示学生英语四级总分,X表示入学测试成绩,依据表三中回归分析的结果,回归方程可表示为:Y=3.253X+269.140 X∈(0,100),且检验系数为0(

为了探测CET4单项对学生CET4总分影响大小,找出哪些是重要因素,哪些是次要因素,把CET4总分作为因变量,四项分成绩作为自变量,运用SPSS回归分析,得到如下结果:

由表3回归系数可以看出,学生CET4单项成绩对其CET4总成绩影响强弱的次序依次为听力、阅读、写作和综合测试,所有的回归系数都是正值且显著性达到了0.01水平(显著水平为.000)。

3.独立样本T检验

通过SPSS独立样本T检验得知,两年级908名男生在以上六类成绩上平均分都低于702名女生的平均分,且这种差异显著。

4.单因素方差分析。运用SPSS单因素方差分析,就不同研究对象在单个变量平均值上是否存在显著差异一一进行了研究,根据显著系数

表中显示信息系(a)学生入学测试成绩明显低于机械系学生,CET4总分低于经管系与人文社科系,CET4阅读成绩与人文社科系学生差异明显,CET4写作成绩与经管系学生差别显著;机械系(b)学生入学测试成绩显著高于信息系,CET4写作成绩平均分低于人文社科系学生,且差别达到显著水平(.026

四、研究启示及意义

两个年级学生入学测试成绩与其CET4成绩及单项成绩密切相关,入学测试成绩和学生四级听力成绩相关性最大,其次是阅读。这就要求教师在教学中充分了解学生基础,重视各班学生入学测试成绩的分析,根据不同学生,给予合适的指导。

依据学生入学测试成绩,建立的CET4总分预测模型,为教务处预测每级CET4通过率提供了理论依据;也为教师和学生更好的认识班级和自己情况提供了可操作公式,促使学生清晰认识基础,制定合理计划,逐步提高英语成绩。

在学生CET4总分影响因素大小的分析中,学生听力贡献度最大,回归系数为.424;其次是阅读,回归系数为.420。这就要求教师开展相关听力和阅读方法研究,切实提高听力和阅读教学水平,进而提高学生听力和阅读能力。

男女学生入学测试成绩,CET4总分和CET4单项成绩存在显著性差异,这启示教师在实际教学中,要充分发挥各班女生的带头作用,形成良好的学风,在具体教学中,多多关注男生,研究其学习特点,给予更多指导。

具体到各系,根据统计数据可知信息系学生入学基础差,听力水平尚可,要狠抓阅读和写作;机械系学生CET4单项成绩中,写作水平最差;对于经管系学生,写作能力尚可,需狠抓其听力和阅读;人文社科系学生听力水平有待提高。就实验班而言,仅发现经管实验在CET4总分和CET4听力上显著优于机械实验班。经管实验班是文科实验班,但在阅读和写作上并未发现明显优势。由于教学对象的差异,所任不同系的大英老师要具体分析所教学生,针对不同系别的学生给予具体的指导。

五、结语

本研究调查对象和研究内容的特色性使得该研究能丰富对CET4研究的维度和内容,为后来者提供实践数据和参考。本研究也存在局限性,如并未对学生入学测试单项成绩进行分析,调查对象也仅限于北京工业大学耿丹学院的学生等。

参考文献:

[1]刘春鱼.大学生英语四、六级考试成绩的性别差异[J].内江师范学院学报,2011,(3).

[2]李红燕,曹苏娜,曹贻鹏,刘艳霞.基于统计分析的英语四级通过率和入学重点率的相关性之实证研究[J].时代教育(教育教学版),2010,(7).

[3]刘旭东,田家莉,薛素萍.大学英语四级成绩多因素影响分析[J].中北大学学报,2005,(4).

[4]邵华,王煜.大学英语四级统考成绩与研考英语成绩关系的定量研究[J].阜阳师范学院学报(社会科学版),2002,(2).

差生考试总结范文2

考试焦虑是个体在考试情景刺激下,由于个人的认知、人格和评价等影响因素而产生的各种紧张、恐惧情绪和对考试结果的担忧的心理反应状态。考试焦虑形成的原因是复杂多样的,大量研究显示,考试焦虑的形成是由来自外部环境的外源性因素和来自个体特质的内源性因素交互作用的结果。外源性因素有家庭环境,学校教育和社会支持等。内源性因素有个体的人格特征、归因和认知评价等因素。而学习压力也被认为与考试焦虑有极大关系,一直备受人们的关注。

学习压力是中学生面对的重大压力之一。学习压力是来自外界和个体的因素导致的。社会的压力,同龄人的压力和家庭的期望等都给高中生的学习产生了极大压力,而个体的归因方式,认知风格,人格特质也影响了其压力的大小。学习压力有很多不良后果,如:导致学生身心疲劳,对学习的意义和目的产生歪曲理解,把分数作为一切的目标。

学业拖延是指在一定的时间范围内推迟学业任务,直到临近最后期限开始着手进行的行为倾向。学业拖延情况普遍存在于学生们的学习生活中,如延迟交作业,临时抱佛脚,在交作业截止日期前一天才开始做作业等,研究表明学业拖延者常伴随着负性情绪。长期的拖延会引发个体焦虑、内疚和担忧等负性的情绪,影响个体的身心健康。

目前少有关于考试焦虑、学习压力和学业拖延关系的研究,该研究以高中生为对象,旨在研究这三者的现状并且揭示三者关系。

一、研究方法

(一)被试

抽取浙江省永嘉中学、温州中学和乐清中学的学生共410人,发放问卷410份,全部收回,回收率为100%,有效问卷为402份,问卷有效率为98%。其中女生197人(占总人数的48%),男生205人(占总人数的51%);高二101人(占总人数的25%)、高三301人(占总人数的75%)。

(二)工具

1.考试焦虑问卷,采用的是参考了王才康1999年的译本,一星期间隔重测信度为0.60,Cronbach’α系数为0.64,有良好的信度和效度。该量表共37个项目,各项均为0-1计分,其中5项是反向计分。此量表主要测量因素是考试焦虑的特质方面,即测量考试焦虑与一个人的稳定人格特质有关的因素。

2.状态―特质焦虑问卷,此量表由状态焦虑量表和特质焦虑量表组成,各量表共20个项目,该量表具有较好的信度和效度。以中国人群为被试STAI的重测信度为0.90,得分越高越焦虑。该测试仅采用状态焦虑量表,测量由具体情景引发的考试焦虑。

3.中学生学习压力问卷,由徐嘉骏、曹静芳、崔立中、朱鹏编制的。该量表共 21 个项目,包括:父母压力,自我压力,教师压力和社会压力四个维度,采用Licket 5级评分,分数越高学习压力越大。各因素及总量表的Cronbach’α系数分别为:父母压力0.76、自我压力0.73、教师压力0.63、社交压力0.63、总量表0.81。该问卷具有良好的信度和效度。

4.一般拖延问卷,是由Clarry Lay 1986年编制的。该问卷共20个题目,采用Licket 5级计分,其中有10项是反向计分,得分越高拖延行为越严重。Cronbach’α为0.82,具有良好的信度和效度。一般用于测量个体的特质性拖延行为。

(三)施测程序

在10月期中考试前对该校学生以班级为单位进行施测,由统一主试按照相同指导语进行问卷发放,并当场回收问卷。

(四)统计工具

采用SPSS16.0统计软件进行t检验、方差分析和回归分析。

二、结果与分析

(一)高中生的考试焦虑、学习压力和学业拖延状况

对高中生的考试焦虑、学习压力及学业拖延进行问卷施测的描述统计。结果表明,高中生学习压力(M=53.80,SD=10.40),学业拖延(M=52.28,SD=11.16)特质焦虑(M=19.44,SD=6.81),状态焦虑(M=49.00,SD=11.50),其中特质焦虑根据其焦虑程度分级,低于12分属于低水平考试焦虑共58人(占总人数的14%),12―20分属于中度考试焦虑共167人(占总人数的42%),高于20分属于重度考试焦虑共177人(占总人数的44%)。状态焦虑的49.00分接近其综述中提到的状态焦虑中等分数的50分,所以状态焦虑处于中等程度;学习压力的53.80分接近其综述中提到的学习压力中等分数的60分,因此学习压力处于中等程度;学业拖延的53.80分接近其综述中提到的学业拖延中等分数的60分,所以学业拖延处于中等程度。

为了分析考试焦虑、学习压力和学业拖延的年龄发展特征以及其在性别上是否存在差异。以特质焦虑、状态焦虑、学习压力和学业拖延为因变量,以性别和年级为自变量进行2(性别)×2(年级)多元方差分析。结果显示(见表1):对于特质焦虑,性别的主效应显著(F=22.90,p0.05)。对于状态焦虑,性别的主效应显著(F=25.23,p0.05)。对于学习压力,年级的主效应显著(F=13.02,p0.05)。对于学业拖延,年级的主效应显著(F=8.76,p0.05)。

表1 高中生考试焦虑、学习压力和学业拖延的平均数和标准差(N=402)

通过高中生对自己的评价,进行其考试焦虑、学习压力和学业拖延的差异比较。结果见表2:

表2 考试焦虑、学习压力和学业拖延的描述统计、自我评价差异(M±SD)

注:*p

表2结果表明,不同程度自我评价学生在考试焦虑、学习压力和学业拖延上均有显著差异。自我评价较低的学生学习压力比自我评价较高的学生大(F=10.01,p

根据表2的结果,对不同程度自我评价的学生的考试焦虑、学习压力和学业拖延的方差分析进行LSD事后分析比较,结果见表3:

表 3 不同自我评价程度学生在学习压力、考试焦虑和学业拖延上的方差分析事后比较

表3结果表明,自我评价差的学习压力显著高于自我评价中等和良好的(p

(二)高中生考试焦虑、学习压力和学业拖延关系分析

1.相关分析结果

采用相关分析考察了考试焦虑、学习压力和学业拖延的关系。结果见表4:

表4 考试焦虑、学习压力和学业拖延相关分析

表4结果表明,特质焦虑和状态焦虑均与学业拖延和学习压力存在显著的正相关,学习压力和学业拖延存在显著正相关,状态焦虑和特质焦虑存在显著正相关。

2.回归分析结果

采用回归分析,进行了学习压力各因子、学业拖延对特质考试焦虑的回归分析,结果见表5:

表 5 学习压力各因子和学业拖延对特质焦虑的回归分析

注:R2=0.247

表5结果表明,学业拖延、自我压力和教师压力与特质焦虑的线性关系显著,特质焦虑=-0.20+0.08×学业拖延+0.60×自我压力+0.20×教师压力。回归方程达到显著水平(p

采用回归分析,进行了学习压力各因子、学业拖延对状态考试焦虑的回归分析,结果见表6:

表6 学习压力各因子和学业拖延对状态焦虑的回归分析

注:R2=0.205

表6结果表明,学业拖延、自我压力与状态焦虑的线性关系显著,特质焦虑=18.33+0.14×学业拖延+0.95×自我压力。回归方程达到显著水平(p

三、讨论

(一)考试焦虑状况

该研究得出现在高中生考试焦虑状况普遍,许多学生都有一定程度焦虑,状态焦虑处于中等程度,特质焦虑的结果比起其他研究结果而言重度考试焦虑偏高,这也许是因为近年来考试增多、各种考试增加了学生的考试焦虑。但是适度的焦虑可以促进个体考试发挥,而过高或者过低的焦虑才会影响个体身心健康、导致考试成绩下降,因此如何保持适度焦虑才是需要关心的问题。

该研究结果显示在考试焦虑方面,女生比男生更容易焦虑,这一点与国内许多研究结果一致。这些研究认为女生比男生更容易焦虑是因为女生更加敏感,情绪唤醒水平高,所以容易产生焦虑。有研究认为,考试焦虑性别差异可能是由于男女生对评价情境的感受不同,女生明显表现出一种将评价情境看作威胁,而不是挑战的倾向,增强了认知干扰的可能性。该研究认为是女生更加敏感,并且缓解焦虑的方法没有男生那么直接,不能一次将情绪抒发。男生减轻焦虑的方式是打篮球或者其他运动,而女生喜欢述说和听音乐等方式,这些方式缓解焦虑可能会有点慢并且效果没那么明显。这一结果显示,教师在帮助学生应对考试焦虑时,应该更注重女生的情绪抒发,缓解女生考试焦虑。

考试焦虑在年级上差异不显著,高二和高三都具有同等程度的考试焦虑。戴斌荣等研究中指出,非毕业班高中生和毕业班高中生考试焦虑的人数百分比存在显著性差异。但是也有很多研究显示,高二和高三学生考试焦虑差异不显著。这也许是因为现在学校对学生的课程加重,补课现象严重,作业繁多,导致学生虽然是高二却过着和高三差不多的学习生活,因此考试焦虑也和高三学生差不多。

考试焦虑在自我评价方面存在显著差异,自我评价对应的考试焦虑程度依次是:差>中等>良好,并且差与中等和良好的考试焦虑差异显著,中等和良好的考试焦虑差异不显著。原因可能是自我评价良好的学生在身心方面都比自我评价低的要好一些,而考试焦虑本身就是一种由于不能很好应对考试而产生的紧张、焦虑情绪,自我评价低的往往不能很好应对考试,所以更容易产生考试焦虑。

(二)学习压力状况

高中生中普遍都有学习压力,来自不同社会、家庭、学校和同龄人中的各种压力,让高中生们身心疲倦,目前教育应该帮助高中生减轻和释放压力,教会他们如何应对压力。

学习压力在性别方面没有显著差异,表明现在社会不再是以前男人需要扛起一切,而女人则负责家务的社会。现在社会男女平等,对男女的要求也开始有了变化。女人开始需要承担更多的责任,需要多为社会做出贡献,并且女人也有这个能力,因此学习压力对于男女而言没有显著差异。

学习压力在年级方面差异显著,高三学生明显比高二学生学习压力大。原因可能是因为高三是毕业阶段,将要面临高考,而高考又给予了很多学生压力,很多学校、家庭和学生都非常重视高考,因此繁重的课程,大量的月考、周考,还有学生自我的要求都给予了学生很多压力,导致其学习压力比高二大。

学习压力在自我评价方面存在显著差异,自我评价对应的学习压力程度依次是:差>中等>良好,并且差、中等和良好之间学习压力情况差异显著。对学习压力的感受也是基于个体的应对,自我评价良好的应对学习压力应该比自我评价低的要好,所以感受到的学习压力小。

(三)学业拖延状况

学业拖延情况在高中生中普遍存在,高中生面对学习存在拖延完成学习任务和不完成作业情况,学业拖延是时间的不合理安排,也是回避性行为。

学业拖延在性别上是否存在显著差异一直是研究界争论的话题,该研究结果显示学业拖延在性别上没有显著差异,这与一些研究的结果一致。女生和男生在学业拖延上不存在显著差异,他们的应对方式,没有导致其有显著差异。

学业拖延在年级上差异显著,高三学生比高二学生学业拖延情况严重,这一些研究结果一致。可能是因为高三学业的繁重,大量的作业,导致学生不能完成所有作业,有的学生有自己的学习方式所以选择放弃老师作业,做自己的辅导书,或者是学生根据自己情况在恶补自己的劣势,所以不能完成别的作业。也有可能是学生产生了放弃的念头,认为来不及了,所以就不做作业。

学业拖延在自我评价方面存在显著差异,自我评价对应的学业拖延程度依次是:差>中等>良好,差于良好之间的学业拖延情况显著,差于中等、中等与良好之间的学业拖延情况不显著。可能是因为自我评价低的学生对于学习也不上心或者不能很好应付学习,所以导致其学业拖延,而自我评价比较高的则是能很好的应对学习任务,自我规划时间,完成学习任务。

(四)考试焦虑与学习压力和学业拖延的关系

差生考试总结范文3

关键词:药物应用护理;试卷分析;试卷质量;教学思考药物应用

护理是在药理学基本理论指导下进行用药护理的综合性专业技能课,是护理专业必修的一门重要桥梁课程,课程的任务是使学生掌握各类代表药物应用的基本知识、主要不良反应和用药注意事项,具备药物应用护理的基本技能[1-3]。考试能检查和评估学生对知识和技能的掌握程度,通过试卷分析能发现教学中存在的问题[4-5]。本文通过对重庆市某卫生学校2015级护理专业《药物应用护理》期末考试成绩进行回顾性统计分析,以评价试卷质量发现教学过程中存在的不足,为改进教学方法、提高教学质量作参考。

1材料与方法

1.1资料来源

重庆市某卫生学校2015级护理专业1班—4班《药物应用护理》期末考试试卷共239份,以姚宏主编的《药物应用护理》(第2版)为教材,共72学时。考试时间为2016年6月。

1.2命题与考试

授课教师严格按照教学大纲命题,共两套试卷,分别为A、B卷,考前由教务科随机抽取其中一套作为期末考试试卷,考试形式为闭卷笔试,考试时间90min,满分100分。考试题型分为主观题和客观题,共50题,具体题型数量及所占比例见表1.1.3方法试卷的评判依据考前制订的标准答案和评卷标准进行,由高年资授课教师以流水作业方式集体进行,阅卷后由专人复查、登分。阅卷完成后,用Excel2013和SPSS22.0软件进行数据处理、统计分析,算出平均分、标准差、难度系数、区分度、信度等试卷质量指标。

2结果

2.1成绩分数分布

有效试卷共239份,最高分97.0分,最低分44.0分,全距53.0分,平均分71.1分,标准差12.46,成绩近似正态分布,各分数段频数分布见表2.

2.2试卷质量评价

本套试卷总难度系数为0.71,总区分度为0.30,信度为0.79,各项试卷质量指标评价结果见表3~表4。

2.3考生失分情况分析

试卷根据《药物应用护理》教学大纲进行命题,此次考试学生失分情况中主观题高于客观题,具体由高到低为:分析题、名词解释、简答题、填空题、单选题和判断题,见表5

3讨论

3.1题型分布及成绩分析

本套试卷客观题与主观题所占分值比例为7:3,题量比约为5.3:1。客观题主要考查学生理解和掌握基础知识的程度,主观题主要考查学生归纳总结、灵活运用所学知识的能力。药物应用护理基本知识和相关概念多,涉及面广,作为对学生课程结束总结性考试,因而客观题量稍高。成绩分析结果显示,分数主要集中在60.0~89.0,良好率24.27%,及格率83.68%,成绩近似正态分布,一方面有利于选拔优秀,甄别落后,另一方面也可借此激发学生积极性,提升其学习成就感。

3.2试卷质量分析

3.2.1难度难度分析通过难度系数(P)来评价,其由该题通过率来计算,P=X/W(X为该题的平均得分,W为该题的满分值),反映大部分学生对该考查知识点的掌握度。一般认为,P<0.6为难,0.6≤P<0.8为适中,P≥0.8为容易。平均难度是衡量试卷难度的重要指标,通常平均难度在0.7~0.8。良好试卷难度应合理分配,难、中、易的题目比2:6:2[6-8]。本试卷小题型中,难、适中、易小题各占12%、38%、50%,容易题过多,适中题偏少,特别是考查学生记忆为主、基础知识的单选、判断题容易题较多,一方面说明学生基本知识掌握较好,另一方面在今后的出题中应该适当增加试题难度;各大题型难度系数P介于0.6~0.8,全卷难度0.71,总体难度适中,基本达到了本次考核目的。3.2.2区分度区分度(D)是指试题对学生实际水平的鉴别能力,是作为评价试卷质指标,筛选试题的主要依据,它是依据高分组和低分组学生对某题的难度系数,通过区分度计算公式计算出来的;D值越大区分度越好,一般认为,D≥0.3,区分度很好;0.20≤D≤0.29,试题适中;D≤0.19,试题差[9-12]。本试卷的良好题为10道,适中题为13道,差题为27道,分别占总体的20%,26%,54%;各大题型中,主观题区分度优于客观题的,特别是名词解释和分析题较好,判断题和填空题较差。说明学生在最基本的知识方面都能较好掌握,当主观灵活应用方面,相差区别比较明显。结合难度分析,提示成绩较低的学生需要加强学习、增强综合能力应用,与难度分析基本保持一致性。试卷总体区分度为0.30,属于区分度较好的试卷,但选择题、填空题的区分度较差,判断题有待改进。3.2.3信度信度是反映测试内部题目得分一致性的量度,用克伦巴赫Alpha(Cronbach'sα)系数来表示信度系数,可以采用SPSS计算。试卷信度系数α涉及其本身可靠性和评分可靠性,通常应大于0.6。本次考试试卷考查面广、方式丰富,评分标准客观、准确,统一阅卷,专人复核和统分,总体信度系数α为0.79,说明试卷信度较高,较真实地反映了学生学习状况、实际水平。

3.3教学思考

差生考试总结范文4

关键词: 语言测试学 英语教学 应用

1.前言

语言测试通常以所教的内容为基础,也有一些标准化语言测试,例如雅思、托福等考试主要用来检测学生的语言水平,通常不管如何教或如何学。因此,在一些统一考试之前,老师对学生进行针对性培训。可见,教学和测试的关系是密不可分的。但无论哪种考试,都不应该机械地测量学生对语言形式的掌握,而应测量其实际的语言交际能力。这样的测试才能够对教和学产生积极影响。

2.测试的要素

2.1测试信度。

测试信度,即考分的一致性,如果一个考试信度很高,则无论什么时间、在什么情况下对同样的学生施考多少次,各次的成绩都是一致的。例如:

例1.利用试卷1对同一组人不同时间的两次测试的成绩:

我们能够清楚地看出,例1中的测试成绩,有部分学生两次成绩之间差距较大,大多数差距大于五分,名次排序也有较大差距。

例2.利用试卷2对同一组人不同时间的两次测试的成绩:

例2的表中可看出两次考试成绩的分数差距和名次差距都不是很大,而且部分学生的成绩和名次保持一致。

通过对两份试卷的比较,我们能够发现后者的信度明显高于前者,后者更能真实地反映学生的水平,我们在选择试卷时更倾向于后者。那么,在教学和测试时我们该如何确定测试信度呢?通常有三种方法:重复测试法,即对同一组学生在不同时间连续使用同一份试卷进行测试来测定考试信度;平行卷测试法,即让学生做两套试卷,然后分析这两次考试的结果,考试信度由分数组之间的一致性决定;对半分析法是把一份试卷分成两部分,通过比较这两部分的成绩来测定考试信度,两部分成绩越一致,试卷的信度就越高。

2.2测试效度。

测试效度,即考试达到其预期测试意图的程度。考试效度分为表面效度、内容效度、结构效度和尺度关联效度。表面效度是指测试的表面可信度,如果一次考试表面上看着符合测试要求,例如测试写作时让学生写作文或测试口语时让学生说话,这些都具有表面效度,直接考试通常具有表面效度而间接考试缺少表面效度。内容效度则必须对测试目的或测试语言有较透彻的分析。因为考试所选材料要同所学内容一致,所选材料的覆盖面要广,要能够反映所学内容的特点,但又不能超出教学大纲或所学内容的范围。成就考试对于内容信度的要求较高。结构效度指语言能力理论中假设的基础能力或特征。如果我们说某次考试具有结构效度,这就意味着此次考试能够有效衡量某个语言技能与该语言技能的理论基础要求的一致程度,即能够有效衡量一名考生的成绩能否达到要求。尺度关联效度,取决于它同某个可靠的学生能力测量工具之间的关联程度,即取决于两次考试的比较。要衡量某次考试的尺度关联效度,我们可以把此次考试的结果与一次公认的、很可靠的考试的结果相比较,关联性大的、一致性高的效度就高。水平测试比较强调尺度关联效度。

考试信度和效度都是必不可少的,有了信度,才可能有效度,不讲效度而只谈信度也是没有意义的。假设我们用一份可信度极高的口语试卷区测试写作能力,就没有丝毫效度可言,此次考试也没有什么实际意义了。因此,我们在选择试题时必须兼顾信度和效度两方面。

3.实际教学中测试结果的反馈及成绩分析

通常测试一结束,教师就要立即阅卷并公布考试结果,就是要将成绩反馈给考生,以使其认识到自己的不足并改进学习,本节介绍一些反馈成绩的形式,下面的分析都是基于我所教的一个自然班在一次期末考试中的成绩,该班成绩如下:

总成绩=网络听力成绩×30%+期末卷面成绩×70%

3.1分数的分布、集中量和差异量。

本次考试考生成绩在80―89分之间有23人,70―79分之间有10人,60―69分之间有1人,60分以下有1人。分数多集中在80―89分之间,最高分和最低分相差39分。还可以将组距定得更小(比如每5分一个组),这样能更精确地分析成绩的频数分布。分数的集中量是代表一组数据典型水平或集中趋势的量,通常用算术平均数、中位数和众数来表示集中量。算术平均数很容易计算,此次考试的平均分是80.77,但是如果出现一个过高或过低的时,平均分就不能很好的代表这组分数的典型水平了。中位数是位于按大小顺序排列的一组数中间位置的数值,各有一般频数分布在它的上下。当分数出现过高或过低的现象时,大多采用中位数来代表成绩的典型水平。集中量只能代表分数的平均水平或典型趋势,却无法反映差异,因此出现了差异量以概念,即表达分数离散程度的量,差异量越大,表示分数的分布越不整齐;差异量越小,则分数分布越集中,变动范围越小。最简单的差异量表达是全距,即最高分与最低分之差,此次考试是39分,很明显,全距易受到两极分数的影响,不能很精确地反映分数差异。当需要比较两组或几组分数的离散度时,全距就不精确了,所以我们采用标准差(SD),SD=,其中∑表示总和,d表示离,即每个分数与平均分数之差,N表示总频数或总人数。一组分数的标准差值越大,说明离散度越大,反之亦然。那么标准差大比较好还是小比较好呢?这就要看考试的目的了,若像这次学期成绩,目的是要检查学生是否达到教学要求,则希望标准差小一些,这说明学生成绩比较集中;若是一些选拔性的考试,则希望标准差大一些,以便作出选择。

3.2题目难易度和区分度。

要合理地分析试卷并作出改进,就要分析试题的题目难易度和区分度。题目难易度FV=,R代表总人数中答对某题的比例,N代表总人数,这个数值一定是在0―1之间,可见,数值越大说明题目越容易;数值越小则题目越难。通过对本次考试各个题目的分析和计算得出:

通常情况下,题目难易度过高过低都不利于区分考试水平,一般将难易度控制在0.3―0.7比较合适,可见此次考试的难易度适中。只看难易度还不能完全合理地评价学生的成绩,还要看能够表明试题区分高分和低分程度的区分度。区分度D=,RT表示高分组答对的人数,RB表示低分组答对的人数,NT高分组总人数,那么区分度就可能在-1―1之间,对于一个题目来说,如果高分组都答对了、低分组都答错了,则区分度为1,这是最理想的状态;如果两组答对的人数相同,则区分度没有,即该题目无法区分学生水平;如果高分组学生都答错了而低分组学生都答对了,则区分度为-1,这是最糟糕的状态,不合理。对于此次成绩,我们把学生分为三个组,高分组和低分组人数相等,经过计算得出:

由上述两组数据我们可以总结出,本次考试具有较强的可信度。

4.结语

本文旨在研究语言测试学在英语教学中的应用,开篇介绍了测试学的相关要素,最后以作者所授班级的成绩为实例,利用测试学的相关原理分析了一次期末试题并作出评价,希望通过该分析能够改进以后的教学工作和选题工作,更加有效地帮助学生掌握所学知识并予以考查其真实水平。虽然该研究能够在一定程度上帮助师生解决教学中的问题,但在测试手段、评分标准,尤其是主观题的评分标准、及格标准上还有待广大测试学者和一线教师在实践中的研究予以补充、发展。

参考文献:

[1]Heaton,J.B.Writing English Language Tests,Foreign Language Teaching and Research Press,2000.

[2]J.Charles Alderson,Caroline Clapham,Dianne Wall.Language Test Construction and Evaluation,Foreign Language Teaching and Research Press,2000.

差生考试总结范文5

论文摘要:通过对公共体育课学生乒乓球反手挡球、正手攻球、反手搓球、左推右攻、往返触台跑的考试标准的实验,结果表明:实验后所制订的评分标准较适合学生的实际水平。

公共体育课从2000学年度第一学期开始大二年级实行选项上课。乒乓球为其中一项选项内容,学习期限为一年。但当时没有乒乓球考试评分标准,台州学院乒乓球老师每年在探索乒乓球的评分标准,其标准通过调整也逐渐完善起来。在调整完善过程中,也参照了浙江省高等学校体育选项课系列教材《乒乓球》及浙江省一些高校自己制订的乒乓球评分标准,结果发现有些标准对我校学生偏低了,而个别标准又偏高了。这样的评分标准对台州学院学生来说显然存在不合理性,不能充分体现对台州学院学生的激励性,因此,制订台州学院公共体育课学生乒乓球的评分标准具有现实的意义。为了使台州学院公共体育课学生乒乓球的评分标准更趋于合理,更适合台州学院公共体育课学生的实际水平。本人对台州学院o3、04级公共体育课乒乓球选项男生共283人,女生共248人进行了乒乓球考试标准的实验。

1研究对象与方法

1.1研究对象

台州学院03、04级公共体育课乒乓球选项男生共283人,女生共248人。

1.2测试方法

在同一测试条件下,对测试对象进行乒乓球技术的反手挡球、正手攻球、反手搓球、左推右攻的考试以及乒乓球专项素质往返触台跑的考试。具体考试方法如下:(以下都是以右手拿拍为例,如左手拿拍,方向相反)

1_2.1反手推挡球考试

轮到考试者,叫一个同学陪考,陪考同学将球发给考试者左半台,考试者反手推挡球,秒表记时一分钟,如球失误停表,继续开球后再开表,打满一分钟。考试者失误一次从最后总数中扣除一个球。

1.2.2正手攻球考试

轮到考试者,叫一个同学陪考,陪考同学将球发给考试者右半台,考试者正手攻球,秒表记时一分钟,如球失误停表,继续开球后再开表,打满一分钟。考试者失误一次从最后总数中扣除一个球。

1.2.3反手搓球考试

轮到考试者,叫一个同学陪考,陪考同学发下旋球或搓球到左半台给考试者,考试者反手搓球,秒表记时一分钟,如球失误停表,继续开球后再开表,打满一分钟。考试者失误一次从最后总数中扣除一个球。

1.2.4左推右攻考试

轮到考试者,叫一个同学陪考,陪考者将球间隔击到考试者左、右两半台,考试者左半台来球以推挡回击,右半台来球以正手攻球回击。推挡一次和攻球一次计两个球,累计连续左推右攻的个数,秒表记时一分钟,如球失误停表,继续开球(挡球失误从挡球继续开球,攻球失误从攻球继续开球)后再开表,打满一分钟。考试者失误一次从最后总数中扣除一个球。

1-2.5往返触台跑考试

考试者站在乒乓球台的边线中间,教师喊预备起,考试者向左(右)滑步或交叉步,用右手(左)手触球台端线(要超过端线,以下同样),接着马上向右(左)滑步或交叉步,用左手(右)手触球台端线,依此类推,一只手触端线一次算1次,秒表记时一分钟,看考试者的次数多少进行评分。

1.3数据处理

根据体育统计体育成绩的评分方法:平均数加减标准差。根据学生考试成绩,将学生成绩输入电脑Excel表格,利用Excel表格的求和、平均植、标准差,计算出学生考试结果的平均数与标准差。男生平均数:Xl=50,x2=84,x~=45,X~=48,X~=62;男生标准差sl=4,s2=5,S3=3,s4=5,s6=4。女生平均数:Xl=48,x2=45,X~=43,x~=84分,X5=52;女生标准差S。=5,S2=6,S3=4,S4=5,S6=4。(下标l、2、3、4、5分别表示反手挡球、正手攻球、反手搓球、左推右攻、往返触台跑5个项目)。按照学生成绩呈正态分布的现象,看X+2S(占总面积的95.44%),制订出最适合台州学院公共体育课学生乒乓球的考试标准。

2讨论

体育领域的各种现象在宏观上都是遵从“正态分布”规律的,如任何学校学生的体育成绩总是特别优秀得100分的偏少,特别差的不及格的学生也偏少,而处于中问水平的成绩则会占大多数。按照体育成绩应呈“正态分布”的规律,按照百分制评分标准。学生成绩大多数应在中等水平(70~85分之间)。

按照体育统计的原理,根据“正态分布”的特点,平均数加减标准差,可得知占“正态分布”曲线所含的面积,其中X+2S是占总面积的95.4%。根据体育统计体育成绩的评分方法及学生考试成绩的平均数与标准差,将学生平均数的成绩定为80分,那x—lS为70分,X+IS为90分,也就是有68.26%的学生成绩在70分到90分之间;那X一2S为60分,X+2S为100分,也就是有95.4%的学生成绩在60分到100分之间;有个别学生占2.28~,4的学生成绩会不及格,但只要这些学生通过自身的努力会达到及格。按照体育统计的原理体育成绩的评定方法:平均数加减标准差,按这样的方法给台州学院公共体育课乒乓球选项学生评定成绩,这样制定的评分标准具有科学性。那台州学院公共体育课学生乒乓球的评分标准就可制订了。见表l评分标准制订好后,然后对照浙江省高等学校体育选项课系列教材《乒乓球》的评分标准及随机抽取浙江省2所高校——浙江工业大学与杭州师范学院他们自己制订的乒乓球评分标准进行比较分析。

4个评分标准的考试内痞都包括了反手挡球、正手攻球、左推右攻、反手搓球(杭州师范学院没有这项考试内容)的考试项目,这主要是这几项技术都是乒乓球技术中最有代表性的项目,所以都被选择为考试项目。台州学院、杭州师范学院还将专项素质——往返触台跑作为一项考试内容,而其他几个评分标准没有这项考试内容。要想提高乒乓球技术,同时也应提高学生的专项素质,只有各方面的素质都提高了,乒乓球的技术才会提高。所以往返触台跑也应该作为考试项目的其中一项。这样才比较合理。

从可以看出,浙江省高等学校体育选项课系列教材《乒乓球》的评分标准,从5O一100分每个项目比较有规律,都是相隔l0个球相差l0分,这样的评分标准从5O—l00分之间学生成绩的离差性太大了,而50分以下又没有规律了,学生成绩档次缩小了,这样不能公平的反应每个档次的学生的实际水平,这样的评分标准是不合理的。

从可以看出,浙江工业大学乒乓球选项课评分标准,反手挡球、正手攻球、左推右攻这3个项目评分标准都是一样的,从50_—_80分都是相隔4个球相差l0分,从80_—_90分相隔7个球相差l0分,从9O—l00分相隔l0个球相差l0分,从50_—_80分之间学生成绩的离差性对正手攻球、左推右攻偏小了,而从8l00分又没有规律了,离差变大了;而反手搓球的评分标准从表中可以看出也没有规律,这样不能公平的反应每个档次的学生的实际水平。这样的评分标准也是不合理的。

从可以看出,杭州师范学院公体选项课乒乓球的评分标准,反手挡球、左推右攻这2个项目评分标准从6O—l00分都是一样的;都是相隔l0个球相差l0分,同样学生成绩的离差性太大了,而6o分以下也没规律了。而正手攻球的评分标准偏低且没有规律,这样不能公平的反应每个档次的学生的实际水平,这样的评分标准显然是不合理的。另外一项乒乓球专项素质往返触台跑评分标准比较有规律,每相隔4个相差l0分,这对专项素质来说,是比较合理的,但标准也稍偏高了一些,而且男女生评分标准是一样的,男女生的身体素质,身高等因素都不一样,对男女生用同一个评分标准,这是极不合理的。

综合来看,评分标准看,它们全部标准都没分男女生,毕竟男女生身体素质等方面总是有差别的,而且男女生对每个项目掌握程度的离差性也有所不同的,因此男女生的评分标准应该有所区别的。还有这3个评分标准制订的这些乒乓球各项技术之间的成绩分数档次多数项目是一样的,这也是不合理的,因各项动作技术的动作特点、动作结构、动作难易程度不一样,那学生每项技术掌握程度的离差性也是不一样的。所以应该根据实际情况,各项目的评分标准的成绩档次应该有区别的。还有从,表3,表4看,学生每项技术评分标准的成绩档次是没规律的,有些在高分拉开档次,那对成绩好的学生就不利了;有些在低分缩小档次,那对差的学生就有利了。这样的评分标准不能公平、公正的反应学生的实际水平,这样的评分标准是不合理的。

台州学院的评分标准与其它3个标准比较,除满分这一档次比它们略低以外(正手攻球比杭州师范学院标准高),当然得满分的学生是极少数的。其它档次进行比较,台州学院比浙江省高等学校体育选项课系列教材《乒乓球》的评分标准及杭州师范学院公体选项课乒乓球的评分标准都高(乒乓球专项素质往返触台跑评分标准还是杭州师范学院稍高一些)。我校与浙江工业大学乒乓球选项课评分标准进行比较,反手挡球、左推右攻评分标准两校差不多,反手搓球评分标准是台州学院高,而正手攻球评分标准浙江工业大学稍高一些。

台州学院公共体育课学生乒乓球评分标准的制订,是在03、04级公共体育课乒乓球选项男生共283人,女生共248人考试标准实验后,根据体育统计体育成绩评分方法平均数加减标准差及体育领域的各种现象在宏观上都是遵从“正态分布”的规律制订出来的,评分标准具有科学性。:

台州学院以上制订的公共体育课学生乒乓球的评分标准只是一个方面,还有一方面是学生对每个考试项目动作质量的掌握情况,也就是说对学生考试还要进行技术评定。这项对动作质量掌握情况的评定,浙江工业大学有这项评定要求,见表5。而浙江省高等学校体育选项课系列教材《乒乓球》的评分标准及杭州师范学院公体选项课乒乓球的评分标准都没有这项评定要求,这样的评分标准是不全面的。乒乓球考试既要有量化的考试评定标准,又要有技术质量掌握情况的评定标准,这样的评分标准才能比较全面合理地评定学生的成绩。台州学院乒乓球老师根据乒乓球各项技术的动作特点、作用,动作结构,动作要领以及学生掌握动作质量的情况,制定出台州学院公共体育课学生乒乓球技术评定评分表

台州学院学生最终乒乓球成绩是由每个项目的达标成绩占50%,及技术评定成绩占50%,然后综合评定学生的成绩,这样的评分标准是全面而合理的。并且将制订的评分标准在05级公共体育课乒乓球选项学生中实行,从实行结果看,这样的评分标准是比较合理的。不同水平的学生经过自己的努力,都能达到各自的目标,达到各自力所能及的标准,对学生有激励性。

差生考试总结范文6

【关键词】考试;MS Excel;成绩分析;试卷质量分析

【中图分类号】G40-057 【文献标识码】B 【论文编号】1009―8097(2010)10―0135―03

引言

考试是教育活动中评价教学质量,衡量教学效果,鉴别人才素质的重要手段之一。所有的教学都是用不同的考试手段来检测和监控教育质量、规范和引导教师的教学行为,并督促学生积极努力的学习。对于考试的准确定位和恰当使用成为现代教育的一个重要问题。在现今情况,各类各级学校的绝大多数考试的结果大都是以分数成绩的形式给出,成绩的评定和使用显得尤为重要。对学生的成绩进行分析评估,为引导教学工作和提高学生成绩提供了重要的依据。

在教学过程中将会产生大量的成绩数据,对其进行人工分析是非常困难的,而且较易受到教师主观因素的影响。随着信息技术的发展并且引入到教育领域[1],利用信息技术对学生的学习成绩进行分析处理将变得可行[2]和简单,目前大多数教师对信息技术的利用仅仅停留在数据的存储和查询上,并没有对数据进一步的统计分析。

使用信息技术对成绩进行有效的统计分析,可以更好发挥考试对教学效果的反馈作用,同时也可以对试卷质量进行评估,辅助指导教师的命题。目前市面上流行着很多专业的统计分析软件比如SPSS[3]、SAS[4]等,但是这些软件价格昂贵、操作复杂,并不适合普通教师使用。MS Excel[5]作为最普及的办公软件,完全可以实现成绩分析和试卷质量分析的功能。

一 MS Excel介绍

MS Excel是美国微软公司的Microsoft Office System办公软件包中的一个重要组件。它集数据管理、数理统计、绘图与一体,既具备存储功能,又可以完成多种表格与图表的设计。同时MS Excel内置了数百个函数,能够完成绝大多数复杂的数据运算和统计分析,精度能达到专业统计分析软件。使用Excel的内置功能可以进行各种数据的处理、统计分析和辅助决策操作。本文使用MS Excel版本为2003版。

二 某英语成绩分析实例

出于教学本身考虑,对学生成绩的统计分析包括最高分最低分、及格率、集中量分析和差异量分析等。

本文以兰州理工大学在2009年5月组织的一次四级模拟考试的部分成绩为样本进行分析,样本数目为925,参考学生分别来自不同院系不同年级。

1 成绩表的建立

我们在Excel中建立成绩表来存储学生成绩。表格存储了学生院系名称、年级、学生姓名、学号、总分和各小题得分。本次模拟试卷由四大部分组成,分别是听力部分、阅读部分、写作部分和综合测试部分,其中听力部分和阅读部分为客观题目,写作部分和综合测试部分为主观题目。

2 初步分析

对成绩的初步统计,是指从整体上对成绩进行分析。包括将成绩按照分数段统计出每个分数段的人数和比例,以及最高分、最低分和整体分布情况等[6]。

在Excel中可以非常简单地对分数段人数和所占比例进行统计。使用内置COUNTIF函数可以计算出所处相应分数段的人数,再除以总参考人数即可得出相应分数段所占比例。

同时Excel提供的图表功能可将工作表中的数据用图形表示出来,使得数据更加直观、易于阅读和评价。如图1所示,本文以三维饼状图的形式表示了不同分数段及所占比例,非常的直观。根据不同的习惯和用途,用户还可以自行选择以柱状图、条形图等图表样式表示。

3 统计量分析[7]

初步的分析只是对成绩进行简单分析,还需要更深入地对成绩进行统计学分析,计算一些能够反映数据分布特征和规律的某些具有代表性的数值,也就是统计量。在数据分析中常用的描述数据特征的统计量主要有描述数据分布的集中趋势的度量和数据分布的分散程度的度量。

分数分布的集中量数主要用来反映该组分数集中趋势的统计量,一般使用均值和中位数来表示。

均值是一组数据的算术平均值,在成绩分析中,它可以反映一个群体对知识的掌握状况。在Excel中,提供了求均值的函数AVERAGE可以直接对分数求均值。由于我们分析的实例缺考人数较多(接近10%),直接使用AVERAGE函数求得的均值不能真实反映实际参加考试学生的知识水平。因此,我们通过Excel提供的其它函数来解决这一问题,SUMIF函数用来按条件对指定区域求和,COUNTIF可以按条件统计指定区域数目。利用SUMIF(总分,”>0”)/COUNTIF(总分,”>0”)可以计算参加考试的学生成绩的平均值。

均值容易受到极端值(极大值或者极小值)的影响,因此在描述一组数据的集中量分布时,一般还要使用到受极端值影响较小的中位数。中位数是指将数据排序后,位置在最中间的数值,在Excel中,提供了直接求取指定区域中位数的函数MEDIAN。

差异量数是用来描述一组学生分数散布状况的量数,差异量数反映的是学生分数的分布范围的大小和波动情况,一般使用标准差作为差异量数。同时使用集中量数和差异量数才能较全面对一组学生成绩进行全面的分析描述。

标准差也称均方差,是各数据偏离平均数的距离的平均数,它是方差的算术平方根。标准差反映的是一个数据集的离散程度。标准差越大,表明这组成绩的偏离平均数的程度越大,标准差越小,这组数据偏离平均数的程度越小,即分布的差异越小。Excel提供了用来估算样本标准差的函数STDEV。

我们对实例使用的四级成绩数据进行统计量分析截图如图2所示。可以看到本次四级模拟成绩的平均分数为379.08,低于总成绩的60%。教学实践表明,如果平均分低于总分的60%,则说明试卷较难或者学生水平较低,在60%到80%之间,说明学生整体水平基本合格,80%以上则说明试卷较易或者学生整体水平较高。本次四级模拟的总成绩为710,平均分是低于总成绩的60%(426),说明参考学生的水平较低,应加强英语学习,同时本次试卷略偏难。

在差异量数计算中我们可以看到,本次考试成绩的标准差为59.16,数值较大,说明参考学生之间的差异性较大,即学生成绩的两极分化较为严重。

三 试卷质量分析

试卷质量分析是分析考试可靠性、有效性的基本方法,是促进考试工作,提高试卷和试卷编制质量的基础,是反馈教学信息,改进考试工作的有效途径。试卷的质量标准为准确可靠、切实有效、难易适当和鉴别能力强,一般用信度、效度、难度和区分度等度量值来描述试卷的质量[7],我们同样可以借助Excel工具对试卷的质量进行定量分析。

1 信度分析

考试信度是反映考试可靠性的重要指标,即检验能否真实反映学生水平程度的数量化指标,它描述的是考试的误差的大小。在教育统计学领域,最常用的求解考试信度的方法是 x系数法。

其中,分子 表示的是每一大题得分的方差,分母 代表是试卷总分的方差,n代表的是试卷的大题数目。我们在Excel中计算了示例使用的某大学四级模拟考试的信度。考试信度 的计算使用到Excel内置的计算方差的函数VAR。使用该函数可以方便地计算试卷总分的方差和每一大题的方差。实践表明,对于正规的大型考试其信度一般要求在0.9以上。

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

2 效度分析

效度是衡量试卷质量的另一个度量,效度描述的是试卷考试结果的有效性或正确性,效度较高的试卷能够较准确地测出学生掌握知识情况的真实程度。

效度是测量学上的定义,确定效度一般是通过计算两门性质相近的学科成绩的相关系数或者同一学科两次考试成绩的有效性,由于本文中实例只是单次单科考试,因此不对试卷效度进行演示分析。

3 难度分析

难度就是试卷的难易程度,有多种方法对试卷难度进行评定,基于我们示例所用数据考生人数较多,本文使用分组平均分系数来描述试卷难度。首先将学生的成绩由高到低排序,然后把成绩最高的27%的学生定义为高分组,把成绩最低的27%定义为低分组,分组平均分难度系数的公式为:

其中 为高分组的平均分数, 为低分组的平均分数,W则为试卷的总分。

平均分难度系数的计算在Excel非常的简单,仅仅涉及到简单的排序和求平均值运算。

试卷的难度系数根据考试的目的而定,一般来说,难度系数在0.7以上的为较易试卷,在0.4和0.7之间的为中等难度,在0.4以下则为较难题。

4 区分度分析

区分度是指试卷对不同水平的学生加以区别的能力,又称为鉴别力。具有良好区分度的试卷,实际水平高的学生应该得到高分,水平低的学生应得低分。

区分度的计算取决与试卷的类型,对于客观题的区分度计算公式为:

其中Di为第i题的区分度,Wi为第i题的分数。

由于分数表录入了每一小题的分数,Excel对试卷区分度的计算也非常的简单和方便。一般认为区分度在0.4以上的试题为去区分性优良题,在0.3和0.39之间的试题为区分性良好题,位于0.2和0.29之间的为一般题,0.2以下的为劣等题。

5 实例分析

我们在Excel中对兰州理工大学四级模拟试卷进行度量计算,分析试卷的质量,在Excel中的结果截图为图4所示:

从图中可以看到,试卷的可信度偏低,难度适中、略难,区分度较差,这份试卷的质量一般,应注意调整试卷结构。

四 结语

本文利用MS Excel软件对学生成绩进行统计分析,同时对试卷质量在信度、效度、难度和区分度四个方面进行了分析评估。MS Excel软件普及性较高,简单易用,使广大教师在进行分数统计、试卷分析时更为高效、便捷。

参考文献

[1] Mark Warschauera and Deborah Healya. Computers and language

learning:an overview[J].Language Teaching,2009,(12):57-71.

[2] 李竹宁.试卷质量的统计分析与评价[J].教学与管理, 2006,(12):60-62.

[3] [OL].

[4] [OL].

[5] Excel2003/2007公式与函数的使用艺术[M].北京:中国铁道出版社,2009.

[6] 宋.基于数据挖掘技术的学生成绩分析[D].重庆:重庆师范大学,2009.

[7] 于秀林,任雪松.多元统计分析[M].北京:中国统计出版社,1999