数学考试分析总结范例6篇

数学考试分析总结

数学考试分析总结范文1

一、引言

考核是检验教学质量最重要的手段之一,试卷的质量和学生考试成绩是衡量教学质量的主要方法。通过对试卷分析,可以反馈学生学习情况,评估教学效果,为进一步推进教学改革、提高教学质量提供参考。[1]

虽然目前许多高校在教学评价方面都呼吁评价形式的多样化,但试卷测试仍然是最主要的方法,因此试卷质量分析成为高校教师教学过程中的一个必备环节。目前多数学科如数学和医学专业已经重视试卷成绩和试题质量分析,[2-7]]对世界自然地理的课程与教学改革方面进行研究较少,[8-10]贺丹君等从评价体系上对地理课程进行定性分析和评价,未对试卷质量进行定量分析。[11]然而,《世界自然地理》是高等院校地理专业的必修课程之一,它最能体现地理学的综合性、区域性和人地相关性,具有其它地理学分支学科不可比拟的优势,所以对《世界自然地理》试卷成绩进行定量分析,评价试卷的优劣是很有必要的。本文对2007级地理科学专业57名学生的世界自然地理期末考试成绩进行分析,评判试卷对学生学习情况的反映能力,旨在为今后的考试命题和教学改革提供参考依据。

二、数据来源与研究方法

1. 数据来源

2007级地理科学本文由收集整理专业的本科生共57名学生的世界自然地理期末考试试卷。试卷由任课教师命题,试卷评判严格按照评分标准和标准答案进行,由任课教师评分。试卷卷面分值满分为100分,包括4种题型,26道小题:第一题单项选择题包含15道小题,占总题目数的57.69%,共15分;第二题简答题包含5道小题,占总题目数的19.23%,共40分;第三题填图题包含4道小题,40个空,占总题目数的15.38%,共20分;第四题论述题包含2道小题,占总题目数的7.69%,共25分。

2. 方法

试卷分析主要是指通过收集一定量的原始数据,按照设定的评价指标,运用测量学和统计学的理论,通过计算各种统计量数和绘制统计图表,对试卷进行定量分析和评价。[12]可以针对某一门课程,比较学生各成绩段的比例,分析学生成绩的分布是否合理,与试卷内容是否相关等。评价指标可以从教学大纲、命题、试题数量比例等方面来设定。

试卷质量的统计分析是运用数理统计描述和统计推断的方法,对试卷的数量特征和数量关系进行分析和判断。[12]根据《教育测量学》的介绍,[13]本文主要选取难度、区分度两个指标对试卷质量进行统计分析。

(1)难度。试题的难度是衡量试题难易程度的指标。[13]

在编制试题时,难度分布从易到难,逐步增加难度,这样有利于考生水平的正常发挥。试题的难度即考生对该题的通过率或得分率,对于答对得1分、答错或不答得0分的试题,难度(p)就是答对(或通过)试题的人数与考生总数之比:

(1)

式中,r为答对该题的人数,n为考生总数。

对于满分量大于1分的试题,难度则是考生对该题的平均得分与该题的满分之比:

(2)

式中, 为考生对该题的平均得分, 为该题的满分。p值越大,试题越容易。因为百分制以60分为及格,通常情况下,把平均难度控制在0.45~0.75之间比较合适。[13]试题难度的评价标准见表1。

表1 试题难度的评价标准

(2)区分度。题目区分度是指检验题目对其学业水平不同的考生的区分程度或鉴别能力,它是学生掌握知识水平和能力差异的指标。[14]通过考试,学习好的学生得到高分,学习差的学生得到低分,则说明试题的区分度高;如果学生中好、中、差三个层次的考试成绩处于同一个分数段中,就反映不出学生学习水平,那么这样的试题区分度就低。所以一般采用比较方便的两端分组法来计算试题的区分度。所谓两端分组法,即当测试成绩成正态分布时,将考试总分进行排序,然后选出得分最高的27%列为高分组,将得分最低的27%列为低分组。区分度计算公式如下:

,其中i=1,2,3,……n (3)

式中, 和 分别表示全体考生中的高分组和低分组中第i题的平均分; 表示第i 题的满分值。d≥0.40为优秀;0.30≤d<0.40为良好;0.20≤d<0.30为尚可,需改进;d<0.20为劣,需淘汰或修改。[15]试题区分度的评价标准具体见表2。

表2 试题区分度的评价标准

3. 结果分析

从2007级地理科学专业世界自然地理期末考试的成绩分布来看,试卷满分为100分,客观题总分为35,主观题总分为65,学生考试的平均成绩为68.35,最高分为91,最低分40.5,标准差10.10,及格率为80.7%,不及格率为19.3%。

一是课程成绩分布情况分析。

(1)试卷总成绩分布:2007级地理科学班的57名学生,有39名学生成绩分布在60~79分内,占68.42%;有6名学生成绩分布在80~89分内,占10.53%;有10名学生成绩分布在50~59分内,占17.54%;仅1名学生成绩高于90分和低于40分,各占1.75%,见表3。通过绘制成绩分布直方图可以看出,该班期末成绩总体呈正态分布,见图1。教育统计学统计规律表明:学生的智力水平,包括学习能力,实际动手能力等呈正态分布。考试成绩分布应基本服从正态分布,这样才能真实反映学生的实际,也能够说明试卷设计是合理和具有科学依据和实际意义的。[15]本试卷总成绩呈正态分布,说明试卷总体设计合理、可靠、科学。

转贴于

表3 《世界自然地理》期末考试总成绩分布情况

图1 《世界自然地理》期末考试成绩分布图

(2)试卷各大题成绩分布。该试卷共四个大题,因为各题总分不一样,所以把各大题以100分为基准,对分数段进行折合计算,具体各分数段的人数和比例见表4。通过对各大题绘制直方图可以看出,单选题、填图题成绩分布呈偏正态分布,简答题成绩呈偏态分布,但是没有单选题和填图题严重,大体还呈正态分布,这看出就大题而言,单选和填图题设计过于简单,不能很好反应学生的学习能力,但是单选和填图属于识记类知识类型,本来就不好区分学生层次,所以总体看来还是符合实际的;简答和论述题成绩大致呈正态分布,能较好地体现学生学习效果的差异和智力水平,设计很好,见图2。

二是难度、区分度分析。从总成绩看,试卷难度为0.680,试卷区分度为0.402,表明整卷难度适中,区分度好,总体来说试卷质量优良。在各大题中,难度都适中,区分度除了单项选择题为0.29,试题尚可,须进一步改进外,其它三道大题都为优良。结合2007级地理专业的学生为理科生的专业背景,地理基础知识相对薄弱的实际情况,可以看出该试卷的论述题等反映综合能力的试题偏难,但区分度较好,适合考核学生的实际学习水平,有利于提高学生考试的有效性程度,见表5。

三、结论及建议

通过结果分析可以看出,该试卷整体的命题结构好,学生总成绩和大部分大题成绩呈正态分布,试题难度适中,除了选择题之外,其他题型区分度很好。建议以后命题要严格按照教学文件规定的要求,不断完善命题工作,特别是选择题的要加强命题的难度和区分度,同时应该从新课改的理念出发,不断改进命题工作,让考试在教学过程中发挥其应有的积极作用。

1. 试卷构成

整卷共四道大题,26道小题,客观题和主观题的比例为7:13;客观题主要考核学生对世界自然地理的基本概念及基本知识的掌握与理解的程度,而主观题则是考核学生归纳总结、分析、理解和应用知识的能力。本试卷考试内容覆盖面较广,基本涵盖教学大纲要求的大部分教学知识点,符合教学大纲的要求。该试卷试题综合了教学大纲的多个知识点,适当增加了一定的难度和深度。试卷结构记忆类占20%,理解类占40%,简单类占15%,综合应用类占25%;试卷各类题型所占的比例均符合教学要求,难度适中则反映出本课程的基本知识点、重点和难点。

2. 考试成绩分布

由于2007地科班属于理科生,没有高中地理知识的基础,所以本次试卷的命题不但注重学生综合分析能力的提升,同时也关注学生的地理基础知识,因此试题大约有70%是考察学生综合思维能力和分析能力的,涉及知识范围较广,其目的是提高学生对所学课堂内容进行总结提炼及实际应用,也设计有30%左右的基本知识题,如选择和填图题。从总成绩来看,该卷的成绩分布是呈正态分布,反映出绝大多数学生对考查综合能力的试题还是比较适应的,其分值大部分集中在60~80分,见图1;从各大题成绩来看,简答和论述题成绩基本呈正态分布,试卷能很好区分学生层次和体现他们各自的能力水平,能很好达到测验目的,但是单选、填图题的成绩分布呈偏正态,虽然这两大题属于识记型,但是作为试卷设计,还是应该从科学性测验出发,更好体现学生水平为原则,所以在以后的命题中,会更加注重这两部分题目的科学性和实践性。综合以上分析表明,本次考试基本反映出学生对世界自然地理知识学习的实际水平,同时也说明命题者对试题难度等因素掌握得较好。

3. 试题的难度与区分度

难度和区分度都是判断试题质量的重要指标,用于衡量考生能力的程度。通过一次考试将不同程度和不同能力的学生区别开来。难度系数(p)是反映试题难易程度的重要参数,难度系数越小,说明试题难度越大。一般认为试题的难度系数应控制在0.45~0.75之间比较合适。[10]本次试卷的平均难度系数为0.68,四个大题的难度分别为(单选题0.72,简答题0.70,填图题0.71,论述题0.62),不管是从整个试卷来看还是从各大题来看,本套考卷所有类型试题的难度系数在0.62~0.72之间,根据表1(试题难度的评价标准)来看,试题难易程度适中,比较合理,能区分学生能力。

区分度(d)是衡量试题质量的另一重要因素,是评价试题质量、筛选试题的主要指标,d值越大,区分效果越好。一般认为,d≥0.4,区分度极好;0.3≤d≤0.39,区分度良好;d≤0.19,区分度极差;所以试题区分度≥0.20即为可用试题,而区分度≤0.19的试题应该被淘汰。世界自然地理是地理学的一门基础主干课程,有其特殊性,概念多,需要记忆的知识多,尤其记忆各大洲的山脉、河流、湖泊容易记错,各周的地理位置不易描述,而且该级的学生是理科生出生,地理基础知识掌握有待提高,诸多因素使命题者难以把握试卷的难易程度及区分度。在本试卷中,整卷区分度为0.402,各大题中,除了单选题的区分度<0.30(为0.29)外,简答题、填图题和论述题的区分度均>0.40(分别为0.53、0.48和0.52),而且简答题、论述题的区分度非常好(d>0.5)。通过试卷分析表明,本套试题的区分度、易难度良好,其分析结果为命题者今后的命题工作提供了参考依据。但今后对单选题和绘图题的区分度还需要进一步加以改进,判断题应淘汰或注意完善该题型的区分度。

4. 今后命题工作的导向

数学考试分析总结范文2

关键词: 大学新生英语分级考试 Gitest III软件 项目分析

1.引言

大学新生英语分级考试是我院为临床医学专业七年制新生制定的英语技能水平测试。测试的目的是衡量学生的英语技能水平,为后续的英语分级教学提供依据。考试试卷的设计、考试的实际实施、评分标准的统一与否对于能否公正客观地反映学生的能力都有影响。因此,我抽取2009级90名临床医学专业七年制新生的试题,采用广东外语外贸大学设计开发的Gitest III软件对该份分级考试试题的100道客观选择题(其中听力15题,阅读理解20题,词汇语法题40题,完形填空题25题)进行项目分析,包括平均分、难度、区分度、信度等各项数据和效度分析等,以检测试题的设计是否合理,是否能在保证信度和效度的基础上考查学生的英语语言知识和技能并针对发现的问题提出建议,希望能对以后的分级测试命题和设计有所帮助,从而提高测试质量。

2.理论依据

2.1信度

“测试的信度,指它的结果分数对受试者的表现而言的可靠程度……具体说来,就是代表分数与试题,及试题与受试者(test population)的关系”。[1]45为了保证测试的信度,我们应该更多地关注到测试的数量与质量、测试的实施与试卷的评阅。[2]首先在数量上,语言测试应该有足够的数量来保证测试点的覆盖及测试抽样。其次在质量上,考试结果的分数分布应该是正态分布,大多数在中间水平。至于评分的信度,应该保证评分员与评分员之间保持一致,每个评分员自身也要保持前后一致。因为该份分级测试全部题目均为客观选择题,评分信度不受人为因素影响,因而可以得到保证。

2.2效度

“语言测试的效度,亦称有效性,指测试所考的,是否就是所要考的,或者说,在多大程度上,是考了目的所要考的”。[1]49效度分为内在效度、外在效度、使用效度和超考试效度。其中,内在效度是指测试本身的效度,包括内容效度和结构效度。前者是指测试是否考了考试大纲规定要考的,后者指考试的原则理论的效度。结构效度是所有的各种效度之本,决定了整个考试的性质。[1]49-56因此,本文主要分析该份分级考试试题的结构效度。

2.3项目分析

项目分析指的是应用统计学得出的结果来描述测试项目的难度和区分度。项目难度以答对题目人数的百分比表示,而项目区分度则表示被测试者具备的所要测试能力的大小。项目分析的结果用以修正一次测试,通过对不合格项目的修改或删除可以增加测试的信度和效度。我所作的项目分析是根据李莜菊定下的标准进行的,[2]125答对率(facility value,p)、难易度(the difficulty level,pd)和区分度(discrmination index,R-Bis)都有使用。答对率是显示考试的总人数中答对某题的比例。一般来讲,答对率值应该在0到1的范围之间,理想值是0.5。难易度值的范围在1到25,理想值是13。值越小,题目就越容易。如果值达到9或更低,就说明84%的受试者答对了题目。如果值达到17或更高,说明只有16%的受试者答对。区分度是这个题目区分性能的量度,即这个题目正确鉴别不同受考者在所考目标方面的能力。区分度值的范围在-1到1。一道题目的区分度值达到0.3就算符合要求,0.4是理想值。如果低于0.3,那此题目就需要修改或者舍弃不用,而且这样的题目量要控制在总题数的5%以下。

3.结果与讨论

3.1信度分析

整份试题的信度分析结果如表1所示。试题的全部100道客观选择题的平均分为67.40,有67.4%的题目做对了,说明这是一个难度中等的测试。标准偏差是7.40,而预期的标准偏差应该是14.06,说明分数比较集中,分布比较窄。分数的分布呈负偏态,偏态值为-0.54,表示得分高于规定平均分的人数超过了50%,说明试题总的难度比理想难度低。而峰值为1.65,表示峰比理想的峰高尖,说明分数过分集中在中段。一般说,一个考试偏态值和峰值能控制在-1到1之内,便算其分数基本符合正态分布。[2]124因此该试题的分数没有符合正态分布。信度指标R11值为0.74,aValue值为0.56,未达到李筱菊要求的理想值0.9和0.8,[2]128说明整份试题的信度不高。

语言测试的结构效度可以用相关分析及因素分析来验证。根据李筱菊所定的标准,如果相关系数达到0.4,那这两个部分就是相关的;如果相关系数能达到0.5或者以上,那就说明显著相关。[2]129从各大题的相关分析得到试题的四个部分听力、阅读理解、词汇语法和完形填空与总分的相关系数分别是0.52、0.54、0.76和0.77,显示这四部分与总分高度相关,表明考生对大部分试题的作答影响着最后总分的高低。但是,各大题之间都没有显著相关,相关系数在0.15到0.28之间。试卷中两部分之间的低相关常常被片面地认为是因为这两部分检测了考生不同的能力技巧,实际上两部分之间的低相关可以是由很多因素造成的,Oller(1979)指出,试卷两部分的低相关可以从以下几个方面来探讨其原因:1)对于考生来说,其中一部分试题太容易了或者太难了,因而导致这一部分试题的结果不可信;2)两部分试题的信度值都不高;3)其中一部分或者两部分试题都没有检测应该被检测的能力技巧,即测试结果无效;4)试题的效度值不高。[3]56

从表3可以看出,听力理解部分的信度值较低,只有0.33,这可能是该部分与其他大题低相关的原因。阅读理解部分的信度值也不高,只有0.41,而且答对率为0.73,可见阅读题过于简单而且信度不高,因而解释了该部分与其他大题之间的低相关。词汇语法部分需要修改的题目多达19道,占了需修改题目总数的70%,造成这部分区分率较低,只有0.34,这或许解释了该部分与其他大题之间的低相关。

综上所述,各大题之间的低相关可能是由于有些部分的信度值很低,也有可能是有些部分的难度低,我们需要作深一步的研究,探讨考生试题的解答过程,[4],[5],[6]以得出更加可靠的结论。

另外,因素分析也验证了该份试题的结构效度,结果如表4。通过对试题潜在因素分析与主成分分析,可以看到试题因素1的总负荷量是26.72%,另两个因素负荷量分别为3.68%与1.98%,低于10%,因此这两个因素可视作为无意义。[1]130完形填空部分在第一个因素中的负荷最大(0.604),其次是词汇语法(0.560)。由于这两部分侧重于测试考生的词汇和语法基础知识的运用及句子层面的理解能力,因此因素1是词汇和语法基础知识,以及句子层面的理解。考虑到该试题只有一个有效因素,那么这份试题在测试词汇和语法这方面的语言知识与句子理解的语言技能方面有较高的效度,但现代语言测试理论认为单是语言知识并不足以让人们使用语言,此试题忽略了其他语言技能,因而可以说其效度是较低的。

根据项目分析得到试题难度和区分度来看(见表5),这份试题中等难度、容易、非常容易的题目数量达85道,占题目总数的85%,超过了标准分布率80%,特别是容易的题目多达45题,占题目总数的45%,远超过了标准分布率15%,说明这份试题倾向于容易。此外,符合要求(区分度≥0.3)的题目仅为73道,不合格题目有27道,占题目总数的27%,远超过了5%的标准。在27道不合格题目中,听力题有3道,阅读题有3道,词汇语法题有19道,完形填空题有2道(见表3),这些题目需要修改或者直接淘汰。

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

经过分析总结出需要修改的题目存在的问题,具体如下:第一,有些题目难度不够,区分度低,无法有效反映学生掌握的语言知识和技能的程度,从而无法区分不同语言水平的学生。题46“46.We went to the airport to ?摇?摇?摇?摇 a friend who was leaving for New York.A) see off C) come across B) take over D) look up”就存在这样的问题。第二,问题出在答案项上。有的题目出现两个选项是正确答案,而有的题目却没有一个选项是正确答案。这类题如题49,56,68等。“49.The school team has won five ?摇?摇?摇?摇 games.A) running C) successive B) continuous D) uninterrupted”“68.Few came to the classroom than I ?摇?摇?摇?摇.A) expect C) have expected B) was expecting D) expected”。第三,问题出在干扰项上。有些题目的干扰项干扰作用太强,以致太多考生选错。题14,51,60,63存在这样的问题。

4.结语

通过对试题进行分析可以得出以下结论:1)从测试分数上看,分数没有呈正态分布,信度指标值没有达到理想值,因此试题的信度不高。2)试题没能测试学生多方面的语言能力,考察面较窄,因此效度不高。3)试题难、中、易题目搭配不合理,容易题目偏多,需要修改和淘汰的题目过多,以致试题区分度不高。

本文只是对试卷进行了统计性的分析,因而有一定的局限性,仍然需要从其他方面对试卷进行全面分析来论证上述结论,但是,从本次分析所反映出来的问题是值得试题命题者思考的。客观选择题考卷的设计者,在完成试卷的设计后应进行试测,试测完后进行题目分析,然后审改,审改之后再用于正式考试。同时,应从每道题的三个质量指标:答对率、难易度和区分度,以及每道题目的每个选择项的三个质量指标:人数、平均分、区分度来判断每道题的总质量指标,[2]220从而满足信度和效度的基本要求,这样才能有效、可信地评价学生的语言能力。

参考文献:

[1]李莜菊.语言测试科学与艺术[M].长沙:湖南教育出版社,2001.

[2]李筱菊.语言测试科学与艺术[M].长沙:湖南教育出版社,1997.

[3]Oller,J.Language Tests at School:A Pragmatic Approach[M].London:Longman Ltd.,1979.

[4]葛福东.语言测试的信度、效度与题型关系的研究[J].内蒙古农业大学学报(社会科学版),2006,(4).

[5]黄沐云.影响非英语专业学生阅读效率的因素和对策[J].内蒙古农业大学学报(社会科学版),2007,(5).

数学考试分析总结范文3

关键词: 中药学 难度 区分度 信度 效度

考试是衡量教育效果的必不可少的手段,如何用好及改进这种手段,是每一个教育工作者都必须面对的问题。作为学生成绩管理部门,有责任、有义务做好这项工作。借专业认证之机会,逐步开展课程成绩定量分析,使之更有效地服务教与学。本文随机抽取2015-2016学年第1学期江西中医药大学药学院某班《中药学》期末考试试卷,运用SPSS19.0进行统计分析,并在统计结果的基础上提出相应改进建议和方法。

1.试卷结构

本试卷分客观性试题和主观性试题,其中,客观性试题包括单选题(30分)和填空题(12分),主观性试题包括功效解释题(20分)、简答题(18分)和论述题(20分)。具体结构如下:单选题共30小题,每题1分;填空题共12小题,每题1分;功效解释题共10道题,每题1分;简答题共3小题,每题6分;论述题共2道,每题10分。

2.试卷分析

2.1原始数据录入

2.1.1数据定义

在SPSS19.0中,将单选题的题号设置为A1、A2、A3、A4……A30,总值为Atotal,填空题的题号设置为B1、B2、B3、B4……B12,总值为Btotal,功效解释题题号设置为C1、C2、C3……C10,总值为Ctotal,简答题的题号设置为D1、D2、D3,总值为Dtotal,论述题的题号设置为E1、E2,总值为Etotal,整个卷面的总值为TOTAL。其中,所有题号属性均定义为数值类型。

2.1.2数据录入

将本次考试的52份试卷按照各题得分情况输入SPSS中。

经过基本描述性统计显示,本份试卷的最大值为96分,最小值为16分,平均值为68.48,标准差为14.74,不及格率为1.92%。

2.3难度分析

试题的难度指学生对该题的失分率,计算公式为P=1-/W,其中P为难度值,为均分值,W为该题满分值,这种定义法,难度值小表明试题容易,难度值大表明试题难,最小值为0,最大值为1。一份好的试卷试题的难度值在0.3~0.8之间。整份试卷的平均难度值最好掌握在0.5左右。经分析,所有试题难度值分布区间为0~0.69,其中,填空题的第5空难度值最高(0.69),填空题的第12空难度值最低(0),有31道题的难度值低于0.3,占到总数的54.39%。所有大题的难度值分布区间为0.25~0.40,试卷的整体难度值为0.32,整份试卷整体偏容易。

2.4区分度分析

区分度指试题对被测试对象实际水平的鉴别能力,是把考生区别开来的统计量。进行区分度分析时,常以考试总分作为被试实际能力水平,而把被试在某题上的得分与总分之间的相关系数作为该题区分度。区分度的计算方法很多,对于客观题,使用斯皮尔曼(Spearman)等级相关分析。对于主观题,看成非等间距测度的连续变量,并且本试卷的样本量大于30,在此采用皮尔逊(Pearson)相关分析对试题进行分析。

区分度的常用指标为D,取值在-1~1之间,值越大,区分度越好。测量学家伊贝尔认为:试题的区分度在0.4以上表明此题的区分度很好,0.3~0.39表明此题的区分度较好,0.2~0.29表明此题的区分度不太好需修改,0.19以下表明此题的区分度不好应淘汰。

本测试的区分度分析结果如表3所示,各个小题的区分度分布在0.07~0.89之间,其中,B12没有区分度,A2、A5、A8、A10、A11、A19、A27、A29、B9、B11这10道题的区分度低于0.19,因此,这10道题和B12都应予以删除。A3、A6、A12、A17、A18、A20、A23、A24、A28、B3、B5、B10这12道题的区分度在0.2~0.29之间,应进行修改。其他题项区分度较好。结合表4,各个大题的区分度总体区间为0.74~0.93,总体区分度为0.84,所有大题区分度很好,整份试卷的总体区分度很好。

2.5信度分析

信度是反映测试内部题目得分一致性程度的统计量,表示考试的可靠性,取值范围为0~1,其值越大,信度越高,对于及格性考试测验,一般认为,信度值大于0.5,认为其可靠性较高。通过科隆巴赫a系数,得出其信度为0.899(见表2),信度非常高,说明题目得分一致性程度高。

3.结论

第一,基本统计分析。本次测试的平均成绩为68.48,标准差为14.74,标准差值比较大,说明学生的成绩不集中,比较分散,高分者与低分者差距较大,同时表明学生对考试内容的掌握程度不一,并且有很大差异。另外,从频数分布图来看,峰值出现在60左右,说明大多数学生对待大学成绩的态度是及格即可,或者说大多数学生只要经过一定努力都是可以通过考试的。

第二,难度。B5的难度比较大,为0.69,B12的难度最小,为0。一般难度范围在0.3-0.8之间比较恰当,54.39%的题目较为简单,当然,也可以认为大多数学生对B12题或54.39%的题目考察的基本知识点掌握得较好。

第三,区分度。各个小题的区分度分布在0.07~0.89之间,其中,B12没有区分度,A2、A5、A8、A10、A11、A19、A27、A29、B9、B11这10道题的区分度低于0.19,因此,这10道题和B12都应予以删除。A3、A6、A12、A17、A18、A20、A23、A24、A28、B3、B5、B10这12道题的区分度在0.2~0.29之间,应进行修改。综合看,各个大题的区分度的总体区间为0.74~0.93,所有大题的区分度很好。

第四,信度。通过信度分析,得到本次测试的信度系数为0.899。一般来说,教师自编试题的信度系数应达0.85以上,分析结果表明,本次测试质量较高。

总体来说,整份试卷质量较高。

4.建议

对于B12这类完全没有难度和区分度低于0.19的试题,在未来命题中应不予采用。对于难度低于0.3,区分度在0.2~0.29之间的题应予以相应修改。

对于离散程度(标准差)较大的情况,建议具体教学中,如条件允许,可考虑分班或者给较弱学生调整教学内容或者进行适当补课。

试卷定量分析后,对于不符合指标的题目,应及时反馈给命题老师和授课教师,进行适当删除或修改;对于符合指标的题目,建议分门别类地归入课程试题库,避免出题的随意性,有利于试题进一步标准化,增强考试的科学性,进而方便、经济、高效地测查学生的真实水平。

5.总结

通过对某门课程的定量分析了解到,日常教学行为中,不应仅围绕课堂上的教与学进行教学工作改进,考试作为教学工作的重要部分,还应重视学生教与学后的行为反馈和教师在教学过程中的优点与不足,以此为出发点,针对性地为下一次教学工作做相应调整,真正促进教与学。

参考文献:

[1]高建,许杜娟,夏泉,等.中药炮制学试卷分析及思考[J].安徽医药,2010,14(8):991-992.

[2]黄艳,李俊.2007级临床医学专业学生的临床药理学试卷分析[J].安徽医药,2009,13(12):1602-1604.

[3]姜常胜.高等医学院校实用教务管理手册[M].上海:上海中医学院出版社,1993.

[4]宋小平,张敏,陈建军,等.SPSS在医学生物学试卷的信度和效度分析中的应用[J].生物学通报,2008,43(11):39-40.

[5]丁晓娟,陈灵芝,余莉,等.运用试卷分析加强医学微生物学题库建设的初探[J].基础医学教育,2009,11(6).

数学考试分析总结范文4

中图分类号:G71 文献标识码:A 文章编号:1672-3791(2016)10(c)-0000-00

医学统计学是运用概率论与数理统计的原理和方法研究医学科研中的有关数据的收集、整理、分析和推断应用性学科[1],也是提高医学高等院校学生水平的必修课程。为了了解本校此门课程的教与学的效果,给教学和制卷工作提供重要的反馈信息。本文通过对2013级选修此门课程学生的期末考试试卷进行分析,希望借此评价试卷质量,了解各专业学生知识的掌握程度,为进一步提高教学质量和制卷水平提供参考。

1. 材料和方法

1.1 材料

我校2013级本科生选修《医学统计学》的学生期末考试试卷,采用整群抽样的方法,从中选取了3个专业5个班级,共188分试卷。试卷严格遵守教学大纲和教材,注重对学生基本知识、基本理论、基本技能的考核,并注重对学生简单应用能力的考核。

1.2方法

试卷分析采用目前国内较为常用的指标,包括试卷信度、难度、区分度等指标[2-4]。

信度是指考试的可靠性或可信程度,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度。从另一方面来说,信度就是指测量数据的可靠程度。信度高的试题很少受到外部因素的影响,对不同学生的多次测试都会产生相对稳定和一致的测试结果。

常用的信度指标为Cronbach’α系数,计算公式为。k为测试的题目个数, 为所有被试者在第i道题上的分数变异, 为测试总分的变异。

难度是指试题的难易程度,它作为衡量试题质量的主要指标之一,是衡量试题质量的一个重要指标参数,与区分度共同影响并决定试卷的鉴别性。难度的计算一般采用某试题的通过率或平均得分率。较好的测验大部分的难度P值应介于0.2~0.8之间。

难度的计算方法为:

客观题 (k为答对该题的人数,N为参加考试的总人数)

主观题 (x为试题的平均得分,M为该题的满分)

为进一步计算区分度采用极端分组法计算难度,其具体步骤为:1、将考生的总分由高到低排列;2、从高分开始向下取全部试卷的27%(即188*27%=50份)作为高分组;3、从最低开始向上取全部试卷的27%(即188*27%=50份)作为低分组;4、分别计算出高分组的难度PH及低分组的难度PL;5、最后计算出PH和PL的平均值

区分度是指一道题能多大程度上把不同水平的人区分开来,也即题目的鉴别力。区分度越高,越能把不同水平的受测者区分开来,该题目被采用的价值也就越大。区分度D的取值范围-1~1。一般要求试题的区分度在0.2以上。当D>0.4时,说明该题目能起到很好地区分作用;当D

1.3统计分析

利用SPSS 18.0统计软件和ExcelΤ杉ǖ姆植继卣骷笆跃淼男哦取⒛讯取⑶分度等指标进行统计分析。

2.结果

2.1 试卷内容与结构

本张试卷内容涵盖了医学统计学的基本概念、t检验、方差分析、卡方检验、秩和检验、相关和回归分析等。由选择题、名词解释、简答题、案例分析等部分组成,题量与分值设置见表1

2.2考试成绩的基本分布特征

用SPSS18.0统计软件对总分进行统计描述。结果显示考试成绩呈负偏态呈分布,参加考试188名学生中,最高分96分。最低分43份,平均分74.63分。各分数段人数见表2

2.3各专业成绩比较

本次调查共选出3个专业共5个班级,各专业考试成绩见表3

由表可见三个专业的学生考试成绩差别有统计学意义(F=25.87,P=0.000)。两两比较发现营养专业与护理专业分数有统计学意义(P=0.000)与中医班分数也有统计学意义(P=0.000)。

2.4试卷质量分析

2.4.1 信度分析利用Excel作信度分析,得到本卷的Cronbach’α系数为0.73。普通试卷要求α>0.5,标准试卷要求α>0.7,说明整体考试结果可以信赖,该试卷能够反映学生的真实能力。

2.4.2 难度与区分度分析 分别计算各种题型的难度系数和区分度,结果见表4。四种题型的难度均介于0.2~0.8之间,试卷整体难度为0.74,难度适中。其中案例分析题难度最大,名词解释难度最小。试卷总体区分度为0.31,其中简答题区分度为0.150.4,优秀,整体试卷质量较好。

2.4.3试卷质量分析运用教育测量学理论,计算所有试题的难度系数和区分度对试题质量进行综合分析,结果见表5。本试卷良好试题占比为66.6%,可以认为试卷质量比较令人满意。

3.讨论

由试卷质量的分析可见本套试卷信度指标Cronbach’α系数为0.74,可信度较高,试卷较真实地反应了学生的真实情况;难度系数0.74、区分度0.31。试卷难度设计适当、覆盖面广,试卷质量较高。但是在制卷过程中还有需要注意的地方。名词解释的题型对于学生考核的区分度不高,学生也较易得分。这由于部分学生在应试的过程中主要是通过死记硬背的方法,因此并不能很好的反应学生真实掌握的情况。需要在以后的制卷工作中加以调整。

此次考试学生发热平均成绩为74.63±12.20,成绩曲线成负偏态分布,从学生成绩看有接近40%的同学在80分以上,取得了较理想的分数,从中反映出这些同学对于基本知识、概念掌握较好并且能灵活应用解决实际问题。但也有部分同学成绩较差,主要原因是案例分析题失分较多,这反映出这部分同学虽然对基本概念和知识掌握较好,但是对统计分析方法的运用以及解决实际问题的能力还有待提高。通过不同专业学生成绩的比较,我们发现营养专业的学生获得了更加理想的成绩。这部分得益于我们新的教学尝试,对于营养专业的学生我们在讲授理论课的同时适时的增加了SPSS软件操作步骤和结果解读的讲解。更丰富也更接近实践的锻炼有效的提高了他们灵活运用统计知识解决实际问题的能力。

对于提高解决实际问题的能力,我们认为将理论课与SPSS实践相结合,教学过程中甄选案例,适时的补充SPSS软件的操作步骤和对结果的解读将会取得不错的教学效果。这样的方法可以帮助学生从繁杂的公式记忆和计算工作中解脱出来,从而使其注意力转移到对统计学方法的应用条件的理解和对统计结果的判断上,角色从计算的执行者转变成为对结果的决策者。让同学们充分体会到统计学解决问题后所带来的快乐和成就感,有助于提高学生对医学统计学的学习兴趣及动手能力、实际解决问题能力的提高。

参考文献

[1]孙振球.医学统计学[M].北京:人民卫生出版社,2010:1.

[2]许志强,周华东,李静等.试卷分析系统在神经病学教学中的应用[J].重庆医学,2010(10):1311-1312.

数学考试分析总结范文5

    一、试卷的结构分析

    主要包括:

    1.内容结构分析:基本概念和化学原理、元素化合物知识、有机化学知识、化学计算、化学实验等方面的内容比例乃至每一方面的二级结构分析。

    2.目标水平结构分析:按照考试大纲所列水平(通常分为知道、理解、应用、综合运用等)种类,分析它们的组成比例并且作内容—水平双向交*分析。

    3.题型结构分析:各类题型的比例分析。

    4.分数结构分析:内容—分数和水平—分数的双向交*分析。

    5.难度和时限结构分析:对难度测验作难度分布描述,对速度测验作时限分布描述。

    6.试卷特点及横向、纵向比较:就试卷是否符合考试(教学)大纲规定、是否反映化学学科特点和内在联系、符合学生实际水平、合理性、适宜性以及其他特点作出描述和判断。横向比较可以在学校—学校或地区—地区间进行,纵向比较可以在不同学年间进行。

    进行结构分析时,分析者要对测验各项目逐一分析和作出判断,因而结构分析带有较强的主观色彩。分析者对项目的判断跟编制、设计者不一致的情况经常会发生,对于比较复杂的综合题尤其是这样。为此可以把试卷结构分析结果跟编制试卷的结构设计进行比较。

    除了难度结构分析跟答卷情况有关,只有在考试实施之后才能进行外,其他各项分析跟答卷情况无关,在考试实施之前就可以进行,属于试卷的“静态”分析。

    二、答卷情况描述

    主要包括:

    1.成绩分布情况描述:列出频数分布表或频数分布图。

    2.统计量描述:列出平均分、标准差、优分率和低分率以及某些因素间的相关系数等数据,还可以进一步作各内容跟其平均得分率、标准差、优分率和低分率的双向交*分析,各水平层次跟其平均得分率、标准差、优分率和低分率的双向交*分析,以便从中发现问题。

    3.分布形态判断:判断总体分布是正态还是偏态或其它形态。

    4.由样本统计量推测总体参数(总体平均成绩、总体标准差等)。

    三、试题及解答情况分析

    1.题目的内容、水平分析:逐一分析各题的内容、水平和考核意图。

    2.题目的难度、区分度、灵敏度、识别度和题目反应分布:具体方法参见文后所附题目分析部分。

    四、试卷质量分析

    1.试卷的信度分析和效度分析。参见文后所附“试卷的信度分析和效度分析。”

    2.整卷难度分析。

    3.试卷质量评价:就考试目的和试卷内容、结构、形式的合理性、适宜性、有效性和可行性等对试卷作出全面评价。

    五、教学分析和教学建议

    从得分、失分情况以及某些部分之间的比较、分析,发现教师、学生以及命题等方面的成功与不足之处,并针对存在问题提出改进意见。

    为了使试卷分析全面、可靠和有效地发挥应有作用,试卷分析工作应实行教师分析和学生自我分析结合、“动态”分析和“静态”分析结合、定性分析和定量分析结合,在认真分析的基础上,简明、扼要、有重点地写出试卷分析报告。

    附:题目和试卷的统计分析方法

    一、常模参照性测验的题目分析

    常模参照性测验题目的分析工作,主要是对测验结果进行统计分析,估计题目的难度、区分度,分析答案是否适宜等。

    1.难度分析

    所谓题目难度是指某一题目的难易程度,通常用答对率P来表示。

    一般说来,题目的P值以0.2~0.8为宜。也有人用不通过率Q来表示难度。它们的计算方法如下表所示:

    *X高为高分组的该题得分总和,X低为低分组的该题得分总和,H、L分别为该题的最高、最低得分。

    P值无等距性,无法对试题之间的难度差异作精确的比较,也不能用于计算平均难度。为了对各题难度作比较,通常要把P转换成标准难度,使之等距化。

    值越大,题目难度越大;=13时,题目难度为中等。

    运用下表可以方便地由P值直接查得对应的值:

    2.区分度分析

    题目区分度是指某一题目对被测水平的区分能力。若某题目能使水平较高的被测得较高分、使水平较低的被测得较低分,该题就有较高的区分度。

    区分度分析可以采用极端分组法,或者采用相关法。相关法比较复杂,这里从略,不作介绍。在极端分组法中,从总体中分出高分组和低分组(比例均为25%~33%且数值相同),然后计算区分指数D作为区分度的指标,如下表所示:

    除了计算方法以外,还可以采用弗拉南根查表法:根据占总人数27%的高分组的答对率和占总体人数27%的低分组的答对率,从专门的表(附表5)中查得题目的区分度。

    一般说来,当D<0.20时,题目的区分度太低,必须淘汰或者加以修改;当D≥0.40时,题目的区分度非常好;通常题目的区分度指数D在0.2~0.4之间。题目难度跟题目区分度之间有着一定的联系。难度太大或者太小,都可能使区分度变小;只有难度适中时,才可能有较高的区分度。

    3.题目反应分布分析

    对于多重选择题等可能有多种答题情况(题目反应)的题型来说,仅仅作难度分析和区分度分析是不够的,还需要分析题目反应分布情况,检查它是否跟预期的反应分布模式符合,从而发现需要修改之处。题目的难度和区分度也可以从反应分布中得到反映。进行题目反应分布分析,先要制作题目反应分布表。下面是该表的示例,表中还列出了有关的分析和判断:

    *为答对人数

    二、目标参照性测验的题目分析

    目标参照性测验题目试测后的分析工作主要是作灵敏度分析和识别度分析,有时也要作题目反应分布分析。

    1.灵敏度分析所谓灵敏度是指题目能灵敏地反映教学作用的能力,通常用目标教学前后被测总体的通过率之差来估计。

    设目标教学前、后通过试题的被测人数分别为R1、R2,被测总体人数为N,则试题对教学的灵敏度指数S可按下式计算:

    当S>0时,试题有效,S越大,试题对教学作用的感受越灵敏;当S≤0时,需要研究是否由教学不当而引起,如非教学不当引起,则可认为试题质量不佳。

    2.识别度分析

    题目识别度是指某试题能有效地识别达标者的能力,通常用合格者通过本题的百分比跟不合格者通过本题的百分比之差来估计。

    设P1和P2分别为合格者和不合格者的本题通过率,则

    识别度指标D=P1-P2

    识别度指标的最大值为1.0,当D≤0时,该题无预期的识别能力。

    题目识别度还可以用被测是否合格跟是否通过本题的φ相关系数来表示。设题目在总人数为N

    的被测总体中的试测结果如下表所示:

    所得φ相关系数需进行检验,方法是:按下式算出φx2

    x2=Nφ2

    的,其犯错误可能性为0.05。

    3.题目反应分布分析

    目标参照性测验的题目反应分布分析方法跟常模参照性测验的分析方法相似。通过分析不但可以发现题目中存在的问题,还可以了解被测的错误类型及其分布,具有学习诊断作用。

    三、试卷的信度分析

    信度表示测量的一致性、稳定性和测量结果的可靠性。测量时的随机误差越小,测量结果就越接近真实值,其信度就越高;样本统计量越是接近总体参数,其信度也越高。

    信度常用信度系数rxx表示,其值在0~1之间。若rxx=0,表明实得分数完全由偶然误差决定;若rxx=1,表明实得分数完全不受偶然误差的影响。一般说来,化学学业成绩测验的信度应在0.90以上,甚至达到0.95。

    由于Sr和SR难于直接测得,所以rxx通常借助于某些特别方法进行计算。

    (一)常模参照测验信度的计算

数学考试分析总结范文6

[关键词]SPSS;期末考试成绩;统计分析

1 引言

统计分析软件――SPSS(Statistical Package for the Social sci,ence)的中文译名为社会科学统计软件包,它是世界著名的、优秀的统计分析软件之一。SPSS是一个具有综合性的专业统计分析和数据管理系统。SPSS数据管理和分析功能强大,界面友好,操作简单,有灵活的变量变换和文件交换系统,多种统计图表的结果输出,并具有与Microsoft Office软件兼容等特点,在社会学、医学、心理学、人文学、生物学、教育学等领域已取得了深入的应用。它操作简便、好学易懂、简单实用,是学术界经常使用的计量软件。SPSS的主要功能为:回归及相关分析、聚类与判别分析、主成分分析及因子分析等十几个大类。下文将以某班学生的期末考试成绩为样本,简单分析了一下SPSS在学术研究中的具体应用案例。

2 数据来源和数据录入

笔者通过运用统计分析软件SPSS,对某班30名同学的一次期末考试成绩进行了统计分析,各项成绩包括大学体育、程序设计语言、成绩设计语言SJ、思想和中国特色社会主义理论体系概论、大学英语、档案学概论、信息系统管理和总分8项,统计数据如表1所示。将存在于excel中的表1,通过“文件”“打开”“数据”“文件类型”选择excel一选中表某班同学期末考试成绩所在的excel文件一点击“打开”,便可将excel中的数据导入SPSS。

3 数据分析

3.1 描述性分析

3.1.1 频数

在数据视图中进行以下操作:点击菜单栏中的“分析”“描述统计”“频率”将7门课程及总分项添加到变量中,选中“图表”中的“直方图”并勾选“带正态曲线”后点击“继续”,勾选“显示频率表格”项,点击“确定”共出现8个直方图,图1是其中一个。由图1可分析,大学体育成绩的均值为89.03分,取得89-91分的同学占8人,得分在80分以下的2位同学需加强此方面的锻炼。大学体育成绩呈正态分布,标准差为5.411,反映出此体育教师的评分较合理。

3.1.2 平均数与标准差

在数据视图中进行以下操作:点击菜单栏中的“分析”“描述统计”“描述”在“描述性”对话框中添加7门课程和总分项到“变量”,勾选“将标准化得分另存为变量”,点击选项中的“均值”、“标准差”、“最大值”、“最小值”后点击“继续”,单击“确定”所得结果如表2:

由表1可知,大学英语中的极小值为55分,存在挂课现象,该同学必须重修,来年选课时应及时通知该同学重修。程序设计语言和大学英语的均值达不到70分,英语和计算机是当代大学生必备的两个技能,我班需实施一些措施来提高同学们的英语和计算机水平。程序设计语言的标准差高达10.189分,极大值94分,同学们可以向计算机水平高的2009409035等同学请教。

3.1.3 分组求平均值

分组求平均值是对数据分组描述,可以输出分组数据的均值、标准差、极值等,即对数据进行多层分类汇总。点击菜单栏中的“分析”“比较均值”“均值”在“均值”对话框中,将“总分”添加到“因变量列表”、“大学体育”添加到“自变量列表”,点击确定。结果为表2:

随着体育成绩的逐步提高,总成绩均值出现了高低起伏不定的趋势,这说明体育成绩和总分之间没有必然的联系。加强体质锻炼不会影响自己的学习成绩,因此多运动不应成为成绩不佳的借口。作为当今社会的一名大学生,只是学习好是不行的。学习固然重要,但大学作为与社会接触的桥梁,素质拓展活动也不可缺少。同学们应努力提升自己的综合素质,力图使自己成为一名四有新人,德智体美各方面全部发展。

3.1.4 数据探测

点击菜单栏中的“分析”“描述统计”“探索”在弹出的“探索”对话框中,将“总分”添加到“因变量列表”、“档案学概论”和“信息系统管理”添加到“因子列表”,选择“绘制”中的“茎叶图”后单击“继续”,选择“输出”中的“图”,最后点击“确定”生成如图2所示的两张箱线图:

图2中的两幅图呈现出同一个趋势,即数据点分布在左下角和右上角的对角线附近。也就是说,无论是档案学概论的成绩还是信息系统管理的成绩,都与总分是正相关的关系。换句话讲,一般情况下,专业课成绩高的同学,总分也就越高。由此可见专业课的重要性,在日常的学习中,同学们应把专业课放在首要位置。

3.2 聚类分析

聚类分析是根据一批样本的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样品(或指标)聚合为一类。类聚分析是研究“物以类聚”的一种方法。

现将全班30人按总分分为三类,以直观、简明的方式统计每个同学在学习成绩上所处的位置,具体操作步骤如下:点击菜单栏中的“分析”“分类”“系统聚类”一在弹出的对话框中,将“总分”添加到“变量”、“学号”添加到“标注个案”,分群为“个案”,输出勾选“图”,在“绘制”中勾选“树状图”,然后继续一单击“确定,最后生成树状图。

3.3 多维尺度分析

多维尺度分析技术是一种探索性数据分析技术,可以将含有多个变量的大型数据压缩到一个低维空间,形成一个直观的空间图形,以空间中的点表示变量之间的潜在规律性联系。

通过SPSS统计软件“度量”功能中的“多维尺度”分析功能。可以分析七门课程之间的潜在规律性联系,具体操作步骤如下:“分析”“度量”“多维尺度”在“多维尺度”对话框中,将七门课程添加到“变量”,数据为距离数据选择“正对称”,“模型”中度量水平为“序数”、条件性为“矩阵”、维数均为“2”,选项中的输出选择“组图”点击“确定”,生成图3。通过图3可以看出七门课程之间的潜在性规律,如程序设计语言和大学英语被划分在第二象限,其中的潜在性规律可能有很多,比如均分都比较低等。通过此图也可以验证上文的一些结论。

3.4 相关分析

相关分析是研究一个变量与另一个变量间的相互关系。研究变量间相互关系的性质和紧密程度。换句话讲,相关分析的任务是对相关关系给予定量的描述。

4 结语

成绩分析是教育系统的有机组成部分,对考试成绩的分析测量和评价应当是每个教师和同学必备的能力。SPSS在考试数据统计分析中应用广泛,本文结合具体数据,从描述性分析、聚类分析、多维尺度分析和相关分析四个方面介绍了使用SPSS进行统计分析的一般方法和步骤,并提出一些实际存在的问题和建议。通过分析该班同学的期末考试成绩,笔者更加深入地了解了同学们的学习现状,相信此次统计分析结果会为该班提供很好的借鉴,同时也希望能为年轻的科研人员提供一种研究思路。

参考文献

[1]杨晓秋,图书馆读者满意度调查问卷的SPSS设计[J],农业图书情报学刊,2 008(20):171-174

[2]杨晓明,SPSS在教育统计中的应用[M],北京:高等教育出版社,2004

[3]赵守盈,吕红云,多维尺度分析技术的特点及几个基础问题[J],评价与测量,2010(4):13-19

[4]曹玲,杨静,夏严,国内竞争情报领域研究论文的共词聚类分析[J],情报科学,2011(28):923-930

[5]李延波,房红芳,SPSS统计软件在大学英语考试成绩分析中的应用[J],考试研究,2011(20):1-3

[6]崔永红,李学民,运用SPSS对专业基础课与专业课成绩分析[J],科教研究,2011(14):34-36

[7]潘小燕,统计分析软件在大学英语教学测试效果评估中的英语[J],科教文汇,2011(3):112-113