范文一:对XX同志的综合评价
对XXX同志的综合评价
XXX同志于1996年参加工作,先后做过我厂A车间岗位操作工、班长、车间主任。因其出色的工作表现, 2009年初XXX同志被调任B车间主任。
该同志为人诚信廉洁,在工作中善于听取别人的意见,乐于和他人讨论问题,员工也愿意与他沟通,在工作中也能给下属充分授权,使员工的积极性和智慧得到充分的发挥,在员工中有一定的影响力。
该同志在工作中恪尽职守,吃苦耐劳,敬业负责,勇于承担责任。对于制药行业来说,质量是企业的生命,而我们生产的产品质量起伏很大,质量控制一直都处于严峻的形势,针对这种情况,XXX同志在组织生产中严格执行GMP条款加强管理,从加大清洁消毒频率,到严格执行人员进出洁净区管理,以及人员在洁净区内的行为规范,使产品质量比以前有所提高,微生物指标有所下降。在他的日程表上没有休息日、节假日,从不计工作时间长短,车间有事随叫随到,努力保证生产顺利,产品质量稳定。
虽然工作很辛苦,很紧张,但该同志从来没有停止过对新知识的学习,《2010年版药品质量管理规范》出台后,他通过努力学习,再利用业余时间把自已的学习体会通过培训的形式给大家分享,让大家一起得到提高。
在公司各级领导的支持下,XXX同志在担任B车间主任期间,无论是从产量、质量、安全等方面,都使B车间的工作得到了很大的提高。在实际管理过程中,能牢固树立“质量第一、安全第一”的思想注重产品质量、安全管理工作,具有良好的职业道德,XXX同志曾分别被评为2010年度“百日质量安全活动”先进个人、2010年度优秀党员。
在各项工作顺利开展的同时,XXX同志也还存在一些需要提高的地方,如:对于领导交办的任务,想问题不够全面,不够深刻,有时处理问题思路不够清晰,使得工作开展起来比较被动。
但从我厂的总体的角度来看,XXX同志完全符合副厂长的工作能力。
范文二:对物理试卷A的评价
对物理试卷A的评价
一、综合评价
(一)试卷规范标准评价
该试卷的说明语和试题解题指导语简明、准确、齐全。
试卷题量为30小题与中考题量相当,试卷格式、试题编排(由选择、填空和问答三部分组成)比较合理;但在字体的大小、物理量的符号(字母的正斜体)上规范性还不够。
(二)试卷课程目标标准评价
试卷中所提供的物理情景真实,主要考查学生的基本知识与技能,同时也注重考查学生 运用基本物理知识进行科学探究、解决实际问题的能力(如29题、30题)。但试题在体现对学生情感态度与价值观的考查方面还重视不够。
(三)试题题型质量标准评价
1. 选择题
题干与选项具有一定的逻辑关系,语法上无错误并大部分采用正面陈述。但在干扰项具有似真性,而且是实际中因错误解答可能得到的结果设置方面还没有充分考虑。另外,第7题B、C选项题意重复;第11题电路图脱离实际,是为了人为提高难度;第12题的问题情境太虚拟了,有失真实性。
2.填空题
试题表述较清晰、无歧义和含糊不清的语言、对答案无暗示。能注重考查学生对物理概念建立过程与物理规律形成过程的理解,没有鼓励对物理概念、规律的死记硬背。要求填写的答案基本明确、唯一且无争议。
3.作图题
试题解答要求明确,涉及的知识点基本,提供的主图清晰且比较规范;但丙图中物理量符号不规范,图丁中最好加画开关。
4.计算题
编制题目时考虑了创设一定的情境,没有照抄教材中的原文或例题。试题考查学生应用所学知识分析问题和解决问题的能力,重点考核学生的思维过程和对问题的整体理解。语言陈述比较规范、准确;提供的数据真实、可靠。但还没有注意鼓励学生的创新精神。
5.实验与探究题
能考虑试题背景材料联系生活、自然、科学与技术等方面素材作题干内容(如29题、30题);实验探究设计过程基本符合学生认知特点,从多个角度、多个层次考查学生的多种思维能力(如29题); 但在试题具有一定的开放性方面还没有做到,探究题要重视思维的开放性、强调答题的多样性。实验与探究题既要给学生发挥余地,又要给予适当提示(如28题(4)的操作需要三项,但只给了两个空格,很容易误导学生。如30题(3)因为在题干中没有给予适当提示,要让学生完整正确的回答出命题者的答案几乎是不可能的)。另外第28题的实物连接图与电路图的连接线没有对应而有失规范造成失误;第29题(4)对于
影响静摩擦力的因素的叙述不严谨;第30题(5)超出初中所学范围(要用到力矩平衡的概念和圆盘状质量的表达式),且只是仿造(对应给定的公式去凑)而不是探究。
(四)试卷科学性标准评价
试题的知识点基本符合新课程标准要求和考试说明(物质约15%、运动和相互作用45%、能量约40%);试卷题型结构、分值结构合理(选择题约24%、填空题约28%、作图题约8%、计算题约18%、实验与探究题约22%),结构效度比较好。但试卷地方特色不很明显、试卷难度结构不很合理,中档难度试题略微多了些,所以区分度会不很明显(难度和区分度都只是预估,实际难度和区分度要阅卷后才能知晓)。
二、亮点点评
主要具有亮点的题是29题。
第29题以课外兴趣小组施放水火箭的科技活动为背景,创设了一个真实的探究活动的情境,贴近学生、可操作性强、设问符合科学探究过程的要素标准,将力的作用是相互的、内能和机械能的相互转换、影响摩擦力大小的因素等知识巧妙的融入情境中,体现了在情境中设问,能激发学生解题的兴趣,提高学生探究的欲望,并能从多角度、多方法综合考查学生利用力学知识、能量知识发现问题和解决问题的探究能力和语言表达能力。
三、失误剖析
第28题实物连接图与电路图的连接线没有对应,造成失误;原因可能是命题者没有仔细核对或是命题者平时就没有注意规范。
第29题(4)增大瓶塞与瓶口的压力,从而增大了瓶塞与瓶口的摩擦力,这句话很不严谨;此时的摩擦力是静摩擦力,其大小是与压力大小无关的。只有最大静摩擦力才与正压力成正比,故命题者在命题时一定要有更深的学科知识教学背景才能做到居高临下。
四、改进建议
1.命题前必须认真研究课标和理解考试说明内容,必须了解应届考生的实际学习情况和教师的实际教学情况,做到命题具有针对性、两考合一性;既能体现学业水平性,又能体现选拔性。
2.命题时既要注意符合考试说明中考试内容分布占比,又要考虑到重点知识、核心知识的全覆盖,还要注意知识点的考查不要有重复。
3.以能力立意的题目不是人为的增加超范围的学科知识上的难度,而是考查学生的思维的深刻性和发散性,主要考查学生对已学概念的辨析、理解和具体应用,主要考查学生对知识的迁移能力。
4.试题要体现地方色彩,要体现时代性,要关注科技热点问题,要加强实验基本方法、基本思想、基本设计能力的考查。试题既要关注改编,又要注重创新, 压轴题必须是原创题,否则就会产生考试的不公平。
范文三:对高考试卷的评价
对高考试题的评价
曹春丽
本次高考试题个人认为出的还是以稳为主,试题难浅度区分较明显。比如选择题,单选最后一题第5题,不定项最后一题第8题难度都较大,在第8题中体现了新教材中新加入的简谐运动中位移随时间变化的关系公式,这个知识点在最后补漏中也提到了,但是没有类似的考题,学生答的可能不会太理想。其它的选择题应该说都较基础,是平时较经常练习的,象第2,3,4,6,7题,学生如果能正常发挥的话,应该问题要小一些。选择题第1题学生容易大意失分。另外学生可能出现的问题是不定项中可能不敢多选。
主观题中的实验题可能有点意外,填空题没的说,考纲中已经明确说明,只是学生可能还需要适应。力学实验出的挺好,挺基础,还有变化,平时练习相对较多。比较重要的是它同时考察了学生的语言表达能力,这也是新课标要达到的一项任务,也是学生的一个弱项。只有电学实验出的真挺意外,因为多用表的实验前面考过,所以今年相对来说没有其他实验复习的多。在事先的多次预估中,也是很少出现。但仔细想一下,今年实验的考题也是新教材中新加入的,虽然新教材我是在高三才接手,但是在复习多用电表这个实验时,已经注意到,在几本参考书中都提到了一图改多图的电路图,在以前的教材中没有体现。这应该也是与新课标的一个接合点。
主观题中的计算题第10题,从答案中就可以看出这道题的多解性,学生可以从很多角度去解,体现了现在教育经常提倡的创造性,灵活性。难度不大,方法多多。第11题,考察的学生作图能力,计算能力,复合场一直是高考考察的重点,今年也不例外。第12题是本次考试的压轴题,在这次判卷中我判的也是这道题,先不说我的判卷感受,单从题面来说,本题考查了学生的阅读能力,对字母的辨别能力,审题能力,计算能力,数学基础。从难度系数来说,还是难浅度区分较明显,第1问只要读懂题,有时间,难度就不是很大。但第2问很明显是在拔高了,有相当的难度。
从判卷的感觉来说,
第1,学生时间不充裕,我判的最后这道题,很大一部分学生放弃了,还有一部分可以很明显的看出实在匆匆忙忙中写下几个公式还没时间继续,还有一部分是做的太心慌,第一步错了,第二步又对了,或者反过来,总之你综合看他的答卷会有感觉他是会的,但是落在答卷上,会有很多扣分,丢平方的,平方变立方的,比比皆是。
第2,审题不清,几个字母谁代表谁,都乱了。还有最后结果要求保留一位有效数字,一部分学生没看见,还有不会保留的。
第3,学生的计算能力不太好,很多因为计算失分的,应该说是物理的可悲处,他物理会,但是没得分。
第4,每道题的计算结果,对学生得分上影响很大。
第5,采分点,有些学生因最后结果错了,中间有些数据就没体现所以失分,很遗憾。
第6,学生公式错,比如少平方,过程很好,整道题一分没有,太遗憾了。
今后更要注意的事项
1.再次跟学生强调,在答大题时,实在不会的,能写点公式就写,哪怕是在罗列公式。但强调公式一定要准。
2.加强公式的记忆过程。现在的学生主动性差一些,那就需要老师们逼着去背。以前总认为这个公式都已经每节课都说了,但有些学生他就是不会。今年的高三比较有感触,万有引力那节的公式特别多,所以我用了几节课上课先提问,当时一问公式就要占据半节课,当时还有点后悔,但在最后的复习中,我体会到了我的学生是最愿意做那块的习题的,象其他章节公式较少的,都没那好。所以这一点我一定要记住。也提醒大家。
3.平时做题注意找采分点。
4.精于计算,结果在题中所占分量很沉的。
5.学生的做题速度。
6.学会取舍,象最后大题的第一问,有时间的话,一定可以那分的。前面选择难度的,就先放一放。
范文四:关于试卷分析的综合评价报告
南京财经大学本科毕业论文
目 录
中文摘要 ....................................................... 1 英文摘要 ....................................................... 1 一、引言 ....................................................... 3 二、文献综述 ................................................... 3 三、试卷分析的指标体系 ......................................... 4
,一,试卷成绩分析 ......................................... 4
,二,试卷质量分析 ......................................... 5 四、试卷分析的实证分析 ......................................... 8
,一,统计学考试情况介绍 ................................... 8
,二,试卷分析的实证分析 ................................... 8 五、试卷质量的综合评价 ........................................ 11
,一,建立层次结构模型 .................................... 11
,二,确定权重 ............................................ 12
,三,制定评定标准 ........................................ 13
,四,计算试卷质量综合得分 ................................ 14 六、试卷质量分析总结 .......................................... 15 参考文献 ................................................ 18 附 录 ................................................... 20
南京财经大学本科毕业论文
基于综合评价的试卷质量分析
-以南京财经大学统计学考试为例
中文摘要
摘要:考试是教学工作的一个重要组成部分~对考试做试卷质量分析具有很重要的实践
意义。本文具体分析了南京财经大学2010年6月至2012年6月统计学考试试卷的难度、
信度、区分度及效度等~对其考试成绩做一个定量的~较为准确的分析~以此介绍一些
常用的试卷质量分析指标和手段。同时建立关于试卷质量分析的综合评价模型~对试卷
质量进行综合评价,计算各试卷综合得分~总结并提出具体的改进建议。
关键词:试卷质量~信度~难度~区分度~综合评价
英文摘要
Analysis based on the comprehensive evaluation of the quality of papers
- A Case Study of Nanjing University of Finance and Economics
statistics examination
Abstract:The examinationis is an important part of teaching, exam papers quality analysis has a very important practical significance. In this paper, we analyzed
1
南京财经大学本科毕业论文
the statistics examination of Nanjing University of Finance and Economics from June 2010 to June 2012 b, to examination their difficulty, discrimination and reliability, at the same time~to make a quantitative and more accurate
analysis,in order to introduce some commonly used paper analysis tools and indicators, a quantitative test scores, the more accurate analysis. At the same time, we establish a comprehensive evaluation model, and make a comprehensive evaluation of the papers, in order to summarize and make specific recommendations for improvement.
Keyword:Quality of Test Papers ~ reliability, difficulty, discrimination,
Comprehensive Evaluation
2
南京财经大学本科毕业论文
一、引言
考试是一种有效的检验学生知识能力及教学质量优劣水平的手段~考试成绩客观的反映了学生的综合能力, 同时也是对教师教学情况的直接反馈。一份准确的考试成绩分析~可以帮助教师在接下来的教学工作中有侧重点的调整教学~正确评价教学质量~同时也有助于了解同学平常学习的真实情况。然而~由于部分试卷的质量并不能得到充分的保证~导致它在实际教学中不能充分发挥其应有的作用。因此~不断提高和完善命题水平~确保试卷质量是非常重要的。
本文具体介绍试卷分析中各指标的选择和运用~并建立对考试成绩分析的综合评价模型~力图对试卷质量做出客观的综合评价。
二、文献综述
试卷分析是教育测量学的一个重要延伸~建立科学的试卷分析指标体系需要依靠教育测量学学作为支持。
在教育测量学发展史上~杰弗瑞〃格林勒(Jeffrey A. Gliner)与乔治〃莫干(Georg
[1]e A. Morgan)初次较完整地给出了教育质量的评价框架,具体归纳为以下六个方面:,1,同行评议总体质量,,2,考察研究中涉及的关键变量的属性及测度水平,,3,识别研究问题或假设、研究设计方法以及实验设计类型,,4,评估该项研究的测量信度、效度是否符合要求,,5,评估该项研究的信度与效度,,6,对该项研究的总结性评价。其中研究的测量信度、效度以及研究的效度是决定研究质量最为重要的方面。
[2]根据教育测量学理论,试卷分析分为两个部分:试卷成绩分析和试卷质量分析。
试卷成绩分析指标主要有:参加考试的学生总数~最高分~最低分~平均值~标准差以及正态分布偏差~优秀、良好、中等、及格与不及格的人数分布及百分比, 成绩分
[3]布图等。
试卷质量分析指标有定量指标和定性指标两类。定量指标有:试题的难度指数、区
3
南京财经大学本科毕业论文
分度、信度~效度等。定性指标有: 试卷覆盖面、内容效度、失分原因分析、试题语言明确性和准确性(如表达是否科学、正确,是否使用准确的名词术语,是否设计合理的选择题备选答案~是否随机排列选项,是否参用精确的参考答案,是否有试卷内容提示相关
[3]答案等)、试卷印刷质量等。
以上所列指标均符合张篙莲和毛磊《课程成绩考核质量评估指标刍议》中提出的建
[4]立试卷评估指标体系所要坚持的四项原则:全面性~客观性~科学性~可行性。 三、试卷分析的指标体系
根据教育测量学理论,我们从试卷成绩分析和试卷质量分析两方面具体介绍试卷分析的各指标。
,一,试卷成绩分析
1. 均值、最值、标准差、频率分析
标准差反映变量值与其均值离散的程度。在考试中学生成绩的差异程度用标准差来
2x(x,),ixixS,衡量。标准差计算公式为:。其中~S为标准差~为各观测值~为n
平均数~n为观测值的个数。一般认为一份优秀的试卷标准差S为9-15间。S,8~则成绩分布较集中~中等难度题目偏多,当S,16时成绩分布较分散。
标准差系数C.V.是从相对意义上衡量全班成绩离散程度的指标, 计算公式为
SC. V. ,,100%。参考文献~C.V.值一般介于5% -35%间。当C.V.>35%时~应考虑平X
均数是否为适当的集中量数,若C.V.<5%~则应检验抽样或计算过程是否出现差错。 2(检验是否符合正态分布="">5%~则应检验抽样或计算过程是否出现差错。>
根据教育测量学理论,一次可靠科学的考试,考试成绩应该接近正态分布。也就是说~只有当考试成绩接近于正态分布时, 才能达到既定的考试目标。通常~我们可以利用P-P图或K-S检验来检验考试是否符合正态分布。
4
南京财经大学本科毕业论文
考试成绩正态分布偏差率F用来衡量考试成绩接近正态分布程度。F值越小~则考
51F,ni,AiN。 其中:ni ( 即试成绩越接近正态分布。偏差率的计算公式为:,Ni,1
n1、n2、n3、n4、n5)~是属于各考试分数等级 ( 0-49分)、( 50-59分)、( 60-79分)、
89分)、( 90-100分) 的学生人数,N为总人数。Ai是考试人数在5个分数等级( 80-
,
内分布的比例~。 ,,A0.1,0.2,0.4,0.2,0.1i,
,二,试卷质量分析
1.信度
信度又称可靠性~是指考试的可靠程度。个人在考试过程中的心理反应直接影响着考试成绩~这使得其结果必然存在误差~所以信度作为反映试题稳定性的重要指标,可以检验考试的结果是否真实客观的反应了学生的实际水平。考试成绩不易受偶然因素影响则试卷信度较高~所以一般要求试卷的信度系数尽可能大。我们通常采用克朗巴赫
N2,,iNi,1,Cronbach,α系数法来计算考试信度。计算公式为:。其中:N为,(1,)T2,1N,
22,试题数目,为第i题成绩的方差~为该考试成绩的总体方差。 ,i
α系数值一般介于0-1之间~对于试卷整体~α值越大表示信度越好。根据教育测量学理论,若一份试卷信度系数达到0.8以上则其可信程度较高。同时~美国语言测试学家罗伯特〃拉多,Robert Lado,也曾指出“如果是客观题, 信度系数应在0.9以上为佳”。所以~当T?0.5 时认为试卷信度较差,0.5 2.难度 难度指试卷难易程度~主要用于检测该份试卷对于考生来说是偏易还是偏难。一份过于容易或是过于困难的试卷都意味着出题的失败。难度的计算使用以下公式: 5 南京财经大学本科毕业论文 Xi。其中:表示第i题满分值~表示第i题平均值~表示第i题的难度。P,1-XSPiiiiSi n1P,P的整体难度:。其中:N表示总试题数。 一般由试题的平均难度来表示试卷,iN,1i 试卷难度P介于0.2-0.5时表示难度适中~若P,0.8则难度过高~P?0.2则难度 难度越小则难度系数越趋近于0~反之~难度越大则p越趋近于1。 过低~试卷偏易。 3.区分度 区分度是对不同水平的考生做出具体区分的统计量~是评价试题质量、筛选试题的主要依据, 它能拉开学生成绩优劣的层次~能反映出各水平同学对所学知识的掌握程度,使高水平的同学获得较高的分数~低水平的同学获得较低分。若是一份低区分度的试题~学生无论能力水平~所得成绩并无较大区别~考试的衡量作用不能得到很好的体现。 在计算区分度时,一题区分度一般被认为是被测试对象在某题的具体得分与总成绩间的相关系数。参照教育测量学~区分度具体计算一般使用高低27%分组法:将学生第i题考试成绩由高到低排列~从高分一端开始向低选取全部试卷的27%~作为高分组,从低分一端开始~依次向高顺次选取27%~作为低分组。分组后第i题区分度为: HLiiD,,。其中:、分别为高、低分组第i题的平均分~为高分组学生人HLMiii1MM12 数乘以第i题满分;为低分组学生人数乘以第i题满分。 M2 通常认为~区分度达到0.20以上即为良好。参考教育学文献~我们将区分度>0.4Di的试题认为“优秀”,0.3<>< dii0.3="" 的试题区分度为“尚可”但需要修改,而试题?0.2=""> 汰。 作为评价试卷质量的重要指标~难度和区分度之间有着密不可分的关系。一套试题不论是太难或是过于简单~它的区分度都不会很高~要达到有效区分学习成果的目的~必须使试题难度适中。于此同时~难度高的试题对高水平的同学有比较好的区分度~难 6 南京财经大学本科毕业论文 度低的试题对低水平的同学有较好的区分度~同样~难度中等的试题对中等水平的同学有更高的区分。一套合格的试卷其成绩应该呈正态分布~这要求教师相应的调整试题~在出题时需要选择较多中等水平的题目~同时保证较难和较简单的题型占相应的少部分比例~使难易程度保持正态分布~保证试卷整体有一个较高的区分度~体现考试的真正目的。 4.效度 效度反映了考试结果的有效程度~即考试成绩与考试目标间的接近程度~它验证考试在多大程度上满足考试目的。即考试的覆盖面是否准确体现了教学大纲的要求~考试成绩能否达到预期的考试要求。一次考试~如果没有合格的效度~那么不管在其他评价指标方面的得分有多高~都无法体现其真正的功能。 求效度需要一个有效的效标。效标效度是指测验结果与效标之间的一致性程度。一般情况下~进行试卷分析时采用平时成绩做效标。平时成绩主要有学生的出勤率、课堂作业情况、上课回答问题等方面~在评价方面具有一定的正确性和有效性。但由于本文测量需要的有效效标难以确定~因此~通过参考相关文献~在这里采用求平均区分度代 N1DE,Di替试卷效度的方法。计算效度的公式为: 。其中为第i题的区分度。 ,iN,1i 通常认为~若效度E?0.4~则该试卷可以有效地实现考试目标,若E,0.2~则不能有效实现考试目标,若0.2?E,0.4~则可以较有效地实现考试目标。 效度与信度间既有联系又有区别:考试中随机误差的大小是通过信度来反映的~而考试中系统误差的大小则通过效度来反映。拥有足够的信度是获得理想效度的必要保证。信度和效度是反应试卷质量的两个不同角度~效度是一种正确性, 而信度是一种稳定性, 但是稳定性并不代表正确性, 所以信度高, 其效度并不一定高, 但是信度低, 其效度必然低。所以效度只有在高信度前提下才具有统计意义。就二者而言~效度居于首位~低效度会使考试本身失去意义。 7 南京财经大学本科毕业论文 四、试卷分析的实证分析 ,一,统计学考试情况介绍 本文以南京财经大学统计学考试为例~选取2010年6月至2012年6月统计学5次考试成绩进行分析。统计学课程采用闭卷上机考试的方式对学生的学习情况进行考察~试题由计算机从题库随机抽取。试卷主要包括三个题型:单项选择题~多项选择题~综合题。其中~单选题30题~每题1分,多选题10题~每题1分,综合题6题~每题10分~总计100分。考试时间为80分钟。 ,二,试卷分析的实证分析 1.数据处理 将考试数据导入excel~删除测试数据及补考成绩~零分成绩等~选取有效成绩进行分析。求得单选题~多选题~综合题各题型总分~并得到考试总成绩。 2.分析过程 将处理所得数据导入统计分析软件SPSS19.0进行统计分析~逐步求得信度~难度~区分度等指标。下文具体操作以2011年01月第847号试卷为例。 ,1, 均值、最值、标准差、频率分析 通过计算~847号试卷各题型均值见表1~就成绩总体情况来看~平均分接近68分~单选题和多选题得分率高~综合题得分率低。从考试本身情况来看~单选题及多选题考查的大部分为基础知识~得分率较高,而综合题大多考查学生的综合应用能力~其得分低~显示学生对侧重知识应用的题型得分较低。 表1 847号试卷各题型均值 总分 多选 单选 综合题 均值 68.47 7.97 22.83 37.67 同样经过分析得到847号试卷其他描述性结果~见表2~由表得2011年1月考试中 8 南京财经大学本科毕业论文 共有26人抽中该试卷并进行测试~该份试卷标准差s=14.194~计算得标准差系数c.v.=21%~成绩分布较恰当。 表2 847号考卷考试成绩统计情况 指标 均值 众数 标准差 极小值 极大值 68.47 58 14.194 22 92 ,2, 正态检验 利用统计软件spss19.0对试卷进行k-s检验~其正态性结果如表3。可以看出:总分~多选、单选题及综合题均服从正态分布。同时计算得正态分布偏差率F=0.37。由于F值较小~所以该试题考试成绩很接近正态分布~试卷正态性为优秀。 表3 单样本K-S检验 单样本 Kolmogorov-Smirnov 检验 total 多选 单选 综合题 N 36 36 36 36 a,b正态参数 均值 68.47 7.97 22.83 37.67 标准差 14.194 1.797 4.570 9.577 最极端差别 绝对值 .128 .201 .178 .098 正 .069 .145 .105 .083 负 -.128 -.201 -.178 -.098 Kolmogorov-Smirnov Z .766 1.204 1.066 .586 渐近显著性(双侧) .600 .110 .206 .883 a. 检验分布为正态分布。 b. 根据数据计算得到。 ,3, 信度 我们选用克朗巴哈系数计算一致性信度系数~结果得出见表4:α系数为0.758~由于0.5 9 南京财经大学本科毕业论文 表4 信度统计量 可靠性统计量 Cronbach's Alpha 项数 .758 46 ,4,难度 在计算难度时~我们先求得各题型均值mean~然后后利用公式:p=1- Mean/S得到 ,其中S为各题型总分。计算得847试卷各题型难度见表5~由结果得选择各题难度系数 题难度较简单~试卷整体难度适中。 表5 各题型难度系数 题型 均值 总分 难度 total 68.47 100 0.32 多选 7.97 10 0.2 单选 22.83 30 0.24 综合 37.67 60 0.37 ,5,区分度 计算区分度时~参考相关文献~对客观题采用皮尔曼( Spearman) 等级相关分析~而主观题用皮尔逊( Spearson) 相关分析计算。经计算得各题型区分度见表6~分析得~客观题中单选题和多选题的区分度分别为0.594和0.737。主观题区分度为0.950。 表6 各题型区分度 题型 多选题 单选题 综合题 区分度 0.737 0.594 0.95 10 南京财经大学本科毕业论文 n PF,iii,1D,试卷总体区分度计算公式为:~其中为第i题的区分度~为第i题PFnii F,ii,1 的分值。参照公式计算得847号试题总区分度为0.82.故该试题整体区分度优秀。 ,6,效度 无法得到学生的平时成绩~所以这里利用平均区分度代替试卷的效由于此次分析 度~计算得该试卷效度E=0.76。根据评价标准~效度相关系数应位于0.4-0.8之间~所以对该份试卷其效度理想~能够有效实现考试目标。 五、试卷质量的综合评价 我们可以对试卷分析计算出的评价指标量进行综合评价~以此全面考察试卷质量~使各试卷之间更具可比性。 参照《教育测量学》理论~结合学校考试的性质和目的, 在进行试卷质量的综合评价时~我们所选择的试卷质量分析指标有:难度、区分度、信度。它们分别表示试卷的难易程度、可靠程度、区分能力。由于效度指标无法确定有效地校标~在上文中仅采用平均区分度代替效度~故在综合评价时不将其选入评价指标。选取试卷成绩分析指标有:平均分、标准差系数、正态分布偏度。后文将利用这六个因素建立综合评价模型并对试卷质量进行最终的分析。 ,一,建立层次结构模型 首先确定试卷分析评价目标树图~将各层评价目标用图有机地表示出来~建立综合评价模型~具体如下图: 11 南京财经大学本科毕业论文 试卷分析 试卷质量 试卷成绩 标准差系数C. V. 难度P 区分度D 信度T 偏度F 平均分A w, ww,,331212 其中:分别为各指标权重。 w,w,w,,,,,,123123 ,二,确定权重 权重对于评价过程是非常重要的~它直接体现着各指标在评价体系中的作用和地位~并对综合决策结果有着关键性的影响。本文中~我们采用专家咨询法和层次分析和相结合的方法来确定权重~以此增强其客观性。具体步骤如下: 1.构造判断矩阵: 采用专家征询法完成对判断矩阵的构造。请5位老师填写对各指标相对重要性的看法~并取平均值计算得判断矩阵R。经过整理所得判断矩阵见表7。 表7 判断矩阵 难度 区分度 信度 偏度 平均分 标准差系数 难度 1 0.2 0.14 0.33 0.33 0.5 区分度 5 1 0.33 3 5 5 信度 7 3 1 5 7 7 偏度 3 0.33 0.2 1 2 3 平均分 3 0.2 0.14 0.5 1 1 标准差系数 2 0.2 0.14 0.33 1 1 2.计算判断矩阵R的特征值及特征向量 在层析分析法中~由于判断矩阵本身存在着一定程度的误差~所以不需要高的精度~故采用较简便的近似求解法~在这里使用方根法求解。 12 南京财经大学本科毕业论文 'mW,u,u?u,1,计算初始权重系数 ii1i2im 'Wi,,2,计算归一化权重系数 。其中:m为指标个数。 Wmi'W,ii,1 根据方根法算出各项目指标的权重系数见表8: 表8 试卷评价各指标权重 难度 区分度 信度 偏度 平均分 标准差系数 权重w 0.04 0.25 0.47 0.12 0.07 0.06 3.一致性检验 综合评价过程中求得的权向量,需要通过一致性检验后才能使用。一致性检验公式为:CR=CI/RI。其中CR为随机一致性比率。CI为一致性指标~计算公式如下: mmw,m,,,ijjMaxiCI,,,,,, ~ ~ 。RI为平均一致性指标,规定Max,imm,1w,1i,1ii 6阶判断矩阵的平均一致性指标RI=1.24。 要使判断矩阵具有满意的一致性~则其CR,0.10。此时证明权重分配合理。否则需要调整判断矩阵直到达到合理的一致性。 由以上方法计算得:847号试卷随机一致性比率CR=0.04~CR<0.1。所以此次权重的分配是合理的。所以在接下来的评定中我们将使用第二步计算得到的权重进行具体分析。>0.1。所以此次权重的分配是合理的。所以在接下来的评定中我们将使用第二步计算得到的权重进行具体分析。> ,三,制定评定标准 南京财经大学统计学考试满分为100 分, 经参考相关试卷质量评价研究文献, 确定了难度P、区分度D、信度T、正态分布偏差率F、平均分A、标准差系数C.V.此6项指标的量标和相对应的分数。量化标准如表9所示。 13 南京财经大学本科毕业论文 表9 各项指标的量化标准 等级赋分 平均分 标准差系数 正态分布偏差率 难度 区分度 信度 A C.V. F P D T 优秀 65-74 0-20 0-0.15 0.5-0.79 大于0.4 0.9-1.0 ,90-100, 指标 良好60-64或21-40 0.15-0.3 0.3-0.49 0.3-0.39 0.8-0.89 等级 ,76-89, 75-79 评价 合格55-59或41-60 0.3-0.5 0.2-0.29 0.2-0.29 0.6-0.79 标准 ,60-75, 80-84 不合格,60大于0.8或低于55或高于60 大于0.5 小于0.2 低于0.6 以内, 小于0.2 高于85 ,四,计算试卷质量综合得分 m y,wx采用加法合成模型来计算试卷综合成绩~用线性加权函数作为综合评价,ii,1i 模型~进行最后的评价并求得试卷质量综合得分。我们将最终的试卷质量综合得分划分为四个等级:优秀~良好~合格~不合格。具体标准如表10所示。 表10 试卷综合得分等级标准 试卷综合得分 0-59.9 60-79.9 80-89.9 90-100 试卷等级 不合格 合格 良好 优秀 根据原始数据, 经计算~得到2011年01月第846份试卷质量的各项指标得分、指标等级得分及试卷质量的综合得分, 见表11: 表11 综合评价统计数据 试卷平均标准差系正态分布 试卷难度 试卷区分考试信度 201101-846 分 数 度 A C.V. 偏差率F P D T 指标 82.74 0.16 0.89 0.22 0.82 0.84 等级分值 66.53 98.00 46.80 63.33 97.00 81.78 权重 0.07 0.06 0.12 0.04 0.25 0.47 综合评价 y=80.88 结合表中数据~同时利用加法合成模型得该试卷综合评价得分y=81。参照试卷质量等级~846号试卷处于良好的等级水平~能满足考试测评的大部分要求。 14 南京财经大学本科毕业论文 六、试卷质量分析总结 由于统计学考试试题为题库随机抽取~为了降低研究结果的误差~在做最后统计分析时对每次考试选取测试人数最多的十份试题进行分析。因2011年1月参加考试人数较少~故选取三份进行分析。同样~2011年6月选取5份进行分析。共计38份。经过SPSS19.0对上述38份试卷逐步分析~可以得到以下几点结论: ,一,试卷成绩分析结果 从基本描述统计数据上来看~2010年6月至2012年6月五次统计学考试中~学生的卷面总成绩平均分为75分左右~大部分学生都可以顺利通过期末考核。在考试过程中~学生对考查基本概念的题得分率都比较高~如单选及多选题。然而~在对于知识的综合分析和实际运用方面~得分率普遍较低。 以上分析表明学生在学习过程中并没有很好地掌握学习重点~对课堂的知识掌握还停留在片面理解~并没有进行深入的思考~对各个知识点间的衔接掌握不够~反而更多的是进行简单的机械记忆。这种情况可能是由于学生没用使用正确的学习方法不当~也可能是由于学习态度不太端正~对于学习的态度还停留在简单的应付考试层面~没有扎实的理解学习重点~也没有发自内心想要真正的掌握所学习的知识。 从试卷的标准差水平来看~各考卷的标准差分布均恰当~学生个体之间并不存在较大差异。在今后的教学过程中有侧重性的对少数后进学生进行关注~努力调动他们的学习积极性~从而达到提高总体学习成绩的目的。 ,二,试卷质量分析结果 从难度上来看~所选试题中个别选择题难度系数小于0.2~这说明该题太简单~建议从题库删除此题~或者对其进行修改后参加下一轮的筛选。 从区分度及信度上来看~各试卷各题型区分度及信度都比较好~总体来说较为符合试卷组合规律和要求~考试成绩能够真实反应实际的教学情况~可以基本达到教学大纲的要求。 15 南京财经大学本科毕业论文 ,三,试卷质量综合分析 对38套试卷分别求试卷质量综合得分~根据已经制定的试卷综合得分等级标准~我们将各评价指标进行量化~使各试卷难度~信度~区分度和考试均分等按其得分处于合理的区间内~并对最终结果进行简单分析。分析得统计学考试试卷综合得分平均值为 -80分试卷18份~此类试卷等级评价为合格~79.82分~试卷总体水平为良好。其中70 需要在以后出题时调整难度结构~平衡出题难度~提高试卷质量。同时~80-90分试卷20份~此类试卷等级评价为良好~以后的教学工作中~可以在继续保持此水平的基础上调整个别低信度及低区分度的考题~使试卷质量达到更优。不足的是~此次检验的38份有效试卷中没有综合得分大于90分的优秀试卷~根据指标量化标准可推测~综合得分为优秀的试卷其卷面均分大致位于65-75分之间~标准差系数小于0.15~难度为0.5-0.79~区分度大于0.4~信度大于0.9以上~希望通过对各试卷的具体细致分析~在今后努力改进~合理分配试题分布~使其更加接近以上标准~最终得到综合评价成绩为优秀的试题模板。 ,四,对试卷的改进建议 根据对各指标的计算和试卷综合质量的分析结果来看~提高试卷质量可以从以下几方面进行改进: 1.适当增加考试试题数量~使试题涉及更多更重要的教学知识点~扩展其覆盖面~实考试抽样更具代表性。 2.选择题由于其特殊性~有很大的几率蒙对答案~这对于低水平的同学比较有利~不能检验出真正的水平~所以可以适当的减少选择题的数量~增加一些其它考查基本知识的题型~如填空题~以此来避免由于对选项的猜测而造成的成绩分布不合理。 3.由于考试试卷的难度也应近似服从正态分布~所以在试题的分配方面需要做相应的调整~另难度适中的题目占卷面分数的适当比例~最好在60-70分之间~以使考试成绩呈正态分布。 ,五,试卷质量分析的意义 16 南京财经大学本科毕业论文 利用软件对考试成绩进行分析~一方面能有效提高办公效率~节约办公时间~另一方面~能对以后的教学工作发挥有效的指导作用。对考试成绩及时进行分析~删除信度效度不合格的试题~对考查合格的题目进行保留或改进~将其引进试题库~取优弃劣~最终逐步建立一个各方面指标均为优秀的试题库~降低考卷选题的不成功率~促进试卷的标准化~为教育工作提供有效地反馈信息~更好的知道进行下一步教育工作~进而更有效地测试出学生的真实水平。 17 南京财经大学本科毕业论文 参考文献 [1] Jeffrey A. Gliner & Georg e A. M org an. Resea rch Methods in Applied Settings: An Integ rated Approach to Design and Analysis[M]. London: Lawrence Erlbaum Associates , Publishers , 2000. [2] 陈玉琨. 教育评价学[ M] . 北京: 人民教育出版社,1999. [3]任艳玲,朱明放. 基于统计软件SPSS的学生试卷分析方法[J]. 重庆工学院学报(自然科学版),2007,(4) [4]张嵩莲,毛磊. 课程成绩考核质量评估指标刍议[J]. 中国社会医学,1990,(3). [5]徐全生,刘美宏. 试卷质量分析与评估技术的研究与实现[J]. 科技信息,2009,No.28804:392. ,郑垣模. 试卷质量的模糊综合评价[J]. 数理统计与管理,1992,(2). [6]买焕章 [7]王较过,秦春华,李晓林. 试卷质量综合评价初探[J]. 陕西教育学院学报,2001,(1) [8]徐明欣,高斌,李瑞年,鞠传进. 试卷质量综合评价方法的应用研究[J]. 青岛大学学报(自然科学版),2002,(2). [9]沙红. 教育评价的产生及其发展[J]. 天津市教科院学报,2005,(5). [10]卢立涛. 测量、描述、判断与建构——四代教育评价理论述评[J]. 教育测量与评价(理论版),2009,No.1403:4-7+17. [11]潘保国. Spss在试卷分析中的应用[J]. 统计与咨询,2009,No.15005:54-55. [12]王秀红. 利用统计软件spss进行试卷质量分析[J]. 企业导报,2010,No.16101:289-290. [13]孙成霖. 对试卷质量的常规统计分析[J]. 价值工程,2010,v.29;No.19103:134. [14]吴钢. 我国教育评价学研究的回顾与展望[J]. 教育测量与评价(理论版),2010,No.3803:19-22. [15]崔国生,张楠,李卓玲. 试卷分析与评价系统的主要指标及关键问题处理[J]. 沈阳工程学院学报(社会科学版),2011,v.7;No.2703:403-405. 18 南京财经大学本科毕业论文 [16]孙涛,杜鹏东,. 统计软件SPSS在试卷再测信度计算中的应用[J]. 实验技术与管理,2008,(3). [17] 刘海生. 多元统计分析法在学生成绩综合评价中的应用[J]. 华北科技学院学报,2003,01:77-79. 18]井海立,谷成军,. Spss在数学试卷统计分析中的应用[J]. 科技信息(学术研[ 究),2006,(10). [19]王大鹏. 基于综合评价对大学生体育成绩的研究[J]. 职业时空,2008,No.7104:53-54. [20] 竺丽英,. SPSS软件在教学统计分析中的应用[J]. 化学教学,2006,(3). [21]陈珺,王鹏程,. 试题质量分析的统计方法[J]. 经济师,2005,(12). [22]李竹宁,. 试卷质量的统计分析与评价[J]. 教学与管理(理论版),2006,(36). [23] 曹黎侠,冯孝周. 考查课成绩评定的模糊综合评价模型[J]. 西南民族大学学报(自然科学版),2010,v.36;No.13903:325-329. [24]刘影,宋立新,. 多元统计分析在高等教育管理中的应用[J]. 现代教育科学,2006,(3). [25] 于丽亚,徐永利. 大学生成绩的综合评价及分析[J]. 新疆职业大学学报,2008,04:43-45. [26]唐志华,. 略论多元统计分析在高校教育管理中的应用[J]. 江苏高教,2007,(6). [27]马友友,. 统计实证在教学质量指标设计中的应用[J]. 统计与决策,2011,(24). [28]吴海英,张杰. 学生成绩排名的综合评价模型[J]. 大学数学,2006,04:142-145. [29] Jiang Yanqiao. Quality Assurance System and Teaching Quality[J].Hong Kong Council for Academic Accreditation~1998,(17). 19 南京财经大学本科毕业论文 附 录 2010年6月有效考卷分布情况 题号 人数 均值 标准差 C.V. 偏度 信度 难度 区分度 效度 852 72 74.63 10.69 0.14 0.61 0.68 0.31 0.85 0.03 860 71 79.15 13.50 0.17 0.58 0.78 0.24 0.86 0.03 862 75 78.85 11.67 0.15 0.55 0.77 0.24 0.89 0.03 863 73 72.12 12.80 0.18 0.33 0.70 0.28 0.85 0.03 874 76 76.16 11.24 0.15 0.42 0.73 0.26 0.87 0.03 875 75 66.19 14.48 0.22 0.41 0.77 0.33 0.88 0.03 879 72 78.75 12.37 0.16 0.59 0.79 0.25 0.88 0.03 881 74 73.01 10.58 0.14 0.48 0.70 0.31 0.84 0.03 887 81 80.85 12.63 0.16 0.83 0.79 0.22 0.88 0.03 892 73 73.59 9.57 0.13 0.61 0.63 0.27 0.84 0.03 2011年1月有效考卷分布情况表 题号 人数 均值 标准差 C.V. 偏度 信度 难度 区分度 效度 846 35 82.74 12.84 0.16 0.89 0.84 0.22 0.92 0.85 847 36 68.47 14.19 0.21 0.37 0.76 0.28 0.82 0.76 893 31 76.94 16.94 0.22 0.43 0.84 0.27 0.90 0.78 2011年6月有效考卷分布情况 题号 人数 均值 标准差 C.V. 偏度 信度 难度 区分度 效度 897 411 74.82 11.18 0.15 0.44 0.62 0.25 0.81 0.01 898 422 77.25 11.73 0.15 0.45 0.73 0.25 0.91 0.01 899 422 70.68 10.97 0.16 0.47 0.68 0.30 0.84 0.01 900 417 77.02 11.49 0.15 0.53 0.73 0.26 0.85 0.01 901 445 80.83 9.99 0.12 0.63 0.71 0.23 0.84 0.01 20 南京财经大学本科毕业论文 2012年1月有效考卷分布情况 题号 人数 均值 标准差 C.V. 偏度F 信度 难度 区分度 效度 846 105 78.24 14.31 0.18 0.45 0.84 0.27 0.89 0.02 893 100 80.60 12.09 0.15 0.72 0.78 0.24 0.88 0.02 913 78 70.17 13.97 0.20 0.21 0.75 0.27 0.87 0.03 914 79 73.32 12.40 0.17 0.47 0.74 0.26 0.87 0.03 915 103 69.98 10.18 0.15 0.62 0.64 0.33 0.84 0.02 917 88 75.23 9.80 0.13 0.64 0.70 0.32 0.83 0.02 919 109 71.07 10.98 0.15 0.43 0.69 0.31 0.83 0.03 920 88 74.02 10.38 0.14 0.55 0.62 0.27 0.83 0.03 921 80 76.26 11.91 0.16 0.53 0.72 0.28 0.83 0.02 922 90 75.40 12.16 0.16 0.47 0.74 0.27 0.81 0.02 2012年6月有效考卷分布情况 题号 人数 均值 标准差 C.V. 偏度F 信度 难度 区分度 效度 75.63 12.45 0.76 924 231 0.16 0.41 0.29 0.85 0.01 75.42 12.51 0.76 925 206 0.17 0.40 0.30 0.88 0.01 77.44 13.15 0.79 926 204 0.17 0.43 0.27 0.89 0.01 76.89 11.60 0.76 927 206 0.15 0.43 0.28 0.88 0.01 65.61 10.58 0.68 929 215 0.16 0.49 0.35 0.85 0.01 73.96 12.06 0.75 930 202 0.16 0.41 0.31 0.87 0.01 68.48 11.58 0.74 931 215 0.17 0.46 0.35 0.88 0.01 77.07 13.44 0.80 934 217 0.17 0.49 0.28 0.89 0.01 74.75 12.71 0.77 935 203 0.17 0.44 0.29 0.88 0.01 77.65 11.89 0.78 937 230 0.15 0.44 0.26 0.88 0.01 2010年6月有效考卷综合评价得分 题号 综合得分 852 78.89 860 76.50 862 78.14 863 80.07 874 79.43 875 82.28 879 78.42 881 80.63 887 77.09 892 76.39 21 南京财经大学本科毕业论文 2011年1月有效考卷综合评价得分 题号 综合得分 846 80.88 847 77.50 893 82.24 2011年6月有效考卷综合评价得分 题号 综合得分 897 84.98 898 81.72 899 80.49 900 75.96 901 72.82 2012年1月有效考卷综合评价得分 题号 综合得分 846 83.07 893 77.11 913 81.99 914 81.25 915 77.72 917 76.85 919 79.98 920 75.70 921 75.60 922 76.73 2012年6月有效考卷综合评价得分 题号 综合得分 924 79.98 925 82.45 926 82.24 927 81.28 929 81.25 930 83.26 931 84.33 934 82.85 935 83.83 937 81.08 22 关于试卷分析的综合评价报告 目 录 中文摘要 0 英文摘要 1 一、引言 2 二、文献综述 3 三、试卷分析的指标体系 4 (一)试卷成绩分析 4 (二)试卷质量分析 5 四、试卷分析的实证分析 7 (一)统计学考试情况介绍 7 (二)试卷分析的实证分析 8 五、试卷质量的综合评价 10 (一)建立层次结构模型 11 (二)确定权重 11 (三)制定评定标准 13 (四)计算试卷质量综合得分 13 六、试卷质量分析总结 14 参考文献 17 附 录 19基于综合评价的试卷质量分析 -以南京财经大学统计学考试为例 中文摘要 摘要:考试是教学工作的一个重要组成部分,对考试做试卷质量分析具有很 重要的实践意义。本文具体分析了南京财经大学2010年6月至2012年6月统计 学考试试卷的难度、信度、区分度及效度等,对其考试成绩做一个定量的,较为准 确的分析,以此介绍一些常用的试卷质量分析指标和手段。同时建立关于试卷质 量分析的综合评价模型,对试卷质量进行综合评价,计算各试卷综合得分,总结并 提出具体的改进建议。 关键词:试卷质量,信度,难度,区分度,综合评价 英文摘要 Analysis based on the comprehensive evaluation of the quality of papers A Case Study of Nanjing University of Finance and Economics statistics examination Abstract:The examinationis is an important part of teaching, exam papers quality analysis has a very important practical significance. In this paper, we analyzed the statistics examination of Nanjing University of Finance and Economics from June 2010 to June 2012 b, to examination their difficulty, discrimination and reliability, at the same time,to make a quantitative and more accurate analysis,in order to introduce some commonly used paper analysis tools and indicators, a quantitative test scores, the more accurate analysis. At the same time, we establish a comprehensive evaluation model, and make a comprehensive evaluation of the papers, in order to summarize and make specific recommendations for improvement. Keyword:Quality of Test Papers , reliability, difficulty, discrimination, Comprehensive Evaluation 一、引言 考试是一种有效的检验学生知识能力及教学质量优劣水平的手段,考试成绩客观的反映了学生的综合能力, 同时也是对教师教学情况的直接反馈。一份准确的考试成绩分析,可以帮助教师在接下来的教学工作中有侧重点的调整教学,正确评价教学质量,同时也有助于了解同学平常学习的真实情况。然而,由于部分试卷的质量并不能得到充分的保证,导致它在实际教学中不能充分发挥其应有的作用。因此,不断提高和完善命题水平,确保试卷质量是非常重要的。 本文具体介绍试卷分析中各指标的选择和运用,并建立对考试成绩分析的综合评价模型,力图对试卷质量做出客观的综合评价。 二、文献综述 试卷分析是教育测量学的一个重要延伸,建立科学的试卷分析指标体系需要依靠教育测量学学作为支持。 在教育测量学发展史上,杰弗瑞?格林勒Jeffrey A. Gliner与乔治?莫干Georg e A. Morgan初次较完整地给出了教育质量的评价框架,具体归纳为以下六个方面[1]:(1)同行评议总体质量;(2)考察研究中涉及的关键变量的属性及测度水平;(3)识别研究问题或假设、研究设计方法以及实验设计类型;(4)评估该项研究的测量信度、效度是否符合要求;(5)评估该项研究的信度与效度;(6)对该项 研究的总结性评价。其中研究的测量信度、效度以及研究的效度是决定研究质量最为重要的方面。 根据教育测量学理论,试卷分析分为两个部分:试卷成绩分析和试卷质量分析[2]。 试卷成绩分析指标主要有:参加考试的学生总数,最高分,最低分,平均值,标准差以及正态分布偏差,优秀、良好、中等、及格与不及格的人数分布及百分比, 成绩分布图等[3]。 试卷质量分析指标有定量指标和定性指标两类。定量指标有:试题的难度指数、区分度、信度,效度等。定性指标有: 试卷覆盖面、内容效度、失分原因分析、试题语言明确性和准确性如表达是否科学、正确,是否使用准确的名词术语,是否设计合理的选择题备选答案,是否随机排列选项,是否参用精确的参考答案,是否有试卷内容提示相关答案等、试卷印刷质量等[3]。 以上所列指标均符合张篙莲和毛磊《课程成绩考核质量评估指标刍议》中提出的建立试卷评估指标体系所要坚持的四项原则[4]:全面性,客观性,科学性,可行性。 三、试卷分析的指标体系 根据教育测量学理论,我们从试卷成绩分析和试卷质量分析两方面具体介绍试卷分析的各指标。 (一)试卷成绩分析 1. 均值、最值、标准差、频率分析 标准差反映变量值与其均值离散的程度。在考试中学生成绩的差异程度用标准差来衡量。标准差计算公式为:。其中,S为标准差,为各观测值,为平均 数,n为观测值的个数。一般认为一份优秀的试卷标准差S为9-15间。S<8,则成绩分布较集中,中等难度题目偏多;当s>16时成绩分布较分散。 标准差系数C.V.是从相对意义上衡量全班成绩离散程度的指标, 计算公式为。参考文献,C.V.值一般介于5% -35%间。当C.V.35%时,应考虑平均数是否为适当的集中量数;若C.V.5%,则应检验抽样或计算过程是否出现差错。 2.检验是否符合正态分布 根据教育测量学理论,一次可靠科学的考试,考试成绩应该接近正态分布。也就是说,只有当考试成绩接近于正态分布时, 才能达到既定的考试目标。通常,我们可以利用P-P图或K-S检验来检验考试是否符合正态分布。 考试成绩正态分布偏差率F用来衡量考试成绩接近正态分布程度。F值越小,则考试成绩越接近正态分布。偏差率的计算公式为:。 其中:ni 即n1、n2、n3、n4、n5,是属于各考试分数等级 0-49分、 50-59分、 60-79分、 80-89分、 90-100分 的学生人数;N为总人数。Ai是考试人数在5个分数等级内分布的比例,。 (二)试卷质量分析1.信度 信度又称可靠性,是指考试的可靠程度。个人在考试过程中的心理反应直接影响着考试成绩,这使得其结果必然存在误差,所以信度作为反映试题稳定性的重要指标,可以检验考试的结果是否真实客观的反应了学生的实际水平。考试成绩不易受偶然因素影响则试卷信度较高,所以一般要求试卷的信度系数尽可能大。我们通常采用克朗巴赫(Cronbach)α系数法来计算考试信度。计算公式为:。其中:N为试题数目,为第i题成绩的方差,为该考试成绩的总体方差。 α系数值一般介于0-1之间,对于试卷整体,α值越大表示信度越好。根 据教育测量学理论,若一份试卷信度系数达到0.8以上则其可信程度较高。同时,美国语言测试学家罗伯特?拉多(Robert Lado)也曾指出“如果是客观题, 信度系数应在0.9以上为佳”。所以,当T?0.5 时认为试卷信度较差;0.5T?0.8时具有良好的信度;T0.8的试卷信度非常好。 2.难度 难度指试卷难易程度,主要用于检测该份试卷对于考生来说是偏易还是偏难。一份过于容易或是过于困难的试卷都意味着出题的失败。难度的计算使用以下公式:。其中:表示第i题满分值,表示第i题平均值,表示第i题的难度。一般由试题的平均难度来表示试卷的整体难度:。其中:N表示总试题数。 试卷难度P介于0.2-0.5时表示难度适中,若P>0.8则难度过高,P?0.2则难度过低,试卷偏易。难度越小则难度系数越趋近于0,反之,难度越大则p越趋近于1。 3.区分度 区分度是对不同水平的考生做出具体区分的统计量,是评价试题质量、筛选试题的主要依据, 它能拉开学生成绩优劣的层次,能反映出各水平同学对所学知识的掌握程度,使高水平的同学获得较高的分数,低水平的同学获得较低分。若是一份低区分度的试题,学生无论能力水平,所得成绩并无较大区别,考试的衡量作用不能得到很好的体现。 在计算区分度时,一题区分度一般被认为是被测试对象在某题的具体得分与总成绩间的相关系数。参照教育测量学,区分度具体计算一般使用高低27%分组法:将学生第i题考试成绩由高到低排列,从高分一端开始向低选取全部试卷的27%,作为高分组;从低分一端开始,依次向高顺次选取27%,作为低分组。分 组后第i题区分度为:。其中:、分别为高、低分组第i题的平均分,为高分组学生人数乘以第i题满分;为低分组学生人数乘以第i题满分。 通常认为,区分度达到0.20以上即为良好。参考教育学文献,我们将区分度0.4的试题认为“优秀”;0.3 ?0.4试题的区分度为“良好”修改后会更佳;0.2 ?0.3 的试题区分度为“尚可”但需要修改;而试题?0.2 则区分度“较差”,需要淘汰。 作为评价试卷质量的重要指标,难度和区分度之间有着密不可分的关系。一套试题不论是太难或是过于简单,它的区分度都不会很高,要达到有效区分学习成果的目的,必须使试题难度适中。于此同时,难度高的试题对高水平的同学有比较好的区分度,难度低的试题对低水平的同学有较好的区分度,同样,难度中等的试题对中等水平的同学有更高的区分。一套合格的试卷其成绩应该呈正态分布,这要求教师相应的调整试题,在出题时需要选择较多中等水平的题目,同时保证较难和较简单的题型占相应的少部分比例,使难易程度保持正态分布,保证试卷整体有一个较高的区分度,体现考试的真正目的。 4.效度 效度反映了考试结果的有效程度,即考试成绩与考试目标间的接近程度,它验证考试在多大程度上满足考试目的。即考试的覆盖面是否准确体现了教学大纲的要求,考试成绩能否达到预期的考试要求。一次考试,如果没有合格的效度,那么不管在其他评价指标方面的得分有多高,都无法体现其真正的功能。 求效度需要一个有效的效标。效标效度是指测验结果与效标之间的一致性程度。一般情况下,进行试卷分析时采用平时成绩做效标。平时成绩主要有学生的出勤率、课堂作业情况、上课回答问题等方面,在评价方面具有一定的正确 性和有效性。但由于本文测量需要的有效效标难以确定,因此,通过参考相关文献,在这里采用求平均区分度代替试卷效度的方法。计算效度的公式为: 。其中为第i题的区分度。 通常认为,若效度E?0.4,则该试卷可以有效地实现考试目标;若E<><0.4,则可以较有效地实现考试目标。>0.4,则可以较有效地实现考试目标。> 效度与信度间既有联系又有区别:考试中随机误差的大小是通过信度来反映的,而考试中系统误差的大小则通过效度来反映。拥有足够的信度是获得理想效度的必要保证。信度和效度是反应试卷质量的两个不同角度,效度是一种正确性, 而信度是一种稳定性, 但是稳定性并不代表正确性, 所以信度高, 其效度并不一定高, 但是信度低, 其效度必然低。所以效度只有在高信度前提下才具有统计意义。就二者而言,效度居于首位,低效度会使考试本身失去意义。 四、试卷分析的实证分析 (一)统计学考试情况介绍 本文以南京财经大学统计学考试为例,选取2010年6月至2012年6月统计学5次考试成绩进行分析。统计学课程采用闭卷上机考试的方式对学生的学习情况进行考察,试题由计算机从题库随机抽取。试卷主要包括三个题型:单项选择题,多项选择题,综合题。其中,单选题30题,每题1分;多选题10题,每题1分;综合题6题,每题10分,总计100分。考试时间为80分钟。 (二)试卷分析的实证分析 1.数据处理 将考试数据导入excel,删除测试数据及补考成绩,零分成绩等,选取有效成绩进行分析。求得单选题,多选题,综合题各题型总分,并得到考试总成绩。 2.分析过程 将处理所得数据导入统计分析软件SPSS19.0进行统计分析,逐步求得信度,难度,区分度等指标。下文具体操作以2011年01月第847号试卷为例。 (1) 均值、最值、标准差、频率分析 通过计算,847号试卷各题型均值见表1,就成绩总体情况来看,平均分接近68分,单选题和多选题得分率高,综合题得分率低。从考试本身情况来看,单选题及多选题考查的大部分为基础知识,得分率较高;而综合题大多考查学生的综合应用能力,其得分低,显示学生对侧重知识应用的题型得分较低。 表1 847号试卷各题型均值 总分 多选 单选 综合题 均值 68.47 7.97 22.83 37.67 同样经过分析得到847号试卷其他描述性结果,见表2,由表得2011年1月考试中共有26人抽中该试卷并进行测试,该份试卷标准差s14.194,计算得标准差系数c.v.21%,成绩分布较恰当。 表2 847号考卷考试成绩统计情况 指标 均值 众数 标准差 极小值 极大值 68.47 58 14.194 22 92 (2) 正态检验 利用统计软件spss19.0对试卷进行k-s检验,其正态性结果如表3。可以看出:总分,多选、单选题及综合题均服从正态分布。同时计算得正态分布偏差率F0.37。由于F值较小,所以该试题考试成绩很接近正态分布,试卷正态性为优秀。 表3 单样本K-S检验 单样本 Kolmogorov-Smirnov 检验 total 多选 单选 综合题 N 36 36 36 36 正态参数a,b 均值 68.47 7.97 22.83 37.67 标准差 14.194 1.797 4.570 9.577 最极端差别 绝对值 .128 .201 .178 .098 正 .069 .145 .105 .083 负 -.128 -.201 -.178 -.098 Kolmogorov-Smirnov Z .766 1.204 1.066 .586 渐近显著性双侧 .600 .110 .206 .883 a. 检验分布为正态分布。 b. 根据数据计算得到。 (3) 信度 我们选用克朗巴哈系数计算一致性信度系数,结果得出见表4:α系数为 0.758,由于0.5T?0.8,故该试卷信度良好,此次考试和评分的准确度比较高,成 绩是可靠的,考试是具有实际意义的。 表4 信度统计量 可靠性统计量 Cronbach's Alpha 项数 .758 46 (4)难度 在计算难度时,我们先求得各题型均值mean,然后后利用公式:p1- Mean/S得到各题难度系数,其中S为各题型总分。计算得847试卷各题型难度见表5,由结果得选择题难度较简单,试卷整体难度适中。 表5 各题型难度系数 题型 均值 总分 难度 total 68.47 100 0.32 多选 7.97 10 0.2 单选 22.83 30 0.24 综合 37.67 60 0.37 (5)区分度 计算区分度时,参考相关文献,对客观题采用皮尔曼 Spearman 等级相关分析,而主观题用皮尔逊 Spearson 相关分析计算。经计算得各题型区分度见表6,分析得,客观题中单选题和多选题的区分度分别为0.594和0.737。主观题区分度为0.950。 表6各题型区分度 题型 多选题 单选题 综合题 区分度 0.737 0.594 0.95 试卷总体区分度计算公式为:,其中为第i题的区分度,为第i题的分值。参照公式计算得847号试题总区分度为0.82.故该试题整体区分度优秀。 (6)效度 由于此次分析无法得到学生的平时成绩,所以这里利用平均区分度代替试卷的效度,计算得该试卷效度E0.76。根据评价标准,效度相关系数应位于0.4-0.8之间,所以对该份试卷其效度理想,能够有效实现考试目标。 五、试卷质量的综合评价 我们可以对试卷分析计算出的评价指标量进行综合评价,以此全面考察试卷质量,使各试卷之间更具可比性。 参照《教育测量学》理论,结合学校考试的性质和目的, 在进行试卷质量的综合评价时,我们所选择的试卷质量分析指标有:难度、区分度、信度。它们分别表示试卷的难易程度、可靠程度、区分能力。由于效度指标无法确定有效地校标,在上文中仅采用平均区分度代替效度,故在综合评价时不将其选入评价指标。选取试卷成绩分析指标有:平均分、标准差系数、正态分布偏度。后文将利用这六个因素建立综合评价模型并对试卷质量进行最终的分析。 (一)建立层次结构模型 首先确定试卷分析评价目标树图,将各层评价目标用图有机地表示出来,建立综合评价模型,具体如下图: 其中:分别为各指标权重。 (二)确定权重 权重对于评价过程是非常重要的,它直接体现着各指标在评价体系中的作用和地位,并对综合决策结果有着关键性的影响。本文中,我们采用专家咨询法和层次分析和相结合的方法来确定权重,以此增强其客观性。具体步骤如下: 1.构造判断矩阵: 采用专家征询法完成对判断矩阵的构造。请5位老师填写对各指标相对重要性的看法,并取平均值计算得判断矩阵R。经过整理所得判断矩阵见表7。 表7 判断矩阵 难度 区分度 信度 偏度 平均分 标准差系数 难度 1 0.2 0.14 0.33 0.33 0.5 区分度 5 1 0.33 3 5 5 信度 7 3 1 5 7 7 偏度 3 0.33 0.2 1 2 3 平均分 3 0.2 0.14 0.5 1 1 标准差系数 2 0.2 0.14 0.33 1 1 2.计算判断矩阵R的特征值及特征向量 在层析分析法中,由于判断矩阵本身存在着一定程度的误差,所以不需要 高的精度,故采用较简便的近似求解法,在这里使用方根法求解。 (1)计算初始权重系数 (2)计算归一化权重系数 。其中:m为指标个数。 根据方根法算出各项目指标的权重系数见表8: 表8 试卷评价各指标权重 难度 区分度 信度 偏度 平均分 标准差系数 权重w 0.04 0.25 0.47 0.12 0.07 0.06 3.一致性检验 综合评价过程中求得的权向量,需要通过一致性检验后才能使用。一致性检验公式为:CRCI/RI。其中CR为随机一致性比率。CI为一致性指标,计算公式如下: , , 。RI为平均一致性指标,规定6阶判断矩阵的平均一致性指标RI1.24。 要使判断矩阵具有满意的一致性,则其CR<0.10。此时证明权重分配合理。否则需要调整判断矩阵直到达到合理的一致性。>0.10。此时证明权重分配合理。否则需要调整判断矩阵直到达到合理的一致性。> 由以上方法计算得:847号试卷随机一致性比率CR0.04,CR0.1。所以此次权重的分配是合理的。所以在接下来的评定中我们将使用第二步计算得到的权重进行具体分析。 (三)制定评定标准 南京财经大学统计学考试满分为100 分, 经参考相关试卷质量评价研究文献, 确定了难度P、区分度D、信度T、正态分布偏差率F、平均分A、标准差系数C.V.此6项指标的量标和相对应的分数。量化标准如表9所示。 表9各项指标的量化标准 等级赋分 平均分 A 标准差系数 C.V. 正态分布偏差率 F 难度 P 区分度 D 信度 T 指标 等级 评价 标准 优秀(90-100) 65-74 0-20 0-0.15 0.5-0.79 大于0.4 0.9-1.0 良好(76-89) 60-64或75-79 21-40 0.15-0.3 0.3-0.49 0.3-0.39 0.8-0.89 合格(60-75) 55-59或80-84 41-60 0.3-0.5 0.2-0.29 0.2-0.29 0.6-0.79 不合格(60以内) 低于55或高于85 高于60 大于0.5 大于0.8或小于0.2 小于0.2 低于0.6 (四)计算试卷质量综合得分 采用加法合成模型来计算试卷综合成绩,用线性加权函数作为综合评价 模型,进行最后的评价并求得试卷质量综合得分。我们将最终的试卷质量综合得分划分为四个等级:优秀,良好,合格,不合格。具体标准如表10所示。 表10试卷综合得分等级标准 试卷综合得分 0-59.9 60-79.9 80-89.9 90-100 试卷等级 不合格 合格 良好 优秀 根据原始数据, 经计算,得到2011年01月第846份试卷质量的各项指标得分、指标等级得分及试卷质量的综合得分, 见表11: 表11综合评价统计数据 201101-846 试卷平均分 标准差系数 正态分布 试卷难度 试卷区分度 考试信度 A C.V. 偏差率F P D T 指标 82.74 0.16 0.89 0.22 0.82 0.84 等级分值 66.53 98.00 46.80 63.33 97.00 81.78 权重 0.07 0.06 0.12 0.04 0.25 0.47 综合评价 y80.88 结合表中数据,同时利用加法合成模型得该试卷综合评价得分y81。参照试卷质量等级,846号试卷处于良好的等级水平,能满足考试测评的大部分要求。 六、试卷质量分析总结 由于统计学考试试题为题库随机抽取,为了降低研究结果的误差,在做最后统计分析时对每次考试选取测试人数最多的十份试题进行分析。因2011年1月参加考试人数较少,故选取三份进行分析。同样,2011年6月选取5份进行分析。共计38份。经过SPSS19.0对上述38份试卷逐步分析,可以得到以下几点结 论: (一)试卷成绩分析结果 从基本描述统计数据上来看,2010年6月至2012年6月五次统计学考试中,学生的卷面总成绩平均分为75分左右,大部分学生都可以顺利通过期末考核。在考试过程中,学生对考查基本概念的题得分率都比较高,如单选及多选题。然而,在对于知识的综合分析和实际运用方面,得分率普遍较低。以上分析表明学生在学习过程中并没有很好地掌握学习重点,对课堂的知识掌握还停留在片面理解,并没有进行深入的思考,对各个知识点间的衔接掌握不够,反而更多的是进行简单的机械记忆。这种情况可能是由于学生没用使用正确的学习方法不当,也可能是由于学习态度不太端正,对于学习的态度还停留在简单的应付考试层面,没有扎实的理解学习重点,也没有发自内心想要真正的掌握所学习的知识。 从试卷的标准差水平来看,各考卷的标准差分布均恰当,学生个体之间并不存在较大差异。在今后的教学过程中有侧重性的对少数后进学生进行关注,努力调动他们的学习积极性,从而达到提高总体学习成绩的目的。 (二)试卷质量分析结果 从难度上来看,所选试题中个别选择题难度系数小于0.2,这说明该题太简单,建议从题库删除此题,或者对其进行修改后参加下一轮的筛选。 从区分度及信度上来看,各试卷各题型区分度及信度都比较好,总体来说较为符合试卷组合规律和要求,考试成绩能够真实反应实际的教学情况,可以基本达到教学大纲的要求。 (三)试卷质量综合分析 对38套试卷分别求试卷质量综合得分,根据已经制定的试卷综合得分等 级标准,我们将各评价指标进行量化,使各试卷难度,信度,区分度和考试均分等按其得分处于合理的区间内,并对最终结果进行简单分析。分析得统计学考试试卷综合得分平均值为79.82分,试卷总体水平为良好。其中70-80分试卷18份,此类试卷等级评价为合格,需要在以后出题时调整难度结构,平衡出题难度,提高试卷质量。同时,80-90分试卷20份,此类试卷等级评价为良好,以后的教学工作中,可以在继续保持此水平的基础上调整个别低信度及低区分度的考题,使试卷质量达到更优。不足的是,此次检验的38份有效试卷中没有综合得分大于90分的优秀试卷,根据指标量化标准可推测,综合得分为优秀的试卷其卷面均分大致位于65-75分之间,标准差系数小于0.15,难度为0.5-0.79,区分度大于0.4,信度大于0.9以上,希望通过对各试卷的具体细致分析,在今后努力改进,合理分配试题分布,使其更加接近以上标准,最终得到综合评价成绩为优秀的试题模板。 (四)对试卷的改进建议 根据对各指标的计算和试卷综合质量的分析结果来看,提高试卷质量可以从以下几方面进行改进: 1.适当增加考试试题数量,使试题涉及更多更重要的教学知识点,扩展其覆盖面,实考试抽样更具代表性。 2.选择题由于其特殊性,有很大的几率蒙对答案,这对于低水平的同学比较有利,不能检验出真正的水平,所以可以适当的减少选择题的数量,增加一些其它考查基本知识的题型,如填空题,以此来避免由于对选项的猜测而造成的成绩分布不合理。 3.由于考试试卷的难度也应近似服从正态分布,所以在试题的分配方面需要做相应的调整,另难度适中的题目占卷面分数的适当比例,最好在60-70分 之间,以使考试成绩呈正态分布。 (五)试卷质量分析的意义 利用软件对考试成绩进行分析,一方面能有效提高办公效率,节约办公时间,另一方面,能对以后的教学工作发挥有效的指导作用。对考试成绩及时进行分析,删除信度效度不合格的试题,对考查合格的题目进行保留或改进,将其引进试题库,取优弃劣,最终逐步建立一个各方面指标均为优秀的试题库,降低考卷选题的不成功率,促进试卷的标准化,为教育工作提供有效地反馈信息,更好的知道进行下一步教育工作,进而更有效地测试出学生的真实水平。 参考文献 [1] Jeffrey A. Gliner & Georg e A. M org an. Resea rch Methods in Applied Settings: An Integ rated Approach to Design and Analysis[M]. London: Lawrence Erlbaum Associates , Publishers , 2000. [2] 陈玉琨. 教育评价学[ M]北京: 人民教育出版社,1999. [3]任艳玲,朱明放. 基于统计软件SPSS的学生试卷分析方法[J]. 重庆工 学院学报自然科学版,2007,4 [4]张嵩莲,毛磊. 课程成绩考核质量评估指标刍议[J]. 中国社会医 学,1990,3. [5]徐全生,刘美宏. 试卷质量分析与评估技术的研究与实现[J]. 科技信 息,2009,No.28804:392. [6]买焕章 ,郑垣模. 试卷质量的模糊综合评价[J]. 数理统计与管 理,1992,2. [7]王较过,秦春华,李晓林. 试卷质量综合评价初探[J]. 陕西教育学院学 报,2001,1 [8]徐明欣,高斌,李瑞年,鞠传进. 试卷质量综合评价方法的应用研究[J]. 青岛大学学报自然科学版,2002,2. [9]沙红. 教育评价的产生及其发展[J]. 天津市教科院学报,2005,5. [10]卢立涛. 测量、描述、判断与建构??四代教育评价理论述评[J]. 教育测量与评价理论版,2009,No.1403:4-7+17. [11]潘保国. Spss在试卷分析中的应用[J]. 统计与咨询,2009,No.15005:54-55. [12]王秀红. 利用统计软件spss进行试卷质量分析[J]. 企业导报,2010,No.16101:289-290. [13]孙成霖. 对试卷质量的常规统计分析[J]. 价值工程,2010,v.29;No.19103:134. [14]吴钢. 我国教育评价学研究的回顾与展望[J]. 教育测量与评价理论版,2010,No.3803:19-22. [15]崔国生,张楠,李卓玲. 试卷分析与评价系统的主要指标及关键问题处理[J]. 沈阳工程学院学报社会科学版,2011,v.7;No.2703:403-405. [16]孙涛,杜鹏东,. 统计软件SPSS在试卷再测信度计算中的应用[J]. 实验技术与管理,2008,3. [17] 刘海生. 多元统计分析法在学生成绩综合评价中的应用[J]. 华北科技学院学报,2003,01:77-79. [18]井海立,谷成军,. Spss在数学试卷统计分析中的应用[J]. 科技信息学术研究,2006,10. [19]王大鹏. 基于综合评价对大学生体育成绩的研究[J]. 职业时 空,2008,No.7104:53-54. [20] 竺丽英,. SPSS软件在教学统计分析中的应用[J]. 化学教学,2006,3. [21]陈?,王鹏程,. 试题质量分析的统计方法[J]. 经济师,2005,12. [22]李竹宁,. 试卷质量的统计分析与评价[J]. 教学与管理理论版,2006,36. [23] 曹黎侠,冯孝周. 考查课成绩评定的模糊综合评价模型[J]. 西南民族大学学报自然科学版,2010,v.36;No.13903:325-329. [24]刘影,宋立新,. 多元统计分析在高等教育管理中的应用[J]. 现代教育科学,2006,3. [25] 于丽亚,徐永利. 大学生成绩的综合评价及分析[J]. 新疆职业大学学报,2008,04:43-45. [26]唐志华,. 略论多元统计分析在高校教育管理中的应用[J]. 江苏高教,2007,6. [27]马友友,. 统计实证在教学质量指标设计中的应用[J]. 统计与决策,2011,24. [28]吴海英,张杰. 学生成绩排名的综合评价模型[J]. 大学数学,2006,04:142-145. [29] Jiang Yanqiao. Quality Assurance System and Teaching Quality[J].Hong Kong Council for Academic Accreditation,1998,17. 附 录 2010年6月有效考卷分布情况 题号 人数 均值 标准差 C.V. 偏度 信度 难度 区分度 效 度 852 72 74.63 10.69 0.14 0.61 0.68 0.31 0.85 0.03 860 71 79.15 13.50 0.17 0.58 0.78 0.24 0.86 0.03 862 75 78.85 11.67 0.15 0.55 0.77 0.24 0.89 0.03 863 73 72.12 12.80 0.18 0.33 0.70 0.28 0.85 0.03 874 76 76.16 11.24 0.15 0.42 0.73 0.26 0.87 0.03 875 75 66.19 14.48 0.22 0.41 0.77 0.33 0.88 0.03 879 72 78.75 12.37 0.16 0.59 0.79 0.25 0.88 0.03 881 74 73.01 10.58 0.14 0.48 0.70 0.31 0.84 0.03 887 81 80.85 12.63 0.16 0.83 0.79 0.22 0.88 0.03 892 73 73.59 9.57 0.13 0.61 0.63 0.27 0.84 0.03 2011年1月有效考卷分布情况表 题号 人数 均值 标准差 C.V. 偏度 信度 难度 区分度 效 度 846 35 82.74 12.84 0.16 0.89 0.84 0.22 0.92 0.85 847 36 68.47 14.19 0.21 0.37 0.76 0.28 0.82 0.76 893 31 76.94 16.94 0.22 0.43 0.84 0.27 0.90 0.78 2011年6月有效考卷分布情况 题号 人数 均值 标准差 C.V. 偏度 信度 难度 区分度 效 度 897 411 74.82 11.18 0.15 0.44 0.62 0.25 0.81 0.01 898 422 77.25 11.73 0.15 0.45 0.73 0.25 0.91 0.01 899 422 70.68 10.97 0.16 0.47 0.68 0.30 0.84 0.01 900 417 77.02 11.49 0.15 0.53 0.73 0.26 0.85 0.01 901 445 80.83 9.99 0.12 0.63 0.71 0.23 0.84 0.01 2012年1月有效考卷分布情况 题号 人数 均值 标准差 C.V. 偏度F 信度 难度 区分度 效 度 846 105 78.24 14.31 0.18 0.45 0.84 0.27 0.89 0.02 893 100 80.60 12.09 0.15 0.72 0.78 0.24 0.88 0.02 913 78 70.17 13.97 0.20 0.21 0.75 0.27 0.87 0.03 914 79 73.32 12.40 0.17 0.47 0.74 0.26 0.87 0.03 915 103 69.98 10.18 0.15 0.62 0.64 0.33 0.84 0.02 917 88 75.23 9.80 0.13 0.64 0.70 0.32 0.83 0.02 919 109 71.07 10.98 0.15 0.43 0.69 0.31 0.83 0.03 920 88 74.02 10.38 0.14 0.55 0.62 0.27 0.83 0.03 921 80 76.26 11.91 0.16 0.53 0.72 0.28 0.83 0.02 922 90 75.40 12.16 0.16 0.47 0.74 0.27 0.81 0.02 2012年6月有效考卷分布情况 题号 人数 均值 标准差 C.V. 偏度F 信度 难度 区分度 效 度 924 231 75.63 12.45 0.16 0.41 0.76 0.29 0.85 0.01 925 206 75.42 12.51 0.17 0.40 0.76 0.30 0.88 0.01 926 204 77.44 13.15 0.17 0.43 0.79 0.27 0.89 0.01 927 206 76.89 11.60 0.15 0.43 0.76 0.28 0.88 0.01 929 215 65.61 10.58 0.16 0.49 0.68 0.35 0.85 0.01 930 202 73.96 12.06 0.16 0.41 0.75 0.31 0.87 0.01 931 215 68.48 11.58 0.17 0.46 0.74 0.35 0.88 0.01 934 217 77.07 13.44 0.17 0.49 0.80 0.28 0.89 0.01 935 203 74.75 12.71 0.17 0.44 0.77 0.29 0.88 0.01 937 230 77.65 11.89 0.15 0.44 0.78 0.26 0.88 0.01 2010年6月有效考卷综合评价得分 题号 综合得分 852 78.89 860 76.50 862 78.14 863 80.07 874 79.43 875 82.28 879 78.42 881 80.63 887 77.09 892 76.39 2011年1月有效考卷综合评价得分 题号 综合得分 846 80.88 847 77.50 893 82.24 2011年6月有效考卷综合评价得分 题号 综合得分 897 84.98 898 81.72 899 80.49 900 75.96 901 72.82 2012年1月有效考卷综合评价得分 题号 综合得分 846 83.07 893 77.11 913 81.99 914 81.25 915 77.72 917 76.85 919 79.98 920 75.70 921 75.60 922 76.73 2012年6月有效考卷综合评价得分 题号 综合得分 924 79.98 925 82.45 926 82.24 927 81.28 929 81.25 930 83.26 931 84.33 934 82.85 935 83.83 937 81.08 转载请注明出处范文大全网 » 对XX同志的综合评价范文五:关于试卷分析的综合评价报告