前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇试卷质量分析范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
[关键词)试卷分析;教学评估;程序
试卷分析是教学质量监控体系的重要组成部分,其目的是为了进一步提高课程考试的科学性和严密性,不但可为教学效果反馈信息,还可以为改善题库、改进教学提供参考。
上海中医药大学的试卷分析针对的是专业基础课和专业课课程。校方采用标准答题卡,通过光标阅读机将答题信息读取到计算机,用FOXPRO程序编写试卷分析程序。输出的试卷分析报表包括3部分:考试成绩、试题质量分析和试卷质量分析。本文就试卷分析系统的设计特点及实现功能作一介绍。
1设计特点
1.1运行环境
该校试卷分析系统采用的是光标阅读机与计算机相结合的工作方式。校方使用的光标阅读机(OpticalMarkRead―er,OMR)是一个通用阅读系统,它可以完成信息卡格式编辑、选纸、通用阅读、评分、结果文件浏览及标准答案打印等功能。OMR通过阅读答题卡上的涂点信息,转化为计算机可识别的文本方式和FOXPRO数据库文件方式,便可达到将信息录入计算机的目的。
计算机采用Windows98以上操作系统即可,安装FOX―PR06.0软件,在此环境下编写试卷分析程序,接收来自OMR的数据,完成各项分析功能,教学研究并输出分析报表。
1.2试卷编制要求
所使用的标准答题卡是根据该校实际情况设计的,包括客观题和主观题。试卷分析系统对试卷编制的要求是:客观题数≤75题,可以是单选题、多选题;是非题;主观题数≤30题。对试题分数的限制:主观题每小题的满分不得大于9.9分。学生答题卡客观题部分考试时由学生填涂,主观题得分由教师阅卷后统一填涂,标准答案卡由教师填涂,教师还要填写一份考试信息卡,其中信息用于系统中试卷数据库的建立。
2实现功能
此试卷分析系统目前实现的功能包括考试成绩的输出、试题质量分析和试卷质量分析。
2.1考试成绩输出
考试成绩报表输出字段包括:学生学号、客观题分数、主观题分数和总分。
2.2试题质量分析
校方采用的分析指标有每道试题的难度、区分度以及客观题的备选答案选答比例。
2.2.1试题难度分析系统给出每道题目的难度指数。难度是指试题的难易程度,是评价试题质量的一个量化指标,过难,或过易都不能真实、准确地反映出考生的实际水平。因此,难度指数可以用来筛选题目。[1]难度指数越大,试题的难度越大;难度指数越小,试题的难度越小。一般认为,难度指数在0.65以上的为较难,在0.35~0.65之间为难度适中,在0.35以下则试题比较容易。为更好地检验学生对知识的掌握,通常应以难度适中的试题占多数为好。
2.2.2试题区分度 区分度是指试题对考生实际水平的区分程度和鉴别能力。区分度是反映试题效用高低的参数,好的试题应能反映各档次学生的知识掌握水平,即拉开学生的得分档次。如果有的试题全体学生都不会,或者都会,就说明该试题区分度低。区分度是评价试题质量,筛选试题的主要指标与依据。
美国测验专家RobertEbel根据长期实验研究提出区分度的标准:区分度指数在0.40以上的说明试题区分度很好,区分度指数在0.3~0.4之间的说明试题良好但改进更佳,区分度指数在0.20~0.29之间说明试题尚可但仍需修改,在0.20以下则表明试题区分度较差应淘汰或修改。
一道试题的质量由该试题的难度和区分度共同构成,当试题的难度系数在适中的范围内,而且有相对较高的区分能力时,这道题就被看成是质量好的试题。
2.2.3客观题备选答案选答比例 分析系统给出每道客观题各个备选项的选答人数百分比。它提示我们题目可能在以下几方面存在问题:①如果所有考生都选择的是正确答案,则说明该题目太容易或者题目中可能提供了某种暗示。②如果某个错误答案没有一个考生选择,说明该备选答案不具有迷惑性,错得过于明显。一般说来,除非有2%以上的人选择,否则这个备选答案则应该修改。③如果大部分或全部考生都选择了同一个错误答案,可能是编制测验时把答案定错了,也可能是在教学中发生了错误。④如果高分组考生的选择集中在两个答案上,二者选择比例很相近,提示该题可能存在两个正确答案或另一答案也有道理。⑤如果某题目考生未答人数过多或选择各个备选答案人数相等,则说明题目过难或题意不清,使得考生无法作答或是仅凭猜测作答。
2.3试卷质量分析
校方选用了集中量分析、差异量分析、试卷信度、成绩频数分布、试卷难度分布情况和试卷区分度分布情况作为评定指标。
2.3.1集中量分析给出试卷满分和平均分。平均分反映学生成绩的总体水平,理想状况在70分~80分之间。
2.3.2差异量分析给出最高分、最低分和标准差。标准差反映学生成绩的离散程度,用以检验考试区分学生掌握学业内容程度的能力。标准差越大表明成绩的离散度越大,通常标准差在9分~13分之间较为理想。
2.3.3试卷信度信度是衡量一个试卷质量高低的重要指标之一。信度高的试卷表明考试能较真实地反映出学生的学业水平。信度不合要求的试卷是不能使用的。校方采用克朗巴赫a信度系数。
通常影响信度的因素包括:①样本情况。样本的异质程度与分数的分布有关,样本越是异质,其分数分布的范围也就越大,信度系数也越高。②题目数量。一般来说,测验越长,试题越多,信度值越高。这是因为测验加长后,试题取样的代表性增加,每个题目的随机误差也较小。③难度。测验的难度与信度没有直接对应关系,但当测验太难或太易时则分数的范围就会缩小,从而降低信度。
2.3.4成绩频数分布分析系统以10分为组距、成绩为横坐标、人数为纵坐标给出成绩频数分布图。它的作用是,当成绩分布曲线呈正偏态时,说明低分学生多,可能题目偏难;成绩分布曲线呈负偏态时,说明高分的学生较多,可能题目偏容易;而理想状态为成绩呈正态分布,此时说明成绩很好和很差的学生较少,接均分的学生较多。
2.3.5试卷难度分布难度对考试的影响主要表现在:①影响考试成绩的分布形态,正常人群智力的高低分布服从正态分布,所以在适宜难度的考试中,学生的成绩分布应基本服从正态分布,难度过大或过小都会使成绩分布偏离正态。②影响考试成绩的离散度,过难或过易的考试会使成绩相对集中在高分端或低分端。③影响考试区分度。一套高质量的试卷应该合理分配题目的难度,整个试卷的平均难度基本控制在0.35~0.65之间,试题难、中、易的比例大致为20%、60%、20%。
2.3.6试卷区分度分布分析系统汇总整个试卷上所有题目的区分度,以区分度值从0~1.0为横坐标,以不同区分度值的试题数为纵坐标,给出整个试卷上区分度分布情况。通过区分度分布分析,可以提示试卷是否需要进一步改进。
一、引言
考核是检验教学质量最重要的手段之一,试卷的质量和学生考试成绩是衡量教学质量的主要方法。通过对试卷分析,可以反馈学生学习情况,评估教学效果,为进一步推进教学改革、提高教学质量提供参考。[1]
虽然目前许多高校在教学评价方面都呼吁评价形式的多样化,但试卷测试仍然是最主要的方法,因此试卷质量分析成为高校教师教学过程中的一个必备环节。目前多数学科如数学和医学专业已经重视试卷成绩和试题质量分析,[2-7]]对世界自然地理的课程与教学改革方面进行研究较少,[8-10]贺丹君等从评价体系上对地理课程进行定性分析和评价,未对试卷质量进行定量分析。[11]然而,《世界自然地理》是高等院校地理专业的必修课程之一,它最能体现地理学的综合性、区域性和人地相关性,具有其它地理学分支学科不可比拟的优势,所以对《世界自然地理》试卷成绩进行定量分析,评价试卷的优劣是很有必要的。本文对2007级地理科学专业57名学生的世界自然地理期末考试成绩进行分析,评判试卷对学生学习情况的反映能力,旨在为今后的考试命题和教学改革提供参考依据。
二、数据来源与研究方法
1. 数据来源
2007级地理科学本文由收集整理专业的本科生共57名学生的世界自然地理期末考试试卷。试卷由任课教师命题,试卷评判严格按照评分标准和标准答案进行,由任课教师评分。试卷卷面分值满分为100分,包括4种题型,26道小题:第一题单项选择题包含15道小题,占总题目数的57.69%,共15分;第二题简答题包含5道小题,占总题目数的19.23%,共40分;第三题填图题包含4道小题,40个空,占总题目数的15.38%,共20分;第四题论述题包含2道小题,占总题目数的7.69%,共25分。
2. 方法
试卷分析主要是指通过收集一定量的原始数据,按照设定的评价指标,运用测量学和统计学的理论,通过计算各种统计量数和绘制统计图表,对试卷进行定量分析和评价。[12]可以针对某一门课程,比较学生各成绩段的比例,分析学生成绩的分布是否合理,与试卷内容是否相关等。评价指标可以从教学大纲、命题、试题数量比例等方面来设定。
试卷质量的统计分析是运用数理统计描述和统计推断的方法,对试卷的数量特征和数量关系进行分析和判断。[12]根据《教育测量学》的介绍,[13]本文主要选取难度、区分度两个指标对试卷质量进行统计分析。
(1)难度。试题的难度是衡量试题难易程度的指标。[13]
在编制试题时,难度分布从易到难,逐步增加难度,这样有利于考生水平的正常发挥。试题的难度即考生对该题的通过率或得分率,对于答对得1分、答错或不答得0分的试题,难度(p)就是答对(或通过)试题的人数与考生总数之比:
(1)
式中,r为答对该题的人数,n为考生总数。
对于满分量大于1分的试题,难度则是考生对该题的平均得分与该题的满分之比:
(2)
式中, 为考生对该题的平均得分, 为该题的满分。p值越大,试题越容易。因为百分制以60分为及格,通常情况下,把平均难度控制在0.45~0.75之间比较合适。[13]试题难度的评价标准见表1。
表1 试题难度的评价标准
(2)区分度。题目区分度是指检验题目对其学业水平不同的考生的区分程度或鉴别能力,它是学生掌握知识水平和能力差异的指标。[14]通过考试,学习好的学生得到高分,学习差的学生得到低分,则说明试题的区分度高;如果学生中好、中、差三个层次的考试成绩处于同一个分数段中,就反映不出学生学习水平,那么这样的试题区分度就低。所以一般采用比较方便的两端分组法来计算试题的区分度。所谓两端分组法,即当测试成绩成正态分布时,将考试总分进行排序,然后选出得分最高的27%列为高分组,将得分最低的27%列为低分组。区分度计算公式如下:
,其中i=1,2,3,……n (3)
式中, 和 分别表示全体考生中的高分组和低分组中第i题的平均分; 表示第i 题的满分值。d≥0.40为优秀;0.30≤d<0.40为良好;0.20≤d<0.30为尚可,需改进;d<0.20为劣,需淘汰或修改。[15]试题区分度的评价标准具体见表2。
表2 试题区分度的评价标准
3. 结果分析
从2007级地理科学专业世界自然地理期末考试的成绩分布来看,试卷满分为100分,客观题总分为35,主观题总分为65,学生考试的平均成绩为68.35,最高分为91,最低分40.5,标准差10.10,及格率为80.7%,不及格率为19.3%。
一是课程成绩分布情况分析。
(1)试卷总成绩分布:2007级地理科学班的57名学生,有39名学生成绩分布在60~79分内,占68.42%;有6名学生成绩分布在80~89分内,占10.53%;有10名学生成绩分布在50~59分内,占17.54%;仅1名学生成绩高于90分和低于40分,各占1.75%,见表3。通过绘制成绩分布直方图可以看出,该班期末成绩总体呈正态分布,见图1。教育统计学统计规律表明:学生的智力水平,包括学习能力,实际动手能力等呈正态分布。考试成绩分布应基本服从正态分布,这样才能真实反映学生的实际,也能够说明试卷设计是合理和具有科学依据和实际意义的。[15]本试卷总成绩呈正态分布,说明试卷总体设计合理、可靠、科学。
转贴于
表3 《世界自然地理》期末考试总成绩分布情况
图1 《世界自然地理》期末考试成绩分布图
(2)试卷各大题成绩分布。该试卷共四个大题,因为各题总分不一样,所以把各大题以100分为基准,对分数段进行折合计算,具体各分数段的人数和比例见表4。通过对各大题绘制直方图可以看出,单选题、填图题成绩分布呈偏正态分布,简答题成绩呈偏态分布,但是没有单选题和填图题严重,大体还呈正态分布,这看出就大题而言,单选和填图题设计过于简单,不能很好反应学生的学习能力,但是单选和填图属于识记类知识类型,本来就不好区分学生层次,所以总体看来还是符合实际的;简答和论述题成绩大致呈正态分布,能较好地体现学生学习效果的差异和智力水平,设计很好,见图2。
二是难度、区分度分析。从总成绩看,试卷难度为0.680,试卷区分度为0.402,表明整卷难度适中,区分度好,总体来说试卷质量优良。在各大题中,难度都适中,区分度除了单项选择题为0.29,试题尚可,须进一步改进外,其它三道大题都为优良。结合2007级地理专业的学生为理科生的专业背景,地理基础知识相对薄弱的实际情况,可以看出该试卷的论述题等反映综合能力的试题偏难,但区分度较好,适合考核学生的实际学习水平,有利于提高学生考试的有效性程度,见表5。
三、结论及建议
通过结果分析可以看出,该试卷整体的命题结构好,学生总成绩和大部分大题成绩呈正态分布,试题难度适中,除了选择题之外,其他题型区分度很好。建议以后命题要严格按照教学文件规定的要求,不断完善命题工作,特别是选择题的要加强命题的难度和区分度,同时应该从新课改的理念出发,不断改进命题工作,让考试在教学过程中发挥其应有的积极作用。
1. 试卷构成
整卷共四道大题,26道小题,客观题和主观题的比例为7:13;客观题主要考核学生对世界自然地理的基本概念及基本知识的掌握与理解的程度,而主观题则是考核学生归纳总结、分析、理解和应用知识的能力。本试卷考试内容覆盖面较广,基本涵盖教学大纲要求的大部分教学知识点,符合教学大纲的要求。该试卷试题综合了教学大纲的多个知识点,适当增加了一定的难度和深度。试卷结构记忆类占20%,理解类占40%,简单类占15%,综合应用类占25%;试卷各类题型所占的比例均符合教学要求,难度适中则反映出本课程的基本知识点、重点和难点。
2. 考试成绩分布
由于2007地科班属于理科生,没有高中地理知识的基础,所以本次试卷的命题不但注重学生综合分析能力的提升,同时也关注学生的地理基础知识,因此试题大约有70%是考察学生综合思维能力和分析能力的,涉及知识范围较广,其目的是提高学生对所学课堂内容进行总结提炼及实际应用,也设计有30%左右的基本知识题,如选择和填图题。从总成绩来看,该卷的成绩分布是呈正态分布,反映出绝大多数学生对考查综合能力的试题还是比较适应的,其分值大部分集中在60~80分,见图1;从各大题成绩来看,简答和论述题成绩基本呈正态分布,试卷能很好区分学生层次和体现他们各自的能力水平,能很好达到测验目的,但是单选、填图题的成绩分布呈偏正态,虽然这两大题属于识记型,但是作为试卷设计,还是应该从科学性测验出发,更好体现学生水平为原则,所以在以后的命题中,会更加注重这两部分题目的科学性和实践性。综合以上分析表明,本次考试基本反映出学生对世界自然地理知识学习的实际水平,同时也说明命题者对试题难度等因素掌握得较好。
3. 试题的难度与区分度
难度和区分度都是判断试题质量的重要指标,用于衡量考生能力的程度。通过一次考试将不同程度和不同能力的学生区别开来。难度系数(p)是反映试题难易程度的重要参数,难度系数越小,说明试题难度越大。一般认为试题的难度系数应控制在0.45~0.75之间比较合适。[10]本次试卷的平均难度系数为0.68,四个大题的难度分别为(单选题0.72,简答题0.70,填图题0.71,论述题0.62),不管是从整个试卷来看还是从各大题来看,本套考卷所有类型试题的难度系数在0.62~0.72之间,根据表1(试题难度的评价标准)来看,试题难易程度适中,比较合理,能区分学生能力。
区分度(d)是衡量试题质量的另一重要因素,是评价试题质量、筛选试题的主要指标,d值越大,区分效果越好。一般认为,d≥0.4,区分度极好;0.3≤d≤0.39,区分度良好;d≤0.19,区分度极差;所以试题区分度≥0.20即为可用试题,而区分度≤0.19的试题应该被淘汰。世界自然地理是地理学的一门基础主干课程,有其特殊性,概念多,需要记忆的知识多,尤其记忆各大洲的山脉、河流、湖泊容易记错,各周的地理位置不易描述,而且该级的学生是理科生出生,地理基础知识掌握有待提高,诸多因素使命题者难以把握试卷的难易程度及区分度。在本试卷中,整卷区分度为0.402,各大题中,除了单选题的区分度<0.30(为0.29)外,简答题、填图题和论述题的区分度均>0.40(分别为0.53、0.48和0.52),而且简答题、论述题的区分度非常好(d>0.5)。通过试卷分析表明,本套试题的区分度、易难度良好,其分析结果为命题者今后的命题工作提供了参考依据。但今后对单选题和绘图题的区分度还需要进一步加以改进,判断题应淘汰或注意完善该题型的区分度。
4. 今后命题工作的导向
关键词: 经典测量理论 信度 难度 区分度
一、引言
教育测量与评价是教育研究领域中重要的组成部分,是学科教学活动中科学管理的有效手段。《国家中长期教育改革和发展规划纲要(2010-2020年)》明确把提高教育质量作为教育改革发展的核心任务,并多次强调与教育质量的监测和评价相关的内容[1]。显然,在当前教育制度下,各种笔试仍是一种重要而有效的教育质量定量评价方式。试卷质量自然影响对教育质量的正确评价,因此,针对笔试试卷的质量分析显得尤为重要。
试卷质量的分析一般是利用经典教育测量理论(CTT: Classical Test Theory)和项目反应理论(IRT:Item Response Theory)进行分析。
经典测量理论又称为真分数理论,假定观察分数X与真分数T线性相关,即CTT的数学模型为X=T+E,其中,随机误差E服从均值为零的正态分布。该理论最重要的四个指标正是反应试卷是否真实可靠、准确有效、难易适中、鉴别力强的信度、效度、难度和区分度等测验质量指标[2]。当然,由于其比较依赖样本、信度估计精度不高、难度和被试水平没有定义在同一参照系上,同时,无法回答总分相同的考生的真实能力有无差异等问题,该理论也存在一定的局限性[3]。
项目反应理论是一种新兴的心理与教育测量理论。该理论的前提假设非常严格,主要包括单维性假设和局部独立性假设[4]。主要方法是在利用参数模型的基础上,利用项目特征曲线、试题信息函数进行探讨,同时利用EM算法,用边际极大似然估计方法寻找项目参数的一致估计[5]。
本文主要利用南宁市某中学2013年秋季学期数学期末考试成绩,在经典测量理论(CTT)范畴下探讨该次期末考试数学试卷的信度、效度、难度、区分度和成绩分布情况。通过试卷“四度一分布”了解试卷质量,并反馈教学效果情况。
二、基于CTT的试卷质量情况分析
1.成绩分布情况
一般而言,一份好的试卷考试的成绩都服从或近似服从正态分布,因此,考试成绩的正态性是考察试卷质量的一个首要指标。检验正态性的方法很多,常见的是利用直方图和卡方检验、K-S检验。从参加本次考试的872人中随机抽取387人的成绩进行检验,结果如图1所示:
图1 学生成绩的直方图
正态分布的K-S统计量显著性概率P值为0.095>0.05,因此,这次考试学生成绩服从正态分布。
2.信度
中学试卷中,选择题分数可简化为0,1得分情况来解释,解答题和填空题可以看成非0,1记分的项目。因此,选择题信度主要采用折半信度[斯皮尔曼-布朗(Spearman-Brown)公式、卢隆(Rulon)公式、弗拉纳根(Flanagan)公式]和库德-理查逊(Kuder-Richardson)信度(K-R20、K-R21公式)进行分析[7]。填空题和解答题为非0、1记分的项目,采用克龙巴赫系数进行统计,结果如表1所示。
表1 试卷信度分析结果
结果表明,每种方法计算的选择题信度都接近0.7,信度系数处于尚可使用范围之内。研究表明,对于标准化的大型测试题目信度要求一般要在0.9以上,而学校期末考试的信度在0.6以上即可接受[1]。选择题、解答题的克龙巴赫系数为0.905,可以认为填空题和解答题的信度非常好,综合考虑,试卷整体信度是可信的。
3.效度
效度(validity)是指测验结果的有效性或准确性,即通过测验能够正确测量出它所要测量的属性的程度[5]。测量的效度的种类很多,其中基于专家和教师对试题与所涉及的范围进行符合性判断的逻辑判断法的内容效度使用较多。内容效度是指测验内容对所要测验的全部内容的代表性程度。但一次考试很难包含学生所学课程的所有内容,因此只能选择具有代表性的试题进行考核,来了解学生的知识技能掌握情况[8]。
根据测量的目标与内容的双向细分表,经过该校7位一线数学教师(其中高级教师4位,中教一级2位,中教二级1位)不记名反馈信息来看,本次考试所设计的试题覆盖了所要测内容的主要方面,考查目标清晰明确,题型和分数结构合理恰当,总体符合考试大纲和教学要求。
4.难度
试题难度是反映考题难易程度的指标,一般而言是按照答对人数的百分比确定的,是衡量试卷质量的最主要的数量性指标,简单来说可以利用测验分数的分布情况和特征进行观测,例如考察测验分数的全距、零分、满分、众数、平均分数等相关指标进行定性的判断,也可以根据不同的情况,利用有关公示进行精确计算。
一般而言,难度的取值范围在[0,1]之间,取值越大,难度越小。难度在0.7以上的为比较容易的题,在0.4-0.7为中等难度的题,在0.4以下的则为较难的题或是难题。在实际教学中试卷难度水平的选择,应取决于测验的目的和试题的形式。如果测验是用于区分学生水平,那么应该将试题或试卷的难度系数控制在0.5左右,各试题难度值在0.2-0.8,同时各题平均难度值在0.5左右是比较适宜的[5]。
对于采用0,1记分的选择题,用通过率P、平衡猜测的校正公式CP和极端分组法计算各个试题的难度。
表2 选择题的难度
对于非0,1记分的填空题、解答题和总分,用难度系数和极端分组法计算各个项目的难度。
表3 填空题、解答题的难度
结果显示,就选择题而言,三种计算方法的计算的难度差异不大,整体趋势较一致,从三种公式的难度均值看,第1、2、5、6、7、8、9属于难度较小的题目,3、4、10、11、12属于难度中等偏上的题目,其中第4题难度最大,10,11,12三题难度也较大,选择题总体难度为0.767,属于比较容易,从试题编排上看,除个别题目外,整体趋势是容易的题型放在前面,中等难度试题放在题型中间,较难试题放在题型后面,较合理。
对填空题和解答题而言,题目难度显然大于选择题,填空题总体难度均值为0.499,难度中等,解答题总体难度均值为0,472,属于中等偏难程度,8道解答题的难易程度也和题目顺序基本一致,越难的题目越在后面,符合数学试卷的一般规律。
从考试成绩来看,难度系数为0.548,综合选择题、填空题、解答题三种类型的难度均值,整张试卷难度均值为0.579,和总分难度系数接近,因此,可以判定该份试卷总体难度适中。
5.区分度
区分度是反映试题效用的一个主要参数,同时也是试题对考生实际水平的鉴别能力,将不同层次的考生区分开来的统计量。若试题的测试结果是水平高的学生答对或者得高分,水平低的学生答错或者得低分,则认为试题的区分能力强。一般而言,区分度在0.4以上为最佳效果,在0.3~0.39为合格,修改会更好,在0.2~0.29为勉强,仍需耍修改,区分度在0.19以下为差,必须淘汰[6]。
对于0,1记分的选择题,利用极端分组法、点二列相关计算各个试题的区分度。
表4 选择题的区分度
对于连续记分的主观性试题填空题、解答题和总分,用极端分组法和相关法计算各个项目的区分度。
表5 填空题、解答题以及试卷的区分度
注:试卷区分度是将各题区分度进行加权平均计算的。
结果显示,对于选择题而言,总体看来,整个选择题中大部分题目的区分度都在0.4以上。通过极端分组法和点二列相关系数计算的区分度在大部分题目中相差不大。极个别题目有明显差异,主要在于两种方法考虑的视角不一致,就第1题而言,极端分组法的区分度指标0.093,是利用高分组和低分组之间差异进行计算的,两者差异很小,说明该题无论是高分组还是低分组都能完成,就区分能力而言属于应该淘汰的题目,但正是由于该题目在高低分组中完成率都较高,和总分的相关性自然就大,因此,点二列相关法计算出来该题的区分度较高。两种方法计算的试卷区分度均在0.6以上,说明该试卷区分能力强,区分效果佳。
三、有关结论
事实上,该次试卷为全市统一考试题目,从一定程度上说属于“较大的标准化”考试题目。从上述分析可知,本次考试成绩的分布直方图并未凸显畸形特征,基本上呈正态分布,单峰,稍微右偏。就四度而言,填空题、解答题的信度很好,但选择题的信度适中。常见的提高测验信度主要有以下方式:一是适当增加试题量;二是提高质量,试题难度要适中,区分度大;三是调整试题编排顺序,尽量做到先易后难。
测验的效度采用学科专家通过逻辑分析法进行分析的,根据测量的目标与内容的双向细分表,了解到试题覆盖了所要测内容的主要方面,考目标清晰明确,题型和分数结构合理恰当,总体符合考试大纲和教学要求。
试题的难度较合理,大部分选择题难度偏低,其中第4、10两题难度最大。而最后一道解答题的难度系数则过大。这和数学试卷利用最后一题作为压轴题有密切关系。
试题的区分度方面反应较好,但选择题第1、2题和解答题最后一道题在两种计算方法中差异很大。可能的原因在于第1、2题属于难度很低的送分题,因此区分度也不高,最后一道压轴题属于难度最大,很多学生放弃作答,因此存在这方面的问题。
四、结语
考试是衡量教学效果的必要手段。随着统计学及经济计量学边缘的不断扩张,对于教学结果的评价越来越依赖于科学的理论和方法。教育评价技术方法中教育测量理论就是应用教育统计学方法实现的,成为测评学生能力、考核教育效果的重要措施。利用SPSS测度考试的难易度、区分度、信度、效度等指标,不仅可以直观、便捷分析考试结果,发现考试中的重要信息和规律,还可以为教学效果评估提供重要的考核指标和模式。目前在教育教学及科研领域,人们采用科学的测评方法测度试卷科学性的尝试并不多,尤其是一些规模较小的考试,这不利于教学质量和教师素质的提高,亦不利于考试学研究者开启新的研究视域。应该加强对试卷科学化测度的研究及实践,使考试这一重要的教学环节日益走上科学化和规范化的轨道。
通过试卷质量分析,不仅可以了解试卷情况,更可以利用试卷科学性测评的方式了解教师的教学效果,同时也可以通过建立试题库、制定命题双向细目表等方式,提高试卷质量。
参考文献:
[1]《国家中长期教育改革和发展规划纲要》关注教育质量监测[N].基础教育质量监测信息简报,教育部基础教育质量监测中心,2010,1.
[2]郭熙汉,何穗,赵东方.教学评价与测量[M].武汉:武汉大学出版社,2008.
[3]杜洪飞.经典测量理论与项目反应理论的比较研究[J].社会心理科学,2006(6):15-17.
[4]Christine DeMars.Item Response Theory[M].London:Oxford University Press,2010.
[5]何穗,吴慧萍.基于教育测量理论的中学数学试卷质量评价研究[J].考试与招生,2012(08):49-53.
[6]Robert L.Ebel.Measuring Educational Achievement [M].Englewood Cliffs,N.J., Prentice-Hall,1965.
【关键词】教师 学生 试卷 分析
纵观近年来语文试卷,严格按照语文课程标准的要求命题,试卷遵循基础性、生活性、发展性的原则,密切联系学生实际,关注学生心灵,紧紧围绕教材,侧重考查学生的语文基础知识和基本技能,较好地渗透新课程理念,对提高学生成绩和增强教育效果有着较好的导向性作用。
一、试题特点
考查的维度力求由知识和能力的单维,走向三维,确定考评的三维空间:即知识和能力、过程与方法、情感态度和价值观,促进学生知识、能力、态度及情感的和谐发展。试题源自教材,题目的形式又有别于教材,在一定程度上促进了学生的语言积累,注重了语感的培养,有利于学生语文素养的形成,体现了“课程标准”的要求,对今后的语文教学也起到了明确的导向作用。
注重积累,体现课内与课外结合,体现语文和生活结合,具体考查学生对基础知识和基本技能的掌握情况。如:积累运用部分充分体现了科学性原则,而课外阅读和习作展示注重了开放性,给学生留有很大的思维空间。
注重创新精神与想象能力的培养。试卷中较多体现富有人性化色彩,体现人文关怀,尊重学生个性化的思考和创造性的解答。部分题目要求写出父母对儿女之间的真情实感,给学生一个充分写作的空间,丰富学生的想象能力,培养学生的个性发展。
整个试题力求体现:注重基础,突出能力,尊重个性,鼓励创新,联系生活的原则。试题难易、题量均比较适中,避免偏、难、怪题,较全面的对学生进行应知应会的考查。
二、试卷分析
一般来说,试卷分为四个板块,前两大板块都是基础性题,都是课内所需掌握的知识,是学生应知应会的,大多学生也都得到了一个满意的分数,但学生在答题过程中所暴露的一些问题和弱点还是应该引起我们的重视。
第一板块,基础知识题。是对学生生字词和查字典方法的掌握情况的考查。通过试卷可以看出,大部分学生对生字的识记和查字典的方法掌握得都很扎实,只是个别学生失分。失分的主要原因是错别字,极少数学生对课文中要掌握的一类字掌握不太好,多笔少画,对易错字识记不准,记忆不牢;对较复杂的字部首分辨不清。如:慈祥的“祥”;再接再厉的“厉”与励精图治的“励”混淆;“砸”字的笔顺30%的学生出现问题。
第二板块,积累运用题。从卷面看,改写句子、补充诗句、积累名言或句子等这类课本上的积累性知识掌握得都很好,但像积累拟人句、比喻句、补充句子、重新排序等这种稍活一些的题,学生就显得有些犯难,普遍失分较多。究其原因:一是多数学生审题失误。对课本中一些精讲课文中重点语句和段落积累巩固不够,写的句子并不是本册课文中的句子或不是拟人句、比喻句,还有一部分学生对“拟人”这一修辞手法含糊不清。二是学生读题分析、判断运用能力不够。不能利用语句中关键的词语分析,理清关系进行排序。
第三板块,阅读理解题。主要是对学生的默读能力、理解能力、领悟其表达方法、体会表达情感等阅读能力的综合考查。学生完成较差,失分较高。主要表现在课外阅读部分:学生审题不清,“先读句子,再回答问题”,对句子体会不够,不能很好地感受到作者所要表达的思想感情,答题失误较多。学生对标点符号的填写能力欠缺,不能借助上下文内容根据语境填写恰当的标点符号,对某些标点符号的用法不清,缺乏良好的语感培养与训练。学生对揣摩短文中心,领悟文章基本的表达方法,抓住重点词句体会作者所表达的思想感情等综合阅读能力较差。
第四板块,作文。从阅卷情况看,大部分学生能按自己的体会,写出真情实感,但学生在考场作文中反映出来一些问题:一是选材缺乏新意,视野不够开阔,仅局限于那一两件典型的事情上,少数同学叙事不清;二是语言积累不够,词语贫乏,语言表达是一个弱项;三是写作技巧欠缺,作文段落不清楚;四是字迹潦草,书写不规范的作文较多,错别字现象仍较普遍。
三、对今后教学的启示
要注重实践,加强语言文字训练。语文的学习资源和实践机会无处不在,无时不有,我们应该积极的创造条件,给学生创设语文实践的环境,让他们积累大量的感性材料,尤其要注重语文的工具性,加强学生理解与运用语言的能力,语文能力才能不断提高。认真学习新课程标准,积极倡导自主、合作、探究的学习方式。我们只有在平时的教学中落实课标精神,才能使学生有所发现、有所发展、有所创新。随着课标的实施和考试命题的进一步改革,开放性试题、个性化试题和创新试题将会越来越多,因此,我们必须紧跟教育形势的发展,更新教育理念,不断改进教法,努力培养有创新精神的高素质的人才。
要拓宽学生视野,丰富知识积累。积累对提高学生的整体素质起着至关重要的作用。在语文教学法中,让学生多读书,读好书,多思考,引导学生有目的、有计划、有方法的进行课外阅读,并指导做好摘抄和读书笔记。同时要充分利用语文教育资源,开展诸如手抄报、辩论、演讲等丰富多彩的综合实践活动,从而达到拓宽学生视野,丰富知识积累的目的。重视方法的指导与能力的培养,让学生掌握阅读方法,在培养阅读能力、分析问题能力、理解能力上下功夫。
【参考文献】
卫生行政处罚是卫生行政部门对违反卫生相关法律法规规范的公民、法人或其他组织依法实施的法律制裁。从卫生行政部门角度而言,卫生行政处罚是卫生行政部门的一种具体行政行为,从受处罚的当事人角度而言,卫生行政处罚是其为自己的违法行为而承担的行政法律责任。因此,卫生行政处罚案卷的质量能够反映出卫生行政部门及卫生监督员的办案能力和行政执法行为的规范情况。为进一步规范卫生行政处罚行为,推进本市卫生行政部门及卫生监督员依法行政办案能力,我们将常州市2005年度食品卫生、医政执法、公共场所、职业卫生等各专业卫生行政处罚案卷进行了认真审阅与分析,现将有关情况分析如下。
1 资料与方法
我市2005年共承办各类卫生行政处罚案件815件。按执法专业分类,食品卫生处罚案卷612件,占75.09%;医政执法案卷114件,占13.99%;公共场所处罚案卷55件,占6.75%;消毒产品案卷9件,占1.10%;职业卫生处罚案卷7件,占0.86%;化妆品案件6件,占0.74%;涉水产品处罚案卷5件,占0.61%;其它类别案件7件,占O.86%;按办案程序分类,简易程序253件,占31.04%,一般程序557件,占68.34%,听证程序5件,占o.61%。我们组织法律、食品卫生、医政执法等各专业的专家和专业人员对案卷严格按照《常州市卫生监督所行政处罚案卷质量评定标准(试行)》进行评分定级。该评定标准根据《中华人民共和国行政处罚法》、《卫生行政执法文书规范》以及本市政府法制部门对行政处罚案卷考核评议要求制定,由文书择用、处罚对象认定、处罚程序、证据收集、法律适用、裁量适当、案卷装订8项内容组成,8项内容又各自细化为若干小标准。案卷整体得分在90分以上的为甲级案卷,在80~89分为乙级案卷,60~79分为丙级案卷,60分以下的为不合格案卷。处罚程序、证据收集、法律适用、文书质量4项有扣分的不得评为甲级案卷;处罚对象认定、处罚程序、法律适用错误的则评为不合格案卷。对案卷中存在争议的问题则由数位专家和专业人员共同讨论分析,得出最终结果。
2 结果
经过打分评定,甲级案卷645份,占79.14%;乙级案卷112份,占13.74%;不合格案卷58份,占7.12%;无丙级案卷。常州市卫生监督所承办的126份卫生行政处罚案卷中,甲级案卷有121份,占%.03%;乙级案卷2份,占1.59%;不合格案卷3份,占2.38%;所辖2市5区卫生监督所承办的689份卫生行政处罚案卷中,甲级案卷有524份,占76.05%;乙级案卷110份,占15.97%;不合格案卷55份,占7.98%。
3 讨论
2005年本市卫生行政处罚案件数达815件,较2004年的648件增加了20.5%,案件数量的增加反映了本市卫生监督部门和卫生监督员的办案能力有明显提高,处罚案卷质量也得到了本市司法部门以及政府法制部门的肯定,执法程序完备规范,适用法律准确,处罚裁量适当,证据收集形式丰富多样,执法文书符合卫生部执法文书规范要求。
3.1 执法领域拓展
2005年卫生执法重心由传统的公共卫生向医政执法逐渐转移。2003年以前,本市没有开展医政方面的处罚,2004年仅有18件,且多以警告、责令整改为主,2005年度处罚案卷中虽仍以食品卫生为代表的公共卫生领域为主,但医政执法案件有114件,占案例总数的13.99%,执法依据涵盖了《医疗机构管理条例》、《执业医师法》、《母婴保健法》等法律法规,且案例具有一定质量,开拓了卫生行政执法新领域,积累了一定办案经验,为开拓医政领域执法奠定了基础。
3.2 处罚力度加大
卫生行政处罚的社会影响和效果日益明显。由于部分卫生法律法规滞后、缺乏可操作性,执法对象日益复杂等原因,卫生行政处罚在实践中遇到很多障碍,操作的难度越来越大。根据案卷的质量分析,一些案卷的当事人拒绝在笔录上签字,一些案卷在调查取证时已不能收集到违法事实的直接证据,而案件承办人员都能严格按照相关程序进行操作。2005年全市卫生行政执法处罚(没收)金额达152万元,较2004年罚没款129.2万元增长15.38%。说明虽然面临的执法情势日渐复杂,但卫生执法人员的依法行政办案能力在不断提高,卫生执法力度在不断加大。
3.3 案卷质量较高
从2005年年初,我们采取一系列措施,如对卫生监督员进行办案如何取证、固证、案件点评等培训,建立和规范卫生行政执法程序的制度,加强文书制作考核等”。所以,757件甲乙级案卷基本能做到对受处罚主体资格有工商营业执照、当事人身份证等复印件进行确认;处罚程序在文书中固定,每个运作程序严格在规定时限内完成;证据形式丰富,有书证、物证(或照片)、证人证言、检测报告等;法律条款适用准确;文书择用正确。在2005年度本市政府法制部门和省卫生监督所案卷质量评比中获得较好成绩,得到了本市政府法制部门和省卫生监督所案卷质量评议组的肯定。尽管办案质量有较大的提高但仍有不少需要改进的地方。①案卷中各种文书制作质量有待提高。一是案由表述不规范,未按卫生部工作规范要求书写案由,如在个人卫生不符合卫生要求的案例中,将案由书写为某某工作人员不穿工作服上岗案;二是在法律文书中使用口语化的用语,未使用法律、法规、规章中的用语,三是文书中出现错别字、涂改处未经当事人确认;四是表述过于笼统不客观具体等。②欠缺对当事入主体资格的确认。在对处罚对象的主体认定方面,程序不够完备,缺乏相应证据材料,有些案卷出现主体认定错误,如在无证生产经营的违法行为中,将当事人打出的字号认定为当事人,而不是将无证生产经营行为的负责人认定为当事人,这些案卷则被判为不合格案卷。③少数案卷证据单薄、未形成证据链。部分处罚案例对违法事实的认定仅有现场笔录和询问笔录予以支持,证据形式单一,证明力相对较弱。甚至出现了某案卷以鉴定结论作为主要证据定性违法事实为食物中毒肇事,案卷中未见采样记录的情况及其它相关证据。④适用法律、法规不具体。评定过程中发现有少数处罚案卷在适用法律、法规时,不能具体适用到款、项,而只是适用到条,为行政处罚被司法部门撤销埋下隐患。⑤合议较为简单,合议过程流于形式。部分处罚案卷合议形式化,走过场,案件讨论记录过于简单化,不能真实反映讨论的过程和与会人员每个人的真实意见。如当事人陈述申辩后减轻行政处罚的,在再次合议的过程中不能体现出减轻处罚的理由和依据。