前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇测量学试题及答案范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
一年级数学
(满分100分,考试时间60分)
得分:
一、填空。
(11分)
1、(1)上图中一共有(
)个图形,从左边数,长方形排在第(
)个,第(
)个和第(
)个是三角形。
(2)从右边数,第(
)个和第(
)个是正方形。
2、一个数的个位上是8,十位上1,这个数是(
)。
3、红红今年10岁,去年她(
)岁,明年她(
)岁。
4、有个数比12大,比16小,它可以分成两个相同的数,这个数是(
)。
3、在计数器上,从右边起第一位是(
)位,第二位是(
)位。
4、-8>6,
最小是(
),16-
>6,
最大是(
)。
5、找规律填数。
①、
、14、16、
、
、20。
②、19、
、15、
、11、9。
③、3、6、9、_____、_____。
二、计算。
(30分)
12-8=
16-7=
13-5=
13-7=
19-0=
14-7=
16-9=
15-6=
12-3=
11-4=
13-6=
9+7=
15-9=
14-5=
12-9=
15-7=
13-9=
8+9=
16-8=
14-9=
14-9-2=
12-7+6=
7+6-8=
6+3+4=
8+8-7=
11-5+8=
7+4-6=
7+9-8=
5+7-6=
7+8-6=
三、在里填上“<”
“>”
或“=”
。(10分)
168+7
18-98
11-312-3
14-614-8
14-87
11-57
16-914-7
15-814-9
15-7+815
89+5-6
四、在下面的方格纸上画一个三角形、一个正方形和一个长方形。
(6分)
五、数一数,填一填。
(6+4分)
1、(
)个长方形
(
)个正方形
(
)个三角形
(
)个
(
)个
(
)个
(
)个
2、六、填表。(6分)
原有
16箱
13箱
(
)箱
卖出
9箱
(
)箱
8箱
还剩
(
)箱
5箱
6箱
七、看图列式计算。
(6分)
1.
?个
2.
13个
?个
=
=
八、在每个图形里画一条直线、分一分。
(6分)
(1)分成两个长方形
(2)分成两个三角形
(3)分成两个三角形
九、解决实际问题。
(15分)
1、班级图书角有17本故事书,借给小朋友8本,还剩多少本?
(本)
2、小红做了16面
,送给幼儿园小朋友一些后,还剩7面,送走了多少面?
(面)
我已经看了9页,还有9页没有看。
3、这本书一共有多少页?
(页)
4、鸡有13只,鸭有7只,鹅有4只。
⑴、鸭和鹅一共有多少只?
(只)
⑵、公鸡有9只,母鸡有几只?
(只)
足球和篮球一共
有12个。
5、⑴、篮球最少有(
)个。
一、当前学业成就测评所面临的技术难题
随着基础教育改革的不断深入,对学生学业成就的测评工作已经取得很大进展,但我们仍然无法忽视其中存在的问题:一是现行的学业成就测评仍然摆脱不了对学生进行排队的嫌疑,通过测评所挖掘的学生的信息仍然不够深,从而导致对学生的能力不能很好地诊断和指导[2];二是囿于测评技术的发展局限,现行的学业成就测评还是主要考查学生对知识的掌握程度,对学生能力的掌握还不够深;三是学业成就测量与评价的非标准化,导致了测评内容缺乏客观性。尽管我们打破了传统的材一统天下的局面,制定了一个共同的课程标准,但现行的考试制度还是抹不去学业成就测验内容选择的主观色彩;四是学科专家和心理测量学专家之间的联系不够紧密,导致学科专家在成就测评的实施过程中,缺乏心理测量学的理论指导,而心理测量学专家对学科知识和课程标准也吃不透;五是在我国现状下,大规模的学业成就测评的形式非常单一,主要采取纸笔的形式,这也导致人们对测评的客观性和公正性存有质疑。综合上述五个问题的出现,分析其根本原因,主要原因还是心理测量学的基本理论还没有完全融入到学业成就测量与评价的实践中去,所以,要解决学业成就测评面临的问题,还得从心理测量学的理论与技术的实施中寻找答案,加强心理测量学专家与学科专家之间的联系与交流,从而做到学业成就测评的客观、公正与公平,促进学生能力的发展。
二、学业成就测评的经典测量学基础
经典测量理论(Classical test theory,CTT)起始于20世纪中叶之前,其主要特点是以真值理论为基础,以信度、效度、难度和区分度为指标,它的基本假设是考生的分数并不是一个绝对的值,而是其真实能力或技能的反映与测量误差的和,所以称为真值理论。根据经典测量理论,人们逐步建立并完善了测验发展的标准化程序,通过标准化的程序提高所编制的测验的信度和效度。
自2001年国家教育部提出课程改革以来,教育心理学工作者和学科专家在新课程下学业成就测评工具的研发上,下了不少工夫。经典测量理论在学业成就测评中也得到了一定的应用。某地区初中数学成就测验在编制过程中,首先是依据初中数学课程标准,确定初中数学涉及4个领域的内容:数与代数、空间与图形、统计与概率以及综合应用。同时结合美国教育学家B.S.Bloom的教育目标分类法,选择记忆能力、理解能力、运算能力、推理能力、综合应用能力为教育目标,确定测量目标。根据教学内容和教学目标,制定了双向细目表,之后对该区的数学教学专家进行了访谈,确定了项目以及项目所占的权重,然后组成两套平行题本。根据题本通过小样本预试,用难度、区分度的指标来筛选题目,最后确定正式施测题本。采取分层整群抽样,进行施测收集数据,分析数据,从而根据数据分析的结果来评价学生学会了什么,对什么是了解、知道、理解、应用[3]。
在大规模的学业测评中,试题往往要全面覆盖基础教育的各个学科,测试题目非常多,如果要将这些题目让全部学生作答,测试的时间会大大超过学生所能承受的限度,这也是不可能实现的,矩阵取样技术化解了这个难题。将覆盖多个学科的所有题目按照一定原则分配到多套测验中,学生随机分配,每个学生只需完成一套测验中的试题,这样的设计叫做完全矩阵取样设计。采用这种设计解决了测验时长的问题,但是不同学生测试结果的比较又成了新的问题。针对这一问题,发展出不完全矩阵取样设计,就是每一个题本中都有一部分共同题,利用学生在共同题部分作答的情况,将学生在整个题本中的作答结构等值到同一个量尺上,就可以解决个体之间的比较问题。
即便如此,经典测量理论下的学业成就测验,采用总分指标来评价能力,对个体在总体中的相对位置进行排序,不能指出被试具体掌握了哪些内容,更无法诊断其题目作答错误的原因,仍然摆脱不了还只是对学生知识点考查的怪圈,在注重能力培养的素质教育背景下,它缺乏对学生能力的掌握;用难度与区分度的指标来分析学生的反应,保留了一些反映学生能力的题目;在实际的教学过程中,教师一般也都是自出题目,对题目的难度和区分度只做一个主观的估计,同时,它也缺乏避免曝光的理论技术指导,从而造成学业成就测验的标准化程度很低;另外,如果涉及到语文成就测验时,主观题目的设计以及结果的分析又会面临统计学的难题。
三、学业成就测评的现代测量学指导
基于经典测量理论下成就测验只能测查知识点的致命缺点,教育与心理学工作者围绕经典测量理论的一些问题展开了讨论,促进了测量理论的新发展,注重表现学生能力的项目反应理论(Itemresponse theory,IRT)产生了,该理论起始于20世纪60年代,其特点是:采用严格的数学模型来反映不同能力水平的测试者对测试题目的反应模式。项目反应理论相对于经典测量理论来说取得了巨大的进步,但也并非没有缺点[4],它的3个基本假设非常严格——(1)单一维度假设,即假定测验的所有题目只测查同一种能力或潜在特质。但实际上,很少有测验只测查单一的能力或特质。(2)局部独立性假设,即当控制所测量的能力或特质之后,被试在不同题目上的反应是相互独立的。换一句话讲,就是被试对题目的反应只受该题目所测的能力的影响。(3)单调递增假设,即被试对题目正确反应的概率随其能力水平的增加而单调递增。这3条非常严格的假设,使其应用受到很大的限制。
从20世纪90年代至今,围绕项目反应理论产生了很多新的研究和新的动向,如:多维项目反应理论(Multi-dimensional IRT,MIRT)、非参数项目反应理论(Non-parametric IRT,NIRT)等。多维项目反应理论为成就测验中所涉及的每个维度引入能力和项目区分度参数,进而模拟测验题目和被试之间的交互作用,它是一个非线性的用来表征题目参数、被试的多维潜在能力以及其正确作答概率之间关系的数学函数,通过这个模型,我们可以对被试的多个特质进行分别推断。换一句话说,利用多维项目反应模型能同时估计被试在多个维度上的能力参数,并且考虑各能力维度之间的关系,因此,如果测验数据是多维的,则多维模型就能更有效地估计被试及项目参数。这使我们能更深入地了解被试,结合多方面的信息,为对被试的评估或诊断提供帮助。在实际应用中,一个总的学业成就测验可以分为多个子测验,如果子测验测量了不同的内容领域或认知技能,则这些项目就有可能代表了不同的维度,这时,对每个项目能够正确作答所需要的内容领域或认知技能进行分析是非常必要的,在传统测验中一个知识点的考查可能涉及到对多个能力的考查,用经典测量理论的假设,一个题目对应一个能力,这显然是有很大的误差。另外,多维项目反应理论能够提供项目在每个能力维度上的区分度参数,可以据此来选择对多维能力差异具有敏感性的项目。在教育中,课堂上学科教师给学生出的小测验比比皆是,这种测验不仅题目少,而且受测的对象也仅仅是本班的学生,即样本小,这时,非参数项目反应理论就给我们提供了模型,这至少削弱了我们对经典测验中样本分布正态和在参数项目反应理论中关于特质分布正态假设的依赖。
四、学业成就测评的认知诊断技术前沿
认知诊断理论(Cognitively diagnostic theory)非常值得我们关注。随着认知心理学的发展,关于知识与技能的认知理论为我们研发成就测验工具提供了理论基础。认知诊断理论就是以现代测量学为基础,结合认知科学对学习理论的研究与发现,采用更精致的数学模型,来研究如下问题,(1)学生在答题时,经历哪些认知过程?(2)这些认知过程如何发展?以及能力高的学生与能力低的学生在这些方面有哪些差异?认知诊断可以通过学生对试题的作答反应,推论出其认知过程与知识结构的可能状态。
在学业成就测评中,经典测量理论和项目反应理论,都是根据理论中的一些指标来筛选题目,将学生按顺序排列在特定能力(或特质)的连续体上。这并不能给学生或教师有用的诊断信息,不能帮助学生或教师理解需要学习或教学的知识与技能。而运用认知诊断理论,我们能更深入地理解隐含在考生总分背后其认知技能之间的差异。这为我们深入挖掘受测者信息提供了一个有力的工具。
认知诊断理论中比较有代表性的有Mislevy的以概率为基础的推理(the probability based inference)、Corbett和Anderson等人的学生思维模拟(student modeling)、Britton和Tidwell的认知结构诊断(cognitive structure testing)以及Tatsuoka的规则空间模型(rule space model)[5]。Tatsuoka的规则空间模型最初是用来诊断小学生在解决四则运算问题时答对或者答错的原因,进而发现学生使用错误的规则来解题,因此会产生系统化的错误,这种系统化的错误,他们称之为“失误”。该模型的方法包括两个阶段[6]:第一阶段是抽取某个领域的认知特征并根据这些认知特征确定潜在的知识结构;第二个阶段是把学生的反应模式划分到所确定的各个知识结构中去,并且计算被试的属性掌握概率。在构建规则空间的过程中使用了项目反应理论中参数估计的方法,所以严格来讲,规则空间模型的建构方法是项目反应理论的继承与发展。用规则空间模型的方法编制成就测验时,通过可达到矩阵的距离来澄清各属性之间的关系,使得矩阵中的项目属性关系清晰且符合逻辑。同时,由于属性间的逻辑关系很清晰,所以在项目的反应上就能很清楚地知道学生掌握了哪些属性,或者未掌握哪些属性,或者是因为失误而造成的反应错误,这样就能给教师和学生提供更深层的信息,从而进行补救性的教学[7]。
在实际工作中开展认知诊断测评,需要进行一系列的系统化工作:(1)确定诊断目标。必须明确要诊断的具体学科内容,如小学数学分数诊断,中学语文句法诊断等。(2)确定诊断目标所涉及的认知属性及属性间的阶层关系。这项工作需要认知心理学家、学科专家和教育测量学专家共同完成。(3)根据已经确定的属性和属性层级关系选择适当的模型,如规则空间模型就是一种。(4)预测验与正式测验,获取模型参数。(5)诊断结果报告和有针对性的补救教学措施的制作。
认知诊断测评技术的发展使形成性评价的实施得以可能。在课程改革的背景下,教育的主题是关心人的发展,全面提高人的素养,同样,学业测评的功能也就从过去关注结果的评价逐渐转向注重过程的评价,强调通过评价改进教学活动,促进学生发展。“为了学习的评价”(Assessment for Learning,AFL)理念就应运而生,其核心目的是促进学生的学习,同时,该理念还提出了教育政策制定者过于强调大尺度教育评价对教育的影响而忽视了课堂上的评价。事实上,过程性评价是课堂上应该选择的最有效的评价方式,因为,在课堂教学活动过程中,为了促进教学活动而不是鉴定学生能力,教师和学生需要共同对学习过程进行监控和评价。这样,教学活动得到及时反馈,教师可以根据评价结果来调整教学;同时,学生得到学业评价的反馈,也提高了学业监控能力。
五、学业测评技术的理论发展与反思
通过心理测量理论的历史发展这条主线,对其在学业成就测评中的应用进行回顾,体现了测量理论在学业成就测评中的意义与价值,同时,这也体现了学业成就测评的测量学取向。从经典测量理论下学业成就测验对知识的测查,到项目反应理论下学业成就测验对能力的静态刻画,再到认知诊断理论下学业成就测验对能力的动态诊断,从而使教育者从反应行为的面纱下揭开能力的形成过程,对学生能力能进行更好的诊断、评价以及实施补救性的个性化教学。从学业成就测评的测量学取向的发展来看,随着认知科学、教学研究和心理统计学的发展,以认知理论为基础的新的测量方法和测验设计方法也会得到进一步发展,从而更好地指导学业成就的测评工作。
在对测评理论发展趋势的展望下,我们也应该有所反思。传统的学业测评中,更多地强调对学生学业水平和能力的衡量,但是认知诊断技术的发展趋势告诉我们,对学业的测评不仅仅是为了对学生进行考量,更应该是对教师改进教学质量提供信息,为教育质量的提高提供信息。另外,增值性评价的提出,提倡学生本身的纵向比较,更关注学生个体的发展与提高,使教育更人性化。这也更顺应了《基础教育课程改革纲要(试行)》中指出的,改革课程评价过分强调甄别和选拔的功能,发挥评价促进学生发展、教师提高和改进教学实践的功能。
参考文献
[1] Lewis R Aiken.心理测验与考试——能力和行为表现的测量.张厚粲,译.北京:中国工业出版社,2002.
[2] 辛涛.新课程背景下的学业评价:测量理论的价值.北京师范大学学报(社科版),2006.
[3] 柴彩霞.7~9年级数学成就测验的初步编制.湖南师范大学,2005.
[4] 辛涛.项目反应理论研究的新进展.中国考试,2005(7).
[5] 余娜,辛涛.规则空间模型的简介与述评.中国考试,2007(9).
关键词 高中生物 学习兴趣 量表
中图分类号 G633.91 文献标志码 B
1 问题的提出
兴趣是影响学生学习积极性的重要因素。提高学生的学习兴趣既是生物教育的手段,也是生物教育的重要目标。对学生进行学习兴趣量化评估,需要设计一个兼顾信度和效度的量表。本文参照心理测量中自陈表的设计方法,设计了可进行批量测试的量表,并进行了试测和分析。
2 生物学习兴趣量表的设计
要测量学生的生物学学习兴趣度,首先要明确哪些特征可以反映学生对生物的兴趣。笔者在广泛参阅心理学、教育学理论,结合生物教学的特点和近年来对高中生的观察分析,泸县二中生物教研组经过讨论,并列出了能够反映学生生物学习兴趣度的典型特征,用于量表中的设问。下面所用兴趣度量表是一种自陈量表,是心理学测量人格常用的方法。在量表中包括一系列陈述语句或问题,每个句子或问题描述一种行为特征,要求受试者做出该描述是否与个人情况相符的回答。
本量表的编制,特别注意对以下几个方面的理解:
(1) 生物学习兴趣是学生对生物学有关概念、原理、生物学实验、生命现象等教学内容各方面的趣味程度的综合考量。
(2) 生物学习兴趣是学生在各学习环节中表现出的兴趣,不仅指在校内课堂学习时段的环节,也包括在平时生活中对生物学科相关知识的兴趣表现。
(3) 生物学习兴趣除了表现为对生命现象的好奇、疑问,还体现为力图探求生命现象的原理,生命现象的发展,并且渴望了解生命科学的探索历程。
(4) 兴趣既是外在的行为取向,也是内在的心理倾向。因此,在让学生报告其有关的行为表现的同时,还应让学生报告自己的心理感受和体验。
(5) 问卷的题目要与被试的年龄阶段、生活阅历相吻合。
经过多次修改,用于高一新生的初始兴趣度测量的试题共包括30个陈述句见附录部分,每个句子描述一种学生对生物感兴趣或者不感兴趣的典型行为、心理感受。要求被试者如实做出是否与自身情况相符的回答。30个题中,1、5、11、17、24、25、30题每个题选“否”得兴趣分1分,选“是”得兴趣分0分,其余23个题中选“是”得兴趣分1分,选“否”得兴趣分0分。最后将全卷分数总和作为该生的兴趣分,满分30分。
效度量表包括完美性检验和对偶检验两部分。在完美性测试中,31~36题回答“是”的得1分,37~40题回答“否”的得1分。完美性测试总分≥3分者视为说谎,作为无效卷处理。问卷中设计了6对对偶检验题(41题与5题,42题与18题,43题与19题,44题与3题,45题与1题,46题与28题)。对偶检验中若出现说谎分≥3分,则该卷视为无效卷。
3 量表的试测与质量分析
2013年9月对泸县二中高2016届B部全体学生(1 378人)进行了测试。由于对测试结果的读取、统计分析工作量非常大,利用机读卡光电阅读机(怀宇OMR2140B标准型),快速将学生的选择结果设计为电子表格中的选项(表1),再将学生的选择结果转化为兴趣度分,这样大大减轻了数据的统计工作量。另外,运用IBM SPSS statistics 19软件进行每道题的区分度的分析、变量之间的相关度分析,提升了本研究的科学性。
测试的标准差为6.72,表明针对同一测试对象,测试具有较大的稳定性;测试中除了18、22题区分度为“尚可”,其余题目都表现为“很好”;测试所得Cronbach's Alpha系数分别为0.89,Guttman折半信度分别为0.89。学者DeVellis认为,信度系数r为0.60~0.65(最好不要);0.65~0.70(最小可接受值);0.70~0.80(相当好);0.80~0.90(非常好)。心理测量学上最理想的信度系数为r=1.00,但这是办不到的,在性格、兴趣、态度等人格测量中信度系数通常在0.80~0.85之间。故本测试均有较高的内部一致性,信度相当好。
4 测试各题分值分析
本研究设计的量表满分为30分,在测试中,全体学生的总体平均分18.13分,表明学生的整体基础学习兴趣还是较高的。泸县二中是国家级示范性普通高中,由于报考的学生数量大,经过多番选拔,录取进校的生源自然基础成绩较高,相应的初始兴趣度也较高。初始兴趣度测试中,得分人数最多的分值是15分,其次是16分、17分,与全体分数的中值比较接近。
4.1 得分最低的5道题
测试得分最低的前5道题依次是第7、2、8、27、29题(表2),具体分析如下:
7题:通过测试学生是否了解生物学科的分支来判断学生平时是否关注了更深层次的生物学知识。这道题的得分需要学生在课堂之外对生物学及其分支学科有所了解,从这道题0.52的区分度来看,这也是一道易于区分学生兴趣度高低的题。
26题:此题说明初中阶段的学生对生物课堂所讲的知识深入程度是不够的,当前在四川省初中生物大都被视为“小学科”,在许多学校中生物学科课时少。在当前教学条件下,教师对学生深入了解生物知识的引导还做得不够,并且对于教师在课堂中所讲的知识,学生消化、理解的时间不足,所以在这道题上学生的得分率很低。
8、27、29题:都是在通过考查学生是否留意了身边的生物及生命现象,是否怀着兴趣去探究生物知识,是否有了解生物知识、应用生物知识的愿望来表征生物学习兴趣。这几道题体现出学生对生活和环境观察得不够深入,这可能跟学生的生活环境、学习条件有关。
4.2 得分最高的5道题
得分最高的5道题是18、22、23、19、1题(表2)。分析分别如下:
18题:此题的得分最高,反映出当前高中生对能够自己动手的机会非常珍惜,操作的主动性很强。给教师的启示是:生物课堂应该增加学生动手操作的机会。例如:演示实验可以让学生做;对于学生操作的实验在考虑分工合作的同时,也应该充分保障每个人的动手机会。
22题:此题也涉及学生自己“动手”的问题,许多生物科学家做过的实验,在教材中往往以“生物科学史”“小资料”“背景资料”等形式呈现,详尽的操作过程在高中教材中并未呈现。而其中蕴含的科学研究思路及方法,对培养学生的生物科学素养具有很高的价值。此题也反映出初中阶段的实验操作的普及面与学生的实际需求存在差距。
23、19、1题:三题反映出许多学生对身边的生物学原理具有较强的了解愿望,对应的措施可以是给予学生更多接触生物科普知识的途径。教师可以通过开展课外读书交流活动、生物奥赛知识讲座等,为学生提供这种途径。
附 中学生物学习兴趣量表
亲爱的同学,为了了解你的生物学科学习情况,我们邀请你参与本次问卷调查。下面每个问题中叙述了一种行为或感受,请你如实地评判。
如果该叙述与你的情况相符,请在机读卡上相应题号涂A项,如果不符,请涂B项。问卷的任何选项都没有好与坏之分,也没有“正确”答案。如果你觉得在不同的情境里,两个答案或许都能反映你的倾向,请选择一个对于你的行为方式来说最自然、最顺畅和最从容的答案。
最后,请记得在考号栏涂上你的理科综合周练考号。
( )1.上生物课我经常希望快些下课。
( )2.课余时间我经常翻阅生物课本。
( )3.我经常在生物老师上课之前预习。
( )4.我会仔细地看一遍老师批改之后的生物作业。
( )5.我觉得生物课是枯燥乏味的。
( )6.课后我喜欢和同学们讨论生物老师当堂课所讲的问题。
( )7.我知道遗传学、生态学、分子生物学、细胞生物学、动物学、植物学等都属于生物学的范畴。
( )8.我能说出许多花草树木的名字。
( )9.生物教材上老师没有讲或者略讲的内容,我会自己去阅读。
( )10.我曾多次借阅有关生物学的课外书。
( )11.我对生物学没有什么好感。
( )12.生物课上老师提出问题时,我能积极思考。
( )13.我在生活中经常注意到课堂所学的生物学现象。
( )14.我能用所学知识解释生活中的许多生物学现象。
( )15.我喜欢做生物测试题。
( )16.我希望能参加生物知识竞赛。
( )17.我没有认真解剖、观察过花朵的结构。
( )18.生物实验中我经常争取自己动手。
( )19.我经常就学习生物时遇到的疑问请教老师和同学。
( )20.如果发现下一节课是生物课我会比较开心。
( )21.如果高考不考生物,我还是会对生物很感兴趣。
( )22.我很想亲自动手做一做教材上那些生物科学家们做过的实验。
( )23.生活中遇到一些生物学现象时,我希望自己能知晓其中的道理。
( )24.我希望生物学科不布置作业。
( )25.我希望生物学科每周少上一节或者两节课。
( )26.我希望老师就某些生物知识讲得更深一些。
( )27.我喜欢种点花草树木,观察他们的生长。
( )28.我经常看一两个有关生物、有关自然的电视节目。
( )29.我很想知道自己身边的常见植物叫什么名字。
( )30.我做生物作业时会去想其他事情。
( )31.每次生物考试我都能考出最好水平。
( )32.我的生物老师的每堂课都是非常成功的。
( )33.我上生物课从不走神发呆。
( )34.我喜欢教过我的每一个老师。
( )35.每次的生物作业我都会完成得非常认真。
( )36.我从来不会放弃没弄明白的生物知识。
( )37.有时我也会说假话。
( )38.我的生物作业也有完不成的时候。
( )39.生物教材上不是每个章节我都学懂了。
( )40.我有时会拖延完成学习任务的时间。
( )41.生物课是有趣的。
( )42.做生物实验时我更愿意看着别人做。
( )43.我没有主动问过老师问题。
( )44.我经常预习生物教材。
( )45.在生物上,我经常盼着下课。
( )46.我看过一些有关动、植物或自然类的节目。
参考文献:
[1] 中华人民共和国科学技术部等.国家中长期生物技术人才发展规划(2010-2020年)[Z].2011-12-26.
[2] 江.中学生生物学习兴趣的研究[D].北京:首都师范大学,2011.
【关键词】选择题 高考英语 试题
一、引言
选择题是各类测试中常用的一种题型,它由题干和三个或三个以上的选项构成,要求受试者根据题干提供的信息从选项中做出恰当的选择。选择题答案固定,不需要评分人员的主观判断,易于给分,能够保持很高的评分信度。现在采用光电阅读器来读答题卡,更省力,速度更快。
二、选择题的发展
1.选择题的引入。1965年,高考试卷中出现了一道五选一的多项选择题,这标志着我国高考英语试卷中开始引入选择题。从形式上看,当时我国对选择题还处于引入阶段,出题技巧欠缺,试题质量较差,这道选择题的题干无法提供完整的信息,考点比较模糊,只能说是选择题的雏形,还不完整。在这道选择题出现之前,都是主观测试,这说明我国的英语测试一直以来都是受写作翻译测试法的影响。从1965年出现这道选择题,我国开始引入结构主义心理测量法。选择题是结构主义测量法的代表题型之一,由于当时的理论水平还不够,题型的质量尚不如人意。
2.选择题的发展。恢复高考后,1978年的试卷中出现了65年用过的选择题,采用三选一的形式,当时称为选择法填空,共30小题,占30分。同时,阅读理解题也开始采用四选一的选择题,跟现在采用的阅读测试方法相同,只是当年只有一段二百多字的短文,短文后有四个小题,每小题5分。可以看出我国当时对选择题的重视,表明结构主义心理测量法已经被中国的测试专家所接收。选择题评分客观,信度高,正好符合人们对高考成绩公平、公正的时代要求,受到教育界及广大考生的高度认可。只是由于当时对它的认识还不是很充分,所以79和80年的高考试卷中,四选一的选择题只有20个小题,占20分。此外,79和80年的阅读理解采用了两种题型,即填空题和选择题,选择题每小题3分,采用三选一的形式,降低了选择题的难度和分值。这都说明了我国测试学专家在结构主义心理测量学的测试方法上不断的摸索,从最初只用于测试语法到慢慢向阅读技能的延伸。82年的题型做了重要的改革,在往年题型的基础上,新增加了考查语音知识的单词辩音。直到80年代中期,我国对选择题的研究从理论上的探讨发展到相当的规模,标志着结构主义心理测量法在我国高考英语测试的实际应用中有了长足的发展。
3.选择题的成熟。从1987年起,短文填空由原来的填空形式改为四选一的完形填空,这标志着我国在测试学理论上又有了新的发展。完型填空是综合测试法的典型题型,所以完型填空在高考中的引入,标志着我国测试学在理论上的又一大进步,完形填空法的产生与格式塔心理学有着密切的关系。在此之前,受结构主义心理测量法的影响,选则题是单纯地考查知识点,虽然是句子或对话,但没有语篇,语境难以创设,而且题干和选项的选定非常主观,提供的不一定是正确输入,更不是真实的交流,考查不出考生语言理解能力。然而,多项选择完型填空题的出现,使这一现象得到了改善,将语言基础知识的考查和语篇结合在一起,可以通过一个小题的回答综合判断学生多方面的能力,这也符合当时综合测试法的观点。综合式测试主张通过一次测试全面评价被试总体语言水平,被试者需要综合运用各种语言知识或技能。在此期间选择题的使用空前广泛,最高时占试卷总分的80%,除了对语法、阅读能力的考查,还出现了单词辨音、补全对话等形式。
4.选择题的飞跃。97年阅读理解增加了考察交际能力的选择题,这标志着我国高考英语的发展进入了全新的阶段,此时的高考不仅重视语篇及语言应用,更加重视学生交际能力的检测,这与当时交际理论的盛行是密不可分的。理论上交际理论和选择题是矛盾的,但语言测试专家Heaton[3]23认为选择题与交际语言测试并非是非此即彼的关系,在很多交际测试中仍可限制性地使用此题型,特别是测试阅读和听力时。2000年,教育部考试中心在当年的4种高考试卷中,有3种试卷增加了听力,虽然在这3种试卷中听力所占的分值不同,但我们看到了国家对学生交际能力的重视。2003年高考英语听力测试在全国普及,促进了基础教育阶段学生的听力水平,因引入了听力,高考去掉了沿用多年的单词辨音这种20世纪中叶结构主义语言观时流行的分立型间接测试题。2004年是我国高考历史上改革幅度最大的一年。同往年相比,2004 年的试题更加突出语言的交际性,更加强调英语知识的灵活运用。可以说,2004年高考英语测试已成功地实行了从知识型向能力型的过渡,这也体现了后来高考英语命题的走向。到目前为止,高考英语考试中选择题的题型基本趋于稳定,只是由于听力测试施考的难度较大,所以有些省市对听力有不同的做法,仍有个别省份不考听力,有些省份不把听力成绩计入总分,但未来的发展,听力一定是高考口语考试中必不可少的一部分。
三、总结
作为标准化的测试题型,选择题具有试题设计规范、试题答案唯一、可用机器阅卷等特点,被公认为是一种信度极高的考试题型,仍将是未来高考英语测试及其他测试中主要的题型之一。
参考文献:
[1]胡春洞,王才仁.英语测试论[M].南宁:广西教育出版社,1996.
数学诊断性测验难度信度效度1引言
在基础教育课程改革逐步完善的过程中,传统测验的局限性在新课程改革中犹为凸显。单一的分数不能反映学生使用的认知成分或技能,也不能诊断出学生答错题目的原因,更不能挖掘考试信息的深度。《基础教育课程改革纲要(试行)》明确指出:“建立促进学生全面发展的评价体系。评价不仅要关注学生的学业成绩,而且要发现和发展学生多方面的潜能,了解学生发展中的需求,帮助学生认识自我,建立自信。发挥评价的教育功能,促进学生在原有水平上的发展。”而诊断性测验(diagnostic test)是诊断性评价使用的工具,是运用测量手段,考查学生在学习上的困难而编制的一种测验。一般在学期末或学期前,即实施新的教学计划之前进行,目的是了解、评价、分析学生所具有的基础知识基本技能掌握情况,以鉴别学生接受教学的能力并为补救教学提供参考。国内外学者的研究为诊断测验的编制与开发提供了许多理论与方法,从不同角度为诊断测验编制做出了努力,值得参考借鉴。但这些研究提出的理论比较局限,不够精准,实践性欠佳,因此未能被广泛推广应用。
八年级数学是初中数学学习的关键,也是转折点。这一阶段学生知识掌握与否,直接影响他能否顺利进入高中阶段学习。本研究以义务教育新课程标准为依据,编制八年级数学诊断性测验,目的在于了解学生知识水平掌握情况,以鉴别学生能否顺利进入九年级学习提供参考。同时,教师通过数学诊断性测验,全面了解学生数学知识、能力等方面的基础和发展状况,以把握学生的学习起点,恰当地确定教学目标,选择教学策略,并通过诊断报告获得有关学生数学学习情况的评价信息,掌握学生数学学习目标的达成情况和他们在数学学习中出现的问题和困难,以便有针对性地提出适应整体和个别需要的教学策略和措施,达到因材施教的目的,改进数学教学,提高学生的学习效果,并为其它研究人员进行更广泛的诊断性教育研究提供测量工具和方法。
2研究方法
2.1测验的编制
2.1.1测验内容的确定
本研究的内容为八年级数学诊断性测验,用团体施测的纸笔测验形式。参考国内外诊断性测验的样本,本测验题型分为四选一的选择题、填空题、计算题三大部分。以义务教育新课标准为依据,并参照多位从事中学数学教学的一线教师经验选择初步编制题本,一级目标10个,二级子目标63个,题目总数204。学生知识能力掌握情况分为三种水平。尚未掌握:是指不具备或不完全具备学习新知识的条件;基本掌握:是指已基本具备了学习新知识的条件;完全掌握:是指完全具备了学习新知识的条件。每个子目标的题目设置一般为三个,少部分5个。标准定为:题目设置为3个,3个全对则为完全掌握;2个全对,基本掌握;对1个或0个,则为尚未掌握。题目设置为5个,5个全对则为完全掌握;4个或3个全对,基本掌握;对2个或1个或0个,则为尚未掌握。选择、填空题答对则满分,否则0分,计算题按参考答案酌情给分,完全答对计满分。
2.2测验的实施
2.2.1预测
在赣州市信丰四中随机选取了八年级一个班(60人)样本,进行当堂施测,每次90分钟,分10个时间段完成全部测验。回收有效问卷60份。将难度系数 0.30以下和 0.95以上、区分度 0.19以下的试题删除,并结合专家意见进行修改、增删。测试题的二级子目标减少至53个,题目总数减至176个。
2.2.2正式施测
选取赣州市信丰四中刚升入九年级的三个班学生。1班60人,2班58人,3班60人。剔除无效问卷176份,回收有效问卷总计1574份。16、17章施测各为45分钟,其它每章施测为90分钟。
2.2.3统计方法
对数据采用SPSS20.0进行统计处理。
3结果
3.1难度分析
主观题的难度用平均分除以满分来表示。选择题计算矫正难度系数CP。本研究把项目的难度分为五个等级,分别是小于0.20、0.20~0.39、0.40~0.59、0.60~0.79、大于0.80,对应的依次是最难、较难、中等、较易、最易。测验难度以百分比或通过率表示,是等级量表,因此转化成等距量表,查出Z分数,Z分数就视为该题的标准难度。各分测验的难度等级分布为:最难项目测验13有2个,测验11、14、15、16、18、19各有1个。最易项目测验11、15、17各有2个,测验13、16、18、19、20各有1个,测验12有3个,测验14有5个。1个分测验试题难度分布在0.2~0.39之间,7个分测验试题难度分布在0.4~0.59之间,分测验12,14试题难度分布在0.6~0.79之间。各分测验样本难度分布在0.640~0.994之间。
3.2测验项目区分度分析
鉴别度指数分为四个等级,小于0.20认为区分度很差,区分度尚可:0.20~0.29,区分度较好:0.30~0.39,区分度很好:大于0.40。各分测验鉴别度指数分布0.47~0.62,即各分测验项目区分度很好。
采用相关法对项目的区分度进行分析,分测验以及总分的相关区分度见表1。
表1表明,十个分测验与总分的相关在0.350~0.799之间,且均在0.01上显著。与鉴别指数法所分析的各分测验的区分度结果一致。
3.3信效度分析
采用克龙巴赫系数方法来估计测验的内部一致性系数。各分测验的α系数在0.614~0.744之间,各分测验间较同质(表2)。
用测量标准误对信度分析得到各分测验的测量标准误在1.496~2.145分测验的测量标准误均在三个标准差内,说明测验信度较好。
本测验编制按照八年级数学教学大纲,以义务教育新课程标准为依据,从大量试题集中精选有代表性的题目编制成测验试题,初步编制成题本后,还进行了一次小样本施测,将难度系数0.30以下和0.95以上、区分度0.19以下的试题删除。并请从事中学数学教学且有丰富教学经验的一线教师和数学教研员,结合相关教材、测验目标、教学大纲,参考各教学单元时数的基础就题本呈现的内容、形式进行调整。最后,测验的二级目标减少至53个,题目总数减至176。因此,整个过程保证了此测验具有良好的内容效度。
并用探索性因素分析对测验结构进行了分析(表3)。
经KMO统计量检验,各测验的KMO在0.607~0.860,Bartlett' s球形检验结果在0.001水平显著性。说明各分测验适合用探索性因素分析。
以主成分法进行初始分析,采用方差最大化正交旋转法,进行因素分析。测验十一能得到两个大于1的特征根,能解释总变异的75.918%;测验十二能得到两个大于1的特征根,能解释总变异的76.007%;测验十三能得到两个大于1的特征根,能解释总变异的68.626%;测验十四能得到两个大于1的特征根,能解释总变异的80.174%;测验十五能得到两个大于1的特征根,能解释总变异的81.758%;测验十六能得到一个大于1的特征根,能解释总方差的67.006%;测验十七能得到一个大于1的特征根,能解释总方差的63.540%;测验十八能得到两个大于1的特征根能解释总变异的73.181%;测验十九能得到两个大于1的特征根,能解释总变异的67.206%。;测验二十能得到两个大于1的特征根能解释总变异的64.008%。结果表明本测验符合构想。
4讨论
4.1测验的内容
诊断性测验旨在运用测量手段,考查学生基础知识掌握情况,所以测验的编制必须配合学校的课程。本测验编制以全日制义务教育数学课程标准为依据,参照中学数学实验教科书内容编写。对新旧版本教材进行比较研究。它们之间的内容基本是相同的,主要是代数知识、几何知识,只是内容呈现的先后顺序稍有不一致,这也为编制测验时提供参考的依据。老版本的教材八年级才设置几何知识教学;新版本的几何知识在七年级就以生活中常见的图形向学生加以介绍,这样不仅易于学习,还能和实践相结合。除此之外,新教材把统计和概率的初步知识以及推理知识也纳入到课本中来。
本研究编制测验的目的是诊断学生的基本技能、知识掌握情况。编制的数学诊断性测验包括十个分测验。分式、反比例函数由于在数学课程标准中规定掌握的知识点很少,在测验中题量相对较少。实测时,因条件限制,只在一所中学选取研究对象。就代表性来看,范围应该更广泛些。从测验结果分析,总测验包含10个分测验,每个分测验题目在总测验当中的量不能太大,测验时间又有限制,题目代表性的问题在后续研究中尚需完善。
4.2测验的项目分析
测验的项目分析从主要是对项目难度、区分度等进行分析。理论上来说,项目难度值在0.5左右较好,但诊断性测验旨在测查学生基础知识掌握情况,试题难度小,则说明学生掌握良好,大则说明大部分学生没掌握,因此对难度系数要求不高。从各分测验结果来看,除了第20章平均难度系数为0.365,其它各章平均难度系数分布在0.509~0.804之间;从总测验题量分析,最难的题目占总题量的4.5%,较少。大部分题目难度系数落在0.4~0.79之间,总测验的难度系数为0.628。可见测验题目属于中等偏易,试题难度分布符合测验要求。
项目区分度用鉴别指数法和相关法进行了分析。各分测验的平均鉴别指数(D)在0.47~0.62之间,各分测验中项目鉴别指数大于0.4的项目均占最大比重。区分度小于0.2的项目占总题量的10.2%。采用相关法对项目的区分度进行分析,区分度越高,越能将不同水平的被试区分开来。用相关法计算分测验以及总分的相关区分度,十个分测验的区分度都达到了非常显著水平,区分度较好。从测验区分度结果来看,试题总体达标。
4.3测验的信效度分析
内部一致性信度我们采用克龙巴赫系数。各分测验的α系数在0.614~0.744之间,可见所测内容较为一致。各分测验的测量标准误在1.496~2.145之间,总测验的测量标准误为1.267,都在3个标准差以内,说明测验分数与真实分数之间的误差比较小。从这两种信度估计的结果来看,本测验的信度系数比较高,测量标准误比较小,符合测量学的计量标准。
在结构效度考察上,采用探索性因素分析,根据所得各分测验的因素负荷矩阵,来评量问卷的结构是否符合。经KMO统计量检验,各测验的KMO在0.607~0.860,Bartlett's球形检验结果在0.001水平达到统计显著性,说明适合做探索性因素分析。其中8个测验都得到两个大于1的特征根,2个测验得到一个大于1的特征根,且解释测验的总变异都达到了50%以上。说明本测验符合构想。
参考文献:
[1]刘经兰,戴海琦.小学四年级数学诊断性测验的编制与研究[J].心理学探新,2003,(3).
[2]孟瑛如,苏肖好,简吟文.澳门地区小学学生数学诊断测验之建置与发展[J].特教论坛,1997,6(4):56-68.
[3]杨晓辉,张兰英.诊断性测验在生物学概念教学中的应用[J].生物学通报,1992,(4).