前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇计量学研究论文范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
(1)充分利用校院两级提供的资源
鼓励与支持课程组成员进修学习,拓展研究视野、提升教学能力。
(2)学习与借鉴国内外高校优秀教学经验与成果
课程组一方面注重跟踪学科的发展,结合《计量经济学》国际国内的最新科研成果不断更新教学内容,另一方面跟踪国外、国家与省级精品课、精品资源共享课,获取有益的经验与方法。
(3)改革课程考核方式,增强课程教学效果
课程的考试分为两部分:实验和课程论文。实验的考核主要是为了促进学生熟练掌握计量软件EVIEWS的应用,能够熟练进行建模求解并对模型的参数进行检验,进一步为科学研究的实证分析奠定基础;而课程论文的考核主要是增强学生的科研写作能力。
二《计量经济学》具体授课内容的改革方案
在理论教学内容方面,课程组要反复研讨并通过与学生的反馈交流,精心设计符合我校研究生实际的教学内容,使课程教学适应和符合培养经济管理创新型人才的需要。在教学实践方面,课程组要不断完善和更新教学案例,加强实践教学改革(特别是课程论文、课程实习等),注重培养学生在科研中应用本课程中相关知识与方法的能力。在教学载体方面,课程组要做到全部教学资源上网共享,实现课程在时间和空间上的无障碍教学。由于我校管理类专业研究生需要运用计量经济方法分析和解决本专业领域的实际问题,而非侧重在研究计量方法本身,因此,本课程的教学目标应是以培养学生的应用能力为主,课程教学应当理论与应用并重,融基本理论方法与应用为一体。考虑到本学科的研究生大部分在本科没有系统学过本课程,所以在教学中要根据大多数研究的实际情况以及本课程的体系,反复精选计量经济学的教学内容,使之更加符合本专业教学的实际要求。本课程以经典计量经济学的内容为主,适当概要性地介绍“非经典”计量经济学的新发展与动态。课程特别注重基本思想、经济背景、基本方法和实际应用,通过教学使学生掌握现代经济学、管理学研究和分析的基本理论与方法,并能够应用计量经济学模型分析现实的经济和管理问题。在《计量经济学》教学过程中,强调理论与实践的结合,注重培养学生运用定量分析方法解决经济管理问题的能力,以适应社会发展对创新型经济与管理人才的需要。《计量经济学》实验在培养学生发现问题、分析问题和解决问题的能力方面有显著成效。《计量经济学》实践性教学环节由案例分析、实验教学与课程论文三部分组成。
(1)案例教学
为了引导学生体验计量经济学理论与方法的实际应用,基本上每节课都结合案例进行讲解。通过实际经济问题的提出和解决,了解理论方法实际应用中出现的问题,以及解决的办法。并结合案例分析介绍EViews软件的使用方法。这种教学方式使学生感到计量经济理论方法更加贴近经济管理实际,而且是从实际需要出发去学习计算机软件,比单纯讲授软件本身更引起学生的兴趣。
(2)实验教学
实验教学是以通用的Eviews软件为载体,为配合《计量经济学》课堂教学专门设计的辅教学环节。设计思想和目的是完成课堂讲授内容的计算机软件的实现,帮助学生理解、消化、评价课堂所学的内容。具体做法是在工商管理实验室进行专门的上机实验教学,并要求学生课外另外安排不低于10小时的上机实践。上机实验课上,在教师的引导下,要求每个学生结合自己选定的作业和设计的模型,熟悉EViews软件的使用方法各个部分的具体操作。实践证明,经过8学时及以上的训练,学生都能掌握基本的计量经济分析的EViews软件操作,都具有了用计量经济软件作实证性经济分析的初步能力。
(3)课程论文
课程论文是要求研究生结合本专业所学基础理论和自身的研究兴趣,运用计量经济学的基本思路、方法和工具,解决一个社会、经济发展中的实际问题,并形成8000字左右的课程论文。这种方法可以使学生在学习了计量经济学理论方法以后,受到计量经济分析的实际训练,对运用计量经济方法解决实际经济问题方式有更深刻体会,从而提高学生处理实际经济问题的能力和素质,提高其科研能力。通过实践性教学,不仅可以增加学生对学习计量经济学的兴趣,而且使学生享受到了运用计量经济学分析实际问题的乐趣,培养了学生应用计量经济学的建模能力。一方面可以参加相关的建模竞赛,更可以运用《计量经济学》的理论和方法撰写科研论文进行发表,这几年研究生的科研成果论文能够充分说明这一点。
三《计量经济学》教学方法与手段的改革方案
该课程采用课堂讲授与上机实验相结合、模型计算与问题分析相结合的授课模式,使学生探究、协作的学习过程中达到学好《计量经济学》课程的目的。具体而言,我们在课堂教学中采用了精讲、案例、讨论等多种教学方法,将课程教学延伸到实践环节之中。根据教学内容、教学环境、教学对象采用了相应的教学方法,形式灵活,效果良好。例如,对一些理论性很强的难点内容,如总体回归函数、总体回归模型概念的联系和区别,t检验法、P值对回归方程系数显著性检验的联系与区别,回归模型存在多重共线性时会出现的理论后果和实际后果,内生变量和外生变量、模型识别的阶条件和秩条件,采用精讲教学形式。对一些实践性很强的重点内容,如经济计量学的研究程序,运用包含虚拟变量的回归模型分析结构稳定性,多重共线性、异方差、自相关的各种诊断方法和补救措施,间接最小二乘法和两阶段最小二乘法,采用案例教学形式。对一些容易混淆难以理解的内容,如多元线性回归模型与一元线性回归模型的不同点,对数线性模型、半对数模型、线性对数模型的设定和参数含义,采用对比、讨论教学形式。对有些难点内容,如内生变量和外生变量、模型识别的阶条件和秩条件,采用精讲、案例、讨论等多种教学形式。教学手段:
(1)多媒体教学
通过多媒体教学讲授《计量经济学》,突破了传统教学手段的时空限制,节省了时间,增加了课堂教学的信息量,使课堂教学形象化、生动化。
(2)实验教学
关键词:硕士研究生;全面质量管理;学位论文
中图分类号:G643 文献标志码:A 文章编号:1674-9324(2016)30-0015-02
随着近年来高校研究生的大规模扩招,我国高校研究生的教育规模也越来越大。根据中国教育在线的《2016年全国研究生招生数据调查报告》显示,我国硕士研究生招生规模从2005年的312292人,一直扩大到2015年的574300人,十年间,我国硕士研究生招生规模增长近85%,年增幅保持在4%左右。随着我国研究生招生和培养规模的不断扩大,越来越多的关注点放在研究生培养质量上。衡量研究生培养质量高低的标准就是研究生阶段培养环节的最终结果――学位论文。如何保证和提高研究生学位论文的质量,让研究生的硕士阶段学有所成并学有所用,全面质量管理(TQM)的方法为我们提供了一个很好的思路。
一、全面质量管理的内涵
全面质量(total quality,TQ)的概念是在1992年由9大企业的主席和CEO、著名大学的商学院院长以及许多知名咨询专家做出概括定义:全面质量是一个以人为中心的管理系统,它是一个综合的系统方法,横跨所有的职能和部门,涉及所有的员工,从高层到低层,并前后延伸至供应链和顾客链。全面质量的基础是其理念,包括系统、方法、工具。
国际标准ISO8402-94对全面质量管理(Total Quality Management,简称TQM)的定义是:一个组织以质量为中心,以全员参与为基础,目的是通过顾客满意和本组织所有成员及社会受益而达到长期成功的管理途径。TQM与传统质量管理的区别主要在于“全面”两字,全面两字也突出了TQM的三个特点:全员参加、全过程控制、各个环节全面性。
全面质量管理在美国发源于制造领域,随着期望的提高,渗透到医疗、教育、非盈利组织等主要经济领域。美国也是最早将质量管理应用到高等教育中的国家,而宾夕法尼亚州立大学是美国高等教育层次在质量管理方面取得成功的一个范例:自1991年以来,每年有50~60个项目由大学持续质量改进委员会来实施协调,过去十几年已经针对其整体管理系统完成了诸多重要的质量管理改进项目。在国内,将全面质量管理与研究生教育结合起来的研究仍属于一个前沿的领域,鲜有成果。
二、目前研究生学位论文存在的问题阐述
在将全面质量管理思想运用于我国研究生学位论文质量管理之前,首先应该梳理清楚目前我国研究生学位论文从撰写到答辩过程中存在的质量问题,才能针对于存在的问题对症下药,应用全面质量管理的方法对学位论文进行质量管理。
1.研究生生源质量问题。从2014年研究生教育不再免费,而是实行教育收费制度以后,研究生报名人数出现了近20年以来的第一次明显下降。在国内部分高校,尤其是地方高校出现生源严重短缺的情况。生源短缺给各高校研究生招生部门带来的问题是无法完成既定的招生计划,进而导致研究生生源质量严重下降。研究生是高等教育中的最高层次,生源质量的下降直接影响研究生的培养质量,最终导致学位论文质量的下降。
2.研究生指导教师问题。从研究生导师双选确定研究生指导教师开始,研究生导师就成为研究生培养及学位论文的第一责任人,然而研究生导师由于各种各样的原因,如忙于自身科研任务、自身能力不足、所带研究生数量较多等,对研究生学位论文疏于指导甚至不闻不问,没有尽到第一责任人的义务。同时,由于近年来高校不断扩大招生规模,导师队伍也随研究生数量的增长而不断扩大,许多刚入职的博士讲师未经过培训直接被聘为研究生指导教师,高水平的导师相对不足,导师队伍的平均素质有所下降。
3.研究生本人问题。我国目前有两种类型硕士研究生:学术学位研究生及专业学位研究生,两种类型研究生最明显的区别在于学术学位研究生重科研,专业学位研究生偏实践;然而无论是何种类型研究生,学位论文的撰写基础均来源于培养期间的科研或实践。部分研究生在研期间不潜心研究导师布置的课题研究或不在企业完成实践,荒废了研究生期间的资源和时间。
4.高校研究生培养机制问题。目前大多数高校关于学位论文撰写流程及答辩相关事宜已经有各自的一套规章制度,从学位论文开题、中期检查、预答辩直至最终答辩都是相应的规章制度规范,但这些规章制度只能起到对研究生及导师的引导作用,指导下一步的论文工作进程要求。从高校研究生管理机构角度来讲,也存在着管理手段落后、监管力度较差等问题。
三、全面质量管理理论在学位论文管理中的应用
硕士论文的全面质量管理思想是指:以学位论文质量为中心,与学位论文有关的全体成员(责任人与机构)为提高硕士学位论文的全面质量而进行的一系列全程监控、保障、改善过程。提高研究生学位论文质量是一项全面质量管理工程,将全面质量管理的管理方法科学的运用到研究生学位论文管理中,才能更好地提高学位论文质量水平。
将全面质量管理方法应用到学位论文管理中,对学位论文进行全员参与、全过程控制、全环节保障的全面质量管理方法,具体来说,应该做好以下三方面工作:
1.全员参与。全面质量管理思想反映在研究生教育上,即硕士学位论文的管理应该由全体成员来完成,包括研究生指导教师、研究生所在硕士点、硕士点所在学院、研究生管理机构等。
全体成员中导师的作用占很大比重,上文提到由于指导教师的原因导致硕士学位论文质量无法提高的现象普遍存在,而“导师组”或“双导师制”都是目前高校中提倡的研究生培养质量和论文质量提高的有效手段。目前,我国大部分高校实行一个研究生由一位指导教师进行指导,这样就会出现导师精力不足等问题,而导师组或双导师制则可以极好地避免这个问题,而且多位导师均可从自己认知的各个角度对研究生学位论文进行指导,导师有主有次,形式客观。
除导师外的全员,即硕士点、学院和研究生院,也应具有监督、控制、保障等职责。高校应该明确各自的工作目标,将工作目标进行分解,硕士点及二级学院教育管理人员应该明确自己的工作任务。高校实行二级管理后,应配备专职研究生管理人员,建立相应的激励机制,给予二级学院分管研究生的领导充分的自和决定权,强化责权机制。与此同时,研究生教育管理的全体成员均可以提出提高硕士学位论文质量的各种观点,全员参与优化学位论文的质量。
2.全过程监控。研究生学位质量出现问题一般表现在研究生的学位论文无法通过答辩、省里抽检学位论文不合格等,虽然学位论文的质量问题是在最终甚至毕业后才检验出来,但学位论文的质量监控保障应该具有全过程性,质量监控保障意识是从学位论文开始写作之初就应该具备的,直至研究生提交论文答辩结束。
研究生学位论文流程从选题开始,到最终答辩,中间需要进行实验搜集资料、开题、中期检查、预答辩、学位论文反抄袭检测()、学位论文评阅这一系列的环节,全过程应用全面质量管理方法。目前在我国高校研究生中,选题、开题、中期、预答辩阶段均没有引起足够重视,存在研究生采用“探索式”前行的现象,即研究生锁定一个选题抱着试试看这种不端正的态度询问导师的意见,而导师由于忙于自身的科研,没有足够精力指导研究生帮助其选题,采取“放羊式”的做法,造成研究生本身也抱着见步行步的想法,并没有论文质量意识。
全面质量管理的方法应贯穿于论文写作始终,从研究生选题开始,树立以研究生论文质量为中心的观念,夯实基础,任何一步都脚踏实地保证质量。同时研究生管理部门也要起到监控质量的作用,整合学校资源,在学位论文流程的每个重要节点制定分流淘汰的相关规章制度,防止“问题论文”在质量控制环节蒙混过关而在最终答辩或论文抽检中爆发式出现。
3.全环节保障。如果“全过程性”是从学位论文写作过程的微观角度来进行全面质量管理,那么“全环节性”就是在宏观层面上将全面质量管理应用到研究生学位论文管理中。学位论文写作是研究生在校培养中后期的一个环节,但不是独立于其他培养环节,而是密不可分的。
学位论文的全环节性,要以学位论文质量为中心,从研究生入学开始从各个渠道让研究生知晓学校硕士学位论文管理理念和管理形式,培养其撰写高水平优秀硕士论文的意识,向其展示优秀硕士学位论文对其就业及对学校产生的社会影响和社会效益。构建信息公开和程序规范的硕士学位论文管理平台,以研究生所在培养单位及研究生院网站为依托,将学位论文相关制度和行事历公开;同时编制研究生学位论文管理手册,将国家和省级学位论文管理文件及学校的相关规章制度编辑成册发放给研究生,确保研究生及导师按照手册规定制定论文写作计划。
重视研究生培养的课程修读环节和基础文献的学习环节,具备本专业(领域)课程基础知识是学位论文选题的前提,也是论文写作的基础;而通过专业领域内基本文献的学习,可以为后续专业课学习打下坚实基础并巩固其知识结构,从中学习严谨的科学研究方法。了解本学科的前沿领域,引导研究生发现问题分析问题解决问题,为后续学位论文的写作提供更多启发。
综上,研究生学位论文质量影响着研究生培养质量的高低,以硕士论文的质量为中心,采用全员参与、全过程控制、全环节保障的学位论文全面质量管理方法提高学位论文质量,进而不断提升研究生的培养质量。
参考文献:
【关键词】中职教育;数学教学;存在问题;对策研究
当前中职学生综合素质较弱,中职教育在教育体系中“失势”已成为中职教育不容忽视的问题.而在这种情况下,中职教育生源较有限,各校为了争夺生源,放低了入学“门槛”,因此入学学生的基础知识薄弱成为中职教育的普遍现象.要对这些学生进行改造,实现教育的本质,使数学教育更好地适应中职教育形势的变化,走出尴尬的困境,这就要对中职数学教学中存在的问题进行反思,并根据存在的问题提出相应对策.
一、中职数学教学中存在的问题分析
1.数学教师教学理念落后,职业教育理念认识不深刻
教师的理念定位有偏差,认为中职教育更多的是重视学生专业知识与技能的培养,而数学只是作为一种基础课,对于学生职业教育的培养无关紧要,理念上的认识偏差就直接影响到了教学行为的积极性.在这样的教学思想指导下,往往不重视学科教育,在教学中会只重视理论知识的传授,照本宣科地进行教学,而没有将数学教学与实际生活相结合,忽视教学情境的创设.在教学过程中只重视讲,而忽视学生对知识的思考,不能有效激发学生的学习兴趣,反而使学生对原本枯燥的数学知识更加感到乏味.
2.中职学生数学基础知识薄弱,学习积极性有待加强
近年来随着我国教育体制的改革,以及家庭教育观念发生变化,中职教育日渐失去往日的优势,生源日渐短缺,而在这种情况下,中职学校为了竞争生源,往往采取放低招生“门槛”的方法吸引学生.大部分学生家长都意识到知识的重要性,因此不希望自己的孩子将来成为“蓝领”中的一员,因此进入中职学校的学生大多是基础知识薄弱、学习方法欠佳、缺乏自信心的学生,这些都直接导致了中职学生整体素质偏低.而由于数学学科自身特点,加之教学方法存在不足等,均导致学生数学学习积极性不高.
3.数学教学缺乏实用性,教学方法有待改善
在实际的教学中没有注重数学教学的实用性,使数学理论知识应用于现实生活中.而对于多数中职学生,由于基础知识薄弱,教师没有根据学生的实际接受水平来深入浅出地讲解教学内容,使多数学生听课犹如听天书一般,因此数学教学自然无法取得良好的教学效果.数学作为一种基础性学科,是学好专业课的前提条件.在教学内容的选择上没有针对性,没有根据学生所学专业的不同,从实际出发,灵活地选择内容进行针对性教学.教学内容的重点仅仅只是放在部分基础知识的传授与基本技能的训练上,没有考虑到学生的实际情况.没有重视知识的连贯性,而数学知识实用性的缺失也无法激起学生的学习欲望.
二、提高中职数学教学的对策研究
1.教师要改变传统理念,积极引导学生正确对待中职教育
教师只有正确对待数学在中职教育的定位,才能优化教学方法,根据学生的实际情况制定相应的教学策略.要引导学生正确对待中职教育,社会发展不仅需要高素质人才,更需要大量的高素质劳动者,这就极大地鼓舞了中职教育,因此要使学生积极正视中职教育的社会地位.社会的人才结构有其层次性,要引导学生找准自己的定位,在适合自己的岗位上发挥自己的聪明才智.激发学生的信心和学习的热情.在数学教学中,教师要注意渗透这些积极思想.
2.创设教学情境,激发学生学习兴趣
中职学生大部分基础知识较差,对数学的学习热情不高.这个时候就要寻求激发学生学习兴趣的方法,根据学生的心理特征以及兴趣爱好,向学生列举学习数学的重要性,以及在现实生活中数学的实用实例,端正学生心态,消除对数学的恐惧与厌倦心理,使学生乐学,最终实现对数学知识的熟练应用.可以根据某一课讲述的内容,结合当下专业课中所要用到的数学知识,激发学生的学习热情,不仅完成了数学教学任务,而且在与专业课知识相结合的情况下,使学生深化对数学知识的理解.
3.改革教学方法,突出课程的实用性
教师作为执行教学行为的主体,其知识水平、理念及态度等都将影响到教学质量,因此教师要及时更新理念,优化教学方法,提高自身教学实践能力.要由传统的封闭式教学转向开放式教学,在教学过程中多注入启发式教学理念,组织学生参加一定的课外实践活动,让学生在参与中获取知识并得到实际锻炼,从而使课堂中所学的知识得到验证,同时也培养了学生运用科学知识来参与实践的能力.在教学内容的选择上,也要与学生所学专业挂钩,与专业基础课的要求相适应.制订教学计划时,要与专业课教师沟通,了解在专业基础课程中所需要的数学基础知识,从而对这部分内容进行重点讲解,这样不仅使学生掌握了数学知识,也减轻了学生在专业课学习过程中的压力.在不影响整个数学知识系统的情况下,最大限度地体现数学知识的实用性.
中职数学教育中存在的问题比较普遍,只要我们在思想上予以高度重视,并根据存在的问题采取积极的应对措施,就一定能使中职数学教学水平提高到一个新的台阶.
【参考文献】
普赖斯(Derek de Solla Price)(1922-1983)被誉为“科学计量学之父”,其主要学术成就体现在如下几方面:发现了科学发展的指数规律;指出了论文间引证与被引证关系;创立了反映文献老化程度的普赖斯指数;提出了反映科学家生产率的普赖斯定律等。贝尔纳(J.D.Bernal)的《科学的社会功能》不仅为科学学,而且为科学计量学提供了基本的研究范式。受贝尔纳科学学思想的影响,作为科学史家,普赖斯开始系统运用定量方法对科学、技术、医学等进行历史、哲学、社会学、心理学、经济学、政治学、运筹学等等研究的先驱者之一。《巴比伦以来的科学》和《小科学,大科学》两部著作成为他的科学计量学成果的集大成之作,也是科学计量学的奠基之作。尤其是情报学家加菲尔德(Eugene Garfield)博士创立科学引文索引(SCI)后,普赖斯巧妙地借助这一工具,赋予科学计量学研究以新的生命活力。1965年,他借助SCI在《科学》杂志上发表了科学计量学重要论文《科学论文的网络结构》,为人们利用大规模数据绘制知识图谱做出了开拓性探索。在这篇论文中第一次界定了“研究前沿(Research front)”和“知识基础(Intellecture base)的内涵,使得利用科学引文数据探测和识别学科知识前沿和研究热点成为可能。正是在普赖斯科学计量学范式的强大影响下,使科学计量学研究在全世界得到快速发展,并形成了多个国际科学计量学研究重镇,如美国费城的德雷克赛尔大学、荷兰的莱顿大学、英国的苏塞克斯大学等。科学计量学理论、指标和方法的研究成果,也为宏观科技政策和各层次的科技管理提供重要的工具和手段。
普赖斯奖是为纪念普赖斯的学术成就于1984年设立的国际科学计量学和信息计量学界最高奖。该奖项每两年颁发一次,截至2011年,共有25位科学计量学家获此殊荣。这些学者都是在科学计量学领域做出杰出贡献的人,他们为推进科学计量学从“软科学”走向“硬科学”做出了卓越成就,为科学计量学的繁荣和发展增添了浓墨重彩的一笔。
2011年在南非举办的国际科学计量学和信息计量学大会17个主要会议主题中提出了“学术生涯(Academic careers)”这一值得关注的研究领域。这不仅是科学计量学学科自我总结和反思的需要,也是科学计量学逐步走向成熟的一个重要标志。系统梳理普赖斯奖获得者的学术思想和成就,对我国学者把握科学计量学发展的特点和发展方向不失为一个独特视角。基于此,我们考虑从科学计量学角度对这些获奖者的学术生涯逐一进行梳理,以便能从中挖掘若干有益的信息,并为丰富科学计量学的研究领域展现新的研究视角,为科学计量学史研究提供较为详实的信息。
2012年是普赖斯诞辰90周年,为纪念这位在科学史和科学的定量研究方面做出巨大贡献的学者,我们特编发四篇梳理普赖斯奖获得者学术成就的文章,以深切缅怀普赖斯的卓越思想。
关键词:心理计量学;试题反应理论;测验与评量;测验与统计
中图分类号:B841.2 文献标识码:A 文章编号:1003-5184(2012)05-0466-07
1 序言
笔者(本文第一位作者)于公元1991年6月回到台湾,在政治大学教育学系服务。旋即于《测验与辅导》与《研习信息》(1991a,1991b)期刊上,投稿发表留学美国的简短学习心得《测验理论的发展趋势》,以介绍当代心理计量学(psychometrics)在欧美国家的发展状况。后来,由于受到重视,复应邀在训育委员会委托政治大学心理学研究所承办的“心理测验之学术及实务研讨会”学术会议上,正式进行详细的论文宣读(1992)。
笔者在此,再次扼要地重点回顾该次大规模文献评阅的结果与心得如下,以作为本文的引言:(1)测验理论派别:两大一小。测验理论分古典测验理论(classical test theory,CTT)与试题反应理论(item response theory,IRT)等两大派学说理论,以及一派较小规模的推论力理论(generalizability theory,GT)。前者的使用人口较广,理论较被熟悉,相关研究文献较多;而后者的接触人口较窄,理论较为陌生,相关研究文献较少。
(2)代表人物及其著作。Gulliksen(1950,1987)的专著是古典测验理论之始;Cronbach,Gleser,Nanda和Rajaratnam(1972)的专著是推论力理论之起源;而Lord(1980)的专著则是试题反应理论的滥觞。其实,上述各家学派理论的发展,并不是断然没有交集,至今,他们仍然是并存的。
(3)两本重量级的经典作品。一为美国加州 Annual Review 公司所出版的《心理学年度评论》(Annual Review of Psychology)年刊,另一为美国心理学学会(American Psychological Association,APA)所出版的《教育测量》(Educational Measurement)。前者,约每隔四至五年,即针对过去几年间有关心理计量学领域的某个研究主题文献,进行整理和评阅,并提出该主题的研究发展现况与趋势之说明。后者,乃有心理计量学食谱(cook book)或百科全书(encyclopedia)之称,约每隔二十年,即针对过去二十年来整个心理计量学的重要领域研究文献,进行整理和评阅,并提出发展趋势的回顾与展望;第一版于1951年发行,第二版于1971年发行,笔者毕业(1991)时,则刚出版第三版,由Robert L.Linn教授所主编(Linn,1989),而最近一版是第四版,则由Robert L.Brennan教授所主编(Brennan,2006)。
(4)两个发展趋势。在该次学术会议上,笔者归纳文献后,提出测验理论有两大发展趋势的看法,那就是:理论的发展愈趋向数学化,理论的应用愈趋向计算机化。
(5)三个发展方向的未来建议。笔者亦于当时提出心理计量学未来可朝下列三个方向发展下去:1)建立多向度试题反应模式(即multidimensional item response theory,MIRT)及其参数估计所需的计算机程序;2)计算机化适性测验(computerized adaptive testing,CAT);3)结合认知科学的研究,往认知诊断测验或评量(cognitively diagnostic assessment,CDA)领域发展。而此三个领域,正是当前(从公元1991年~至今)心理计量学领域中,正发展得如火如荼的研究议题与方向。
上述重点评论,后来均被收录引用在笔者的专书著作《教育测验与评量:成就测验与教学评量》(1997,2002,2011)及《试题反应理论(IRT)及其应用》(2009)里。笔者根据有关测验与评量发展史的文献评阅结果,归纳提出近百年来有关测验与评量的发展趋势如下:
(1)能力或成就的评量观点,已由传统重视单一心智能力或成就评量的纸笔测验,逐渐走向强调多元心智能力或成就评量重要性的实作评量;
(2)命题、测验编制,及施测方式,则由原本盛行的人工化复本测验,逐渐走向题库式的计算机化适性测验;
(3)测验结果的解释与做成决策,则由原先强调常模参照测验的用途,逐渐趋向重视效标参照测验的应用;
(4)测验理论的发展与应用,亦愈发趋向重视数学化和计算机化的结合。
本文的目的,即在序文的背景下,评阅近二十年来(从公元1991年笔者回台至今),心理计量学文献出版数量在台湾测验学界发展情况的回顾与展望,以作为海峡两岸学术交流的信息桥梁。
2 相关文献资料的检索
为了进一步探索这二十年来,心理计量学的研究在台湾的发展情况,笔者检索台湾现行的两大研究文献信息检索系统:一为台湾期刊论文索引系统,另一为台湾硕博士论文索引系统。前者为国家科学委员会所出资建置,后来统一委由国家图书馆负责管理,后者则为国家图书馆所出资建置并负责管理。从这两个信息索引系统中,最可以窥见这二十年心理计量学领域的学术研究在台湾的发展情形。
由于每位作者所使用的关键词未必一致,甚至对论文主题的归类,也有译名不一、类别不一、甚至到了众说纷纭的程度。因此,笔者依据书目索引的表达方式,将心理计量学列为待检索的关键词(key words),并将其相关的译名及可能归属的类别名称,如:测验与评量、教育统计、试题反应理论(IRT)、测验与统计等,凡出现在所检索的论文标题、关键词,及摘要等范围里,通通列为检索的对象。兹分别针对上述两个信息索引系统进行检索,并将检索结果呈现在表1和表2以及图1到图4里,笔者再于后续文章里针对此检索结果进行说明。
2.2011年度篇数偏少,可能是尚未完整上传建档所致。
3.检索日期:2012.8.12.
2.国家图书馆于公元2010年,将中华民国期刊论文索引系统改版,分为台湾期刊论文索引系统和HyRead台湾期刊论文数据库。
3.检索日期:2012.8.17.
从表1和表2所示可知,心理计量学在台湾学术发展的情况,确实有逐年成长的趋势。然而,相对于二十年来,整体研究人口的成长趋势来看,心理计量学还是属于相当冷门的学科。所谓的冷门,即是指这领域的研究人口,相对于整体研究人口的成长数量来看,比例是相对偏低的。由于可能撰写有关心理计量学领域的学术论文者,多半是毕业自教育学门或心理学门的人才,表3所示即为二十年来相关学门毕业的硕博士研究人口的成长情形。若以表1和表2的数据相较于表3来看,可知学位论文或期刊论文的产出比例(以每年度的硕博士学位论文数或期刊论文数,除以每年度毕业的硕博士人口数之比例)是相当低的,因此说,心理计量学在台湾算是一门冷门的学科。
2.心理学门包含在社会及行为科学学门里计算,没有单独列成一类。
3 对过去的回顾
中国测验学会算是台湾历史悠久的学术团体之一,所出版的学术性刊物《测验学刊》,至今(2012年)已历时五十九年,可说是历史久远的学术性刊物之一。该刊物算是目前台湾心理计量学领域论文的主要出版园地,但由于论文归属的分歧,心理计量学一词在台湾并没有统一的译名与界定范围,因此本文所检索的关键词就包含了其它可能归属的名称,如:测验与评量、教育统计、试题反应理论(IRT)、测验与统计等。所以,本文采用较为广泛的检索方式,凡出现在所检索论文的标题、关键词,及摘要等范围里的论文篇数,统统列为检索的对象。虽然这种检索方式无法做到十分精确,但长远看来,却也反映出长期的发展趋势。
一门学术领域的发展,若能配合政府施政政策的推动,将能如火如荼地进展与发展茁壮;以美国为例,当布什政府推动“带好每一位孩子法案”(No Child Left Behind Act,NCLB法案)时,即带动心理计量学的学术蓬勃发展,并且造成这方面人才供不应求的情形,即为明显的一例。回顾这二十年来,台湾有一项考试方式的变革,与心理计量学的发展最具有息息相关,那就是台湾教育部在2001年推动国民中学基本学力测验(简称国中基测)的升学考试变革政策,但该政策的推动结果,却没有获得如美国推动NCLB法案那般促进心理计量学发展的效果。
国中基测是台湾近二十年来,为改进高中升学考试方式所建置发展的大型测验题库(余民宁,2004)。原先即以效标参照测验(criterion-reference testing,CRT)观点设立,并以Rasch模式作为建置与计分的理论基础,初期建立各考科为1分至60分的量尺分数,现在已改为1分至80分的量尺分数。这种考试方式的变革,虽然启用了新式的测验理论(即IRT中的Rasch模式),但却缺乏全面引用欧美的专业测验制度与配套措施(如:试题回收,不再公告题型与答案等),而仅将传统100分制的考试得分,透过beta binominal transformation计分公式变成60分制或80分制的特定量尺分数,而不是采用国际上常用的量尺分数(如TIMSS或PISA等大型数据库的学业成就评比所使用者——以250分为平均数,标准差为50分的量尺分数),结果一来徒增民众认知与习惯上的困扰,二来却没有达到当初教育改革的目标之一:降低学生的考试压力,却反而增加升学的考试压力。因此,在下一轮的教育革新中,教育部拟于2014年起推动十二年国民基本教育时,即实行免试升学的方式,届时,推动十余年的国民中学基本学力测验将转型成国中毕业会考(各学科的学习成就仅分成三等级,不再使用量尺分数),不再是国中毕业生升学高中或高职的考试依据之一。国中基测的升学考试方式,届时将再由现行的常模参照测验(norm-reference testing,NRT)做法,转变回到原先预设的效标参照测验方式。
笔者省思评估此一考试方式的变革,无法像美国推动NCLB法案一样,一举推动让心理计量学成为台湾测验与评量中的主流学说,其原因有下列几点:
(1)台湾民众被传统的考试习惯所左右,认知观念已经积重难改。例如,传统的考试习惯是:考试完毕即公布试题和答案,且采用百分制计分,答对几题可以得到几分是大众可以自己计算得知的事。然而,心理计量学是一门很专业的学问,尤其是IRT的理论和应用更是如此,像国中基测如此的新式测验方式,其考题的研发系将定锚试题(anchor items)透过严谨的等化(equating)与衔接(linking)设计程序,将不同校准过(calibrated)试题参数的考题,建立在一个相同量尺上的测验题库后,再抽题组卷成当年度使用的考试题目;如此严谨、复杂、专业的作业程序,已远远超过传统考试制度的做法。但考试传统上考试完毕即公布试题和答案的做法,却正好危害到该题库的安全性与专业性,造成它在题库试题逐渐用罄之后,已成为与传统考试没有两样的测验方式。
(2)补习班及报章杂志的宣传广告、家长们对子女升学的看法,与明星学校的光环等价值观的扭曲,反映出民众认为考试不是一件专业工作的认知,这才是造成心理计量学发展的真正瓶颈所在。由于学校考试频繁,补习班、学校、出版社所出版的测验卷价格低廉,测验试题多半是剪辑自坊间的考试参考书、过去的考古题,或教师不用心命题的题目,且多半都是依据古典测验理论且采用传统百分制计分方式的考试,这些举动造成民众对心理计量学专业形象的误解,间接认为考试不是一件专业工作,不需要像IRT那么复杂的理论依据与专业做法,也可以把考试工作办好。所以,愈发强化民众对考试传统习惯作法的认知,造成新兴的测验理论(如IRT)甚难在台湾的测验与评量领域中生根与发展。
(3)考试方式变革的目的与手段不一。当初国中基测的设计目的,是在评估教育部推动九年一贯课程教育改革是否有达成既定的目标成效,因此是立基于效标参照测验观点所建置发展的,而不是在作为升学考试之用;因此,才会引进严谨的Rasch理论模式,作为建置题库、测验,与计分的依据,并以此作为教学诊断、补救教学,与改进课程纲要参考之用。然而,因为推动此方案的部长过于鞠躬尽瘁而死于任内,后继的部长不明原委,乃将它拿来作为改良式的升学考试之用,实施十余年下来,结果造成学生的考试压力不降反升的现象,台湾民众对此政策措施的批评声浪不断。
除了国中基测是政策性推动的考试变革之外,二十年来,台湾的高等教育虽然也蓬勃发展,攻读心理计量学领域的人口也有缓步增加的趋势,但专责考试业务的机构(如:大学入学考试中心、四技二专入学考试中心、考选部举行的各种国家考试等)多半仍以古典测验理论作为主流的传统考试方式,致使专攻当代测验理论(如:IRT)的人才就业状况不胜理想,且民间企业对此领域人才的需求量又不大,这也都是间接造就此领域成为冷门科学的原因之一。
由于上述几点原因可知,心理计量学在台湾的发展,已然错过许多可以成长茁壮的机会。现行考试方式在台湾的推行,可说是根深蒂固很久了,心理计量学学者在短短二十年间的努力,即想引进与推行西方新式的考试方式,可能不是那么容易做到,这还需要时间去倡导与教育民众,以及耐心的等待才行。
4 对未来的展望—代结论
在全球华人的地区,甚至受儒家文化思想影响下的亚太地区(包括:中国大陆、韩国、日本、台湾、香港、新加坡、东南亚及美加的华侨地区等),华人家长都把“接受教育”当作是促进子女往上层社会流动的一大关键所在。重视教育,是全球华人家长的共识。而如何评估子女的学习成就好坏,相较而言,当然只有诉诸于较为客观、公平、公正的考试制度。因此,全球绝大多数华人子弟的成长岁月,从小到大即是在读书与考试中度过的。华人对考试制度和精神的认知和熟识程度,俨然已融入成为中华文化的一部分,甚至已融入每一位华人的血液里,DNA里,想要一夕变革,谈何容易。
然而,心理计量学在欧美西方国家兴起,也不过才百余年的事。西方人藉由科学探究的精神,百余年来,已将考试方式变成是一门科学,虽然心理计量学对西方人来说也是一门冷门科学,但近二十年来,仍朝着笔者所说的数学化与计算机化趋势继续发展下去,这不得不令人佩服西方人探究学问的精神与做法!凡是主修心理计量学的人都知道,一项专业化的考试,从组成考试委员会,邀请专家命题,修审试题,分析试题,等化与衔接,题库建置,到最后的组卷施测等过程,都是相当严谨、繁复、专业化的程序,也都是在一群专家代表(含:学科专家、测验专家、资讯工程专家、行政官员、一般教师等)负责规划、监督,与执行之下,才能顺利完成的作业。但是,华人(甚或是亚太地区的人民)的想法可不是这样,他们对考试的传统看法,已经太过根深蒂固了,想要他们尝试不同的新方式做法,恐怕还需要一段时间才能适应、调整得过来。
兹举一例如下,即可说明此现象。过度重视考试与要求考试完毕即公布试题和答案的看法和做法。民众呼吁说“人民有知的权利。不公布考题的话,民众怎知考题的对错与好坏?”,这句话听起来似乎是没有错、很有道理,让考试主办单位很难拒绝考生这项要求。但这样的看法和做法,就不容易使考试成为一项专业工作,当代的新兴测验理论(如:IRT)便无法派上用场,考试就仍停留在原始的传统做法上。殊不知民众的这种呼吁,其实是以邻(愈晚参加考试的学生)为壑——也是造成学生考试压力不减反增现象的来源之一。历届考题都公布了,愈晚参加考试的学生所需准备的考古试题就愈多,花费在准备考试的经费、时间、压力就愈大,未来的考题为避免与考古题重复,便会愈出愈叼钻、愈偏离考试与评量的原本目标——最后倒霉受害的,还是愈晚参加考试的学生莫属。结果,读书与考试即消磨掉大半年轻学子的学习热忱与探究学问的精神,难怪国际数学与科学教育成就趋势调查(Trends in International Mathematics and Science Study,TIMSS)的国际评比结果显示,参赛的亚太地区代表(包括:韩国、日本、香港、台湾、和新加坡,除新加坡外)学生数理成绩表现优异(包办国际评比成绩的前五名),但却相对缺乏对学习数理科学的兴趣与热忱(Mullis,Martin,Gonzales,& Chrostowski,2004;余民宁,韩佩华,2009)。这种现象都是由于过度重视考试的结果,学校的考试太过频繁,且每次考试之后都公布答案和试题,考题的命题已然愈趋叼钻,考试已偏离评量的原始目的,造成学生应付考试的能力很强,但却无法体会学习与考试(评量)的目的为何,更不用说能否体会出学习的乐趣与培养出探究学问的精神与热忱为何,这些现象都将不利于未来人才的培育。
考试制度是中华文化的千年传统,说要变革,以全盘引用新式的测验理论观点,谈何容易。因此,展望全球华人的地区,想要把考试方式变成像西方国家一样的专业测验方式,可能还需要透过长期的教育和倡导,才能教化民众未来能够接受更专业、更科学、更效率化考试方式的变革,而这才是心理计量学未来能在华人地区蓬勃发展的契机所在。
致谢:本文的撰稿,笔者拟感谢行政院国家科学委员会101年度补助大专校院奖励特殊优秀人才之奖励经费的支持(补助文号:国科会101年7月30日台会综二字第1010050707号函)。参考文献
教育部统计处.(2012).2012年08月01日,取自http://edu.tw/statistics/content.aspx?site_content_sn=8956.
余民宁.(1991a).测验理论的发展趋势.测验与辅导,109,2186-2188.
余民宁.(1991b).试题反应理论的介绍(一)——测验理论的发展趋势.研习信息,8(6),13-18.余民宁.(1992).测验理论的发展趋势.国立政治大学心理学系研究所承办“心理测验之学术及实务研讨会”的学术会议论文宣读.台北:国立政治大学.
余民宁.(1997).教育测验与评量:成就测验与教学评量.台北:心理.
余民宁.(2002).教育测验与评量:成就测验与教学评量(第二版).台北:心理.
余民宁.(2004).从调查数据回顾基本学力测验的实施.中国测验学会主办“2004年年会暨教育与心理测验学术研讨会”木铎奖得主专题演讲及论文宣读.
余民宁.(2009).试题反应理论(IRT)及其应用.台北:心理.
余民宁,韩佩华.(2009).教学方式对数学学习兴趣与数学成就之影响:以TIMSS 2003台湾资料为例.测验学刊,56(1),19-48.
余民宁.(2011).教育测验与评量:成就测验与教学评量(第三版).台北:心理.
Brennan,R.L.(2006).Educational measurement(4th ed.).Washington,DC:American Council on Education.
Cronbach,L.J.,Gleser,G.C.,Nanda,H.,& Rajaratnam,N.(1972).The dependability of behavioral measures:Theory of generalizability for scores and profiles.New York:John Wiley & Sons.
Gulliksen,H.(1987).Theory of mental test.Hillsdale,NJ:Lawrence Erlbaum Associates.(Originally published in 1950 by New York:John Wiley & Sons)
Linn,R.L.(1989).Educational measurement(3rd ed.).New York:Macmillan.
Lord,F.M.(1980).Applications of item response theory to practical testing problems.Hillsdale,NJ:Lawrence Erlbaum Associates.
Mullis,I.V.S.,Martin,M.O.,Gonzales,E.J.,& Chrostowski,S.J.(2004).TIMSS 2003 international mathematics report:Findings from IEA’s Trends in International Mathematics and Science Study at the fourth and eight grades.Chestnut Hill,MA:Boston College.
Review and Expectation of Psychometrics Literatures in Taiwan from 1911 to 2011
Yu Min-Ning Chen Po-Lin Syu Jia-Jia Chao Pei-Ching
(Department of Education,National Chengchi University,Taiwan 11605)