前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇参加测试情况报告范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
一、项目实施方案概述
软件产品,特别是行业解决方案软件产品不同于一般的商品,用户购买软件产品之后,不能立即进行使用,需要软件公司的技术人员在软件技术、软件功能、软件操作等方面进行系统调试、软件功能实现、人员培训、软件上线使用、后期维护等一系列的工作,我们将这一系列的工作称为软件项目实施。大量的软件公司项目实施案例证明,软件项目是否成功、用户的软件使用情况是否顺利、是否提高了用户的工作效率和管理水平,不仅取决于软件产品本身的质量,软件项目实施的质量效果也对后期用户应用的情况起到非常重要的影响。项目实施规范主要包括项目启动阶段、需求调研确认阶段、软件功能实现确认阶段、数据标准化初装阶段、系统培训阶段、系统安装测试及试运行阶段、总体验收阶段、系统交接阶段等八个阶段工作内容,每个阶段下面有不同的工作事项,各个阶段之间都是承上启下关系,上一阶段的顺利完成是保证下一阶段的工作开展的基础。下面将按照每个项目实施阶段分别介绍。
二、项目实施方案介绍
(一)项目启动阶段
此阶段处于整个项目实施工作的最前期,由成立项目组、前期调研、编制总体项目计划、启动会四个阶段组成。
此阶段主任务:
公司:在合同签定后,指定项目经理,成立项目组,授权项目组织完成项目目标。
公司项目组:进行前期项目调研,与用户共同成立项目实施组织,编制《总体项目计划》,召开项目启动会。
商务经理:配合公司项目组,将积累的项目和用户信息转交给项目组。将项目组正式介绍给用户,配合项目组建立与用户的联系。
用户:成立项目实施组织,配合前期调研和召开启动会,签署《总体项目计划》和《项目实施协议》。
1、成立项目组
部门经理接到实施申请后,任命项目经理,指定项目目标,由部门经理及项目经理一起指定项目组成员及成员任务,并报总经理签署《项目任务书》。
2、前期调研
项目经理及项目组成员,在商务人员配合下,建立与用户的联系,对合同、用户进行调研。填写《用户及合同信息表》。在项目商务谈判中,商务经理积累了大量的信息,项目组首先应收集商务和合同信息,并与商务经理一起识别那些个体和组织是项目的干系人,确定他们的需求和期望,如何满足和影响这些需求、期望以确保项目能够成功。
3、编制《项目总体计划》
《项目总体计划》是一个文件或文件的集合,随着项目信息不断丰富和变化,会被不断变更,主要介绍项目目标、主要项目阶段、里程碑、可交付成果。通常包括以下几方面内容:
项目描述,项目目标、主要项目阶段、里程碑、可交付成果。所计划的职责分配(包括用户的);
沟通管理计划,确定项目干系人对信息和沟通的需要:即什么人何时需要什么信息以及通过什么方式将信息提供给他们。质量管理计划,确定适合于项目的质量标准和如何满足其要求。如果有必要,可以包括上述每一个计划,详细程度根据每个具体项目的要求而定。未解决事宜和未定的决策。
4、启动会
项目组与用户共同召开的宣布项目实施正式开始的会议。
会程安排如下:
共同组建项目实施组织,实施组织的权利和职责;双方签署《项目实施协议》。
项目组介绍《项目总体计划》和《项目实施协议》,包括以下内容:
项目目标、主要项目阶段、里程碑、可交付成果。所计划的职责分配(包括用户的);
项目实施中项目管理的必要性和如何进行项目管理,项目的质量如何控制;
项目实施中用户的参与和领导的支持的重要作用;
阶段验收、技术交接和项目结束后如何对用户提供后续服务。
(二)需求调研确认阶段
此阶段的主要工作是软件公司的项目实施人员向用户调查用户对系统的需求,包括管理流程调研、功能需求调研、报表要求调研、查询需求调研等,实施人员调研完成后,会编写《需求调研分析手册》,并交付用户进行确认,待用户对《需求调研分析手册》上所提到的需求确认完毕后,项目实施人员将以此为依据进行软件功能的实现。如果用户又提出新的需求,实施人员将分析需求的难度及对整个系统的影响程度来确定是否给予实现。需求调研阶段具体包括如下内容:
1、进行需求调研准备
2、编制《需求调研计划》
3、内部评审是否通过《需求调研计划》,项目组、部门经理、商务等人员根据合同要求和项目实际情况对《需求调研计划》草稿进行评审,如评审通过,则在稍后的时间内签署,如评审不通过则重新修改。
4、用户是否签署《需求调研计划》,如用户签署《需求调研计划》,则作为以后需求调研工作的指南。否则重新修改。
5、《需求调研计划》是否有变更,如果计划存在变更,则执行变更控制流程,否则按计划进行后续工作。
6、编写及发出《需求调研通知》,项目组编写《需求调研通知》,确定进行需求调研的相关事宜,发给用户,为顺利完成需求调研工作做准备
7、需求调研,项目组以《需求调研手册》为依据,从业务流程、单据使用、打印格式、报表查询几个方面展开深入和全面的调研,并搜集用户的个性化需求。
8、需求调研分析根据调研的结果,项目组和公司其他技术部门将进一步进行分析,确定合理、可行的需求,将分析结果形成《需求分析报告》草稿。
9、内部评审是否通过《需求分析报告》。项目组、部门经理、公司其他技术部门的人员对《需求分析报告》草稿进行评审,如评审通过,则在稍后由用户签署,如评审不通过则重新修改,直至内部评审通过。
10、编写及发出《需求分析报告确认通知》。项目组编写《需求分析报告确认通知》,发给用户,确定进行需求确认的相关事宜,告之相关部门及人员安排好工作,准时参与需求确认工作,为顺利完成需求确认工作做准备。
11、用户是否确认《需求分析报告》。如果用户确认,并签署了《需求分析报告》,则需求调研阶段工作结束,进行后续的软件功能实现的工作;如没有确认,则进一步进行调研、分析,直至用户最终确认并签署《需求分析报告》。双方签署了《需求分析报告》,需求调研工作结束之后,如果用户提出新的需求或是变更已有的需求,则执行需求新增及变更流程。
(三)软件功能实现确认阶段
此阶段的主要工作是项目实施人员根据需求调研阶段确认的《需求调研分析手册》中的用户需求内容进行具体软件功能的实现工作。在软件功能实现的过程中,项目实施人员将记录软件实现的详细过程。便于公司售后服务之用。每一个实施技术人员必须严格按照要求记录、存档。按照调研要求的所有功能实现完毕后,项目实施人员将编制《软件功能确认表》,将定制好软件功能待用户确认,用户根据《软件功能确认表》上的功能逐一确定软件功能是否达到要求,对不满足要求的功能,项目实施人员将会记录下来并进行功能修改,直到满足用于要求。
(四)数据标准化初装阶段
此阶段的主要工作是项目实施人员指导用户进行系统标准化资料的准备工作,并对用户进行初装资料的软件操作培训,以便用户能够及时的将标准资料录入系统,初装完成后,项目实施人员会对资料初装的情况进行核查,为以后具体业务功能的开展做好基础。
(五)系统培训阶段
系统培训阶段工作是整个项目实施工作中比较重要的工作,用户对软件的操作功能是否熟练将直接影响到后面的软件应用效果,所以软件公司和用户双方要对此阶段的工作给予足够的重视。要充分认识培训的重要性和艰巨性。在项目实施之前对用户的相关人员进行系统和规范的产品培训是非常必要的,达到让用户了解软件产品,最终自己能够解决使用中的具体的问题。
此阶段的培训工作中将用户参加产品培训的人员划分为三个层次:决策层、技术层、操作层,对不同层次的用户参加产品培训人员的培训内容分别是:
决策层:领导在实施中的作用与重要性、决策查询。
维护层:系统维护知识、操作方法。
操作层:操作方法。
具体的培训工作流程为:
1、调研培训信息:在培训开始前3天由用户实施负责人,将参加培训的部门和人员情况填入《受训部门汇总表》、《受训人员情况一览表》。
2、编制培训计划:结合调研结果,与用户实施负责人商议具体培训内容、时间,场地,人员等。项目组编制《培训计划》。
3、签署培训计划:用户签署《培训计划》,进一步确认培训安排。
4、发培训通知:培训开始前2天,按照签署的《培训计划》,将培训内容、时间,场地,人员等信息通知用户实施负责人。
5、搭建培训环境:公司项目组在培训开始前,将培训环境搭建及检查妥当,将培训提纲及培训手册准备好。
6、组织培训:公司项目组培训负责人与用户实施负责人组织相关人员参加培训,按培训制度严格考核。由用户将考勤情况填入《培训人员签到表》。
7、培训考核:公司项目组培训负责人与用户实施负责人组织受训人员参加上机及理论考试。
8、培训总结:公司项目组培训负责人与用户实施负责人一起将出勤情况及考核情况做出总结,填入《培训及考核统计表》,及时向相关负责人
汇报。
(六)系统安装测试及试运行阶段
此阶段的主要工作是在用户真实环境下,对用户网络及硬件设备进行测试,对软件系统进行容量、性能压力等测试测试及试运行的目的在于确保系统各项功能均能正常使用,并且符合用户签署的《需求分析报告》中描述的需求,同时把尽可能多的潜在问题在正式运行之前发现并改正;同时目的还在于在正式运行前用户的有关人员能进一步提高操作水平,掌握操作规范。此阶段的主要工作内容为:
1、 编制计划:与用户实施负责人商议具体测试及试运行时间,地点,人员等安排,项目组编制《测试及试运行计划》。
2、签署计划:用户签署《测试及试运行计划》,进一步确认测试及试运行安排。
3、发测试及试运行通知:在测试及试运行开始前2天,按照签署的《测试及试运行计划》,将时间,地点,人员等信息通知用户实施负责人。
4、搭建环境及数据准备:在试运行开始前搭建好软件环境、硬件环境、网络环境、调通线路;检查软件、硬件、网络、线路等各个环节是否有问题;
5、组织测试及试运行:用户相关各级领导给予全面配合,组织相关人员进行测试及试运行。
6、测试及试运行总结:测试及试运行完成,总结试运行中设备、软件的运行情况,总结试运行中业务流程和操作环节的情况,以书面总结形式将测试及试运行结果通知相关负责人。
公司项目组负责担当指挥,检查用户人员组织情况并给予指导,跟踪检查如下情况:
跟踪单据流转状况。
跟踪新资料登录环节。
观察业务流程执行状况。
观察操作人员操作表现。
观察系统运行速度及异常表现。
观察关键数据的正确性。
及时纠正错误操作、对于新发生的问题及时与相关人员沟通,确定解决办法。
(七)总体验收阶段。
此阶段是对项目总体的完成情况进行验收。验收分阶段进行,在每一项目阶段结束时,用户对这一阶段的可交付成果进行验收,在测试及试运行结束后,对系统进行总体验收。
需要验收的可交付成果:
主要项目阶段
阶段组成
主要里程碑
可交付成果
关键词:CACE测试 高等职业英语测试统计分析系统 设计 实现
中图分类号:G642 文献标识码:A 文章编号:1007-3973(2013)012-357-03
1 引言
广东省在充分顺应语言测试领域的新趋势果断采用先进科学测试手段的基础上率先推行计算机化高等职业英语测试(曾用强,2012),以期客观全面反映教改成效并有效监测改革后教学理念方法等的功效,起到良好的测试反拨效应(甘利,2012)。本研究的依据是英语语言测试理论(亓鲁霞,2011)。语言测试的实践是个系统工程。其中在考试总结阶段要做的,就是要从考试得出结果反馈。这里包括三步工作(李筱菊,2001):评定分数、统计分析分数、解释分数。分数包括等级、名次或考试结果的其他表示形式。这三步工作,第一步是得出分数,即从受试者的答案行为中得出分数;第二步是计算分数,即把分数与分数之间(也就是受试者与受试者之间、受试群与受试群之间)、考试各部分之间等等关系整理清楚;第三步是解释分数,把分数所表征的是什么解释清楚,即说明分数与要测试的能力之间、所测试的各种能力之间、所测出的能力与所期望的能力之间等等的关系。CACE测试后需全面系统科学地得出精密的数据统计分析结果。但现有的全国全省大型考试中,考试机构在试后仅提供考试成绩或授予考试证书,没有数据统计分析结果展示平台。故本研究开发网络版软件“高等职业英语测试统计分析系统”以自动生成所有统计分析结果。本软件能提供所有考生听力、阅读、写作等职业能力的量化分析。教学管理者可宏观监控教学;教师和同行可相互切磋,有的放矢;受试者可获得关于自己学习情况的个性化信息反馈。
2 高等职业英语测试统计分析系统的设计实现
(1)笔者设计的“高等职业英语测试统计分析系统”的软件架构图,如图1所示。本软件由前台用户使用部分和后台数据库管理部分组成。以下仅述前台用户使用部分。
如图1所示,“高等职业英语测试统计分析系统”包括四个模块,即模块一“各院校成绩对比”、模块二“总成绩综述”、模块三“各专业类别(文理工商艺)成绩对比分析”和模块四“个人成绩分析”。四个模块分别下设若干子模块,实现相应功能,具体见图1。这四个模块分别成为四类用户的入口,分别向四类用户开放使用权限。四类用户即“教育厅和教指委领导”、“各学院主管”、“任课教师”、“学生”。借此软件,教育厅和教指委领导进入“各院校成绩对比”入口,可全面了解全省的考试汇总情况以及所有参加当次CACE考试的院校之间的各种比较情况;学院主管即某学院主管教学的院领导或教务处领导进入“总成绩综述”入口,可了解本校考试的总体情况以及和其他院校的比较和差距;任课教师进入“各专业类别(文理工商艺)成绩对比分析”入口,可了解自己所任课班级的考试情况以及与全校其他班的对比情况;学生进入“个人成绩分析”入口,可了解本人在本次考试中情况以及与本班或本校其他同学之间的比较和差距。此外,本软件还设有管理员入口,供管理员全面维持整个软件的正常运行和处理后台数据的操作。
(2)全程指导软件开发工作的软件架构图中,对应各功能的数学公式繁多,仅举模块一“各院校成绩对比”中比较所有院校的成绩需用到的单因素方差分析ANOVA公式为例,如表1所示。
(3)本软件的开发环境设计为:LAMPS(Linux+ Apache+MySQL+PHP+SVN)。开发框架是在基于Zend Framework 1.8 的三层MVC结构基础上进行开发的。开发工具软件包括UltraEdit,Dreamweaver。
(4)成功开发的网络版“高等职业英语测试统计分析系统”,登陆网站http://,即可访问。软件页面繁多,仅举一例以说明。如用户“教育厅和教指委领导”进入模块一“各院校成绩对比”,点击“比较所有院校的成绩”,可查看某次全省参加CACE考试的若干所学院的成绩是否存在差异性,如图2所示。
本软件可推广CACE测试后相关工作,用以分析试卷成绩统计。本研究分析与利用受试者由考试机构所组织的并按高职英语考试大纲要求所设计的CACE测试,综合检测高职英语教学效果。本项研究不仅为各受试学校受试者提供考试成绩,对全校甚至全省的高职公共英语质量进行科学量化的分析、跟踪与监控,还可对每位考生的英语具体技能如听力能力、阅读能力、写作能力及特殊职业能力等方面进行监控。学校(或省)主管通过此系统,可以查看出某校(全省)某系甚至某班某个学生某个教师量化的教学效果,从而可以对英语教学质量进行宏观的监控。各个系(部)对每个学生及教师进行微观监督,教师对每个学生有针对性施教,改进教学,提高整体英语水平。本软件是广东省内首创的基于语言测试理论研发出专门针对CACE测试的统计分析系统,在网站软件中移植并完善相关算法源代码,实现了网站系统自动生成与SPSS相同的相关性分析结果,可以对测试成绩进行全面系统分析。为高职英语教育提供了科学规范的评估测试系统。本测试分析系统,界面友好、操作简单、复用性强、易推广。本软件进行的数据统计分析结果将成为学生个人化的信息反馈获取的基本保障和理论来源。
3 后续研究设想
高级职业英语测试已在全省范围展开和普及。虽然教改课改成效显著,但为进一步充实和完善整套改革体系,使其日趋成熟并有效服务于当前高职英语教育改革发展之需,仍有后续研究空间。如,每位学习者还希望能经常获得关于自己学习情况的个人化信息反馈,譬如学习诊断报告,学习者图像描绘,学习进程路线图,成就报告等,又想随时得到基于个人不断变化情况的学习指导,譬如针对个人的辅导,材料或方法介绍,迄今学习的总结和往后学习的处方性意见等(李筱菊,2001:436)。但上文提到的“高等职业英语测试统计分析系统”虽实现了CACE测试后成绩统计分析展示平台的功能,却没能实现为学习者提供详细英语学习诊断报告的功能,仍无法满足新形势下对新测试应提供更多更具体更精确的关于考生知识和能力掌握信息的期待和要求。为实现英语学习诊断报告功能,笔者后续研究将致力于“高级职业英语测试诊断书”的研制。笔者设想将“高级职业英语测试诊断书”模块,设计为前文阐述的已成功开发的“高等职业英语测试统计分析系统”的第五个模块,即增设这一模块。访问权限向前四个模块的所有用户开放。
“高级职业英语测试诊断书”模块的研制主要是通过引入测试领域的最新研究成果和应用工具,即将诊断分类模型DCM(Diagnostic Classification Models)应用在英语听力、阅读及写作理论、教学以及考试信度与效度方面(陈芳,2011)。所有该类模型的目的都是为了将被试分类,并提供详细诊断信息,因此可以广泛应用于各领域。DCM的原理是直接计算每个考生掌握每项技能的概率,如将每道题所考查的技能点按Q矩阵排列,根据不同的假设选择相应的诊断模型,经过特定软件(Arpeggio,M-Plus)运算最后得出每个考生的详细诊断信息表,如哪些技能已掌握,哪些技能还未掌握,哪些技能因数据信息不足无法判断是否掌握。这种从测试结果中挖掘更多精准的反馈信息来指导教学和测试工作的方式,大副提高了测试的效度和效率,符合教育要高效节能的新趋势(甘利:2012)。
“高级职业英语测试诊断书”模块的研制大致分为两个阶段:(1)资料数据搜集准备阶段,包括诊断模型软件Arpeggio的获取;向测试命题组索要考题设计时的综合技能列表;鉴于理想的考点和学生实际运用的技能点有所出入,需要结合一些调查手段例如分析若干位学生的有声思维,参考几位专家的意见以及评估模型拟合度(goodness-of-fit)和相关参数。经反复调整,最终确定高级职业英语测试测量的所有技能并将这些技能点作Q矩阵分析汇总;现有的外语能力标准的搜集,确定10名将参加当年CACE测试的受试,建立考前和考后档案报告。(2)抽取当年参加CACE测试的1000份学生答卷,不含之前确定的10名受试,考生的回答和Q矩阵一起输入Arpeggio软件进行运算(陈芳,2011)。考生的回答同项目反应理论中一样赋值。正确的回答标为1,错误的回答标为0。对1000位考生答卷的分析决定了所有考题的相关参数,即考题难度、区分度等。基于这些参数,将10名受试的能力测量简化为数据代入,即将已获得的考题参数和这些学生的回答输入诊断分类模型的定义公式中,直接计算他们掌握每项能力的概率。最后得出个人报告样本,即10名被试的各项技能掌握程度的诊断书,然后通过对比这些被试的档案与被试的自我评价及对其老师的调查问卷结果,可以判断高级职业英语测试的诊断准确性。
4结语
本研究保证了对测试结果解读和使用的科学性严谨性,为今后类似大型考试的结果分析运用提供了参考范本,对学生CACE测试后的进一步学习指导工作发挥巨大的引导作用。教学管理者可对考试进行宏观监控,了解全局;教师可了解自己及同行所任班级学生的考试情况及教学反馈,学生可相应调整学习策略方法;能提高学生整体英语水平,为社会做出更大的贡献,更顺应时代的潮流和社会对高等职业英语的发展需要。笔者后续“高级职业英语测试诊断书”模块的研究成果可应用于CACE测试的命题、课改教改的各个环节,直接服务于测试对教学教改的良好反拨效应和教改课改的实效性,可直接检验教改课改是否达到应有的深度和效度。
(本文是笔者副主持的2009年广东省教育厅基金项目《高等职业英语》测试统计分析系统的研究与实践(Yyjg-2010-30)的部分研究成果。)
参考文献:
[1] 李筱菊.语言测试科学与艺术[M].长沙:湖南教育出版社,2001.
[2] 陈芳.诊断分类模型:测试领域的新工具[J].外语教学理论于实践,2011(02).
[3] 甘利.语言测试视野下的高职英语教学现状和改革方向[J].中国成人教育,2012(20).
时间:2013年9月26日上午8:30。
地点:教育局五楼第一会议室。
流程:
同志们:
现在开始开会,请关闭通讯工具,保持会场安静。今天会议议程比较多,安排的几项工作很具体,时间要求也很紧。希望大家能够静下心、坐得住、听得清、记得牢,以便回去后向主要领导汇报好、落实好。
今天会议的主要议题,是总结上学年学校体育卫生艺术教育和食品安全工作情况,对下段重点工作进行安排部署。出席今天会议的有:分管学校体育卫生艺术、国防教育和食品安全的各镇、街道、双王城经济生态园区教办副主任、初中副校长,市属学校(学院、幼儿园)副校长;各镇、街道、双王城经济生态园区所属初中、市属各学校体育、艺术教研室(组)主任(组长)、食品安全专管员,市竞技体校专职教练员,共计180余人。市体育局刘永军副书记出席今天会议。
今天会议主要有五项议程:一是简要通报2012-2013学年度中小学生健康体检分析结果;二是安排部署市竞技体校招生事宜;三是简要总结上学年学校体育卫生艺术教育和食品安全工作情况,对下段重点工作进行安排部署;四是王局长做重要讲话;五是对下步《国家学生体质健康标准》测试、数据上报和学校健康教育促进行动结果公布公示工作进行技术培训。
下面,会议进行第一项:就我市2012-2013学年度中小学生健康体检结果分析情况进行简要通报。
2012年10月-2013年3月,由市教育局学生健康服务站体检中心实施,对全市126984名中小学生进行了全面健康体检。其中小学生11841人、初中学生37526人、高中学生23674人,按性别区分男生65787人、女生61197人,市属初中小学学生15592人,镇街初中小学学生87720人。现场体检结束后,体卫艺科利用7-8月近两个月的时间,对相关数据进行了汇总统计,并选取视力低下、龋齿、肥胖等学校重点常见病患病情况进行了分析,形成了《2012-2013学年度中小学生健康体检报告》。《报告》对视力低下、龋齿、肥胖等学校重点常见病患病情况,分别按城乡、男女进行了横向对比,按年级进行了纵向对比。《报告》分析了存在问题的主要原因,并就今后改进措施提出相应的对策建议,希望能够引起各学校高度重视,并在今后工作中,采取针对性措施,切实改善学生体质健康水平,促进学生全面、健康发展。
特别需要关注的是小学一年级视力低下率18.78%,固然与学生年龄小,生理指标发育不成熟有关,与日常家庭生活中看电视、玩电脑游戏用眼过度有关,更与学前过早介入文化知识学习有关。各年级学生视力低下率居高不下,过重的课业负担是主要原因,但最关键的是学校、教师没有教育学生养成良好的读写姿势。
会议进行第二项:安排部署市竞技体校招生事宜。请市体育局刘永军副书记宣读《2013年市竞技体育学校招生方案》,大家欢迎。
……
体校是竞技体育工作的排头兵,是训练和挖掘体育竞技人才的重要基地。近年来,在学院领导的关注支持下,市体校在各级比赛中发挥了重要作用。为确保今年招生工作顺利,制定分配了各项目、各单位招生指标,希望各级各学校予以足够重视,确保今年招生质量。对各单位工作进展情况,教育局将及时跟进,适时通报。
会议进行第三项:简要总结上学年学校体育卫生艺术教育和食品安全工作情况,安排部署下段重点工作。
一、2012-2013学年度全市体卫艺工作回顾
一年来,在市局领导的大力支持下,在市体育、卫生、宣传等部门的协调配合下,在各级各学校、广大艺体教师的帮助下,我市学校体育卫生艺术国防和食品安全工作取得了长跑进展。
(一)规范程序、严肃纪律,圆满完成2013年初中毕业生升学体育与健康科目测试和普通高中艺体特长生招生工作
一是圆满完成2013年初中毕业生升学体育与健康考试工作,社会反响良好。今年,我们进一步健全完善了考试组织程序,有效强化了考试过程监督,保证了考试的公平、公正、公开。由于考试组织纪律严格、防范工作严密,社会反应良好。
二是严密组织、规范流程,顺利完成普通高中艺体特长生招生。为选拔真正具有艺体特长的学生进入高中深造,切实打造普通高色办学中坚力量,在总结往年招生基本经验的基础上,今年我们适当放开了部分项目的招生区域限制,以集中优秀生源,打造学校特色项目;适当扩大了招生学校范围,以强化完善学校艺体特长生培养的竞争体系。本着公平、公正、公开的原则,考试过程中采取外聘监考员、现场公布成绩的办法;录取时采取学校推荐、专业科与文化科考试成绩相结合的办法,由学校自主录取。在即不违背上级有关招生考试、录取政策,又适当监控考试、录取过程的前提下,充分发挥高中学校自主招生的积极性。今年我市从600余名报考学生中,按基本素质和考试成绩录取203名音乐、体育、美术特长生。
(二)以活动为载体,积极开展学校体育、艺术、卫生教育活动,促进学生全面、健康发展
1.进一步完善中小学生田径运动会等各项比赛规程,规范体育比赛活动。重点是规范报名资格、项目设置、裁判技术、比赛分组、奖项设置等,引导各级各学校自觉重视和加强日常体育训练,逐步实现全市各类比赛公平、公正、规范。去年底开展了全市中小学阳光体育冬季长跑活动,今年初举办了“中国体育彩票杯”中小学生体育联赛足球、田径、乒乓球、小学生一无排球比赛,举办了小学生校园体育活动项目展示。6月份,组队参加潍坊市举办的省中运会选拔赛,高中组获团体第一名;现代中学代表潍坊参加山东省第十二届中学生运动会,获得跳绳项目第一名的优异成绩。
2.艺术活动形式多样,全方位展示学校素质教育成果。一是在菜博会期间,借寿光文化博览会平台,举办了师生书画展。面向全市师生征集书画作品1300余幅,从中遴选出300余幅,在菜博会农展馆展出,得到参展领导和社会各届的高度评价。二是利用“六一国际儿童节”,组织了全市“庆六一”文艺汇演,市委、市政府、有关部门领导出席了演出现场,并对演出效果给予高度评价。三是借助市委宣传部组织的“周末群众大舞台”,在市文化中心举办了专场文艺演出。四是与市委宣传部联合举办了“中央电视台《大手牵小手》寿光行专场演出”。该项活动经广泛宣传发动,各学校积极参与,经过6-7月份的海选、复赛等环节,选拔出一批高质量、高水平节目,于9月15日在菜博园进行了现场演出和节目录制。央视著名主持人鞠萍、红果果、绿泡泡等亲临现场,全程参与了演出和节目录制。节目将于9月28日上午7:30在央视少儿频道播出。
3.充分利用社会资源,扎实开展了中小学生近视防控工作。根据教育部《中小学学生近视眼防控工作方案》要求,委托明润视光中心、光明医院眼科中心等社会机构,对全市中小学生视力状况进行按期监测,配套完善了学生视觉健康档案,初步建立起全市视力预警系统和“政府主导、企业运作、专家指导、部门配合、社会参与”的学生近视眼防治工作机制。8月初,举办了 “近视防控”培训班。授课专家对我市前期监测结果进行了初步对比,现场普及了“阳光亮眼操”,全市各级各学校140余名分管学生近视防控工作的老师参加了培训。
(三)进一步健全学校公共卫生和食品安全保障体系
1.进一步健全完善学校卫生防疫和学生保健体系。一是顺利完成9000余名高考考生的体检工作,并连续三年实现高考体检信息统计“0差错”,得到上级招生考试院的高度评价。二是实现了全市中小学生健康体检工作的统一管理。三是配合市卫生疾控部门,切实做好各级各学校、幼儿园流行性疾病防控工作,有效控制疫情。针对今年手足口病、水痘、腮腺炎等流行病、传染病暴发特点,配合市卫生疾控部门加大对学校(幼儿园)监督、指导力度,督促各学校(幼儿园)加强流行性疾病防控知识宣传教育,切实落实晨午检制度和病情每日报告制度,对病情较重的幼儿园、小学严格落实了停班停园制度。
2.切实做好学校食堂食品安全工作。建立学校食堂日检制度和随机督查制度,今年共随机督查52处学校(幼儿园)食堂,对发现的问题提出整改意见和整改时限,并形成了《备忘录》。利用暑期教师集中培训时间,邀请著名营养与健康、食物中毒与防治等学科专家授课,对全市160余名学校食堂管理员进行了集中培训。
3.圆满完成学校食堂注册企业法人登记工作。市教育局成立了专门办公室,承担了学校食堂分离注册企业法人工作。自7月中旬到9月初,一周一调度、一周一汇报。各有关学校分管校长、食堂管理负责人牺牲了暑假休息时间,积极主动跑手续、上设备,为圆满完成全市36处学校食堂分离任务,做出了极大的贡献。
二、2013-2014学年度重点工作安排
(一)做好《国家学生体质健康标准》测试、数据上报工作,全力应对好潍坊市组织的体质测试比赛、国家抽测工作。与往年相比,今年《国家学生体质健康标准》测试、数据上报工作出现新变化、新要求:一是测试、上报时间由学期末提前到学期初。时间的提前必然增加工作组织难度,开学初期学生的体质水平也难免出现降低。二是进一步明确并增加了测试项目。增加项目就必然影响测试速度,但必须要保证质量。三是评定标准没有明确,上报时只要原始数据,不用换算成分数。四是上报平台和方式发生变化,要求学校直接进行网上提报。这样在集中上报时就有必然会出现网络堵塞,需要各学校妥善保管数据。五是学校数据需要经过县、市、省逐级审核后,才能全面上报。六是接收数据后,要实施逐级抽测。抽测的目的就是要验证数据的真实性,确保数据准确。为确保该项工作顺利完成,提出以下要求:
1.迅速制定学校《标准》测试、上报工作的实施方案,方案要明确测试日程安排、测试场地、测试方法、上报日期。各学校方案务于28日上午10:00前上传到指定邮箱,各教办要汇总辖区学校方案后,统一打包上传。
2.认真核对数据库学校名单,及时排除已撤并学校和非教育系统所属学校。该项工作去年已经做过要求,但目前国家数据库我市学校存量仍有173处,比实际数量多出50多处。除去6处市属已撤并学校和非教育系统学校外,各教办所属学校仍多出40余处。会后,我们将下发国家数据库中我市学校存量名单,各教办要及时组织人员进行认真审核,于28日上午10:00前将已撤并学校全称、撤并方向、学校代码等详细信息上传到指定邮箱,由教育局汇总后,统一申请从数据库中删除。
3.切实加强测试仪器配备,确保测试数据真实、可靠。从今年测试要求分析,国家有可能是要根据这次测试数据,修订完善《标准》的计分标准。这就要求我们必须提供真实、有效的原始成绩,使用仪器测试出的成绩,其真实性要远远高于手工测试;同时,使用仪器测试,可以有效遏制不经测试编造数据、应付上报的弊端。对于测试仪器的配备,早在2011年印发的《关于进一步落实中小学生每天一小时校园体育活动的意见》(寿教字〔2011〕109 号)文件中提出了要求。各教办、各学校可根据学校实际,适当降低配备标准,各教办、市属各学校至少统一配备2-3套,学生人数较多的大学校,要适当增加配备。
4.按时完成测试,认真对待潍坊组织的体质测试比赛。各级各学校要根据潍坊市测试时间配档表要求,在时间安排上尽量往前赶。测试期间,教育局将组织专门人员到校抽查,确保于10月15日前完成测试、数据上报、抽查审核和公布工作。10月26、27日,潍坊市教育局将组织体质测试比赛。测试通过随机抽取一定数额学生统一进行。测试结果与上报数据核对产生数据符合率,数据符合率与测试比赛成绩按比例计入全市教育综合督导评估相应指标中。各级各学校要彻底打掉侥幸心理,制定严格的应对措施,抽测到的学校要确保比赛成绩。因应对不力导致抽测成绩不高,影响我市有关指标在潍坊评估中扣分较多的,除按各系列评估方案规定,加倍在年终综合评估中扣分外,还要对有关学校、有关责任人通报批评。
(二)扎实落实学生健康促进行动公示报告制度。潍坊教育局近期下发通知,要求各级各学校建立学生健康促进行动公示报告制度。目的是为更好地发挥校务公开对实施学生健康促进行动的推动作用,进一步规范办学行为。
制度规定全市所有中小学校(含中等职业学校)都要对“学生健康促进行动”的实施情况进行公示和报告。公示报告内容为本学年学校音乐、体育、美术课程开课情况;学校健康教育实施情况;学校实施学生健康促进行动的经费投入、师资配置、场地设施配备等具体情况;学校实施体育课程、大课间(课间操)和课外体育活动一体化的阳光体育运动方案;学校每年开展学生健康体检和体质健康监测工作情况。为确保该项工作落实到位,要求各学校一是于10月10日前,如实整理各项相关内容向本校服务区域、家长、学生公示,并向教育局报告;市教育局完成对学校所报情况审核、监督后,将于10月20日前进行公示,并汇总情况向潍坊市教育局报告。二是紧紧围绕上述时间点,认真、及时填报《通知》附表中要求的相关数据,确保工作质量和全市公示工作顺利进行。公示涉及的相关数据报送要求,稍后将作专门讲解。
(三)认真组织好中小学生合唱节、戏剧大赛工作评比。为应对三年一个周期的全国艺术展演,省教育厅每年举办一到两个项目专门文艺比赛。今年是合唱节和戏剧大赛,2014年将举办器乐大赛、舞蹈大赛,2015年是组织各级艺术展演活动,选拔优秀节目参加第五届全国艺术展演。早在6月24日,我们就在网上了寿教函【2013】22 号《关于举办全市中小学生合唱节、戏曲节大赛的通知》,但就在前几天,仍有老师在网上发帖咨询该项活动有关事宜,说明个别单位对活动宣传贯彻很不到位。根据工作安排,今年合唱节、戏剧大赛的巡回评比工作,将于10-11月期间,组织专门人员,与其他活动组合、穿行,请各单位、各学校做好准备。
(四)抓特长、促特色,统筹安排好第三届中小学生体育联赛各项目组队参赛工作。第三届中小学生体育联赛的中学生排球、篮球联赛有关比赛事宜将于近期,请各学校认真准备,积极参赛。为适应学校工作实际,今后计划将联赛中的乒乓球比赛安排到每学年的第一学期末举行,小学生排球比赛与中学生排球比赛一并进行,中学生足球比赛于第二学期初举行,中小学生田径比赛一般安排在每年的4月中旬举行。在今后的比赛中,不提倡各学校项项参与,鼓励各学校统筹规划,根据学校体育传统和学生特长,除田径项目外,集中组建1-2支球类特长队伍,进行专门化训练、精细化培养,确保学校在相关项目比赛中能够拉得队伍、拿得到名次,争取校校有亮点,能够创建、打造相关项目的特色学校。
在今年举办小学生校园体育项目展示活动的基础上,今后将以每2年一个周期,轮流举行中小学校园体育项目展示活动,展示项目从“体育、艺术2+1项目”中选择。各教办、各学校要结合各自实际,适时组织好自己的展示活动,要求人人参与、校校参加。通过活动,争取人人有特长、校校有特色,切实丰富在校学生的校园文化生活,切实提高学生体质健康水平。
(五)积极组织好中小学生国防知识竞赛网上答题活动,迎接国家及省厅对国防教育活动抽查。寿教字〔2013〕89 号《关于做好新学期中小学生国防教育及中学生军训工作的通知》中,转发了省教育厅《关于举办2013年山东省学校国防知识竞赛活动的通知》。各级各学校要根据通知要求,广泛发动学生积极参加竞赛第一阶段的网上答题活动。
(六)高度重视、常抓不懈,切实做好学校食堂食品安全、卫生防疫工作,确保学生身心健康。各级领导高度关注学校食堂管理、食品安全和学校传染病防控工作。魏局长在历次会议上都会强调食堂食品的安全管理问题,到学校调研,食堂是必到的地方。教育局一年无数次发文强调食堂管理、食品安全和学校卫生防疫问题。并且行文强调建立学校食堂日检制度、从业人员日常学习培训制度和随机督查制度,但在实际工作,依然引不起有关领导、有关人员的重视。通过现场调研发现,食管餐厅卫生状况差、进货把关不严、索票索证不全、加工清洗不彻底、生熟不分、饭菜留样不规范、餐具消毒不彻底甚至不消毒的现象依然存在,有的学校甚至在午饭后就把晚上的饭菜做好。对于学校卫生防疫工作,同样存在晨午检制度、学生病后复查复课制度不落实,发现传染病不报告、发病学生停课治疗不及时的问题。这些问题存在的根本原因,就在于学校领导思想认识不到位、督促检查措施落实不力,有关人员责任心不强。这是对学生体质健康的轻视,也是对自身职业操守和政治前途的不负责。
针对上述问题,就今后相关工作强调要求:一是各学校、有关领导要切实提高思想认识,要时刻把学生生命安全放在心里。健康不保,无以谈质量。要细化工作分工,加大日常管理督查力度,配合有关部门,确保各项工作制度落实到位。二是今后市教育局将进一步强化随机督查力度和密度,发现问题,及时汇报,跟上通报。
(七)需要做好的其他常规工作。一是要切实落实好大课间活动、每天一小时集体体育活动。这是潍坊对县市区、我市对学校督导评估的重要指标,是国家课程设置的一贯要求,是丰富校园文化活动主要内容和手段,更是学生体质健康的可靠保障,各级各学校要作为一项常规性工作,抓好落实。二是配合做好视力监测。学生视力监测继续实行分片负责、委托实施的办法,由明润视光和眼科医院具体实施。各学校要积极主动,配合有关机构做好数据采集和信息建档,为今后统计分析学生视力情况提供可靠数据。该项工作要保证每学期至少一次的专业机构监测,相关数据记入学生视觉档案。另外一次的监测由学校自行组织,另行建档记录数据。三是协调做好2013-2014学年度中小学生健康体检工作。该项工作继续由学生健康服务站体检中心负责,在国庆节后组织实施,具体实施时间另行安排。各教办、各学校要积极配合,争取在年底前基本完成现场工作。
以上七项工作中,《体质健康标准》测试、学生健康促进行动公示报告工作要求时间紧、工作密度大,各级各学校要统筹安排,组织专门机构和队伍,明确工作责任,倒排工期,确保工作质量和时间。
下面,会议进行第四项:请王局长做重要讲话,大家欢迎!
……
王局长在讲话中,就今后我市学校体育卫生艺术国防教育和食品安全工作,提出三个方面的要求:一是转变思想,狠抓落实,切实提高学生体质健康水平;二是切实重视体校招生工作;三是明确责任,倒排时间,切实按时保质完成各项重点工作任务。
就王局长讲话和今天会议精神的落实,各与会领导回去后,一是要向主要领导汇报好;二是要在及时召开会议传达、布置好;三是要迅速制度工作方案和针对性措施,确保安排落实好。
关键词:可用性;可用性测试;测试方法;测试过程
在软件系统开发的过程中,软件可用性的测试是必不可少的一环。可用性是从人的角度来看软件系统是否易用、高效,使人感到满意。可用性测试一般来讲就是要测试软件的可用性是否达到了用户的要求[1]149。
近年来,IT产业发展迅速。然而,在IT产品特别是软件产品的开发中,往往只重视技术创新而对人的因素考虑不足,导致很多产品存在着不同程度的可用性问题。据统计[2],在英国,80%的软件缺陷是由于不能有效满足用户需求,而其中60%是由于存在着可用性问题。具有良好可用性的软件产品可以减少用户的操作错误,减少人员培训和系统维护的费用,提高用户的生产效率和满意程度,从而提高产品的市场竞争力。
可用性测试的研究早在90年代初就已经兴起,经过十几年的发展,已经诞生了很多有效的可用性测试方法。目前这一领域的关键问题是如何设计合理的测试过程,选择实用的测试方法,使得测试高效率、低代价。
本文后续章节将首先介绍各种可用性测试方法,然后根据我们所开展的工作,给出一种比较合理实用的可用性测试过程,最后进行总结和展望。
1可用性测试方法
可用性测试的方法大致可以分为4类,用户模型法、用户调查法、专家评审法和观察法。
1.1用户模型法
用户模型法[1]150[3]通常是用数学模型来模拟人机交互的过程。这种方法把人机交互的过程看作是解决问题的过程,它认为人使用软件系统时是有目的的,而每一个大目的可以被细分为许多小目的。为了完成每个小目的,又有不同的动作和方法可供选择。每一个细小的过程都可以计算完成的时间,这样,整个模型可以用来预测用户完成任务的时间。因为数学建模相对来说比较复杂,所以这种方法在工业界一般比较少用。
1.2用户调查法
用户调查法[1]196-206[4]包括问卷调查法和用户采访法。问卷调查和用户采访可以在用户使用完软件之后,调查用户的满意度和发现软件的可用性问题。
用户问卷调查所收集的数据可以用来进行统计分析。问卷本身需要认真的设计,避免可能的误导问题,保证所收集的数据有高的可信度。用户问卷的使用过程大致可以分为用户要求分析、问卷设计、问卷施行及结果分析。
用户采访一般在试验结束以后,问试验参加者一些相关的问题,也可以让试验参加者随意谈谈使用软件的一些主观感受。
1.3专家评审法
专家评审法[1]176-195[5]是由可用性专家来评估软件系统的可用性。根据评审专家使用原则的不同,可分为启发评估法、步进评估法和设计准则评估法。
启发评估法是让专家来评估软件是否符合某些可用性原则。可用性原则要简单、通用、有启发性。
步进评估法通常由专家来模拟用户初次使用软件时人机交互的过程,在这个过程中发现潜在的可用性问题。比较适用于没有任何用户培训的系统,比如为大众设计的网站。
设计准则评估法用来评估系统的设计是否符合设计准则。设计准则通常是为满足公司或设计团体特殊需要而制定的、一般性的用户界面设计规范。比如保持界面简洁,提供明确的路径,不要让用户费力等。
1.4观察法
观察法[1]151-165[6]就是观察用户使用软件的方法,包括用户测试法和使用记录法。用户测试一般在实验室里进行;使用记录法是观察用户的使用记录,通过分析这些记录可以发现一些可用性问题。
用户测试有两种,一种是用于发现可用性问题的正式的可用性测试。通常选择6~10个有代表性的用户参加,完成几个符合实际的测试任务,通过对用户完成任务过程的观察,确定设计中的可用性问题。另一种是在软件开发阶段使用快速改良测试评估。整个试验分为几轮小的试验,在两轮试验之间,可用性工程师快速地报告试验结果并提出改进意见,设计人员根据这些意见改进设计,下一轮试验使用改进后的设计。
使用记录法就是分析试验过程中记录的数据,以进一步发现软件系统存在的可用性问题。试验过程中具体要记录哪些数据,要根据不同试验而定。
2可用性测试过程
合理实用的可用性测试过程,能够在低代价的情况下,高效率地进行,发现尽可能多的可用性问题。 我们一直致力于可用性测试方面的研究,经过长期的实践工作,总结出一套比较合理实用的可用性测试过程。一个软件产品开发出来之后,首先进行专家评审,将这个过程发现的可用性问题解决好之后,进行实际的用户测试,测试完毕,进行问卷调查和用户采访,最后对整个记录的数据进行统计分析,找出存在的可用性问题。
2.1专家评审
进行专家评审的时候,首先采取启发评估法。让几个评审人员根据一些通用的可用性原则和自己的经验来发现系统内潜在的可用性问题。在评审人员的选择方面,我们通常选择既具有可用性知识又具有和被测系统相关专业知识的“双重专家”,据试验统计,这样的双重专家比只有可用性知识的专家平均多发现大约20%的可用性问题[7]。评审人员的人数一般在5人左右,有试验表明[1]176,5个评审人员可以找到大约75%的可用性问题。每个评审人员评估后会提供一份独立的报告,描述发现的可用性问题,问题的严重性以及改进的建议。将所有评审人员的报告综合得到最后的报告,根据这份报告,改进软件产品。
然后采取步进评估法,由评审人员模拟初次使用系统的用户,真实地感受直接使用系统时可能会遇到的问题。在进行步进评估时,评审人员可以进行简单的评估记录,也可以对可用性问题进行更详细的描述,并且估计其危害性和发生频率,帮助设计人员更好地解决相应的问题。
2.2用户测试
经过专家评审,并将发现的可用性问题解决以后,进行实际的用户测试。用户测试是可用性测试过程中最关键的一步,也是发现可用性问题最重要最直接的方法。用户测试涉及到很多方面的问题,下面逐一论述。
2.2.1可用性实验室
用户测试可以在实验室进行,也可以现场进行。但现场测试很费时,而且难以控制,所以,一般都选择在实验室进行。
正规的可用性实验室要由两个房间组成:实验室和观察室。实验室和观察室之间有一面隔音、单向透光的玻璃墙,当实验室开着灯,而观察室灯光比较暗的时候,从实验室看过去是一面不透光的镜子,从观察室看过去则像一个普通的玻璃窗。实验室的计算机(被试机)配备麦克风和摄像头,观察室的计算机(主试机)可以同步监测被测机的屏幕,进行录音和录像,并能记录相关的试验数据。如图1所示。
2.2.2试验的参加者
试验参加者应该代表被测系统的现有和潜在的可能用户。因此,在选择试验参加者的时候,要考虑如下几个因素:
1) 专业知识、计算机经验及对被测系统的熟悉程度。
有些系统是给计算机专业人士设计的,为这种系统的可用性试验选择参加者时,对专业知识的要求较高。有些系统是为普通用户设计的,则对参加者没有很强的专业知识要求。
计算机经验也是一个考虑因素,如果参与者的计算机知识过于贫乏,可用性测试就会变成学习如何使用计算机,会影响测试结果。
对被测系统没有用过或者很少用的属于新用户,比较熟悉的属于熟练用户,还有一些用户介于两者之间可称为半熟练用户。一般选择测试参加者的时候,这3类用户都要占据一定的比例。新用户可以发现软件可学性方面的问题,熟练或半熟练用户可发现软件易用性、效率和用户满意度等方面的问题。
2) 参加者的人数。
在进行正式的可用性试验时,一般需要6~10个参加者。可用性试验的目的是发现可用性问题,发现所有可能存在的可用性问题的可能性可以用以下公式计算[1]153:
P=1-(1-λ)n
其中,n是参加者的个数,λ是一个参加者发现任何一个问题的可能性。Nielsen和Landauer统计发现,λ大约是31%。所以,一个有6个人参加的试验,大约会发现89%的可用性问题。
(3) 其他因素。
试验参加者的性别、年龄、教育水平、工作类型等因素也需要考虑。一般的软件测试,应该尽量使男女比例保持平衡,各个年龄段保持一定比例。有些涉及性别和年龄的软件系统要特殊考虑。
2.2.3试验任务设计
设计试验任务时,应该让试验参加者觉得易于理解,另外只提供给参加者完成任务所需要的信息,以免信息过多引起混淆。任务应该是有意义的,以一定的逻辑顺序展现给用户,同时还要控制每个任务的完成时间,不能让用户把所有的时间都花费在一个任务上。
2.2.4试验数据收集
在试验过程中可以收集的数据通常有两类,一类是客观可测量的数据,如参加者完成任务所需要的时间,参加者完成任务时犯错误的次数等,这些需要设计相关的数据结构来记录;另一类是参加者的主观感受,如对产品的满意度、评价等,用户对产品的满意度可以通过后续的问卷调查获得,对产品的主观定性评价可以通过后续的用户采访获得,也可以通过有声思考[8](think aloud)的方法来收集。
有声思考是指试验参加者在人机交互的同时不断的进行发声的思考,比如描述自己对系统的了解,为什么采取某个行动,期待的后果是什么等等。有声思考的优点是简单易用,能够了解参加者对系统的理解。缺点是可能会影响参加者完成任务的时间,或者导致出现错误。
另外,试验过程中有同步的录音和录像。录音是记录试验参加者在试验过程中进行有声思考的相关信息,录像是记录试验参加者在试验过程中的脸部表情。
2.2.5知情告知书
为了保护试验参加者的权利,也为了保护研究机构或者公司的利益,通常,在试验开始的时候要求参加者在一份知情告知书上签字。知情告知书没有严格的格式限制,但应该解释清楚试验的目的,参加者的权利,试验相关设备的使用方法,以及告诉参加者试验过程中需要进行笔录、录音和录像的目的,还应该知会参加者有关测试产品的信息需要保密等。
2.3问卷调查
为了测试用户的满意度,在试验参加者完成试验任务后,进行问卷调查。为了方便用户使用和便于试验结束后进行数据分析,我们将问卷调查直接放到主试机上,并在被试机上提供访问链接给用户,点击即可进行问卷的填写,即通过网络的方式进行。
问卷调查所收集的数据可用于进行统计分析,因此问卷本身需要认真的设计,使问卷简单、易读、容易理解,保证所收集的数据有高的可信度。
2.3.1问题的类型
最常见的问题有3种:事实型、意见型和态度型。
事实型的问题是关于公开的、可以观察到的信息的问题。如用户的受教育程度,使用计算机的年数等。
意见型问题是有关用户对系统的看法的问题。这种问题回答时只需给出感受的强烈程度。如是否喜欢某一个软件,更乐意使用哪个软件等。
态度型问题将用户的注意力集中在他们的内部,集中在他们对事物内在的反映。用户满意度问题通常就是态度型问题,反映了用户在使用了某系统后的感受。如用户喜爱的程度,用户对学习使用该系统的难易程度的感受等。
在一个问卷中,通常可以先通过事实型问题了解用户的背景,然后给出一些意见型和态度型问题来了解用户的感受。
2.3.2问题的形式
常见的问题形式有清单、李克特(Likert)量表及开放式的问题[1]199。
清单式的问题给用户几个事先安排的答案,让用户选择其中一个或多个答案。如:
您使用过多少类型的菜单?
没用过12 34 4种以上
李克特量表形式的问题允许用户用不同的程度来回答问题。这种问题的答案是一个两极化的量表。通常低端代表否定的答案,高端代表肯定的答案。如:
您对使用鱼眼菜单的感受是:
困难 1 2 3 4 5 6 7容易
量表的阶数一般是1到3,1到7或1到9。
开放式问题是指用户用自己的话来回答问题。这样可以直接感受到参加者对系统使用的满意度。
2.3.3常见的可用性问卷调查
在学术论文中常常提到的可用性问卷有:用户交互满意度问卷[9](Questionnaire for User Interaction Satisfaction, QUIS),软件可用性测量目录[10](Software Usability Measurement Inventory, SUMI),计算机系统可用性问卷[11](Computer System Usability Questionnaire, CSUQ)。在设计问卷的时候,这些都可以作为很好的参考标准。
2.4用户采访
用户采访是在试验参加者完成所有任务,填写完问卷调查之后进行的。用户采访没有特别严格的形式,可以由参加者自己简单描绘一下使用系统的一些感受,对系统的一些修改意见等,也可以由工作人员设计一些相关问题,对参加者进行提问。
2.5试验数据分析
用户测试、问卷调查、用户采访结束后,我们会得到很多试验数据,合理分析这些试验数据,就会发现很多的可用性问题。
2.5.1统计试验记录
进行用户测试的时候,应该设计相关的数据结构,来记录测试过程中的相关数据。比如我们在进行各种菜单使用情况测试的时候,会记录每个用户使用每种菜单完成任务的时间,用户点击任务是否正确等。对得到的这些数据进行数理统计,就可以方便地比较各种菜单的性能。常用的数理统计有下面几种(假设经过n次试验得到一组数据X1X2…Xn):
(1) 均值:
(2) 标准方差:
(3) 分布。
均值和方差只是简单地给出了我们所收集数据的平均值以及个体的偏差。但有时候我们想知道我们的设计是否达到了预计的要求,这时就要用到相关的分布函数。分布函数有很多种,如t分布,F分布,χ2分布等。请参阅相关的数理统计书籍,在此不再赘述。
2.5.2统计问卷结果
在设计调查问卷的时候,也需要设计一些相关的数据结构,来对问卷的结果进行统计。这里能够进行量化统计的,是李克特量表式的问题,每个用户对每个问题,都会选择一个具体的数值,对所有用户对同一个问题选择的数值,进行相关的数理统计,比如均值和方差,通过这些统计的数值,我们可以清楚地看到用户对系统使用的满意度情况。
2.5.3统计开放式问题
我们这里所说的开放式问题既包括问卷里面所涉及到的开放式问题,也包括用户采访的一些问题。开放式问题没有办法进行量化统计,只能通过问题答案来进行分析总结用户对系统的相关评价。
2.5.4回放录音录像
必要时可以通过回放录音录像来观察用户进行测试过程中的表情、状态和有声思考的情形,以从中发现某些可用性问题。
2.5.5总结问题
最后,对用上述各种方式分析得到的数据进行总结,汇总系统所存在的各种可用性问题,提交系统设计者,进行修正。
3结语
本文综述了各种可用性测试方法,并根据我们的经验,给出了一个比较合理实用的完整的可用性测试过程。在软件产业飞速发展并直接影响着人们生活的今天,计算机及相关专业的学生不能仅局限于可以写程序实现某个软件系统,而且要保证所实现的软件系统是正确并有应用价值的,因此,教会学生如何对自己设计实现的软件系统进行可用性测试,是一个必然的选择。当然,对于学生实现的某些简单的软件系统,不必使用上述完整的可用性测试过程,可以根据系统的特点选择其中的某个测试环节,比如可以只进行用户采访,或者只进行问卷调查等。
参考文献:
[1] 董建明. 以用户为中心的设计和评估[M]. 2版. 北京:清华大学出版社,2007.
[2] Bevan N. Tutorial 1:Industry Standard Usability Tests[R]. Interact’99 Conference,Edinburgh,1999.
[3] Mie Nørgaard,Rune T. Høegh. Evaluating UsabilityCUsing Models of Argumentation to Improve Persuasiveness of Usability Feedback,DIS2008[C]. Landon: University College Landon,2008:212-221.
[4] West Ryan,Lehman Katherine. Automated Summative Usability Studies: An Empirical Evaluation[C]//Proceedings of the SIGCHI Conference on Human Factors in Computing Systems,April 22-27,2006. New York:ACM,2006:631-639.
[5] Tasha Hollingsed,David G.Novick. Usability Inspection Methods after 15 Years of Research and Practice[C]// Proceedings of the 25th Annual ACM International Conference on Design of Communication,2006. New York: ACM,2007:249-255.
[6] Jakob Nielson. Usability Inspection Methods[C]//Conference on Human Factors in Computing Systems 1994. New York: ACM,1994:413-414.
[7] Patrick W. Jordan. Usability Evaluation in Industry[M]. Landon: CRC Press,1996:169-178.
[8] Virzi R A,Sorce J F,Herbert L B. A. A Comparison of Three Usability Evaluation Methods:Heuristic,Think-aloud,and Performance Testing[C]// Proceedings of the Human factors and Ergonomics Society 37 th Annual Meeting,1993. CA:The Society,1993:309-313.
[9] Shneiderman B. Designing the User Interface: Strategies for Effective Human Computer Interaction[M]. 2nd ed. Reading MA: Addison-Wesley,1992.
[10] Kirakowski J,Corbett M. SUMI: The Software Usability Measurement Inventory[J]. British Journal of Educational Technology,1993,24(3):210-212.
[11] Lewis J R. IBM Computer Usability Satisfaction Questionaires: Psychometric Evaluation and Instructons for Use[J]. International Joural of Human-Computer Interaction,1995,7(1):57-58.
A Feasible Usability Test Process
ZHANG Li-xia, LIANG Hua-kun, FU Yi, SONG Hong-zhi
(Research Center of Human Computer Interaction, South China Agricultural University, Guangzhou 510642, China)
循环对比测试结果的可比性是该类测试最重要的特征之一。随着全球化地不断推进,测试的可比性也越来越重要。不论是进行内部对比测试,还是授权给外部客户进行测试,确保可比性都是首要任务,其可通过减少重复测试来降低成本。因此,测试的可比性已成为促进国际纺织服装行业经济效益提升的一项重要因素。
TESTEX主持的首次纱线循环对比测试开始于1983年,其目的是通过定期进行对比测试的方法,为认证的质量体系(ISO 9000,ISO 17025,EN 45001等)以及内部解决方案创建重要的监测工具。
纺织价值链上相关的各企业如今都利用各种仪器和设备来测试来自不同环节的纺织产品――原材料如纤维和纱线,机织和针织面料,或其他用于服装、装饰品、家居或工程的面料。每一个检测实验室中所进行的测试都会直接或间接地对纺织品的质量产生影响,因此,各项测试均基于一项测试标准可以统一测试程序,并使测试结果更具可比性。这是因为,不仅仅是测试过程,还有许多其它的因素会对测试结果产生重要影响,而其中有些是难以界定的,如测试人员、实验室条件以及对试样的处理。循环对比测试的首要目标就是揭示测试系统中错误的来源,以便采取必要的矫正措施,主要包括以下几种方法:检测设备的校准和保养、实验室人员的培训、相关影响因素的调整(如气候)。
定期举行循环对比测试有助于确保各方间的测试结果能够提供有用及准确的信息。参与循环对比测试还有其它作用,包括对内部质量保证体系提供有力支持、对内部测试结果提供信心保证、鉴定出缺乏准确性的测量方法、为其他重要认证创造条件(如PPE)。
因此,循环对比测试是经认可的检测实验室开展的质量保证的有效方法。
2 国际影响
1983年,22家来自瑞士、德国、奥地利和意大利等 4 个国家的纺织实验室参加了第一次纱线循环对比测试。2000年举行了色牢度循环对比测试,2005年举行了织物性能循环对比测试,2010年举行了功能性循环对比测试,循环对比测试的范围正在不断扩大,影响也远远超出了欧洲范围。在此期间,测试吸引了来自世界各地的参与者,其中增幅最为明显的是亚洲地区(图 1)。
多年来,定期参加完整循环对比测试项目的纺织实验室的数量已经增长至350多家,它们分别来自36个不同的国家和地区,部分测试项目增长如图 2。
3 市场变化
3.1 测试认证资质
与TESTEX其他测试服务一样,循环对比测试项目也通过了认证,自2011年起,即符合ISO 17043《合格评定能力验证通用要求》(原ISO 17025)的标准。这不但保证了样品的一致性,而且使数据收集以及分析在前得到验证。
3.2 项目参与方式
通过在TESTEX官方网站查询测试的时间安排表,可以确保参与者知晓下一次的寄送时间以及循环对比测试的当前状态。这些日期可随时查询,方便参与者随时登记参加相关项目,可以防止由于年度周期各不相同而错失机会的情况发生。
通过登记注册,参加者成为相关利益方。缴纳所需的年费即可享有会员资格,并可参与相关的循环对比测试。除非参与者主动退出项目,否则将于次年自动续约。
确保每位参与者以匿名方式参加测试,是循环测试的关键。TESTEX为每位参与者分配了一个名为“实验室号”的编号,以便对参与的实验室进行匿名分析。TESTEX对所提交的结果数据以及对相关实验室的分析结论的保密性,给与最高优先权。
3.3 测试项目内容
近年来,原料特性方面的要求日趋严格,消费者不断要求生产者提供更多的透明信息,同时对纺织品性能的测试能力也显著提高。这些都使得包括功能性循环对比测试、色牢度循环对比测试及织物性能循环对比测试在内的测试内容不断丰富。除了对传统机织和针织面料的基本要求外,该测试中还涉及了对用于个人防护用品(PPE)的具有纺织技术特性的材料的要求(图 3)。
3.4 测试项目数据
截止日期前收到的所有结果都在考虑范围内,测试结果均进行集中记录,并在综合报告中进行客观分析。报告的电子版本将以下载链接的形式提供给参与者,内容包括以表格形式提交的所有测量数据以及关于测试条件的基本信息(表 1)。经验表明,受特定仪器影响,测试结果往往可能会出现波动。
为了对可比性进行有效分析,TESTEX为参与者提供了包含详细信息的指导说明。
当某个实验室的某项数据与其他实验室的数据出现较大偏差时,与平均值偏差达到±1.5σ(标准差)的数据均会在分析中以(o)标出。与平均值的偏差超出±2σ范围(科克伦法异常值检验或95%概率测试)的测试结果,以及超出偏差系数值的测试结果,无法进行有意义的统计分析,均会在分析中以(x)标出。此类值不包括在最终的平均值中,也不会在图表中显示。另一方面,因为在色牢度循环对比测试中设定的容差为半级,所以与平均值的偏差超出±1σ级别的数值也将排除在外。
为了提供更直观的信息,每个样品的测试结果均以图表形式清晰列出,以便每个参与者根据分配的实验室编号,迅速了解其测试结果在整体中的水平。
测量数据直观可见。单个结果与整体平均值之间的偏差(增量值)以百分比形式列出,此处的0%表示所有参与者的平均值,偏差越小表示自身的测试值越接近整体平均值(图 6)。
4 未来展望
30多年的经验表明,组织和分析循环测试是了解测量数据在整体中水平的最简单有效的方法之一,测试需求也正在不断扩大。因为它有助于重新审视测试方法和测试标准,并在可能的情况下予以优化,现在几乎所有测试实验室都会采取这一质量保障方法。测试材料也早已不仅仅局限于纯纺织产品,而覆盖到了许多行业。为了满足不断增长的需求,越来越多的技术资料需要获取翔实的测量数据,这就包括从抗静电性能到地毯等的特定测试。