首页 > 文章中心 > 数据挖掘学习计划

数据挖掘学习计划

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇数据挖掘学习计划范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

数据挖掘学习计划范文第1篇

关键词:远程教育;数据挖掘;个性化学习系统

中图分类号:G434 文献标识码:A 文章编号:1007-9599 (2012) 12-0000-02

目前网络远程教育的普及使得优质教学资源突破了时间和空间的局限性,使得终身学习成为可能。而当前网络教育的开展,也出现了种种弊端:技术方面,多以教学资料呈现形式的转换为主,只是书本搬家而缺少一定的交互模式;而其不同学习进度、不同兴趣、个性化的学习需要基本不能得到一定的满足,无法因材施教。因此,网络教育需要强大的技术力量帮助学生迅速高效地搜寻到满足其个性要求的教学资源,并对其学习整个进程进行正确指引与科学评价。本文试图设计一种系统模型,利用数据挖掘技术来改进当前的网络教育模式,对每一个学生都提供个性化的学习进程,达到一下学习要求:

学习系统可依照与当前登录学生相似的学生的学习步骤自动的对其后续目标知识进行预测和推荐

针对学生的学习过程进行过程性考核,并依据成绩动态改变学生的学习与练习进程,对此学生的掌握不好的地方进行再次督学

本文依据以上目标,构建了基于Web的个性化学习系统模块(Web-based Personalized Learning Core System 下文简称WPLCS)来满足远程教育中学习者个性化学习的迫切需要。

在该系统核心算法的选型上锁定了数据挖掘技术来构建WPLCS。下面图1便是基于网络的个性化学习系统核心模块(Web-based Personalized Learning Core System)数据挖掘引擎的基本架构:

数据挖掘技术是从多样的、无序的数据中,抽取提炼出有用的信息的过程。因此数据挖掘技术被广泛商用。但在教育领域中应用此技术,就不能简单的套用一些商用模式,因为电子商务中的服务器端在进行数据挖掘时只需知道大量的用户在访问了A页面后又去访问了B或者C页面,证明他们对B、C页面有潜在的兴趣,从而向访问过A页面的用户的客户端动态的推荐B、C页面,以此来达到个性化引导客户访问的目的。

而在网络教育中,若系统锁定学生感兴趣的知识和关注知识页面的时长等信息,不但可以依据此信息灵活地改变练习和考核进程,还可重构网站结构减少网络响应时长。与此同时,在设计网络课程的页面时,力图使嵌有某些特定知识页面和网络课程中的知识点形成映射关系,也就使得系统能够清楚标记出学生对于知识的掌握情况。从而在数据挖掘过程中能够做到以知识点为导向。

WPLCS利用数据处理模块将系统的用户访问日志文件和数据库构建出一个学生基本特征数据仓库,再在此数据仓库的基础上,利用多种数据挖掘算法进行挖掘从而形成学生个性化数据挖掘库。

数据预处理

本阶段首要找准挖掘数据源,本文遴选出系统服务器中的日志文件和系统数据库数据作为数据源。抽取数据源数据形成挖掘库,即学生特征数据仓库。

服务器访问日志的预处理

学生从登录到系统服务器开始,便在此服务器上留下相应的日志文件。它包括登录学生的IP、URL、Cookie等信息。首先抽取网络日志中的信息,再清洗数据缺值等脏数据,最后识别学生的IP及登录Cookie值,合并同一个学生的访问路径请求,将时间跨度大的URL进行相应的区分和记录。

构建数据挖掘库

匹配系统数据库预处理后的数据和服务器访问日志预处理得到的数据,构建出数据挖掘库,即学生特征数据仓库(学习者标识、个人信息、学业信息、偏好信息等)。

数据挖掘

综合考虑不同数据挖掘算法有不同的特点和弊端以及前文所述的个性化学习的要求,在选择数据挖掘算法时,本文选取了序列模式、聚类、关联规则发现等不同算法,并将其有机结合。为了精确匹配当前学生特征模式与规则前项,力争较高的推荐准确率,采取了基于关联规则的挖掘方式进行学习页面推荐;为了得到更高的推荐覆盖率,采用基于聚类分析进行推荐。综合了两种数据挖掘算法的优势,从而改善了推荐的测度。本文将学生特征数据仓库中的数据传送到数据挖掘核心模块来进行数据挖掘,得到的数据再存放到学生个性化数据仓库来完成整个数据挖掘的全过程。

关联规则发现

关联规则发现,即寻找数据项之间的联系规则。在服务器访问日志数据的预处理过程中,将学生访问的页面路径组成了学生访问session集,我们可以利用关联规则挖掘得到学生访问请求间的关联规则。其中比较简单的一种规则为:访问了A页面的学习者中,有60%又访问过B页面。得到这种初始化关联规则后,再通过用户访问页面与知识点的一一映射关系,我们就可以推理出更加实用的规则模式,即确定在学习过A知识点的学习者中有60%的人对B知识点表现出一定兴趣。得到这种有用规则后我们即可对所有访问A页面的学习者的页面上加上B页面的推荐链接,方便学习者导航。

聚类

聚类,即将数据划分到不同的类中,类间的差别尽可能的大,类内的差别尽可能的小,聚类分析实现并不知晓将要划分成几个类,而是利用系统服务器自动化、智能化的计算而得。产生出不同的类后,某学生的特征模式一旦符合某个类后,系统推荐引擎会自动将此学生未来可能访问的页面链接推荐给学生。由此就可以智能化地将处在不同学习阶段的学生匹配到此类本该获得的学习和考核进程。

序列模式

与关联规则发现相仿,序列模式是将数据间的关联性与时间相联系。在实际挖掘过程中,我们可以得到下列序列模式:在学习过B和C两个知识点的学生中有81%的学生在若干天后进行A知识的学习,并且在此过程中大量地频繁访问A2、A5、A7、B2等知识,而且对这些知识点的掌握情况开始下滑。因此我们可以及时干预在此时间段所有学习过C、B知识点的学生,将一定量的练习和测试推荐给他们,帮其熟练掌握上述知识,从而达到因时施教的目的。

作为一种新的教学手段——基于Web的网络教育,当前正方兴未艾。本文旨在通过计算机数据挖掘技术构建出一个智能化的基于网络的个性化学系统,以此来辅助完成对不同学生的个性化教学。从而充分发挥网络教育的优势。

参考文献:

[1]W.H.Inmon 《Building the Data Warehouse》 John Wiley & Sons,Inc. 1996

数据挖掘学习计划范文第2篇

关键词:数据挖掘;教师培训;教师专业发展

中图分类号:TP391文献标识码:A文章编号:16727800(2012)007011302

作者简介:徐海霞(1980-),女,宁夏银川人,西北师范大学教育技术与传播学院硕士研究生,研究方向教学设计;寇艺儒(1966-),男,宁夏银川人,宁夏银川一中高级教师,研究方向为物理学教育理论。

随着教育的不断发展,教师培训已成为促进教师专业发展的一种有效途径。而培训过程中会积聚各种资源,培训结束后也会有大量的数据需要处理。本文利用数据挖掘技术发现、捕获和挖掘有效的信息资源,使分布、异构信息的智能聚合问题得到有效解决,使网络平台上丰富的信息资源得到有效利用与深度共享,以帮助培训者更有效地制定培训规划与培训策略,从而提高培训效果。

1数据挖掘的概念

数据挖掘(Data Mining,简称DM)被称为数据库中的知识发现(Knowledge Discovery in Databases,简称KDD)。有一种比较公认的定义是:数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。简单地说,就是从大量数据中提取或“挖掘”知识。

这些知识是隐含的、事先未知的潜在的有用信息,提取的知识表示为概念、规则、规律、模式等形式。数据挖掘要处理的问题,就是从庞大的数据库中寻找出有价值的隐藏事件,并加以分析,将这些有意义的信息归纳成结构模式,供有关部门决策时参考。此外,数据挖掘看重的是数据库的再分析,包括模式的构建或是资料特征的判定,其主要目的是要从数据库中发现先前未曾获悉的有价值的信息。

2数据挖掘技术的选取

为进一步加强教师培训,全面提高教师队伍素质,在联合国儿童基金会(UNICEF)的资助下,中央电教馆组织实施了基于交互式电视培训课程的“灾区教师培训”项目,加快了教师继续教育学习与终身学习的步伐,基本上每位教师都参与了不同程度、不同学科的培训学习。应用数据挖掘技术将培训对象、学习内容、模块设计、作业、发帖量、培训反思等数据生成数据库,通过对这些网络平台上的数据信息进行分析,可以得到关于培训现状与效果的一些数据信息,用以改进培训过程中存在的不足。更重要的是,通过对这些数据特征的理解与分析,可以开展有针对性的培训预测。本文利用数据挖掘技术来挖掘网络平台上的数据资源,以此来达到资源深度共享,也为提高教师培训网络平台系统的完整性、协调性和高效性。

3数据挖掘在教师培训系统中的应用

在联合国儿童基金会(UNICEF)的资助下,中央电教馆组织实施了基于交互式电视培训课程的“灾区教师培训”项目。该项目是为提高四川、甘肃地震受灾地区的小学教育质量,使四川省北川县、青川县、什邡市、绵竹市及甘肃省西和县这5个县级地区的200所学校的5 000名教师和100 000 名8~12岁的小学生从高质量的教育中受益。并在教育部国家教师培训网站(省略.cn)上建立网络学习模块,实施网络学习远程指导。本文就数据挖掘技术应用于教师培训系统中的培训对象、培训内容设置、培训效果评价等几个方面进行具体分析。

3.1培训对象方面

该项目的培训对象被分成两部分:一部分为资源教师,另一部分为学科教师。资源教师在灾区教师培训中也被称为骨干教师,由各学校的校长、语文、数学、科学等主要学科带头人组成。资源教师在接受培训后,将负责组织和实施各自学校的校本培训,因而在本校的校本培训过程中是核心人物,他们所担任的角色较多,主要是为学科教师集中授课,提供网络指导,并组织、管理校本培训,与网络远程指导团队沟通协调。所以在“灾区教师培训”项目中,我们将资源教师作为一种宝贵的资源纳入教师培训发展的关键环节。利用数据挖掘技术,整理数据信息库,充分利用资源教师和学科教师在项目培训过程中的所有信息(包括姓名、性别、年龄、职务、教龄、学科、职称等)和过程性资料(在项目培训过程中资源教师的作业提交情况、网络平台注册情况、发帖情况、回帖情况、学习成绩等),在分析资源教师和学科教师特征的基础上进行信息处理和数据分析,从中挖掘出有价值的资源信息和培训信息。我们在数据库的属性中罗列出培训对象的所有基本信息,并利用数据挖掘得到了一些意想不到的数据信息,如资源教师的教龄与发帖情况有着正向联系,资源教师与学科教师的职务与网络课程学习有着密不可分的关联。通过数据挖掘,利用足够的信息迭代,修正种种问题,尤其是对资源教师和学科教师的行为、需求及其在校本培训过程中的指导研究,可为教师培训提供科学的决策依据,以此提升教师培训的效果。

3.2培训内容设置方面

数据挖掘学习计划范文第3篇

决定经济增长的因素很多,人力资本是其中之一。鉴于人力资本系统构成的复杂性,通过对自组织数据挖掘理论与方法的分析,阐述它对人力资本指标体系功能和模型预测功能,并强调,自组织数据挖掘理论为有效而准确的人力资本系统复杂性研究提供了有力的理论依据,为人力资本研究提供了新的思路。

关键词:

人力资本系统;自组织数据挖掘;复杂性

舒尔茨认为,人力资本是指劳动者的劳动能力(通过五个方面投资而获取)。在《人力资本投资》一书中,舒尔茨将人力资本投资的范围分为五个方面,即⑴正规教育;⑵在职培训;⑶卫生保健;⑷校外学习计划;⑸流动迁移。我国部分学者对人力资本投资估算范围主要有:侯凤云对教育、科研、文化、健康、干中学和就业迁移六种类别分别进行了测算,是根据中国的实际情况而确定的测算范围;钱雪亚对人力资本测算范围,包括教育、在职培训等类的投资。测算范围的确定与测算的结果有决定性的关系。对人力资本的测算与衡量,国内外学者未考虑到人力资本是复杂系统(人力资本的测算范围与经济增长之间存在着某种“黑箱”,即对人力资本投资所确定的人力资本存量,并将人力资本存量通过劳动(脑力劳动或者体力劳动)物化在商品当中,这个过程能够直接推动经济增长,他们(人力资本存量与经济增长)之间存在非线性映射关系。)所以,本文提出一个新的观点:“自组织数据挖掘理论是人力资本系统复杂性研究提供了有力的理论依据,为人力资本研究提供了新的思路”。

一、自组织数据挖掘理论与方法的发展过程

选择学说是自组织数据挖掘理论基础。是建立在“遗传-变异-选择-进化”的进化论原理基础上的。自组织数据挖掘算法是从一个简单的数学模型(根据面板数据或者截面数据、统计数据样本来建模)集合出发,按一定的法则(根据自己研究的目的来确定)进行组合,产生了新的中间待选模型(筛选条件),再经过中间模型进行筛选(根据数据情况而定),不断重复“遗传-变异-选择-进化”这个过程,使其“中间待选模型”复杂度不断增加(从简单到复杂逐步改进,特别是循环过程的次数),最后得到最优的复杂模型,这个最优模型就是与自己研究目的相关的模型。对于人力资本系统,其特征是劳动者(卫生保健投资维持生命的延续)、自我不断提高(教育、在职培训投资)、不断适应环境变化(迁移投资),所以人力资本系统属于自组织系统,把人力资本归于自组织系统是一个创新。所以,利自组织数据挖掘理论可以建立人力资本系统最优复杂模型。

二、人力资本形成与指标体系建立

本文采用侯凤云六种类别。所以,本文将人力资本投资内容(范围)定为教育培训、医疗保健、劳动力迁移、经验技能和科研,建立人力资本指标体系:如表1。

三、揭示人力资本指标体系功能

“竞争而产生的优胜劣汰”是生物进化过程,自组织数据挖掘建立模型过程就是从简单系统到复杂系统演化过程,本文用贺昌政自组织数据挖掘方法,揭示了人力资本存量测算因素的功能,它能够影响的因素(19个因素)中筛选出对人力资本存量测算重要影响因素,其中外准则起着关键作用,外准则就是对人力资本存量测算因素进行筛选条件,筛选条件不能对存量的结果有大的偏差,最后对偏差进行检验。偏差越小,评价模型质量较优。

在模型构造过程中,消除建模者参与而给计算机选择自由是自组织数据挖掘算法的目的。建模者仅仅要做的是提供样本数据(截面数据或者纵贯数据),外准则算法类型,只能通过选择准则的形式来影响建模的结果(选择最重要的影响因素来确定人力资本存量的结果),然而,建模者对研究对象模型的主观想象(主观性)与建模结果无关,从而保证了模型选择的客观性。例如人力资本指标体系中劳动力迁移研究。建模者要完成的工作:样本区间(1990-2014年)数据采集;算法类型:用最小偏差准则;系统输出Y:劳动力迁移指数;系统输入(可能的影响因素):x,i=1−5i,共5个变量。

用自组织数据挖掘算法,计算机自由选择筛选出的模型含3个变量:农村居民人均纯收入,乡镇企业就业人数,从业人员占总人口比重。自组织数挖掘算法通过最优复杂度原理能够对人力资本存量进行预测,是人力资本系统的复杂性研究的另一个重要内容,为人力资本存量的测算提供新思路。

参考文献:

[1]舒尔茨.人力资本投资[M].北京:北京经济学院出版社,1991:9-10.

[2]侯凤云.中国人力资本投资与城乡就业相关性研究[M].上海:上海人民出版社,2007.

[3]钱雪亚,王秋实,刘辉.中国人力资本水平再估算:1995—2005[J].统计研究,2008,(2).

数据挖掘学习计划范文第4篇

关键词:大数据;教育领域

大数据(big data),又名巨量资料、海量资料。麦肯锡全球研究院报告《大数据:创新、竞争和生产力的下一个前沿》对大数据所做定义如下:大数据是指数据量大小超出了传统数据库软件工具的抓取、存储、管理和分析能力的数据群。大数据必定具备四个特征:容量大(Volume),指数据的存储容量单位已经由GB、TB上升到EB、ZB、YB,甚至更高的级别;速度快(Velocity),指海量数据的创建、传输和分析速度快,一般要求响应时间要控制在秒级单位内;类型多(Variety),指数据类型多样,除了结构化的事务数据,还包括半结构化的网页数据、非结构化的视频和音频数据;价值高(Value),指数据价值密度低,但海量数据综合价值总量很高。

大数据时代的来临对各行业都产生了深刻的影响,教育领域也不例外。学员的学习行为、思维方式,教员的授课理念、教学方法,学校的教育管理、教学评价无一例外都受到大数据的影响。教育领域必定会在大数据技术的推动下发生深层次的、多元化的创新与变革。

一、大数据对教育领域的影响

1.教育理念与教学评价被迫革新。教育作为社会子系统的重要组成部分深受社会形态影响,现代的教育体系几乎是伴随着工业社会发展同步发展的。市场的扩大与提高,对劳动者劳动技术与经验的要求远远高于个体层面的文化修养,合格劳动力的衡量标志是能不能解决问题。这一实用主义特点对教育领域的影响是巨大的。传统的教学评价不论对学员还是对教员,总是依赖能力测试,通过考试分数的数理统计分析来评价学员与教员。在大数据时代,则是跟踪记录教员与学员教与学的长期行为并对之进行分析,采用过程性、归纳式、多元化的方式进行评价。

2.个性化教学得以真正实现。运用大数据技术,在线平台能实时记录每一位学员的学习行为,教员获得全面丰富的数据内容后利用数据挖掘技术加以整合分析,不但能掌握学员个体的学习状态、知识接受水平,还能了解哪种教学方法对该学员最有效,以及该学员具体的薄弱点。教员根据这些数据就可以针对学员个体因材施教,制定个性化的教学方案、教学活动和学习计划,教学工作真正从共性化的群体教学转向了个性化的个体教学。个性化教学的实现能大幅提高教员的教学质量和学员的学习效果。

二、大数据在教育领域的应用模式

大数据在教育领域的应用模式本质上就是数据的生命周期,即数据获取(学员使用在线教育系统)、数据存储(系统将学员的在线学习行为记录下来存入数据库)、查找与分析(进行数据挖掘,预测学员的各项表现)、可视化(对数据挖掘和预测结果进行可视化处理)、决策(教员与教学管理人员给予学员指导与支持)。

1.教育者角度的应用,即教学领域知识模型构建。大数据教育系统对现有的教学内容建模后通过数据挖掘、学习分析和在线决策各子系统,研究各专业学员所必须掌握的教学知识点、教学单元与教学课程之间的逻辑关系,最终重新构建领域知识结构,对现有的教学内容与方法进行改革,达到提高学员学习效果和教员教学效率的目的。

2.学习者角度的应用。(1)个性化课程分析。大数据教育系统首先获取某个学员以前的学习表现,从已毕业学员的成绩库中匹配与之相似的学员,分析已获得的成绩和待选课程表现之间的相关性;然后通过学习满意度调查问卷分析评估学员个人情况;再结合专业课程的重要性,为学生列举课程清单。并向其推荐有可能取得优秀成绩的课程。(2)辍学行为预警。大数据教育系统可以记录所有学员的课程学习信息,进行教学情况实时监测。当旷课、违纪、课堂表现等与辍学行为相关的关键因素发生变化时,系统会及时对学员行为做出评估,并在风险达到一定阈值时向教育管理方发出预警,使教育管理方有足够的时间在辍学行为发生前进行提前干涉。(3)助学需求预测。大数据教育系统可以通过收集校园卡的生活与消费记录,以一日三餐为主要权重指标对生活必要开销进行计算评估,当发现某学员的消费明显低于预警线时,会主动通知学校相关管理方,由相关部门与学员进一步沟通,并进行相应调查,判断该学员是否需要助学帮助。

3.其他应用。当大数据教育系统与其他领域的大数据系统互联互通后能发挥的作用不可估量。比如,与社保、医疗、金融、公安、政府等大数据实现安全共享后,教育系统内所有学校与学区内的情况可以从各个角度可视化地展现在出来。大数据系统既能帮助学员从选择学习合作小组到职业规划的制定等各个方面进行辅助指导,也能帮助国家层面的教育管理者制定宏观教育政策、调整教育改革方向、分配教育资源。

总而言之,大数据在教育领域的应用惠及该系统内学员、教员、教育管理者、教育研究者等所有人员,它是未来教育发展的必然趋势。但作为新生事物,大数据具体的应用还不成熟,需要在实践探索中不断改进完善。

参考文献:

数据挖掘学习计划范文第5篇

【关键词】 在线学习;学习过程管理;大数据思维;学习分析

【中图分类号】 G434 【文献标识码】 B 【文章编号】 1009―458x(2016)11―0017―05

现代信息技术对教育领域产生着越来越深远的影响。以大数据、云计算、移动互联网等为特征的信息化手段,催生出各种新的学习模式、教学模式和管理模式。教育部在《关于“十三五”期间全面深入推进教育信息化工作的指导意见(征求意见稿)》中指出:党的十以来,“互联网+”行动计划、促进大数据发展行动纲要等有关政策密集出台,信息化已成为国家战略,教育信息化正迎来重大历史发展机遇,我们要坚持融合创新,拓展教育信息化应用广度与深度,依托网络学习空间逐步实现对学生日常学习情况的大数据采集和分析,优化教学模式。(教育部,2015)因此,利用互联网和信息技术促进教育大数据建设与应用,有效开展在线学习并实现过程管理,不仅是开放大学、各高校网络学院、各类培训机构的主要教育目标,也是我国教育信息化发展的重要任务,是构建继续教育公共服务平台,扩大教育供给,促进教育公平,完善终身教育体系的主要途径。

在当前互联网+环境下,大数据思维被越来越广泛而深入地应用到教育领域,数据分析结果越来越多地影响管理和决策。在教育实践中,我们如何对海量信息进行有效而充分的采集和挖掘,同时又要避免对数据和技术产生过度依赖,陷入技术决定教育和数据决定管理的误区(郑争文,2016)?本文通过分析国内当前在线学习过程管理现状和学习者学习过程中产生的相关数据,探讨如何应用大数据思维来提升在线学习者的学习效果、在线教育的教学效果与管理水平,并以在线学习过程管理大数据应用为例,探讨互联网+环境下教育大数据管理的新思维和新模式。

一、在线学习过程管理现状

在线学习是随着网络技术发展出现的新的学习模式,是远程教育发展的新阶段,是利用计算机互联网和移动互联网,通过依托于网络的学习平台和管理平台建立虚拟的学习环境实施教学、开展学习的过程。

我国在线教育于2000年前后缓慢起步。1999年,中央广播电视大学在电大系统启动“开放教育”试点;2000年,教育部批准68所高校建立网络教育学院,同一时间,新东方网校上线运行;2010年,在线教育开始蓬勃发展;2012年美国三大MOOC平台催生了国内千百计企业加盟教育培训,进军在线教育特别是高等教育市场;2014年,随着国务院“取消和下放利用网络实施远程高等学历教育的网校审批”,我国在线教育市场走向开放和多元化;2015年,“互联网+”时代到来,为我国基于信息技术的在线教育带来新的机遇与挑战。

我国在线教育学习过程管理存在几个普遍性现象:一是教、学、管分离,使得信息碎片和数据孤岛问题凸显(顾小清,等,2014);二是各高校或培训机构信息技术与教育教学的深度融合不够,对整个学习周期的管理缺乏顶层设计,导致诸多平台运行不力,管理模式固化,数据标准不统一;三是在教学和资源建设方面,教学设计和课程资源面向所有学习者,没有考虑对不同学习者的适用性,无法满足其个性化需求,也就无法实现真正意义上的个性化人才培养;四是在学习支持服务方面,大众化的学习支持多,个性化的学习支持少(吴南中,2015);五是缺乏对学习效果、教学效果的有效评价和激励机制,在线学习活动的参与度低,学习任务的完成率差。此外,在线课程学习的课程完成率低,在线学历教育的毕业率明显低于传统教育的问题一直是困扰远程教育可持续发展的难题之一,特别是在缺乏有效的教学约束管理和学习支持服务的情况下这一现象尤为明显。

二、大数据思维对在线学习过程管理的启示

与传统数据相比,互联网和信息时代产生的大数据呈现出在线、实时、全貌的显著特征。如果说传统数据产生出自然价值,大数据则衍生出智慧价值,它深刻改变了人们对待数据的思维方式,这主要体现在:一是总体思维,从原本只能采集样本数据到获取全面、系统的所有相关数据;二是容错思维,从微观和精准性向宏观和包容性转变;三是相关思维,不再执着于对数据进行因果关系的分析,而是聚焦到相关关系和对未来的洞见与预测分析;四是智能思维,使线性、简单的机器思维变得像人脑一样呈现出主动性、逻辑性和前瞻性。

针对在线教育领域,我们可以把大数据思维应用到在线学习过程管理中,以数据为核心梳理架构管理流程,利用全样本数据搜集协助管理判断,通过对过程数据的快速获取实现管理高效,通过过程相关性数据分析预测管理风险,把数据处理结果转化为管理决策支持,探索实现管理主动性和智能化的渠道。例如通过对多维度、多元化、分散异构的海量在线学习相关数据进行采集、分析和挖掘,研究学习者需求,推荐适用不同个体的学习资源,避免其面对海量信息却无法提取有效资源而产生空茫状态(杨现民,等,2016);研究学习者特点,协助其制定个性化的学习计划;研究学习者学习过程,通过及时有效的技术支持与信息推送服务,缓解在线学习者由于时空分离、师生分离产生的孤独感;研究学习者学习生命周期中的动态影响因素,进行评估预测与风险预警等。

在在线学习过程管理中应用大数据思维和技术,跟踪学习者学习过程和学习行为,跟踪教学活动与学习者参与状况,进行教学质量监控,对学习效果、教学效果、资源适用度等进行评估预测,具有积极的现实意义:① 挖掘有效学习模式,助力在线学习者学习能力和自我管理能力的提升,实现深度学习; ② 掌握学习者学习动因与需求,为在线学习者提供真正意义上的个性化教学与支持服务;③ 促进在线教学模式的改进和教学效果提升,提高教学活动参与度,降低辍学率(谢洵,2016);④ 为教学管理和科学决策提供智慧支撑;⑤ 促进数据标准统一,实现信息共建共享,促进教育的透明与公平。

三、在线学习过程管理大数据建设关键问题探讨

在线学习者的学习过程概括讲包括学习内容选择(课程资源或专业)、就读学校或机构选择、注册缴费、参加教学活动、自主学习、学习效果考核与评价、成果获取(如获得毕业或课程证书)。在线学习者的学习过程,由于处在虚拟网络和课堂中,又受到诸如学习者特征、环境、工作与生活状态、对教师与资源适应度等多种因素影响与制约,因此在线学习过程管理大数据建设与应用,要关注以下几个关键问题:

1. 化零为整与化整为零的思维

大数据是一种新的思维方式,一种解决问题的新方法(赵靖岩,等,2016)。化零为整就是要收集与学生学习过程相关的各类碎片化信息,进行分类统计,通过大数据建模,形成结构化的数据表或可视化的分析结果,据此对学习、教学和管理进行评估和预测。化整为零是对大数据所呈现结果的反馈与落实,关注到每一位学习者个体分析结果,对教学与管理从每一个细节进行调整与改进。例如依据在线学习特点对资源进行分解制作微课,依据风险预警为每一位学习者提供有针对性的信息推送服务,教师依据学习效果评估实时改进教学设计,在教学过程中为学习者提供个性化支持等。

2. 关键数据库的建立

数据采集是大数据应用的首要和基础工作。围绕在线学习者的学习过程,要建立一系列关键信息数据库:① 学生信息库,包括个人基本信息、学习者特征、环境、学习动因与目标等;② 师资信息库,包括学习过程涉及的专业负责人、课程责任教师、课程辅导教师、导学教师、技术支持教师、教务管理教师等各类师资;③ 课程资源库,包括围绕课程学科建设的系统资源、针对课程模块提供的支撑素材、各类专题研究与讨论等;④ 学分与成绩库,记录学习者围绕课程或专业学习的阶段性和终结性学习效果与获得成果及相关信息;⑤ 教学过程信息库,采集教学实施过程中的教学策略、教学行为、教学活动、技术运用、教学效果等信息;⑥ 质量评价保障信息库实现多元化质量因子采集与质量标准的确立。

3. 数据的互通性

互联网极大地促进了数据的开放,但基于在线学习的各类高校和教育机构都建有独立的诸多教学、教务、考核等管理平台,这些平台使用不同的开发工具和数据库技术,必然造成数据管理上的独占性、封闭性和数据范式的不一致。因此,大数据应用需要更高层面的统筹规划和顶层设计,建立开放的、采用相同范式和标准的数据接口,实现数据管理的标准化和数据互通共享。2015年9月正式启动的国际开放数据就提出了开放数据必须保证互通性的倡议,提出将努力“制定并实现统一、开放的数据标准,从而确保数据的格式、结构和通用标识符都具备互通性”(高丰,2016)。

4. 数据的有效性

信息技术的飞速发展使海量的数据采集变得越来越高效,但并非收集的基础数据量越庞大,分析预测的结果准确性就越高,大量无效的信息不但会造成冗余,影响数据处理的效率,更重要的是会干扰数据加工过程与风险导向,使预测结果偏离最接近真实的方向。因此,有效数据的遴选是在线学习过程数据采集的首要任务。

5. 数据的时效性

大数据应用中,反应速度极为关键。我们知道,大数据获取的不仅是历史数据,更重要的是即时数据。数据从产生的一刻起,就是有不同生命周期的,这就决定了数据价值会随时间发生动态变化。因此,在线学习过程管理大数据应用中要重视数据采集、数据挖掘与结果呈现的时效性。要确保预测结果的有效性和价值实现,建立对在线学习过程相关数据的快速反应机制就显得尤为重要。

6. 分析结果的准确性与质量

数据分析结果的准确性和质量直接影响管理决策方向。对于在线学习过程管理中关键环节的教学评价,在数据建设中要聚焦于实现教育质量保障的理性、透明性、可测量性和专业性,建立一种相互信任、权利与责任相平衡的质量文化(张应强,等,2014)。要重视对在线学习参与水平而不仅仅是参与度的数据研究,通过大数据应用探索有效的测量标准、方法与机制。对此,美国雪域大学DI Sun提出了测量学习者参与水平的三要素,即情感参与、认知参与和行为参与,并构建了包含21项条目的量表(梁林梅,等,2016)。这些研究成果可作为我们探索在线学习过程管理大数据挖掘和分析的参考。

7. 人的因素

对大数据进行加工处理,依托的不仅仅是数据分析软件和信息技术,更重要的是人的参与。数据挖掘的灵魂是智能算法,通过对数据的分析、整合与设计实现信息向价值的转换,体现的是人的智慧与思维。因此,在线教育的教师和管理者要具备一定的大数据思维和数据挖掘基础知识,做既懂得数据分析技术又谙熟各项具体业务的复合型人才;大数据建模与应用的技术实施者,同时要了解并熟悉在线教育的特征和发展现状,要跟踪在线教育的新变化和新理念,才能挖掘教育大数据所潜藏的更高价值。

四、在线学习过程管理大数据

应用模式设计

大数据应用遵循数据采集、数据加工、结果呈现的基本模型。其中,数据收集是大数据应用的最基础最底层任务,通过数据采集将数量庞大、结构复杂的信息汇聚起来建立关键信息数据库。依据不同模型对收集到的各类数据通过挖掘和分析等技术手段和设计进行预处理和再加工,最终转化为可视化结果输出并落地应用,是大数据管理要实现的核心目标。依据不同的研究领域,大数据管理衍生出诸多不同的更具体的应用模式,这里围绕在线学习过程,从学习分析、教学分析以及二者相结合的维度对大数据管理模式进行探讨。

1. 学习分析模式

学习分析是大数据在教育领域的典型应用(王良周,等,2016)。新媒体联盟(New Media Consortium)将学习分析定义为:利用松散耦合的数据收集工具和分析技术,研究分析学习者学习参与、学习表现和学习过程的相关数据,进而对课程、教学和评价进行实时修正(徐鹏,等,2013)。以在线学习者及其学习过程为主体,对在线学习过程进行分析的过程同样如此。它通过收集学习者特征、学习背景、学习动因与需求等数据,跟踪学习过程中的状态、行为、影响因子、资源利用、作业与考核情况等信息,利用预设的模型对数据加以分析,并呈现出可视化数据分析结果。在线学习分析的大数据应用主要体现在:在保护学生个人隐私的基础上,尽可能全面并有效地反映客观真实;能预测学生的学习行为与需求,实现有针对性地为学习者提供支持和服务;依据正确的判断进行风险预警,并体现关键性和前瞻性;能够挖掘有效的个性化学习模式,提升学习者的学习能力、自我调适能力和管理能力。

2. 教学分析模式

在线学习教学分析围绕教师的教学周期进行,聚焦于教师特征提取、课程资源建设、教学活动设计、线上互动学习设计、线下任务部署、学生资源访问情况、活动参与情况、考核与学习效果评价、教学评价等环节,在数据采集和分析的基础上,力争针对每一位学习者实现真正意义上的“因材施教”。对在线学习教学分析应用大数据思维的重点聚焦在三方面:一是从互联网海量的公开资源中遴选优质、适用的资源应用于课程教学;二是通过跟踪教学活动参与效果与学生行为,及时调整、改进教学设计手段与策略方法,激发学习者学习动力,提升其学习效果;三是通过对整个教学过程的跟踪反馈与评价,找到提高课程整体设计水平和资源质量的切入点,同时提升在线课程责任教师、在线辅导教师的教学能力和教学效果(郑燕林,等,2015)。

3. 学教管相结合的分析模式

学习、教学和管理在在线学习中是交叉进行并互相影响的。随着教育领域中大数据应用逐渐引起关注,功能相对单一的“学习分析系统”已经不能满足互联网+环境下教育发展的需要。学习者希望能利用碎片化的时间学习到丰富有用的知识或技能,实现高效能又不枯燥的学习;教师希望设计出受欢迎的优质课程或资源,开发学习者感兴趣又能保持高参与度和持久度的学习活动,展现教师的价值与成就感;管理者希望能建立一个通畅的管理流程和渠道,并实时捕捉过程中发生的问题和需求,实现高品质服务和高效率管理。上述三者目标的共同实现,将促成学校或机构的品牌建立与影响力提升。于是,学教管相结合的大数据分析模式应此而生。这种分析模式如图一所示,它具备统筹规划与顶层设计,围绕学习者整个学习周期,从更全面的多元化的角度收集数据,在有专业技术人员进行大数据平台搭建的基础上,结合实际需求与发展趋势对数据进行算法设计研究,再将处理结果在学习、教学与管理中落地应用,并在实践中不断调整和改进。

结束语

终身学习已经从教育观念发展成为全球性的共同行动,成为人们不可或缺的生存和生活方式,在线学习作为实现终身学习的必要途径,以其丰富多样的资源、多元化的教学方式、自由灵活的学习方式、开放包容的入学条件等优势,受到越来越多学习者青睐。2015年在青岛举行的国际教育信息化大会上通过的《青岛宣言》中指出,“在线学习,包含大规模开放在线学习课程(MOOCS),具有建立迈向高等教育和终身学习新路径的潜力。我们鼓励那些为改进在线学习而探索大数据潜力的努力,这使我们深入了解学生行为和学习活动,并且改进在线课程的设计和组织形式。”以信息技术为手段,对在线学习者学习过程产生的大数据进行研究,是一项复杂的系统工程,探讨更适应学习者个性化的学习模式,不断改进教学模式,建立先进的管理体系,是在线教育工作者不懈努力的目标。在此,笔者结合多年在开放教育一线教育教学管理经验,谨以此文与从事在线教育的同行们就在线学数据思维与应用进行探讨,以期引发对在线教育大数据更深入的研究。

[参考文献]

徐鹏,王以宁,刘艳华,张海. 2013. 大数据视角分析学习变革[N]. 远程教育杂志(6):11-17.

顾小清,郑隆威,简菁. 2014. 获取教育大数据:基于xAPI规范对学习经历数据的获取与共享[J]. 现代远程教育研究(5):13-22.

吴南中. 2015. 基于教育大数据的MOOC支持服务特质与形成研究[J]. 中国远程教育(12):49-55.

张应强,苏永建. 2014. 高等教育质量保障:反思、批判与变革[J]. 教育研究(5):19-26.

郑燕林,柳海民. 2015. 大数据在美国教育评价中的应用路径分析[J].中国电化教育(7):25-31.

王良周,于卫红. 2015. 大数据视角下的学习分析综述[J]. 中国远程教育(3):31-37.

教育部. 2015. 关于“十三五”期间全面深入推进教育信息化工作的指导意见(征求意见稿)[EB/OL].

谢洵. 2016. 聚焦远程学习的多元化实践与研究[J]. 中国远程教育(1):73-76.

赵靖岩,胡振波. 2016. 大数据环境下高校信息化教学模式研究[J]. 情报科学(1):92-95.

高丰. 2016. 共治共创视角下的开放数据发展:趋势、挑战和反思[J].大数据(2):38-45.

梁林梅,夏颖越. 2016. 美国高校在线教育:现状、阻碍、动因与启示[J]. 开放教育研究(1):27-34.