首页 > 文章中心 > 数据分析的统计学基础

数据分析的统计学基础

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇数据分析的统计学基础范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

数据分析的统计学基础

数据分析的统计学基础范文第1篇

应用统计专业学位的设立是为了适应现代统计事业发展对应用统计专门人才的需要而设置的,它的培养目标主要是让学生掌握扎实的理论基础和系统的专业知识和技能,具备数据采集、整理、分析和开发的能力,能够从事统计调查咨询、数据分析等“应用型”统计专门人才[5]110-111。然而,在大数据环境下实现的数据分析已不再局限于某一类特殊的行业统计分析需要,各行各业的运作发展都越来越依赖于大数据环境的存储、计算、统计分析与决策。对于多样化的大数据集,其所涉及的内容和知识结构必然是不同学科的交叉应用。大数据时代的数据分析专业人才的培养目标并不仅仅是传统的数据收集、整理与分析,而是需要掌握能适应大数据特点的新的研究方法和独立分析的能力,能很好地融会贯通其他专业的知识内涵,成为真正意义的专业大数据分析人才。然而传统的统计学人才培养目标和教学模式并不符合社会对大数据分析专业能力的要求。参考和借鉴文献[6-7]8-9,226提出来的一些建议,笔者探索从以下几个方面对人才培养目标和教学培养模式进行改革:(一)走出校园,深入社会,挖掘并归纳出社会用人单位对数据分析专业职位技能和能力素质要求,进而制定符合社会需求的人才培养目标,以市场需求为导向更好地指导教学实践活动。为了更好地为用人单位输送符合大数据时代需求的专业数据分析人才,尝试对高年级学生的培养方案设计中考虑以岗位需求为标准灵活调整和制定相应的培养目标和内容。(二)参考国外本科生专业人才培养的先进理念,引入“协作式”培养模式,大力支持大型企业与高校合作或高校与高校合作培养复合型和开发型人才。各个高校、企业可以发挥各自专业特长来实现合作,高校的不同专业之间也应该加强沟通和协作,例如在制定应用统计专业数据分析人才培养方案及实施过程中,可以以统计学科所在的学院为主导,让计算机学科、经济、金融及管理学科等相关学院协作参与完成[8-9]60-64。(三)总结教学过程存在的不足,探索新的知识学习和能力培养的创新模式。目前的教学活动主要以老师独立授课,学生被动接受知识为主的方式,培养过程计划性强,缺乏弹性,培养的评价也过于单一。在本科生培养中可以引入课程学习、导师指导和科学研究三个阶段,考虑采用导师指导与集体培养相结合的方式,一门专业课程的讲授不再局限于单个老师完成,在培养方案中考虑主题分组方式,鼓励授课教师根据自己的专业特点和知识背景共同参与一门课程的教学活动。多名教师协同工作的模式可以取长补短,在大数据分析的实际案例设计及课程内容上都更加贴近实际需求,产生更好的教学效果[6]8-9。

二、基于大数据分析的特点科学构建课程体系

大数据背景下,人们可以通过互联网、数据库以及各种通信工具获得海量数据,人们日常生活、学习和工作的各类事物都可以实现信息化,世界几乎是由各种信息和数据所构成的。大数据的特点可以归结为四个V,数量大(Volume)、类型繁多(Variety)、价值密度低(Value)、速度快时效高(Velocity)[6]8-9。大数据的真正意义不在于能提供庞大的数据量,而是对海量的数据进行专业的处理和分析,并从中获取用户关注的信息。结合当前互联网应用中大数据本身的特点,从大数据中挖掘出重要知识并对之深度学习和分析的工具和方法也应与时俱进地发生改变,传统的统计方法和统计分析工具已无法满足大数据分析的需要。然而,在大多数高等院校中,统计学专业人才培养的课程体系并没有考虑社会的实际应用需求,仍然停留在以传统的统计模型框架为主导的课程体系设置,本科生教育的主要专业课程包括:数学分析、高等概率论与数理统计、应用随机过程、回归分析和多元统计分析等[10]248-249,这些课程内容和知识结构还不足以满足大数据时代对数据分析专业人才知识结构的要求,课程体系设置中缺少能有效整合的数据分析能力培养模块[11]66-68。因此,有必要针对各类院校师生各自的专业特点和学科基础,分层次、分阶段地展开课程体系改革。(一)参考国内外先进高校大数据分析专业的课程设置,结合本校的师资和专业结构特点采取灵活的策略制定课程计划,在实施学分制改革的高校中各类学生可以在学业导师指导下实施符合学生自身特点的课程学习方案。(二)以大数据分析人才需求驱动的课程体系改革要考虑市场的行业需求变化、大数据应用中跨学科的特点。素质好的数据分析人员不仅仅要具备专业的数据分析能力,还应该对具体数据中涉及的学科知识有较好的储备,能将不同行业的专业知识与数据分析紧密关联起来,实现大数据分析的效用最大化。此外,在充分借鉴国内外大学成功经验的基础上,课程设置应该与学生的学术倾向和基础能力紧密结合,注重基础课程教育的同时强调文理渗透,同时要兼顾学生的兴趣与学习的联系,在课程体系的设置中需要增设一些多领域、跨学科的选修课程,如经济学、金融学、保险学、管理学和会计学等。因此,校内跨学科或高校与高校之间联合培养是实现跨学科课程建设的有效方法之一。(三)科学构建课程体系的主要思路还包括根据大数据时代需求,对专业必修和专业选修课程在课程时间、顺序及内容等方面进行改革。专业必修课程重点内容为统计学和计算机科学的交叉部分,在讲授统计基础理论(如多元统计、决策树、时间序列等)课程基础上设置大数据案例分析课程,在案例分析过程中让学生实际操作企业当前应用的大数据计算平台[6]8-9,从而增强学生大规模分布式计算技能。为提高学生的实际动手和二次开发能力,专业选修课程需更多地开设与数据挖掘及面向数据的编程语言相关的课程,如数据挖掘算法、C++、Java和Python等课程,强化学生的数据挖掘和分析能力。

三、基于协同创新的理念开展实践教学改革

近几年,随着应用型、创新型人才培养目标的提出,学校越来越重视和加强对各类专业人才实践教学能力的培养,以“数据分析”为方向的专业人才需要运用统计分析软件对数据进行分析和决策,其实践教学的重要性更是不言而喻。然而,在大数据被广泛应用的时代背景下,高等院校中的实践教学仍然是培养高层次“大数据分析”人才的薄弱环节,实践教学教材及内容不规范、教学方法单一、软硬件的更新以及师资储备等方面都存在着一些问题[12]96-97。例如以模型驱动为主的实践教学模式已不适应大数据时代的要求,大数据时代数据是海量且复杂的,用简单的SPSS、Eviews为主的软件教学已无法处理大数据[5]110-111。因此,学习其他知名高校构建的协同创新的理念,结合财经类院校的统计学科及人才培养的特点,开展实践教学改革[13]248-249。对“数据分析”专业人才实践教学改革,笔者的建议如下:(一)根据协同创新理念,解决实践教学环节存在的实验教材(教学内容)缺乏实用性的问题,一方面可以参考企业对数据分析师、调查分析师资格认证相关培训教材,开发实用性强的《数据分析》实践教材,另一方面学校可以和企业或其他高校定期举办交流座谈会,面向企业需求甄选实践教学内容。(二)高素质的师资队伍对人才的培养无疑起着至关重要的作用,在提高指导教师理论和实践能力方面,借鉴协同创新联合培养的模式可以有效充分地利用企业、学校的各方面师资资源。例如北京大学、中国科学院、中国人民大学、中央财经大学、首都经济贸易大学5所高校已经与政府部门和产业界签署了联合培养大数据分析应用人才的合作协议[14]。广东财经大学也可以参照类似联合培养的做法,和广东其他高校、政府和企业合作。一方面企业或政府可以利用自身的资源为高校提供人才培养实习基地,并且引荐相关的技术人员聘为校外实习导师,指导学生在实习实践中建立以问题为导向,以项目为牵引的运作机制,让学生能够理论联系实际,切身体会数据分析的商业操作体系。另一方面,由于高校的专业教师缺乏社会实践的机会和经验,高校应该制定政策鼓励并推荐相关专业教师走出学校、走进企业,密切与企业合作交流,从而更进一步地提高教师对复合型专业学位人才培养的能力[15]29-32。(三)为了激发学生的学习热情,减少对实践操作的畏难情绪,实验课程的教学方法也需要探索创新性实践教育模式。教学过程可以考虑灵活的制定团队教学计划、案例实战分析、模拟实训等多样化的方式,减少单一的课堂内容讲授,在理论和实践教学环节中积极调动学生的主观能动性,提供更真实的企业大数据应用环境,并以学生为主完成实际案例分析。此外,基于不同的授课对象的特点,老师在教学过程中也要适当考虑学生的兴趣和需求,随时调整实验教学策略[9]。

数据分析的统计学基础范文第2篇

有了高级数学,有了概率论,有了统计学,数据分析终于有了科学的方法,可以进行各种各样的抽样调查,也可以基于方程式进行未来的预测,人的作用变成了选择模型和进行计算。随着统计学的深入发展,相关分析、回归分析、聚类分析、因子分析、生存分析、神经网络逐渐被应用到各行各业,数据分析成为了国家行政的依据,也成为了企业制定战略和执行计划的抓手。

计算机的出现本来就是为了解决人们手工计算的无奈。如今的智能手机,小小的身躯就可以超过十年前巨型机的运算能力。

2016年,谷歌的围棋程序横空出世,战胜了人类的顶尖棋手,也标志着这一被认为是人类最复杂的智力运动遭遇到机器人的暴力破解。在这个时代,我们在进行数据分析的时候,存储不再需要人工干预,计算不再需要手工操作,留给我们的只有制定规则、给出算法,然后等待结果,等待各种漂亮绝伦的图标表呈现。

数据分析的统计学基础范文第3篇

【关键词】统计学;统计思想;认识

1关于统计学

统计学是一门实质性的社会科学,既研究社会生活的客观规律,也研究统计方法。统计学是继承和发展基础统计的理论成果,坚持统计学的社会科学性质,使统计理论研究更接近统计工作实际,在国家和社会得到广泛发展。

2 统计学中的几种统计思想

2.1 统计思想的形成

统计思想不是天然形成的,需要经历统计观念、统计意识、统计理念等阶段。统计思想是根据人类社会需求的变化而开展各种统计实践、统计理论研究与概括,才能逐步形成系统的统计思想。

2.2 比较常用的几种统计思想

所谓统计思想,就是统计实际工作、统计学理论及应用研究中必须遵循的基本理念和指导思想。统计思想主要包括:均值思想、变异思想、估计思想、相关思想、拟合思想、检验思想。现分述如下:

2.2.1 均值思想

均值是对所要研究对象的简明而重要的代表。均值概念几乎涉及所有统计学理论,是统计学的基本思想。均值思想也要求从总体上看问题,但要求观察其一般发展趋势,避免个别偶然现象的干扰,故也体现了总体观。

2.2.2 变异思想

统计研究同类现象的总体特征,它的前提则是总体各单位的特征存在着差异。统计方法就是要认识事物数量方面的差异。统计学反映变异情况较基本的概念是方差,是表示“变异”的“一般水平”的概念。平均与变异都是对同类事物特征的抽象和宏观度量。

2.2.3 估计思想

估计以样本推测总体,是对同类事物的由此及彼式的认识方法。使用估计方法有一个预设:样本与总体具有相同的性质。样本才能代表总体。但样本的代表性受偶然因素影响,在估计理论对置信程度的测量就是保持逻辑严谨的必要步骤。

2.2.4 相关思想

事物是普遍联系的,在变化中,经常出现一些事物相随共变或相随共现的情况,总体又是由许多个别事务所组成,这些个别事物是相互关联的,而我们所研究的事物总体又是在同质性的基础上形成。因而,总体中的个体之间、这一总体与另一总体之间总是相互关联的。

2.2.5 拟合思想

拟合是对不同类型事物之间关系之表象的抽象。任何一个单一的关系必须依赖其他关系而存在,所有实际事物的关系都表现得非常复杂,这种方法就是对规律或趋势的拟合。拟合的成果是模型,反映一般趋势。趋势表达的是“事物和关系的变化过程在数量上所体现的模式和基于此而预示的可能性”。

2.2.6 检验思想

统计方法总是归纳性的,其结论永远带有一定的或然性,基于局部特征和规律所推广出来的判断不可能完全可信,检验过程就是利用样本的实际资料来检验事先对总体某些数量特征的假设是否可信。

2.3 统计思想的特点

作为一门应用统计学,它从数理统计学派汲取新的营养,并且越来越广泛的应用数学方法,联系也越来越密切,但在统计思想的体现上与通用学派相比,还有着自己的特别之处。其基本特点能从以下四个方面体现出:(1)统计思想强调方法性与应用性的统一;(2)统计思想强调科学性与艺术性的统一;(3)统计思想强调客观性与主观性的统一;(4)统计思想强调定性分析与定量分析的统一。

3 对统计思想的一些思考

3.1 要更正当前存在的一些不正确的思想认识

英国著名生物学家、统计学家高尔顿曾经说过:“统计学具有处理复杂问题的非凡能力,当科学的探索者在前进的过程中荆棘载途时,唯有统计学可以帮助他们打开一条通道”。但事实并非这么简单,因为我们所面临的现实问题可能要比想象的复杂得多。此外,有些人认为方法越复杂越科学,在实际的分析研究中,喜欢简单问题复杂化,似乎这样才能显示其科学含量。其实,真正的科学是使复杂的问题简单化而不是追求复杂化。与此相关联的是,有些人认为只有推断统计才是科学,描述统计不是科学,并延伸扩大到只有数理统计是科学、社会经济统计不是科学这样的认识。这种认识是极其错误的,至少是对社会经济统计的无知。比利时数学家凯特勒不仅研究概率论,并且注重于把统计学应用于人类事物,试图把统计学创建成改良社会的一种工具。经济学和人口统计学中的某些近代概念,如GNP、人口增长率等等,均是凯特勒及其弟子们的遗产。

3.2要不断拓展统计思维方式

统计学是以归纳推理或归纳思维为主要的逻辑方式的。众所周知,逻辑推理方式主要有两种:归纳推理和演绎推理。归纳推理是基于观测到的数据信息(尤其是不完全甚至劣质的信息)去产生新的知识或去验证一个假设,即以所掌握的数据信息为依据,归纳得出具有一般特征的结论。归纳推理是要在数据信息的基础上透过偶然性去发现必然性。演绎推理是对统计认识能力的深化,尤其是在根据必然性去研究和认识偶然性方面,具有很大的作用。

3.3深化对数据分析的认识

任何统计研究都离不开数据分析。因为这是得到统计研究结论的必要环节。虽然统计分析的形式随时代的推移而变化着,但是“从数据中提取一切信息”或者“归纳和揭示”作为统计分析的目的却一直没有改变。对统计数据分析的原因有以下三个方面:一是基于同样的数据会得出不同、甚至相反的分析结论;二是我们所面对的分析数据有时是缺损的或存在不真实性;三是我们所面对的分析数据有时则又是海量的,让人无从下手。虽然统计数据分析已经经历了描述性数据分析(DDA)、推断性数据分析(IDA)和探索性数据分析(EDA)等阶段,分析的方法技术已经有了质的飞跃,但与人类不断提高的要求相比,存在的问题似乎也越来越多。所以,我们必须深化对数据分析的认识,围绕“准确解答特定问题并且从数据中获取一切有效信息”这一目的,不断拓展研究思路,继续开展数据分析方法技术的研究。

参考文献

[1] 陈福贵.统计思想雏议[J]北京统计, 2004,(05) .

[2] 庞有贵.统计工作及统计思想[J]科技情报开发与经济, 2004,(03) .

数据分析的统计学基础范文第4篇

关键词:数据分析;统计学;课程体系;大数据

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2014)49-0248-02

随着社交网络的逐渐成熟,移动带宽迅速提升,云计算、互联网应用的丰富,更多的传感设备、移动终端接入到网络,由此产生的数据及增长速度将比历史上的任何时期都要多,都要快。“大数据”时代已经来临,它对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。大数据是指海量数据集,其来源包括动漫数据、企业IT应用带来的数据、博客、点击流数据、社交媒体、机器和传感数据等。它是互联网、电子商务的又一次重大革命,对数据处理、数据挖掘、数据分析提出了新的挑战。如今互联网行业、电子商务行业中的数据应用及分析已经相当普遍,为了应对大数据时代的要求,同时要具备较强的统计学功底和娴熟的计算机软件运用能力,而今完全具备这些能力的数据分析专业人才是极其匮乏的。数据分析师便应运而生,不仅互联网行业、电子商务行业需要大量的数据分析师,近年来项目数据分析事务所不断涌现,而项目数据分析师因其专业技能及量化的数据分析为客户以及所在单位控制决策风险、保证利益最大化而备受各界青睐,以待遇优厚和地位尊崇而闻名国际,也被视为我国21世纪的黄金职业。《华商报》将项目数据分析师纳入了新七十二行,《HR管理世界》将项目数据分析师评为七大赚钱职业。本文就如何在统计学专业开展数据分析方向进行了阐述,首先论述了数据分析的重要意义,其次讨论了数据分析方向的课程构建,最后分析了如何加强理论与实践环节的结合。

一、数据分析的重要意义

大数据预测美国总统:美国时代周刊报道称,数据驱动的竞选决策才是奥巴马竞选获胜的关键。数据分析团队在筹集竞选经费、锁定目标选民、督促选民投票等各个环节的决策中都发挥了重要作用。这意味着华盛顿竞选专家的作用极具下降,能够分析大数据的量化分析家和程序员的地位却大幅提升。如今从事专业数据分析工作的企业如项目数据分析师事务所、数据挖掘公司等都应市场需求而大力发展,并且受到风险投资的青睐。如美国社交数据挖掘公司Datasift于2012年宣布,获得1500万美元风险投资。2013年,DataSift成为Twitter的“认证合作伙伴”,主要负责海量微博社交数据分析。这是该公司今年第二笔融资,五月份其曾融资720万美元。又如面向开发者的大数据应用软件平台服务提供商Continuity最近获得1000万美元的融资,目前融资总额已经达到1250万美元。

数据分析的应用无处不在,那什么是数据分析呢?数据分析就是用适当的统计方法对数据进行分析,以求最大化地开发数据的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析技术不仅能通过对真实数据的分析去发现问题,还能够通过经济学原理建立数学模型,对投资或其他决策是否可行进行分析,预测未来的收益及风险情况,为做出科学合理的决策提供依据。在提高工作效率的基础上,也增强企业管理的科学性。无论是在国家政府部门,还是企事业单位中,数据分析工作都是进行决策和做出工作决定之前至关重要的一个环节。因此,针对项目可行性、风险承载力、投资回报率以及相关经济效益指标等方面的分析工作显得格外重要。在这个工作过程中,专业的数据分析人员扮演着无比重要的角色,数据分析成果的质量高低直接决定着项目投资、企业经营决策计划最终的方向。所以,各个行业对数据分析人员的需求之多是不言而喻的。传统行业,如政府机构:一类是计委、经委、统计局等一些经济综合管理部门所设有的调研处、研究室和情报所。第二类是商业、粮食、物资、银行等经济主管业务部门会设有信息中心或调研室,从本系统、本部门的业务出发进行专业性调研,提供支持本部门的市场信息。而伴随着数据分析应用的扩大,其在新兴行业中也得到了发展,如计算机软硬件及IT行业、电子商务与网络游戏、金融保险、消费品、咨询业与广告媒体、大型设备与重工业以及房地产行业等对数据分析师的需求量很大,尤其是电子商务,由于利用互联网,能够比传统零售业具有更好的数据收集和管理能力,能积累海量的数据,因此更看重从海量数据中挖掘出用户偏好和市场机会。研究机构:比如市场研究公司、咨询公司、证券公司、研究院。自主创业:取得注册项目数据分析师(CPDA)资格证可以自主创建或就业于项目数据分析师事务所等。所以,数据分析的行业应用是极其广泛的,并且随着大数据时代的到来,数据分析尤其是数据挖掘将借助互联网的发展,逐步形成人们依靠的重点,并可能成为未来发展与竞争的重点之一。由此我们可以看到数据分析师的就业前景是非常广泛而乐观的,无论是数学专业、统计专业,还是计算机专业的学生,都可以通过系统的学习数据分析课程来适应对数据分析人才的要求。

二、课程体系构建

1.主干课程。主干课程包含高代、数分、概率论、数理统计、多元统计分析、时间序列分析、市场调查与分析、统计预测与决策、数据结构、C语言、数据分析、数据挖掘、大数据分析与展示。理论课程的学习可以使学生了解数据分析的基本内容,学会如何对已获取的数据进行加工处理,如何对实际问题进行定量分析,以及如何解释分析的结果。掌握几种常用数据分析方法的统计思想及基本步骤,并具备一定的分析论证能力。

2.实验课程。数据分析的操作离不开计算机。目前数据分析行业常用的一些统计软件有SAS、SPSS和R软件。SAS软件是一个模块化、集成化的大型应用统计系统。它的功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等。SPSS软件是一个社会科学统计软件包,是采用图形菜单驱动界面的统计软件,SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等。R软件是一套完整的数据处理、计算和制图软件系统,包括:数据存储和处理系统、完整连贯的统计分析工具、优秀的统计制图功能、可操纵数据的输入和输入等功能。这三个软件在数据分析中针对不同行业的需求有不同方向的应用。

3.专业课程。从数据分析的行业需求出发,好的数据分析人员不仅要有较强的数据分析能力,还要有该行业的背景及相关知识的储备,这样才能将数据分析与行业特性联系起来,发挥数据分析的最大功能,即所谓的“因地制宜”。同时要兼顾学生的兴趣与学习的联系,需提供多领域的课程选择,如:经济学、金融学、保险学、管理学、会计学等。而在软件学习方面也要拓宽渠道,除了实验课程安排学习的软件,学生可根据自身发展意向再多掌握一些软件如:SQL数据库,熟悉office常用功能,尤其熟练运用Word和PowerPoint、Excel图表及数据分析等。同时还应该结合对数据分析师的要求设置一些相关课程:投资数据分析、市场调研与预测、预测技术分析、现金流量表编制、风险投资项目筛选、不确定性分析、编制数据分析报告等。

三、实践环节

培养数据分析的专业型人才目的就是为了学以致用。数据分析本身就是为了从数据中发现问题、建立模型、预测收益风险企业决策进而做出合理正确的决策判断。因此,学习了基本的知识和技能就要运用到实际操作中。学校可以和本地的数据分析事务所,或者大量需求数据分析人员的互联网行业建立实训基地,进行合作式教学,使得学生在实习的过程中能够理论联系实际,切身体会数据分析的商业操作体系,这样就能够促进学生有目的、有取舍地针对自身情况学习钻研,继而就能够培养出适应经济发展,满足市场需求的应用型人才。

四、结语

在大数据时代到来之时,数据分析在互联网中的应用将会空前广泛,与此同时对数据分析师的需求也将会井喷,无论是在军事、工业、企业还是在政治上,大数据分析都将会十分紧缺。因此,目前对数据分析师的培养刻不容缓。本文从分析数据分析行业发展及其重要意义、数据分析专业课程设置以及教学实践环节方面对构建数据分析课程体系进行了探讨。不仅从教学课程的内容上予以安排,而且更加注重引导学生自主学习,特别强调理论结合实践的合作式教学。希望能够结合行业需求合理地构建课程,培养出专门从事数据分析的项目数据分析师,从而能够满足市场需求和自身发展。

参考文献:

[1]范金城.数据分析[M].科学出版社,2010.

[2]http:///jrt/120922/70953.shtml

数据分析的统计学基础范文第5篇

关键词:大数据;经济统计;专业建设

当前,大数据已经渗透到社会、经济、政治以及文化等众多领域。大数据在给各行各业带来了新的历史发展机遇的同时,也将给各行各业带来新的挑战。显然,对高等教育来讲也同样如此。相应的,对直接服务于经济统计人才培养的经济统计学专业建设来讲,迫切需要回答的问题是,在新形势下,专业建设遇到新的挑战又将是怎样的呢?进一步的,为了积极应对新的挑战又需要对旧的培养模式进行怎样的修正和改进呢?从现有的文献资料看,虽然学术界已经积累了大量与(经济)统计学专业建设相关的研究成果(如庞皓,1991;曾五一,1999;曾五一和尚卫平,1999;曾五一等,2010;朱宇兵,2009等),但基于大数据背景对这些问题较为深入的研究还比较缺乏,本研究则可以视为是对此进行弥补的一个努力尝试。

1经济统计学专业建设的发展现状

从某种意义上讲,经济统计学是一个新的专业。2012年10月,教育部颁布了《普通高等学校本科专业目录(2012年)》。在新专业目录中,除保留统计学为理学类一级学科(包括统计学和应用统计学两个二级学科)之外,在经济学类的经济学一级学科下增设经济统计学。正是在这样的背景下,目前我国高校经济统计学专业的开设一般有两种情况,一种是新专业目录颁布后新设立的,如中央财经大学、对外经济贸易大学、西南政法大学以及中南民族大学等;一种则是由原来的统计学专业更名而来的,如中南财经政法大学、天津财经大学、江西财经大学、南京财经大学以及中央民族大学等。从发展历史过程看,经济统计学并非是一个全新的专业,而是由以前的统计学专业发展而来。在1998年9月国家教育部颁布的《普通高等学校本科专业目录和专业介绍》中,统计学被列为理学类一级学科,但可选择授予经济学或理学学位。在这种背景下,根据具体的办学条件和偏好,各高校采用了不同的教育模式,一类是强调各类统计学所具有的共性。它肯定统计学的“理学性质”,按照理学类学科的特点设置课程。另一类则是强调各类统计学的个性,如财经类院校统计学专业(曾五一等,2010)。前者的数量较少,它是将统计学作为应用数学的一个分支来看待,所开设课程主要是数学和各种数理统计方法。后者数量占有绝大的比重,其专业方向包括国民经济统计、经济统计、管理统计、金融证券统计等(李宝瑜,2004)。从我国统计学学科建设的发展过程看,其特征主要表现为两个转变,即从起初的侧重理论培养向当前的强调实际应用转变以及从起初的主要服务政府部门向当前的主要服务社会企业组织转变。由于新专业目录颁布时间还很短,经济统计学专业还没有建立起新的培养模式,主要还是其前身———(经济学方向的)统计学——培养模式的一种延续。从我们掌握的资料看,目前各高校经济统计学专业的培养方案还主要是参照1998年《普通高等学校本科专业介绍》制定的,其培养目标是所谓的“复合型人才”,即具有坚实的经济理论基础,既懂数理统计方法、又懂经济统计方法,并能熟练掌握现代计算手段的经济统计人才(曾五一等,2010)。这种人才既是统计人才又是经济管理人才,不仅能胜任基层企业和政府部门的日常统计业务,而且能从事市场调查、经济预测、信息分析和其他经济管理工作。相应的,在具体的课程体系构建和安排上,各高校大都贯彻了“大统计”的学科观点,遵循“厚基础、宽口径、重应用”的复合型人才培养原则(向书坚和平卫英,2010),即在强调较为完整系统地介绍统计学主要理论和分析方法的同时,还强调其与经济学其他学科的密切联系,按照经济类学科的特点设置课程。也就是说,经济统计学专业的课程设置具有显著的二元性特征。从各高校的具体设置看,统计学方面的课程一般有数学基础课、概率论、数理统计、运筹学、随机过程、回归分析、时间序列分析、多元统计分析、抽样调查、非参数统计、统计预测与决策等;而经济学方面的课程一般则有微观经济学、宏观经济学、会计学、国际经济学以及与专业方向(如国民经济统计、财务会计统计、金融证券统计等)有关的课程。此外,和其他专业一样,经济统计学也重视学生应用和创新能力的培养,特别强调本专业的毕业生应该具有熟练地采集数据和应用计算机分析、处理数据的能力。因此,Excel、SAS、SPSS等常用软件的学习和训练也通常以实验课的形式被纳入到课程体系中。但是,要注意的是,我国各高校在制定或修订经济统计学培养方案时,有意或无意地忽视了当前随互联网技术日新月异带来的大数据海量涌现。而由于大数据和传统数据存在显著的差异,各高校现有的经济统计培养模式可能需要做出重大调整。

2大数据带来的挑战

大数据之所以在众多领域里引起关注,其根本的原因在于大数据蕴含着巨大的潜在价值。相对于传统的标准化数据,大数据不仅体量庞大、产生速率极快,而且也更为全面(甚至是整体数据)。因此,大数据的分析结果也更接近真实。换句话说,大数据分析往往意味着人们能够从这些全面的数据中获取新的洞察力,从而更有可能创造出新的价值,进而带来更大的发展。大数据蕴含的巨大潜在价值,势必将打破现有的数据边界,使大数据逐渐成为经济统计分析的主要对象。由于大数据与传统的标准数据存在显著的差异,对未来的经济统计工作而言,大数据势必将带来新的问题或挑战。简要地说,大数据带来新的问题或挑战主要来自于两个方面,即:

(1)数据来源问题。与传统数据主要来源于抽样调查或组织内部不同,大数据是互联网高速发展的产物。随着科技环境的巨变———个人电脑的全球普及,移动智能终端的盛行,物联网和社交网络的爆炸式发展,以及数以千万计的联网传感器节点在交通、汽车、工业、公用事业和零售部门等的广泛分布,这些都让数据的生产和收集的途径更为多元、更为广泛。不过,需要特别注意的是,由于其蕴含的巨大潜在价值,大数据已经成为了可以与物质和人力资本相提并论的重要生产要素和组织资产。相应的,对各类逐利组织(尤其是企业)来说,不仅需要考虑如何收集到大量的有效信息,同时也希望这些信息为其独自所占有,如最近阿里巴巴封杀微信、京东,断绝与社交网络新浪微博的账号合作。这种电商行业“封杀”现象的出现,其理由看似是如这些企业所宣称的那样为了保护公司的信息安全,但背后的根源其实是担心自身的内部商业信息通过互联网泄漏,担心用户流量的命脉被他人掌握。因此,在大数据时代,如何解决数据的封闭性问题将是经济统计工作数据收集面临的一个重要挑战。此外,对经济统计人才来讲,由于数据不再仅仅是标准结构的,资料收集新技术的开发和掌握也成为一种迫切的需要。

(2)数据分析问题。由于数据更多的是半结构化或非结构化的,传统的经济统计分析工具和方法可能不再有效。就大数据分析而言,经济统计工作需要解决的问题是如何从体量庞大且杂乱无章的各类数据中挖掘有效信息以创造新的知识和新的价值。在以前,数据很大程度上是指“数字”,如业务量、营业收入额、利润额、工业企业产值、固定资产投资、GDP等,都是一个个数字或者是可以进行编码的简单文本。而在大数据时代,人们不再是隐藏在终端和网络后面的隐形者,购物、社交、游戏、阅读、出行等信息都变成数据被收集到各种各样的储存设备中。而数据也不再是单纯的“数字”,还包括文本、图片、音频、视频等多种格式,其涵括的内容也更为丰富,如博客、微博、通话录音、位置信息、交易信息、点评信息、互动信息等。也就是说,数据不再只是结构化的,更多是广泛存在于社交网络、物联网、电子商务等之中的半结构化数据和非结构化数据。随着数据越来越大,越来越复杂,增长越来越快,要想建立和保持竞争优势需要对数据进行实时、有效的分析。而由于数据更多的是以半结构化和非结构化形式出现,过去传统的数据分析技术可能无法实现实时监测和分析。

3应对措施及建议

从个人服务到商业运营,从医疗卫生到公共教育,从城市交通到公共管理,大数据已开始撼动世界的方方面面。在带来新的发展机遇的同时,大数据时代也向包括经济统计在内的众多领域提出了众多挑战,需要做好充足的准备及应对。具体到与人才培养息息相关的经济统计学专业建设,我们认为需要从以下几个方面做出必要的变革:

(1)树立市场意识,避免人才培养与现实需求脱节。从目前的实际情况看,我国高校经济统计人才培养与市场需求之间或多或少存在一定程度的“学”“用”脱节,还没有全面实现学以致用。一方面,以企业为主的各类组织对经济统计人才需求非常急迫,如最近一份针对近千家企业和从业人员的调查显示,97.9%的企业认为数据分析对电商运营很重要,超过半数的企业表示数据分析能力欠缺,同时有近60%的企业希望专业数据分析人才加入,并愿意为此支付更高薪资;①另一方面,无论是课程体系还是教学内容以及教学方式,现有模式基本上是以传统数据为对象的。换句话说,在现有培养方式下,学生掌握的数理统计和经济统计方法可能无法满足大数据的分析需要,如传统的统计分组、频数分布等数据整理方法显然难以完全适用于图片、音频、视频等非结构化数据。因此,要真正做到“厚基础、宽口径、重应用”,则需要根据经济发展的需求设置教学计划、更新落后的教育内容、采纳现代化的教学手段,需要注意与其他学科之间进行充分的交流与融合,跟上当代社会科学的杂交化、整体化趋势发展的步伐。

(2)经济、统计与IT相融合,优化课程体系。在大数据的洪流中,数据分析是否能够带来新的洞察力、创造新的知识和价值,取决于从业人员是否掌握大数据收集、管理、分析和开发的相关特定工具。从我国高校经济统计学专业课程体系看,专业课程设置主要包括经济类基础课程与专业主干课程两大基本模块。虽然各高校都强调遵循“厚基础、宽口径、重应用”的复合型经济统计人才培养原则,也主张将理论方法的教学与计算机软件紧密结合起来(如“统计学导论”选用Excel,“应用多元统计分析”选用SPSS,“计量经济学”选用Eviews等软件作为计算工具),但在大数据的开发和应用日益成为新潮流、新趋势的背景下,仍然很少看到有高校在经济统计学专业中开设独立的、专门涉及大数据技术的相关课程。因此,根据现实人才需求的新变化以及大数据技术的不断进步和升级,我们应该对经济统计学专业的课程体系进行必要的调整,即根据大数据分析的内在需要,在经济学和统计学相关课程之外把大数据技术相关的课程纳入到现有体系之中,实现“经济、统计与IT”三方面内容的平衡和融合。在大数据时代,虽然经济统计所包括的主要工作仍然是数据收集和数据分析等,但是其内容却发生了翻天覆地的变化。如收集数据不再依赖于随机采样,而是需要利用多个数据库来接收发自客户端的数据,并导入到一个集中的大型分布式数据库。相应的,数据存储和预处理以及数据挖掘和分析也都是以分布式数据库为工作对象的。考虑到本科教育的基本要求与技术的实际发展水平以及通用性等,在Hadoop、NoSQL、HDFS等目前较为常用的大型数据分析软件和工具中,我们建议至少增设Hadoop方面相关的课程。

(3)与时俱进,加强师资队伍培养。能否把本专业的学生培养成为复合型的应用人才,取决于是否拥有一支高素质的教师队伍。随着大数据及其应用成为一种新的潮流和趋势,经济统计的专业教师团队建设也需要做出相应的调整和变革。从教师队伍的结构看,由于经济统计学专业发展的过程使然,目前我国各高校该专业的专业教师以具有经济学或统计学学科教育背景的教师为主,而具有信息技术教育背景的教师还非常稀少。由于大数据及其应用需要融合经济、统计以及IT等多个领域的理论、方法和工具,因此对经济统计专业建设而言,当前最为迫切的是,需要建设一支教育背景涵盖上述三个领域的结构合理的教师队伍。而实现的途径无非是两种:一方面是在全校范围内进行挖潜,重新组合和配置教师资源以优化经济统计专业教师团队;另一方面则是实施“请进来”战略,加大力度引进海内外优秀人才。在内部挖潜和外部引进的同时,专业教师团队建设还应该努力创造一个良好的人才成长环境,鼓励教师积极“走出去”,到国内外高水平大学进修和学习,鼓励教师不断以新的知识充实、提高自己,以此来不断提高本专业的教师质量和水平.

参考文献

[1]李宝瑜.统计学一级学科建设中的若干问题[J].统计研究,2004(8).

[2]庞皓.经济统计学课程体系改革的方向[J].统计研究,1991(1).

[3]向书坚,平卫英.30年来我国财经类院校统计学专业本科课程设置的历史回顾与展望[J].统计研究,2010(1).

[4]曾五一.关于经济管理类统计学专业课程体系设置的几点意见[J].统计教育,1999(8).

[5]曾五一,尚卫平.关于经济统计学若干问题的思考[J].统计研究,1999(11).

[6]曾五一,肖红叶,庞皓,朱建平.经济管理类统计学专业教学体系的改革与创新[J].统计研究,2010(2).