首页 > 文章中心 > 大数据时代含义

大数据时代含义

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇大数据时代含义范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

大数据时代含义

大数据时代含义范文第1篇

工业设计本质是工业社会人类的基本造物方式,与人类最初制造各种原始的工具一样,充斥在我们生活之中的各种大批量生产的产品,其目的都是为了解决各类型现实的问题,为人们提供更好的服务。然而,在大数据时代下多元化的信息途径对工业设计产生了非同寻常的影响,并且在“互联网+”的推动下工业设计产业也表现出新的变化。

1 大数据时代下对工业设计的改变

大数据促使公司企业发展和转型,推动了经济转型发展的进程,成为打造国家级竞争的优势的重大升华。大数据思维具有三层含义。第一层含义是,大数据思维必须随机抽样数据进行分析,必须掌握数据复杂性,减化精确性,必须重点了解数据相关性。第二层含义是要把数据当做一种可以升值的重要资产,而不是只做研究对象,研究完之后就束之高阁。第三层含义是数据有变现功能,通过挖掘数据价值,就能改变价值的生成基础和价值链条。

大数据非常重要。这是因为,思维方式的改变引起了巨大的商业变革,在面对思维逻辑时,传统的经济体制和旧的商业理念一定要与时俱进,吸取并创新的服从先进的新思维,通过新的思维模式重组企业战略和各种策略。在旧的信息时代,击落他们的是被互联网武装起来的大数据思维,因此,这些昔日看起来极为庞然的巨人,就这么轰然倒塌,留下的知识唏嘘声声。然而大数据思维的基础是互联网,而互联网思维就是充分利用互联网的精神、价值、技术、方法、规则、机会来指导、处理、创新、工作的思想。互联网思维是相对工业化思维而言的,是一种商业民主化的思维,是用户至上、扁平化的思维。

这也与工业设计的理念不谋而合。两者都在强调用户驱动产品的设计需求方向。这也是大数据时代下表现出来的设计机遇。由用户行为习惯形成的大数据思维和互联网思维快速更新,也让设计师及时更新得到用户的真实反馈。这种互联网+的结合让设计师的设计作品更多的符合用户的需求,服务社会。

2 “互联网+”对工业设计产业的转型升级

在“互联网+”向技术、服务、创新思维、研发模式等全方面进攻的过程中,这些变化都以“互联网+”为原点重新组构,并带领工业4.0的进程,因而带动了“互联网+”工业设计产业的转型升级。而在“互联网+”工业设计产业的情况下,设计师本身角色就像过山车一样,高速发展之后开始下行,从市场角度来说设计行业不容乐观,从创新精神来说也不容乐观。我们赶上了最好的时代,也赶上了最坏的时代。所以,随着互联网模式的不断深化,我们设计师的很多思维模式也发生了许多变化。

首先,思维的转变是必要的。长期以乙方的身份服务于比较强势的甲方,设计师所有的来源与收入都基于这种关系,设计师没能真正思考设计是什么,他只是一名产品的设计师,而没有成为生活方式的设计师。什么是成为生活方式的设计师,就要深入到人的生活当中,像德国设计师或其他欧美设计师一样,不但能做产品设计,还能做生活用品设计、展示设计、小产品设计、桌椅设计、标识系统设计等,这叫生活方式的设计,关注生活中的每一点滴,与生活方式的内容紧密联系。中国设计师尤其工业设计师则少有甚至没有能做到这些,但未来多样的设计肯定会融为一体,在未来,建筑、室内和产品设计又会融为一体,西方设计师走过的路,我们得重走一遍。我希望重走这条路不是以外来的理论体系做支撑,而是基于本土,最核心的就是十二个字“道法自然、因地制宜、天人合一”,这是所有中国传统哲学的精髓。这也是在大数据时代下,“互联网+”带给工业设计最大的改变。

其次,市场变化很大。第一,有些项目缓建,有些项目停建,我觉得这是好事,因为要将未来的发展方向思考清楚。前十年工业设计行业的设计师是在以甲方的需求做设计,大都失去了设计的本真。所有的设计都围绕甲方转,突然发现这有如空中楼阁,特别虚幻。当“互联网+”到来以后,你会发现原来做的很多工作,很多体系,其实没有太大的意义与价值。尤其中国当下经济正处在一个新常态的转型期,我觉得设计行业和设计师都要思考,有没有这么多项目需要做设计。是不是应该把设计的重点选在减少设计垃圾上面。第二,做设计的价值在哪里,是为工程项目服务,还是为设计的产值,还是为有需求的人服务?设计的社会价值是设计师要思考的问题。现在的新的转型升级正好可以让设计师停下来或慢下来去思考设计的本质是什么。

最后,设计师的需求转变。如果一个设计师,或者一个设计工作室愿意从研究人性的需求作为出发点进行工业设计,当项目本身还没有成型的时候,相关部门就要做认真的归纳,并且将研究成果用一种公开的方式进行倡议宣讲,当这个项目实现时,其实现的成功率就会符合消费者用户的真正需求,我觉得这是互联网思维模式下设计师的一种转型方式。

“互联网+”工业设计更多的是一种创意+设计+运营+资本的模式,创意属于顶层设计思维,对新生事物有敏感的感知反应,而且能产生出与众不同的设计新思维。在这种大数据时代下,“互联网+”工业设计是能够让思维体系完美落地的非常重要的手段。只要能你创造一种为生活方式服务的工业设计产品,再有一个不错的商业运营的模式,肯定会有为这一体系买单的资本家涌现出来。工业设计的价值才能真正得到体现。

大数据时代含义范文第2篇

【关键词】大数据;数据解析;运用范围;现状;展望

1、引言

在互联网时代,几乎每个人都与互联网有着千丝万缕的关系,而每个人都产生了很多的互联网数据,这些数据中包含着很多有用的信息,对这些数据进行分析,可以得到一些不容易获取的隐藏信息,为人们提供更多的新的机会,但是庞大的数据需要有效的管理,也有很多问题需要我们解决。

2、大数据的现状

2.1大数据的含义

对于现代社会的发展、人们生活的便利性而言,大数据的作用都得到了各行各业的认可,大数据本身并不是一个具体的东西,在不同的行业,大数据起到的作用也是不一样的,因此,在不同的行业背景下,对于大数据的定义也不相同。对于大数据的定义,也不是一蹴而就的,随着时代的发展,对于其定义也一直在补充完善,对于我们普通大众而言,大数据就是我们要采用一定的信息手段和信息处理工具,来对信息进行摘取、操控、办理的集中。

2.2大数据的解析方法

大数据的数据量十分的庞大,并且随着时间的推移,其数据量还在不断的增加,如何从这些庞杂的数据中提取出有用的信息,并且利用这些信息来创造更多的价值,是很多行业都在深入思考的一个问题。

目前,对于大数据的解析方法大概有这些:

(1)布隆过滤器。这种方法并不对数据本身进行解析,而是对储存的数据的函数值进行处理,将这些信息中对于储存压缩不利的位置或者图案进行引导,这种方法有一些缺陷,就是识别的正确性不高,并且整体上删除能力不强。

(2)分列解析法。这种方法也叫函数法,对于一个固定的数值,将其长度变短或者进行引导,利用这种方式来管理数据。

(3)引导解析法。这种方式与第一种相比,有较高的删除能力,并且对于改变搜索的能力较高,对于部分开销可以减小,但其他部分相应的就变高,同时还需要经常性的更新。

(4)字典树解析法。在迅速的检查搜索中,采用这种方法有较高的效率。

2.3大数据的解析方式

大数据在不同的应用领域,都有不同的方式来进行解析,这也反应了大数据应用的范围比较广的特点,并且数据的种类比较多,针对不同领域,采取对应的解析方式来进行处理。

在金融行业,数据信息的变化十分的迅速,需要经常性的更新,在对数据进行解析时,就需要数据的解析十分的及时,这往往需要在很短的时间内,对数据完成解析,并且回到解析的结尾处。及时解析的方式主要利用内部储存计算平台来完成。还有一种是离线解析,这种方式利用在对数据处理时间要求不高的场合,利用数据搜集器,将数据引进平台来进行解析工作。对于数据解析的范围不同,也可以将数据解析分为几种类型,比如效率比较高的内存级解析,这种解析时间快,对于需要及时解析的行业可以得到应用。此外,还有大量级解析等。在实际应用当中,很多情况下,解析的过程会不断的变化,采用的方式也是有差别的。

3、大数据运用

3.1运用演变

大数据从二十世纪90年代就开始使用了,在社交网络、移动数据以及多媒体等行业,产生了很大的作用,最开始对于大数据的使用仅仅限于邮件收发等简单的形式,目前大数据已经有很多的数据模型,比如图形、视频等,对于数据的应用,也使很多的行业受益,比如军事、商业等。

3.2大数据机械的重要范围

大数据的重要技术范围可以通过架构不同以及产生模式的不一样列分为六种。架构数据、网络数据、多媒体数据、交互网络数据、移动数据以及文本数据。架构数据主要操控工具,是传统数据解析的关键。网络数据技术最高程度重组了提取和互换信息数据的模式。多媒体数据被迅速传出使用。交互网络数据影响了现代社会的活动特点。移动数据能够根据信息数据定位来源位置信息。文本数据是最熟知的非架构化数据,是储存文字、信息的互送的模式。

4、总结

大数据发展到今天,覆盖的范围越来越大,在各行各业产生的影响也越来越大,发展的速度在不断地加快,但是,从整体上来看,目前大数据的发展还是处于初期阶段,对于大数据的研究还要不断的进行深入,从基础理论上要进行深入,一些重要的技术上,进行深入,如何运用大数据上也要进行深入。目前来看,很多新的数据形式正在产生,从一定程度上,也可以看出未来大数据发展的趋势,从大数据的解析方式和处理上,对现代社会的发展,对人们生活的影响,都在产生着积极的作用,并且这种变化正在向更好的方向发展。本文首先介绍了大数据的基本含义,然后从运用方面进行阐述,分析了几种经典的运用,并且介绍了几种解析方式,从几个角度来看大数据的影响,并对大数据以后的发展作出了分析。

参考文献

大数据时代含义范文第3篇

[关键词] 大数据时代;会计工作;挑战;思考和应对

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2015 . 17. 017

[中图分类号] F232 [文献标识码] A [文章编号] 1673 - 0194(2015)17- 0036- 02

1 大数据的含义及其特征

随着信息时代的到来,“大数据”这个概念也被广为传播。美国奥巴马政府也高调制定了其大数据研究和开发计划,大数据已经开始进入到人们的生活中。对于大数据这一概念,目前暂无确切的定义,通常是通过数据产生的过程和数据形成的两个过程进行描述,本文从大数据产生和大数据的特征两个维度进行定义。大数据具有规模大、类型多、处理速度快、价值密度低4个基本特征。

(1)大数据的基本特征是数据规模大,大不仅体现在数量上,还体现在范围上。随着数理统计技术的发展以及数据处理能力的提高,用传统的少量的样本特征来推断整体的习惯已经被摒弃,人们通过搜集和整理更大量、更大范围的数据,进行更精准的决策。

(2)大数据所包含的数据类型繁多、复杂多变。大数据时代数据来源范围更广阔,比如电子商务、手机信息、行车信息、购物会员信息等多渠道,同时数据的格式也不尽相同。因此,数据的多样性具有来源多样性以及格式多样性等特点。

(3)大数据的另一个显著特征就是处理速度快。面对巨大数量的数据,同时数据形式多样化,只有加快数据处理的速度才能让数据的时效性和有效性得到充分发挥。在巨量数据的情况下,数据还具有流动性,随着时间的推移其价值也会降低甚至失去其自身的意义,因此,在大数据时代下,数据处理越来越强调其时效性,对其处理速度也提出了更高的要求。

(4)大数据下大量数据的聚集导致数据的价值密度低。大数据所包含的巨量数据信息中包含了所有数据和全部字段细节,对于要解决一些特定的问题和决策来说,有大量不相关信息包含其中,造成了相对有效数据的密度低。面对这个特征,为了提升决策的效率以及效益,需要提炼有效数据。大数据为了保证信息的完整性以及能够满足所有应用,这就要求数据数量的激增,而有效信息的比例相对减少,也就是我们所说的价值密度低的特征。

2 大数据时代管理会计面临的挑战

2.1 会计工作者对大数据的应用认识不足

大数据时代的到来对很多行业来说既是机遇也是挑战,会计从业者对大数据的正确认识是迎接机遇和挑战的必要条件。目前很多企业并没用充分认识到这一点,对大数据的认识不足,主要表现为:首先,认为大数据技术比较遥远,而且仅仅是存在于如谷歌、微软等高精尖技术公司,不愿意为大数据技术投入人力、物力、财力,甚至有意避开大数据这一领域的有效应用;其次,对于大数据的认知度不足,调查显示,在中小企业中,对大数据有过关注和了解的人不足50%,另一半则仅仅听过这个名词而已,并没有真正关注和了解。再这样的情况下,大数据在会计工作者中的应用与推广必将受到影响。

2.2 会计的信息存储空间不足

我们强调了大数据时代其特征中数据量的巨大,并且要求所存储数据的全面性以及持续性,这些都需要巨大的存储空间,而目前对于处理这些TB级别的数据有很大困难。

2.3 会计信息的安全无保障

大数据时代基础数据搜集中,包含着大量的私密信息,这些信息的安全关系到员工及客户的自身安全;同时大数据也涉及到企业核心信息。这些数据一旦泄露,都将对客户或者企业造成威胁,给企业带来不可弥补的损失。因此,面对大数据的应用,对于信息安全的要求是一个不可回避的重要课题。

2.4 针对大数据的会计分析技术不足

大数据的特点之一就是数据价值密度低,也就是说面对众多数据,对其有效的分析和充分的利用是实现大数据有效应用的途径之一。目前,对于大数据的有效应用少之又少,一方面是因为数据量过大,另一面则是因为传统的分析方法不能很好地适用于非结构化数据的分析。

2.5 大数据时代下会计人才缺失

目前,全世界都面临着大数据专业人才的缺口,面对大数据的特点,必须有专业数据分析技能的会计工作者才能胜任,才能将众多数据转化为有效的深度挖掘和分析决策报告。专业知识的短缺必将阻碍会计工作者在大数据时代下的发展,因此,对于数据处理及数据挖掘等相关方面的培训是会计工作者提升自身技能的必备条件。

3 如何应对大数据给会计工作带来的挑战

大数据时代的到来是一个渐进的过程,在这个过程中,对会计工作的能力要求也是一个渐变和逐步提升的过程,会计人员必须积极应对这些变革,迎接大数据带来的挑战。

3.1 提升自身对数据挖掘的应用能力

大数据的有效应用就是考验会计工作从海量信息中找到有价值信息的过程,只有找到了有价值的信息才能为生产经营提供正确的发展方向。这些都需要依赖于数据仓库以及数据挖掘技术。

3.2 提升会计信息化的安全性

前面提到了目前会计信息安全性的问题,如何防止他人恶意非法访问以及窃取相关数据是目前急需解决的问题。目前比较有效的防护办法为:企业启用用户身份安全认证以及访问控制机制,同时增加会计信息安全评估机制,在企业内部建立和健全一个会计信息管理系统。

3.3 加大对大数据知识的会计人才的培养

随着大数据的逐步应用,为应对大数据知识及技能人才缺失的现状,企业一方面可以加大招聘力度,另一方面可以通过对现有会计人员进行培训或者交流学习等方式,提升会计工作人员的大数据挖掘分析的能力。

4 结 语

随着大数据时代的到来,对会计工作的需求也上升到了一个新的高度,在技术上说,要求会计人员了解大数据的特点,并且能从中挖掘和整理出有效的信息,能为公司解读有效数据并提供决策依据;从职业操守上来看,需要会计工作者严保数据库中的敏感信息,不可泄露客户及公司的信息。因此,需要不断提升会计工作的技能和职业操守来应对大数据时代的到来,更好地利用大数据来更加出色地完成会计工作。

主要参考文献

[1]袁振兴,张青娜,张晓琳,等.大数据对会计的挑战及其应对[J].会计之友,2014(32).

[2]许金玲,赵爽.大数据时代管理会计工作变革研究[J].现代经济信息,2014(23).

[3]孙雨萌,田雨晴.大数据时代下我国会计行业[J].商,2014(6).

大数据时代含义范文第4篇

关键词:大数据 统计新思维

一、大数据内涵解析

不同行业、不同研究领悟的从业者对大数据的理解不尽相同,但是大数据不论从“大”的层面来看还是从“数据”的层面来讲都和传统的数据存在天差地远的区别,二者的区别不仅仅体现在体量上,更体现在数据内涵上。从统计学角度上来理解大数据的含义的话,大数据是建立在现代信息技术和手段基础上的连续的、扩充的数据形式,大数据在记录能力和存储能力上要远远超过传统数据,突破了传统数据固定、不连续、有限和不可扩充的局限性。简而言之,大数据是一切可以记录的符号的集合。

传统统计研究以有意收集的结构化样本数据为研究对象,当今统计研究面临的则是随时随地存储、动态扩充、无限容量的多类型数据。样本数据和大数据的区别在于样本数据是格式化数据,是按照研究目的和一定的抽样方法收集而来的,数据量相当有限,而在研究过程偏离预定方案的情况下,样本数据可能不再试用。根据样本数据进行的统计分析,适用空间也比较小,难以满足多角度、全方位的研究需要,当在研究中出现抽样方案未能预测到的情况时,样本数据不可扩充的缺陷就会直接暴露出来。大数据则不仅仅信息量大,而且在现代信息技术的支持下不受条框的限制,可以接纳任何种类的数据,也无法拒绝任何一个类型的数据。相较于样本数据而言,大数据具有无限大的选择空间,可以胜任多角度、多层次分析的要求。

二、大数据带来的统计思维的变化

(一)转变认识数据思维

从数据来源上看,传统数据收集目的性强,基本可以确定数据提供者的身份,一些数据还支持事后进行核对校正。但是大数据全部来自物联网,其产生之初就不是为了收集目的而存在,而是一切可记录符号的集合,识别数据提供者的身份是非常困难的,也就是说从微观层面追溯大数据的数据来源是不太现实的。

从数据类型上来看,传统数据具有很强的结构性,基本上都是定量数据加上一定形式的定性数据组成,具有一定的标准和格式,并以传统的统计指标和统计图表为格式展现出来。大数据具有非结构性、半结构性和异结构性特点,一切可记录的符号和信息都被其囊括其中,传统的统计指标和统计图表难以体现大数据的多样化和无标准性。另外,大数据产生于不同的网络信息系统,不同的系统之间对数据的分类并不存在统一的标准。现有的数据库本身就是非关系型数据库,在包容多种多样的大量数据的时候不需要对数据的记录结构进行预先的设置。

从数据量化的层面来看,传统数据在多年的统计分析之中已经形成了相对完善和规范的数据量化方式和过程,量化之后的数据基本可以直接运用于数据分析和计算。但是大数据的非结构性使得对其的量化方式、提取方式、如何对接到结构性数据之中成为一个崭新的问题。任何统计分析都难以直接分析非结构化的数据,更不用说从非结构化的数据中得到科学正确的统计结论,在大数据统计工作中,量化的含义本身也发生了变化,对量化结果的呈现形式也不再统一和规范。由此可见,大数据下的非结构化数据不再试用传统的数据结构方式。

(二)转变收集数据思维

统计分析以收集数据为前提,没有经过收集数据过程的统计分析无异于缘木求鱼。传统统计分析中首先要确认分析的目的然后再进行数据收集,并对调查方案或者抽样方法进行精心设计,这个过程中需要消耗大量的时间和精力。大数据出现之后,我们就拥有了大量可供选择的数据,统计分析的对象在种类和体量上都获得大大的提升,所以统计分析工作的重点就转变为选择和比较,收集数据的思维也就转变为如何充分利用大数据,不必要对大数据中能够找到的数据进行专门的调查和收集。

但是,鉴于大数据来源多样、种类繁杂,数据增加速度很快,统计分析在感受数据丰富性的同时也需要思考这样一个难题:存储能力不足、分析能力较差、数据真伪鉴别能力有待提升、关联物选择不佳等等。目前TB级别的数据库已经屡见不鲜,PB级别的数据也已经渐渐盛行,将来甚至可能出现EB、ZB和YB级的数据,电子储备能力的提升已经迫在眉睫,如果数据库不能自动更新就可能会影响到大数据的运用,加之数据库的自动更新还可能会导致数据的丢失和遗漏。在数据库达到一定级别之后进行容量扩充或者数据拷贝的时候,代价是非常惨重的,所以在必要的情况下我们必须对数据库进行筛选和分类,针对性删除一些不重要的数据或者垃圾数据。传统统计分析中中针对性获取数据成为数据收集,当今对大数据进行选择性地删除在本质上也属于数据收集。大数据时代的数据收集理念已经转变为从超大量数据中进行过滤和再次选择,大数据时代意味着我们必然会舍弃一部分数据。

(三)转变数据分析思维

首先,传统统计分析过程从定性分析开始,然后进行定量分析,最后再归回到定性分析。开始的定性分析是为了给定量分析找到要点和方向,此时分析者的经验和能力成为统计分析质量的决胜因素,因为在数据缺失和分析运算方法有限的情况下,高质量的定性分析决定了统计分析的优劣好坏。而当前我们可以依赖大数据进行判断和决策,当今时代计算机技术、分析技术、存储能力大大提升,定量的回应已经不可避免地走上简单化趋势,而统计分析工作要做的仅仅是从定量的回应之中挖掘出和统计分析目的相符的数量关系和数量特征,从而为科学、合理的决策提供依据和数据支撑。大数据背景下的统计分析只经历定量到定性的环节和步骤,得出的定性结论更具可靠性和准确性。

其次,传统的实证分析工作从提出研究假设开始,然后通过收集数据和分析数据来验证假设是否成立,这种实证分析方法受到假设本身的科学性、指标选择的恰当性和数据的完整性影响,稍有不当就有可能得出错误的结论。尤其是当假设本身不科学的时候,那么这个实证研究都变得毫无意义,甚至会歪曲事实。所以在传统的实证分析中,通常都是分析过程去迎合假设结论,科学研究走上歧途之路。大数据时代背景下的实证分析已经不再受到假设的限制,能够自动地发现规律、找到关系,然后再据此进行归结和总结,形成最终的结论,在这种情况下实证分析的思路转变为发现―总结,统计分析能够得到资源和空间上的极大扩展,很多以前没有发现的规律被意外发现。

再次,传统统计分析以分布理论作为研究基础,而分布理论建立在概率保证的前提下。所以传统的统计分析方法最基础的方法就是根据样本的特征去对总体的特征进行推断,并运用分布理论来对得出的结论提供一定程度的概率保证,这就意味着统计结论的质量直接取决于样本的质量,大数据统计分析的对象是总体数据,其不再受到分布理论的约束和限制,只要单纯地进行计数或者计量处理就可以完成统计分析工作。另外,大数据在分析总体数据的实际分布情况和特征的前提下还能够判断某种情况的可能性高低,也就是说大数据下的统计分析遵循的是实际分布―总体特征―概率判断的思维逻辑,在这种情况下概率不再是预设的,而是根据实际分布情况得出的真实结论。

三、积极应对大数据

首先,在大数据时代背景下,我们需要改变总体、个体和样本的传统内涵。传统统计分析首先要有总体,然后才有数据和样本。但是在大数据时代这种情况发生了逆转,我们首先拥有了数据,然后才有的总体。大数据并无事先定义的总体目标,只有和各个时点对应的一些事后总体,主要原因在于大数据之中的个体是在不断变化着的,是难以用事先的名录库对其进行归纳和总结的。在统计分析之后对事后个体进行识别也是相当困难的,因为在大数据中一个个体可能有多个不同的称呼和表达方式,在不同网络体系中的相同称呼或者表达方式也不一定就是同一个个体,所以,在大数据中我们见到的往往都是数据外形,但是对数据个体却不识庐山真面目,但是这不意味着我们对大数据的分析可以忽略总体口径上的问题,我们依然需要对数据个体的身份进行识别。尽管总体和个体的内涵并没有发生变化,但是我们依然需要改变总体和个体的定义方法。与此同时,当我们从大数据中提出样本的时候,样本的定义方式也随之发生变化。鉴于大数据本身具有极强的流动变化性,其在任何一个时点的总体都可以被视为一个截面样本。

其次,大数据时代要建立新的数据分析和梳理方法。受到数据本身复杂和多样特点的影响,加之大数据是先有数据总体后有总体的特性,原有的数据分析和梳理方法将不再使用。大数据之中存在着新的信息内容、流行的网络语言、不同的数据表现形式,我们是难以对产生信息的种类、信息之间加以区分的有效分类标识、信息和个体之间的对应关系进行严格地控制和划分的。面对超大量的数据,我们只能从数据本身着手进行观察,采取不同的数据分析和梳理方法,否则要想对大数据进行统计分析是不可能的。

参考文献:

[1]Viktor Mayer-Schǒnberger,Kenneth Cukier.盛杨燕等译.大数据时代[M].浙江人民出版社,2013

大数据时代含义范文第5篇

关键词:中医古籍;大数据;数据挖掘

doi: 10.3969/j.issn.2095-5707.2014.03.004

Opportunities and Challenges of Traditional Chinese Medicine Ancient Books in the Era of Big Data

Zhu Yumei

(Shandong University of Traditional Chinese Medicine, Jinan Shandong 250355, China)

Abstract: This article expounded that the information of Traditional Chinese Medicine(TCM) Ancient Books possesses the characteristic of Big Data and demonstrated the opportunities and challenges of TCM Ancient Books in the fields of data integration, information application and knowledge discovery.

Key words: TCM ancient book; Big Data; data mining

1大数据的背景、特点和含义

信息和能源、材料一起,并称为现代社会的三大支柱[1]。信息不可遏制的增长,导致了大数据时代的到来。大数据具有“大容量、种类多、流动快、价值高”的含义[2]。在维克托•迈尔-舍恩伯格和肯尼思•库克耶所著的《大数据时代:生活、工作与思维的大变革》一书中谈到,起源于电子信息领域的大数据概念正在日益深刻地改变着我们的生活以及理解世界的方式。在该书中谈到,大数据具有三个特点,第一是全面性;第二是模糊性;第三是由探求因果关系,转向事物相关性的寻找,要让数据自己发声;建立在相关关系的分析基础上的预测是大数据的核心[3]。

2中医古籍信息具有大数据的特点

中医古籍是中医理论和诊疗实践传承的载体。中医古籍信息量巨大,据《中国中医古籍总目》记载,在全国131个图书馆中馆藏中医书目有1.3万种。

中医古籍信息种类繁多,从临床诊疗经验的描述、中药的采集、药性的辨别到理论的阐述,既有严格遵循逻辑理论原则的医案解释,又有偏方验方汇集。中医古籍信息历经几千年,横跨南北方,既有横向的学术争鸣,又有纵向的流派传承,既有一定的理论自洽性,又有各自独特的见解。

基金项目:国家公共卫生资金项目(2010GJ01)

作者简介:朱毓梅,副研究馆员,研究方向:图书与文献信息研究。E-mail:

中医古籍信息的利用率不高,但无疑古籍中蕴含着极为有价值的知识。不仅临床中医医生要借助于古代文献中的知识来处理病患,2011年美国“拉斯克临床医学研究奖”――青蒿素的发现也来源于古籍文献。

中医思维的习惯是“取类比象”。个例化诊疗是中医临床的特色描述方式。个别是一般的基础,规律是个体的凝练。中医在被迫接受现代科学“大量、双盲、随机”统计学方式的同时,也在坚守着自己“天人合一,辨证论证,个体化诊疗”的特色。中医传统理论不是由“可观察、可设计、可控制、可预测”的实验证实的、具有明确因果逻辑关系的科学理论,而是采用经验的、“取类比象”的方式进行的描述。比如对于发热的症状而言,因为“热”的现象和太阳的发热、物体的发热是具有相似性的,在现实生活中,用寒凉的物体可以消除或者消退热的现象,而在中医实践中,石膏的服入可以治疗发热的症状,因此把石膏定位为具有“寒”的药性。这种“石膏-发热”到“寒-热”关联角度考虑问题的方式体现了中医自然哲学的特征。这种特征无法像现代生物学那样,从微观逻辑的角度、从实验设计的角度令人完全信服,但这种关联本身在实际的医疗实践中是非常有效的。生物医学的最终目的除了满足人们对于人体自身的好奇心之外,就是对于疾病好转的追求。忽略临床需要,一味追求理论的完美对于医学本身是有害的。中医的这种关联性思维方式无处不在,符合大数据时代对于相关性的重视。

在大数据时代,个别信息不确定,总体信息具有规律性。中医古籍信息良莠不齐,真理和谬误并存。就像我们不能从单一信息源出发,确定某个网络信息是否为真一样,对于中医古籍信息真实性的确定除了临床验证之外,我们可以通过全面信息的分析获得我们需要的知识。比如不同医家对于“不寐”的理论阐述是不同的,他们所采用的方药也是各异的,宋咏梅等[4]对历代治疗不寐方剂中的中药进行频次分析得知,酸枣仁是所有方剂中使用频率最高的药物,使用频率较高的药物包括人参、茯神、麦冬、半夏、远志、熟地黄、生地黄、柏子仁,这些常用药物在临床中是常用的,也是有效的。从大量不确定信息中找出有价值的信息,是大数据时代的特征。

中医专家系统的目的就是根据以往有效的临床经验,在疾病好转的驱动下,预测当前患者病因病机和诊疗方案的过程。预测的基础是对以往海量数据进行机器学习。中医古籍文献中的大量病例,是构建中医专家系统的基础。这些病例来自不同年代、不同地域的不同医家,具有鲜明的个性化特征。对于一个具体的患者,不同医家的预测方向可能是不同的,如何根据当前大量的、模糊的、不确定的知识选择最符合要求的诊疗方案,是中医专家系统能最终广泛应用于临床的关键所在。

3大数据时代中医古籍面临的机遇

中医古籍最初全部都是以文本形式存在的,与信息化数据相比,具有传播性慢、复制性差、容易损坏等特点。

传统中医从业者和研究者对中医古籍的利用具有局限性、片面性、时效性、地域性等不足。大数据的理念和技术为中医古籍信息的充分利用带来了机遇。

3.1在大数据时代,知识变得更加全面,海量数据的集成变得可能

在农业社会,很难想象一个人能够有机会阅读如此众多、不同年代、不同流派、不同地域的中医药著作。信息化时代打破了时间、地域界限和流派之争,使得面向主题的全面信息的存储和检索变得简单和可能。王振国等[5]研制的“中医药古文献保障系统”收录了上至秦汉,下至当代的十万余首方剂,并具有灵活的面向用户的知识服务功能;张启明等[6]在visual foxpro平台上,通过对历代中医医案文本数据的规范化、结构化处理,收录了历代医案22 459首,数据量达到2亿。

3.2在大数据时代,不确定的、模糊的个体经验,在数据挖掘后呈现总体的规律性

中医流传几千年,中医理论和成功诊疗的实践描述无疑是丰富的,信息量是巨大的。在过去,人们往往依靠个人在阅读有限书籍和临床的摸索悟性中寻找规律。如今数据挖掘技术使得规律的寻找变得更加直观和触手可及。相比于“第一原理”对客观世界微观领域的精确描述,数据挖掘强调收集大量的、复杂的、模糊的、不确定的数据,分析数据集合从而获得有用的信息和知识的过程[7-8]。

对中医古籍信息进行数据挖掘主要集中在病案和用药规律的研究。曾大方[9]对《临证指南医案》进行了频数统计的分析;陈擎文[10]在中医古籍治疗中风的医案基础中,运用频次分析和关联分析的方法,找到古代名医治疗中风最常用的7味中药、9个药对和3个三药对;周德生[11]集成了明清时期津液亏损的病案573例,采用R型系统聚类分析方法,确定了每个亚型的辨证用药规律;王佑华等[12]探讨了人工神经网络、决策树、粗糙集等方法应用于古籍文献信息数据挖掘的可行性。

3.3在大数据时代,个性化十足的师承将被中医专家系统取代

个性化诊疗是中医的特色,也是中医难以进行规范化的桎梏。中医专家系统是人工智能和中医药相结合的研究领域。自1979年第一台中医专家系 统――关幼波中医肝病诊疗系统诞生以来,迎来了10多年的研究热潮。到2008年底,研制的中医专家系统有200多个[13],比如鲍友麟“胃脘痛”专家系统、梁宗翰儿科脾病专家诊疗系统等[14]。到上个世纪90年代,由于中医专家系统的个性化特点,研制成的专家系统往往很难进行普及,中医专家系统的研究陷入低潮。王瑞祥等[15]在胃脘痛中医古籍信息的基础上,针对不同医生对同一患者诊断可能产生的不确定信息和不同症状体征对辨证的重要性难以把握的瓶颈问题,采用粗集理论结合聚类分析的方法,实现了不同年代中医专家的集体会诊,研制成功的胃脘痛中医诊疗系统,具有良好的理论基础和临床效果。

4大数据时代中医古籍面临的挑战

大数据时代尽管给人们带来了更全面的信息,更先进的技术,更科学的算法,但要使得中医古籍信息的作用得到充分的发挥,还面临着许多尚待解决的问题。

大数据要求数据越多越好,但中医古籍由于年代久远,保存不利,大量古籍流失,有的版本流落在民间,有的版本远在海外,现存古籍也面临大量修复的问题。

尽管大数据不强调数据的规范化和结构化[3],但对于中医古籍信息而言,由于年代和地域的差距过大,一词多义、多词同义现象非常普遍,如果不进行适当的规范化,很容易造成信息的误读,很难提取出有价值的信息。2010年,财政部专项公共卫生专项资金“中医药古籍保护与利用能力建设”对400本中医古籍进行整理,有望在一定程度上实现对中医古籍信息的确认和规范化[16]。2012年,科技部重点项目“中医药基础学科名词术语规范研究项目”在北京启动,项目将对中药、方剂等十个学科的8 000条名词术语进行规范,项目完成后,中医规范化名词术语将达到1.3万条,并建立同义词数据库[17]。尽管如此,中医古籍信息的规范化工作还有相当长的道路要走。

中医古籍中的不确定信息固然可以通过数据挖掘的手段提取出临床和科学研究中有价值的知识,但不可否认,很多有价值的知识并不是在古籍信息中普遍存在的。比如在发现青蒿素的过程中,是通过对古籍中记载的治疗疟疾的640个方药一一实验之后,才找到青蒿这一治疗疟疾的中药的。而数据挖掘仅仅体现在从2 000多个记载治疗疟疾的方药中精选出640个方药的过程。这种范围的缩小尽管有价值,但也是远远不够的。如何找到一个能对有价值信息进行精确定位的工具,是大数据时代中医古籍信息知识发现的关键。

5小结

在信息化浪潮里,中医古籍以其悠久的历史渊源、丰富多彩的信息内容、高价值的知识蕴含,越来越多地受到人们的关注,中医特有的相关性思维方式符合大数据时代的特征。根据相关性知识构建的具有预测功能的中医专家系统,可以在大量不同医家不确定知识的基础上进行确定性诊疗。在大数据理念和技术的指导之下,以中医古籍文本信息为本,最大限度地构建同义词数据库,保持古籍信息的原汁原味,在正确语义的基础上进行知识发现,并能及时应用于临床和科学研究,是中医古籍信息发挥作用的必由之路。

参考文献

[1]郁青.图书馆信息服务散论[J].图书馆界,2000,9(3): 8-11.

[2]韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报, 2012(5):37-40.

[3]维克托•迈尔-舍恩伯格,肯尼思•库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2012:18-42.

[4]宋咏梅,崔利锐,李军伟.古代失眠方药的文献分析[J].山东中医药大学学报,2012,36(5):392-394.

[5]王振国,刘耀,.基于信息构建(IA)的中医药古文献保障系统研究[J].中国中医药现代远程教育,2004, 2(7):5-8.

[6]张启明,王永炎,张志斌,等.中医历代医案数据库的建立与统计方法[J].山东中医药大学学报,2005,29(4): 298-299.

[7]DL Olson, D Delen. Advanced data mining techniques[M]. Springer Publishing Company,2008:5-7.

[8]Mehmed Kantardzic. Data Mining: Concepts, Models, Methods, and Algorithms[M]. A JOHN WILEY&SONS, INC, 2011:1-9.

[9]曾大方.《临证指南医案》方案的统计研究[J].山东中医学院学报,1985,9(1):13-17.

[10]陈擎文.数据挖掘技术在古代名中医中风医案之应用研究[J].中华中医药学刊,2008,26(10):2254-2257.

[11]周德生.明清时期津液亏损病案573例辨证用药统计分 析[J].中医药研究,1998,14(4):12-13.

[12]王佑华,陆金根,柳涛,等.中医医案中的知识发现研 究[J].中西医结合学报,2007,5(4):368-372.

[13]白春清.中医专家系统30年[J].医学信息,2011,24(2): 550-552.

[14]北京中医管理局科教处.关幼波、鲍友麟、梁宗翰老中医专家系统[J].北京中医,1992(4):54-55.

[15]王瑞祥.一种基于粗集简约的中医专家系统设计和实现[J].时珍国医国药,2013,24(10):2476-2477.

[16]林玉婷,林莉.论中医古籍的保护[J].中华医学图书情报杂志,2011,20(11):45-47.