前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇大数据在云计算中的应用范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
随着计算机信息技术的迅速发展,大数据技术在计算机信息安全提供了有利的条件。大数据技术对计算机信息安全的数据进行快速的收集和分析,云计算技术对数据进行加工处理。为计算机信息安全提供的可靠的基础。同时,大数据技术在数据分析的有效性有待进一步的提高,这也是我们要攻克的难点。
1.1大数据技术概述
大数据技术是一种现代化技术,核心技术由大数据采集、大数据预处理、大数据存储、大数据分析组成。具体处理的过程如图1所示:先进行数据采集,再对采集到的原始数据所进行如图2的数据清理、数据集成、数据转换、数据规约操作后,后进行存储和数据分析。得到高质量的数据。随着大数据技术的发展,在计算机信息安全中应用更为突出。除此之外,必须要注意的是,大数据技术对于海量的数据在数据分析时也存在一定的困难。这也是本文研究的方向。
1.2大数据环境下面临的计算机信息安全问题
大数据技术已经深入各行各业,加上计算机信息的开发性,对计算机信息安全带来了问题。在大数据技术的应用过程中,没有和各行各业的需求相融合。导致大数据技术给计算机信息安全带来的效果不理想。所以实际使用期间,必须要深入理解用户需求[1]。实施大数据技术的过程中,计算机信息存储、信息的安全管理部到位,还有黑客的攻击、病毒的侵入,使得计算机信息在传输的过程或存储过程中的信息被窃取,直接威胁计算机信息安全。
1.3大数据技术在计算机信息安全中的应用现状
目前,关于大数据技术在计算机信息安全中的应用的研究比较多,并给出了相应的保障计算机信息安全的方法和技术。在企业应用领域,奇虎公司取得了业内瞩目的成果,其提出的“云+终端+边界”安全模型囊括了360的系列计算机产品,也大有扩张之势头,对于提高计算机信息安全保障质量具有一定的指向意义。
2大数据技术在计算机信息安全中的关键技术
2.1云计算技术
在大数据技术、云计算技术的快速发展,大数据技术处理的海量数据的信息安全方面,云计算技术为大数据技术提供了强大的技术支持。云计算技术通常会采用分布式存储技术,将数据存储在不同的物理设备中。这种模式不仅摆脱了硬件设备的限制,同时扩展性更好,能够快速响应用户需求的变化。从而保证数据的高可靠性和安全性[2]。
2.2加密技术
计算机信息化的快速发展,对于海量数据的处理必须满足信息计算机信息的安全,必须对海量的进行数据加密处理。在计算机信息的传输、保存期间定期检测数据,确保数据的安全性。同时在实践操作中应用数据加密安全技术[3],杜绝计算机信息安全问题。
2.3数据备份技术
信息化的快速发展,给人们的生活提供了方便,但对计算机信息安全带来风险。在大数据技术中,数据的备份技术起到了很大的作用。通过数据备份技术为计算机信息安全提供足够的空间。目前在数据备份技术中,采用的存储介质为百度硬盘、移动硬盘、U盘、光盘这四种。各个企事业单位根据本单位的需求,选择相应的存储介质。同时要做到以便在发生突发状况时,比如断电、断网等,快速启动数据备份系统,防止数据丢失。
3大数据技术在计算机信息安全中的应用
3.1大数据采集技术
大数据采集技术在数据采集过程中,要考虑数据的安全问题,给予不同用户有身份验证。同时采取数据信息加密技术,利用数据传输过程的保真特点实现验证码和附加码的认证过程,从而加强对数据信息的完整性保护,继而更好地满足计算机网络安全防范的实际需求[4]。
3.2大数据存储技术
计算机信息的存储及传输要对信息进行保密和安全处理。大数据存储技术为海量数据的存储的安全性提供了保证。同时在计算机信息在信息的传输过程中,对计算机信息的数据进行加密保护。大数据存储和传统的数据存储的不相同,大数据技术应用表现形式是实时性。数据以每年增长50%的速度快速增长,特别是非结构化数据的增长。随着信息时代的进步,有越来越多的传感器采集数据、移动设备、社交多媒体等等,所以数据只能继续大幅增长。总而言之,大数据储存技术需要非常高性能、高吞吐率、大容量的基础设备。
3.3大数据技术、云计算技术
大数据技术和云计算技术在计算机信息安全中的应用是密不可分。大数据技术对计算信息安全的处理采用分布式结构处理。通过云计算技术的分布式处理、分布式数据库、云存储、虚拟化技术对海量数据的处理、存储。给计算机信息安全提供支持无论你采取何种数据分析模型,还是运算方式,它都是通过将海量的服务器资源通过网络进行整合,以整理出有效的数据信息,并将其分配给各个相对应的客户,来处理因存储资源不足给用户带来的问题。大数据技术是海量数据爆发式增长所带来的一个全新的研究领域,对于大数据的研究,主要集中在如何对其进行存储和有效的分析,大数据是依靠云计算技术来进行存储和计算的。通过大数据技术和云计算技术的配合使用,给计算机信息安全带来便利。
4大数据技术在计算机信息安全中的应用展望
4.1建立安全服务后台
建立安全服务后台的,将通过对计算机信息进行认证、授权、监控、分析、预警及响应等服务管理,实时提供信息服务。大数据技术的应用,有效解决了海量数据的处理,为计算机信息安全提供了保证。
4.2大数据技术的安全智能化发展
为了预防计算机病毒的入侵和黑客的攻击,必须建立计算机智能化发展。有效预防和解决这些问题,在计算机信息安全维护中,对于计算机信息安全的智能化判定快速的提升,是值得大数据技术、云计算技术参考学习。
关键词:大数据;应用感知;云计算;软件定义网络;云存储
中图分类号:TP391 文献标识码:A 文章编号:2095-1302(2017)07-00-06
0 引 言
大数据(Big Data)[1]可被定义为具有4V特征的数据,即数据量及规模巨大且持续增长(Volume,一般指数据量达到PB以上级别);多源/多样/多结构性,不同的数据源、数据类型(Variety,复杂文档及多媒体,结构化、半结构化和非结构化数据);高速性,由于存在用户数量庞大与实时性等因素,数据的生成、增长速率快,数据处理、分析的速度要求也高(Velocity);有价值性/精确性,数据量庞大,虽然价值密度低或个别数据无价值,但数据总体上是有价值的(Value/Veracity)。
大数据环境已成熟,云计算中的大数据分析/处理,大数据处理与网络/硬件的协同工作,大数据的私有性及云平台的能耗等方面对网络及其资源调度的需求,使得大数据应用与物理网络之间的交互尤显重要,一方面让网络呈现出“应用感知网络(Application Aware)”的特性,使之更好地服务于大数据应用;另一方面,如何让大数据应用/用户方便高效地访问、调度网络资源,减轻大数据应用在网络访问决策上的负担是当前大数据应用研究中的热点问题。
1 云计算环境下的虚拟化
云计算[2]作为下一代计算模式,具有超大规模、高可扩展性、高可靠性、虚拟化、按需服务和价格低廉等特点,通过调用网络中大量计算节点/服务器完成核心计算业务的任务,向用户提供多层次的服务如基础设施、平台、存储服务和软件服务等。在大数据应用中,云计算的核心功能主要有数据存储/管理(以数据存储为主的存储型云平台)和数据分析/处理(以数据处理为主的计算型云平台)。云计算提供商将大量计算节点与网络设备连在一起,构建一个或若干个大规模(由具有万甚至百万级以上的计算节点所组成)数据中心,通过云平台实时访问、调用网络、存储、计算等资源为用户服务。
云计算核心组成逻辑如图1所示。云计算主要由服务器、存储和网络组成。为了使得云能够更快、更方便地响应企业用户的需求,服务器(层)和存储(层)已经通过在实际基础设施和云环境之间构建抽象层实现虚拟化,满足配置、管理和使用服务器及存储资源的要求。但最终还需要依靠网络将资源连接集成以搭建一个完整的云环境。“大数据应用环境下与网络的交互”以及“网络与计算资源的交互”面临以下三方面的要求:
(1)大数据应用层与网络的交互:网络结构相对稳定,但由于云环境的高扩展性以及节点规模的庞大,使得服务器和存储这两方面的资源会时常发生变化,如服务器/节点的添加――断电、故障、恢复、新增节点等或存储磁盘的故障、失效等。面对这些变化,上层大数据应用如何能更好、更快地获取计算资源的变化?
图1 云计算核心组成逻辑图
(2)计算资源与网络的交互:在大数据处理中,各计算资源的状态与承担的任务及负荷各不相同,为合理使用计算资源并计算资源负载平衡,网络如何能更快更方便地告知上层大数据应用其所获得的感知信息,并让应用或用户调整其调用计算资源的策略?
(3)计算资源按上层大数据应用的需求动态调整:上层应用复杂多变,面对应用/服务的变化,其所需的计算资源也不同,如何更快地调整、组织计算资源让其适应并为上层应用提供服务?
为满足上述需求,添加两个具有扩展性的接口层形成大数据应用与计算资源(服务器/存储)的中间层,这两个接口层如下:
(1)大数据应用层与网络层之间的交互接口层;
(2)网络层与计算资源层(服务器/存储)之间的交互接口层。
2 开放式协同平台的中介――SDN
2011年10月,美国麻省理工大学Kate Greene教授提出了SDN (Software-Defined Networking,SDN)软件定义网络技术的概念[3]。所谓SDN,是指根据不同的使用需要,通过软件来完成所有路由器与交换机的动态配置。并于2011年3月成立了以实现该概念为目的的网络联盟Open Network Foundation (ONF),提倡使用OpenFlow作为实现SDN的重要技术。
OpenFlow网络的最大特点是将传统的交换机路由控制部分与数据传送部分分离,使得网络设备可以专注于数据包转发,从而极大地简化了交换机的体系。OpenFlow网络的主要构成元素包括支持OpenFlow协议的交换机(OpenFlow Switch),交换机控制器(OpenFlow Controller)以及用于交换机与控制器之间的控制协议(OpenFlow Protocol),其体系结构如图2所示。
OpenFlowW络可以处理包含在数据包中的各种信息,如MAC地址,IP地址,VLANID,MPLS标识,TCP端口等共15类,将这些信息与数据包的处理方法相结合,用于设计OpenFlow交换机的Flow Table。Flow Table即数据包的处理规则与处理方法对照表,如对含有特定VLANID信息的数据包执行数据包转发、丢弃或多播等操作。
网络管理人员通过对Flow Table进行详细设计便可轻松实现对数据包交换路径的精准控制。随着云计算应用的不断增多,频繁的网络重新配置不可避免。VLAN组网技术支持网络管理员动态对网络进行配置,是目前HDFS云存储的主要组网技术。但VLAN组网技术面临以下问题:
(1)当子网数量不断增加时,采用VLAN对网络进行管理将会使情况变得很复杂;
(2)只能利用VLANID进行组网,组网的灵活性不高,无法适应来自云计算的不同需求。
(3)除电信运营商级的VLAN技术外,数据中心级VLAN技术几乎不能实现异地云存储服务器之间的连接。异地云存储系统互连的重要性在于通过将数据备份在不同的物理地点来消除单一故障(电力中断,火灾等)引起的服务中断,这正是ONF联盟将OpenFlow列为云计算网络控制技术之一的主要原因。
图2 OpenFlow体系架构
3 存在问题及分析
3.1 从大数据处理的角度分析
在大数据应用的环境下,大数据分析/处理的计算框架以MapReduce编程模型最具代表性。MapReduce计算模型在执行中,首先对数据源进行分块,然后交给不同Map任务区来处理,执行Map函数,根据数据处理的规则对数据分类,并写入本地磁盘;Map阶段完成后,进入Reduce阶段,执行Reduce函数,具有同样Key值的中间结果从多个Map任务所在的节点被收集到一起(称为Shuffle)进行合并处理(称为Merge),输出结果写入本地磁盘。最终通过合并所有Reduce任务得到最终结果。
以MapReduce计算模型为基本核心原理,相似的计算模型有如下几种:
Hadoop[4]:核心由HDFS和MapReduce组成,其中Hadoop-MapReduce是Google MapReduce的开源实现。
Dryad[5]:与MapReduce计算模型相似,其总体构建用来支持有向无环图(Directed Acycline Graph,DAG)类型数据流的并行程序。Dryad的整体框架根据程序的要求完成调度工作,自动完成任务在各节点上的运行。
Hadoop++[6]:Hadoop++是通过自定义Hadoop框架中的split等函数来提升数据查询和联接性能,即通过Hadoop用户自定义函数方式对Hadoop-MapReduce实现非入侵式优化。
CoHadoop[7]:Hadoop无法突破把相关数据定位到同一个node集合下的性能瓶颈。CoHadoop是对Hadoop的一个轻量级扩展,目的是允许应用层控制数据的存储。应用层通过某种方式提示CoHadoop某些集合里的文件相关性较大,可能需要合并,之后CoHadoop尝试转移这些文件以提高数据读取效率。MapReduce计算过程示意如图3所示。
图3 MapReduce计算过程示意图
Haloop[8]:Haloop是一个Hadoop-MapReduce框架的修改版本,其目标是为了高效支持迭代,递归数据分析任务。递归的连接可能在Map端,也可能在Reduce端。Haloop的基本思想是缓存循环不变量(即静态变量)到salve nodes。每次迭代重用这些数据。
HadoopDB[9]:HadoopDB是一混合系统。其基本思想是采用现有的MapReduce作为与正在运行着单节点DBMS实例的多样化节点的通信层,实现并行化数据库。查询语言采用SQL表示,并使用现有工具将其翻译成MapReduce可以接受的语言,使得尽可能多的任务被推送到每个高性能的单节点数据库。
G-Hadoop[10]:通过现有的MapReduce计算模型配合高速的存储区域网(Storage Area Network,SAN)实现在多群聚环境,为大数据应用提供一个并行处理的环境。
P2P-MapReduce[11]:是一个动态分布式环境中自适应的MapReduce框架(2P-MapReduce),利用P2P模式在动态分布式环境中管理计算节点的参与、主机失败和作业恢复等,为大数据应用提供服务。
Spark[12]:Spark是一个与Hadoop相似的开源云计算系统,支持分布式数据集上的迭代作业,是对Hadoop的补充,用于快速数据分析,包括快速运行和快速写操作。Spark启用内存分布数据集,除能够提供交互式查询外,还可优化迭代工作负载。
Hyracks[13]:一个受MapReduce启发,基于分区并行数据流的大数据并行处理系统,用户可将计算表示成数据操作器和连接器的有向无环图(Directed Acycline Graph,DAG)类型数据流。
大数据处理框架的设计思想见表1所列。
(1)MapReduce计算执行过程中的Shuffle阶段――执行完Map阶段后会产生大量中间结果数据,该阶段根据中间输出结果中的Key值进行分类并分发到相关节点执行Reduce函数;
(2)其余类MapReduce计算模式、迭代、递归等也需要进行大量分片和合并操作。
在这两个过程中产生的大量中间结果数据要在不同的节点(Map节点/Reduce节点)之间传输,数据规模越大、参与计算的节点越多、Map-Reduce的迭代/递归次数越多,节点间传输的频度及数据量也越大,占用网络的带宽及时间也越长,最终可能导致网络拥挤与堵塞,严重影响大数据处理框架的性能。
缺乏应用感知网络的支持,这些大数据处理框架其性能得不到很好的发挥,因此,在大数据处理框架与网络之间构建一抽象层,通过抽象层实现大数据处理框架与网络之间的交互是一个有效的解决方式。一方面大数据处理框架无需修改现有的计算模式,直接通过该层告知基础设施其所需计算资源的类别,而非特定的某一计算资源,从而让计算资源调度策略从数据处理框架中脱离出来,使得计算过程主要关注数据的分析/处理,减轻大数据处理框架的包袱;另一方面通过该抽象层为第三方提供网络访问/调整的接口,在网络物理结构不变的前提下按大数据应用需求调整网络逻辑结构,方便资源调度策略的优化和实施,构建应用感知网络更好地为大数据应用提供服务。
3.2 从云存储的角度分析
在大数据应用的环境下,存储是核心的组成之一,HDFS(Hadoop Distributed File System,HDFS)是当前主流的一款开源云存储框架,是一个分布式文件系统,更是适合运行在普通硬件上的分布式高容错文件系统,当前绝大多数云存储系统都通过HDFS实现。
HDFS的系统架构如图4所示。
HDFS采用Master/Slave架构。HDFS主要由Namenode(master)和一系列Datanode(workers)构成。一个HDFS集群由一个Namenode和一定数目的Datanode组成。HDFS支持传统的层次型文件组织。Namenode是一个中心服务器,负责管理文件系统的namespace以及客舳硕晕募的访问。HDFS有着高容错性的特点,部署在低廉的硬件上,提供高传输率来访问应用程序的数据,是为以流的方式存取大文件而设计,适合拥有超大数据集的应用程序。HDFS支持大数据文件,能够提供大数据传输的带宽和数百个节点的集群服务,能够支持千万级别的文件。所有的HDFS通讯协议都构建在TCP/IP协议上。HDFS设计目标对网络的需求:
(1)硬件故障/错误及副本策略
硬件故障/错误是常态而非异常。HDFS集群由成百上千的服务器构成,每个服务器上存储着文件系统中数据的一部分,任一个服务器都有可能失效。因此错误检测和快速、自动恢复是HDFS最为核心的架构目标。此时,在网络上需解决网络可用的计算节点数量减少,一部分文件的可用副本数减少等问题。为确保文件副本的数量,数据需备份,以防故障。
(2)流式数据访问
HDFS应用程序需要流式访问数据集。HDFS进行的是数据批处理,而非用户交互处理;相比数据访问的低延迟,更应保证数据访问的高吞吐量。
(3)大规模数据集
大数据应用中的应用程序是在大规模数据集基础上的计算。HDFS上一个典型文件的大小一般都为G字节至T字节。因此,大文件存储且能提供整体上数据传输的高带宽,能在一个集群里扩展到数百个节点,使得网络中的计算节点之间、存储节点之间必然有大量数据传输。
(4)计算移到数据附近
数据离应用程序越近,计算就越高效,尤其是在数据达到海量级别时。因为这样就能降低网络阻塞的影响,提高系统数据的吞吐量。
(5)数据复制及副本存放
HDFS能够在集群机器上可靠地存储超大文件,其将文件分割成若干“块”,除了最后一个,所有“块”大小一致。为了容错,文件的所有数据块都有副本。每个文件的数据块大小和副本系数都可配置,应用程序可以指定某个文件的副本数目。数据复制与采用的副本策略有关,且由于故障、更新、备份(HA的主要解决方案:Hadoop的元数据备份方案、Secondary NameNode方案、Checkpoint node方案、Backup Node方案、DRDB、Facebook的Avatarnode方案)等原因,数据复制经常发生在同机架的不同存储节点之间及不同机架的不同存储节点之间,这个过程必然依靠网络。
其他一些云存储系统如GFS(HDFS是GFS的开源实现)、CoHadoop、StorNext FS、Lustr、Total Storage SAN File System、DDFS(Disco Distributed File System)等,其设计目标主要为上述几个方面。
云存储系统设计目标的实现依赖于畅通的网络。云存储作为大数据应用的核心支撑,其效能直接影响到大数据应用的性能,云存储框架与网络及计算资源的(服务器/存储)高耦合(数据调度、存储调度、副本存放、数据操作等与具体计算资源的选择与使用高耦合)关系,将影响应用框架的可扩展性。在云存储的文件操作与网络中的存储资源之间插入中间抽象层,云存储系统只需告知抽象层申请的计算资源的类别,通过抽象层与计算资源之间的接口访问某类资源,实现文件的相关操作,一方面能方便地直接访问抽象层反馈的计算资源集,另一方面将操作的具体实现过程标准化,通过抽象的接口简化云存储系统的操作。
3.3 从大数据分析/处理任务调度的角度分析
大数据分析/处理都在集群(Cluster)的基础上完成,通过网络连接多个成为节点的计算机为应用提供计算、数据存储和通信资源等。以Hadoop集群所提供的大数据分析/处理为代表,Hadoop集群中节点负责数据存储、集群维护管理和数据分析/处理的任务。在作业/任务调度中,分为JobTracker(控制节点)和TaskTracker(任务节点/执行节点)。一般情况下,Namenode和 JobTracker合并在同一台物理服务器上,Datanode和TaskTracker作为集群的主要部分也会被安装在相同节点上且大量散布于集群中。
集群结构如图5所示[14,15]。
控制节点负责HDFS和MapReduce执行的管理(JobTracker),其余节点为执行节点(TaskTracker),负责数据的存储和计算。任务调度是JobTracker指派任务(tasks)到相应TaskTracker上执行的过程。任务调度过程如下:
(1)JobTracker调度和管理其它TaskTracker,并将Map任务和Reduce任务分发给空闲的TaskTracker,让这些任务并行运行,并负责监控任务的运行情况。
(2)TaskTracker负责具体任务的执行,并向JobTracker报告自己所处的状态,接受其管理调度;一个重要的任务是原始输入数据和中间运算结果的存储和传递(在网络中不同TaskTracker之间传递中间结果数据)。
(3)JobTracker和TaskTracker之间通过网络以心跳机制实现通信。
(4)当一个Map任务被分配到执行节点执行时,系统会移动Map计算程序到该节点――在数据存储的Datanode节点上执行这部分数据的计算,以减少数据在网络上的传输,降低对网络带宽的需求。
(5)在一个Reduce任务被分配到一个空闲的TaskTracker节点上执行时,JobTracker会先将中间结果的key/value对在执行Map任务的TaskTracker节点上局部磁盘位置信息发送给Reduce任务,Reduce任务采用远程过程调用机制从Map任务节点的磁盘中读取数据。
任务/作业调度方法直接关系到Hadoop集群的整体系统和系统资源的利用情况。针对MapReduce集群先后提出了很多调度策略,包括FIFO调度、HOD调度、计算能力调度、公平{度等。
在任务/作业的调度中,无论何种调度策略,对网络的使用及需求如下:
(1)JobTracker在分配任务前,必须与该任务使用的数据源所存储的节点(节点集)建立联系,并通过节点的空闲状态以判断是否在该节点启动任务。针对一个文件,其被划分为多个块存储在各节点上,每个文件块对应多个(默认设置为3)副本,每个副本存储在不同的节点上,因此,一个任务对应要判断多个节点的状态。当多个任务并行时,JobTracker要审阅大规模节点的状态,当前JobTracker节点与这些节点之间的网络状态对任务启动的策略及判断有非常大的影响;
(2)JobTracker无法判断及获知被选中的计算节点的当前网络状况及其历史网络情况,因此计算节点的网络状况这一因素在任务调度中被忽略,不利于有效利用网络以提高大数据分析/处理性能;
(3)在Reduce任务分配时,JobTracker由于不了解TaskTracker节点的当前网络状况及其历史网络情况,无法根据TaskTracker节点的网络状况来选择最优的节点启动Reduce任务,故无法高效快速地获取Map任务产生的大量中间数据,从而影响了数据分析/处理的性能;
(4)在任务执行的过程中,JobTracker与大规模的TaskTracker节点之间利用网络来实现心跳机制的通信,JobTracker需要有稳定的网络来支持。
其它如表1所列的大数据处理框架中的任务调度也存在类似问题。所以,针对上述问题,在计算资源及网络的上层架设一抽象层,负责统计网络的当前状况及各节点的网络状态,维护计算资源的状态,任务调度器只需向该抽象层提出执行的任务(主要为TaskTracker的任务)及申请使用的计算资源的类别,从抽象层中获取得到相应类别的计算资源,最后执行任务。通过架设这一抽象层,可以做到:
(1)大数据应用环境下的任务调度器,只需关注调度策略及使用的计算资源类别,抽象层负责维护具体的计算资源的状态,反馈告知调度器可按需查询抽象层中所维护的计算资源的信息,实现计算资源对调度器的虚拟化;
(2)通过向抽象层中加载针对计算资源状态分析、网络历史情况分析及节点网络状况分析的第三方策略获得计算资源的最优或次优集,能更有效地利用网络来优化任务调度,通过提供计算资源调度策略的接口,有利于提高当前计算框架的数据分析/处理性能;
(3)由于抽象层对任务调度器反馈的是某类计算资源中最优或次优的可选节点集,能实现节点及网络的负载平衡,预防Map/Reduce任务之间大数据量传输所造成的网络拥挤及堵塞,避开网络带宽的瓶颈。
3.4 从大数据处理中容错处理的角度分析
由于大数据应用环境下,数据的规模、计算资源(存储、服务器)的规模和同时并行处理的任务规模都极其庞大,各种情况的失效[16,17](服务器故障、软件故障、存储器故障、运行环境故障等)已成为一种常态行为。
MapReduce是一种并行编程模型,作为典型的大数据处理框架,被经常用以处理和生成大数据集。任务调度以及容错机制作为模型的重要组成部分,会对整个大数据处理框架的性能产生直接影响[18,19]。提高整个大数据应用环境的容错性[20](分布存储的容错性、物理拓扑结构的容错性、数据的容错性等)是云计算面临的一项挑战。大数据应用环境下,为提高容错性对网络的需求主要有以下几个方面:
(1)节点失效、存储介质故障导致文件数据丢失。选择另外一个或多个有足够存储空间的节点来存储受影响的文件后,常态化需要在跨机架或同一机架跨节点之间进行数据的复制/迁移 ,因此需要得到网络在时间和带宽上的支持;
(2)元数据服务器失效/JobTracker失效。为防止元数据服务器失效,应对元数据备份众多方案,在实施方面,网络需在备份操作期间保持稳定且维持一定的带宽,以便传输日志、元数据信息等,保证数据的一致性;
关键词:大数据;云资源;云计算;应用
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2015)05-0017-02
现阶段,大数据这一概念广泛被人们熟知,是继数据云计算、数据挖掘后涌现出的另一项信息革命。在大数据的研究上,众多商业机构,如IBM、Microsoft等都已介入,在借助云计算这一数据信息平台的基础上,研发了大数据信息资源处理产品。作为高校来讲,充分运用大数据时代的相关技术及产品,着重培育及使用高校云资源,具有极强的现实研究价值。
1大数据及其基本概述
大数据这一概念首先由麦肯锡公司在于2011年在分析报告中提出,在这一报告中,该公司表示:在社会生产生活各领域中,已被数据广泛覆盖,数据开始作为一种生产要素存在,通过对数据的调用,可以培育出新的消费增长点。但在业界关于大数据的具体内涵界定上,尚未形成统一的表述,不一而足的内涵表述方式都是基于一点:大数据具备较为庞杂的数据量,在数据信息的种类及形式上具备繁复多样性,大数据并不等同于海量数据[1]。
结合相关数据统计,2010年,全世界范围内的信息数据总量达到了1.2ZB,通过对这些数据加以分析时可以获取以下信息:结构化数据在数据总量中占比仅为10%左右,剩余的数据主要以半结构或非结构化数据形式为主,如视频、邮件、微博等。除了数量庞杂,种类形式多样外,大数据还具备了快速预测的特点,具有较高的应用价值。例如,美国的海洋及大气管理部门,在日本发生地震灾害后,借助大数据信息,能够在极短的时间内制定并海啸灾害的预警防备措施,从而能够为有效预防后续灾害提供强力支撑。
2大数据时代背景下,高校云资源的整合与利用
在大数据时代,随着信息技术及云计算的研究发展,高校信息建设能够突破原有的信息局限性,消除原有的高校信息资源孤立化的弊端,可以通过云计算技术的运用将高校的各种教学资源加以整合利用,形成一个高校云资源储存及管理的平台,从而通过在此平台中调用各类资源,为高校各项教学活动及管理决策的制定提供技术及服务参考。此外,更为重要的一点是,大数据时代背景下,伴随云计算而出现了众多的信息终端装置,通过采用云计算技术,可以将这些信息终端装置与高校的教学活动有效连接,一方面强化了教师与学生的交流沟通,另一方面有助于学生高效地开展学习活动。
总体上看,大数据时代的到来,给云计算功效的真正发挥提供了技术支持,使得云计算可以和大数据、高校三者之间有效衔接,使高校教育资源能够被充分调动起来,为高校云资源的整合利用带来了一些新的变革:
2.1为高校图书馆管理及发展提供契机
大数据时代下云计算的优势在高校图书馆中体现最为明显,其给高校图书馆管理及发展带来的影响主要是改变了其服务的基本形态,借助云计算,可以使图书馆进行网络及数字化应用阶段,从而建立起了以云资源为主要模式的高校数字图书馆。例如,借助云计算技术,我国山东省高校图书馆构成了基于云技术的图书馆联盟,实现了资源、管理及服务上的共享化,一体化。
此外,大数据凭借其数据分析及挖掘功能,可以对云储存端的各种信息数据加以分析归纳,从而对学生的图书借阅需求,学生群体的知识层次结构等加以揣摩,从而为图书馆管理者更好地进行决策提供借鉴;针对借阅者的科研及读者与图书馆之间的交互服务,可以借助大数据开展预测分析,做到图书馆后期发展阶段未雨绸缪;针对图书馆信息数据的馆藏,还可以通过大数据建立相关的风险评估模型。
2.2 为高校学习效率的提升提供指导
大数据和及云计算之间的融合,能够使教育资源实现应用上的有机整合,做到将存储在云端的高校教学资源加以共享,再借助大数据的数据分析及挖掘功能,对教育信息资源中蕴藏的各种数据信息进行分析提炼,从而为高校教与学策略规划提供帮助[2]。此外,通过运用大数据还可以着重对学生在学习中的各项行为及爱好等数据信息加以分析,摸准学生的学习特点,以此为教师科学制定教学决策予以指导。最后,大数据还可以被用于对学生的学习效果及学习倾向进行分析评价,通过对学生业务时间参与各项活动的信息加以解析,可以对学生的学习效果及倾向加以评估,便于教师掌握学生学习及生活动态,提升教与学的效率。
2.3为高校管理决策提供参考
传统的数据分析是基于群体调查而展开,不具备较高的数据精准性。进入大数据时代后,借助大数据具备的数据分析整理功能,可以为决策的制定提供更加全面到位的数据信息参考,从而使管理及决策者对市场、产品及消费群体的把握更加准确。作为高校来讲,通过运用大数据及云端信息分析处理技术,也可以对高校的发展状况及后期趋势加以模拟,将高校管理决策与相应的数据信息相印证,从而起到规避决策风险的效果。另外,通过大数据技术,还能够使高校教育达到质量与公平上的统一,而大数据技术贯穿于高校各个部门中,又可以进一步对高校教学及管理成效加以验证,有助于高校改革的退行实施。
3大数据时代高校云资源应用中的数据处理及服务的原理和流程
大数据时代背景下,对云资源加以利用时,人们的关注点不仅仅局限于数据的分析及使用,而更加注重通过数据分析对之后的发展趋向加以预测。这就需要我们对云资源在信息数据处理及服务方面的流程进行探究。
3.1 高校云资源的信息数据处理
伴随着云计算的出现,在教学资源的信息数据处理上有了革命性的提升,围绕着云计算,各大高校着力打造以云为核心的教育模式。但在对高校云资源加以分析时,通常选用关系数据库的形式,一方面其信息分析及管理成本较高,另一方面也无法对后期教育资源应用趋势加以前瞻分析。因此,基于大数据,Hadoop技术得以形成,该技术涵盖了资源内存检索、数据实时反应,主要借助Map Reduce对数据加以管理,从而做到了对信息资源的高效分析。在具体处理流程上,该平台通过对云端上的各种信息碎片数据,如学生及教室的云端信息等加以整理汇总,然后再对这些数据碎片加以提炼,形成具有连续性的信息数据,最后该平台接收并对这些信息数据加以分析,在数据挖掘技术的配合下,最终构成具备较强价值的信息,为教师、学生及管理者提供指导。
3.2 高校云资源的教育资源服务
在大数据及云计算的辅助下,高校资源的用户在资源需求上也出现了一定程度的变化,由此也使高校资源在服务上,管理模式上及途径上也有所改变。结合大数据及云计算的特征规律,可以预见到,高校教育及服务主要依靠采用大数据对信息数据加以分析、提炼,在此基础上提供具体的资源服务,因此,高校云资源教育服务的针对性将更加凸显[3]。首先,高校云资源是以提供准确及时的信息服务为宗旨,资源用户不必探究其形成过程,只要对其结果加以运用即。其次,大数据技术体系下,通过对信息数据碎片加以分析,然后反馈到云端资源中,用户可以针对某一项信息要素,如教学方法及手段进行重点分析,可以对其效果加以评估,从而使教师及时修正自身教学方式,以提高教学效率。第三,大数据时代与信息化的有效结合,能够使高校云资源服务形式更加多样,如教师及学生可以对资源使用情况进行评价,通过大数据进行采集及分析,可以对教育资源的使用及改进建议加以汇总,从而提高云资源服务的主动性。
4大数据时代高校云资源应用的趋势分析
4.1 高校云资源的应用以满足学生终身学习需求为方向
在大数据时代下,作为高校信息资源来说,已经不是传统的较为明确的关系数据,而是各种基于学生访问及调用的各种非结构形式的数据,如信息资源的浏览访问及下载访问等[4]。在这一趋势下,高校云资源的信息数据处理就需要将重点转向对此类信息数据的分析工作,然后将结果以数据的形式加以呈现,从而便于学生能够对自身的学习情况及信息获取频率加以掌握,使学生从盲目地学习状态中走出,满足自身终身学习的需求。
4.2 高校云资源的应用以打造交流沟通类型的课堂教学形式为方向
传统高校教学课堂,师生之间的交流不够频繁,教学效果收效不明显,在大数据时代背景下,借助大数据分析技术,教师能够对学生的学习情况加以全面掌握,从而根据学生的学习兴趣点及侧重点,通过多种多样的教学手段,从高校云资源中挑选教学资源,通过教学课件及视频的方式予以呈现,一方面可以使学生的学习更具针对性,另一方面围绕学习中的难点及重点,教师也能够更多地与学生展开交流沟通,从而实现教学相长的目标。
5 高校云资源的应用以促进教室及教学设备管理更加快捷高效为方向
在高校教室及相应的教学设备管理上,在大数据时代以前,往往安排专人进行负责,一方面增加了高校的人力投入成本,另一方面其管理效率未必高效。与之相对应,在大数据时代背景下,可以通过对高校云资源的存储信息加以提炼,获取高校教室及相应的教学设备使用数据,通过对其加以分析整理,可以形成某一时段教室及设备的应用信息及应用的趋势,从而为管理人员科学判断该教室及设备能否满足教学活动需求,是否存在故障发生临界点提供数据支持,以便管理人员及时对教室及设备加以维保,既节约了管理成本,又能够提高教室及设备资源的利用效率。
6 结束语
大数据伴随着信息技术及云计算技术的不断发展而出现,现已被各行业管理人员普遍重视,并着重开展了相关的实践及应用。作为高校来讲,其信息资源逐渐向着复杂化、规模化方向发展,通过借助大数据及云计算技术,可以建立高校云资源数据库,为教学、学习及决策提供详尽科学的指导。
参考文献:
[1] 邹流乡,王朝斌.高校云计算资源共享平台建设研究[J].西华师范大学学报(自然科学版),2014(1):91-94.
[2] 郭松.大数据时代高校学习资源云存储模型构建研究[J].软件导刊・教育技术,2014(11):48-49.
关键词:大数据;云计算;财务管理;应用
财务管理工作是学校的重要工作之一,而大数据和云计算的引入,能够解决很多传统财务管理模式中存在的问题,拓展了财务管理工作原有的工作范围,节约了人力物力,使远程和高负荷数据处理成为一种可能。因此,在大数据和云计算视域下,加强财务管理,促进学校的和谐健康发展是值得探究的课题。
一、相关概念
1.大数据
大数据能够从种类繁多、来源广泛的海量不同数据中提取出最有价值的数据。它具有数据的容量庞大、数据的种类复杂多样、数据的来源可靠性和价值度较低、处理时效紧等特点。财务大数据是指通过一定的技术手段把大数据技术有效运用在财务管理工作上。大数据的运用,能够使财务工作人员在极短的时间内,从结构复杂、种类繁多的财务数据当中提取最有用的财务信息。
2.云计算
云计算是一种以互联网为基础的共享资源使用模式,当用户需要使用计算资源时,只需要向互联网提交计算资源服务的申请,互联网接收到用户的申请后,就能够把用户申请的计算资源服务立刻划分成很多不同的小程序,然后再通过互联网上大量的电脑、服务器资源把各个程序迅速处理,并立即传回给用户。通过这样的方法,用户可以通过申请,在短时间内调用互联网上庞大的服务器、计算机资源,来为自己完成数据服务,相当于用户拥有了世界上运算最快捷的、最先进的超级计算机。云计算具有计算容量大、服务方便、稳定性高、成本低等优点,但存在一定的风险。大数据与云计算是相互关联,互相依存、共同作用的。运用大数据离不开云计算,云计算是大数据技术最有效的方法,云计算为大数据提供了基础架构平台,大数据是云计算的基础。
二、基于大数据的财务决策流程
财务数据管理是财务管理工作的重点,它详细记录着一个单位的各种经济活动和资金运转情况,数据信息是财务决策的基础和保障。运用大数据和云计算,能够及时发现整个运行过程中存在的各种问题和风险,有效提高对数据的处理能力。基于大数据的财务决策流程主要有:建立财务大数据收集系统,把收集到的各种财务数据,通过大数据收集系统完成不同类型财务数据的收集、加工处理和有效提取,确保财务大数据的一致性、准确性、实时性和系统性;对财务大数据进行定量分析,通过财务云计算平台对财务大数据进行实时分析处理;通过数据挖掘功能给出财务数据背后存在的相关问题,根据之前所有的数据的相关性分析,做出切实可行的决策方案。
三、大数据和云计算技术背景下财务管理的创新策略
1.正确认识,合理运用
自上而下高度重视,正确认识大数据和云计算所带来的价值,明确大数据和云计算的意义和作用,把大数据和云计算在财务管理中的创新运用当作重要工作来抓,充分发挥财务管理部门和财务人员的积极作用,把大数据和云计算的新理念和高效的财务处理技术相融合,不断提高财务管理人员通过大数据和云计算对财务数据的分析和处理能力,以便更好应对各种财务风险的挑战。结合本单位的具体情况,创建财务管理信息中心,加强对财务数据的处理、分析和应用,促进学校的生存和发展。
2.加强队伍建设
大数据和云计算的引入,不仅需要新的管理模式,更需要财务工作人员能够通过对数据进行分析,根据数据分析的结果,透过现象抓住本质的东西,引领决策者做出正确选择。大数据和云计算需要专业性很强的技术人才,因此,应加强对财务管理人员的培训,多为他们提供外出学习和参观的机会,学习好的创新做法和管理经验,更多地了解其他单位的大数据和云计算的运用情况,不断提升自身的专业水平,在可能的情况下,加大资金投入,聘请对大数据和云计算了解透彻、运用能力强的专业人员来本单位工作,同时指导并定期组织财务管理人员和有这方面诉求的员工学习相关知识,促进整个队伍建设。
3.建立统一的信息化管理系统
大数据和云计算的引入,原有的信息系统已满足不了新技术的需求。这就需要建立统一的信息化管理系统。统一数据格式,加大信息存储量,以便对多年累积的内部、外部各种业务、财务等各种信息进行剖析,提取有价值的数据,促进本单位财务管理工作。建设适用于不同行业的可扩展性报告语言,通过规范、适用的会计信息平台,不断提高会计数据的收集、整理、储存和分析,从而提高对数据的利用率。根据单位的具体情况,不断创新,开发研制新软件,和大数据、云计算进行有机结合,加强财务管理工作,促进学校的生存和发展。与传统的财务管理模式相比,大数据和云计算模式下的财务信息化管理系统,不仅提高了系统的安全可靠性,“云财务”系统还具有自动化管理能力和可扩展性能,进而实现整个财务系统的自动重复实施和自动化管理操作。首先搭建云计算架构,把整合后的用户系统逐步迁移到云计算构架中,运用云计算构架模式来取代原有财务应用系统。在云架构模式下,财务软件能够稽查到用户的财务制度是否合理、操作流程是否规范等,如果用户的操作存在不安全隐患,可以根据财务制度的要求进行及时修正。还可以依据本单位内部的财务管理制度和管理模式,制定出不同的财务人员的合法行为,通过云系统实现对财务人员的合法行为的安全审计。一旦发现违规行为或者违章操作,需在云端设置的第一时间进行预处理的策略。在云系统财务软件建立之后,根据不同的管理和操作人员的各自角色的不同,进行财务软件管理的模板化。
4.加强风险管理
无论管理者还是财务工作人员,都应不断学习和探究,了解更多有关大数据和云计算的相关知识。对我国云计算的规模、价格、服务种类以及安全水平进行综合考察,了解它的安全性能、稳定情况和技术支持能力等,结合单位的实际情况制定合理的风险管理方案,特别是各种风险的应急措施,提高云计算整体的安全性,要求服务商要加强云存储的安全以及数据库的管理和数据传输的安全,云计算要设有防止数据外泄的安全防护系统。随着大数据和云计算逐步走进各行各业,财务管理工作也将迎来全新改变。根据本单位的具体情况,通过改变观念、加强队伍建设、建立统一的信息化系统、构建云财务模式等有效方式,加强财务管理,不仅使财务管理工作更高效、更便捷,而且充分调动了财务管理人员的工作积极性,减少了单位的资金投入,节约了人力资源,提高了工作效率,为更好的适应时代的发展,提高竞争力打下了必备的基础。
参考文献
1.朱晓燕.大数据和云计算技术在财政工作中的应用研究.中国财政,2016(22).
2.熊发政,李育强,陈英齐.浅析大数据技术在高校学生教育管理工作中的应用路径.才智,2016(23).
3.张方,陈发富.大数据技术在高校管理中的应用初探.信息通信,2015(07).
4.贾子扬.基于大数据的财务报表持续审计研究.山西财经大学,2016.
当前云计算、物联网、移动互联网等技术飞速发展,数据的种类和规模以前所未有的速度增长,如何管理和利用大数据成为当前研究的热点。云计算和大数据技术对数据处理及服务方式产生巨大影响。文章阐述了云计算和大数据的内涵特征基础,结合医疗领域,论述了大数据的研究意义及云计算下大数据处理方式。阐述了云计算下大数据技术不仅改变了传统的数据管理模式,必将带来极大的经济与社会价值。
【关键字】
云计算;大数据;医疗行业数据;应用研究
一、前言
随着社会的发展,人们日常生活与工作产生的数据量越来越大,人类已经步入了大数据时代。数据变化具有以下趋势:第一是海量数据的需求。数据基本是以每年成倍的速度进行增长,数据量的需求分析也更细,对它的门槛要求也更低,传统的数据库无法满足这种需求。第二是快的需求。数据得到的同时,希望有智能的产生,希望能够直接产生效果。第三现在的开发者,需求是多样化的,很多时候关系型数据库并不是最优的解决方案。数据的不断增长,给数据存储、数据管理和分析利用带来了机遇;在这些包括个人信息、消费记录等的海量数据之中,蕴含着许多有价值的信息,能够为企业经营及管理提供参考。云计算作为这个大数据时代的主流技术,对于大数据的应用管理又有着重要影响。云计算是大数据的IT基础,而大数据是云计算的一个重要应用。
二、大数据的概念与意义
1、大数据的概念
大数据,即巨大数据量,不能够通过主流的软件工具,在适当的时间内收集管理处理及组织起来,使之作为企业决策的有用信息。大数据,需要特别的技术,由大规模并行处理(MPP)数据库、数据挖掘网格、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统组成。“大数据”,需要更多的决策权及洞察发现力及过程地大规模优化能力,应对新模式高增长率及信息资产多样化。大数据技术的战略意义并不是一个巨大的数据信息的掌握,而是因为这些包含了专门的数据进行处理。大数据的特点可以概括为4个“V”(大量Volume,多样Va-riety,价值Value,高速Velocity)。首先,庞大的数据量。大数据的初始测量单元至少为P(1000个T),E(100万个T)或Z(10亿个T);二、数据类型丰富。例如,网络日志,视频,图片,位置信息等。第三,低密度,高商业价值。第四、快速处理速度。这最后一点是传统的数据挖掘技术本质上是不同的。大数据技术,是一种先进的数据分析技术,能够从各类数据快速获取有价值地信息,它需要新地加工方式,实现更大决策力地海量高增长率及多样化的信息。
2、大数据的意义
面对大数据直接从所有的数据分析,挖掘所需信息。分析数据挖掘是混合的有不同来源数据结构,要求其对样品的精度高并且关注数据相关性地研究。大数据为云计算及计算能力提供了解决空间,对于大数据存储挖掘及云计算业务,大数据需要高效节能的海量云服务器,并从海量数据提取有价值地信息,能够对政府金融零售娱乐及媒体领域带来革命性的变化。云计算是基础信息存储,为数据共享和挖掘方法提供有用的工具,通过数据的分析和预测使决策更加准确。中国拥有庞大地高度复杂性充满变化的用户群体,将成为世界数据量最大的国家。探索基于大数据的解决方案能够解决海量数据带来的问题,并使国内产业升级和提高效率。
三、云计算技术与大数据结合应用
1、云计算技术
云计算,是互联网基础设施底层的抽象,是互联网相关服务的使用和交付模式,并提供一个具有扩展性和虚拟性地动态资源。云计算,将加工程序自动分割成许多较小子程序,通过互联网使一个或多个服务器搜索大量系统的计算和分析的巨大处理能力。最后将计算处理结果反馈给用户。云计算,强调动态计算能力,大数据,是静态计算的对象。
2、云计算与大数据关系
云计算和大数据是相辅相成的关系。云计算提供了大数据存储和操作地一个计算平台,大数据则利用分布式处理方法来应用此平台,云计算与大数据,前者强调计算能力,需要处理大量复杂数据:包括数据获取、整理、转换、统计。云计算,要用大量数据作为运算地基础,两者是必然趋势结合。在具体实际应用中,云计算促进了大数据的实际应用,这种应用出现在公共问题领域等。借助云计算、云存储、数据丢失、病毒入侵等问题的优势,保障数据安全和爆炸性增长的数据为企业带来了新的机遇和挑战。
四、大数据在医疗行业应用
1、医疗行业数据分析
随着医院信息化的快速发展,医疗行业产生大量的医疗数据,如何使这些数据提供帮助,即节约医疗成本,提高医疗质量,目前,医疗数据的应用,还有一些问题,一是医疗数据分散在各个医疗机构,二是数据利用率很低,医院信息系统积累了大量的数据,但在大多数情况下仅限于管理层面,很少涉及临床专业水平。在面对大量的医疗数据积累的情况下,如果可以进行有效的数据分析和数据挖掘,可以获得大量的有价值的信息,可以帮助医疗和医院决策者,从而推动到医院提供更好的医疗服务,提高治疗质量。大数据技术将在医疗领域的公共基础服务领域应用,将能够帮助医院推动医疗行业的进步。
2、大数据的应用
由于区域医疗信息化及医疗物联网地应用,能够产生大量地数据:如测试结果、成本数据、传感器数据、基因数据和图像数据等,并且还包括大量的在线实时数据分析和处理的需求数据,它们满足大数据4V特征,属于大数据类别。为了创造经济和社会价值,如何有效地管理利用这些海量地医疗数据是医疗行业面临的挑战。在医学领域中大数据技术的应用前景广泛。主要包括以下几个方面:
(1)临床决策支持系统
将大数据技术应用于临床决策支持系统,能使系统更加智能化。由于大数据分析技术的非结构化数据的强大的分析能力。例如:在医学文献数据库通过数据挖掘,为医师提出更合理的诊断及治疗意见,提醒医生对于预防潜在的错误,例如由于药品不良反应等,通过采用图像分析与识别技术,对医学图像数据进行识别并提高诊断和治疗的质量。
(2)个性化地医疗系统
通过对患者进行如基因组数据分析的个性化医疗大型数据。综合分析患者的特点及疗效数据及对患者进行基因测序的调查,对某一疾病患者的药物特殊性和敏感性的反应关系,及在治疗过程中的特殊性进行靶向治疗。
(3)监测与预报流行病
在中国疾病预防控制中心,建设突发公共卫生事件和国家传染病网络报告系统已投入运行,每年存储的病例报告和信息有600多万左右,覆盖了全国所有县疾病控制机构信息的年度报告。通过大数据技术报告海量数据可以进行综合性地分析及检测,对于通过综合疾病监测及反应程序,准确预测传播时间和路径,方便采取有效措施,减少传染病的患病率。流感的准确预测是利用大数据技术成功案例。谷歌公司对流感准确预测的成功案例是大数据技术的应用。谷歌公司把美国最常使用的搜索条目。与流感疫情在美国疾病预防控制中心的数据相比,确诊了是否感染流感。人们通过使用特定的如“咳嗽和发热药”搜索词,便获得流感治疗的互联网信息,建立了特定的搜索条件和时间空间与流感之间联系。比美国疾病控制和预防中心的数据提前一周。检测流感传播路径,他们的判断很及时。近年来,医疗行业面临着海量数据和非结构化数据的挑战,许多国家都在积极推动医疗信息化的发展。因此,大数据技术在医学领域的应用前景十分广阔。
五、结束语
大数据技术在医疗领域的大规模应用尚不完全成熟,但随着高速网络、云计算中心等基础设施建设日趋完善和大数据技术的发展,医学领域发展的趋势,将是推动大数据技术的个性化、创新化,便利化医疗。云计算、移动互联网和物联网技术的快速发展,全球范围内数据增长规模越来越大,大数据将被应用到各行各业,不仅改变了传统的数据管理模式,带来了新的思维、业务转型和管理创新,提高企业和公共部门的生产力和竞争力,也会带来巨大的经济和社会价值。大数据已成为新发明和新服务的来源,是社会新的财富。
作者:郭群 单位:辽宁对外经贸学院信息管理系
参考文献:
[1]张德丰.大数据走向云计算[M].北京:人民邮电出版社.2014.4.1.