前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇医疗大数据解决方案范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
借云之势
曙光公司无锡云计算中心目前已经有200多个云应用,数据存储总量也超过了10PB。如此庞大的数据,每天的存储、管理成本对数据的拥有者来说是一个极大的负担。用历军的话来说,这些数据就像是沉睡的金矿,必须找到一个最有效的方法对数据进行组织、整合、分类、检索,深入挖掘数据的内在价值,同时还要降低管理成本,只有这样才能让这些数据闪光。开启金矿的钥匙就是大数据解决方案。
为了更好地处理这些海量数据,曙光公司两年前开始研发一种新的架构——海量数据检索处理系统,这就是XData大数据一体机的前身,因为当时还没有大数据这个概念。“XData是我们为在自己的云数据中心里提供数据挖掘服务做的铺垫。”历军表示,曙光的大数据战略可以概括为8个字:“平台一体,智汇应用”。“平台一体”包含多层含义:首先,大数据解决方案必须是存储、分析和应用三位一体;其次,XData大数据一体机实现了软硬件一体化,监控与管理一体化,产品与服务一体化,以及多种数据类型处理一体化。“智汇应用”表明,大数据天生具有鲜明的行业属性,因此大数据解决方案必须与行业需求和特色相结合,从行业切入、逐层递进,才能达到事半功倍的效果。
相比云计算,大数据从概念辨析到落地应用这中间所用的时间似乎缩短了很多。有人说,这是云计算的功劳,因为云计算在技术、观念、应用和商业模式等方面给大数据的应用做了很好的铺垫。过去几年中,曙光公司在云计算方面的布局与积淀为今天大数据战略的实施奠定了良好的基础。2013年,曙光公司将开通乌鲁木齐、哈尔滨、宁波三个城市的云计算中心,这样一来曙光在国内自投建设和负责运营的云计算中心总量将达10个。“用云的方式实现数据的分析与挖掘是未来的一个趋势。”历军表示,“我们现在主要销售大数据的解决方案,随着大数据技术走向成熟,软件更加完备,未来我们很可能会基于云提供大数据的分析服务。”
大数据厂商要全面
“大数据厂商一定要全面。数据挖掘不是一个存储厂商能独自完成的事。”历军表示,“大数据厂商必须具备很强的综合实力,能够提供包括计算、存储、分析和应用等在内的整体解决方案。XData大数据一体机的推出证明曙光已经具备了这种综合实力。”
时至今日,曙光在很多人心目中还是高性能计算领先者的形象。其实,这已经是老黄历了。曙光不仅拥有高性能计算产品,还有丰富的存储、软件产品,能够提供云计算整体解决方案,在大数据方面还有分析软件及工具等。历军表示:“我们一直在关注一些有技术特色的厂商,也曾经有过一系列成功收购,未来还希望继续通过收购等资本运作方式,不断增强自身的技术实力。”
大数据解决方案本身就是软硬件一体的,其中软件扮演着十分重要的角色。进军大数据领域对曙光的软件业务来说既是一种挑战,又是一个机遇。目前,曙光软件研发人员的数量以及对软件研发的投入都已经超过了硬件。曙光公司副总裁邵宗有表示:“我们的策略是在打造具有国际先进水平的硬件产品基础上,大力发展软件及服务业务。比如,我们希望用高品质的刀片承载不同的软件与应用,为客户提供云计算解决方案、大数据解决方案等。”
过去这些年曙光一直在做系统,从最初的以硬件为核心的计算机系统,到现在的以软件和服务为核心的信息系统。曙光希望做一个有价值的信息系统提供商,大数据正是实现这一目标的关键所在。历军透露,再过几个月,曙光旗下将出现一个独立运作的软件公司。
鲜明的行业属性
曙光为银联提供的离线交易数据分析平台已经投入了使用。银联为了控制信用卡使用风险,就必须掌握和洞察消费者的行为,若想达到此目的,非大数据解决方案不可。银联的结构化和非结构化数据统一共享处理平台就构建在曙光XData之上。中国银联副总裁柴洪峰介绍说,银联10年的离线数据都放在曙光XData大数据处理平台之上,借助云计算的手段进行处理和分析。
曙光的大数据解决方案提供了标准的平台接口,支持各行业丰富的第三方应用集成,包括智慧城市、金融、电信、交通、医疗、教育、军工等各行业的大数据应用软件,可以提供高效和个性化的数据分析服务。曙光不仅可以提供通用的大数据一体机,而且可以提供针对不同行业应用的定制化的专用一体机。目前已经投入实际应用的曙光大数据应用平台包括银行历史数据查询分析系统、银联离线交易数据分析平台、大型运营商流量经营分析系统、大型信息安全监控系统、高校柔性大数据处理平台等。全国农信银资金清算中心运行保障部总经理王永刚很好地概括了曙光大数据一体机的特色:HPC+存储+分析平台。
“在全球公认的大数据最先崛起的五大应用领域,包括金融、电信、安全、交通和卫生,曙光都已经有了成功应用。”邵宗有表示,“我们就是要打造简单易用、注重实效的大数据解决方案,重点加强易用性和智能化,注重性能优化和可靠性,提供柔性扩展能力,实现各类数据处理的融合,以及与开源平台的融合。”
历军概括了曙光在大数据方面的优势:从技术角度讲,曙光在并行分布式存储、云计算、数据抽取和检索等方面拥有多年积累和多项创新;从应用角度讲,曙光的云计算中心积累了大量用户和应用,而曙光的大数据解决方案又可与细分行业需求相结合。大数据带来的不仅仅是技术和应用模式上的创新,还为商业模式的创新以及大数据企业自身的业务转型带来了契机。
曙光XData大数据一体机
曙光可以提供大数据产品、大数据方案和大数据服务。具体来看,大数据产品包括XData、ParaStor、DRAC、DS900、DBStor、I640等;大数据方案包括针对金融、电信、政务、能源、交通、医疗等行业的大数据解决方案;大数据服务主要包括对用户的培训、应用迁移、开发支持以及运维保障等服务。
Power传承既有优势
“x86+Hadoop”被认为是承载大数据应用的主流平台,其开发和应用生态系统已经得到了市场的验证,但这并不意味着大数据基础平台会呈现一种架构“通吃”的局面。
在IBM看来,Power平台是构建大数据应用的一把“利器”。“大数据是一个跨行业的需求,不仅在互联网公司,传统企业客户,像金融、政府、电信等行业也有非常多的有关大数据的应用。” IBM大中华区副总裁及系统与科技部Power Systems总经理侯淼表示,“Power平台所具有的大内存、大Cache、多线程等技术特征,使之非常符合大数据的应用需求。”
数据仓库、数据挖掘、业务数据库,这些都是Power平台传统的优势领域。在IBM系统与科技部大中华区Power Systems产品总监李红看来,这些既有优势为Power平台在大数据领域的应用奠定了基础。
“首先,大数据应用需要与既有系统进行平滑、无缝的连接和交互。在此基础上,Power平台可以拓展新的需求,例如开源的非结构化数据、流数据的分析等,都可以集成到新的需求中去。在这个过程中,传统方案需要和新方案实现很好的整合,Power平台的价值进一步得到体现。此外,软件生态系统至关重要,对软件以及并发处理等场景的广泛支持(包括DB2、GPFS等)使基于Power的解决方案具备更多优势。”李红告诉记者。
面向数据类型的解决方案
多样性是大数据的一个典型特征,在IBM看来,面向不同大数据类型,大数据应用可分为静态批量大数据处理、实时大数据处理、数据仓库整合、数据集市构建四类,IBM面向这四类应用都有专门的解决方案。“以数据仓库应用为基础,发展出了新的大数据应用场景和需求,例如静态数据的批处理、流数据的实时分析等。 IBM的思路是提供整合的解决方案,帮助用户最终获得完整的数据价值。”李红表示。
在静态大数据解决方案中,Power可支持Open Hadoop、 BigInsights、 Symphony 等大数据解决方案,并能够与传统数据仓库系统无缝集成。李红解释说:“Symphony专门面向计算密集型大数据应用,BigInsight在Hadoop框架上增加了安全管理、工作流等特性,并融入了IBM独特的数据分析、机器学习和文本数据分析挖掘等技术。”
在GPS、医疗检测分析、天气预报、金融交易等应用场景中,实时数据分析不可或缺。在这方面,Power支持IBM Infosphere Streams和开源的Storm构建流计算解决方案。“PowerLinux+GPFS-FPO+Streams”的组合能够提供强大的实时数据处理功能和性能。“大内存、大网络带宽的硬件特性在实时数据分析场景中可以大显身手。”李红表示。
这正是白宫网站的《大数据研究和发展倡议》所追求的——“通过收集、处理庞大而复杂的数据信息,获得知识和洞见,提升能力,加快科学、工程领域的创新步伐,转变教育和学习模式”。
各行各业都能用得上大数据,只是对大数据重要性的意识程度不同:凯捷咨询(Capgemini)的调研结果显示,76%能源和自然资源行业的高管相信公司是数据驱动的,在医疗医药行业和生物科技行业这个数字为75%,在金融行业为73%。包括英特尔在内的有能力提供大数据解决方案的IT厂商正在努力让各行各业的企业切实感受到大数据的魔力。
能否置身事外?
随着网络应用和多媒体应用的兴起,互联网成为大数据的主要来源。随之而产生的网络营销调整围绕大数据而展开。淘宝是国内公认的对用户数据利用得较好的公司——淘宝网利用大数据统计分析得到诸如“欧洲杯的球队胜负如何影响各队球衣的销量?花露水的最佳搭配是电蚊拍还是痱子粉?”等问题的有趣结果,并以此为依据来更好地调整营销战略。
近日,阿里巴巴集团宣布,将在集团管理层面设立首席数据官岗位(Chief Data Officer),负责全面推进阿里巴巴集团成为“数据分享平台”的战略。这直接证明了大数据对于互联网企业的意义。
别的行业能不能对大数据冷眼旁观呢?赛迪智库软件与信息服务业研究所研究员安晖认为,虽然目前大数据的主要来源是互联网,但许多以信息流作为核心竞争力,如金融、电信、零售等行业的机构或企业,其数据量也不容低估。例如,美国国家海洋和大气管理局(NOAA)数据中心存储的数据超过20PB,沃尔玛数据中心的存储能力超过4PB,eBay分析平台每天处理的数据量高达100PB。并且,由于这些机构和企业所存储的数据更加有针对性,其数据的价值密度更高,进行大数据处理的意义更强,运用大数据的需求也更为迫切。
安晖以数个典型行业为例来说明大数据能带来什么好处——电信行业可以从庞大的数据中分析出不同群体的差异化需求,实现套餐制定等精准营销;制造行业可以通过整合来自研发、工程和制造部门的数据以实行并行工程,显著缩短产品上市时间并提高质量;交通行业可以通过整合和处理相关数据,实现智能交通(管理)与高效物流调度。
赛迪顾问软件与信息服务业研究中心研究总监胡小鹏认为,金融行业中证券、信用卡、电子支付等数据规模庞大,具有使用对象多样化、信息可靠性、实时性、保密性要求高等特点;电信行业中大数据主要体现为电信业务系统产业的计费账务数据和用户信息(包括客户资料、客户服务数据等),不仅数据量大,而且保存时间长;能源行业大数据主要集中在石油勘探以及电力生产、经营、管理等数据,具有数据量大、分散、类型复杂等特点。其中,在金融行业,利用大数据的挖掘和分析改善用户体验、监督欺诈行为、验证合规性、服务创新等,从而助力金融智能决策,提升竞争力;而对于电力行业,大数据分析有利于电网安全高效运行(安全检测与控制、灾难预警与处理、供电与电力调度决策支持和负荷预测)、电力营销(用户用电行为分析)、集团集中管控与精细化管理等。
大数据这场盛宴上,哪个行业也不愿意没有一席之地。
谁能站出来?
大数据的热度可以由英特尔、IBM、EMC、惠普等厂商纷纷推出面向大数据的一体化产品和解决方案直接反映出来。
然而,一个不能逃避的现实是,虽然越来越多的行业用户尝试应用大数据的解决方案,但是大多数行业用户对于大数据的认知仍然比较有限。面对林林总总的不同厂商提供的大数据解决方案,用户分不清这些解决方案的差异在哪里,也就不会真正了解哪种解决方案适合自己。
有用户反映,大数据解决方案容易给人的错觉是该解决方案就是把数据分布存储,再并行处理。即使采用国外厂商的工具,这些工具成熟度不是特别高,导致解决实际问题的时间过长。
英特尔相关专家表示,从总体上看,中国大数据市场发展迅速,特征明显,相关技术和应用可改进和提升的空间巨大。而且大数据要落地,必须实现包括芯片商、软件企业等在内的IT基础设施与服务层平台的开放。
英特尔在硬件上的领先无需多言。在软件层面,考虑到Hadoop的开源特性,很多厂商都有机会在Hadoop的基础上推出产品,但行业解决方案提供商面临的一个苦恼是,他们不得不进行底层开发。实际上,底层解决方案是有很多共性的。对行业解决方案提供商来说,如果有一个由可靠厂商优化过的平台再好不过了。利用这个平台,行业解决方案提供商可以抛开重复的、无意义的劳动,将注意力和精力更加集中在行业特点上,进而开发出满足行业所需的实打实的行业解决方案。在这种情况下,英特尔适时地推出了英特尔Hadoop发行版,打造一个优秀的、高价值的底层平台。
对于如何从大数据中发掘价值,英特尔指出,这需要在IT基础设施与服务层、数据组织与管理层、数据分析与发现层、决策支持与IT服务层全面引入新的技术,特别是在堪称大数据应用“载体”的IT基础设施与服务层,采用基于开放架构的平台将是最佳选择。
O‘Reilly Strata和Open Source Convention大会委员会主席Edd Dumbill曾指出,使大数据真正变得强大的方式之一就是让上层程序员可以将精力放在数据而非底层Hadoop设施的抽象特征上。他们编写更简短的程序,能够更清晰地表达出对数据所做的处理。这些将有助于为非程序员创建更好的工具。
延伸到企业层面,“行业解决方案提供商需要稳定性和可用性都足够好的平台。在这样的平台上,行业解决方案提供商可以从不必要的重复性劳动中解放出来,从而把更多的精力放在提供差异化特色方案和服务上。”英特尔亚太研发有限公司总经理、英特尔软件与服务事业部中国区总经理何京翔的看法类似。进而,他解读了英特尔Hadoop发行版的优势:“英特尔Hadoop发行版的优势在于:处理接近于实时;能在英特尔平台上实现最优化的性能,比非英特尔发行版有成倍的增长;通过和电信、智能城市、医疗等行业客户的合作,英特尔Hadoop还做了更进一步的优化。”
除了提供平台,英特尔(中国)行业合作与解决方案部中国区总监凌琦强调,英特尔还会把大数据解决方案的研究和服务作为投资部门的重点。英特尔的风险投资部门也对大数据中所涉及的关键平台、关键应用、提供商,给予关注。
行业侧重点
英特尔硬件平台的特点让其可以用“通吃”来形容,行业特色则由软件来体现。
正如英特尔Hadoop发行版白皮书所指出的,它“为企业应用而优化”,其拥有的增强高可靠性、增强分布式文件系统HDFS扩展性(使集群的I/O吞吐量能够随着节点数量的增加而线性增加)、动态调整数据复制策略(提高热点数据的并发访问能力)、改进分布式计算框架调度算法(避免并行任务退化成串行执行)、增加Hadoop集群监控管理、优化HBase查询、实现细粒度的HBase合并调度控制(避免合并风暴)、创建异地HBase大表、均衡负载等相对开源Hadoop和其他Hadoop发行版的核心优势在多个行业中均不可或缺。
但是,业界定义的大数据是指迅速收集的、各种各样的、大量的数据集合,而不是能够处理一切问题的万能解决方案。在现实中,如果一些企业偏信这些与大数据相关的谬见,那么这些企业很可能会偏离正轨,走向错误的发展方向,浪费大量的时间和金钱,丧失其在市场上有利的竞争地位,还可能损害企业的声誉。
此篇文章就讲述了业界常出现的有关大数据十大谬见。
1.只有数据科学家才能处理大数据
事实上,在处理大数据时,光靠数据科学家是远远不够的。
“如果你不能首先确定到底需要什么样的信息的话,那么单凭数据科学家自己是不可能成功地从大数据中提取有用信息的”,宾夕法尼亚大学医院(Penn Medicine)数据分析部门高级主管Pat Farrell说:“你还需要熟悉业界动态、掌握相关领域知识的人才,他们知道问题的所在,也了解什么样的解决方案对于你所从事的领域最有价值。”
例如,在宾夕法尼亚大学医院有两个系统,一个是医疗系统,一个是医学院系统。长期以来,医疗系统通常从一个数据仓库中收集临床医疗数据。与此同时,在医学院系统中,出现了一个新的技术,可以实现对人类基金组的排序,并产生了大量的数据。
Farrell说:“我们知道这些数据一定存在着某些价值,而我们最终也有了能够获取这些价值的计算能力。我们将专业的医疗知识与数据分析技术相结合,为预测医疗开拓了一片新的、更广阔的领域。”
2.数据越大,价值越大
收集数据,并把它储存起来再登记入册,这会花费许多时间、占用很多资源。如果企业或机构在收集数据时不加选择、任意地收集大量数据,那么很可能会造成大量的资源浪费,而这些资源完全可以用到更有价值的项目上去。
Farrell建议企业在收集数据之前一定要有一个具体的目标,或关键性能指标,要明确自己需要什么样的数据,再去有目的地收集数据。
Farrell说:“你需要从你收集的数据中提取有价值的信息,但这并不代表你收集的数据越多,你所获得的价值越大。”
3.大数据用于大企业
大企业或许会有更多的内部数据来源,他们可以利用这些数据获取对自身企业发展有价值的东西。但这并不代表大数据只用于大企业,小企业也能够收集来自社交媒体平台、政府机构和数据供应商的数据,并从这些数据中提取有利信息。
戴尔软件信息管理解决方案部门的产品管理高级总监Darin Bartik说:“对于企业来说,不管它的规模有多大,利用数据分析制定的决策总比单纯依靠直觉或第六感制定的决策要好得多,且更加可靠。”
小企业虽然不像大企业那样经常利用数据分析来制定决策,但是当这些小企业真正这样做的时候,它们会使公司走向快速、正确的发展轨道。
Darin Bartik说:“小企业可以利用其最佳实践,进一步推动数据分析决策在企业中的发展,以此赶超或者胜过那些强大的竞争对手。”
4.收集数据后不及时整理分类
位于美国旧金山的云计算商业智能供应商Birst的首席执行官Brad Peters表示,虽然数据存储的成本越来越低,但它并不是免费的。然而,对于许多大公司来说,它们对于数据欲望的增长速度要比数据存储成本降低的速度快得多。
许多企业往往在收集完数据之后,并不迅速处理这些数据,造成数据存储成本增加。Brad Peters说:“我发现很多大的企业或机构收集了一大堆数据之后却不及时处理这些数据,导致他们在这些数据上的开支逐渐增大,而他们也并没有从这些数据中获取任何价值。”
事实上,企业中的一些数据集已经开始造成了企业的收益递减。这种现象就像通过分析选民数据信息来预测选举结果一样,在预测过程中,你需要一定数量的选民作为样本,但是如果样本数量超过一个临界点之后,无论增加多少选民,对于预测结果不会有任何太大的影响。也就是说,样本数量过多,所花费的成本也就越多,但对于目标没有任何实质性的价值。
“数据冗余的话,企业支出的不仅仅是存储成本,还会面临许多其他的问题”,Recommind公司信息治理和大数据管理全球主管Dean Gonsowski说。比如,如果数据泄露的话,那么公司也会承担相应的损失。Recommind是一家位于美国旧金山的专注于非结构化数据分析的公司。
最终,数据越多,那么分类整理数据所需要的时间也就越多。Dean Gonsowski说:“当数据仓库的规模达到数十亿条记录时,那么光是检索数据就需要花上几个小时,甚至是几个星期。这时候,这些信息非但不会给企业带来商业价值,反而会阻碍企业系统的运转,因为这些系统根本不能处理这么大信息量。”
5.所有数据都是一样的
美国佛吉尼亚州曾收集过在过去20年里学生的注册信息、奖学金,以及学位授予情况的数据,但这并不意味着20年前收集的与之存储在同一个数据域里的数据就一定是相同的数据。
佛吉尼亚州高等教育委员会的政策研究和数据仓库部门的主管Tod Massa说:“由于数据都存储在一个数据仓库里,这导致研究人员认为这些数据都是等同的,而这正是我需要处理的一个最大的问题。我们收集的ACT(American College Test,美国大学入学考试)和SAT(Scholastic Assessment Test,学术能力评估测试)的学生成绩,最初我们收集的只是整个佛吉尼亚州的学生成绩,但这导致我们的调查研究出现一个缺口,所以后来我们不仅收集了佛吉尼亚州的数据,还收集了其他州学生的数据。而且,不同种族在K-12级和高等教育的数据也不同。”
事实上,任何特定的数据,如果由不同的组织机构,或在不同的时间内,或由不同的人的话,也有所不同。Tod Massa说:“假如收集数据的这家公司或机构是完全孤立或与世隔绝的,那么情况可能会不一样。但我认为,随着时间的推移,它们收集的数据也会有所变化。”
因此,数据分析人员不仅要有数据统计的技能,还要掌握一定的数据知识,并清楚地了解相关行业内的动向和整体发展趋势。
这一点也同样适用于从外部数据源收集的数据,过去的那种数据收集和分析的方式已经完全改变了。能够了解不同的数据文化背景和数据环境,对于充分利用这些数据是非常必要的。
6.数据预测越具体越好
我们通常认为,如果一件事情越具体,那么它就会越精确,比如,“下午三点十二分”就比“下午某个时候”更加精确;气象学家预测“周日早上会有降雨”就比“这周末50%会下雨”的预测要精确得多。
但是事实上,结果正好相反。大多数情况下,预测得越具体其准确率反而并不高。
例如,一个顾客买了一台具有特殊配置的电脑,而另一个购买了同样一款电脑的顾客又购买了一双亮粉色的高跟鞋。“在这一数据信息中,购买亮粉色高跟鞋的信息显得有些太过具体甚至有些多余,这可能会影响数据分析的过程,给数据分析结果造成一定的误差”,美国加利福尼亚圣塔莫尼卡的营销公司Retention Science的首席执行官Jerry Jao说。
Jerry Jao表示,这通常是业务和营销经理常会出现的问题。
7.大数据等同于Hadoop
Hadoop是业界比较流行的非结构化数据的开源架构,近来也引起了不少业界的关注。但是Hadoop并不是大数据的唯一解决方案,企业还有许多其他的选择。
SAP大数据总经理和资深副总裁Irfan Khan指出企业还可以选择NoSQL、MongoDB、Cassandra或其他相关技术来处理大数据。
这些技术中的某些技术对于处理一些特殊的大数据问题非常有效。尤其是Hadoop,它可以把数据分成若干个数据组,并能同时处理多个数据组。Hadoop解决方案可以用来处理许多大数据相关的问题,但并不是所有大数据的问题它都能处理。
位于美国加州雷德伍德城的大数据咨询公司LucidWorks的首席技术官Grant Ingersoll说:“YARN(Hadoop新版中的资源控制框架)和Hadoop2可以处理大数据的一些问题,但在大数据的其他问题上,Hadoop或许并不是最佳的解决方案。在处理大数据之前,企业应该认真分析问题,并根据自身的实际情况选出一个最佳的、最合适的解决方案,而不是盲目跟风,选择那些使用率较高的解决方案。
8.最终用户不需要直接访问大数据
随着企业从各种各样的来源快速收集大量的数据信息,对于企业的普通员工而言,这些数据处理器起来非常复杂,但事实并非如此。
例如,在重症病房中,医疗设备上会产生大量的数据,如心跳速度、呼吸数据和心电图读数等,但大多情况下,医生和护士只能看到病人当前的数据,却看不到历史数据。
飞利浦医疗保健(Philips Healthcare)病患护理和临床信息(PCCI)系统的首席营销官Anthony Jones:“我根本看不到10分钟之前医疗器械上显示的病人的数据,更不可能画出这些数据在一个小时内的趋势曲线图。”
但是,对于医生来说,病人的历史数据是非常有价值的,他们可以根据这一数据制定更好的护理方案。
Anthony Jones表示,如今,我们需要让所有能够生成数据的医疗设备进行交互(尽管这些设备最初并没有这样的性能),并使用不同的平台、操作系统和程序语言。一旦我们这样做了,那么医护人员就能够获得他们所需要的有用的数据。
9.大数据用来解决大问题
一家大型银行的首席信息官近期发表其对大数据的看法,同时也谈到了终端用户自主服务的问题。据Birst公司首席执行官Peters回忆说,这位银行的首席信息官并不支持最终用户自助服务。
Peters表示,许多企业的主管们认为大数据只能解决一些特殊类型的大问题。他说:“一些人使用大数据的目的是利用一个核心的数据科学家团队帮助他们解决少数且高价值的问题。他们从没有考虑过让普通人接触这些数据信息,因为他们觉得这些人根本不需要这些数据。”
对此,Peters并不赞同这种想法,但这种想法在很多行业里非常普遍。Peters说:“一些大的保险公司普遍陷入一个误区,它们认为他们的最终客户不具备处理自助服务的能力。”
10.大数据的泡沫最终会破裂
媒体上对大数据的宣传和炒作反反复复、起伏跌宕,但就大数据技术本身来讲,它最终会面临变革。大数据的泡沫或许并不代表大数据的终结,就像互联网泡沫不代表互联网的终结一样。
即使有关大数据的炒作平息了下来,企业也仍然会有大数据需要处理。由于未来大数据将成指数级增长,企业要处理的大数据比他们想象的还要多。据市场调查公司IDC预测,到2020年企业所收集的数据总量每两年会翻一倍。
而且,未来企业收集的数据并不只是在数量上简单的增长,同时他们还将收集到许多新类型的数据信息,而这需要大量的数据存储空间。
Anthony Jones说:“到那时,医院可以根据病人的数据信息画出病人的基金组图,还可以为病人定制护理和治疗方案。当人们谈到大数据时,它涉及到的是巨量数据,而对于企业首席信息官们来说,处理这些数据并不是什么难事。”
“我特别担心有客户对我说,请富士通来帮我做一个大数据解决方案,帮我解决包括研发、生产和销售在内的所有问题。说实在的,富士通真的做不到。大数据解决方案的形成是一个过程,是IT厂商与用户一道在分析企业自身运营状态与所在行业发展趋势过程中不断改进的过程。”富士通(中国)信息系统有限公司副总裁兼市场战略总部解决方案服务战略事业部总经理黄邦瑜7月11日在贵阳大数据国际年会上接受采访时表示。
数据决策的5个阶段
黄邦瑜在接受采访时强调,大数据应该是一个帮助企业决策的工具,企业管理者千万不要认为IT能代替他们做出决策。他介绍说,富士通把企业的决策分为五个阶段:
第一个阶段,以传统的根据企业管理层的经验来做决策为特征。这其中涉及一些数据,这些数据可能是管理者的纸面记录和报告,或者新闻媒体的一些信息。管理者认为该怎么做,于是拍脑袋就做出决策了。
第二阶段,以办公软件中的Excel等表格中的数据为依据进行决策。这种表格可能很大,横向纵向都有好几页。
第三阶段,为了把企业管理层从各种各样的电子表格和电子表格中庞杂的数据中解放出来,IT部门会用IT手段把重要的信息及时提炼出来,并且每天早上发给管理层供其决策使用。这一阶段的数据来源是多样化的,如ERP、财务、人力资源、生产等系统产生的结构化数据。经过提炼后,这些数据会以图形化的方式呈现。还有一些来自网络、媒体等的外部数据。所以,管理者会看到结构化与非结构化两种数据。
第四阶段,借助IT手段从大量的数据中找出规律并提醒管理层,而不是要管理者针对各种数据做出快速反应。
第五阶段,根据内外部各种数据对未来的一些业务场景进行模拟,以评估决策的效果。
“因为管理层的时间和精力有限,这就要求IT能够采集企业运营过程中产生并积累的大量准确的数据,并且从外部海量数据中摄取相应的辅助数据,然后通过数据挖掘和分析等方式,将其规律找出来,并且比较精炼地展现在决策者面前,使其能够在短时间内做出精准的判断和决策。”黄邦瑜说,“当然,前提是企业的信息化基础要足够好。如果企业没有存储运营过程中产生的大量的有价值数据,一切也都无从谈起。”
大数据对决策的辅助支持不仅适用于管理层。企业会遇到战略、市场或技术等各种不同层面、不同范围的决策问题。黄邦瑜举例说,富士通众多业务中包括医药领域的基因与新药研究。以往的新药开发主要凭借科研人员的智力和经验。如今,研究人员如果有了一个灵感或者设想,可以在高性能计算机上进行模拟和验证。大数据已经颠覆了传统的新药开发模式。
企业必须参与其中
科学与技术之间一个基本的区别在于,科学是去发现自然界中原本就存在的规律,而技术则是为了发明自然界中原本不存在的东西。就目的而言,大数据更像科学,它要做的是去发现原本存在于海量数据中的关联性规律,只不过先前IT的存储与计算能力难以胜任。
“企业在上马大数据之前首先要练好内功。以制造业为例,企业要从研发、生产、营销等流程上进行审视,看这些流程中的数据是封闭在各自的流程中,还是可以被其他流程共享,因为在从产品研发到销售的整个业务流程中,某个流程上产生的数据可能会对其他流程产生影响。上大数据应用的前提是打破企业的信息孤岛。”黄邦瑜说。
在之前的企业信息化建设中,IT供应商与用户的职责很清晰。系统集成商要根据用户的应用需求,结合企业所在行业的属性,制定并实施相应的解决方案;系统建成后,交由用户使用。而大数据应用则要求打破甲方、乙方泾渭分明的界限,要求用户与系统集成商一道完成大数据解决方案。
“现在大数据非常火,以至有的企业认为大数据就是一副灵药,马上能够解决企业存在的所有问题。实际上这是一种认识误区。”
黄邦瑜说,制造企业拥有大量的各种类型的数据,不可能找到一种解决方案把企业经营者想找的规律一下子都找出来。富士通会根据用户的需要找一个主题,用户从业务分析着眼,让数据与业务关联;而富士通则从IT入手,分析如何从海量数据中找出与该主题相关的规律,然后制定并实施相应的解决方案。
“当前,大数据尚处于起步阶段,中外企业最大的差别在于,国外企业信息化应用更成熟一些,他们会针对大数据提出自己的问题和需求。”黄邦瑜说。
云计算,特别是SaaS应用的普及,使得企业的数据越来越多地向云迁移,企业的数据安全问题因此凸显出来。黄邦瑜因此特别强调云计算下大数据应用的安全问题:“现在,企业的云应用还处于初步阶段,如办公系统、人力资源等,一旦企业的ERP等核心应用迁移到云上,而相关的法律、法规和行业监管没有及时跟上的话,企业的核心数据就有可能被他人恶意盗用,或者被服务供应商为了商业目的而滥用。”
“欧美日在这方面的监管非常严格,市场准入门槛非常高,需要企业具备多种资质。如果不能在机制上有效地保护用户数据不被滥用,那么企业会因为出于对数据安全的担心而对云计算乃至大数据应用裹足不前。”
贵在理解用户的业务
传统上,日本IT厂商比较低调,不像美国IT企业那样通过强势的市场营销开辟新的市场,并借助合作伙伴的力量迅速进行市场扩张。日本的IT厂商通常会与客户保持长期而密切的合作关系。比如说,富士通现在提倡的精益IT理念就源自几十年来与丰田汽车在生产管理方面的合作。
“传统日资IT企业与德国企业比较接近,都比较务实,注重产品品质和细节。而且日资企业的员工流动率没有美国企业那么高,技术队伍的稳定使得日资IT企业对其客户所在行业的知识和经验积累得更多。这些因素使得日资IT企业与他们的客户保持密切的长期合作关系。”黄邦瑜说,“今天看来,在与客户长期合作中形成的对用户业务深刻的理解,以及由此形成的良好的用户体验非常重要,因为大数据的实施既要尽可能理解用户的业务,又要与用户一道持续不断地对解决方案进行改进。”
黄邦瑜说:“富士通既是IT企业,也是制造行业企业,因此我们会基于自己的最佳实践,为不同的客户提供更细致的产品和服务。从产品上看,富士通的特点是比较全,包括后台的服务器、存储、网络、中间件,以及客户端的智能手机、平板电脑、笔记本电脑等。因此,富士通的整体解决方案会更加优化。
“从系统整体上规划、设计和实施大数据解决方案是富士通的优势所在。比如说,在医疗影像领域,有的美国影像设备供应商会在卖设备时附送该设备的处理软件,但它并不能满足医院除了医疗影像设备之外的其他需求。”黄邦瑜说,“而作为IT厂商,富士通更关心如何用IT系统来支撑医院的整个影像业务,即在包括挂号、门诊和影像科检查等在内的整个流程中,不同科室如何分享影像数据,如何分门别类地存储这些数据,如何与医院的信息系统对接等。”