前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇大数据的商业价值范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
—— 本报记者 张建设
十几个快递员在每次派送货件时,都留心记下顾客的着装、家庭情况、消费习惯、购买商品类别和购物频次。积累一段时间后,他们就录入计算机、汇总、分析,制成简单的报告转卖给电商……这是不久前在微博中出现的一个段子,取名曰“最后一公里的商业价值”。
如果说“一切以电子形式存储的记录”都是“数据”,那么这些快递员就是在做“大数据”的挖掘。这不是什么新鲜课题,早在20世纪30年代,一些社会学家就开展过数据挖掘的实验,奠定了社区网络分析学科,并在市场营销、组织改良、经济网络规划以及惩治腐败、预防传染病中广泛应用。如今,社会化媒体和大数据的兴起,重新焕发了这门学科的活力,并以社会计算形态出现。
社会计算是将数据转换为知识、将知识付诸于行动的重要工具。它以信息技术为手段,运用社会学、经济学、心理学、传播学等社会科学的方法论,解析社会化媒体中传播的结构化和非结构化数据,服务于品牌传播、企业决策、智慧和知识的升华。可以说,社会计算是信息技术应用的衍生品,为我国IT企业转型创造了新的机遇。
开发大数据“最后一公里”。根据施振荣的“微笑曲线”,企业当在价值链、产业链高端布局,攫取其丰厚的利润。具体到电子商务,人们必然视支付、平台、物流、服务为“正业”,而这些快递员的所作所为则是“小动作”。恰恰是这些“小动作”,不仅体现快递员和价值,也反哺了电子商务企业。
如果用一句话来形容,也就是说PC互联网的用户粘性是按小时计算,而移动互联网的用户粘性被缩短到了按分钟计算,这种用户粘性深度绑定就会释放出更多的商业行为,这也就是当前移动互联网的浪潮高于之前PC互联网浪潮的关键原因所在。而进入可穿戴设备时代,由于人与设备之间实现了更深入,可以说是无缝的连接,用户粘性从移动互联网的按分钟计算转变到了按秒进行计算。
可想而知,其所释放出来的商业价值必将超越当前的移动互联网与PC互联网,这也是为什么可穿戴设备从诞生那天开始就一直在争议中不断的飞速发展的原因。很显然的一个原因就是我们看到了当其所构建的用户粘性被进一步缩短之后,所释放出来的商业价值将超越当前由移动互联网所带来的改变。
而可穿戴设备之所以能释放更大的商业价值,关键就在于粘性建立背后所产生的大数据。可穿戴设备作为人体数据的流入与流出的双向渠道,其数据流出的背后隐藏的就是商业机会,而数据流入的背后隐藏的就是数据背后的商业呈现。可以说,基于可穿戴设备的大数据价值是目前全球范围所有从业者的一个共识,也是一些提出可穿戴设备免费这一观点人士的基础依据。
不过在我看来,目前谈可穿戴设备的大数据价值挖掘商业模式还为时过早。不可否认,未来可穿戴设备的核心价值在于大数据,硬件本身所能创造的价值非常有限,不论价格高低,都是一次性的价格表现形式。但其核心价值的大小则取决于大数据的延伸、挖掘,这也是我们所看到的谷歌眼镜没有有效地实现价值放大,其关键原因并不是硬件产品本身不可使用所造成,而是由于大数据不能有效支撑其价值放大。
而对于目前大部分的可穿戴设备从业者们而言,不论是希望借助于设备所收集的大数据进行价值挖掘,还是借助于大数据形成来放大可穿戴设备价值,都还需要一段路要走。至少从短期来看,盈利模式还是基于相对传统的硬件产品销售本身上,而不是依赖于可穿戴设备的大数据挖掘商业模式上。制约可穿戴设备大数据商业价值的主要原因有以下三方面:
1、数据过于碎片化。
由于可穿戴设备产品形态目前还处于一个快速裂变的过程,从智能眼镜、智能手表、智能手环、智能鞋子、智能饰品、智能鞋子到智能服装等。这种快速裂变的产品形态对于一个新兴产业而言,在市场上所呈现的就是产品碎片化的局面。一方面产品碎片化,另外一方面在产品碎片化的基础上创业者又处于分化状态,这就导致不同产品、不同品牌所采集到的数据未能实现互联、互通。而这种数据过于碎片化的结果,当然就使得所采集到的数据不是大数据,而是“小”数据,其价值显然难以有效挖掘。
2、市场普及度不高。
由于可穿戴设备是一个新兴的业态,不论是业内外,对于可穿戴设备产业的认知都还没有形成一个统一、清晰的认识。大众对于可穿戴设备的认知不仅模糊,而且在很大程度上可谓是陌生。受制于消费市场普及的因素,制约了可穿戴设备产业的市场普及,也就意味着可穿戴设备的用户使用量相对比较小众。从产品形态层面来看,目前通常局限于智能手表、智能手环。而就从智能手表、智能手环层面来看,目前还只是局限于一部分对新鲜科技事物感兴趣,或者是比较关注新兴事物的群体。正是由于市场普及程度的制约,很显然地就制约了产品的用户使用量,制约了产品的数据采集数量,制约了数据成为“大”数据的进程。
3、用户粘性不高。
摘要:
在信息时代,一切数据都是有价值的,大数据的商业化利用已成必然趋势。大数据商业化利用的前提是大数据的确权。根据其产生和利用方式的不同,可以将大数据分为个体数据和整体数据。个体数据是基于自然人、法人及其他组织等个体在互联网上的行为而产生的数据,属于个人信息,权利归属于个体,商业价值不大;整体数据是海量个体数据的集合,属于民法上的“集合物”,具有极大的商业价值,其所有权归属于信息控制者。整体数据即通常意义上的“大数据”,对大数据的搜集和利用须以不侵犯个人信息权为前提。
关键词:
大数据;法律确权;集合物;个人信息;信息资产
在数据化时代的浪潮下,每天都有大量的数据产生。“淘宝网每天有超过数千万笔交易在发生,单日数据发生量超过50TB(1TB等于1000GB),存储量40PB(1PB=1000TB)。新浪微博的总注册用户超过了6亿,日活跃用户达到4980万,月活跃用户1.3亿”。[1]这些存储于服务器中的海量数据,通过特殊的处理模式就可以转化为十分有价值的商品,应用到商业、科研、教育服务、军事等各个领域。例如百度利用用户的搜索和浏览数据分析个人的兴趣爱好、上网偏好等,推出精准的网络广告,实现个性化的服务推荐。谷歌则利用其庞大的搜索数据库推出流感预测等公共服务;在信息化时代,一切数据都是有价值的,数据交易市场也初具规模。Infochimps、Factual、日本富士通公司、微软的WindowsAzureMarketplace、中关村数海大数据交易等都在构建数据交易平台,进行数据交易。但无论是大数据的使用还是交易,前提都是大数据的确权。只有明确大数据的法律性质是什么,受何种法律保护,数据权利归属于谁,才能明确数据各方的权利义务关系,更好地促进数据的使用和保护。
一、大数据的界定析概念
以辨理,明晰大数据的内涵和外延是分析其法律属性和权利归属的起点。大数据是一个被广泛使用的词汇,经济学、管理学、计算机等多个学科都在定义和分类自己的“大数据”。那么从法律的角度如何对大数据进行定义和分类,才能使其具有法律确权的意义呢?
(一)大数据的定义与特征
大数据,或称巨量数据、海量数据,目前在法律上对其的定义还没有形成共识。著名产业调研机构Gartner认为大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。IBM公司对大数据给出的4V特征受到学者和产业界普遍认可,即数量大、快速变化,庞杂内容和精确性。他们认为在总数据量相同的情况下,与个别分析独立的小型数据集相比,将各个小型数据集合并后进行分析可得出许多额外的信息和数据关系性,可用来察觉商业趋势、判定研究质量、避免疾病扩散、打击犯罪或测定实时交通路况等。换言之,从计算机学科的角度而言,大数据是原材料,利用特殊的处理模式和计算方法能够从海量数据中得出有价值的信息,其关注的重点在加工过程及加工后的产品。而在法学上,大数据则指原始庞大的数据库,侧重看大数据的来源和利用方式是否符合法律的规定。
(二)大数据的分类
1.标准化数据与非标准化数据
根据数据呈现的方式不同,可以将大数据分为标准化数据和非标准化数据。这种分类方法可以让我们更好地了解大数据的含义、组成及特征。所谓标准化数据即传统意义上的数据,一般为“数字”信息,也包括利用数字制作的图表、图片等。常见的标准化数据有客户量、业务量、营业收入额、利润额、调研数据等等。非标准化数据则不仅包括数字,还包括文本、图片、音频、视频等多种格式的信息,涵盖范围十分广泛。例如微信、微博、博客、QQ等社交媒体上的文本、图片信息,账号,音频视频分享,通话录音,电子邮件,位置共享,点评信息,交易记录,搜索记录等。在大数据的背景之下,通过互联网进行的一切行为产生的数据都可以构成大数据。因此,较传统数据而言,大数据范围广、数量大、内容杂、变化快,是典型的“大”数据。对利用大数据的企业而言,大数据一般来源于两部分:一是产生于企业内部的运营数据,通常为结构性、标准化的“数字”信息;一部分为存储于自己网络服务器中的庞大数据库,例如用户个人信息、账号、交易记录、搜索记录、支付记录等等。因此,大数据本质上是各种标准化和非标准化数据的简单集合。通过对大数据的分析得出的商业秘密或其他智力成果,则属于大数据的利用成果,而非大数据本身。
2.个体数据与整体数据
从数据产生和利用的不同层面,可以将大数据分为个体数据和整体数据。这种分类方式有助于明确大数据中的法律关系及其权利归属。个体数据是指基于自然人、法人及其他组织等个体在互联网上的行为而产生的数据,包括注册的个人信息,社交网络中的图片、视频,网络浏览记录,电子商务中的购买记录等等。这些数据直接来源于个体的行为,因此许多个体信息都属于个人信息。从微观上而言,大数据是由个体数据构成的,个体数据是组成大数据的最小单元。通常个体数据商业价值并不大。整体数据则是海量个体数据的集合,从宏观的角度而言,大数据就是存储于网络服务商服务器上的庞大数据库。作为整体存在的大数据才是真正意义上的大数据,具有巨大的潜力和商业价值。对于企业而言,数据量越大、来源越广,数据的价值才会越大。因为通过对不同数据的分析利用,可以透视事物的不同方面,以消费客户为例,消费记录信息能透视客户的消费能力、消费频率、消费兴趣点等,渠道信息能透视客户的渠道偏好,消费支付信息能透视客户的支付渠道情况,一般来说,企业用以分析的数据来源越广、越全面,其分析的结果就越立体,越接近于真实。信息控制者即指这些能够实际控制大数据的企业或网络服务商,只有他们才能搜集和真正利用大数据谋取利益。在理论上就相同的“大数据”一词,不同的文章其所指意义也有不同。通常从权利保护方面而言的“大数据”多指个体数据,例如大数据时代下的个人信息保护;从大数据的利用方面而言的“大数据”多指整体数据,例如大数据的商业化利用研究。
二、大数据的法律属性
大数据的法律性质是确定其权利归属和法律关系的前提。我国法律还没有关于大数据的直接规定,因此大数据在法律上应属于人格权利益还是财产权利益,人格利益中是属隐私还是个人信息,财产利益中是属智力成果、无形财产还是有形财产,是动产还是不动产等问题并没有统一的认识。由上文可知,根据大数据的产生和利用方式的不同,我们将大数据分为个体数据和整体数据,其中个体数据侧重于个人信息的保护,而整体数据侧重于其商业价值的利用。由于个体数据直接产生于个人行为,理应属于个人信息,不再赘言。那么作为整体数据存在的大数据,其法律性质为何呢?
(一)汇编作品
有的学者根据大数据“集合性”的特征,认为我国法律上存在与之相关的概念。他们主张将大数据视为“汇编作品”,作为无形的智力成果,权利人可以主张知识产权的保护。[2]对此,笔者认为仍需商榷。《中华人民共和国著作权法》第十四条规定,“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品,为汇编作品”。由此可知,汇编作品要求内容的选择和编排要体现独创性,否则不构成汇编作品。而多数大数据的集合仅仅是一些标准化或非标准化数据的简单集合,属于事实集合的范畴,并没有体现独创性。如果用汇编作品的标准来衡量大数据的价值,显然许多应受保护的数据不能得到该有的保护。因此,笔者认为对大数据集合本身,由于其巨大的利用价值,我们理应保护。如果数据的集合还体现了“独创性”,则还可以主张作为汇编作品保护,这二者并不冲突。换言之,对于有独创性的集合数据,可以有双重保护,因为其保护的利益不相同。
(二)信息资产
由于大数据本质上属于信息,利用大数据也主要利用其信息价值。因此有的学者主张,大数据是信息化时代下的一种新型资产,传统财产权的客体无法将其涵盖,应建立信息资产制度,信息本身即是信息资产的客体。在信息化时代,信息就是价值,信息就是财产,信息的保护是财产权制度中不可缺少的一环。信息资产的重要性毋庸置疑,但我们是否真的需要建立信息资产这一财产权客体?在这一制度尚未建立之前,我们应如何保护诸如大数据等信息财产?通过对现有制度的解释是否也能实现对信息财产的保护呢?笔者认为,制度的建立非一日之功,在新的制度尚未建立之前,我们仍应探索现有制度的保护途径。事实上,在当下并非一切信息都值得保护,仅有少部分信息体现出了其巨大的商业价值。对于这一部分信息,通过现有的民法制度,完全可以实现对其的保护。
(三)集合物
笔者认为我们可以退一步从民法的角度出发,将大数据作为民法上的“物”进行保护。如果大数据能够符合民法上“物”的特征,则理所当然能适用物权法、侵权法、债权法等一般民事法律。民法上的“物”指具有使用价值,能满足人的某种需要并能为人所控制和支配的物质对象。其具有以下特征:第一,民法上的物是“有体物”,即具有一定的体态,占有一定的空间,并不要求有形;第二,民法上的物是财产物,具有使用价值;第三,民法上的物能为人类所支配和控制。[3]大数据显然符合这些要求,首先大数据虽然表现为二进制代码,但是其需要占据数据存储空间,尤其在网络空间逐渐成为独立空间的时代,数据就是网络空间中物的体现。其次,数据具有使用价值,能满足人类的某种需求。这点毋容置疑,大数据的适用案例和数据交易的兴起皆是大数据具有使用价值的证明。在大数据时代,数据不仅能满足人类的某种需求,数据甚至能满足人类的各种需求。再次,大数据也能为人类所控制和支配。大数据虽然数量庞大、结构复杂,但是其毕竟存在于人类构建的网络空间中,只要信息控制者愿意,随时可以控制和支配存储器上的数据,用于达到自己的目的。因此,大数据属于民法上的物。那么大数据属于民法上的何种“物”呢?首先大数据属于一般财产物,而非人人都能享有的公共产品,诸如空气等。因为大部分大数据仍为特定的人享有,例如百度的搜索记录只能为百度公司控制、支配、处理。即使大数据具有可复制性强的特征,边际成本很低,也不能将大数据视为公共产品。其次,大数据应属于民法上的集合物。集合物不是数个独立物的简单相加,而是因其“集合”而产生了新的特征,从而成为了新的物。大数据是无数个体数据的集合,而这种“集合”本身才使得这些数据有了价值。如果仅仅是个体数据,而不具有大数据之“大”的特性,没人会买这样的数据,对企业而言单个的数据也无价值。因此,笔者认为虽然大数据是由无数的个体数据构成的整体数据,但是这个整体数据因其“大”的特征而具有了价值,构成了新的物,即集合物。这种处理个体与群体关系的方法或规律,在社会科学领域广泛存在。①[4]
三、大数据的法律确权
个体数据属于个人信息,整体数据虽由个体数据构成,却具有自己独立的价值,属于集合物。确定大数据的法律属性之后,其权利归属和法律关系的确定便水到渠成了。
(一)个体数据的权利归属
个体数据来源于个人行为,属于个人信息,其权利当然归属提供数据的个人。这种权利即个人的信息自决权,核心体现为对个人信息的控制权。这种控制表现为个人有权了解谁在搜集其信息资料、搜集了怎样的信息资料、搜集这些信息资料从事何种用途、所搜集的信息资料是否客观全面、个人对这些信息资料的利用是否有权拒绝以及个人对信息资料是否有自我利用或允许他人利用的权利等内容。[5]例如,个体的账号信息、浏览记录、购买记录等事实数据的搜集,网络服务商应征得个人同意,个人也有权要求网络服务商消除这些信息。
(二)整体数据的权利归属
整体数据的所有权归属于信息控制者。整体数据不同于个体数据,其价值的取得在于集合了大量不同个体来源的数据。我们无法将整体数据与具体的个人相联系,因此大数据不具有人格利益,是纯粹的财产物。在此基础上,整体数据的财产所有权应归属于信息控制者。主要理由有:第一,大数据实际处于信息控制者的支配之下,只有他们才能真正利用这些数据;第二,作为整体存在的数据实际上不可能为个体分别所有,也不能说每个个体都对整体数据享有什么权利;第三,信息控制者为数据的取得付出了代价,理应获得这些数据中所蕴含的商业价值。网络服务商能取得这些数据的前提是其为个体提供了相应的服务;第四,将数据的所有权归属于信息控制者能简化数据交易的过程,促进市场更好地发展;最后,从已有的数据利用方式看,利用数据的主体都是信息控制者,而非单独的数据个体。因此,作为整体数据存在的大数据应归属于信息控制者。
(三)大数据中的权利义务关系
大数据的法律确权不仅要确定大数据的权利归属,还需确定大数据利用中所涉的权利义务关系,只有明晰的法律关系才能引导数据市场的正常发展,促进数据的利用和保护。由上文可知,大数据所涉的法律关系主要有两个方面,一是在数据的产生和搜集过程中,个体与信息控制者之间的关系,核心内容是个人信息的保护;信息控制者搜集和利用信息必须充分尊重个体的知情权和同意权。如果涉及隐私等一旦为他人知晓就将带来巨大困扰的敏感性信息,即使个体通过默示的方式同意,也不能公开使用。二是在数据的利用过程中,信息控制者与第三方之间的关系,核心内容是财产权的处分。信息控制者对整体数据享有完全的所有权,即享有占有、使用、收益、处分的权利,可与第三方就任何利用方式达成协议并支付相应的对价。协议问题主要适用合同法律关系,数据的转让和共享适用物权法律关系,其他方式皆可参照现有财产法律关系适用。需注意的是,对大数据的利用不得侵犯个体的隐私权等人格权益,但有时为了公共利益的除外。例如,为了研制流感疫苗,而调取利用病人的病历资料等。
四、结语
随着信息时代的来临,数据的价值越来越大,数据交易也初见规模,数据确权对数据的保护和利用具有十分重要的意义。个体数据来源于个体行为,属于个人信息的保护范畴。大数据是纵多个体数据的集合,构成一个庞大的整体数据,这个数据整体因其本身的价值形成了民法的“集合物”,所有权归属于信息控制者。信息控制者所有权的利用需以不侵犯个人信息权和隐私权为前提。在信息时代下,信息就是资产,一切数据都是有价值的,如何促进信息的利用和保护是互联网治理的重要内容,希望本文的分析能为立法和司法提供一些参考资料。
参考文献:
[1]刘宇晗.大数据时代个人信息的民法保护[J].中国律师,2014(2).
[2]林华.大数据的法律保护[J].电子知识产权,2014(8).
[3]刘凯湘.民法总论[M].2版.北京:北京大学出版社,
[4].乡土中国[M].北京:北京大学出版社,2012:158-159.
[5]王利明.论个人信息权的法律保护———以个人信息权与隐私权的界分为中心[J].现代法学,2013(4).
注释:
[关键词]大数据 传统媒体 数据化 转型
[基金项目]本文是国家社科基金重点项目《新媒体环境下传统媒体的转型战略研究》的阶段性成果
目前大数据正在成为整个社会的底层架构和标配,国家“十三五”发展规划也提出了“大数据”工程,在此背景下,大数据能够帮助深陷困境的传统媒体重建用户连接,有可能成为传统媒体弯道超车的利器,传统媒体应该在数据、技术平台、终端、数据产品已经与大数据互联网公司合作等五个方面来实现传统媒体的转型和发展。
一、大数据能够帮助传统媒体重建用户连接
1.传统媒体深陷困境的根源:用户连接失效。
在互联网媒体的严重冲击下,2012年以来,以报纸为代表的传统媒体正深陷困境,主要表现为受众快速转移到互联网媒体、广告主快速抛弃传统媒体、骨干人才大量流失,传播能力快速下滑,其结果是大量的市场化报纸陷入亏损而休刊停刊。在传统媒体快速衰落的同时互联网媒体广告却保持着30%以上的增速,很显然哪种认为是外部经济环境不好才导致传统媒体陷入困境的说法是站不住脚的,传统媒体深陷困境的是用户连接失效。
首先,传统媒体不仅受众大量流失,而且并不存在真正意义上的用户。自从互联网1994年4月20日正式进入中国以来,我国网民和手机网民数快速发展,根据CNNIC的数据显示,截至2016年年底,我国网民数达7.10亿,互联网普及率达到51.7%,超过全球平均水平3.1个百分点;手机网民规模达6.56亿,市场渗透率达到92.5%,其中仅通过手机上网的网民占比达到24.5%。[1]而报刊的用纸量和发行量大幅度下滑,电视的收视率也出现一定程度的下降,这说明受众开始大量抛弃传统媒体。
其次,受众流失导致传统媒体深陷困境。传统媒体长期以来采取的是“两次销售”的商业模式,即第一次把内容和产品销售给受众,同时获得鞑スδ埽第二次再把传播功能销售给广告主,实现自身的商业价值变现,该模式的关键是内容和渠道的合一,内容所承载的商业价值较小,而渠道所承载的商业价值较大。而受众大量流失之后,就使得传统媒体的入口价值丧失,内容和渠道彻底分离,渠道所承载的广告等商业价值被互联网平台所获取,而传统媒体所获得内容所承载的商业价值已经远远不能弥补传统媒体的正常运作,传统媒体只能深陷亏损深渊,简单地说,大型传统媒体机构想单纯做内容提供商而专门从事内容生产和提供的思路已经不可能成功。
第三,传统媒体从来没有真正意义上的用户。用户和受众之间存在本质区别,一是用户数量更大,而受众数量小,互联网巨型平台的用户动辄数以亿计;二是用户能够利用大数据和人工智能技术分析每一个用户的收入、消费能力、爱好、需求等精准的数据,而受众只能给出一定规模样本的、概貌的数据;三是用户是高频的、动态的,而受众是低频的、静态的;四是用户是紧密型关系,而受众是松散型关系,因此从上述本质区别来看,传统媒体只有受众,并不具有实质意义上的用户。而从用户的商业价值来看,由于用户的商业模式是“新闻+服务”,用户的数量远远大于受众数量,且能够通过智能化推荐技术给用户推荐精准化、定制化的、能够真正满足用户需求的信息、产品和服务,其价值远远超过传统意义上的受众。
2.传统媒体转型核心在于重建用户连接。
传统媒体要想真正实现自身的数据化转型,实现商业价值变现,必须重建用户连接。一是传统媒体要变之前的自我为中心的内容思维转变为以用户为中心的数据思维,用户在哪儿,就服务到哪里,想用户之所想,急用户之所急;二是打造真正属于自己的互联网平台,既要建立基于大数据和人工智能的大数据资源平台、智能生产和传播平台以及用户沉淀平台三大平台,又要建立起PC互联网、官方微博、官方微信公众号、新闻客户端等各类终端,能够对用户的信息消费等行为进行跟踪;三是对传统媒体的内容素材进行标签化以及对用户进行精准画像;四是通过内容和用户个性化、定制化、精准化需求之间的信息智能匹配,实现用户沉淀目的;五是在用户沉淀基础上,为用户提供更好的产品和服务,进而实现自身商业模式和盈利模式的重构。
二、传统媒体数据化转型的五层模型
对于传统媒体来说,要实现彻底的数据化转型,应从数据收集和扩展、技术平台构建、终端全覆盖、数据产品开发和与大数据公司合作五个层面进行构建,当然不同类型的传统媒体并不需要对这五层进行全部构建。
1.数据收集和扩张。
首先,把之前的纸质版数据数据化。传统媒体积累了很多纸质版内容,可以通过外包的方式把纸质内容数字化,然后再通过更多的标签把这些内容数据化,目前绝大多数传统媒体实现了旧有纸质内容的数字化,但很多尚未实现数据化。
其次,及时把数字化内容实现数据化。传统媒体每天都会生产大量的内容并且这些内容已经实现了数字化,但是需要把这些内容在经过标签化之后实现数字化内容的数据化。
第三,扩大数据源。传统媒体一方面可以充分利用政治资源来获取优质数据进而扩展自身的数据源,可以从政府手中获取医疗、养老、旅游等方面的数据,例如,浙江日报报业集团就通过与浙江民政厅合作建设浙江省养老数据库,目前已经达到5,000万以上的活跃用户目标;另一方面可以通过收购和合作的方式获取更多数据源。例如,浙江日报报业集团以31.9亿元收购盛大旗下的杭州边锋和上海浩方游戏竞技平台,获得了一个拥有约3亿注册用户、2000多万活跃用户的成熟游戏平台。此外,浙江日报报业集团旗下的浙报传媒拟定增近20亿元打造互联网数据中心及大数据交易中心项目,其中,互联网数据中心由公司拟新设的全资子公司杭州富春云科技有限公司负责实施;大数据交易中心项目由公司与北京百分点、浙商资本共同投资新设的控股子公司浙江大数据交易中心有限公司负责实施,注册资本为1亿元,浙报传媒出资5320万元,对应持股比例为53.2%,北京百分点出资2700万元,对应持股比例为27%,浙商资本出资1980万元,对应持股比例为19.8%。这两个项目建设完成后,拟向全国范围内的客户提供包括主机托管、宽带租用、云计算服务、大数据服务、大数据交易等一系列服务。
目前来说,浙江日报报业集团在数据层面取得了极大进展:一是把自身的相关内容数字化,并在数字化的基础上实现数据化;二是通过收购边锋和浩方获得了大量的信息和用户数据以及用户;三是通过政治资源尽可能地获得浙江省的相关数据;四是打造互联网数据中心及大数据交易中心项目来获取更多的数据。当然我们也不得不说的是,国内绝大多数传统媒体的数据层面的工作进展很慢,很多连把数字化内容的数据化工作都没有做好。
2.打造三大技术平台。
三大技术平台是指大数据资源平台、智能生产和传播平台以及用户沉淀平台,只有搭建好三大平台才能更好地实现内容和用户的标签化。
首先,在大数据资源平台方面。大数据信息资源平台,是硬件、软件、数据、云存储和平台服务的组合,具体包括大数据资源中心、大数据智能分析中心、大数据组件服务、虚拟化云平台、大数据运营系统、安全管理体系等方面的建设内容。核心通过互联网采集、接口导入、历史数据导入、远程汇聚等各种方式,将传媒集团内部资源、互联网资源、第三方资源以及UGC资源汇聚到大数据资源中心。
其次,在智能生产和传播平台。智能生产和传播平台,是立足于传媒集团大数据平台,以大数据智能分析工具作为技术支撑,将传媒集团旗下媒体资源融合共享使用,以“中央厨房”的方式重构新闻生产,实现“一次采集、多元加工、多次”的智能生产和传播平台。包括新闻线索智能决策系统、融媒体智能创作系统、融媒体智能系统、传播效果分析系统、中央厨房报道指挥系统、内容创作社区、PC互联网改造升级等方面的建设内容。核心是建立起智能化的新闻线索智能决策系统、智能创作系统和融媒体智能系统,即在大数据平台的基础上,通过网络热点采集,形成新闻热点岛图和地域热点岛图,帮助采编人员更好的判断事件的关注度及影响范围,并以信息大数据支撑新闻采写创作,实现创作的智能化、个性化,提高新闻采编的效率和针对性,进而实现新闻内容的一次加工和多渠道多终端统一,将新闻资讯和信息服务点对点推送给在用户,实现信息服务的个性化、智能化。[2]
第三,在用户沉淀平台方面。用户沉淀平台,是将传媒集团通过优质内容资源、线下活动、经营行为沉淀下来的优质用户数据进行整合、清洗、认证、管理、记录以及深入挖掘、分析,并通过智能化、个性化的信息、数据服务,提高用户的参与度和满意度。用户沉淀平台包括用户数据采集及处理、用户数据存储与管理、跨媒用户统一管理、用户行为分析、用户肖像刻画、互动应用管理等方面的建设内容。核心是用户画像,即对采集数据进行分析,通过不同模型及算法实现对用户肖像的刻画、行为轨迹的分析等多维度的分析,为产品优化、精准营销、以及面向用户的智能化服务提供服务。对用户行为的分析,要从内部资源和外部资源两个方面进行分析,在外部资源方面,从阅读兴趣、事件分析、选题趋势、热点走势、区域分析、数据探索、前端可视化和专题汇聚等方面进行分析。在内部资源方面,从稿件热点匹配、聚类关联、影响力分析、跨业务分析、多维标签、历史挖掘等方面分析。内部资源和外部资源的用户行为分析整合为用户行为知识网络。[3]
第四,在信息智能匹配方面。一是可以根据用户短期的点击、转发和评论行为来给用户按照兴趣、职业、年龄、终端、地域分布、兴趣和情感倾向等特征对用户进行画像,进而分析出用户喜欢什么类型的文章、最喜欢文章里的什么关键词、关注你的人还喜欢什么内容等等。二是个性化推荐除了考虑用户的个人特征,也要考虑用户所处的场景;三是重点分析文章中有什么主题词,有什么重要标签,文章热度、时效性和相似性等;四是通过分析用户的个性化特征,结合特定的场景,给每一个用户推荐满足其需求的文章,这样就能够吸引用户留存下来,并提升用户的忠诚度。
在三大平台建设方面,绝大多数传统媒体由于实力有限、观念认识不到位而没有太多进展。浙报集团在搭建三大平台方面做了很多工作:一是通过“媒立方”这一重大工程,打造了基于大数据的大数据资源平台、智能生产和传播平台以及用户沉淀平台三大技术平台,该工程完成之后,能够满足浙报集团媒体融合发展所必需的从信息发现、一站式生产、全媒体到智能化分析、精准化服务等多重需求。该项目获得中央财政文化产业发展专项资金扶持,并委托大数据上市公司拓尔思负责开发,据了解该平台进展顺利且实施效果良好;二是浙报集团高度重视技术工作,通过收购边锋和浩方,在原来技术基础上形成了由新媒体中心、数据库业务部、信息技术中心、边锋等四大模块构成的技术平台,并形成了一个具备自主研发能力的、人员规模千人以上的技术团队。
3.搭建各种终端。
各类终端是接触用户的触角,只有建立了与用户连接的各类终端,才能够真正接触到用户,也才能真正对用户画像和沉淀。目前,传统媒体在和用户连接方面,除了PC互联网之外,还有官方微博、官方微信公众号和头条客等以及各类新闻客户端。
首先,各类传统媒体都在建立新闻客户端。为了实现自身影响力向移动互联网终端的平移,各类各类传统媒体纷纷建立起自身的新闻客户端,截至到2016年8月底,传统媒体已经建了将近300个,其中知名的是中央级的人民日报社下的人民日报新闻客户端、新华社的新华社新闻客户端、中央电视台的央视影音新闻客户端,而地方上的则有上海报业集团旗下的澎湃、浙江日报报业集团旗下的浙江新闻客户端、南方都市报旗下的并读、湖南广电旗下的芒果TV、苏州广电旗下的无线苏州等等。
在全球的各行各业中,高管们都认识到,他们需要更多地了解如何利用大数据。但是,尽管大数据吸引了媒体的广泛关注,但从企业正在做的事情中很难发现深层次的信息。
因此,我们试图更好地了解企业如何看待大数据,以及它们目前在多大程度上使用大数据而使其业务受益。IBM商业价值研究院与牛津大学赛德商学院联手进行了2012 Big Data @ Work研究,调查了95个国家中的1144名业务和IT专业人员,并采访了20多名学者、业务主题专家和企业高管。
我们发现,近三分之二(63%)的受访者表示,信息(包括大数据)和分析的使用为其组织创造了竞争优势。在IBM的2010年新智慧企业全球高管联合调研中,有此看法的受访者比例是37%――在短短两年内增幅达到了70%。
从大数据中获取商业价值的五项建议
作为日益扩大的信息与分析市场中越来越重要的一个领域,大数据具有重要的影响。对于在其组织内已经实施大数据试验项目或者部署项目的受访者来说,通过信息(包括大数据)和分析而获得巨大优势的比例要比仅依赖传统分析方法的组织比例高15%。
那么,当前的大数据活动为何与以前不同?有些组织使用大数据已有多年时间。例如,一家全球电信公司每天从120个不同系统中收集数十亿条详细呼叫记录,并保存至少9个月时间。一家石油勘探公司分析几万亿字节的地质数据,而证券交易所每分钟处理数百万个交易。对于这些公司,大数据并非一个新概念。
然而,两个重要趋势使得大数据时代与之前有显著的区别:
一是目前在广泛行业中几乎“所有方面”的数字化产生了新型的大量的实时数据。其中,非标准数据占据很大一部分,例如流数据、地理空间数据或传感器产生的数据,这些数据并不能完美地适用于传统的、结构化的、关系型数据仓库。
二是当前先进的分析技术和工艺使得各组织能够以从前无法达到的复杂度、速度和准确度从数据中获得洞察力。
在各行业和各地区,我们的调研发现,组织对大数据采用了一种务实的方法。最有效的大数据解决方案首先识别业务要求,然后定制基础架构、数据源和分析方法,以支持业务机会。这些组织从现有的和新的内部信息来源中获取新的洞察力,制定大数据技术战略,然后随着时间的推移逐步地升级相应的基础架构。
我们的调研结果为各组织逐步开展大数据举措以及从大数据中获取最大的商业价值提供了五项关键建议:
(一)以客户为中心推动初始举措
最初的大数据举措必须注重能够为企业提供最大价值的领域,这一点势在必行。对许多行业来说,这意味着从客户分析开始,通过真正了解客户需求,并预测未来行为,从而为客户提供更好的服务。
全面数字化是有助于带来大数据迅猛发展的一个推动力,已经改变了个人和组织之间的力量平衡。如果企业希望了解并向有能力的客户和市民提供价值,他们必须集中精力将客户作为个体进行了解。企业还需要向新技术和高级分析能力投资,以更好地了解各个客户的交互和偏好。
但是,当今的客户――包括最终消费者或者企业对企业客户――需要的不仅仅是了解。要想有效地培养与客户之间有意义的关系,企业必须以客户认为有价值的方式与客户联系。
价值可能来自更及时、更明智或者更相关的交互;也可能来自于企业通过改进底层运作而增强交互的整体体验。无论来自何处,分析都有助于从大数据中获得洞察力,这对于在这些关系中达到这一深度日益重要。
(二)制定整个企业的大数据蓝图
蓝图包含企业内的大数据愿景、战略和要求,对于在业务用户的需求与IT实施路线图之间做到协调非常关键。它实现了关于企业如何利用数据改进业务目标的一致理解。
有效的蓝图通过确定大数据适用的关键业务挑战,规定如何使用大数据的业务流程要求,以及包含实现该蓝图所需数据、工具和硬件的架构,从而定义了企业内大数据的范围。这是为指导企业以实用的方式,并以创造可持续的商业价值为出发点,开发并实施大数据解决方案而制定蓝图的基础。
(三)从现有数据开始,实现近期目标
要实现近期目标,同时为持续开展大数据项目创造发展动力和专业知识,企业必须采取实用的方法。我们的调研表明,要开始寻求新的洞察力,最具逻辑性和性价比的地点就是企业内部。
从内部着眼允许企业利用现有数据、软件和技能,提供近期业务价值,并且在考虑扩展现有的能力而处理更复杂的数据来源和类型之前积累重要的经验。大多数企业希望通过这样做而充分利用现有存储库中的信息,同时扩展其数据仓库,以处理更大数量和更多类型的数据。
(四)根据业务优先级逐步建立分析能力
在世界范围内,越来越多的分析工具使企业目不暇接,同时企业也面临着分析技能的严重缺乏。大数据效率取决于消除这一巨大差距。简言之,企业必须获取工具和技能。在这个过程中,随着分析、功能和IT技能的完美平衡,预计新角色和事业模式将会出现。
关注内部分析人员的专业发展和事业进步――他们已经熟悉企业独特的业务流程和挑战――这应是业务高管的首要任务。同时,大学和个人自身(无论什么背景或专业)都有义务培养强大的分析技能。
(五)基于可衡量的指标制定投资回报分析
制定综合且可行的大数据战略以及后续的路线图需要可靠且可量化的投资回报分析。因此,一位或多位业务高管积极参与并支持这一流程非常重要。要实现长期的成功,强大、持续的业务和IT的协作同样重要。
许多企业的投资回报分析基于以下可从大数据获得的益处:
1.更聪明的决策――利用新的数据源提高决策质量;
2.更快的决策――实现更实时的数据获取与分析,支持在“影响点”做出决策,例如在客户访问您的网站或者与客户服务代表通电话时;
3.创造奇迹的决策――使大数据举措注重于那些能够提供真正差异化的领域。
这些建议中有一个基本原则:业务和IT专业人员必须在整个大数据实施过程中通力合作。最有效的大数据解决方案首先确定业务要求,然后定制基础设施、数据源和量化分析,以支持该业务机会。
按阶段的更多建议
在大数据采用的生命周期内,某些关键活动是每个阶段的特征。以下各阶段建议为从一个阶段进入下一个阶段提供了经过验证且实用的方法。
(一)从教育到探索:为后续行动奠定基础
1.注重大数据为企业提供竞争优势的领域,包括行业内部和外部,持续增加您的知识;
2.与不同的业务部门和职能合作,确定可以通过更好、更及时的信息访问而应对的最关键的业务机遇和挑战。许多企业通过客户数据和分析开始,以支持其前台转型举措;
3.注重增强您的信息管理环境和基础架构,包括制定大数据蓝图;这些蓝图通常基于行业标准、参考架构和其他可用的技术框架和资源。
(二)从探索到接触:将计划付诸实施
1.在制定大数据战略和路线图时,确认业务领导层的积极支持;
2.为您计划通过POC或试点项目而解决一个或两个关键业务挑战制定投资回报分析;
3.在开始为满足更长期的要求而做出计划时,定期确认您的信息管理基础和IT基础架构能够支持POC或试验项目需要的大数据技术和能力;
4.评估您当前的信息治理流程及就绪程度,以应对大数据的新方面;
5.分析内部资源现有的技能集,并且开始进行差距分析,以了解您需要在哪些方面增加和/或获得更多技能。
(三)从接触到执行:了解面临的机遇和挑战
1.积极推动试点项目的成功,以保持前进动力,同时开始参与到业务的其他部分中;
2.通过确认和验证预期的投资回报和收益而最终确定业务案例,包括既定的成功标准和指标;
3.确定由于能够获得更好、更及时的信息(例如营销、销售、客户服务和社交媒体网站)而需要修改和改进的业务流程;
4.制定能力计划,以确认是否有实现短期和长期目标所需的足够技术和定量技能;
5.记录从试验到投产的详细项目计划。该计划应包括预计业务价值、成本、资源和项目时间表的确认。
(四)执行阶段:拥抱大数据的创新
1.记录早期成功的和量化的结果,以支持未来的举措;
2.在企业中发起正式的大数据沟通,持续地提供支持和前进动力;
3.注重增加技术和技能,以应对各业务部门、职能领域和地区的新的大数据挑战;
4.注意信息治理(包括信息生命周期管理)、隐私和安全;
5.持续评估快速发展的大数据工具和技术。平衡现有基础架构与能够提高扩展性、优化度和弹性的新技术。
开始您的大数据演进
要在全球整合的经济环境中竞争,当前的企业需要全面地了解市场、客户、产品、法规、竞争对手、供应商、员工等,这一点日益明确。这种了解需要有效地使用信息和分析技术。事实上,除了其员工之外,许多企业还将信息视为最有价值的差异化资产。
现在,随着大数据的出现和广泛采用,全球各地的企业都在寻找新的方式开展竞争并且获胜。它们不断地转型,以充分利用大量的信息改进整个企业内的决策和绩效。少量领先的企业已经通过为员工――从高管到营销和车间工人――提供信息、技能和工具而使他们更好、更及时地在“影响点”做出决策,从而实现这一目标。