前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇大数据时代范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
新闻回放:
2012年,大数据成为国内软件和信息服务产业最热门的话题。无论是各大IT厂商、还是企业用户,都将大数据作为未来的重要发展方向之一。另外,中国政府和国内科研教育机构对于大数据的重视程度也上升到了一个新的高度。
2012年4月,中国移动、中国联通、中国电信三大运营商不约而同地落户西安西咸大数据处理与服务产业园,这是中国首家以大数据业务为中心的高新园区。
2102年9月,北京航空航天大学成立大数据科学与工程国际研究中心。之后,北京航空航天大学又设立了国内首个“大数据技术与应用”软件工程硕士项目。
2012年12月,在2012中国软件大会上,赛迪集团软件与信息服务业研究所、软件和信息服务杂志社联合了国内首份大数据发展蓝皮书。
科研和人才培养方面的启动,标志着大数据市场已经进入发展期。
而从用户层面来看,2012年,大数据在国内银行、电信、零售以及快消品等行业都已经有成功应用案例出现。可以看到,一个大数据时代的雏形已经清晰地浮现在我们眼前。
新闻点评: IT应用的价值发生质变
2012年,被很多人称为是大数据元年。之所以这样说,是因为在2012年,大数据真正从概念走向了实践应用,开始落地。
事实上,大数据这一概念并不是凭空产生的,用户关于数据分析、处理的需求一直未曾停止过。那么,为什么在2012年,这一需求突然爆发呢?
催生这一需求爆发的原因以下几点:
一是图像、语音、视频等非结构化数据的迅猛增长,使得用户所面临的数据量越来越大、越来越复杂,此时,用户迫切需要对这些海量数据进行处理和分析;
二是数据处理分析技术的进步。最近两年,随着HANA、Hadoop、列式数据库等一批新技术的出现,使得大数据的分析和处理不再可怕。
三是企业市场竞争的需要。
以上几个因素交织在一起,使大数据在2012年显得异常火爆,同时也加速了大数据的落地进程。
在2012年,我们可以看到,大数据已经在很多行业开始得到成功应用。例如,农夫山泉公司通过应用大数据技术,取代了企业原来的数据集市,对大量的数据进行实时的分析,这样企业可以得到实时的业务信息,并及时对市场做出快速反应,这使农夫山泉在激烈的市场竞争中占得先机。
另外,在公共卫生、经济发展和经济预测、互联网等多个领域,大数据的实践应用也开始逐渐涌现。可以说,大数据时代的雏形已经逐步呈现。
在很多人看来,大数据是一项IT技术。但事实上,大数据的更大意义在于,它早已超越了IT技术的范畴,并且将会对一些传统的商业思维进行颠覆。而其中对于企业而言,最重要的就是,要将数据作为一项重要的资产。未来,对于大数据的分析和处理能力,将成为企业的核心竞争力之一。
IDC在其关于大数据的报告中就曾指出,未来领军企业与其他企业之间最大的差别在于新数据类型的引入。那些没有引入新的分析技术和新的数据类型的企业,不太可能成为其行业的领军者。
这意味着,IT应用的价值将发生质的改变:IT技术将真正和企业的业务融合到一起,而不仅仅只是一种支持工具。这对于整个IT产业的发展而言,都具有十分重要的意义。
数据就像一个神奇的砖石矿,当它的首要价值被发掘后仍能不断给予。我们看到的只是冰山一角。就像一些特殊类型的信息也早已经在市场上交易,如书籍、文章、音乐、电影等,这些在过去的几十年中已经通过个人的数据加入数据库当中,同时随着社交平台的出现,我们的人脉关系、想法、喜好和日常生活模式也逐渐被加入到巨大的个人信息库中。在数字化的时代,数据的作用被掩盖,数据只是被交易的对象。被视为附属于企业经营核心业务的一部分,或者被归入知识产权或个人信息中相对局限的类别,但是在大数据时代,事情发生了变化,数据的价值从他最基本的用途转变为未来的潜在用途,这一转变意义重大,它影响了企业评估其原有的数据和访问者的形式,促使甚至是迫使公司改变他们的商业模式,同时也改变了组织看待和使用数据的方式了。
销售企业为了核算和分析而收集销售数据,制造企业为了确保产品符合质量标准而监控输出,互联网为了分析和优化其呈现给访问者的内容而记录访问痕迹。电子商务记录顾客购买的书籍为了给顾客提供个性化的建议,所以数据的价值不是因为使用而减少或增加,而是不断的因为需求而持续地被处理。这也意味着即使首次或之后的每次使用都能只带来了少量的价值,但是只要数据被多次使用过,企业仍然可以对数据加以有效利用。数据的大小和沉寂不是大数据时代的重要标志,数据创新和数据掘金才是大数据时代重要的标志。
数据如何创新首要在于数据的重组,因为处于休眠状态的数据的价值只能通过与另一个截然不同的数据集结合才能释放出来。随着大数据的出现,数据的总和比部分更有价值,当我们完成数据的重组,其数据总和本身的价值比单个总和更大。比如将商家信息与电子地图相结合,微社交平台与传统的电子商务结合,移动平台与传统的销售相结合。这些应用都给了我们指导性意义,通过这种数据的重组,使得我们对数据更加亲和,能够更加简单地接触。
关键词:大数据 数据挖掘 营销
中图分类号:F49 文献标识码:A 文章编号:1007-9416(2015)030-0209-01
近几年,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。2012 年3 月,奥巴马公布了美国《大数据研究和发展计划》,标志着大数据已经成为国家战略,上升为国家意志。从硅谷到北京,大数据的话题传播迅速。
1 大数据时代
随着计算机技术全面融入社会生活,经过半个多世纪的发展,信息爆炸已经积累到了一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且其增长速度也在加快。最先经历信息爆炸的学科,如天文学和基因学,创造出了“大数据”这个概念。
1.1 大数据时代产生的背景
最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”大规模生产、分享和应用海量数据的时代之所以能够开启,源于信息科技的进步、互联网与云计算技术和物联网的发展。
(1)信息科技的进步。信息处理、信息存储和信息传递是信息科技的三个主要支撑,存储设备性价比不断提升、网络带宽的持续增加,为大数据的存储和传播提供了物质基础。
(2)互联网与云计算技术。互联网时代,电子商务、社交网络和移动通信产生了大量结构化和非结构化的数据,以云计算为基础的信息存储、分享和挖掘手段,可以便宜、有效地将这些大量、高速、多变化的终端数据存储下来,并随时进行分析与计算。互联网领域的公司最早重视数据资产的价值,他们从大数据中淘金,并且引领着大数据的发展趋势。
(3)物联网的发展。众所周知,物联网时代所创造的数据不是互联网时代所能比拟的,而且物联网的数据是异构的、多样性的、非结构和有噪声的,最显著的特点是是它的高增长率。大数据是物联网中的关键技术,物联网对大数据技术的要求更高,它的发展离不开大数据。
1.2 大数据与数据挖掘
Google、Amazon、Facebook、Twitter,这些称霸全球互联网的企业,它们的成功都具备一个共同的因素,就是收集分析海量的各种类型的数据,并能够快速获取影响未来的信息的能力。“购买了此商品的顾客还购买了这些商品”,这恐怕是世界上最广为人知的一种商品推荐系统了,而创造出这个系统的正是Amazon。Amazon 通过分析商品的购买记录、浏览历史记录等庞大的用户行为历史数据,并与行为模式相似的其他用户的历史数据进行对照,提供出最适合的商品推荐信息。Facebook 可以为用户提供类似“也许你还认识这些人”的提示,这种提示可以准确到令人恐怖的程度,而这正是对庞大的数据进行分析而得到的结果。这种以数据分析为核心的技术就是数据挖掘(data mining)。
从技术角度看,数据挖掘是从大量的、复杂的、不规则的、随机的、模糊的数据中获取隐含的、人们事先没有发觉的、有潜在价值的信息和知识的过程。从商业角度来说,数据挖掘是从庞大的数据库中抽取、转换、分析一些潜在规律和价值,从中获取辅助商业决策的关键信息和有用知识。大数据概念的提出,将为数据挖掘技术的发展和应用带来一个很大的机遇。
2 数据挖掘
数据挖掘旨在从大数据中提取隐藏的预测性信息,用便于理解和观察的方式反映给用户,作为决策的依据。
2.1 数据挖掘原理
数据挖掘又称为数据库中的知识发现(Knowledge Diseoveryin Databases,KDD),是一个从数据库或数据仓库中发现并抽取隐含的、明显未知的、具有潜在用处的信息的过程。数据挖掘一般流程主要包括三个阶段:数据准备、数据挖掘、结果解释和评价。在数据挖掘的处理过程中,数据挖掘分析方法是最为关键的。
(1)数据准备。数据准备是从海量数据源得到数据挖掘所用的数据,将数据集成到一起的过程。由于数据收集阶段得到的数据可能有一定的污染,即数据可能存在不一致,或有缺失数据、脏数据的存在,因此需通过数据整理,对数据进行清洗及预处理。
(2)数据挖掘。是数据挖掘中最关键的一步,使用智能的方法提取数据模式,例如决策树、分类和聚类、关联规则和神经网络等。首先决定要提取什么样的模型,然后选取相应的算法参数,分析数据从而得到可能形成知识的模式模型。
(3)结果解释和评价。数据挖掘后的结果需要转换成用户能够理解的规则或模式,并根据其是否对决策问题具有实际意义进行评价。
2.2 数据挖掘技术在营销中的应用
无差别的大众媒体营销已经无法满足零和的市场环境下的竞争要求。精准营销是企业现在及未来的发展方向,在精准营销领域,最常用的数据挖掘分析方法包括分类、聚类和关联三类。
(1)关联规则。挖掘关联规则就是发现存在于大量数据集中的关联性或相关性,例如空间关联挖掘出啤酒与尿布效应;时间关联挖掘出孕婴用品与家居装修关系;时间关联挖掘出调味品、纸巾与化妆品的消费等。
此外,关联规则发现也可用于序列模式发现。序列模式发现的侧重点在于分析数据项集在时间上或序列上的前后(因果)规律,可以看作是一种特定的关联规则。例如顾客在购买了打印机后在一段时间内是否会购买墨盒。
(2)分类分析。分类是假定数据库中的每个对象属于一个预先给定的类,从而将数据库中的数据分配到给定的类中。它属于预测性模型,例如在银行业,事先定义用户的信用状况分为两类:信用好和信用坏,对于一个信用状态未知的用户,如果需要确定其信用度,可以采用“决策树”法构建一个分类模型,决策树方法着眼于从一组无次序、无规则的客户数据库中推理出决策树表现形式的分类规则。决策树的非叶子节点均是客户的一些基本特征,叶子节点是客户分类标识,由根节点至上而下,到每个叶子节点,就生成了一条规则,由该决策树可以得到很多规则,构成了一个规则集合,从而进行数据分析。
(3)聚类分析。聚类是将物理或抽象对象的集合进行分组,然后组成为由类似或相似的对象组成的多个分类的分析过程,其目的就是通过相似的方法来收集数据分类。为品牌找客户,回答品牌“谁来卖”是精准营销首先要解决的问题,科学细分客户是解决这一问题的有效手段。聚类可以将目标客户分成多个类,同一个类中的客户有很大的相似性,表现在购买行为的高度一致,不同类间的客户有很大的相异性,表现在购买行为的截然不同。
3 结语
大数据时代背景下“数据成为资产”,数据挖掘技术作为支撑精准营销的重要手段,将它应用于营销行业的决策中,不仅拓展了数据挖掘技术的应用范围,而且大数据时代的数据挖掘技术可以帮助企业获得突破性回报。
参考文献
[1]维克托・迈尔―舍恩伯格;肯尼思・库克耶.大数据时代:生活、工作与思维的大变革[M].周涛译.杭州:浙江人民出版社,2013.
[2]王伟玲.大数据产业的战略价值研究与思考.技术经济与管理研究[J],2015(1).
[3]俞立平.大数据与大数据经济学[J].中国软科学,2013(7):177-183.
更要跨越“数据鸿沟”
云计算上,一个较为悲观的观点是,中国企业已经没有多少机会。由于云计算基础设施建设需要巨大的资金投入,长时间、大范围的部署和持续的更新维护,有足够的资源、实力去构建大规模云计算平台的企业并不多。
“当时我说,纵观全球,也不会有太多的公司有资格成为云平台的掌控者,如今看来,微软、亚马逊、谷歌等少数公司位于第一军团。”微软公司全球资深副总裁、微软亚太研发集团主席张亚勤博士说,到大数据阶段,大数据是信息化一个很重要的推动力。大数据就像黄金,它对于社会、企业和个人,都是一种核心的竞争力。
工业和信息化部软件司副司长陈英认为,大数据所蕴含的价值如今正在逐步释放,大数据的挖掘利用对提升政府管理职能和企业的决策能力、创新发展模式都将产生深远影响。发展我国的大数据产业对于推动经济由粗放型向集约型发展,加速经济发展转型会起到至关重要的作用。
陈英表示,目前发达国家已开始了大数据的战略部署,我国要加快这方面的探索,依托自主创新,掌握自主的大数据技术与装备,务实推动大数据产业发展。
目前国内相关企业正加快在这一领域的投入。中关村在大数据领域具有良好的发展潜力,技术发展被认为与美国硅谷同步,海量数据挖掘等技术处于国内领先地位,云基地内聚集了一批掌握大数据尖端技术的领先企业。目前,由企业、高校共同发起的中关村大数据产业联盟已经成立,以进一步加快中关村大数据产业生态环境的构建,力争引领未来大数据产业发展方向。同时,大数据产业已经纳入《中关村战略性新兴产业集群创新引领工程(20132015年)》,将开展大规模云运营服务和大数据挖掘服务。
去年末,陕西省西咸新区沣西新城规划了国内首家大数据处理与服务专业园区,目标是到2017年建成以西咸新区为核心的国家级大数据处理和服务产业集群。腾讯公司也在近日表示,将把下一代腾讯网打造成“大数据”时代的智慧门户。
“云计算和大数据的结合,将产生难以估量的影响。数据已经被认为是宝贵资源,任何一家有雄心、渴望获取洞察力的企业,都应及早制定大数据战略和方案。”张亚勤说,否则,所有的机会将被“数据鸿沟”所延宕。
大数据时代
对小企业意义非凡
对于原本就十分庞大的IT巨头来说,大数据是不是只是它们的机会?
来自百度的专家说,“拥有大数据的企业,它在数据的处理能力方面,肯定有先天的优势,但是在移动互联网,用户的要求是丰富多彩的。作为一家企业,哪怕你是百度这样的企业,也满足不了所有用户的要求。贴近社会、贴近用户这样的一些中小开发者,甚至是一些个体开发者,他们了解用户的需求,开发出丰富多彩、很多、很小的应用,有些是大公司想不到的。”
实际上,大数据的拥有者和第三方开发者之间可以有着很好的结合点。比如百度地图中的定位技术开放出去,第三方开发者可以调用这个技术,使其开发的应用功能更强大、更好地满足用户的需求。“可以这样讲,拥有大数据的企业,它对整个产业链的拉动应该发挥了更大的作用”。
对于那些拥有行业经验,并熟练掌握云计算开发和应用技能的小型企业,尤其是初创企业来说,则更是意义非凡。张亚勤说,最近几年,我们看到的一些明星初创公司,人员规模只在数十人,但对某个行业拥有深厚知识,并能通过云和大数据的技术手段,快速解决该行业的共性需求。在未来数年,这样的“小而美”、“快而精”的企业会越来越多,并做出有可能改变世界的颠覆性产品。
“现在最火的做数据分析的公司,都是小公司,十几个人、几十个人。”张亚勤介绍说,中关村有一个扶持小企业的微软“云加速器”项目,第一期大部分都是做消费者社交、手机的,到第二期,有2/3的公司是做大数据分析工具,石油、农业、企业社交、教育等各行各业都有。
专家认为,由于数据分散在各行各业,大数据时代可能不会出现“数据垄断”现象,但是要让数据真正发挥作用,需要数据的开放,甚至让数据可以像商品和货币一样互相交换流通。除了互联网领域,我国金融、电信、工商、交通卫生等行业已积累大量的数据资产,如何唤醒这些数据,是推动大数据在行业中应用的关键。
大数据时代
对依法管理互联网提出更高要求
大数据时代的来临,对依法管理互联网提出了更高的要求。
“当数据量越来越大,当个性化、隐私性的数据越来越多,怎样去使用这个数据,是很有争议性的。”张亚勤说。
由于相关的法律界限不清晰,有些企业可能会利用数据做一些让用户不高兴的事。对广大的网民而言,无论是电商、搜索还是微博等互联网服务商,尽管是对用户群体行为数据的挖掘,得出一些趋势性的报告,但如果这些报告被用来获取商业利益,依然有一种隐私被窥视的感觉。
最近有上千家公司写信抗议微软,缘于在最新版的微软IE浏览器中,增加了一个私密浏览的可选功能,用户在这一模式下用浏览器干了什么事,别人都无法看到。典型的应用就是当用户选择开启这个功能,如果浏览淘宝网,包括点击感兴趣的商品、下单、购买等,淘宝网都无法跟踪和搜集用户的一系列在线行为,也分析不到相关的数据信息。对那些不喜欢预先告知用户,直接进行后台数据抓取的互联网服务商来说,是非常不欢迎这个功能的。
与此同时,信息安全的问题仍然存在。张亚勤认为,大数据本身的一些安全性问题,实际上也正是云计算所具有的。服务器被黑客攻击之后,存储在云上的数据有可能包含着个人用户和企业用户的敏感信息,这些信息就可能会被黑客所利用,造成安全隐患。要解决大数据所带来的信息安全问题,需要更完善的法律,更清晰的商业规范,以及更好的奖惩制度。
1.从基于经验的管理转变到基于量化的管理是商业银行业务经营模式变化的重要特征。目前,国内外各大商业银行早已步入量化经营的时代,在开拓某一项新业务时,需要充分依据业务数据判断潜在市场的规模,在进行客户风险及价值的判断环节,要遵循严格的数据及规则构建科学的评价模型。如果没有足够的数据基础,业务开拓及管理的不确定性增大,风险也会增加。但同时,目前量化管理的特点是基于高度结构化、严格定义和大量清洗后的历史交易数据,更多是用于报告已经发生过的事情。因此,其利用的数据不够大,挖掘的程度不够深,应用的领域不够广。国外先进金融机构已意识到相关问题,开始应用海量的客户交易和行为等数据,基于新的数据分析技术支持经营管理。例如,美国银行构建的反洗钱模型、富国银行进行的交叉销售等。
2.在实施新资本协议过程中,数据的挑战贯穿整个过程。2012年,巴塞尔委员会“有效风险数据整合和风险报告的原则”,对新协议实施中数据的要求进行了概括总结。委员会指出,2009年金融危机的一个最重要教训,就是银行的IT和数据架构不足以支持金融风险管理的要求,很多银行无法及时、准确地在集团、跨业务条线、子公司间汇总风险暴露和风险集中度。因此,委员会明确要求银行高层治理结构中必须包括良好的数据整合能力,并采取措施建立一个良好的、有前瞻性的数据库,帮助银行及监管者预测未来可能发生的风险。基于此,各国银行业新协议实施的评估过程中,最重要的工作之一,就是评估该国商业银行的数据管理水平。2011年,我国银监会“监管统计数据质量管理良好标准”,确定了数据管理的15项原则、61条标准,要求建立定期评估工作机制,并将标准实施情况作为银行高级计量方法验收的重要条件。从银监会现场评估结果来看,我国银行业数据质量管理仍有较大提升空间,领先银行也仅处于“大体不符合”到“大体符合”的中间阶段。监管机构之所以对数据如此重视,主要有四个原因:一是高级计量模型对数据依赖性强,模型越精细,数据质量对模型结果准确性的影响就越大;二是数据质量的高低直接关系到资本计量的准确性,进而影响风险管理、监管的有效性;三是随着风险管理量化水平的提高,需要采集、处理的风险管理基础数据范围越来越大;四是委员会强调监管者和银行具有对风险的预测能力,现有的数据、计量体系离这个要求差距较大。
3.大数据契合新资本协议实施对数据的要求。新资本协议实施的本质是提升资本对风险的敏感程度,要求银行能够准确地识别、度量风险,并将计量结果贯穿到业务经营管理的全流程之中。从资本协议发展的历程看,BaselI作为标准法体系,仅在风险资产的标准分类基础上赋予统一的权重,而BaselII则更加依赖对客户PD、债项LGD/EAD等风险参数的估计,在风险度量方面向前走了一大步。新资本协议的实施及标准的不断提升,表面上是针对资本充足率,使用更高级的方法有助于节约资本,但这不是实施新协议的主要目的,其根本目的是建立完整的风险识别、度量、预测和管理体系,进而通过资本覆盖非预期损失。从目前我国商业银行实施资本计量高级方法的情况看,主要存在三方面的数据问题:一是数据范围不够,很多数据尚未得到有效利用。目前资本计量高级方法中主要依赖的数据是客户财务信息、交易数据、区域及行业数据、宏观经济数据,客户的定性变量。这些数据往往是依据设计好的表单结构进行采集,数据大多是静态的、滞后的,而大量的客户行为数据,例如客户的网点交易记录、客户访问记录、通话记录等,都没有得到有效考虑,相比而言这些数据虽然价值密度低,但代表了客户的具体想法和行为,反映了客户要做的事情和所需的服务;二是数据质量不高。由于我国商业银行业务数据积累历史较短,信息化程度较低等原因,数据短缺、奇异值较多、时间长度不够等问题普遍存在,因此在资本计量模型建设过程中,由于要遵循一定的准则和假设,需要进行大量的数据清洗,并基于业务合理性的判断进一步筛选,在这个过程中被动损失了很多数据和变量;三是商业银行跨业务领域、跨子公司间相关数据未得到有效整合,也对风险计量的准确性及风险识别的时效性产生一定影响,例如,通过对小企业主的信用卡交易情况与所属企业贷款的关联性分析可以发现,在企业贷款违约之前,往往存在企业主信用卡严重的透支情况,而这些风险特征的发现,均需要各业务领域、子公司间数据的高度融合和关联。因此,采用大数据技术可以很好的解决上述问题,并能够从看似没有任何规律的数据中挖掘出风险特征和潜在的风险点。
二、大数据是商业银行零售业务量化经营变革的重要机遇
大数据产生于新一代信息技术融合发展过程,是新一代信息技术中最有颠覆性的变革力量。就如《第三次浪潮》作者托夫勒所说:“如果说IBM主机拉开了信息化革命的大幕,那么大数据则是第三次浪潮的华彩乐章”。
1.零售业务是商业银行最能体现大数据优势的领域。未来银行业的竞争将集中在对客户相关数据的收集和分析环节,银行需要成功地通过各种渠道收集客户数据,精确分析客户的意愿,为客户提供个性化服务。大数据技术必将成为银行实现一体化客户关系管理,有效增强自身盈利能力的有力工具和核心竞争力。从商业银行业务经营的情况看,零售业务由于需要面对成千上亿的客户,涉及存款、贷款、汇款、理财等方方面面业务,例如,仅信用卡交易类数据,一天的数据量就有近百万笔,而其又会衍变出大量的消费习惯、投资偏好、日常生活规律等消费信息。因此其涵盖的数据和信息是十分巨大的,可以从中挖掘出很多有规律、有价值的信息,是最能体现出大数据优势的业务领域。就如国外学者所言:“未来属于能将数据转化成产品的人或公司”。因此,哪家商业银行能够领先一步,积极探索大数据技术在零售业务领域的应用,就必然能在日后的业务竞争中取得先机。
2.大数据技术可以应用于零售业务的全生命周期领域。在产品设计阶段,可以通过对群体客户的行为特征进行分析。一是可以综合分析多种服务交付渠道,包括网点、网络、移动终端等的大量客户行为数据,建立预测分析模型,发现客户行为模式,提高客户服务价值;二是构建客户理财洞悉渠道,采用移动理财收集的数据能对不同地域的花销和节约习惯等方面形成深刻洞悉,制定差异化的理财产品和营销方式。在客户营销阶段,可以利用其每月的存款额和支用额反映客户不同的收入特征,再结合其网页浏览记录、信用卡消费记录、投资记录等,就能很好地把握其消费习惯和风险偏好,为其制定个性化的产品配置和服务。在贷款申请阶段,可以利用其收入、学历、消费习惯等特征,在较短的时间内预测业务发展趋势、客户信用变动等情况,支持业务审批。在贷后预警及反欺诈阶段,可以对现在的银行交易记录包括非直接交易的数据,如邮件、语音、视频等进行处理、分析,构建客户行为档案,收集该客户的基本信息以及所有历史交易信息,进行特征的分析与归纳,通过比对本次交易信息和历史行为信息,找出正常和异常的信息,实现实时侦测功能。
3.各种硬件、软件设施的快速发展能够支持大数据在零售业务领域的有效应用。随着信息传输、储存技术的迅速发展以及物联网技术的逐步应用,成千上万的网络传感器、二维码、视频采集器等设备嵌入到现实世界中,产生了大量的实时信息和机读数据。同时,云计算技术的逐步成熟,将为物联网等信息获取端产生的海量数据提供巨大的存储空间,并能够利用超级计算机进行高效化、智能化和多元化的计算、分析,使在线处理、实时处理变为可能。随着各类数据呈现爆炸式增长,商业银行不应再满足于简单的数据处理,而应该通过各种新技术、新设备进行数据分析,把握未来发展的规律,使相关部门做出更好的决策。因此,大数据可以让零售业务的海量数据产生价值、并让数据真正成为商业银行宝贵的资产资源。
4.不同产业领域已进行的大数据实践,为商业银行大数据应用提供了丰富经验。大数据不仅给信息处理技术、软硬件开发等方面的企业带来新的发展机会,还对医疗、零售、金融、制造、能源等领域的发展带来新的冲击,直接推动这些领域的产业升级。大数据分析已在不同领域得到了广泛应用,美国总统奥巴马竞选时就拥有一个几十人的数据分析与挖掘团队,进行大规模、深入的数据挖掘,帮助奥巴马在获取有效选民、投放广告、募集资金方面提高工作的有效性,就像奥巴马成功竞选后媒体指出的那样:华盛顿那些基于直觉与经验决策的竞选人士的优势在急剧下降,取而代之的是数量分析专家与电脑程序员的工作,他们可以在大数据中获取洞察。在公共卫生领域,2009年GOOGLE利用特定检索词的使用频率及流感在时间和空间上传播间的关系,在不需要知道搜索词和流感间的关系,也不需要医生确认的情况下,纯粹依赖于大数据处理了4.5亿个不同的数字模型,最终发现一个由45条检索词组合构成的数学模型,其预测能力高达97%,与疾控中心的统计数据相比,时效性大大提前。在投资领域,GOOGLE日本公司基于用户的搜索词,将大数据技术应用于实时预测股价走势。其利用搜索关键词和股价实时信息,构建了数万个数学模型,从中发现最可能的模式,用于预测未来股价变动情况。一些对冲基金(如DerwentCapital和MarketPsych)通过分析微博的文本数据,寻找股市投资信号。现在,微博中的信息甚至被用于预测好莱坞的票房收入。在保险领域,不同于传统保险行业将数据分析集中于保单、被保险人、服务提供商、人、保险利益、产品、核保和销售卖点、理赔、市场营销等领域,保险公司开始尝试引入先进的数据记录系统,将汽车加速计、刹车频率和力度、每次行使里程和驾驶时间、驾驶位置、安全带使用情况等纳入分析,以求更准确地预测保险人行为,合理计算不同保险人的保费。目前,国际大型金融机构已开始逐步尝试在零售业务领域进行大数据技术的应用,积极向强调“基于数据(事实)”的方向前进。例如,在风险管理领域,过去商业银行可能要花费几个小时(甚至几天)才能分析出相关数据特征,输出风险管理报告,而通过整合多渠道(如分支行、网络、移动终端、外部数据库等)的海量数据,利用大数据分析技术,能实时得出相关趋势特征,显著提高风险报告的获取速度,预测风险事件的发生。
5.各大商业银行已逐步尝试进行大数据分析及业务应用。随着大数据技术的逐步成熟,各大商业银行已开始逐步利用大数据技术进行风险管理、客户营销等方面的业务活动。例如,花旗银行利用大数据分析获取客户信息,并且分析预测客户的下一步需求,进而向客户营销相关金融产品,如某客户为自己的孩子办理了一张信用卡,其后花旗银行根据此信用卡的消费情况、还款情况以及持卡人的各种金融产品消费行为,再结合持卡人的不同年龄及职业,提前预判分析出这位客户可能需要的金融产品,达到有效的精准营销。目前,国内各大商业银行也逐步尝试利用大数据技术进行相关业务的拓展活动。如建设银行利用客户业务数据,将客户划分为长期负债族、活跃结算族、基本需求族等八类客户群,然后根据客户的金融产品购买行为、宏观市场因素、客户生命周期等变化因素,进行更加准确的目标客户筛选,同时其由专业的业务和数据分析人员适时调整和修正客户划分的数据模型,从而进一步提高客户营销的精准性。营销结果显示,通过系统筛选的客户产品购买意向达成率是随机抽取客户的1.5倍,实际购买率是随机抽取客户的6倍。
三、我国商业银行适应大数据时代的行动
1.高度重视大数据带来的机遇和挑战,树立基于数据的量化管理理念。商业银行各级管理层要充分意识到大数据发展的特征和趋势,采取措施加强数据管理和应用水平,推动全行各级机构和部门数据分析能力的提升。
2.高度重视各种数据的积累。大数据时代的数据包含了方方面面的属性信息,可以理解为“信息即数据”。因此,商业银行除了要积累各种传统意义上的经营交易数据外,还要重视其它类型的非结构化数据积累,例如网点交易记录、电子渠道交易记录、网页浏览记录、外部数据等,都应得到有效的采集、积累和应用。
3.强化对制度等文本数据的标准化。每一家商业银行的各级机构均有大量的制度、流程和规定等文本数据,但尚未进行有效组织。因此,要按一定的分类标准对之进行梳理,使之与其它数据得到有效整合,有利于数据挖掘工作的开展。
4.积极搭建大数据技术应用的各种资源条件。在现有数据库基础上,积极探索引进适应大数据要求的分析平台和工具,培养大数据分析人才,建立适应管理要求的数据分析管理机制。