首页 > 文章中心 > 网络舆情监测解决方案

网络舆情监测解决方案

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇网络舆情监测解决方案范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

网络舆情监测解决方案

网络舆情监测解决方案范文第1篇

舆情评论,是舆情研究和新闻评论的某种结合,它的诞生与发展和舆情对中国社会发展产生的日益深刻的影响密切相关。舆情是由个人以及各种社会群体构成的公众,在一定的历史阶段和社会空间内,对自己关心或与自身利益紧密相关的各种公共事务所持有的多种情绪、意愿、态度和意见交织的总和。①如何在纷繁复杂的舆情呈现中找出民意焦点诉求,将多元化的个体性智慧更好地筛选、收集,形成合力并为政府施政提供借鉴,则是舆情研究的关键。

新闻评论的功能,在西方一言以蔽之是“为受众服务”,在我国则把“用正确的舆论引导人”作为根本任务和最大追求。舆情评论的立场离不开对评论基本功能的坚守,同时又暗含对评论功能的进一步细化。它要求评论作者一方面掌握新闻媒体的特点及读者的新闻消费需求,进而在浩瀚的新闻信息里,准确发现公众诉求;另一方面,又要具有政治、经济、历史、法律、社会、哲学、环保等专业领域的积累,从专业的角度来解读公共政策。

南方日报“麦牙堂”时评专栏在“开篇语”中说道:“在互联网影响力日益扩大的今天,各级党政机关越来越重视对网上舆情的监测、研究和引导。南方日报与暨南大学舆情研究中心拟共同打造‘麦牙堂’专栏,作为政府社会治理与建设效果的参照系之一。”以舆情为观察点,呈现舆情整体态势,挖掘舆情焦点诉求,分析影响舆情走势的本质因素,在此基础上结合舆情中的合理智慧以及作者本身的学识积累,为舆情建设提供智慧,正是舆情评论应有的立场。

舆情评论的选题

从深圳八毛门事件、公务员擦鞋事件,到广州地铁故障回应风波、珠三角用工荒现象,再到广东省掀起的网络问政、网络反腐热潮,南方日报“麦牙堂”专栏每次选题无一脱离“广东”这一事发空间。此外,新闻事实的重要性——关系公共利益、国计民生;时新性——“麦牙堂”是周末专栏,一般以本周发生的事为评点对象;冲突性——舆情倾向与公共决策导向不符,政府、媒体的舆情建设初衷与效果冲突,舆情本身存在的正反两方面或多元化倾向不利于社会良性发展;网络性——舆情发端、发酵于网络,通过网络广泛传播并逐渐影响到社会现实,均是“麦牙堂”在选题时主要考虑的因素。

在以上主要选题标准下,“麦牙堂”的选题类型可总结为新闻事件、公共话题、热点现象三种。

新闻事件,指已经成为新闻的事件,即当前社会中已经被各种媒体报道或传播的新近发生的事实。往往由连续的单个新闻事件组成,通过连续的、立体化的事件性新闻还原事件的整体面貌和来龙去脉,展现社会事件的真实状态和矛盾构成。②这一类型在“麦牙堂”专栏中最为常见。如《地方民意缺席,暗合公众偏见》,以深圳公务员上街为市民擦鞋引发的一系列新闻事件为案例,包括该志愿活动中刻意强调公务员身份的诸多细节、深圳方面对舆情反应的后续回应、媒体对事件的报道缺乏客观调查和现场还原等,从中梳理如何疏导舆情的智慧。

公共话题,是指一定范围内为人们所广泛知晓、关注和热议,并与社会公众利益紧密相关的话题。对公共话题的评点较为强调舆论传播研究。《舆论喧嚣后的一场“误伤”》围绕“房婶”这一话题,通过对身处舆论场中的政府、媒体、房婶个人、普通公众各方的舆情表态、心理、利益诉求的分析,系统阐释“房婶”这一话题如何得以构建,以从中找到舆情疏导的突破口。

热点现象,可分为社会存在和社会意识两个基本方面。社会存在和社会意识发展中的问题和矛盾经公众关注、讨论之后,往往上升为种种社会热点现象。③在舆情选题的三大基本类型中,热点现象是从不同的社会科学视角,描述和概括社会发展中亟待认清和解决的热点问题。不同于单独的新闻事件,热点现象一般是一系列事件所体现出来的。而和强调舆论传播研究的公共话题相比,热点现象更强调了舆情监测与分析人员善于发现社会问题、分析社会问题、研判舆情走势和研究应对方案的主动性和科学性。《网络问政期待“制度化力量”加入》,围绕网络问政这一热点现象,结合对地级市书记、市长开始在问政平台上实名回复网民,广东酝酿建设“省市一体化网上办事大厅”平台,地级市建立个性化的地方“网络问政门户”,汕尾市陆河县非法砖厂经网友多渠道发帖投诉后被取缔又再次“复活”等系列事件的分析,为如何实现网络问政制度化提出科学化建议。

舆情评论的论证方式

所谓论证就是把材料和观点统一起来,组成一个完整的说理体系的过程,也就是摆事实、讲道理,分析问题的过程。论证是新闻评论写作的重要环节之一,评论如何展开,论点如何得到阐释,文章结构如何安排,如何把自己的观点论述得无懈可击、令人信服,都要靠严密充分的论证来实现。④

“麦牙堂”评论的论证方式较为灵活。常见的两种论证方式,一是遵循“舆情整体趋势及其热议焦点、原因分析、处置建议”的论证方式,二是针对某一问题直接亮出观点,继而用材料层层加以证明的论证方式。前者的逻辑是从事实的呈现中寻找解决问题的方法,后者则是“说服”的理念——“我这样说是对的,我拿证据来说服你。”文无定法,无论选择何种论证方式,关于舆情的整体态势的研判、舆情关注焦点、影响舆情走势的原因、舆情建设的建议等几大核心问题都会融合其中,这是“麦牙堂”舆情评论的主要论证逻辑。

其论证严密性则主要体现在:

围绕一个中心,聚焦论证。《用工荒中应有不慌智慧》,集中论证广东面对用工荒难题,如何做到“不慌”——媒体、政府应有效引导舆论,疏导舆情;《科学决策需要听取民意更要争取民意》,集中论证公共决策中如何在听取民意的基础上争取民意,论证争取民意的必要性与可行性;《媒体舆论未成合力,供暖议题难产智慧》,直指媒体未能充分发挥“社会协调者”功能,致使“议题”缺乏黏性与合力,难以产生公共智慧。

材料与观点紧密结合。对舆情的宏观基本面及其关注焦点的研判,并非出自作者主观臆造,而是建立在客观的舆情言论抽样统计、分析的基础之上;探寻影响舆情的本质因素,需要将孤立的舆情事件置于社会系统和矛盾运动的结构中深入思考,除了着眼舆情事件本身的细节,还需从相关、类似舆情案例中寻找佐证或启发;提供解决问题的方案,需要紧密结合舆情诉求,从中寻找智慧。此外,所提方案的可行性,又常需要历史的、类似的解决方案做支撑。

以理服人。以充分的事实、周密的论证、严谨又不失生动的表达,呈现真实的舆情面相,剖析舆情事件本质,寻求舆情建设的方法。说服他人的方式,靠循循善诱的说理过程,不靠简单的是非论断和“提要求”、“发命令”式的观点推销和灌输。

值得注意的是,从2011年8月创办以来,“麦牙堂”评论的论证方式处于不断探索、成长之中。从最初百字以内的舆情点评,到千字文的舆情评论,再到“新闻报道+舆情评论”专题打造,其舆情评论的中心论点越发聚焦、说理过程更加充分、舆情建设的建议更趋专业化。“麦牙堂”正在探索一种属于自己的论证风格,这也是舆情评论作为一种新生事物必然要经历的成长过程。

注释:

①刘毅:《网络舆情研究概论》[M],天津人民出版社,2007年版,第51~52页

②③人民网舆情监测室:《如何应对网络舆情》[M],新华出版社,2011年版,第41页,第44页

网络舆情监测解决方案范文第2篇

我国汽车市场从2015年增速明显放缓,逐渐进入供大于求的买方市场。品牌应该建立新的营销思维和策略,从而适应新的市场态势。在互联网新媒体的大环境下,品牌需要开始注重数字营销,加强品牌与社交媒体的互动沟通,塑造正面的品牌互联网形象。因此网络舆情管理变得日益复杂和重要,利用正面信息扩大宣传,遏制负面信息的蔓延,及时提出合理的令消费者满意的解决方案,这才能使得品牌在目标群体的选择里脱颖而出。本文将从最基本的信息抓取及初步的数据分析出发,阐述信息传播的广度及深度,以期在关于汽车产品缺陷舆情管理与分析中提供实践与参考。

目前舆情管理已经实现同时处理海量的互联网数据,常见的分析结果有产生的声量及趋势,数据源分析,热门话题分析,文本聚合分析,情感调性分析,用户画像分析及用户接受度分析等,从而能够对现实中有关品牌产品声誉和形象的网络舆论及时了解和迅速反馈,从而对其进行控制和改进,防范和减少品牌危机的发生。

大数据分析

定义关键词。信息量爆发式增长的大数据时代无疑对数据分析提出了更高层次的要求。我们必须快速地提取最需要的目标品牌相关信息,这就是定义关键词的意义所在,它有效地将我们面临的海量数据进行分类跟提取。我们需要对汽车产品的缺陷进行监测,首先需要对需监测汽车产品的故障进行分析汇总,通过对故障的判断以及围绕该缺陷的关键词云分析,提取最具有代表性的关键词组合。从汽车部分缺陷标签及建议关键词举例(见表1),我们可以看到,对于某些缺陷,我们需要不同的关键词组合来进行覆盖。例如,车内异味缺陷,根据消费者习惯用语及关键词频分析,我们需要用“品牌+车内+异味”,“品牌+车内+甲醛”,“品牌+车内+臭味”,“品牌+车内+有害气体”等来共同定义来实现相关信息的聚合。

数据的抓取。随着互联网行业的快速发展及传播媒介的不断翻新,我们需要明确目标数据在海量网络媒体的传播情况,从而以最快的速度抓取最相关的信息。在汽车产品缺陷分析里,我们对数据源的选择可以分为五个大类别:全国主流媒体覆盖:例如新浪网,网易网,凤凰网等,及重要汽车质量投诉网站:车质网,汽车产品缺陷中心,国家质检总局网站等;主要汽车垂直论坛:汽车之家,爱卡之家,易车,太平洋汽车等;微博:新浪微博;微信:公共账号;问答网站:百度知道,知乎,果壳等。数据的抓取立足于搜索引擎技术和文本挖掘信息技术,工具通过对数据源内容的自动采集和聚合分类。在本文的研究中我们选取某品牌乘用车2017年3月份部分缺陷信息在互联网上的传播情况。我们从产生的声量及趋势进行缺陷影响传播广度和深度分析。

数据的分析。在3月份中,通过定义关键词在覆盖范围内的数据源里,我们共抓取2239条关于该品牌异响的帖子,1772条烧机油相关的帖子,1573条断轴的帖子,1107条异味的原始帖子。从传播广度角度出发,我们可以看到关于异响的缺陷最为更多的消费者熟知,讨论得也更为广泛。我们进一步从产品来源进行分析(见图1),可以看出其中异响在垂直论坛讨论的最为集中,相反,断轴在微博上的传播是以蔓延的趋势呈现的。经过调查我们可以看出,该品牌的断轴事件在3月份有进行发酵,是因为有消费者群体集体维权的情况发生,才导致断轴在微博上占有大部分声量来源。

从传播深度出发,我们就要看信息与网民之间的互动,也就意味着将各个媒介平台的传播力指标数据标准化,比如阅读量,转发量,点击量,评论量及点赞量。

首先,我们可以看到,不同的媒介平台的传播力是不一样的,我们根据媒介的权威性,专业性,同时结合我们汽车产品缺陷监测的特殊需求,给出不同的权重指标。综合考虑传播力指标对我们缺陷信息传播影响力的不同,我们给出监测媒体的权重及不同传播力指标的互动权重(见表2)。从而得到评价事件媒体类别上传播深度的公式为:互动值=W*(求和(阅读量/转发量/点击量)*W1+求和(评论量/点赞量)*W2)。互动总值即将所有媒体类别的得分进行汇总。

在本文的研究中,我们选取的该品牌缺陷信息在主流媒体网站的互动量非常少,可以忽略不计,由此也发现网友更愿意在具有社交功能的平台进行进一步的沟通交流。经过计算我们得到其他各媒体平_的互动值(见表3),我们可以很明显地看出,微信跟汽车垂直论坛与其他两个平台的互动值差别特别大,可以看出目标群体已经把交互平台转移到了微信与汽车垂直论坛。而微博的角色更多的是成为公告板的信息获取地,问答论坛由于没有汽车垂直论坛的专业性和集中性,也在互动值中表现不佳。总体来看,烧机油的互动总值最高,车内异味的互动总值最低,说明烧机油问题对于消费者来说是更容易抱怨,更容易引起品牌反感的危机事件。这也就给品牌一个处理缺陷危机的很有价值性的参考。

当我们综合考虑传播广度与传播深度时,我们发现汽车异响与烧机油已经在大范围的目标群体引起了负面信息量的释放,这就需要品牌开始针对性的提出相关解决措施,从而挽回失去的消费者群体,重塑良好的品牌形象。

危机预警

在现实舆情环境中,我们不光需要监测已有的缺陷信息,也要快速地确认是否有新的舆情危机发生。我们会通过舆情评判体系对事件进行预判及分级,笔者通过多年的舆情监测经验,现总结日常危机预警流程如下(见图2):

网络舆情监测解决方案范文第3篇

>> 基于Flex的校园预警系统设计与实现 税收监控预警系统的设计与实现 面向区域协作的药品安全预警系统的设计与实现 基于Φ―OTDR技术的通信光缆险情定位与预警系统设计与实现 基于云架构的山洪灾害监测预警系统的设计与实现 基于EAI的企业风险预警系统的设计与实现 基于Android的水雨雪情实时监测预警系统的设计与实现 基于ARM/GSM/GPS智能醉驾预警系统的设计与实现 基于WebGIS的山洪地质灾害监测预警系统设计与实现 基于ICE的国资监管财务风险预警系统设计与实现 基于移动互联网的舆情预警系统设计与实现 基于ZigBee无线通信的车厢无线烟雾预警系统设计与实现 基于Web服务财务监管预警系统的设计与实现 探析网络的安全漏洞扫描技术与系统实现研究 铁路安全预警系统的研究与设计 Windows帮助系统的安全漏洞 基于Internet的系统安全漏洞分析与防护 铁路安全预警系统的研究和实现 基于B/S结构的岩溶区高速公路管控预警系统设计与实现 基于web网络的安全预警系统研究 常见问题解答 当前所在位置:,2013.

[3]赵培培.多种流行家用路由器中均出现严重安全漏洞[OL].http://.cn/security_zone/2013/ 0428/2157407.shtml,2013.

[4]肖冬梅.垂直搜索引擎研究[J].图书馆学研究,2003, 2:87-89.

网络舆情监测解决方案范文第4篇

【关键词】网络传播 移动化 视听化 数据化 网络舆论

一、互联网的发展趋势

1、移动化趋势进一步显现,移动互联网将成为主要的信息传播通道

首先,从通信技术来看,移动网络从3G向4G升级将真正开启移动互联网时代。3G技术的出现及使用,为移动互联网提供了良好的承载,但由于通信技术不够成熟、商业模式不清晰等原因,3G时代的移动互联网在中国并未迎来真正意义上的全面爆发。但4G网络获得了政府的高度重视并投入大量人力物力,未来4G网络将对下一代互联网形态产生深刻影响。4G网络最典型的特征是网络速度大幅度提高,能够以高达100Mbps的速度下载,在有高速传输网络的保障下,过去一直受到网速困扰的视频电话、手机电视等应用将获得解放,所有能够上网的业务,都将摆脱网速的限制,实现无线上网。

其次,从用户规模及用户习惯上看,用户逐渐向移动互联网迁移。首先,中国移动互联网用户规模增速明显,根据CNNIC的数据,通过手机上网的比例保持较快增速,从69.3%上升至74.5%。随着智能手机和平板电脑等移动终端市场竞争越来越激烈,终端价格不断降低,越来越多的用户开始通过移动互联网获取信息和通信交流。截止2012年12月底,我国手机网民规模为4.2亿,在整体网民中所占比例增长至74.5%,第一上网终端的比例更加稳固。智能手机上良好的视频、阅读体验,使得越来越多的用户从PC端向手机端转移,挤占电脑上网时间和传统媒体时间,互联网移动化的趋势势不可挡。

2、视频分享日益流行,移动视频将成为主要的传播内容

目前,手机视频和社交网站、微博和门户网站等其他网站的互动分享及应用合作极大推动了手机视频服务的发展。在美国,随着4G网络正式商用并积累了巨大的用户规模,手机视频分享APP随之崛起。成立于2010年的手机视频分享应用Viddy,用了18个月左右的时间便积累了4000万用户,公司市场估值10亿美元。在以Instagram为代表的图片社交取得巨大成功后,视频社交开始崭露头角。

其次,智能手机朝大屏幕高性能方向发展,提高了手机视频观看体验,促进了手机网民的使用。在三星公司Galaxy系列手机的引领下,大屏、多核及高分辨率逐渐成为手机的标配。笔者在中关村在线手机频道中搜索,手机屏幕在5.0寸及以上的手机,共有292款产品;屏幕分辨率在1280*720像素及以上的手机,共有237款;四核及以上手机,共有342款。2013年1月,华为在美国举办的电子消费展上推出了目前为止全球最大屏幕的智能手机——华为Ascend Mate配备6.1英寸高清大屏、四核1.5GHz处理器、4050mAh(典型值)超大容量电池。手机性能的高速发展,迅速缩小与台式电脑的差距,在未来甚至具备取代后者的可能。

最后,互联网解决方案提供商思科公司的预测数据也支持未来的移动世界,视频将成为主流的观点。思科在《视觉网络指数(VNI)》报告中预测,到2014年,移动视频数据流量将比2012年增长22倍,占所有移动数据流量的66%,而在2012年年底,这一数字仅为52%。可见,手机视频服务将在未来的发展中迎来春天。

3、网络传播数据化,移动互联网成为大数据的主战场

早在1996年,美国学者尼葛洛庞帝在《数字化生存》一书中提出,人类生存于一个虚拟的、数字化的活动空间,在这个空间里人们应用数字技术从事信息传播、交流、学习、工作等活动,这便是数字化生存。今天,全球互联网正以庞大的规模和数据流,昂首迈入“大数据”时代。在“大数据”时代,我们的行为、位置,甚至身体生理数据等每一点变化都成为可被记录和分析的数据。随着移动智能设备日趋普及,Android和iOS成为主流的移动设备操作系统,4G网络解决移动信息传输的带宽束缚,移动互联网将成为大数据应用的主战场。而移动化和社交服务的结合,将带来更多的用户数据,能更完整和更生动的去描绘了一个互联网用户的生活轨迹。对这些数据进行挖掘,不仅可以知道人们在过去干什么,现在正在干什么,还可以预测趋势,判断人们的喜好。

二、4G时代网络移动化、视频化、数据化对于网络舆情带来的深层影响

1、传播渠道移动化,信息从即时传播演变为实时传播,从大众传播发展为个人化传播

首先,信息传播发展成为实时化传播。移动化实现了信息对用户的全面包围,线上线下的概念开始变得模糊。在信息传播实时化的趋势下,随时随地的“公民报道”成为可能,正在深刻改变社会舆论的生成机制。通过手机等移动终端,实现对“突发事件”的现场直播,每个人都可以轻而易举地成为信息者。而移动传播同时融合了人际传播、大众传播以及群体传播三种特点,在一个社会议题引起关注后,信息迅速借助人际传播、大众传播和多级传播的模式扩散,导致越来越多的个人和组织加入对议题的讨论,引发大规模的群体互动。现阶段,种种社会问题使网络言论常显得十分尖锐,加之移动互联网让信息传递变得更加迅速,因此网络舆情监管的难度便大大增加了。

其次,信息传播从大众传播发展到个人化传播阶段,舆论非中心化特征更为明显。随着信息传播技术的日益成熟,“数字鸿沟”在移动互联网时代进一步消弭,用户参与信息生产与传播的门槛不断降低。以2012年8月23日正式上线的微信公众平台为例,微信公众平台是腾讯公司在微信的基础上新增的功能模块,通过这一平台,个人和企业都可以打造一个微信的公众账号,并实现和特定群体的文字、图片、语音的全方位沟通、互动。从用户的角度上来说,用户可以根据自身的兴趣爱好关注相关的微信公号,随后既可以被动地接受所关注公共账号的信息,也可以主动发出指令索取信息。同时,用户还可以自己创建微信公共账号,经营自己的媒体平台,在进行信息的采编后,推送给订阅用户。

2、视频化:视频更具冲击性,在社会化分享的情况下容易产生动员式传播,形成大规模群体互动

视频本身具有较高的真实性、冲击性以及现场感,更容易点燃社会情绪。美国教授山德尔(S.Shyam Sundar)实验也证实,视频同时使用声音和图像两个通道进行传播,同时刺激人的视觉和听觉,因而有可能得到最佳的传播效果。相比于文字或图片,视频的背景信息更为完整和立体,网民能够全方位、多角度地感知事件,导致大众对于议题的卷入程度更高,增加了议题的传播效果。在高速移动互联网传播下,视频可以像文字、图片一样快速传播,对政府的舆情控制将带来巨大挑战。借助影像的力量进行的视听传播,这种穿透力是语言、文字、声音、图片等等叠加起来也无法达到的。2011年的佛山“小悦悦事件”,视频中18个路人的冷漠刺激着公众神经,引发媒体的持续关注和社会各层面的强烈反应。

3、网络传播数据化,让网络行为管理和网络舆论管理结合,网络舆情具备更强的可预测性

目前的网络舆情研究主要集中在监测,主要是对一些显著性事件的舆情动态,包括传播范围、影响力等进行监测和研判,只知道事件发展的过去,不知道事件发展的未来。大数据的核心是预测,可以通过分析处理整群数据,而不再大量依赖随机采样,通过自然语言处理、模式识别以及机器学习等人工智能技术,结合人工经验,未来实验舆情的预警,研判未来舆情发展的态势和影响,并在此基础上实现超出人类经验范畴之外的精准化预测。

三、网络传播新形势下的网络舆情应对建议

1、实时化传播导致网络舆情危机应急时间大大缩短,政府针对事件的表态要迅速,但调查过程更要慎重。政府应保持一种开放态度,回应各种质疑。

2、视频化传播导致舆论监控难度加大,可以利用关键帧提取技术来抽取网络视频中的关键帧,建立相应的垃圾视频关键帧匹配库,通过视频关键帧匹配算法和模式,从高速的视频流中监测出不良信息。另外,在视频化传播时代,政府应主动融入这一潮流,转变思路。过去的“广播式新闻播送”思维已经无法满足广大受众的信息需求,政府要学会站在受众的角度,了解受众在互联网移动化、视频化下的信息消费习惯,主动抢占视频舆论阵地。

3、随着大数据时代的到来,网络舆情监测将不再仅限于网民话语表达的表层,而是转向更为深入的社会话语表达、社会关系呈现、社会心理描绘、社会诉求预测等。利用大数据挖掘技术,对互联网海量信息进行筛选、分析和总结,了解舆情现状,并预测趋势。

参考文献

①《CNNIC 第31次〈中国互联网络发展状况统计报告〉》,[EB/OL]2013-1

②喻国明、王斌、李彪等,《传播学研究:大数据时代的新范式》[J].《新闻记者》,2013(6):22-27

③马兵,《大数据时代舆情服务的机遇与挑战》[J].《中国记者》,2013(6):116-116

网络舆情监测解决方案范文第5篇

比格达塔是一家提供“大数据行业云服务解决方案”的公司,其名号来自英文“大数据”(big data)的音译。比格达塔针对新三板所开发了四套大数据平台系统,其中包含多套子系统,以满足新三板行业可能涉及的众多数据挖掘需求。这四套系统包括券商项目持续督导系统、拟挂牌公司的业务咨询系统、已上市公司在线监测系统以及新三板新闻集纳与线索发现系统等。通过这些系统,比格达塔能够重点关注企业的兼并、重组、关联交易及舆情等企业社会行为轨迹;这些数据在企业财报上可能并未体现,但对于投资者而言却至关重要。其他相关信息也包括在其中,如高管异动、司法诉讼、行政处罚、关联担保等。

据公开资料显示,比格达塔由德同资本、IDG创投及博信资本联合投资创立。工商注册资料显示,比格达塔的最大股东为北京汉鼎盛世咨询服务有限公司,认缴出资850万元,占比格达塔总股本的85%;自然人股东吕绍娟认缴出资150万元,占比格达塔总股本15%。

从云计算到云交易的大数据产业链条

比格达塔联合创始人兼首席专家杜登斌对于自己在大数据行业中深耕细作十分自信:尽管“大数据行业非常热”,但“近几年来,中国以云数据为核心做大数据行业应用的不多。”

比格达塔究竟拥有何种特色,足以让杜登斌针对巨头林立的大数据行业做出这样的表述?他解释道:“目前大家提到的‘大数据’基本上是云计算,其中主要是硬件:建产业园、买服务器、租用带宽,让用户储存数据。”而比格达塔的工作重心并不在此,在杜登斌所设想的服务路径中,“大数据应用是一个以云数据为中心的综合解决方案,集云计算、云数据、云服务和云交易为一体。云计算作为应用中的重要环节,它只是第一步,而大数据应用的核心是云数据,再往后是云服务,最后是云交易。”

在杜登斌的字典中,所谓“云计算”指的是硬件设备及一些基础的算法系统,“云数据”主要指数据采集,“云服务”是针对特定行业的数据挖掘和服务,而“云交易”则是基于数据可以买卖的原则,在数据市场中进行交易。这些听来有些与众不同的用词传达出了比格达塔在“大数据”应用行业中的上下游布局。

“云计算”硬件部分主要是做互联网数据中心(Internet Data Center, IDC),“主要靠存储备份和算法。”杜登斌对此着墨不多,他更关心服务链条中的云数据和云服务部分。

在杜登斌看来,大数据除了具体的技术性应用之外,还涉及到“思维方式”:大数据强调关联,数据的使用者并不关心数据的具体来源,大数据服务商需要通过技术采集和挖掘,整合分散在网络各处的资源,同时将数据中的关联关系分析出来,供用户使用。“十年前,当互联网上数据量并未达到一个量级时,大数据并不火热,近年来数据量开始膨胀,不仅考验大数据服务商的整合和架构能力,也考验其对于中文数据的采集和挖掘能力”,杜登斌向《融资中国》记者表示。

数据采集:定向垂直,小处切入

“要做大数据,有几个技术需要实现,其中一个就是采集技术。”杜登斌对于自己的数据采集――也就是数据服务链条中的“云数据”――颇为得意,其采集的内容不仅包括“网络论坛、贴吧、微博、公告年报的PDF文件”等公开信息,也包括“专利、信用系统,各省市工商税务登记资料”等需查询获取的半公开信息。“我们只采集信息公开的部分,隐私数据我们不做”,杜登斌说。

比格达塔的数据收集范围与通用搜索引擎有着很大的区别,“对于百度、谷歌就像在太平洋上撒网,一网下去把各种数据都收集起来,而我们则通过垂直定向的方式,看准一个行业猛扎下去,需要什么数据就收集什么数据。”同时,杜登斌也认为,通过垂直定向的数据收集方式,比格达塔避开了与搜索巨头们的直接竞争,“这样才有价值,大网收集你拼不过巨头们。”

杜登斌做出这样的判断是基于自己在人民在线的工作经历,他一直看好垂直定向的数据收集方式。杜登斌曾任人民在线副总裁,分管架构、技术和销售等工作。人民在线由人民网和《证券时报》合资成立,与专业监测、研究和处置网络舆情的人民网舆情监测室是“一班人马,两块牌子”。

现已与搜索合并的人民搜索上线于2010年6月,据杜登斌介绍,人民搜索在与中科院计算所合作的同时,也从人民在线抽调了部分技术骨干。杜登斌说自己预见到了人民搜索的发展前景:很难成功。原因很简单,尽管人民搜索资金充裕,能够大量购买服务器资源,快速采集数据,但“这些收集到的数据根本没用,数据量太大,人民搜索不具备挖掘、清晰和分析这些数据的经验和能力,特别是在系统应用和架构上没有想清楚,所以走通用搜索根本不可能。”对于人民搜索的发力方向,杜登斌坚持认为“从小处切入”的行业垂直搜索会比立刻上马通用搜索要有优势。

数据分析:如何从数据中“淘出金子”

比格达塔主要做社会化数据采集与挖掘,分析这些数据中所隐含的企业机构行为,其主要内容与万德、彭博等金融终端所提供的数据类型有很大的差异,这也是比格达塔与其他竞争对手的重要区隔。

当各式数据就绪,如何能从这些数据中“淘出金子”?杜登斌说,数据很庞杂,“有结构化数据、非结构化数据甚至是异构的数据”,因此挖掘数据中所蕴含的价值需要有一定的技术积累。杜登斌将比格达塔使用的技术命名为“分词矩阵”、“信息元矩阵”和“规则矩阵”,针对这些技术所能够获得的有用信息,杜登斌向《融资中国》记者表示,“这么多年来没有看到做得更好的。”

公开信息的获得没有门槛,比格达塔如何从中保持自身的竞争力?杜登斌表示,这涉及到数据的“预处理”阶段:这是大数据产生价值的过程中最为重要的一个环节。所谓“预处理”,指的是将各种结构化以及非结构化的数据从系统中导入到需要使用的系统中,统一数据格式和编码并对数据进行清洗,去除有误和无用的信息。

大数据领域公司的门槛较高,一方面要有足够的采集和挖掘能力,但仅仅有采集和挖掘能力还不够,这样获得的数据常常无法直接使用,这就需要对数据进行预处理。杜登斌表示,对数据预处理的大量人力和物力投入奠定了比格达塔在大数据领域的优势。以一条公开信息为例,比格达塔需要对其进行多维度分析,将非结构化的信息分解整理到结构化表格之中。此外,动态数据要实现实时可视化,这对于可视化的能力要求很高。再往后,需要大量的存储能力和实时的调取能力,“由于各种数据的类型不同,如果分库分错了,就不能满足实时分析的需要。”

杜登斌笑称,“大数据是一个环,每一个环节你都需要有所投入和积累,才能成为大数据应用的玩家。”

支撑智慧城市,深挖行业应用

“为什么有这么多人蜂拥去做云计算、做商业智能、做舆情?因为国内很少有公司能够将大数据所涉及的各个环节统统打通,他们大多或许只能做其中的一个环节。”这是杜登斌对于行业中竞争对手的看法。而各重点行业和智慧城市规划对于社会化大数据的需求,使得比格达塔面前的潜在市场一下子大了起来。

智慧城市作为国家支持的未来城市方向,成为各地争抢的“香馍馍”。目前193个城市获批成为试点,但智慧城市真正落地后是什么样子,各地都还在摸索。杜登斌认为,在这个过程中,缺乏必要的数据支撑是智慧城市构建面临的重要问题:一方面通用搜索引擎的数据过于杂乱,另一方面职能部门的数据又无法获取,“现在智慧城市的云平台很多是空的。”这就为比格达塔提供了向智慧城市提供服务的可能性。