前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇大数据技术范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
关键词:大数据 数据挖掘 营销
中图分类号:F49 文献标识码:A 文章编号:1007-9416(2015)030-0209-01
近几年,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。2012 年3 月,奥巴马公布了美国《大数据研究和发展计划》,标志着大数据已经成为国家战略,上升为国家意志。从硅谷到北京,大数据的话题传播迅速。
1 大数据时代
随着计算机技术全面融入社会生活,经过半个多世纪的发展,信息爆炸已经积累到了一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且其增长速度也在加快。最先经历信息爆炸的学科,如天文学和基因学,创造出了“大数据”这个概念。
1.1 大数据时代产生的背景
最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”大规模生产、分享和应用海量数据的时代之所以能够开启,源于信息科技的进步、互联网与云计算技术和物联网的发展。
(1)信息科技的进步。信息处理、信息存储和信息传递是信息科技的三个主要支撑,存储设备性价比不断提升、网络带宽的持续增加,为大数据的存储和传播提供了物质基础。
(2)互联网与云计算技术。互联网时代,电子商务、社交网络和移动通信产生了大量结构化和非结构化的数据,以云计算为基础的信息存储、分享和挖掘手段,可以便宜、有效地将这些大量、高速、多变化的终端数据存储下来,并随时进行分析与计算。互联网领域的公司最早重视数据资产的价值,他们从大数据中淘金,并且引领着大数据的发展趋势。
(3)物联网的发展。众所周知,物联网时代所创造的数据不是互联网时代所能比拟的,而且物联网的数据是异构的、多样性的、非结构和有噪声的,最显著的特点是是它的高增长率。大数据是物联网中的关键技术,物联网对大数据技术的要求更高,它的发展离不开大数据。
1.2 大数据与数据挖掘
Google、Amazon、Facebook、Twitter,这些称霸全球互联网的企业,它们的成功都具备一个共同的因素,就是收集分析海量的各种类型的数据,并能够快速获取影响未来的信息的能力。“购买了此商品的顾客还购买了这些商品”,这恐怕是世界上最广为人知的一种商品推荐系统了,而创造出这个系统的正是Amazon。Amazon 通过分析商品的购买记录、浏览历史记录等庞大的用户行为历史数据,并与行为模式相似的其他用户的历史数据进行对照,提供出最适合的商品推荐信息。Facebook 可以为用户提供类似“也许你还认识这些人”的提示,这种提示可以准确到令人恐怖的程度,而这正是对庞大的数据进行分析而得到的结果。这种以数据分析为核心的技术就是数据挖掘(data mining)。
从技术角度看,数据挖掘是从大量的、复杂的、不规则的、随机的、模糊的数据中获取隐含的、人们事先没有发觉的、有潜在价值的信息和知识的过程。从商业角度来说,数据挖掘是从庞大的数据库中抽取、转换、分析一些潜在规律和价值,从中获取辅助商业决策的关键信息和有用知识。大数据概念的提出,将为数据挖掘技术的发展和应用带来一个很大的机遇。
2 数据挖掘
数据挖掘旨在从大数据中提取隐藏的预测性信息,用便于理解和观察的方式反映给用户,作为决策的依据。
2.1 数据挖掘原理
数据挖掘又称为数据库中的知识发现(Knowledge Diseoveryin Databases,KDD),是一个从数据库或数据仓库中发现并抽取隐含的、明显未知的、具有潜在用处的信息的过程。数据挖掘一般流程主要包括三个阶段:数据准备、数据挖掘、结果解释和评价。在数据挖掘的处理过程中,数据挖掘分析方法是最为关键的。
(1)数据准备。数据准备是从海量数据源得到数据挖掘所用的数据,将数据集成到一起的过程。由于数据收集阶段得到的数据可能有一定的污染,即数据可能存在不一致,或有缺失数据、脏数据的存在,因此需通过数据整理,对数据进行清洗及预处理。
(2)数据挖掘。是数据挖掘中最关键的一步,使用智能的方法提取数据模式,例如决策树、分类和聚类、关联规则和神经网络等。首先决定要提取什么样的模型,然后选取相应的算法参数,分析数据从而得到可能形成知识的模式模型。
(3)结果解释和评价。数据挖掘后的结果需要转换成用户能够理解的规则或模式,并根据其是否对决策问题具有实际意义进行评价。
2.2 数据挖掘技术在营销中的应用
无差别的大众媒体营销已经无法满足零和的市场环境下的竞争要求。精准营销是企业现在及未来的发展方向,在精准营销领域,最常用的数据挖掘分析方法包括分类、聚类和关联三类。
(1)关联规则。挖掘关联规则就是发现存在于大量数据集中的关联性或相关性,例如空间关联挖掘出啤酒与尿布效应;时间关联挖掘出孕婴用品与家居装修关系;时间关联挖掘出调味品、纸巾与化妆品的消费等。
此外,关联规则发现也可用于序列模式发现。序列模式发现的侧重点在于分析数据项集在时间上或序列上的前后(因果)规律,可以看作是一种特定的关联规则。例如顾客在购买了打印机后在一段时间内是否会购买墨盒。
(2)分类分析。分类是假定数据库中的每个对象属于一个预先给定的类,从而将数据库中的数据分配到给定的类中。它属于预测性模型,例如在银行业,事先定义用户的信用状况分为两类:信用好和信用坏,对于一个信用状态未知的用户,如果需要确定其信用度,可以采用“决策树”法构建一个分类模型,决策树方法着眼于从一组无次序、无规则的客户数据库中推理出决策树表现形式的分类规则。决策树的非叶子节点均是客户的一些基本特征,叶子节点是客户分类标识,由根节点至上而下,到每个叶子节点,就生成了一条规则,由该决策树可以得到很多规则,构成了一个规则集合,从而进行数据分析。
(3)聚类分析。聚类是将物理或抽象对象的集合进行分组,然后组成为由类似或相似的对象组成的多个分类的分析过程,其目的就是通过相似的方法来收集数据分类。为品牌找客户,回答品牌“谁来卖”是精准营销首先要解决的问题,科学细分客户是解决这一问题的有效手段。聚类可以将目标客户分成多个类,同一个类中的客户有很大的相似性,表现在购买行为的高度一致,不同类间的客户有很大的相异性,表现在购买行为的截然不同。
3 结语
大数据时代背景下“数据成为资产”,数据挖掘技术作为支撑精准营销的重要手段,将它应用于营销行业的决策中,不仅拓展了数据挖掘技术的应用范围,而且大数据时代的数据挖掘技术可以帮助企业获得突破性回报。
参考文献
[1]维克托・迈尔―舍恩伯格;肯尼思・库克耶.大数据时代:生活、工作与思维的大变革[M].周涛译.杭州:浙江人民出版社,2013.
[2]王伟玲.大数据产业的战略价值研究与思考.技术经济与管理研究[J],2015(1).
[3]俞立平.大数据与大数据经济学[J].中国软科学,2013(7):177-183.
现状
“检察大数据”的概念厘定
“大数据”的生产与运用是一个“人人为我,我为人人”的互通、共享、多赢过程。检察机关在整合应用其他政府机构、企事业单位、社会组织提供的信息数据服务司法办案的同时,也在办案中生产“大数据”。这些数据既可作为检察机关校准后续办案的内部参照系,同时部分数据亦可对外输出服务社会。前者如在刑事检察中整合同类案件形成案例数据库,用以提升公诉量刑精准度,后者以当前检察机关向社会公众提供的行贿犯罪档案查询服务最为典型。显然作为数据运用者,检察机关“大数据”包括检察工作所涉及的一切有用信息数据。其中,相当一部分数据并非检察机关在司法办案中产出的“原生”数据。如职务犯罪侦查办案中反贪部门调用房产、银行、公安行政机关的信息数据库进行初查;相关业务部门在审查、出庭公诉、诉讼监督、参与社会治理等方面运用信息化、数字化新技术等。
“检察大数据”与上述检察机关运用的“大数据”有本质区别。“检察大数据”专指检察机关司法办案大数据,是检察机关在司法办案中的“原生”案件信息数据,其最核心的特征是相关数据是关于检察业务办案的信息数据。目前,在检察司法办案大数据的撷取、管理、应用方面,最高人民检察院推进的“统一业务应用系统”是国家层面“检察大数据”生成的最重要平台;同时各地检察机关亦多有创新,如北京市人民检察院开发应用的“检立方”系统、上海市闵行区人民检察院试运行的“检察官执法办案全程监控考核系统”、浦东新区人民检察院试运行的“综合管理信息平台一期”、湖北省人民检察院研发的“互联网检务办公室”,南京市鼓楼区人民检察院研发的办公办案软件“移动检务通”等。上述系统平台通过案件管理部门案件受理信息输入及办案人员在办案过程中的流程信息输入,生成、存储、管理与检察机关司法办案相关的各项信息数据,并通过对大数据不同子系统数据的深度分析,进而服务领导决策与司法办案。
当前检察工作中的大数据运用
无论是检察机关的“原生”大数据,还是第三方生成的关联大数据,在当前的检察办案与司法管理工作中都有着极为广阔的应用前景。作为检察机关大数据的核心内容,“原生”大数据即“检察大数据”,在辅助检察办案、服务司法管理中发挥着极为重要的作用。
在“检察大数据”辅助检察办案方面,目前较为典型的如贵州省人民检察机关的“大数据司法办案辅助系统”。司法办案辅助系统运用“实体识别”“数学建模”等大数据技术,通过绘制“犯罪构成知识”图谱,建立各罪名案件数学模型的司法办案辅助系统,为办案提供案件信息智能采集、“要素―证据”智能关联和风险预警、证据材料甄别,以及类案推送、量刑建议计算等智能化服务。目前,贵州省人民检察机关的大数据司法办案辅助系统已进行了三次迭代升级,正在贵州全省4个市(州)院和31个基层院试点运行。
在“检察大数据”服务司法管理方面,上海市闵行区人民检察院的检察官执法办案全程监控考核系统非常具有代表性。该院通过对各职能部门受理、立案(项)、办理的案件以及不依附于自侦、批捕、等主要办案业务的,有完整流程、审查结论及相关法律文书的诉讼监督、社会治理、维护稳定、预防犯罪等检察业务进行梳理,对检察建议、纠正违法等共性的检察业务指标进行归并,形成了较为规范的检察机关司法办案大数据目录和工作指标w系。通过对检察官在执法办案中产生的“原生”大数据的深度挖掘和研判分析,将案件统计、质量监控、专题研判、绩效分析有机融为一体,进而使办案监督管理者能够及时准确找出检察官在办案中存在的司法不规范问题,有效强化对司法办案的绩效考评与内部监控。
除了重视对“原生”大数据的收集整理与挖掘应用,如何发挥好“他山之石”的作用,在检察办案中运用好第三方关联大数据,也是大数据技术与检察办案深度融合的重要内容。除了上述在职务犯罪案件侦查中对房产、银行、公安行政机关等提供的关联数据的常规运用外,当前一些地方检察机关正在进行创新运用第三方大数据方面的积极探索。如江苏省无锡市锡山区人民检察院对接社会治理公共服务管理平台和民情APP,推出检察民情APP的创新做法。自对接平台以来,锡山区人民检察院已查阅近6000条民情信息,从海量数据中了解掌握群众诉求,立足检察职能,从中发现老百姓对征地拆迁、环境保护、社会保障等方面的民生需求,聚焦群众关注的热点民生问题深入挖掘职务犯罪案件线索、诉讼监督线索、执行监督线索及公益诉讼线索,使第三方大数据真正成为辅助检察办案,拓展监督案源的新渠道。
短板
检察大数据系统的提升点
目前,检察大数据系统在建设与应用方面存在的主要问题:
关键词:大数据;智能交通;数据技术
随着国民经济的不断发展,人们生活水平的不断提高,居民购买汽车能力加强。我国的汽车保有量随之增加,在一些大城市机动车拥有量以超过10%的速度加速,机动车成为每个家庭代步的交通工具,在有限的交通资源配置下,机动车的增加缩短了道路使用周期,城市主干道路超负荷使用,违法停车致使道路不能合理使用、行车不文明、乘车环境不良等现象有增无减。大数据时代,如何改善当前的交通状况是本文阐述的核心内容。文章从以下几个方面来阐述:大数据的现状、大数据的概述、大数据的应用、智能交通的需求、智能交通体系的建立、数据技术。
1 大数据的现状
据权威数据显示,大数据应用在我国还处在起步阶段。但在未来三年,通信、金融领域将在大数据市场突破100亿元。市场规模在2012年有望达到4.7亿元,到2013年增至11.2亿元,增长率高达138%,2014年,保持了与2013年基本持平的增速,增长率为114.38%,市场规模达到24.1亿元,未来三年内有望突破150亿元,2016年有望达到180亿规模。自从2014年以来,各界对大数据的诞生都备加关注,已渗透到各个领域:交通行业、医疗行业、生物技术、零售行业、电商、农牧业、个人位置服务等行业,由此也正在不断涌现大数据的新产品、新技术、新服务。
大数据行业“十三五”规划主要目标:在2020年,将大数据打造成为国民经济新兴支柱产业并在社会各领域广泛应用,推动我国大数据产业稳步快速发展,基本健全大数据产业体系,推动制定一批相关大数据的国标、行标和地方标准,引进具备大数据条件的企业,建设大数据产业孵化基地,提高全国信息化总体水平,以跻身世界先进水平。
2 大数据的概述
2.1 大数据定义
大数据即巨量数据集合,目前还没有一个统一的定义。大数据的概念最早是由全球著名的管理咨询公司麦肯锡提出,2011年Mckinsey研究称,大数据通常是指信息爆炸时代产生的海量数据,在各个行业和业务领域,数据已经渗透到行业中并逐渐成为重要的要素,人们能够从海量数据中挖掘出有用的数据并加以应用。对大数据定义的另一说法是利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集。
随着信息时代的高速发展,大数据已经成为社会生产力发展的又一推动力。大数据被称为是继云计算、物联网之后信息时代的又一大颠覆性的技术革命。大数据的数据量巨大,一般10TB规模左右,但在实际应用中,多个数据集放在一起,已经形成了PB级的数据量,甚至EB、ZB、TB的数据量。
2.2 大数据的特点
2.2.1 数据量巨大
数据量级别从TB级别跃升到PB级别。随着可穿戴设备、物联网和云计算、云存储等技术的发展,用户的每一个动作都可以被记录,由此每天产生大量的数据信息。据有关人士估算:1986~2007年,全球数据的存储能力每年提高23%,双向通信能力每年提高28%,通用计算能力每年提高58%;2007年,人类大约存储了超过300EB
的数据;到2013年,世界上存储的数据能达到约1.2ZB。
2.2.2 数据类型多样化
即数据类型繁多,产生了海量的新数据集,新数据集可以是关系数据库和数据仓库数据这样的结构化数据到半结构化数据和无结构数据,从静态的数据库到动态的数据流,从简单的数据对象到时间数据、生物序列数据、传感器数据、空间数据、超文本数据、多媒体数据、软件程序代码、Web数据和社会网络数据[1]。各种数据集不仅产生于组织内部运作的各个环节,也来自于组织外部。
2.2.3 数据的时效性高
所谓的数据时效性高指以实时数据处理、实时结果导向为特征的解决方案,数据的传输速度、响应、反应的速度不断加快。数据时效性为了去伪存真,采用非结构化数据剔除数据中无用的信息,而当前未有真正的解决方法,只能是人工承担其中的智能部分。有些专员负责数据分析问题并提出分析后的解决方案。
2.2.4 数据真实性低
即数据的质量。数据的高质量是大数据时代重要的关注点。但在生活中,“脏数据”无处不在,例如,一些低劣的伪冒产品被推上市场,由于营销手段的成功,加之其他因素的影响导致评分很高。但是这并不是真实的数据,如果对数据不加分析和鉴别而直接使用,即使计算的结果精度高,结果都是无意义的,因为数据本身就存在问题出现。
2.2.5 价值密度低
指随着物联网的广泛应用,信息巨大,信息感知存在于客观事物中,有很多不相关的信息。由于数据采集的不及时,数据样本不全面,数据可能不连续等等,数据可能会失真,但当数据量达到一定规模,可以通过更多的数据达到更真实全面的反馈。
2.3 大数据的应用
2.3.1 医疗大数据
利用大数据平台收集患者原先就医的病例和治疗方案,根据患者的体征,建立疾病数据库并对患者的病例分类数据库。一旦患者在哪个医院就医,凭着医保卡或就诊卡,医生就可以从疾病数据库中参考病人的疾病特征、所做的检查报告结果快速帮助患者确诊。同时拥有的数据也有利于医药行业开发出更符合治疗疾病的医疗器械和药物的研发。
2.3.2 传统农牧业大数据
因为传统农牧业主要依赖于天气、土壤、空气质量等客观因素,因此利用大数据可以收集客观因素的数据以及作物成熟度,甚至是设备和劳动力的成本及可用性方面的实时数据,能够帮助农民选择正确的播种时间、施肥和收割作物的决策。当农民遇到技术市场问题可以请教专业人员,专业人员根据实时数据做出科学的指导,制定合理的优化决策,降低农民的损失成本,提高产品的产量,从而为转向规模化经营打下良好基础。
2.3.3 舆情大数据
利用大数据技术收集民众诉求的数据,降低社会,有利管理犯罪行为。通过大数据收集在微博的寻找走失的亲人或提供可能被拐卖人口的信息,来帮助别人。
3 智能交通的需求
随着城市一体化的快速发展,新时代农民工涌入大城市,促使城市人口的增大不断给城市交通带来问题。究其原因主要有:一是机动车的迅猛发展导致城市主次干道的流量趋于饱和,大量机动车的通行和停放占据主干道路。二是城市交通的道路基础设施供给不平衡导致路网承担能力差。三是停车泊位数量不足导致机动车使用者不得不过多依赖道路停车。四是公共设施的公交车分担率不高导致交通运输效率降低。五是城市的土地开发利用与道路交通发展不均衡。六是行人和机动车主素质不文明导致道路通行效率降低。为此,智能交通的出现是改善当前城市交通的必要需求,能够在一定程度上有效的解决城市交通问题。
大数据是如何在智能交通的应用呢?可以从两个方面说明:一是对交通运行数据的收集。由于每天道路的通行机动车较多,能够产生较大的数据,数据的采集并发数高,利用大数据使机动车主更好的了解公路上的通行密度,有效合理对道路进行规划,可规定个别道路为单行线。其二是可以利用大数据来实现主干道根据道路的运行状况即时调度信号灯,提高已有线路运行能力,可以保障交通参与者的生命和提高有关部门的工作效率,降低成本。对于机动车主可以根据大数据随时的了解当前的交通状况和停车位数量。如果交通拥堵,车主则可选择另一路线,节约了车主的大量时间。
4 智能交通体系的建立
4.1 智能交通建立的框架
主要包括感知数据层、软件应用平台及分析预测和优化管理的应用。物理感知层主要是采集交通的运行状况和对交通数据的及时感知;软件应用平台主要整合每个感知终端的信息、将信息进行转换和处理,达到支撑分析并做出及时的预警措施。比如:对主要交通干进行规划,对频发交通事故进行监控。同时还应进行应用系统建设的优化管理。比如:对机动车进行智能诱导、智能停车。
智能交通系统需要在各道路主干道上安装高清摄像头,采用先进的视频监控、智能识别和信息技术手段,来增加可管理的维度,从空间的广度、时间的深度、范围的精细度来管理。整个系统的组成包括信息综合应用平台、信号控制系统、视频监控系统、智能卡口系统、电子警察系统、信息采集系统、信息系统。每个城市建立智能交通并进行联网,则会产生越来越多的视频监控数据、卡口电警数据、路况信息、管控信息、营运信息、GPS定位信息、射频识别信息等数据,每天产生的数据量将可以达到PB级别,并且呈现指数级的增长。
4.2 智能交通数据处理体系的构成
主要包括交通的数据输入、车辆信息、道路承载能力等的数据处理、数据存储、数据检索。其中交通数据输入可以是静态数据或者是动态数据。数据处理是针对实时数据的处理。数据主要存储的是每天采集的巨大数据量。为了从中获取有用的数据,则需要进行数据查询和检索,还要对数据进行规划。
5 大数据技术
5.1 数据采集与预处理
数据采集与预处理主要对交通领域全业态数据的立体采集与处理来支撑交通建设、管理、运行决策。采集的数据主要是车辆的实时通行数据,以实现实时监控、事先预测、及时预警,完成道路网流量的调配、控。这些数据获取可以采用安装的传感器、识别技术并完成对已接收数据的辨析、转换、抽取、清洗等操作。
5.2 数据存储与管理
大数据的存储与管理是把采集到的数据存放在存储器,并建立相应的数据库,如关系数据库、Not Only SQL即对关系型SQL数据系统的补充。利用数据库采用更简单的数据模型,并将元数据与应用数据分离,从而实现管理和调用。
5.3 数据分析与挖掘
数据分析及挖掘技术是大数据的核心技术。从海量数据中,提取隐含在其中,人们事先未知的,但又可能有用的信息和知识的过程。从复杂数据类型中挖掘,如文本、图片、视频、音频。该技术主要从数据中自动地抽取模式、关联、变化、异常和有意义的结构,可以预测模型、机器学习、建模仿真。从而实现一些高级别数据分析的需求。
5.4 数据展现与应用
数据技术能够将每天所产生的大量数据从中挖掘出有用的数据,应用到各个领域有需要的地方以提高运行效率。
6 结束语
大数据时代,能对智能交通信息资源进行优化配置,能够改善传统的交通问题。对非机动车主而言,利用大数据可以更好的规划线路,更好的了解交通状况,在一定程度上可以对问题预先提出解决方案,起到节省大量时间、额外的开支。同时对交管部门而言,能够在限的警力情况下合理配置人员资源和交通设备,主干道路在高峰期出现的问题能够合理利用大数据信息配置资源,在刑事案件侦查中也能发挥更重要的作用。
全国要实现智能交通的联网,依然有问题需要突破,这都是大数据的数据技术应用所在。
关键词:电力运营 数据处理 资源整合
中图分类号: TP311 文献标识码:A 文章编号1672-3791(2016)07(b)-0000-00
通过对电力系统动态性和实时性监测可以掌握大量的实时数据,它是电力系统动态运行的具体体现,但这也严重制约了电力系统的长期发展。现代电力运营监测员应充分利用电力运营监测平台,提升系统数据利用率,建立以供电部门基础数据处理,做好各项数据的衔接、处理,协同各部门协同问题,促进国家电网数据系统的高效运转。
1大数据时代相关内容概述
1.1大数据时代整体发展形势
从我国互联网技术的快速发展,各行业企业在大数据时代中均积累了大量的经营数据,它决定了企业的长期健康发展。为了更好的完成我国电力企业在大数据时代下的发展任务,本文笔者主要从以下四方面进行了大数据时展形势加以概括,进一步实现对电力企业数据共享,实现多种资源的优化整合:
一,促进电力各部门数据的优化整合与共享,提升企业各种资源的整体利用率;二,加快电力数据资源开放力度,扩大资源利用面;三,进行大数据基础设施的统筹规划,提升数据资源利用的合理性;四,构建科学的宏观调控数据体系,进一步实现电力运营监控的宏观调控。
1.2充分发挥大数据平台业务优势,进行管理短板定位
综合考量电力运营业务流程绩效指标,对业务流程整体执行效率进行综合评价;进行执行效率较低业务流程环节的准确定位,全面分析业务流程设计的科学性与合理性,并提出综合性流程改进建议;我们应当在整体业务流程绩效指标和详细数据的基础上,作出有关于业务流程制度、岗位绩效、职责及标准的整体改进意见和建议;提升各部门、不同业务之间的协同性,进行管理短板的准确定位。
1.3加强数据资源安全保障
数据资源的有效利用离不开数据体系的健全和完善,它是加强大数据环境网络技术研究和安全的关键,只有构建大数据时代下的电力运营监测安全评估体系,才能够使企业在大数据安全基础上,提升电力运营监测和预警工作质量,提升电力企业服务水平。
2做好大数据时代电力运营监测系统数据处理
2.1监测数据类型
电力运营监测数据类型主要分为基础型数据、电力企业运营数据以及电力企业管理数据几种,基础型数据是以电力企业生产数据为主,它包含了电压稳定性、发电量、电能质量等,业务部门和业务系统要确保基础数据的完整性和准确性;电力企业运营数据指的是电力企业在生产过程中所产生的数据,通过对上述数据进行分析、处理,它能够为公司整体运营决策指明方向。电力企业管理数据仅限于特定环境下的共享和使用,它主要指协同办公、ERP及一体化平台等方面数据,做好该方面数据分析、处理有利于推进各部门工作的开展。
2.2监测移动数据处理
针对运营监测信息支撑系统来讲,异动产生、处理、统计是异动管理的主要内容,异动类型又可分为数据质量异动、接口异动和数据质量异动三种,业务异动就是通过业务数据分析出生产运营情况,业务异动又可详细划分为指标异动、流程异动和明细数据异动;而数据质量异动就是要分析出接入数据的准确性、完整性和及时性,并作出相关异动数据信息分析、处理。接口异动就是因接口问题产生的异动情况。
3.大数据时代下电力运营监控数据应用
3.1电力生产环节中大数据的具体应用
由于电力系统管理项目众多,想要单纯依靠人力来完成数据的分析和整体难度极大,只有充分利用现代化信息技术手段和多种业务模型才能够不断提升输电线路可靠性和在线计算输送功率,更好的完成电力生产相关技术指标,促进电压质量管理工作的发展。常态化低电压监测有利于实现用户和低电压电台之间的协同合作,实现对低电压运行情况的跟踪治理。因此,电力系统相关部门应在大数据环境下,按期做好停复电监测和电压质量分析报告。
3.2大数据在电力系统营销中的具体应用
远程视频技术应用能够帮助电力运营工作人员进行相关业务的巡查,是运营监测中心针对高压电力作业实施的重要举措。通过远程视频技术的帮助能够极大的缩短营业窗口情况的巡视,进一步提升电力营业窗口整体服务质量,降低用户投诉率,提升电力用户的满意度。积极开展工业电量预测,更好的满足用电需求管理,促进用电系统稽查监控业务,更好的挖掘线损治理工作成效挖掘及典型案例提炼。
3.3大数据在电力检修中的具体应用
电力系统运营中心通过大数据运营监控平台的利用,充分实现了对电网设备运维、资产寿命周期以及资金收支等情况,并将其上报于上级在线监测分析系统中,保证电网系统的正常稳定运行,进一步完成电网设备运维绩效分析。我们应当综合利用大数据时代数据挖掘手段,做好电网生产运营过程中的操作票、工作票及缺陷记录等相关明细的分析和静态数据流程匹配工作,做好配电网络设备的日常巡视、检修处理等工作,促进各部门之间的协同,提升电网运维管理工作发展,尽早发现电网运营过程中存在的不足,全面掌握巡视、检修、缺陷发现等流程绩效分析,做好各环节定量诊断调度和检修,进一步实现电网系统的纵向贯通和横向协同,不断提升我国电网运维管理水平。据相关数据统计,我国大数据时代下电力运营监控线路消缺原因、消缺时长如下图1所示:
4结束语
经上述分析,我们可以了解到数据信息维护、处理对于电力自动化系统运用意义重大,只有充分利用大数据时代所带来的数据分析、处理、应用方面的优势,做好不同数据类型的准备工作,进行电力自动化系统数据准确性、快速性整合,采用科学合理的策略指导,促进大数据时代电力系统数据的长期可持续发展。
参考文献
[1]崔希广;高速公路电力自动化系统信息平台的研究与应用[J];科协论坛(下半月);2012年10期
关键词:大数据;云计算;智能电网;数据集成;数据分析;数据处理;数据展现
一、智能电网、云计算和大数据的关系
(一)智能电网与大数据的关系
智能电网的理念是通过获取用户如何用电、怎样用电的信息,来优化电的生产、分配及消耗,利用现代网络、通信和信息技术进行信息海量交互,来实现电网设备间信息交换,并自动完成信息采集、测量、控制、保护、计量和监测等基本功能,可根据需要支持电网实时自动化控制、智能调节、在线分析决策和协同互动等高级功能。可以抽象的认为,智能电网就是大数据这个概念在电力行业中的应用。
(二)大数据与云计算的关系
云计算是一种利用互联网实现随时、随地、按需、便捷地访问共享资源池(如计算设施、应用程序、存储设备等)的计算模式。大数据根植于云计算,云计算的数据存储、管理与分析方面的技术是大数据技术的基础,云计算使大数据应用成为可能,但是没有大数据的信息沉淀,云计算的功能将得不到完全发挥,所以大数据与云计算是相辅相成的。
(三)智能电网、云计算、大数据的相互关系
云计算能够整合智能电网系统内部计算处理和存储资源,提高电网处理和交互能力,成为电网强有力的技术组成;大数据技术立足于业务服务需求,根植于云计算,以云计算技术为基础;所以三者是彼此交互的关系。
二、电力大数据关键技术
(一)电力大数据的集成管理技术
电力企业集成管理技术是为解决电力企业内部各系统间的数据冗余和信息孤岛而产生的。电力大数据的数据集成管理技术,包含关系型和非关系型数据库技术、数据融合和集成技术、数据抽取技术、过滤技术和数据清洗等。大数据的一个重要特点就是多样性,这就意味着数据来源极其广泛,数据类型极为繁杂,这种复杂的数据环境给大数据的处理带来极大的挑战,要想处理大数据,首先必须对数据源的数据进行抽取和集成,从中提取出实体和关系,经过关联和聚合之后采用统一的结构来存储这些数据,在数据集成和提取时需要对数据进行清洗,保证数据质量及可靠性。大数据存储管理中一个重要的技术是NoSQL数据库技术,它采用分布式数据存储方式,去掉了关系型数据库的关系型特性,数据存储被简化且更加灵活,具有良好的可扩展性,解决了海量数据的存储难题。
(二)电力大数据的数据分析技术
大数据技术的根本驱动力是将信号转化为数据,将数据分析为信息,将信息提炼为知识,以知识促成决策和行动。借助电力大数据的分析技术可以从电力系统的海量数据中找出潜在的模态与规律,为决策人员提供决策支持。
(三)电力大数据的数据处理技术
电力大数据的数据处理技术包括分布式计算技术,内存计算技术,流处理技术等。分布式计算技术解决大规模数据的分布式存储与处理,适用于电力系统信息采集领域的大规模分散数据源。内存计算技术解决数据的高效读取和处理在线的实时计算,解决大数据实时分析和知识挖掘的难题。流处理技术处理实时到达的、速度和规模不受控制的数据,应用于电力系统为决策者提供即时依据,满足实时在线分析需求。
(四)电力大数据的数据展现技术
电力大数据的数据展现技术包括可视化技术、空间信息流展示技术、历史流展示技术等。可视化技术广泛应用于电网状态的实时监控,显著提高了电力系统的自动化水平。空间信息流展示技术主要体现在电网参数与已有地理信息系统的结合上,有利于电网管理人员直观地了解设备情况,从而为其决策提供最新的地理信息。历史流展示技术体现在对电网历史数据的管理与展示上,可以绘制出数据的发展趋势并预测出未来的数据走势,可以模拟历史重大事件发生、演变,挖掘历史事件潜在的知识与规律。
三、大数据在智能电网中的应用
电力大数据的应用场合涵盖发、输、变、配、用、调等电力行业的各个环节,在电场选址、降低网损、光伏并网、电网安全监测、大灾难预警、电力企业精细化运营、电力设备状态监测等领域有非常强的可实现性。随着智能电网建设的进一步推进,大数据技术在智能电网中将发挥越来越大的作用。
四、结论与展望
本文探讨了大数据、云计算、智能电网三者之间的相互关系,阐述了电力大数据平台中四个核心的关键技术,即集成管理技术、分析技术、处理技术、展现技术。文章最后的典型应用,对电力企业开展相关研究具有参考价值。大数据技术在商业领域已经获得较为广泛的应用并创造出巨大的商业价值,但是在电力系统中的应用才刚刚起步,因此结合大数据的技术优势和电力系统的应用需求,发挥电力大数据的价值,将为智能电网的建设带来新的发展契机。电力企业应该牢牢抓住这个契机,从数据政策、人才培养、关键技术研发等层面,全面促成电力大数据技术的发展。
参考文献:
[1]孙柏林.“大数据”技术及其在电力行业中的应用[J].电气时代,2013(8):18-23.
[2]罗军舟,金嘉晖,宋爱波,等.云计算:体系架构与关键技术[J].通信学报,2011,32(7):3-21.
[3]姚宏宇.大数据与云计算[J].信息技术与标准化,2013(5):21-22.
[4]饶威,丁坚勇,路庆凯.智能电网云计算平台构建[J].华东电力,2011,39(9):1493-1496.