前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇大数据云计算的理解范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
关键词:大数据;数据质量;云清洗;Map-Reduce
中图分类号:TP391 文献标识号:A
Design and Implementation of Cloud Clean System on Big Data
HUANG Shenbin1 , WANG Haijie1 , ZHU Zhenhua2
(1 Network and Information Center, Harbin Institute of Technology, Harbin 150001, China;
2 School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China)
Abstract: Data cleaning is one of the central issues in big data. The paper describes a cloud clean system based on Hadoop for data cleaning. Using Map-Reduce model, the system detects and repairs various data quality problems in big data. The paper designs the system from the following features: (1) the support for cleaning multiple data quality problems in big data; (2) a visual tool for watching the status of big data cleaning process and tuning the parameters for data cleaning; (3) the friendly interface for data input and setting and cleaned data collection for big data. The cloud clean system is a promising system that provides efficient and effect data cleaning mechanism for big data in either files or database.
Keywords: Big Data; Data Quality; Cloud Clean; Map-Reduce
0 引 言
大数据已经广泛地应用于各个领域,其数据质量问题逐渐被人们所关注。这主要是由两方面的因素导致的:一方面大数据由海量的数据源获得,不同的数据来源使其更可能存在不一致冲突和不完整性;另一方面则是因为大数据频繁地变化且难以手动地获取。数据质量问题严重影响着大数据应用的效率,因为低质量数据上的分析和查询容易导致错误结果或者误导性的决策。数据清洗无疑能够提升大数据的利用效率。本文设计并实现了一个大数据云清洗系统,提取了数据清洗任务中的基本操作并基于Map-Reduce[1]计算框架实现相应的算法。该系统对多种数据清洗任务均有可观的性能。
1相关工作
虽然已经有很多数据清洗的技术和算法被相继提出,但却并非都适用于大数据上。主要原因如下。
首先,现有的数据清洗算法的效率并不能满足大数据的需求。并行计算是大数据算法的一个常用手段。然而,除了少数实体识别的算法[2-3]外,几乎没有其他的并行数据清洗算法获得提出。具有多种数据质量问题的大数据清洗工作的整体效率往往也都不高。
其次,现有的数据清洗系统[4-7]集中于数据质量的某一方面。NADEEF[8]支持各种形式的规则,但是缺少数据清洗领域的一些重要问题如缺值填充和冲突属性的真值发现等。对于具有多种数据质量问题的大数据而言,这往往是不够高效的。究其原因,一方面多种数据质量问题需要多个不同的系统来完成各自的数据清洗工作,从而导致清洗过程需要多次的导入和导出数据;另一方面,多个数据质量问题往往可能会共享相同的操作,如去除数据冗余[9]和流通数据发现[10]即都需要实体识别。如果不同的数据质量问题均由各自的清洗系统来完成,那么这些相同的操作便将多次执行,不利于全局的优化。
最后,现有的数据清洗系统常常需要设置参数,例如不一致性检测[11]的约束规则,实体识别[12]的阈值。对于小规模数据来说,这些规则能够通过人工的观测和理解来设置。然而对于大数据,仅靠观察来设置是不合理的,而对整个数据人工的遍历一遍更是不可能的。
2云清洗系统概述
清洗大数据的一个很直观、很自然的想法便是将云计算的技术应用其中,并将计算任务分布式地分发给多个节点以提高并行度。本文设计的大数据云清洗系统采用的便是这个思路,基于Map-Reduce封装实现了数据清洗领域的各类基本问题和清洗操作,包括实体识别、不一致性检测和修复、缺值填充和真值发现。
云清洗系统基于Hadoop来实现架构,利用Map-Reduce框架系统能够高效地控制硬件资源执行分布式计算。整个系统的数据流如图1所示。 图1 数据流
Fig.1 Data Flow
系统的数据是组织在分布式文件系统中。而输入数据则是通过文件或者数据库来提供,前者由用户上传,后者将是用户提供数据库的连接信息而由系统来访问。数据输入后存在于分布式文件系统中,而集群中节点的数据则通过分布式文件系统来访问。在清洗过程中,数据在mapper和reducer间传递,清洗结束后数据被送回到分布式文件系统。和输入类似,用户可以将清洗后的数据以文件的形式下载或者提供数据库连接信息再由系统输出到数据库中。
系统的结构如图2所示,其中包含一个Master和多个Slave节点。具体地,Master 节点接收数据清洗任务的输入数据、清洗计划以及参数设置。而清洗计划即是一个清洗操作序列,由系统提供的四种清洗的基本操作构成,这四种操作分别为实体识别、不一致性检测和修复、缺值填充和真值发现,并且四种操作可以重复选择。
图2 系统结构图
Fig.2 Architecture of the System
大数据的清洗任务,往往需要很长的时间。在清洗时,云清洗系统给用户提供一个接口来实时查看清洗的进度情况以及通过结果预览来调整算法参数。
3 数据清洗操作
本节将简要介绍四个数据清洗操作的功能以及基本Map-Reduce计算框架下的算法实现。
3.1 清洗操作
为了使清洗系统能够复用共享的操作以提升清洗的效率,研究提取了数据质量问题中的四类基本的操作,分别是实体识别、不一致性检测和修复、缺值填充和真值发现。对其概述如下
实体识别:识别元组是否代表现实世界的同一实体。
不一致性 检测和修复:检测违反规则集的元组,并修复数据使之符合规则。
缺值填充:根据其他完整的元组数据来填充元组的缺失属性值。
真值发现:选择代表同一实体的不同元组存在取值冲突时的真实取值。
这些操作涵盖了数据质量方面的大多数问题。本文的系统可以利用如上的基本操作并根据实际需求来组合形成新的数据清洗的复杂操作。
3.2 算法实现
这些操作对应的算法可在Map-Reduce框架下获得实现,再并行地在各个slave上运行。限于篇幅,此处仅给出其简要介绍。
(1)实体识别。该算法有两阶段。第一阶段,构建属性索引表,使得索引表中拥有相同属性值的数据对象对应于同一个实体。这一阶段由一轮Map-Reduce实现并完成。其中的Map阶段划分主要根据属性的取值来进行数据划分,而Reduce阶段则根据属性取值来对元组决定其分群。第二阶段,完成实体的识别,执行相似度连接查询生成相似实体对集合。该阶段由五轮Map-Reduce实现并完成。其中的第一轮分别统计每个实体及每个实体对的出现次数。第二轮和第三轮分别根据同时出现在实体对中的第一个实体和第二个进行聚集,生成相似实体对集合。稍后的第四轮和第五轮则根据阈值和计算的相似度,完成实体划分。
(2)不一致性检测和修复。该操作需要三轮Map-Reduce来实现并完成。第一轮实现了常量CFD的不一致性检测和修复。Map过程是根据约束规则对元组进行划分,并从规则中得到修复值,Reduce过程则根据得到的修复值对不一致的数据项进行相关修复。随后的两轮则完成FD和CFD的不一致性检测和修复。两者中,前一轮的Map过程依然是根据约束规则来划分元组,此过程检测的是变量CFD的违反,因此一个元组可能重复地划分;而Reduce过程则针对获得的分组以判断组内是否发生变量违反,制定修复方案。基于前一轮Reduce的输出,后一轮将以其作为输入,并按照计算的解决方案对不一致的数据项进行修复。Map阶段对每条元组的修复方案进行整合。Reduce阶段将继续根据整合后的修复方案对不一致的数据项进行修复。
(3)缺值填充。研究根据不同的属性取值设计了多种不同的算法类型来实现缺值填充。对于连续变量值的缺失而言,就是利用其他的属性取值通过回归来实现缺值填充。此处的回归包含三个子过程,分别是:标准化、排序和回归,每一个操作均对应一轮的Map-Reduce。具体来说,标准化阶段将所有属性进行标准化,并计算各个属性的最小值,构成最小值向量。排序则对所有元组的最小值向量计算相对大小并排序。回归将完成回归并填充缺失值。离散变量值缺失,则通过分类来实现缺值填充。分类也同样包含三个子过程,分别是:概率计算、参数聚集和缺值填充,每个操作也都对应一轮Map-Reduce。具体地,概率计算过程需要计算每个特征属性的条件概率和分类属性的边缘概率,生成概率表。参数聚集则根据概率表来聚集缺值填充需要的参数。而缺值填充主要根据聚集的参数来完成填充。
(4)真值发现。真值发现的基本框架是贝叶斯模型。该框架迭代地计算真值和数据源的相关性。每次迭代均需要两轮的Map-Reduce。第一轮通过数据源的可靠性来计算真值,map将根据属性与实体序号的匹配来生成属性值与数据源的可靠性的对应,reduce阶段则通过投票来确定真值。第二轮通过上一轮得到的真值来重新评估数据源的可靠性。两轮一直迭代执行,直至收敛。
4用户功能接口
现在这个时代被称为信息爆炸的时代,因为互联网上每天产生的信息量大到无法统计的程度。也正因为如此,很多人担心这个时代无法产生更高的价值——信息虽然多到爆炸,但过于散乱,无法从中筛选出对自己有利的信息。信息爆炸时代的一个很重要的体现就是微博等社交形式的出现。如果说互联网让人们离开了传统的书籍,那么微博则直接打破了系统化阅读,让人们阅读的习惯变成了只言片语。
可是,在这个信息爆炸的时代,真的没有什么办法去获取有价值的信息吗?如果海量信息没有什么价值的话,产生信息还有什么意义呢?为了解决这些疑问,对数据的发掘和梳理就成为近几年非常热门的事情,而“大数据”这个词也成为互联网产业最热门的词语。更重要的是,大数据已经不仅仅是一个学术词汇,更成为一座让人垂涎的金矿。
大数据,互联网时代的必然结果
百度百科对大数据的解释是:大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
早在1980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。不过,大约从2009年开始,“大数据”才成为互联网信息技术行业的流行词汇。美国互联网数据中心指出,互联网上的数据每年将增长50%,每两年便将翻一番,而目前世界上90%以上的数据是最近几年才产生的。
有人说,大数据是一种文化基因(meme),一个营销术语。这种说法有一定道理,不过这也是技术领域发展趋势的一个概括,这一趋势打开了理解世界和制定决策的新办法之门。根据技术研究机构IDC的预计,大量新数据无时不刻不在涌现,它们以每年50%的速度在增长,或者说每两年就要翻一番多。不仅仅是数据的洪流越来越大,全新的支流也会越来越多。
互联网时代就是产生大量数据的时代,在这个时代,数据不仅变得越来越普遍,而且对于计算机来说也变得更加可读。这股大数据浪潮当中大部分都是桀骜不驯的——都是一些像Web和那些传感数据流的文字、图像、视频那样难以控制的东西。
大数据时代来临首先由数据丰富度决定的。社交网络兴起,大量的UGC(互联网术语,全称为User Generated Content,即用户生成内容的意思)内容、音频、文本信息、视频、图片等非结构化数据出现了。另外,物联网的数据量更大,加上移动互联网能更准确、更快地收集用户信息,比如位置、生活信息等数据。从数据量来说,目前已进入大数据时代,但现在的硬件明显已跟不上数据发展的脚步。
因为大数据的发展,所以近些年的云计算成为最流行的概念。云计算就是基于大数据而产生的——所谓云计算就是在大量的数据所形成的数据云中寻找、发现有用的信息,并将这些信息在互联网上共享。所以说,大数据是互联网发展的必然结果,也是互联网带来的最大价值。
从数据中提炼黄金
之所以大数据这个概念如此受到重视,是因为数据是有价值的。虽然在一般人看来,互联网上的数据是散乱不堪、海量且无法整理的,但经过专业的梳理,可以从中找到以前所无法得到的优质信息。
从资本角度来看,什么样的公司有价值,什么样的公司没有价值,从其拥有的数据规模、数据的活性和这家公司能运用、解释数据的能力,就可以看出这家公司的核心竞争力。而这几个能力正是资本关注的点。移动互联网与社交网络兴起将大数据带入新的征程,互联网营销将在行为分析的基础上向个性化时代过渡。创业公司应用“大数据”告诉广告商什么是正确的时间,谁是正确的用户,什么是应该发表的正确内容等,这正好切中了广告商的需求。
社交网络产生了海量用户以及实时和完整的数据,同时社交网络也记录了用户群体的情绪,通过深入挖掘这些数据来了解用户,然后将这些分析后的数据信息推给需要的品牌商家或是微博营销公司。实际上,将用户群精准细分,直接找到要找的用户正是社交内容背后数据挖掘所带来的结果。
虽然大数据目前在国内还处于初级阶段,但是商业价值已经显现出来。首先,手中握有数据的公司站在金矿上,基于数据交易即可产生很好的效益;其次,基于数据挖掘会有很多商业模式诞生,定位角度不同,或侧重数据分析。比如帮企业做内部数据挖掘,或侧重优化,帮企业更精准找到用户,降低营销成本,提高企业销售率,增加利润。
当然,大数据不仅仅局限于互联网。比如深圳华大基因研究院的“工业+现代信息”大数据战略的初试牛刀。借助大数据技术,他们成功地绘制出水稻,非典病毒,鸡、猪和大熊猫等物种的基因图谱;通过华大基因库的数据分析,科学家们能够对人群从出生到死亡的疾病预防和治疗进行更为主动的干预,甚至有可能对宫颈癌、糖尿病、乙肝等中国发病率比较高的“恶病”进行疫苗控制。让全球数据为人类共有
因为数据能产生价值,自然就会有人喜欢。因此,大数据已经成为企业争相挖掘的资源宝库。IBM曾经提出“全球整合公司”的概念,以至于2013汉诺威消费电子、信息及通信博览会(简称CeBIT)将“分享型经济”确定为主题。而全球资源的整合和共享型商业模式的创新,为大数据技术提供了用武之地。
大数据像水、像矿石、像石油一样,正在成为新的自然资源,能不能挖掘资源中潜在的价值,成为这个时代能不能走向创富的重要条件。
有数据显示,预计到2020年,全球拥有的数据量是35ZB,在如此庞大的数据量面前,它所带来的信息以及反馈出来的事实,对于人类来的说具有巨大的潜在价值。大数据究竟能为包括服装行业在内的经济发展带来什么价值?北京赛智时代信息技术咨询有限公司总经理赵刚总结了3个方面。
第一,通过大数据分析,各行各业都能更快地对变革进行跟踪,响应全球经济快速的变化。第二,在全球金融经济危机的状态下,通过数据分析,能够更好地理解整个经济危机行为的演变。第三,能够更好地满足大众和企业服务的需求,而且可以预测市场的变化。
而从大数据利用的方式上,也可产生几个方面的价值。首先,大数据的价值密度较低,现在可利用和分析的数据只是冰山一角,数据里的价值远没有被发掘出来,所以要利用分析技术去发现它们的潜在价值。其次,要实现大数据整合创新的价值,通过不同渠道的聚集整合,创造新的数据价值。
对服装企业来说,在哪些方面可以利用大数据,从而对业务产生积极的影响?赵刚罗列出9个方面的应用。
第一,为客户进行产品推荐,这是知名电商亚马逊的竞争力之一。网站根据相似的购买行为,对客户喜好进行分析,最终为客户推荐一系列产品。
第二,基于客户反馈改进产品设计,如在淘宝评论上的反馈。在海量的评论信息中,不是每个评论信息都对企业有用,但也确实能反映客户对产品的体验。
第三,通过分析客户的喜好,实现社区营销。企业以客户为基础把握社区中的数据,因此,现在有很多企业通过ADB“反问”到相关数据分析,来实现客户分析。
第四,基于数据分析进行广告投放。通过点击的数据,进行广告位置、颜色、大小、用词的试验,这样可以更好地改进点击行为。
第五,基于社区热点,对流行时尚趋势进行预测,通过热点话题的分析先导性地判断流行趋势。
第六,基于交易分析进行产品定价。如客户对于产品价格的变化有什么反应?价格提升在什么样的数据范围内会造成客户流失?
第七,基于客户异常的流失预测和多个客户行为数据,建立客户的预警模型。
第八,基于环境分析的问题探讨。
第九,物联数据的产品管理。
赵刚说:“企业都是跟大数据相关的,不要觉得大数据太大,跟我们没有什么关系,大数据所分析出来的信息,能够服务于企业的业务提升。此外,在实施的过程中,大数据并不会投入很大的技术力量。”
构造互联网“转基因”企业
大数据思维需要转换成转基因模式,而技术不是第一位问题,目标、决策、客户才是问题的关键。
大数据时代已经来临,当业界还在讨论服装企业如何在大数据背景下真正获得价值时,在财讯传媒(SEEC)集团首席战略官段永朝看来,构造在大数据背景下的互联网转基因企业,成败取决于企业的互联网基因有多少。
大数据是无所不在的计算,包括社会计算和互联网,无时无刻不在影响着传统的组织模式、商业模式以及产业生态。
段永朝把大数据比喻成一个新物种、甚至是侵入者。在这种情况下,大数据思维需要转换成转基因模式。因此,技术不是第一位问题,而是第二位问题。那么,第一位问题是什么?段永朝的解答是,目标、决策、客户是问题的关键。
要成为互联网转基因企业,首先需要企业学会跨界。在过去狭义的概念下,服装就是衣、帽、鞋袜,但现在这种狭义的产业概念已经不适用。在大数据时代下,必须拥有“行业混搭”的意识。
段永朝举例说,耐克就已经跨界到儿童运动心理学、医疗、保健等多个领域,每年涌现出上百个创意,耐克随时邀请合作伙伴、客户、消费者分享点滴创新。从耐克的案例中可以看到,缔造创新文化,一定要有客户的流畅体验。
此外,以数据为中心,就必须拥有一个数据引擎。还要围绕数据、客户行为和体验来描绘数据的“视图”,进而打造数据链条。除此之外,当有了前面的数据畅想之后,还要考虑企业的采购环节、营销环节能否支持这种模式。
“成为互联网转基因企业,必须从大数据入手,或者从概念入手,总之,从数据入手一定是对的。”段永朝总结道。
数据驱动营销变革
营销云构建了广告组和媒体用户,它通过用户的行为、兴趣、搜索、交易数据就能做出一个用户图谱,然后通过用户数据反馈形成营销互动流。
“还没有被互联网改变的未来,未来一定被互联网改变。”大数据时代的来临对于服装产业的影响就是对这句话的最好诠释。
在互联网行业资深观察家、DCCI互联网研究院院长刘兴亮看来,虽然大数据的威力巨大,但互联网也有诸多变化,最为显著的就是移动互联网的趋势。“因此,我们要顺应这样一个势,这是移动互联网的势,是云计算的势。”刘兴亮说。
大数据营销的第一个变化就是从数据云到营销云。无论是购买平台、需求方平台,还是广告平台,都可以通过数据分析达到数据共赢或者数据优化,通过数据交换进行整合,同时对驱动平台进行优化。刘兴亮认为,在目前这个时代可以做一些精准的营销,这是现在所有互联网平台所提倡的。
在大数据流下,使得数据成为媒体核心竞争力,也就是从读者为中心过渡到用户为中心。虽然这看上去似乎区别并不明显,但要求企业对用户的把握非常精准。营销云构建了广告组和媒体用户,它通过用户的行为、兴趣、搜索、交易数据就能做出一个用户图谱,然后通过用户数据反馈形成营销互动流。在广告方面,通过营销投放和数据交换,得到一个营销效果数据。
“通过大数据构建营销云,我们已经推动了这样一个变化,而营销行为和销售行为也可能因为基于互联网的数据营销而全面加速。”刘兴亮说。
刘兴亮同时指出:“大数据和数据大是两个概念,只要你拥有一定数据,就会成为有效数据。此外,技术并不是万能的,但是没有技术是万万不能,网络技术不到位是一种很大的危害。”
云平台的建设使用
云平台包括云管理、云资讯、云学习等多个方面,很多人觉得云平台很复杂,但其最大的好处就在于可以让我们做任何事情都特别简单。
“在我们这个行业里,每个企业家都必须具备互联网思维,也可以叫互联网基因。我们可不可以用互联网的方式,如何用互联网的方式把事情做得更简单、效率更高、成本更低,这就叫互联网思维。”服装云平台创始人、北京前沿顾问首席管理专家徐斌再次重申了互联网基因的重要性。
在徐斌看来,“云平台”包括云管理、云资讯、云学习等多个方面。“当前,服装企业的核心竞争力应该是人才,更准确地说就是培养人才的能力。服装企业的店铺遍布全国,如果靠传统手段进行培训很难,但现在只要有一个老师讲课就行,因此,云学习在企业里是颠覆性的运用。”徐斌介绍道。
而在企业管理层面,所有激励、标准在云平台上都可以实现。在后台和数据都可以监控的前提下,还可以进行管理分享。徐斌说:“互联网思维并不复杂,它就是一个工具,就是一个云。”
徐斌表示,互联网思维对于企业而言的最大意义是“锦上添花”,就是利用这个工具把很多东西做得更好。企业利用云沟通进行团队之间的沟通,包括内部资讯和外部相关资讯的获取。服装云平台实现人才培养、团队管理、信息沟通、资讯和资源获取,最终让企业的工作变得成本更低、效果更好,这才是最重要的价值。
VOICEI 声音
“企业都是跟大数据相关的,不要觉得大数据太大,跟我们没有什么关系,大数据所分析出来的信息,能够服务于企业的业务提升。我们要知道,大数据的运用主要还是与业务相关。此外,在实施的过程中,大数据并不会投入很大的技术力量。”
――北京赛智时代信息技术咨询有限公司总经理 赵刚
“我们怎样构造一种在大数据背景下的互联网转基因企业,未来的成败取决于企业的互联网基因有多少。而成为互联网转基因企业则必须从大数据入手,或者从概念入手,总之,从数据入手一定是对的。”
――财讯传媒(SEEC)集团首席战略官 段永朝
“无论什么行业,我们都以人为中心。从营销学的角度来看,通过大数据构建营销云,我们已经推动了这样一个变化,而营销行为和销售行为也可能因为基于互联网的数据营销而全面加速。”
――DCCI互联网研究院院长刘兴亮
大学英语翻译教学是大学英语教学的重中之重。翻译教学既是巩固英语基础知识的途径,又是培养大学生英语能力的必要手段。特别是在大数据时代的背景下,探讨大学英语翻译的相关问题,对于拓展大学英语教学改革思路,探讨具体的教学改革实践都具有重要的意义。文章结合自己大学英语翻译实践的教学工作,对大数据时代的大学英语翻译教学的核心问题,即大学英语翻译教学时效性进行详细地阐释和说明。
一、大数据时代与翻译教学的时效性
信息技术参与英语教学实践程度的加深,大数据时代的到来都为大学英语翻译教学的发展提供了不可多得的机遇。它不仅使社会对翻译人才的需求得到了快速地增长,而且还在增加对翻译人才需要的基础上,对翻译人才的实践能力提出了更高的要求。为了探讨大学英语翻译教学最佳的教学策略,必须对大学英语翻译时效性的问题进行分析,而分析大学英语翻译教学的时效性的前提则是对两个核心概念进行相关的界定和说明。
1、大数据时代
大数据主要是指大小超出了传统数据库软件工具的存储、抓取、分析和管理能力的数据群。根据云计算的应用模式和数据处理,通过对数据的交叉复用和集成共享从而形成知识服务能力和智力资源[1]。这也就是说,所谓的大数据是一种资源,而且这种资源的形成与数据群的形成密切相关。大数据时代是一个相对的概念,与其相反的术语是“小数据时代”。小数据时代的标志是以“数据库”软件为主,而大数据时代的标志则是以“云”计算为标志的数据集成。
2、翻译教学的时效性
如何理解翻译教学的时效性,关键在于如何理解“时效性”这一核心术语。在教学实践中,对于“时效性”的理解,不同的研究者有不同的理解。首先,“时效性”应该是在某一段时间内的教学实践所收到的具体效果。在“时效性”这一个词语当中,前边的“时”是“特定的时间”之意,它限制后边的“效果”所产生的具体时间。其次,在教学实践中,“时效性”还可以理解“实际效果”,即具体的教学实践活动所收到的客观教学效果。在此,以后一种理解为标准,对大学英语翻译教学的时效性进行相关的阐释和说明。所谓大学英语翻译教学的时效性就是指大学英语翻译教学实践所收到的具体教学效果。而“大数据时代的大学英语翻译教学时效性研究”就是探讨在“大数据背景下大学英语翻译教学”实践的具体效果问题。
二、影响时效性因素
1、教学背景与教学策略的匹配
影响大学英语翻译教学的时效性最为核心的因素是大学英语翻译教学策略与大学英语翻译教学背景,即大学英语翻译教学策略与大数据时代相互匹配的问题。在传统的大学英语翻译教学实践中,翻译教学的策略是与传统翻译人才培养的需求相互适应的。但是随着大数据时代的到来,社会对英语翻译人才的需求出现了新的变化。它不仅需要翻译者掌握相应的英语知识,懂得相关的翻译技巧,而且还需要翻译者具备相应的信息技术,通过大数据时代的背景,实现自己的翻译教学对众多学习者的影响。换而言之,如果一个翻译教师能够运用大数据时代提供的信息技术,实现教学实践影响的最大化,那么,他的翻译教学实践就会取得更大的教学效果。否则,他的教学影响就是有限的,仅仅限于课堂学习的那一小部分学生之中。因此,大数据时代与其教学策略的匹配问题是影响其教学效果大小的重要因素。
2、教学内容与学生的学习需求
翻译教学内容与学生学习需求之间的相互匹配是影响其教学效果的又一基本因素。在传统的英语翻译教学实践中,任课教师只需要教给学生翻译的知识和技巧,而面对大数据时代的到来,不仅翻译的内容产生了与时俱进的变化,而且翻译技巧也在这种与时俱进的变化中发生了相应的变迁。因此,任课教师还需要结合具体的教学要求,选择一些新的翻译内容作为教学的补充,从而达到提升学生学习效果的目的。
3、课程体系与教学需求的差距
大数据时代的到来,不仅对教学策略、教学内容提出了新的要求,而且对于翻译课程体系的建设也提出了新的改革意见。众所周知,翻译课程体系的构建,既是大学英语翻译教学适应时展的必要策略,也是改革传统翻译教学的关键。特别是面对大数据时代对英语翻译人才提出的新要求,只有从课程的层面进行大学英语翻译教学的改革,才是提升任课教师教学效果的科学选择。特别是在传统英语翻译教学中,由于课程体系所限,大学英语翻译课时所占英语教学全部课时的比例极低。这种极少宝贵的课时,由于任课老师忙于完成所谓的教学任务而忽视了对学生翻译兴趣的培养,从而教学效果长期得不到应有的提高。
4、师资队伍与教学背景需求的脱节
由于大数据时代的到达远远快于大学翻译教学实践任课教师的更新速度,而任课教师的知识更新又远远落后于教学需求的更新速度,在目前的英语翻译教学实践中的大多数教师都不能对大数据时代的翻译教学进行正确的评估。因此,师资队伍与时代教学背景的脱节也是制约大数据时代英语翻译教学效果的因素之一。
三、提升时效性策略
分析影响大数据时代的大学英语翻译教学时效性的主、客观因素,其目的是为了制定相应的提升策略,以促进大数据时代下大学英语翻译教学实践的快速发展。根据以上分析,提升策略可以简单地概括为:更新课程体系,改革教育观念,丰富执教技能。
1、更新课程体系
更新课程体系是提升翻译教学时效性的关键,无论任课教师具有多么高超的教学技能,如果没有课程体系的更新都无法使执教能力在具体的教学实践中得到客观地施展。
2、改革教育观念
教育观念包括三个层面的教育观念,即任课教师的教育观念,管理者的教育观念和学习者的教育观念。只有这三个层面的观念都得到了与时俱进的发展,它才可能促进翻译教学效果的提升。否则,任何只一个层面的观念更新,它对大学翻译教学效果的影响都是有限的。换而言之,只有这三个层面的影响和谐地统一于具体的翻译教学实践,翻译教学的效果才能得到巨大的提升。
3、丰富执教技能
如果说大学英语教学的管理者是从宏观的层面对具体的翻译教学产生影响,那任课教师则是从微宏的层面使这种影响变为教学现实。丰富任课教师的执教技能,不仅可以使其更加适应大数据时代的教育背景,而且它也可以提升具体的教学效果。从另一个层面分析,任课教师是翻译教学活动的主体,他控制着教学实践的具体发展,其执教能力是影响翻译教学时效性的核心因素。因此,教师应该以其丰富的执教技能为突破口从而提升翻译教学的时效。
关键词 云计算 物流信息平台 建设 发展
中图分类号:F252.1 文献标识码:A
在物流信息化的发展建设中,尽管已经取得了可贺的成果,但仍不可避免地出现一些难题,比如说在建设信息平台时所投入的成本要求过高,需要购买先进的技术装备,工作运作中长期维护更新,这也都要求对技术人员的重新培训与分配。更大的问题是很难达信息系统服务多元化的要求。新的信息应用技术的实施对物流企业来说既是一种机遇,也是一个挑战。而云计算技术的提出以及在物流领域的应用,将会彻底推动我国物流服务一体化平台的构建,使我国物流业在运营成本上的消耗不断降低,使其服务质量和服务水平有大幅度提高。所以,在这个大前提环境下,利用云计算运作模式来建设公共物流信息平台是非常重要的任务。
1云计算的概念
随着分布式计算、并行计算、网络计算、效用计算和Web2.0 等计算概念与思想模式出现在人们视野后,计算机与学术界领域又阐述了一种新的云计算模式,运用这种新的模式,可能带动整个领域服务模式的彻底改变。云计算借助快速的网络传输功能,将个人计算机中的信息数据嫁接到互联网的大数据计算机群中。而这个大的计算机群是由大型的数据处理中心控制,多个甚至成千上万个极为标准的工业数据服务器构成的。云计算模式换言之是电厂集中供电的模式的另一种理解为,借助云计算,人们可以不需购买新的服务器和部署软件,也可以不用建立个人的数据库、机房、服务器中心等,只要向云服务厂商或者云端配置相应的服务,就能获得由他们提供的基础架构、服务和软硬件设备等。因此可以很大程度地降低信息平台建设所需的成本。整个云计算系统是一个动态的系统。可以不由人去看守,自动监控资源的程序运行、动态部署、分配资源,自动对资源的使用情况进行观测。
云计算技术在信息的计算处理、数据的安全维护和成本的消耗等方面有着明显的优势。在信息的计算处理方面,云计算的计算机集群,在为物流企业提供强大的在线计算和数据处理服务的同时,能够高速稳定地做到根据计算结果来存储计算结果。在数据的安全维护和成本消耗等方面,云计算是一种变化着的、动态的计算服务体系,这种服务体系根据要求分配服务资源,并对资源的使用情况进行实时监控,避免了高成本的维护和重复的建设费用,使物流企业消耗的成本降低,低费用就能满足其企业的计算和处理过程,提高了信息处理的效率。
2基于云计算的物流信息平台建设
云计算有着巨大的技术优势,那么在物流企业的服务中,如何利用云计算来构建物流信息平台,便成为摆在当前物流企业面前的首要问题。物流企业云计算信息平台中的物流服务根据划分层次的不同可以分为应用层、平台层、基础设施层和虚拟化层,这些层次的分工由物流信息平台的服务功能的不同而决定:应用层在云计算物流信息平台的构建中主要提供物流企业的应用,物流企业根据云计算的物流信息平台,从自己的实际需要出发,需支付给云计算服务提供商的费用由软件服务的时间和方式决定,软件的管理维护都由服务提供商来解决,物流企业只需应用,并不需要去购买,节省了大部分费用。平台层在云计算信息平台的构建中是用来提供服务的开发环境以及服务器平台的发件和服务中所需要的硬件资源,物流企业通过平台层接收这些服务,物流企业对自己客户开展的物流服务也在这个平台的基础上完成。在云计算信息平台的基础设施层将服务器、存储和网络设备等资源以信息服务的形式提供给客户。在云计算信息平台的构建中的关键层是虚拟化层,因为它包括服务器集群及硬件的检测和管理服务。云计算的物流信息平台正是通过这些层的构建和设置,来搭建起一个信息化的物流服务平台,来提供安全的服务环境,为物流企业提供快速、安全、可靠的信息服务。
3云计算在现代物流中的应用发展
基于云计算的现代物流信息平台的成功构建,在一定性质上是为了满足现代物流企业对物流信息的准确掌握,因为物流企业在以生产者为起点和以消费用户为终点的产品传递过程中,要能够处理从制造、运输、装卸、包装、仓储、加工、拆并、配送等各个环节中产生的各种信息,这些信息必须通过一种方式的快速传递来保证各个环节的操作,通过及时的信息传递及时做出信息的处理。而云计算现代物流信息平台由于具有高可靠性、低成本和高性能的数据维护等特性,可称为现代物流企业的首选应用工作平台。因此,云计算平台的成功构建和应用,可以在一定程度上提高物流企业的工作效率。并且,云计算平台的服务共享和日常数据的安全存储解决了物流企业的信息安全,保证了企业的服务效率和服务质量,其应用将可满足物流企业的要求。
4结论
由于云计算技术在数据的海量计算、资源的分配处理以及经营成本的消耗等方面有着显著优势,现代物流企业应当积极采用云计算技术构建物流信息化平台,通过物流信息化平台的有效应用,促进物流产业的信息化、网络化、自动化进程,大幅降低资本投人,为企业的物流服务做好充分的技术支持,使我国的物流业实现飞跃。云计算的应用将带来物流领域的重大变革,提升我国物流企业的现代化和规模化,为物流业的发展提供强劲动力。