前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇人工智能对医疗的帮助范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
(讯)发展目标明确,到2020年产业规模超过1000亿元。此次《实施意见》为上海市人工智能发展提出了明确目标。到2020年,人工智能对上海市创新驱动发展、经济转型升级和社会精细化治理的引领带动效能显著提升,基本建成国家人工智能发展高地,局部领域达到全球先进水平。具体来看,到2020年要打造6个左右人工智能创新示范区域,形成60个左右人工智能深度应用场景,建设100个以上人工智能应用示范项目,建设10个左右人工智能创新平台,培育10家左右人工智能创新标杆企业,人工智能重点产业规模超过1000亿元。到2030年,人工智能总体发展水平进入国际先进行列,初步建成具有全球影响力的人工智能发展高地。我们认为,上海市在产业基础、科研基础、信息化程度、数据丰富程度、应用场景等方面在国内具有领先地位,具有发展人工智能的先天优势。大城市在城市管理、公共服务、交通、医疗、产业转型升级等领域存在的现有问题也有望通过人工智能技术而得以缓解,这进一步加强了上海这样的大型城市对于人工智能的需求。此前广州市的《建设“中国制造2025”试点示范城市实施方案》也将人工智能、新一代信息技术作为重点聚焦产业。政府的大力支持将推动人工智能在前沿技术、应用落地、产业集群、创新生态等方面的快速发展。
政务数据开放有望加快,AI产业基金成立可期。大数据是人工智能的基石。在政务数据开放共享上,上海市政府也将加大开放力度。目前上海已经形成最大的数据开放清单,有1500多项数据开放,下一步还将建立公共数据分级分类开放制度,出台相关的政务数据申请公开使用的细则,建立公共数据开放的应急工作机制,推进数据管理、数据利用、安全保护形成标准和规范。目前,上海已编制政务数据资源共享目录1.7万多条,有26万个数据项,年底前将启动建设全市政务信息交换共享平台。上海市政府下一步将建立跟企业合作的开放性行业大数据训练库,建设人工智能应用多场景验证环境。在资金扶持层面,市政府将加强财政资金扶持力度,引导企业和社会资本投入。目前,上海正在开展第一批人工智能产业基金和人工智能创新项目的组织遴选。在市场支持层面,将推动各级政府部门率先运用人工智能提升业务效率和管理服务水平,支持人工智能创新产品开拓市场应用。我们认为,人工智能的发展离不开政府,除了数据开放、资金扶持等实质性支持外,政府在社会资源引导、产业集群建设、应用场景开拓等方面会对整个行业带来帮助。
投资评级:我们认为,人工智能赋能是产业发展的大趋势。远期来看,人工智能与各行各业的融合有望带来新一轮产业变革。近期来看,图像识别、语音识别等人工智能技术在安防、金融、交通、零售、医疗等领域的应用呈现快速增长趋势。我们看好人工智能产业链发展,具体包括上游的人工智能芯片、智能传感器,中游的人工智能算法、人工智能软件以及下游的行业应用。对于计算机行业,我们维持行业“看好”评级。(来源:信达证券 文/边铁城 编选:中国电子商务研究中心)
――找到甲状腺结节,标注位置和尺寸,并提示良性或恶性的可能性。
浙医一院的医生接待了一家来自兄弟单位的医疗人工智能创业团队――德尚韵兴的专家们。
这个团队的背景很牛,首席科学家孔德兴是知名数学家,浙大求是特聘教授。10多年前,当国际上刚开始把数理模型和高性能数学算法应用到医学图像领域时,这个团队也极为敏锐地进入这个新兴领域探索。他们开发的“DE三维可视化系统”,用于精准外科手g的术前规划、术中导航和术后定量评估,是北京301医院的必备软件之一。
最近几年,他们将深度学习技术应用于超声声像,开发了甲状腺结节智能诊断系统DE-超声机器人(以下简称超声机器人)。在此过程中,他们对原本“均码”的算法和神经网络,针对疾病特点进行“量体裁衣”。相关技术文章发表后,谷歌深度学习团队DeepMind也关注并引用了文章。
“副主任医师水平”
德尚韵兴团队此行就是带着“超声机器人”来跟浙医一院的超声医生“PK”的。医生只要坐在B超机前,用探头给病人检查后,将采集的图像保存发送给超声机器人,超声机器人就能实时生成检查结果――找到甲状腺结节,标注位置和尺寸,并提示良性或恶性的可能性。
不过,面对这个“超声机器人”,浙医一院的医生心中充满疑问――这个系统怎么能像他们一样做判断?结果准吗?出于礼貌,他并未当场提出。
当德尚韵兴专家离开后,这位主任医生准备了202个病例(恶性结节有病理对照,良性结节有三年以上随访期)发送给超声机器人,并认真记录机器人的诊断结果, 结果显示机器人的诊断准确率为85.7%。一段时间后,当他再次见到德尚韵兴的专家时,主动告诉他们:“我判断,超声机器人达到了医院副主任医师的水平,确实挺好。”
好的开始是成功的一半――这也开启了浙医一院和德尚韵兴后续的合作。
实际上,人工智能在医学领域的发展,在国内外都是刚刚起步。
“不能说是完全空白,但这个方向有很多值得我们研究的东西。”德尚韵兴总经理胡海蓉说。
德尚韵兴扮演着领域的“拓荒者”。胡海蓉向《IT经理世界》坦言,在这几年人工智能的落地实践中,她认为,组建跨学科团队,选择合适的切入点,收集和规范数据,开发让医生得心应手的产品是较为关键的环节。
跨学科明星队
人工智能+医学的落地实践,需要跨学科明星队。
“这里的关键体现在‘交叉’上。”胡海蓉说,“在医学重大需求上,数学家、计算机科学家或医学专家,任何单一力量是无法实现的。”
在这类团队中,数学专家负责提出高性能数学模型,“好的模型就像具有高IQ的大脑。”医学专家提供临床知识和经验,让机器能学到“真知灼见”,计算机软件专家要把数学家的语言转化成高效的计算机语言。
“可是,数学家、医学家和计算机专家都有各自的语言,怎么把他们串起来呢?”胡海蓉继续分析说,“我们就需要找到一个具有生物医学工程背景的人来做产品经理。他来负责产品的市场调研和规划,管理整个团队,充当‘多种部队’之间的翻译和桥梁。”
切入甲状腺超声诊断
选择切入点也很有讲究。这个切入点不能太过复杂――它要让团队能小步快跑,保障后续项目的进一步深入拓展;也不能太容易――它要能对医疗痛点有质的帮助,才有推广的价值,容易被市场接受。
“甲状腺结节诊断”最终跳入德尚韵兴团队的视线。
甲状腺癌在中国女性癌症发病率排名第五,在德尚韵兴所在的杭州,甚至排在第一位。但由于个体化差异,目前三甲医院甲状腺结节的诊断准确率平均只有60%~70%。用人工智能提升诊断准确率能造福老百姓。
相对肺、肝脏等器官,甲状腺是一个浅表器官,器官结构相对简单,没有复杂的血管。根据超声声像,就能对甲状腺结节的良恶性作出诊断。
但同时,甲状腺超声诊断也有一定复杂度――不像CT和核磁,超声因每位医生的扫描手法不同,得到的数据千变万化,因此对影像识别算法有很高要求。从这样一个诊断既有其简便性,又有其复杂度的疾病做起,可以在过程中积累足够经验,为开发难度更高的疾病,如乳腺肿块、肝脏肿块、肺结节的良恶性诊断打下基础。
数据!数据!
对于医疗人工智能团队来说,数据的收集、规范和标注是行业性难题。
“数据收集不能全靠医院。”胡海蓉总结说。深度学习靠的是“吃透”大量样本。但目前大部分医疗机构并不愿公开数据。德尚韵兴尝试通过多个渠道,有社区检查,有付费志愿者,也有试点医院。
“我们已收集了两三万张超声图像,这是不多的。”胡海蓉客观地说,“如果样本量能提高一倍,我们的诊断准确率还有较高的提升空间。”现在德尚韵兴的甲状腺超声机器人诊断准确率已达85%以上。
除了数据收集,数据的规范和标注是另一项需要大量调研和沟通协作的活。
以甲状腺结节超声诊断为例,数据规范要从“医生的扫描手法”开始。团队走访了多家医院,听取多位医生建议,规范扫描手法,形成最终文档。
拿到超声影像后,还要找到结节进行勾画。现实中,医生和算法工程师对结节的勾画有不同标准,哪一种勾画对计算机算法更有利?团队要综合考虑,制定出适合的标准。
在数据规范化过程中,对那些疑难病例的判断和标注,特别需要医学专家的指导。“但高水平医生的工作是最繁忙的,他们往往没有时间和兴趣参与标注。”德尚韵兴要想办法争取医学专家的支持。
线上线下的商业探索
目前,国内业界对医疗人工智能的定位有一个共识――定位在辅助诊断上。人工智能系统可取代医生重复性、机械性的工作,让医生能够看更多的病人,做更多有价值的医学探索。
德尚韵兴的超声机器人也是这样定位的。它可以先选出有问题的声像图给医生,及时提醒恶性风险,让医生能更仔细的查看把关。
经过一段时间的试点后,德尚韵兴的超声机器人将首先向基层医院推广,这将提高基层医院患者首诊的诊断水平,让更多患者不出远门就能获得“专家级”服务,再根据诊断结果到不同级别医院治疗。
超声机器人可部署在云端,这特别适合新疆、等基层医院分散的地域。通过英特尔联合创新实验室的牵线,在新疆人民医院联合130多家医院建立的远程会诊体系中,超声机器人将成为关键服务之一。同时,与远程医疗平台汇医在线的合作,超声机器人也为平台上签约的全国基层医院服务。
超声机器人也有单机版,部署在医院和体检中心。其中,与从事体检中心业务的北京世纪经纶的合作,超声机器人将推广到几个省。
在国家社会科学基金和互联网经济学研究联盟的支持下,《财经问题研究》编辑部特别组织了“互联网经济的理论与反垄断政策探讨”笔谈,邀请数位专家对相关问题展开讨论,相关成果发表于《财经问题研究》2018年第9期,本文为其中之一。
核心问题
人工智能和互联网能否带来新的经济增长?
产业互联网将如何影响产业竞争的格局,其对整个经济的增长有什么样的影响?
平台型组织的演变会对社会产生多大的影响?
01
引 言
在过去的十多年时间里,全球经济面临一个比较大的挑战就是如何重塑经济增长。2005—2014年,全球最发达的经济体的增长率长期停滞不前,急需要寻找一个新的经济增长驱动力量。
互联网在中国经历了20年的快速发展之后,已经取得了世人瞩目的成就。特别是随着智能手机的普及,移动互联网在中国已经相当发达。根据中国互联网协会的数据,2016年中国境内活跃的手机上网码号数量达12.47亿。
得益于中国特殊的市场规模和移动互联网的发展,中国的消费互联网市场发展迅速,代表性的电商平台如阿里巴巴、社交及游戏公司腾讯,这两个公司以市值计均进入全球财富五百强的前十位。
当前,人们关注的热点是中国的互联网红利是否已经消失,传统产业的互联网转型是否会带来新的增长机会?
此外,人工智能最近这几年发展迅速。2017年中国的人工智能(AI)投资仅次于美国,成为投资热点,政府也不断推出鼓励和支持政策。
这种变化引发业界和学界的思考,是不是会出现新的驱动经济增长的力量?这个力量如果能够驱动经济增长,其对于整个社会的改变会有哪些影响?
1999年,美国微软的创始人盖茨有一个非常有名的论断:商业新法则就是“互联网会改变一切”。从他提出这个论断到现在已近二十年,可以看到,电影、阅读、新闻等商业模式都发生了巨大的变化。
但另一方面,还有很多东西没有发生变化,如航空发动机的数据获取,1960年和2015年的方式并没有太多的变化。很多产业,如海关报关等,也没有发生实质性的变化。在今天,一个备受关注的问题是,人工智能对于社会将有多大影响?
笔者将从产业竞争和战略的角度来讨论产业互联网和人工智能会如何重塑中国经济的问题。主要讨论三个问题:
第一,人工智能和互联网对经济增长的影响。人工智能和互联网是否有可能提高经济的长期增长水平?
第二,产业互联网将如何影响产业竞争的格局?它对整个经济的增长有什么样的影响?
第三,产业互联网和人工智能如何影响产业结构的变化?特别是产业互联网和人工智能是否会导致产业的平台化?这种平台型的组织又会对社会产生多大的影响?
分析表明:
第一,产业互联网和人工智能会大幅度提升生产力。而且产业互联网和人工智能会提升要素配置的效率,进而提升生产率。因此,可以乐观看待长期经济的增长率。
第二,平台和组件的模式会影响一切组织和经济形态。平台会影响国家的竞争、城市的演变和产业转型。一切组织都会向平台化的方向发展。
02
人工智能和经济增长
经济的长期增长,主要是来自全要素生产率的增长。全要素生产率的增长,除了科技(包括人工智能)的进步,还包括管理效率和要素错配这两个问题带来的影响。
大量的数据都表明,经济的长期增长率一直在下降。无论是20世纪80、90年代还是千禧年后,整个世界的GDP增长一直在下降。
Gordon(2016)提出,美国的长期经济增长将继续下台阶。Gordon研究了美国过去150年的经济发展史,认为美国的发展呈现倒U型的特征。美国经济大约从19世纪70年代开始起飞,到20世纪50年代达到顶点,之后逐步下降。
Gordon的一个略为意外的发现是,从20世纪70年代开始,美国经济的增长表现非常普通,特别是创新的步伐和技术进步带来的增长并没有惠及到更多人。
为什么现在大家如此关心人工智能的发展?很重要的一个原因是希望能够找到提升经济增长新的关键要素,希望找到推动经济持续增长的新动力。这是大时代的背景。
人工智能是否会推动经济增长和提升生产率,对中国同样非常重要。
一是因为目前对中国经济长期增长源泉的解读有很多误区。很多人认为中国经济的增长来自于投资的驱动,认为由于投资占比已经很高,且投资回报率逐步降低,所以中国的经济增长必然下行。
第二个原因是人工智能对组织生产活动的要素配置会有影响。如果人工智能可以提升要素配置效率,那经济增长的潜力也会提高。
Zhu(2012)的研究表明,与很多人想象的不同,中国经济的增长主要来自于效率的提升,而不是来自于投资的增加。虽然投资的增加是经济增长很重要的一部分,但最主要的增长还是来自于经济效率的提升。他的这一发现在学术界受到了越来越多的关注。
这一研究的重要性不仅在于其给出了一个与主流很不一样的观点,更重要的在于这个研究对判断经济增长的潜力有非常大的参考意义。
根据这一研究,1978—2007年,在中国经济增长的贡献中,有70%是来自于全要素生产率的增长。这一结论非常重要,意味着中国长期经济增长仍然有非常大的空间。
这是因为在经历了40年的高速增长后,中国的全要素生产率仍然只有美国的20%多。这表明通过提升全要素生产率来促进中国经济增长的空间非常大。这就是为什么人工智能和新的经济增长动力如此重要的根本原因。
由此,需要一个坚实的支持经济增长的微观理论基础来对当前的经济形势进行解释和指导。人工智能可以看作是广义的机器自动化。在经典的索罗模型中,可以借助一个简单的增长模型来讨论人工智能对经济增长的影响。
参考ZEIRA(1998)的经济增长模型,简单来说,经济增长实际上可以看成一个抽象的生产函数。一个国家的产出是由生产力、资本和劳动共同决定的。
根据这一模型,可以推导出一个重要的结论:经济的增长速度与自动化的比例正相关,即自动化的提升会增加长期的增长。此外,自动化比例的提升意味着资本在总产出中的占比提高。
这个简单的模型有两个非常重要的含义。
第一,人工智能在理论上有可能会带来经济的持续增长。人工智能比例的提升,会带来经济增速的持续提高。这实际上就是从经济学上定义的奇点。经济学家在这方面向自然科学学习了很多。这里的所谓奇点,从经济学角度来说,就是持续的超高增速。
第二,资本和劳动在产出中的占比关乎收入的分配及平等和长期的社会稳定。资本占比提升和劳动的占比越来越低意味着贫富差距会增加。资本家是成为人工智能的投资者和获益者,而普通的工人则可能成为受害者。
对于人工智能对经济增长的影响,在给出确定结论前,可以简要回顾一下历史。关于人工智能的争论其实是一个历久弥新的话题,从信息技术一出现,大家就在讨论这个问题。
20世纪90年代《经济学人》的说法是,计算机不会提升人们的生产力。Zachary(1991)认为数据过载限制了生产率的提高。而信息技术对生产率的提升是显而易见的。
但1996—1999年,美国私人部门的年均增长率达到2.8%,是1980—1995年间的2倍。这段时间可以明显看到信息技术带来的生产力的提升。
人工智能鼻祖和行为经济学鼻祖西蒙也认为计算机和自动化会推动生产力的持续提升,但可能不是加速的提升。加速就是前面提到的奇点,即人工智能应当会持续提升生产率。业界的研究也支持这一判断。
埃森哲的研究表明,美国生产率的增长受益于人工智能,到了2030年可以实现翻倍,意味着全球的经济增长可能会重新进入高速增长的环境,全球经济将进入新的增长周期。
经济增长的源泉无外乎生产率的增长、资本投入的增加或是劳动人口的增长。如何理解抽象的增长模型中人工智能会导致长期的总经济增长?
第一,从资本的角度,对人工智能的投资会产生很多不会折旧的资产,甚至还会增值,这是因为人工智能有学习能力,如阿尔法狗,它一天比一天聪明。这与传统的资本完全不同。
第二,从劳动力的角度,人工智能与劳动力之间的替代关系和互补关系同时存在。在国民经济的很多部门,人工智能会逐渐替代人工,但在其他很多部门,人工智能与劳动力之间是互补的。而且人工智能对劳动力的替代,有可能意味着人们会接受更多的教育,从而带来劳动生产率的提升。
从历史的经验来看,可以参考信息技术对生产率的影响。1996—1999年,是美国信息技术、互联网开始发展的时期。这段时期,美国全要素生产率年均增长2.8%,是1980—1995年的两倍。这一数据表明人工智能这种新的技术会使得生产力有大幅度的提升。
第一次工业革命时期,1850—1910年,蒸汽机驱动的经济增长是0.3%,而第三次工业革命也就是信息技术驱动的经济增长是0.6%。
有估算认为,人工智能驱动的经济增长在0.8%—1.4%。虽然这个数字还难以确认,但有充分的理由相信,人工智能对整个经济效率的提升有非常大的帮助。
除了人工智能直接带来的经济增长,还有两个与人工智能间接相关并会提升经济增长的原因。
第一,来自于管理和组织效率的提升,这个是在微观层面上的。
Bloom(2007)等学者的研究表明,不同国家的企业管理水平差别很大。假设企业管理水平的总分是5分,将各国企业管理水平得分排名,美国、日本、德国名列前茅,中国则仍然处在一个非常低的水平上。这一研究对于理解中国经济增长的长期潜力有非常重要的含义。
中国是在如此低的管理水平的基础上取得近四十年的高速增长的。如果中国能够借鉴国际先进的企业管理经验,提升组织管理效率,就可以大幅提升中国的经济增长水平。
第二,要素错配的问题。
要素错配对经济增长的影响近年来在学术界引起了很大的关注。提升经济增长的另外一种方式是改善要素错配。要素错配会导致经济效率的损失,如果中国能够改善经济要素的配置效率,就可以提升经济效率,进而促进经济增长。
谢长泰[6]等的研究表明,与理想状况相比,中国的全要素生产率提升可以超过100%;即使是与美国的实际水平相比,中国的全要素生产率仍然会有3%—50%的提升,这表明如果中国能够改善要素配置,经济增长的潜力就会持续提升。
总体来讲,跨部门、跨行业的生产率都存在差别。一个国家的企业生产率越集中,表示企业之间的生产效率越是接近的;越分散则表示不同企业的生产效率有差别。而中国企业的生产效率有很大的提升空间。
中国消费互联网的发展已经证明了提升要素配置促进经济增长的作用。阻碍要素配置效率方面有几个重要的调整成本,包括企业所有权和政治的联系、大量的非正式部门等。
但人工智能的发展会导致这些非正式部门的快速消失。这就是为什么产业互联网和人工智能的出现会改善要素配置效率,促进经济增长的原因。
03
产业互联网的影响
在消费互联网中,已经出现的代表性企业有美国的谷歌、苹果、脸书、亚马逊,中国的百度、阿里巴巴、腾讯。
但产业互联网还正在发展中,目前还看不到明确的巨头。美国的通用电气是在产业互联网方面转型最坚定的企业,但目前仍然没有看到非常明显的竞争优势。
什么是产业互联网?笔者的定义是,产业互联网是通过互联网来重构产业的价值链和创造新的价值。而不是简单地在互联网上加一个东西,其范围其实是非常广泛的。
需要正确理解产业互联网与通常所讲的“互联网+”或“+互联网”的区别。
以婚介市场为例,婚介市场是一个具有很大的商业价值和社会价值的大市场。简单的“互联网+”就是把婚介搬到网上去,即国内很多婚恋网站的模式。这种做法只是把线下的婚介搬到线上。其目标是尽可能多地促进互动(interaction)。但美国有一家与众不同的婚恋匹配的网站,叫做eHarmony。
中国的很多婚恋网站注册很容易,但美国这家公司却不同。如果想要成为该网站的会员,需要花四个小时做心理学专家仔细设计的250道问题。这种做法的好处在于可以剔除哪些不是严肃找婚恋对象的用户,有效提升匹配效率。
这里的核心就是进行价值链的重构。整个网站是在信任的基础上,给用户提供严肃、有效的匹配。这种做法完全改变了婚恋网站的商业模式和治理方式,这就是产业互联网与“互联网+”的区别。
产业互联网是一个巨大的市场,发展空间巨大。通用电气的估计是32万亿美元,占到了美国46%的GDP。根据思科的估计,到2020年,美国公司的利润通过产业互联网可以增长21%。
虽然目前中国市场上没有明确的产业互联网巨头,但可以期待产业互联网会为中国带来同样的巨变。
革命性的新产品或新服务一定会出现,类似于苹果创造新的市场,或是特斯拉改变世界汽车产业的方式。特斯拉的意义在于其完全颠覆了一个产业。
电动车并不是新东西,爱迪生是最早看到电动车前途的。但真正驱动汽车产业大发展的是福特的T型车和汽车能源的使用方式。
特斯拉的重要性在于其对汽车产业的两个根本性改变:自动驾驶系统和充电电池系统。这就是为什么特斯拉的市值会超过传统的汽车巨头通用汽车。需要看到的是,特斯拉试图做的是成为汽车产业的微软和英特尔的结合体。
新的应用效率可能会降低成本,提升满意度和安全性。因为在整个生产、服务领域,都会有非常大的改变。
提到工业物联网,如果效率的提升会带来整个产值的增加,那么无论是航空、电力、健康、铁路,还是石油、天然气,产业互联网和人工智能对上述产业的改变都会非常大。
04
平台化组织
今天全球十大公司很多都是平台型公司,包括谷歌、苹果、腾讯、阿里巴巴等。平台经济的商业模式会影响到很多层面,包括国家层面、地方政府、城市,以及各个产业。人工智能的出现,会加剧这个过程的演变。
以PC产业的演变为例,传统计算机产业的典型代表是早期具有垂直整合结构的IBM,即计算机的所有零部件都由自己生产。但今天的计算机产业是一个非常碎片化的产业,由极少数的关键玩家主导,如芯片由因特尔主导,操作系统则由微软主导,其他的部件则由标准化配件提供商生产。
计算机产业从垂直整合结构演变为分散水平结构,意味着这个产业的利润被少数平台型公司获取,其他公司只能赚非常薄的利润。这是非常重要的演变趋势,PC产业的演变,将来有可能会在很多产业中复制。
任何一个行业,如果像PC产业一样演变,那就意味着产业里绝大部分公司只能退化成一个提供标准化组件并获取市场平均利润的普通公司,而主导产业演变的平台型公司则将领导整个产业并获取绝大部分的蛋糕,如智能手机平台苹果、搜索平台谷歌、电商平台阿里巴巴和社交平台腾讯。
平台型组织的演变会对社会产生的影响主要有三个趋势:
第一个趋势是平台化后,产业的合作和融合更加明显。
一些提供单一功能或服务的企业存在通过其独特服务渗透到其他产业进行平台覆盖的可能。产业的分散化意味着核心的主导公司可能会通过技术来颠覆传统产业。
如在汽车产业,传统的主导公司是通用、福特、奔驰等汽车制造商,但在自动驾驶和新能源时代,谷歌和特斯拉可能通过其全新的驾驶技术或充电技术颠覆传统产业。新兴的科技公司也有可能通过智能手术技能来颠覆传统的医疗产业。
第二个趋势是人工智能的基础设施能够促进增长,包括硬件、数据。庞大的数据会使大公司的优势加强。
平台的演变会影响一切经济形态和组织形态,意味着平台的模式将主导一切,平台型的国家会出现。未来,美国和中国将会成为全球经济的超级两强,其他国家则会成为全球政治和经济上的组件和配角。
人工智能会使得中美两国在资本、技术方面的优势进一步强化。而平台型城市会使得人才和资本的规模效应更强,更集中在大城市。深圳就是非常典型的平台城市。
第三个趋势是平台型产业的普遍化。
现在还没有看到人工智能这个产业里出现非常典型的突出玩家,但将来一定会有某个公司提供主导机器的操作系统。这个产业一定会产生一个领导性的企业,类似于微软的超级平台。
可以肯定的是,目前经济体量较大的国家在人工智能方面的投入会非常多,并进一步导致国家间的强弱分化。
05
结 论
本文主要讨论了三个问题:人工智能和互联网能否带来新的经济增长?产业互联网将如何影响产业竞争的格局,它对整个经济的增长有什么样的影响?平台型组织的演变会对社会产生多大的影响?
无论是历史的数据还是理论分析都表明,可以适度乐观看待产业互联网和人工智能对经济的影响。人们有理由相信产业互联网和人工智能会大幅度提升生产力,并推动长期经济增长。
同时,笔者认为,平台加组件的模式会横扫一切组织形态,包括国家、城市和产业,整个社会都会全面向平台化发展。
关键词:人工智能;应用领域;实际应用
1. 人工智能中智能体的功能
1.1人工智能
人工智能是以知识为对象,研究知识表现、知识获取、知识挖掘等的学科。从其功能来看,人工智能即参照人类智能活动的客观规律,借助一定的智能体,模拟人类的思维执行诸如判断、推理、识别、决策、检测等活动。
1.2智能体
人工智能必须借助一定的智能体来实现,也就是说,智能体是人工智能的载体。因此,分析人工智能就要借助智能体来阐述。一个性能良好的智能体,应尽量准确捕捉用户的用意,通过对环境的感知,敏锐地获取相关信息和知识,并根据环境的数据变动适时作出调整,高效执行用户指令,完成用户指定的任务。
1.2.1单智能体的功能
依照智能体的功能,人们通常将智能体划分为思考型、反应型、混合型三种。
图1 思考型智能体的功能示意图
思考型智能体主要通过用户根据目标或任务,下达行动指令,用知识和计划指导行动,并根据行动的反应,对环境进行感知,智能体感知内部状态等对环境状态,适时对动作进行调整,实现思考型智能体的功能。
图2 反应型智能体的功能示意图
反应型智能体主要通过规则动作指导行动,并利用智能体对环境状态的感知,指导规则动作对环境作出适应性改变,实现反应型智能体的功能。
图3 混合型智能体的功能示意图
混合型智能体的功能较为复杂,它通过智能体对环境的一般、紧急情况作出反应,对环境状况建模,对环境可能发生的情况进行预测,与其它智能体进行交流,共同指导决策,指导行动的准确性。
1.2.2多智能体的功能
多智能体即通过多个智能体间的相互协调,共同配合,构成一个综合智能体,联合达成一个任务。每个成员智能体有着各自的目标和动作,可以不受其他成员的限制,自主执行自身的动作规则,利用各个智能体间的竞争与协调,化解多个智能体间的矛盾与冲突,实现多智能体的任务,体现多智能体的功能。在多智能体的综合功能下,各个智能体作为综合功能的子功能,每个智能体都具有较高的适应性,能够根据问题,进行规划和推理,判断应该采用的策略,对环境施加影响。多智能体基于简单的设计理念,具有有利于建模,可扩展性强,管理方便,能够节省构建成本,明白易懂等特点。通过多智能体,可以面向对象,实现智能体的多元化和多层次性的构架,缓解了综合系统的复杂性,也缓解了各个系统解决问题的复杂性,并通过协调与协作,提高解决问题的效率,提高整个系统行动的效率。
2. 人工智能的主要应用领域
2.1人工智能在教育的应用
2.1.1教师辅导的智能化
人工智能在教育的应用,主要表现在利用Agent技术,实现智能化教学。Agent技术是一种基于分布式的智能技术,通过智能体Agent,可以实现自主学习的功能,并根据感知自身和环境状态,采取相应的行动,达成系统规定的目标或任务。Agent具有多种优势,诸如可以自主完成行动,快速对动作做出反应,协作能力强,系统处于开放状态,通信性能好,能够随时随地进行行动等。多Agent系统由多个成员Agent组成,各个成员Agent都有既定的动作,通过成员hgent间的通信,获知相关信息,共同协调完成整个系统的复杂任务。Agent在智能化教学中的主要功能:对教学过程进行跟踪监控、教学分析、教学信息的整理、辅助学习、学习方法建议等。通过上述功能,能够适时监督学生的自主学习和教师的辅导,并能够结合学生的学习行为、学习效果等,提供有效的学习指导,实现教师辅导工作的智能化。
2.1.2教学资源的智能检索
目前,各种网络教学资源五花八门,信息量非常大且较为分散,并且各种教学资源还在不断的增长,给学生和教师利用教学资源带来相应的困难。智能检索系统的应用,能够帮助学生和教师在海量信息中,快速准确地搜索到所需信息,节省学生或教师的检索时间,提高用户检索效率。
2.1.3智能化评价
随着现代教育的发展,运用专家系统技术,通过网络考试系统,采用智能组卷算法,实现自动组织考卷。通过试题库,依照既定规则,对精选的试题进行筛选,实现自适应的试题测试功能。根据相关需要,设计自动评卷功能,对考试结果进行评价,并可根据需要对考试题型进行评价。
2.2数据挖掘技术
2.2.1数据挖掘技术
数据挖掘技术,就是通过揭示数据间的关系和数据的存在模式,对数据和数据库进行处理的技术。它是人工智能、数据库管理、仿真等多学科交叉的边缘学科。数据挖掘技术的应用,为工商、科研工作的发展提供了较多的新方法,对工商业与科学研究都具有非常重要的意义。由于数据挖掘技术蕴含着知识表现、知识获取和知识挖掘等理念,使得其与人工智能的功能如出一辙,很多人认为数据挖掘技术应该是人工智能的一支。从实际来看,虽然数据挖掘技术与人工智能有相应的交集,但它已经成为一个独立的系统,具有更为丰富的内容体系,与人工智能、机器仿真、OLAP、专家系统等都具有相关性,其规则、分类、算法等都自成体系,体现出数据挖掘技术的博大精深。
2.2.2数据库的知识发现
通过数据挖掘技术,对数据库中的知识存量进行充分的研究,从中找出潜在的规律性,从而利用数据的相关性分析,挖掘出蕴含在数据中的抽象知识,揭示数据所表现的客观世界状况,从中得出相关的本质和规律,从而自动获取知识。知识表现所概括的是数据所揭示内容的概念,比数据本身更有应用价值。
2.3智能检测技术的应用
2.3.1智能机器人研究
在智能机器人的研究中,研究者更加关注对机器人的行动进行智能控制,也就是说,研究者在给定机器人任务后,必定要根据任务设计相关的动作规则来实现任务,然后根据智能控制,使机器人的行动达到研究者的预期目的。
2.3.2对流水线的智能监控
很多工厂的生产流水线,都需要通过过程监控,保障产品质量和系统性能。很多企业已经采用人工智能对流水线进行监控 ,确保流水线的物理参数精度,实现流水线的高效和产品的优质。例如汽车工业的模糊逻辑智能控制,轧钢厂的神经元智能控制,水泥旋窑的模糊智能控制等。
2.3.3故障的智能诊断
一般情况下,智能系统根据检测到的故障状况,对照系统存储的相关诊断数据和信息,判断系统、器官、元件等出现故障的原因,采用系统给定的信息进行故障处理,及时排除故障,提高系统的稳定性和可靠性。故障的智能诊断系统构架主要有:故障信息库、诊断信息、数据接口、数据库等。例如,飞控系统的故障诊断、雷达的专家诊断等。
2.3.4医疗领域的专家系统技术
从上世纪70年代,医疗领域已经开始广泛应用专家系统技术。例如在外科手术中,采用模糊逻辑控制,通过模糊函数与语言,准确把握病人的麻醉深度,实现对病人麻醉深度的智能控制。
3. 人工智能的实际应用
3.1机器人在教育界的应用
3.1.1模拟教学
根据教材的安排,对某些需要解释的现象进行机器人模拟演示,让学生认真观察,从中发现一定的规律,使学生加深对规律性的认识和理解。如数学教学中的抛物线轨迹演示,物理教学中的阿基米德定理演示等,都能够利用直观的演示,揭示其中的规律,使学生加深对相关知识的理解。
3.1.2人机交互的辅导方式
利用机器人辅导学生学习,可以通过人机交互,为学生提供量身定制的辅导模式,使学生的个性得到充分发展。采用微型机器人与学生的交互辅导,可利用微型机器人其体积小、重量轻,便于携带等优点,随时随地进行学习,随时为学生解决问题,提供学习指导。利用家庭机器人与学生的交互辅导,承担家庭教师的职责,有利于学生问题的适时解决,也有利于学生的学习得到及时的巩固。通过软件机器人与学生的交互辅导,可以对学生的学习情况进行分析,为学生制定专门的指导计划,提高学生的学习质量。
3.1.3仿真训练
在教学中,教师可以利用机器人,将相关内容通过机器人的演示展现给学生,减轻教师的负担,并能够通过规则的动作,使教学更为规范。例如,用机器人示范体育高难动作,可以将动作分解、定格、重复播放等,从多方位展示动作,使学生能够充分掌握动作的规范,比教师的示范更为科学,也更为有效。
3.1.4机器人远程教育
通过机器人,可以通过对学生的特征数据分析,建立学生模型库,根据学生的个性,同时对多名远程教育的学生实施个性化教学和辅导,提高远程教育的效率,实现远程教育的智能化。
3.1.5激发学生的学习兴趣
机器人为学生创设富有情趣的教学环境,根据教学任务,采用与学习相关的游戏,调动学生的学习积极性,使学生在尽可能短时间内,掌握需要了解的知识点,提高学习效率。
3.2数据挖掘技术的实际应用
数据挖掘技术的应用领域较为广泛,主要有:
(1)商业领域
商业领域是最早应用数据挖掘技术的重要领域。通过数据挖掘,对产品销售数据进行分析,对产品进行市场定位;根据消费者需求分析,对产品的销售进行预测,调整产品营销策略;根据市场销售情况,制定合理的库存,减少资金的占用;对顾客的购买行为模式进行识别,据此布置货架,适应顾客的购买习惯;通过食品的滞销、畅销分析,制定相应的促销手段和促销时间,避免商品过期积压等等,使数据挖掘技术在商业领域得到极为广泛的应用。
(2)金融业
利用金融服务的各种卡品信息,分析客户的需求,了解客户的存款和贷款信息,对存、贷款趋势作出科学预测,从而制定合理的存、贷款优惠策略;对金融交易活动进行监控,从中提取有用信息。例如,有信用卡客户对私家车感兴趣,金融机构就可以将信息告知汽车销售部门,并为客户提供量身定制的贷款服务。
(3)工业生产
在产品销售环节,工业生产企业对数据挖掘技术的应用与商业领域的应用大致无异。随着市场竞争的激烈,很多工业生产厂家已经通过数据挖掘技术对生产过程进行动态监控。
(4)网络应用
随着信息流量的增大,简单的索引与搜索系统已经很难满足网络用户的需要,有待开发高层次的搜索引擎来适应网络不断的发展,智能化的搜索引擎带给用户的是快捷、高效与易用,使其成为今后搜索引擎的应用趋势。
(5)其它方面的应用
通讯公司利用远程通信,及时了解客户信息,创新客户服务,拓展新的业务,扩大市场影响力,赢得最佳效益。高校利用数据挖掘技术,了解生源信息,将学校的专业信息发送给目标生源;对教师的情况进行分析,从中找出关联性,有针对地制定教学方案,有效提高高校的教学质量。医药公司通过对医生处方分析,了解医生的用药情况,可以制定合理的供货计划和营销策略。旅游机构对旅游团体进行分析,可以采用有效的旅游模式,吸引更多的旅游团体。利用卫星遥感技术获取的数据,提高天气预报的准确度。
3.3人工智能在检测系统的应用
人工智能在检测领域的应用非常广泛,如前面介绍流水线的监控、智能故障诊断、专家技术系统等,现对网络入侵的智能检测系统加以简要说明。
3.3.1网络入侵专家检测系统
该系统的智能化程度高,用户不用干预专家系统的推理。然而,其系统信息是建立在专家知识的基础上,必然受专家认知网络攻击模式的限制。该系统的构建基于以下几点:首先,采用安全入侵规则的描述方式,如判断树描述、图形描述等。其次,通过合理推理,参照专家库的规则,判断网络安全状况,检测是否有入侵行为发生。最后,更新专家库,调整专家规则,结合神经网络技术,利用神经网络技术的敏感性与快速反应能力,不断增强系统的自适应功能,提高系统检测能力。
3.3.2入侵统计智能检测系统
该系统主要对异常的安全问题进行检测。它通过建立正常行为模型,对照进行网络入侵检测,检测出正常行为有较大偏离,则视为异常。首先,确立门限值,统计某一事件在特定时间出现的频率,检测是否超出门限值,判断系统是否异常。其次,设定事件度量均值、度量标准偏差的置信区间,统计系统的两个参数值,判断系统是否偏离区间,检测系统异常与否。最后,根据事件的矩阵数据,对事件转移的概率进行统计分析,结果小则预示存在异常。
参考文献:
[1] 于大方.浅析人工智能及其应用领域[J].科技信息.2008(23)
[2] 张鹏.智能机器人辅助教育及其应用[J].中国电化教育2009(2)
[3] 龚成清.基于人工智能的网络入侵检测系统设计[J].南宁职业技术学院学报.2009(5)
[4] 张睿.浅论数据挖掘技术及其应用[J].成功(教育版). 2009(10)
现在的机器拥有超强的计算能力,能识别对象并实时翻译讲话。人工智能终将变得越来越聪明。
重要性:如果计算机能够可靠地识别模式并对外部世界的发展趋势给出正确推论,那么,它可以更有效地帮助人类。
突破:这种人工智能方法可以放之四海而皆准,广泛应用于多个领域。
重要参与者:谷歌公司、微软公司、IBM公司、加拿大多伦多大学的杰弗里·辛顿教授。
美国发明家、预言家雷·库兹韦尔曾发明了盲人阅读机、音乐合成器和语音识别系统。2012年7月,库兹韦尔拜访了谷歌公司的首席执行官拉里·佩奇,但他的目的并非为了找工作。库兹韦尔是一名受人尊敬的发明家,也在变成研究机器智能的未来学家。他想与已经看过他即将出版的《如何创建思维》这本书手稿的佩奇讨论此书,他对佩奇表示,他想创办一家公司来实现自己的想法——建造一台真正的智能计算机:能够理解语言,接着进行推论然后自己做出决定。
很显然,这样一种尝试需要谷歌公司海量的数据库和无与伦比的计算能力。佩奇对库兹韦尔说:“我可以给你一些权限,让你使用我们公司的数据库和计算机,但是,靠一家公司单打独斗,很难做成这件事。”因此,佩奇建议除了自己开公司,从没有在其他公司工作过的库兹韦尔加入谷歌。库兹韦尔很快做出了决定:今年2月,他正式入职谷歌,成为该公司的工程部主管。库兹韦尔说:“50多年来,我专注研究人工智能就是为了这一刻。”
吸引库兹韦尔的不仅包括谷歌公司的计算资源,而且,也包括该公司在人工智能的新领域——深度学习方面所取得的令人惊叹的进步。深度学习软件试图模拟大脑新皮质内神经元的活动,新皮质是哺乳动物大脑皮质的一部分,在脑半球顶层,大约2到4毫米厚,分为6层,占据大脑80%的这些皱褶正是人类思想的发源地。深度学习软件能非常真切地学会识别用数字形式表示的声音、图像和其他数据的不同模式。
几十年前,就有科学家提出了深度学习的基本思路:软件能用人造“神经网络”来模拟大脑新皮质中的神经元阵列,几十年来,研究这一领域的科学家们可谓喜忧掺半。但是,得益于数学公式的改进和计算能力的提升,计算机科学家现在能为更多虚拟神经元建立模型。
随着科学家们的研究不断深入,现在,这些软件在语音和图像识别方面取得了可喜的进步。去年6月,谷歌研发的一套深度学习系统证明,其在YouTube视频的1000万张图像中识别出诸如猫等物体的准确度为此前任何一个图像识别系统的两倍。谷歌还利用该技术,降低了其最新研发的安卓(Android)手机软件的语音识别的错误率。去年10月,微软首席研究官里克·拉希德在中国演讲期间,向与会来宾演示了一款令人惊叹不已的语音软件。该软件可将拉希德的口头发言转录成英文文本,错误率仅为7%,之后,再将英文文本翻译成汉语文本,然后模仿他的口音用普通话说出那些文本。同样在去年10月份,一个由三名研究生和两位教授组成的团队赢得了化学与制药公司默克公司举办的一场竞赛,竞赛的主旨是鉴别出可导致新药的分子,该团队正是采用深度学习的方法,将目标对准那些最有可能与靶标绑定的分子,从而取得了成功。
谷歌目前已经成为一块极富吸引力的磁铁,吸引着全球研究深度学习和相关的人工智能领域专家纷至沓来。2013年3月,谷歌收购了由加拿大多伦多大学计算机科学教授杰弗里·希顿创立的深度学习企业DNNresearch,希顿也曾获得过默克大奖。希顿目前将自己的时间一分为二:一半给大学;一半给谷歌。辛顿表示,他计划“将这一领域的理念提取出来,用来解决实际问题——诸如图像识别、搜索、自然语言理解等方面的问题”。
上述研究进展时刻在提醒人工智能研究领域的专家们:科幻小说和电影中出现的机器终将出现在现实生活中。的确,机器智能已渗透到各行各业并在逐步改变这些行业的面貌,从通讯、计算到医疗、制造以及运输等,不一而足。IBM研究的超级计算机Watson在美国著名的智力比赛中获胜让这一切得以彰显。Watson也使用了一些深度学习技术,而且,科学家们现在也在训练它帮助医生做决定。微软也在手机操作系统Windows Phone和Bing语音搜索中用到了深度学习技术。
然而,要想将深度学习技术从语音和图像识别领域扩展到其他应用领域则需要科学家们在概念和软件上做出更大突破,而且还需要计算能力的进一步增强。或许,在几年内,我们不会看到计算机能自己思考,但几十年内或许可以。微软美国研究院的院长皮特·李说,深度学习已经引发了人工智能领域很多新的大挑战。
建造大脑
当然,有挑战就会有人想解决办法,一直有一些富有竞争力的方法来应对这些挑战。现在,人们已经可以将现实世界的信息和规则“喂给”计算机,为了做到这一点,需要程序员们不辞辛劳地编写这方面的软件。这会耗费大量人力物力,但是,系统仍然无法处理模糊数据,这些程序的使用范围仅限于一些受控的应用领域,诸如手机的菜单系统等,该系统要求你通过说出特定的词语来提要求。
人工智能领域出现后不久,神经网络也于上世纪50年代开始兴起。神经网络似乎很有前景,因为它们试图模拟大脑的工作方式,尽管采用的是一种非常简化的形式。程序能标示出一套虚拟的神经元然后随机给它们分配数值或者“权值”,以让它们之间相互关联。这些“权值”决定了每个模拟的神经元的反应——用数值输出0和1来表示,通过这种方式可以对图像中的边框或者蓝色阴影、话语中的一个音素的某个能级等特征进行数字化表达。
程序员需要训练神经网络通过用含有这些物体的图像或含有这些因素的声波的数字化后的版本来探测一个物体或者音素。如果该网络无法精确地识别某个特定的模式,将会有一个算法来调整这些权值。这种训练的最终目的是让网络能够持续一致地识别出语音或者图像中的这种模式,也就是说,识别出每句语音中的音素“d”或者每幅图像中的狗,这同小孩子通过观察人们称作狗的动物的头型、行为以及毛皮、吠声等等来认识狗如出一辙。
但是,早期的神经网络一次能模拟的神经元的数量有限,因此,它们无法识别出复杂程度很高的模式,这种情况一直持续到上世纪70年代。
在上世纪80年代中期,辛顿和其他人使用所谓的“深度”模型,引发了神经网络研究的新一轮复兴,深度模型能更好地利用软件模拟多层神经网络。但是,这一技术仍然需要大量的人力投入:程序员们不得不在将数据填入神经元网络前给每个数据贴上标签。而且,复杂的语音或者图像识别所要求的计算能力彼时也让人望尘莫及。
在过去十年里,辛顿和其他研究人员才终于做出了一些根本性的概念上突破。2006年,辛顿研发出了一种更有效地训练单层神经元的方法。即第一层网络学习一些基本的特征,诸如图像的边缘或者声音的最小单元等。它通过发现那些出现频率反常高的数字化后的像素或者声波组合来做到这一点。一旦第一层精确地识别出这些特征,那么,它将被“喂给”第二层,以便第二层训练自己识别更复杂的特征,诸如边角或者声音单位的组合等等。这一过程在多层之间不断重复,直到该系统能够可靠地识别出音素或者对象为止。
就像上面提到的图像中的猫。去年6月,谷歌演示了迄今最大的神经网络,其拥有超过10亿个节点。美国斯坦福大学的计算机科学教授安德鲁·恩格和谷歌的科学家杰夫·迪恩让系统从1000万个随机选择的YouTube视频上挑出了猫的图像。在该软件模型中,一个模拟的神经元主要注意猫的图像。其他神经元则专注于人脸、黄色的花朵以及其他物体的图像。因为深层学习拥有的强大功能,尽管此前并没有人给这些图像贴上标签,该系统还是识别出了这些互不相干的对象。
然而,让某些人工智能专家深感震惊的是深度学习在图像识别领域所取得的惊人成就。该系统可以给YouTube视频中的对象分类,并添加主题,准确率达16%,尽管听起来并不是很高,但与以前的方法相比,准确率提高了70%。迪恩强调称,要知道,YouTube视频中的对象总共有2.2万个类别,大部分人都无法做到这一点。当该系统被要求将图像分成1000多个常见类别时,准确率一下子飙升到50%。
大数据
在实验中训练多层虚拟神经元占用了谷歌公司的1.6万台计算机处理器,谷歌公司研发这些计算基础设施的目的是用于搜索引擎和其他服务。机器学习新兴公司Vicarious的联合创始人迪利普·乔治称,人工智能领域最近取得的进步80%要归功于计算能力的增强。
然而,谷歌庞大的数据中心深度学习飞速发展只是这枚硬币的一面,谷歌的操作策略则是这枚硬币的另一面,这些操作策略就是,将计算任务分开,让不同的计算机执行不同的操作以便很快完成这些任务。这是迪恩早期的研究成果,迪恩已在谷歌工作了14年。这一策略让深度学习神经网络的训练速度大大提高,使谷歌能够运行更大的网络并朝这些网络填入更多数据。
而且,深度学习也提高了智能手机上声音搜索软件的性能。直到去年,谷歌的安卓(Android)手机软件使用的方法还会弄错很多单词的意思。但是,在准备于去年7月新安卓系统的过程中,迪恩领导的研究团队用基于深度学习的系统取代了部分语音系统。因为多层神经元能对一个声音的多种变形进行更精确的训练,所以,该系统能更可靠地对各种支离破碎的声音进行识别,尤其是在地铁等嘈杂环境中的声音。因为新系统能够更好地理解话语所表达的真实意义,因此,返回的结果可能也会更加精确。几乎一夜之间,错误率下降到了25%,结果好得出乎人意料之外,有些评论家现在甚至认为安卓的语音搜索功能比苹果手机最著名的Siri语音助手还要更智能。
尽管上述诸多进展令人欢欣鼓舞,但是,并非每个人都认为深度学习会助推人工智能超越人脑。有些批评家表示,深度学习和人工智能从根本上忽略了大脑生物学的很多方面,太过于注重计算能力。
其中一个批评来自手提微型电脑Treo的发明者、PalmComputing公司的创办人杰夫·霍金斯,2004年,霍金斯就出版了《人工智能的未来》一书,主要讨论大脑如何工作以及如何为建造智能机器提供引导。
霍金斯上一个风险投资是Numenta公司,这是一个令人兴奋的新公司,它试图建立像人脑一样的计算机,该公司正在研发一种机器学习系统,其在生物学上受到了深度学习理论的启发,但并不使用深度学习。Numenta的系统能够帮助预测能源消耗模式以及诸如风车等机器失败的可能性。
霍金斯表示,深度学习无法解释时间的概念。他说,大脑会处理传感数据流,而且,人类的学习依靠回忆模式序列:当你观察到一只猫在做某些有意思事情的视频,有意义的是运动本身,而非谷歌在实验中使用到的一系列静止图像。霍金斯说:“谷歌的态度是,数据弥补了一切。”
不过,即使数据不能弥补一切,诸如谷歌等公司用来解决这些问题的计算资源也不会被弃置。深度学习的支持者们强调说,这些数据非常关键,因为大脑本身比今天的任何一个神经网络都要复杂得多。他们表示:“人类需要很多计算资源来使思想更好地工作。”
敢问未来之路在何方?
尽管谷歌对深度学习的未来应用并不那么确定,但是,其前景确实慢慢在发酵。显然,更好的图像搜索能够帮助YouTube。而且,迪恩表示,深度学习模型能使用语音数据来更快地训练系统识别其他语音数据。更复杂的图像识别技术有望使谷歌的自行驾驶汽车表现更好。而且,深度学习和人工智能软件也将帮助谷歌和其广告客户更好地了解人们的想法与需求,从而对广告营销产生重大影响。
上述美好畅想正是吸引库兹韦尔的魅力所在,65岁的库兹韦尔多年来一直潜心研究智能机器。在高中阶段,他就编写软件使计算机能够制造出不同形式的音乐,并于1965年在电视秀节目《我有一个秘密》中进行了演示。从那时起,他的发明囊括了多个第一:第一台盲人阅读器;第一个可以对要打印的任何字体的文本进行扫描并数字化的软件;第一个能再造交响乐器的声音的音乐合成器;第一个具备大型词典的对话识别系统。
他现在的设想是,未来,人们的手机通讯录中会有一个“网络朋友”,可以在用户允许的情况下阅读电子邮件、追踪用户的一举一动,因此,当你有任何问题时,他都会告诉你答案。这并非他在谷歌的直接目的,但是,这一目的与谷歌联合创始人谢尔盖·布林的目标相吻合。在公司成立之初,布林就表示,他想建造《2001太空漫游》中人工智能电脑HAL9000(HAL9000作为太空船的总控制电脑,既具有电脑对任务的绝对服从及精确性,又具有人类思维甚至感情,它在太空旅行中设计害死了除戴维之外的所有宇航员,最后戴维让其停止运行)那样的智能机器,唯一不同的是,他制造出来的机器不会杀人。
库兹韦尔目前的目标是帮助计算机理解甚至表达自然语言。他说:“我的使命是让计算机对自然语言有足够的理解力,然后来做有用的事情——更好地进行搜索、更好地回答问题。”最终,他希望制造出比IBM公司的Watson更好的机器——尽管他很欣赏Watson表现出的理解能力和快速反应能力。
库兹韦尔并不仅仅专注于深度学习,尽管他承认他的语音识别方法也同样基于大脑如何工作的理论。他想给单词、词组以及句子的本来意义建模,包括容易让计算机犯错的模糊意义。他说:“我想寻找一种图画式的方式来表达语言的语义。”
这就需要一种更综合的方式来用图表表示句子的句法。谷歌也在使用这种分析方法改进翻译中的语法。更好地理解自然语言将需要计算机能够掌握我们人类认为是常识的意思。为此,库兹韦尔将会用到谷歌的知识图谱——谷歌对大约7亿个主题、方位、人等进行的分类以及它们之间的几十亿个关系。知识图谱去年投入使用,会给搜索者提供问题的答案而非只有链接。
最终,库兹韦尔计划用深度学习算法来帮助计算机处理“语言中的软边界和模糊内容”。这听起来令人有点望而却步,实际情况也的确如此。他说:“理解自然语言并非像搜索那样,是一个在某个时刻就可以完成的任务,它是一个永远也无法完成的计划。”
尽管库兹韦尔的设想可能需要多年才能变成现实,在可见的未来,深度学习可以在语音和图像识别之外的其他领域找到用武之地。首先,在药物发现方面——辛顿的团队在默克大赛中取得大奖就证明了这一点。