首页 > 文章中心 > 计算机视觉发展报告

计算机视觉发展报告

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇计算机视觉发展报告范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

计算机视觉发展报告

计算机视觉发展报告范文第1篇

关键词 模式分析 计算机视觉 教学改革

中图分类号:G643.2 文献标识码:A DOI:10.16400/ki.kjdkz.2016.03.015

Research and Practice on Course Group of Pattern Analysis and

Visual Processing for Graduated Students

SUN Han, CHEN Songcan, LIU Ningzhong, HUANG Yuanyuan, ZHU Qi

(College of Computer Science and Technology, Nanjing University of

Aeronautics and Astronautics, Nanjing, Jiangsu 210016)

Abstract By analyzing the teaching status of pattern analysis and visual processing course group, this paper puts forward the new teaching goal, which includes improving students' international vision, the ability of linking theory with practice, and promoting the engineering practice ability and innovative consciousness. Then this paper discusses the whole process of course group reform. Firstly the structure of teachers' group is optimized. And then the knowledge system of course group is sorted and the teaching mode is improved. Finally the practice system of course group is optimized and the assessment system is reformed.

Key words pattern analysis; computer vision; teaching reform

1 背景

我校模式分析与智能计算研究所师资团队是江苏省“青蓝工程”创新团队,主要研究领域包括智能数据分析、图像处理和机器视觉等方向,承担研究生和本科生的模式识别、机器学习、数据挖掘、智能信息检索、数字图像处理、计算机视觉等课程的教学任务。以往的教学过程中虽然积累了丰富的教学经验,但当前新知识不断涌现、新技术发展迅猛,对模式分析与视觉处理课程群的知识体系、实践体系改进提出了新的挑战。

近年来,国内外高校在该类课程教学上,已涌现出众多新理念、新方法。Coursera联合创始人Andrew Ng推出的机器学习课程,开启了教育领域的MOOC时代,引领了教育教学方法的新革命。①深圳大学、②江苏科技大学③分别进行了基于CDIO工程教育理念的计算机视觉课程教学改革实践,实现多层次项目设计的教学模式改革,讲座式、讨论式、实践式教学方法的探索。国防科技大学④在计算机视觉课程中引入研讨式教学模式,通过案例教学、小组研讨的方式来替代传统的教学方式。华中科技大学⑤从教学内容国际化、教学方式国际化、教学成果国际化三个方面开展了计算机视觉课程的国际化建设。另外,也有高校进行了图像工程课程群建设,⑥基于图像分析与计算机视觉应用课程结合的项目协同创新能力培养实践。⑦

在分析上述国内外高校该类课程改革的基础上,我们重点以模式分析与视觉处理课程群的实践教学体系改革为切入点,优化师资队伍结构,梳理课程群知识体系,优化课程授课模式,完善课程群实践体系,改革实践考核模式,实现学生国际化视野、理论联系实际、工程实践和创新能力全面提升的目标。

2 模式分析与视觉处理课程群特点

模式分析与视觉处理课程群涵盖了模式识别、机器学习、数据挖掘、数字图像处理、计算机视觉等多门课程。该类课程存在以下特点。

(1)该类课程属于多学科交叉,涉及的知识面既广又深。由于该方向涉及计算机科学与技术、应用数学、自动化、电子科学与技术、信息工程等多学科内容,而学生在大学本科阶段很难学习和了解如此多的知识模块,这对研究生阶段学习来说,具有相当大的挑战。同时,对于每个知识模块,所要求的数学基础较高,理论具有相当的深度,理解和掌握不容易。

(2)该类课程既重视扎实的基础理论,也强调良好的工程实践能力。该类课程的基础理论教学一直受到各高校的重视。随着近年来产业界的迅猛发展,计算机视觉应用层出不穷,对学生的工程实践也提出了更高要求,需要能够在系统层次上有整体认知,同时要能对各功能模块进行优化,提升系统的整体性能。

(3)该类课程所面向的选修学生面广。该类课程既是多学科交叉,也面向计算机应用、电子科学与技术、自动化、应用数学等不同研究方向、不同水平层次的研究生开设。这对课堂教学和实验实践也带来更大挑战。

3 模式分析与视觉处理课程群改革举措

针对上述分析的课程群特点,我们重点以实践体系改革为突破口,通过优化师资队伍结构,梳理课程群知识体系,优化课程授课模式,完善课程群实践体系,改革实践考核模式等举措,实现学生国际化视野、理论联系实际、工程实践和创新能力全面提升的目标。

3.1 师资队伍结构优化

为了学生能够适应模式分析与视觉处理产业的快速发展,在课程群建设过程中更强调学生的工程实践和创新能力培养。这首先对师资队伍结构提出了新的要求。

近年来,课程教学团队引进海内外具有深厚理论功底和较强工程能力的高水平师资4名,大大充实了机器学习、数据挖掘、图像处理等课程的教学力量。对于现有教师队伍,鼓励教师跟产业一线企业广泛合作,目前已与华为、中兴等企业在视频检索、智能交通视觉处理等方面开展了实质合作。这些来源于产业界的高质量课题对科研和教学起到了良好的促进作用。

与此同时,通过研究生工作站、企业短期实习等渠道,鼓励企业高级研发人员参与到学生实践能力培养环节中,将实际项目进行适当切分或提炼,实现该类课程实践环节的模块化、专题化训练。

综上,通过引培并举,优化校内师资队伍结构;通过校企合作,积极吸引企业师资参与。良好的师资队伍为该类课程的实践体系改革提供了有力支撑。

3.2 课程群知识体系梳理与授课模式改革

模式识别、机器学习、数据挖掘、智能信息检索、数字图像处理、计算机视觉等课程既有一定的逻辑关系,也存在相互交叉的混杂关系。一般认为,模式识别、机器学习是模式分析与视觉处理领域的基础理论课程,数据挖掘是建立在模式识别、机器学习和数据库基础上的应用类课程,智能信息检索则是数据挖掘基础上更为具体的应用实现。数字图像处理为计算机视觉课程提供了基础支撑,计算机视觉则是在综合利用模式识别、机器学习、数字图像处理、数据挖掘等知识模块基础上面向应用的系统实现。但是,这些课程也存在着知识点的交叉或重复。例如,模式识别和机器学习中都有贝叶斯参数估计、支持向量机模型等知识点,但视角和侧重点有所不同;图像处理、计算机视觉中都有颜色模型、成像模型等知识点,也同时存在与模式识别、机器学习交叉的知识点。

我们针对来自不同研究领域的学生群体,对该课程群的知识点进行系统梳理,既避免知识点的重复讲授,也防止重要知识点的缺漏。课程教师集体讨论,形成每门课程的核心知识集,和针对不同研究领域的选讲知识集。学生在学习课程时,在掌握核心知识集的基础上,结合自己的研究方向选择相关的选讲知识集学习。

在课程教材和参考书的选择上,注重挑选国际上有影响力的教材。例如,模式识别的参考书为Richard O. Duda等人编著的Pattern Classification;机器学习的参考书为Tom M. Mitchell编著的Machine Learning和Christopher M. Bishop编著的Pattern Recognition and Machine Learning;数据挖掘的参考书为Jiawei Han等人编著的Data Mining:Concepts and Techniques;数字图像处理的参考书为K. R. Castleman编著的Digital Image Processing;计算机视觉的参考书为D. A. Foryth编著的Computer Vision: A Modern Approach和Richard Szeliski编著的Computer Vision: Alogrithms and Applications。这些教材已被国内外著名大学普遍采用。同时,每门课程都提供相关的国内外顶级会议和期刊的列表,供学生课后追踪研究领域的热点问题。

在课堂授课环节上,注意采用灵活多样的授课方式。对于核心基础知识模块,以教师讲授为主,同时提供国内外该类课程的热门MOOC网址给学生参考。对于选讲知识模块,鼓励学生事先结合各自研究方向有目的自学,在学生报告的基础上进行课堂讨论方式进行。充分发挥学生学习的主体作用,也便于教师了解学生的水平和学习状况。

除此以外,不定期邀请国内外著名学者来校做学术报告,让学生充分了解该研究领域的最新前沿动态,并就热点问题进行专题讨论。

3.3 课程群实践体系完善与考核方式改革

工程实践和创新能力的培养是该课程群改革的重要目标。我们在上述师资队伍结构优化、课程群知识体系梳理与授课模式改革的基础上,着力进行课程群实践体系的改革与完善。我们通过多层次菜单式的实验项目选择、项目牵引的创新能力训练、学生综合研究能力的全面考查等方面来实现。

首先,整合和优化课程群实践内容,实现多层次菜单式灵活选择。根据各研究领域的要求进行灵活搭配,根据学生个体的能力与水平选择适当规模和难度的实践内容,通过课程内的基础实验、课程间的综合实验、课程群的创新实验来选择和组合,如图1所示。

图1 多层次菜单式实验内容示意图

基础型实验内容主要是各课程核心知识点的实验验证,主要包括模式识别,机器学习,数据挖掘,图像处理与分析,计算机视觉等课程的实验。要求选课学生对这些基础实验必做,打下良好的研究基础。

综合探索型实验在基础型实验基础上,既有单门课程内总的综合实验,也有课程间知识的综合应用。主要分为两大块,包括模式分析与机器学习方向的综合实验,以及图像处理与机器视觉方向的综合实验。实验目的主要是针对这两大块方向重点知识的综合分析和比较,能够熟练掌握和灵活应用。例如模式分析、机器学习、数据挖掘等方向都用到的线性判别分析、支持向量机、均值聚类等内容;图像处理与机器视觉中的图像特征抽取、视觉系统选型、目标检测、特定平台的算法优化等内容。学生可根据各自研究方向有目的的选择两块综合实验的大部分内容。

在综合型实验基础上,该课程群通过若干创新型实验来检验学生理论知识掌握程度和实践方法应用能力,为后续的研究课题开展打下良好的科研素养。主要内容包括人脸识别、二维条码识别、车辆属性识别、智能视觉监控、以及企业来源的关键技术等。这些项目实践既涉及用到图像处理与机器视觉的内容,也涉及模式分析与机器学习方向的知识。并且需要学生在综合运用相关知识的基础上有创新能力。

其次,重视各类项目牵引的创新能力训练。一方面,鼓励教师从国家自然科学基金、企业合作项目等研究中提炼出问题规模和难度适中的训练项目,作为课程群的综合能力训练项目。另一方面,鼓励学生参加挑战杯、全国研究生智慧城市技术与创意设计大赛等各类具有挑战性的竞赛项目,以赛代练,提升学生的工程实践和创新能力。同时,也鼓励学生利用百度、微软等相关研究领域的企业实习机会,参与产品一线的工程实践能力训练。

再次,注重考核环节,实现科研素养和实践能力的全面考查。只有严格、公平、公正的考核,才能保证实验实践的质量和水平,才能提升学生的科研素养和实践能力。我们主要在手段、方式方法上进行了改进。在题目选择上,根据学生个体水平和研究领域要求的差异,在选题上有适当的难易区分度,让每位学生都有锻炼和提升的机会;在考核方式上,采用结题书面报告来检验学术论文的写作能力,采用程序演示检验系统的设计与实现水平,采用上台汇报的方式检验学生的表达能力,多管齐下全面检查学生的综合科研素养;在考核成绩评定上,采用现场教师和学生共同评分的方式,公平合理;最后,通过网站展示、发表学术小论文、专利、软件著作权等方式展示和公开优秀成果,激发学生的学习热情,并由此形成积累,有利于学生实验实践氛围的传承。

4 结语

本文在分析国内外高校模式分析与视觉处理类课程群改革现状的基础上,以学生国际化视野、理论联系实际、工程实践和创新能力全面提升为目标,重点开展了师资队伍结构优化、课程群知识体系梳理、课程授课模式改革、课程群实践体系完善和实践考核模式改革等工作,取得了良好的效果,并为校内其他课程群的教学改革作为示范推广。

注释

① https:///learn/machine-learning/

② 郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践.理工高教研究,2010.29(5):98-100,148.

③ 史金龙,白素琴,庞林斌,钱强.研究生机器视觉课程的CDIO教学改革实践.计算机教育,2013.9:40-43.

④ 陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式.当代教育理论与实践,2013.5(7):112-114.

⑤ 王岳环,桑农,高常鑫.计算机视觉课程的国际化教学模式.计算机教育,2014.19:101-103.

计算机视觉发展报告范文第2篇

1)等高线生成及等高线分析:等高线图是人们传统上观测地形的主要手段。可以在等高线图上精确地获知地形的起伏程度、区域内各部分的高程等等。等高线图可以从格网数字地形模型仍TM)中获取,也可在不规则三角形格网T(NI)中生成。

2)立体透视图分析:当用户需要从直观上观察地形的概貌时,用绘制透视图的方法(还可以用色彩)可以更逼真地显示地形。

3)坡度分析、地表面积计算及挖、填土方体积计算:建立DTM后就可以用之计算坡度、面积和挖、填土方体积,以其作为土地适宜性评价的因子。

4)断面图分析:断面图主要有利于工程设计和工程测量,如工程勘察的纵向图分析、地质钻孔分析等。

一 CIS技术在矿区土地管理信息的具体形式

在以往的测量中,选择的测量方式还是完全采用机械的形式,但是在使用了计算机CIS技术精密测量后,完成了许多以往技术所不能达到的任务。在我们的研究中,计算机CIS技术测量的原理是通过摄像机将被处理的对象采集进行影像采集,在多个控制点的数据采集完成后,系统会自动将这些图像进行整合,得出相关的几何多变参数,再在计算机上以具体的数据显示出来,以供矿区技术人员使用参照。

在上面所说的摄像机并不是我们通常意义上生活中使用的摄像机。它是一种可视化较强,表针比较敏感的测试仪。可以将视觉中的二维形态通过显影,记录在机械的光谱仪上,再将这种的二维图像做数学处理,有二阶矩阵转换为三阶矩阵,通过播放仪呈现出三维的影像。这时的图像变为立体化,更有层次感,效果上也有了明显的变化,这是一种显示方法。此外还有一种造价较高的仪器,我们不常使用,就是图像提取器。同样是采集控制点的数据,将数据整合在系统之内,然后对于原始的图像进行预处理,不再经过有曝光这个程序,将图像中关键点的坐标在整个内部轴面上体现出来,提取数据帧数,再运用机器的智能识别系统,对控制点的坐标进行数据分析,自动生成图形,这也可以用于精密测量。它的优点就是使用上极其的方面,基本只要架立仪器和打开开关,其他的工作机械系统都会自动的完成。使用的困难就是造价极其的高,不适合一般企业使用。在基于计算机视觉图像测量中使用上的原理如下:

(1) 计算出观察控制点到计算机视觉图像测量仪器的有效距离;

(2) 得出观察点到目标控制点之间的三维的运动几何参数;

(3) 推断出目标控制点在整个平面上的表面特征( 大多时候要求形成立体视觉) ;

(4) 还通过观察可以判断出目标物体的几何坐标方位。

在整个计算机CIS技术精密测量的在矿区土地信息管理中最关键的元件就是压力应变电阻仪,这也是传感器的一部分。压力应变电阻仪的使用方式是将应力片粘贴在控制点位上,事先在物体表面打磨平整,清理干净后,涂抹丙酮试剂,在液体完全风干后就可以黏贴应力片,通过导线的联接,形成了一小段闭合的电路,时刻让计算机CIS技术系统可以感应到并作跟踪观察。因受到来自不同方面谐波的影响后,应力片会产生一定数值的电阻,在电路中,这些电阻会转化为电流,视觉图像系统接收到了电流后就会显示在仪表盘上相应的数据,我们就可以根据仪表盘中的数据记录测量中的数据,很好的解决了原始机械在使用过程中大量的做无用功所消耗资源的现象。传感器对每个应点都进行动态的测量,将数据模转换成现实中的图像,精确的成像可以测算出控制点的位置,用计算机视觉图像精密测量结合数据方面的相关的分析,得出矿区施工中的可行性报告分析,减低了施工中的成本,将施工的预算控制在一个合理的范围之内。

当无法观察到控制点是,计算机CIS技术测量可以通过接收信号或是相关的频率波段来收集数据,不会因为以往测量的环境不好,距离太远,误差太大的影响。

二 计算机CIS技术测量的关键技术分析

在计算机CIS技术测量中解决了很多以往很难完成的任务,但是在使用过程中还是发生了很多的问题。尤其在土地信息的选择中,无法使用高帧数的图片显示,无法将计算机测量的关键技术的优点发挥出来。我们就计算机CIS技术测量的关键技术中常见的问题进行讨论。

1. 降低失误的概率

在很多的数据误差中,有一部分是出现在人为的因素上面。对于机器的不熟悉和操作中的疏忽都会在一定程度上对图像的视觉感模拟带来麻烦。对于网络设备的配置上,要经常性的学习,将配置在可能的情况下设置的更加合理和使用,保证网络连接系统的安全性。为防止更多因操作带来的误差,选用系统登入的制度,用户在通过识别后进入系统,在采集数据后,确定最终数据上又相关的再次确定的标识,系统对本身有的登录服务器和路由器有相关的资料解释,记录好实用操作的时间,及时备份。

2. 对于权限的控制

权限控制是针对测量关键所提出的一种安全保护措施,它是在使用计算机CIS技术测量的关键技术中对用户和用户组赋予一定的权限,可以限制用户和用户组对目录、子目录、文件、打印机和其他共享资源的浏览和更改。图像中的运行服务器在停止的情况下可以做出不应答的操作指令,立刻关闭当前不适用的界面,加快系统的运行速度,对于每天的日志文件实时监控,一旦发现问题及时解决。对于数据终端的数据可采用可三维加密的方法,定时进行安全检测等手段来进一步加强系统的安全性。如果通过了加密通道,系统可以将数据自动的保存和转换为视图模式,对于数据的审计和运行可以同时进行,这样就可以很好的保证大地测量中的图像数据安全,利用防护墙将采集中废弃的数据革除在外,避免数值之间发生紊乱的现象,进一步改善计算机CIS技术。

3. 开启自动建立备份系统

计算机CIS技术测量的关键技术的完善中会常遇到系统突然崩溃或是图像受到严重干扰导致无法转换的一系列情况,发生这种情况最大的可能性就是系统在处理多组数据后无法重新还原成进入界面。这时为保证图片转换成数字的系统数据不丢失,我们对系统进行备份。选定固定的磁盘保存数据,定期将产生的数据(转换前的图像和转换后的数值)导出,保证程序的正常运行。当系统一旦发生错误,可以尽快的恢复数据的初始状态,为测量任务的完成争取更多的时间。我们还要减少信号源周围的干扰,定期的更新系统数据库,保持数据采集的稳定性,把摄像机记录出的数据节点保存在相应的技术图纸上,用这样的方式来知道测量工作。系统备份的数据还可以用于数据的对比,重复测量后得出的数据,系统会自动也备份的数据进行比对,发现误差值在规定以外,就会做出相应的预警,这样也能在工作中降低出现误差的概率。

三 CIS技术测量的关键技术遇到的困难和使用前景

计算机CIS技术测量的关键技术作为一种新兴技术在使用时间上不过十几年,其使用的程度已经无法估算。正是因为它的简单、使用、精度高以及自动化能力卓越的特点受到了矿区土地信息管理部门的广泛青睐。在测量调控方面的这些可靠性和稳定性也是有目共睹的。这项关键技术中涵盖的学科非常的多,涉及到的知识也很全面,一旦出现了机器的故障,在维修上还是一个很大的问题,如何很好的解决计算机视觉图像技术的相关核心问题就是当下亟待解决的。

我们都知道,人的眼睛是可以受到吱声的控制,想要完成矿区土地观测是十分简单的,但是在计算机CIS技术中,毕竟是采取摄像机取景的模式,在取得的点位有的时候不是特别的有代表性,很难将这些问题具体化、形象化。达不到我们设计时的初衷。所以在这些模型的构建中和数据的转换上必须有严格的规定和要求,切不可盲目的实施测量,每项技术操作都要按规程来实施。

四 结束语

计算机视觉发展报告范文第3篇

关键词:智能 传感器

传感器象人的五官一样,是获取信息的重要工具。它在工业生产、国防建设和科学技术领域发挥着巨大的作用。但与飞速发展的计算机相比较,作为“五官”的传感器远远赶不上作为“大脑”的计算机的发展速度。

随着测控系统自动化、智能化的发展,要求传感器准确度高、可靠性高、稳定性好,而且具备一定的数据处理能力,并能够自检、自校、自补偿。传统的传感器已不能满足这样的要求。国外有的文章称传统的传感器为Dumb sensor(愚蠢的、笨哑的传感器)。另外,为制造高性能的传感器,光靠改进材料工艺也很困难,需要利用计算机技术与传感器技术相结合,弥补其性能的不足,计算机技术使传感器技术发生了巨大的变革,微处理器(或微计算机)和传感器相结合,产生功能强大的智能传感器。国外称为Intelligent sensor(智能传感器)或Smart-sensor(灵巧的、机敏的、智能传感器)。另外,传统的传感器一般只能测量一个参数,有些场合需要同时测量多个参数的体积小的多功能传感器。现在多国科学家已重视这一方向的开拓,并已研制出一些多功能传感器。

1 传感器的智能化

目前国内外学者普遍认为.智能传感器是由传统的传感器和微处理器(或微计算机)相结合而构成的,它充分利用微处理器的计算和存储能力,对传感器的数据进行处理,并能对它的内部行为进行调节,使采集的数据最佳。

传统的传感器只能作为敏感元件,检测物理量的变化,而智能传感器则包括测量信号调理(如滤波、放大、A/D转换等)、数据处理、数据显示以及自校自检自补偿等功能,图1是智能传感器的原理框图。

图1 智能传感器原理框图

微处理器是智能传感器的核心,它不但可以对传感器的测量数据进行计算、存储、数据处理,还可以通过反馈回路对传感器进行调节。由于微处理器充分发挥各种软件的功能,可以完成硬件难以完成的任务,从而大大降低了传感器制造的难度,提高传感器的性能,降低成本。需要指出的是,除微处理器以外,智能传感器相对于传统传感器的另一显著特征是其信号调理电路。被测的物理量转换成相应的电信号后,送到信号调理电路中,进行滤波、放大、转换,再送入计算机(微处理器)中进行处理。与计算机技术的结合,使智能传感器相对于传统传感器具有如下功能:

①自补偿能力:通过软件对传感器的非线性、温度漂移、时间漂移、响应时间等进行自动补偿。

②操作者输入零值或某一标准量值后,自校准软件可以自动地对传感器进行在线校准。

③自诊断功能:接通电源后,可对传感器进行自检,检查传感器各部分是否正常,并可诊断发生故障的不见。

④数值处理功能:可以根据智能传感器内部程序,自动处理数据,,如进行统计处理,剔除异常值等。

⑤双向通信功能:微处理器和基本传感器之间构成闭环,微处理器不但接收、处理传感器的数据,还可将信息反馈至传感器,对测量过程进行调节和控制。

⑥信息存储和记忆功能。

⑦数字量输出功能:输出数字信号,可方便地和计算机或接口总线相连。

日前,世界各国都在研制和开发各类智能传感器,随着科学技术的不断发展,智能传感器的功能将逐步增强,它将利用人工神纤网络、人工智能、信息处理技术(如信息融合技术、模糊理论等),使传感器具有更加高级的功能,具有分析、判断、自适应、自学习的功能,并可以完成图像识别、特征检测、多维检测等复杂任务。

随着计算机技术的飞速发展,智能传感器技术必将大放异彩。

2 智能传感器的发展状况

2.1 物理转化机理

由于集成智能传感器可以很容易对非线性的传递函数进行校正,得到一个线性度非常好的输出结果,从而消除了非线性传递对传感器应用的制约。该机理具有稳定性好、精确度高、灵敏度高的特点。利用同一硅片上集成的智能检测电路,可以迅速提取频率信号,使得谐振式微机械传感器成为国际上传感器领域的一个研究热点。

2.2 数据融合理论

数据融合是集成智能传感器理论的重要领域,也是各国研究的热点,对于多个传感器组成的阵列,数据融合技术能够充分发挥各个传感器的特点,利用其互补性、冗余性,提高测量信息的精度和可靠性,延长系统的使用寿命。

2.3 CMOS工艺兼容

目前,国外在研究二次集成技术的同时,集成智能传感器在工艺上的研究热点集中在研制与CMOS工艺兼容的各种传感器结构及制造工艺流程,探求在制造工艺和微机械加工技术上有所突破。

2.4 传感器的微型化

集成智能传感器的微型化决不仅是尺寸上的缩微与减少,而且是一种具有新机理、新结构、新作用和新功能的高科技微型系统,并在智能程度上与先进科技融合。其微型化主要基于以下发展趋势:尺寸上的缩微和性质上的增强性;各要素的集成化和用途上的多样化;功能上的系统化、智能化和结构上的复合性。

3 智能传感器的应用

3.1 立信眼球

由爱立信微波技术公司研制的ERIEYE(爱立信眼球)采用了智能传感器技术和一个用户界面友好的指挥和控制系统,可以快速获取准确和综合的信息。它是一种出色的雷达系统,可以在陆地和水面上分辨和跟踪海上及空中目标,通过仪器观测到的距离远远超过了地平线之外。

3.2 计算机视觉系统

在计算机视觉系统中,智能传感器不仅直接确定数据集的范围,还通过测量确保系统的安全。获得需要到达的地点信息,安置系统以得到高质量的信息。适应实践和环境的变化,甚至获得特殊的指令,控制器件的动作。

4 现状与发展

目前,世界各国都在研制与开发各种智能传感器和多功能传感器。其中最成功的是美国Honeywell公司研制的DSTJ-3000智能压差压力传感器在同一块半导体基片上用离子注入法配置扩散了压差、静压和温度三个敏感元件,整个传感器还包括变换器、多路转换器、脉冲调制、微处理器和数字量输出接口等。

智能传感器是测量技术、半导体技术、计算技术、信息处理技术、微电子学、材料科学互相结合的综合密集型技术。目前各国科学家正在按下列技术途径开发研究:

(1)利用新型材料研制基本传感器。基本传感器是智能传感器的基础,它的制作及其性能对整个智能传感器影响甚大。除硅材料具有优良的物理特性,能够方便地制成各种集成传感器。此外还有功能陶瓷、石英、记忆合金等都是制作传感器的优质材料。

(2)利用新的加工技术。近年来利用微加工技术日趋成熟,可以加工高性能的微结构传感器、ASIC制作技术,也可用于制造智能传感器。

(3)采用新的测量原理和方法。谐振式传感器输出数字量,可以直接和微机及接口总线连接,不用A/D转换器。另外,光纤传感器、化学传感器、生物传感器新型传感器,为智能传感器提供新的信息来源。■

参考文献

1.Clarkson M. Smart Sensors. Sensors, 1997, 14:14

2.White N. Intelligent Sensors. Sensor Review 1997,17(2);9

3.ィンテリヅェントセンサシステムの现状と展望。日本电气学会,电气学会技术报告(Ⅱ)部第272号,昭和63年6月,P4~5

计算机视觉发展报告范文第4篇

据统计,2017年中国人工智能核心产业规模超过700亿元,随着各地人工智能建设的逐步启动,预计到2020年,中国人工智能核心产业规模将超过1600亿元,年复合增长率将达31.7%。

随着人工智能技术的不断成熟,人工智能创业的难度逐步降低,越来越多的创业公司加入人工智能的阵营。

2018年被称为人工智能爆发的元年,人工智能技术应用所催生的商业价值逐步凸显。人工智能逐步切入到社会生活的方方面面,带来生产效率及生活品质的大幅提升。智能红利时代开启!资本、巨头和创业公司纷纷涌入,将人工智能拉到了信息产业革命的风口。

如何把握产业动向,抓住风口机会?创业邦研究中心凭借在人工智能等前言科技领域持续研究、洞察的能力,在对国内人工智能创业公司进行系统调研的基础上,推出《2018中国人工智能白皮书》,对人工智能的核心技术、主要应用领域、巨头和创业公司的布局、未来发展态势和投资机会进行了深度解析。

第一部分人工智能行业发展概述

1.人工智能概念及发展

人工智能(Artificial Intelligence, AI)又称机器智能,是指由人制造出来的机器所表现出来的智能,即通过普通计算机程序的手段实现的类人智能技术。

自1956年达特茅斯会议提出“人工智能”的概念以来,“人工智能”经历了寒冬与交替的起起伏伏60多年的发展历程。2010年以后,深度学习的发展推动语音识别、图像识别和自然语言处理等技术取得了惊人突破,前所未有的人工智能商业化和全球化浪潮席卷而来。

人工智能发展历程

2.人工智能产业链图谱

人工智能产业链可以分为基础设施层、应用技术层和行业应用层。

A基础层,主要有基础数据提供商、半导体芯片供应商、传感器供应商和云服务商。

B技术层,主要有语音识别、自然语言处理、计算机视觉、深度学习技术提供商。

C应用层,主要是把人工智能相关技术集成到自己的产品和服务中,然后切入特定场景。目前来看,自动驾驶、医疗、安防、金融、营销等领域是业内人士普遍比较看好方向。

人工智能产业链

资料来源:创业邦研究中心

第二部分人工智能行业巨头布局

巨头积极寻找人工智能落地场景,B、C 端全面发力。

资料来源:券商报告、互联网公开信息,创业邦研究中心整理

第三部分机器视觉技术解读及行业分析

1.机器视觉技术概念

机器视觉是指通过用计算机或图像处理器及相关设备来模拟人类视觉,以让机器获得相关的视觉信息并加以理解,它是将图像转换成数字信号进行分析处理的技术。

机器视觉的两个组成部分

资料来源:互联网公开信息,创业邦研究中心整理

2.发展关键要素:数据、算力和算法

数据、算力和算法是影响机器视觉行业发展的三要素。 人工智能正在像婴儿一样成长,机器不再只是通过特定的编程完成任务,而是通过不断学习来掌握本领,这主要依赖高效的模型算法进行大量数据训练,其背后需要具备高性能计算能力的软硬件作为支撑。

深度学习出现后,机器视觉的主要识别方式发生重大转变,自学习状态成为视觉识别主流,即机器从海量数据里自行归纳特征,然后按照该特征规律使图像识别的精准度也得到极大的提升,从70%+提升到95%。

3.商业模式分析

机器视觉包括软件平台开发和软硬件一体解决方案服务。整体用户更偏向于B端。软件服务提供商作为技术算法的驱动者,其商业模式应以“技术层+场景应用”作为突破口。软硬件一体化服务供应商作为生态构建者,适合以“全产业链生态+场景应用”作为突破口,加速商业化。

(1)软件服务:技术算法驱动者—“技术层+场景应用”作为突破口

这种商业模式主要是提供以工程师为主的企业级软件服务。有海量数据支撑,构建起功能和信息架构较为复杂的生态系统,推动最末端的消费者体验。

此类商业模式成功关键因素:深耕算法和通用技术,建立技术优势,同时以场景应用为入口,积累用户软件。视觉软件服务按处理方式和存储位置的不同可分为在线API、离线SDK、私有云等。

国内外基础算法应用对比

资料来源:互联网公开信息,创业邦研究中心整理

(2)软硬件一体化:生态构建者—“全产业链生态+场景应用”作为突破口

软硬一体化的商业模式是一种“终端+软件+服务”全产业链体系。成功的因素是大量算力投入,海量优质数据积累,建立算法平台、通用技术平台和应用平台,以场景为入口,积累用户。亮点是打造终端、操作系统、应用和服务一体化的生态系统,各部分相辅相承,锐化企业竞争力,在产业链中拥有更多话语权。

4.投资方向

(1)前端智能化,低成本的视觉解决模块或设备

从需求层面讲,一些场景对实时响应是有很高要求的。提供某些前端就本身有一定计算能力的低成本的视觉模块和设备将有很大市场需求。前置计算让前端设备成为数据采集设备和数据处理单元的合体,一方面提升了处理速度,另一方面可以处理云端难以解决的问题。

机器视觉在消费领域落地的一个障碍是支持高性能运算的低功耗、低价位芯片选择太少。从低功耗、高运算能力的芯片出发,结合先进的算法开发模块和产品,这类企业将在机器视觉领域拥有核心竞争力。

(2)深度学习解决视觉算法场景的专用芯片

以AI芯片方式作为视觉处理芯片有相当大的市场空间。以手势识别为例,传统的识别方案大都基于颜色空间,如 RGB,HSV ,YCrBr,无法排除类肤色物体及黑色皮肤对识别精度的干扰。借助深度学习,如通过 R-CNN 训练大量标注后的手势图像数据,得到的模型在处理带有复杂背景及暗光环境下的手势识别问题时,比传统方案的效果好很多。

(3)新兴服务领域的特殊应用

前沿技术带来的新领域(如无人车、服务机器人、谷歌眼镜等),对机器视觉提出了新要求。机器视觉可以让机器人在多种场合实现应用。服务机器人与工业机器人最大的区别就是多维空间的应用。目前国内的机器视觉,涉及三维空间、多维空间,其技术基本上处在初始阶段,未来存在较大市场增长空间。

(4)数据是争夺要点,应用场景是着力关键

机器视觉的研究虽然始于学术界,但作为商业应用,能解决实际问题才是核心的竞争力。当一家公司先天能够获得大量连续不断的优质场景数据,又有挖掘该数据价值的先进技术时,商业模式和数据模式上就能形成协同效应。创业公司要么通过自有平台获取数据,要么选择与拥有数据源的公司进行合作,同时选择一个商业落地的方向,实现快速的数据循环。

第四部分智能语言技术解读及行业分析

1.语音识别技术

(1)语音识别技术已趋成熟,全球应用持续升温

语音识别技术已趋成熟,全球应用持续升温。语音识别技术经历了长达60年的发展,近年来机器学习和深度神经网络的引入,使得语音识别的准确率提升到足以在实际场景中应用。深度神经网络逐步找到模型结构和调参算法来替代或结合高斯混合算法和HMM算法,在识别率上取得突破。根据Google Trends统计,自2008年iPhone及谷歌语音搜索推出以来语音搜索增长超35倍。百度人工智能专家吴恩达预测,2020年语音及图像搜索占比有望达到50%。Echo热销超过400万,带动智能音箱热潮。

(2)语音识别进入巨头崛起时代,开放平台扩大生态圈成主流

语音识别即将进入大规模产业化时代。随着亚马逊Echo的大卖,语音交互技术催生的新商机,吸引大大小小的公司构建自己主导的语音生态产业链。各大公司纷纷开放各自的智能语音平台和语音能力,欲吸引更多玩家进入他们的生态系统。

(3)语音识别技术发展瓶颈与趋势

低噪声语料下的高识别率在现实环境使用中会明显下降到70-80%,远场识别、复杂噪声环境和特异性口音的识别是下一个阶段需要解决的问题。

麦克风阵列类前端技术不仅是通过降噪和声源定位带来识别率的提高,带环境音的语料的搜集、标注可用于模型的训练,有助于打造更新一代的语音识别引擎技术。语音巨头已经在布局。

在IOT包括车载领域,云端识别并非通行的最优方案,把识别引擎结合场景进行裁剪后往芯片端迁徙是工程化发展的方向。

2.自然语言处理(NLP)发展现状

(1)多技术融合应用促进NLP技术及应用的发展

深度学习、算力和大数据的爆发极大促进了自然语言处理技术的发展。深度学习在某些语言问题上正在取得很大的突破,比如翻译和写作。2014年开始LSTM、Word2Vec以及Attention Model等技术研究的进展,使DL有了路径在语义理解领域取得突破,并且已经有了明显的进展。对话、翻译、写作新技术成果里都开始逐渐混合入DL的框架。2014-2015年,硅谷在语义理解领域的投资热度剧增。

深度学习能最大程度发挥对大数据和算力资源的利用,语义理解的发展还需要深度学习、搜索算法、知识图谱、记忆网络等知识的协同应用,应用场景越明确(如客服/助理),逻辑推理要求越浅(如翻译),知识图谱领域越成熟(如数据饱和度和标准性较强的行业),技术上实现可能性相对较低。在各种技术融合应用发展的情况下,具备获取一定优质数据资源能力并可结合行业Domain knowledge构建出技术、产品、用户反馈闭环的企业会有更好的发展机会。

(2)NLP主要应用场景

问答系统。问答系统能用准确、简洁的自然语言回答用户用自然语言提出的问题。基本工作原理是在线做匹配和排序。比如 IBM 的 Watson,典型的办法是把问答用FAQ索引起来,与搜索引擎相似。对每一个新问题进行检索,再将回答按匹配度进行排序,把最有可能的答案排在前面,往往就取第一个作为答案返回给用户。

图像检索。同样也是基于深度学习技术,跨模态地把文本和图片联系起来。

机器翻译。机器翻译的历史被认为与自然语言处理的历史是一样的。最近,深度学习被成功地运用到机器翻译里,使得机器翻译的准确率大幅度提升。

对话系统。对话系统的回复是完全开放的,要求机器能准确地理解问题,并且基于自身的知识系统和对于对话目标的理解,去生成一个回复。

(3)创业公司的机遇

1)机器翻译方面:经过多年的探索,机器翻译的水平已经得到大幅度提升,在很多垂直领域已经能够在相当大程度上替代一部分人工,机器翻译技术的商业化应用已经开始进入大规模爆发的前夜。

2)应用于垂直领域的自然语言处理技术

避开巨头们对语音交互入口的竞争,以某一细分行业为切入点,深耕垂直领域,对创业公司也是一个不错的选择。

第五部分人工智能在金融行业的应用分析

人工智能产业链包含基础层、技术层、应用层三个层面。基础层的大数据、云计算等细分技术被应用到金融征信、保险、理财管理、支付等金融细分领域;技术层的机器学习、神经网络与知识图谱应用于金融领域的征信与反欺诈、智能投顾、智能量化交易,计算机视觉与生物识别应用于金融领域的身份识别,语音识别及自然语言处理应用于金融领域的智能客服、智能投研;应用层的认知智能应用于金融领域的智能风控。

人工智能在金融行业的典型应用情况

资料来源:创业邦研究中心

第六部分人工智能在医疗行业的应用分析

1.人工智能在医疗行业的应用图谱

人工智能在医疗行业的应用潜力巨大,目前在健康管理、辅助诊疗、虚拟助理、医学影像、智能化器械、药物挖掘和医院管理等领域均有企业在布局,其中医学影像、药物挖掘、健康管理,辅助诊疗、虚拟助理的应用发展速度较快。

图 人工智能在医疗行业的应用图谱

资料来源:创业邦研究中心

2.人工智能在医疗行业的具体应用场景

医学影像。人工智能应用于医学影像,通过深度学习,实现机器对医学影像的分析判断,是协助医生完成诊断、治疗工作的一种辅助工具,帮助更快的获取影像信息,进行定性定量分析,提升医生看图/读图的效率,协助发现隐藏病灶。 人工智能通过影像分类、目标检测、图像分割、图像检索等方式,完成病灶识别与标注,三维重建,靶区自动勾画与自适应放疗等功能,应用在疾病的筛查、诊断和治疗阶段。目前较为火热的应用有肺部筛查、糖网筛查、肿瘤诊断和治疗等。

药物挖掘。人工智能在药物研发上的应用可总结为临床前和临床后两个阶段。临床前阶段:将深度学习技术应用于药物临床前研究,在计算机上模拟药物筛选的过程,包括靶点选择、药效和晶型分析等,预测化合物的活性、稳定性和副作用,快速 、准确地挖掘和筛选合适的化合物或生物,提高筛选效率,优化构效关系。临床后阶段:针对临床试验的不同阶段,利用人工智能技术对患者病历进行分析,迅速筛选符合条件的被试者,监测管理临床试验过程中的患者服药依从性和数据收集过程,提高临床试验的准确性。

虚拟助理。医疗虚拟助理是基于医疗领域的知识系统,通过人工智能技术实现人机交互,从而在就医过程中,承担诊前问询、诊中记录等工作,成为医务人员的合作伙伴,使医生有更多时间可以与患者互动。医疗虚拟助理根据参与就医过程的功能不同,主要有智能导诊分诊,智能问诊,用药咨询和语音电子病历等方向。

第七部分智能驾驶行业分析

1.智能驾驶行业产业链

智能驾驶行业的中心业务是以Google、百度为代表的智能驾驶操纵解决方案提供商和以特斯拉、蔚来为代表的成车厂商。该类厂商,上接上游软硬件提供商,下接公司和消费者,在整个业务链中扮演至关重要的一环。

产业链上游厂商多为细分技术提供商,如深度学习、人机交互、图像识别和新材料、新制造新能源等。

智能驾驶产业链图谱

资料来源:创业邦研究中心

2.智能驾驶市场分析

伴随着 ADAS 技术的不断更新,推断全球 L1-L5 智能驾驶市场的渗透率会在接下来 5年内处于高速渗透期,然 后伴随半无人驾驶的普及进入稳速增长期。在未来的 2025 年无人驾驶放量阶段后,依赖全产业链的配合而进入市场成熟期。预测到2030年,全球 L4/5 级别的自动驾驶车辆渗透率将达到 15%,单车应用成本的显着提升之 外,从 L1-L4 级别的智能驾驶功能全面渗透为汽车产业带来全面的市场机会。

按照 IHS Automotive 保守估计,全球 L4/L5 自动驾驶汽车产量在 2025 年将接近 60 万辆,并在 2025- 2035 年间获得高速发展,年复合增长率将达到43%,并在2035年达到2100万辆。另有接近 7600 万辆的汽车具备部分自动驾驶功能,同时会带动产业链衍生市场的大规模催化扩张。

根据独立市场调研机构 Strategy Engineers 的预测,L4 高度自动驾驶等级下,自动驾驶零部件成本约在 3100 美元/车,其中硬件占比 45%,软件占比 30%,系统整合占比 14%,车联网部分占比 11%。按照全球 1 亿辆量 产规模计算,理想假设所有车辆全部达到 L4 高度自动驾驶水平,那么全球自动驾驶零部件市场规模在 2020 年 将达到 3100 亿美元。

第八部分中国人工智能企业画像分析

随着人工智能技术的不断成熟,人工智能创业的难度逐步降低。创新的大门吸引众多创业企业进入。为了观察行业风向,助力创新企业发展,创业邦研究中心对国内200多家人工智能创业公司进行了系统调研,从发展能力、创新能力、融资能力等多维度指标,评选出“2018中国人工智能创新成长企业50强”。

地域分布

全国88%的人工智能企业聚集在北京、上海、广东和江苏。其中,北京人工智能企业最多,占比高达39.66%;其次是上海,人工智能企业占比达21.55%;位列第三的是广东,人工智能企业占达15.52%。北京以领先全国其他地区的政策环境、人才储备、产业基础、资本支持等,成为人工智能创业首要阵地;华东地区的上海、江苏、浙江均有良好的经济基础和科技实力,人工智能应用实力雄厚,也聚集了一批人工智能垂直产业园;广东互联网产业发达,企业对数据需求强烈,依靠大数据产业链推动人工智能产业发展。

行业分布

从行业大类分布来看,行业应用层的企业占比最大,为56.03%;其次是应用技术层的企业,占比达31.04%;基础技术层的企业占比最小,仅为12.93%。随着人工智能技术的发展,人工智能与场景深度融合,应用领域不断扩展,行业应用公司比重不断提升。在基础层技术方面,国际IT巨头占据行业领先地位, 国内与国际差距明显,中小初创企业很难进入。

从行业应用来看,智能金融企业占比最大,为16.92%;其次是机器人企业,占比达15.38%;位列第三的是智能驾驶和智能教育,占比均为12.31%。金融行业的强数据导向为人工智能的落地提供了产业基础,智慧金融被列入国家发展规划中,庞大的金融市场为人工智能落地带来了发展前景。机器人作为人工智能产业落地输出, 目前市场需求较大,商业机器人占据较大份额。中国智能驾驶市场在资本推动下进入者较多,企业积极推动应用落地,百度、北汽等大型企业尝试商业化落地智能驾驶汽车。人工智能推动教育个性化落地,相关初创企业涉入教育蓝海,推动智慧教育的发展。

收入情况

收入分布在500-10000万之间的企业最多,占比达49.14%;500万以下的企业位居其次,占比达 26.72%;位列第三的是10000-100000万之间的企业,占比为17.24%。

最新估值

企业最新估值均在亿元级别,且分布较为均衡。三成企业估值超过15亿元,还有企业估值达到百亿级别,如优必

选科技、达闼科技和商汤科技等,将来或将跻身人工智能独角兽企业。(备注:分析样本量剔除一半未披露企业)

第九部分典型企业案例分析

1.Atman

企业概述

Atman由来自微软的人工智能科学家和产业经验丰富的产品团队创办,提供专业领域机器翻译、机器写作、知识图谱、大数据智能采集挖掘等语言智能产品,致力于成为医学、新闻、法律等专业领域语言智能专家,为专业领域用户赋能,推动专业领域用户进入人工智能时代,助力专业领域文字智能水平实现跨越式提升。Atman已为强生、新华社参考消息、北大法宝、君合律师事务所等世界领先药企、新闻媒体、法律服务机构开发机器翻译、机器写作、知识图谱、大数据智能采集挖掘等语言智能产品。

目前Atman在北京和苏州两地运营,能快速响应全国各地客户需求。

企业团队

创始人&CEO:马磊

清华大学计算机系毕业,曾先后在微软研究院和工程院担任研究员和架构师,机器学习专家、多次创业者、曾主导多项人工智能重大项目,和申请国际专利共计15+项。

Atman公司核心团队由来自微软、百度、法电等领域高端人才和资深技术人才组成,公司员工40人,其中硕士以上学历占比60%,技术开发人员占比70%,一半以上来自微软亚洲研究院和工程院。

核心技术与产品

技术方面,擅长机器学习(深度学习、强化学习、群体智能)在复杂问题的应用,和国际专利15项,Atman神经网络机器翻译系统于2016年9月首秀,早于谷歌的GNMT,专业领域翻译效果在公测标准和行业客户测试中均持续领先。核心产品为垂直领域机器翻译、机器写作、知识图谱抽取构建、大数据智能挖掘等语言智能产品。

Atman的机器翻译产品可自动翻译编辑专业文献、报告、音视频和网页,支持私有部署和云端混合部署,提供包括数据隐私安全以及自学习的端到端解决方案。

机器写作可对海量数据进行快速搜索、过滤、聚类,根据行业需求自动生成专业文档,适用于所有专业写作场景,可大幅减少专业报告写作过程中的繁复工作,大幅提升专业领域写作效率。

知识图谱可实现海量数据的语义检索、长链推理、意图识别、因果分析,形成一个全局知识库。大数据智能采集挖掘系统为专业领域用户提供智能数据源管理、海量专业数据获取和非结构化数据自动解析并结合知识图谱提供auto-screening、知识重构、专业决策辅助,帮助用户建立强大的以专业大数据为基础的业务辅助能力。

2.黑芝麻

企业概述

黑芝麻智能科技有限公司是一家视觉感知核心技术与应用软件开发企业,2016年分别在美国硅谷和上海成立研发中心,主攻领域为嵌入式图像、计算机视觉,公司核心业务是提供基于图像处理、计算图像以及人工智能的嵌入式视觉感知平台,为ADAS及自动驾驶提供完整的视觉感知方案。

目前公司和博世、滴滴、蔚来、上汽、上汽大通、EVCARD、中科创达、车联天下和云乐新能源等展开深入合作,提供基于视觉的感知方案;除此之外,公司还在消费电子、智能家居等领域布局为智能终端提供视觉解决方案。目前公司已经完成A+轮融资。

企业团队

团队核心成员来自于OmniVision、博世、安霸、英伟达和高通等知名企业,平均拥有超过15年以上的产业经验,毕业于清华、交大、中科大和浙大等知名高校。

创始人&CEO:单记章此前在硅谷一家全球顶尖的图像传感器公司工作近20年,离职前担任该公司的技术副总裁一职,工作内容覆盖了图像传感器研发和设计、图像处理算法研发和图像处理芯片设计。

核心技术和产品

在汽车领域,黑芝麻可提供车内监控方案(DMS),自动泊车方案(AVP),ADAS/自动驾驶感知平台方案。黑芝麻智能科技提供的解决方案包括算法和芯片两个核心部分:黑芝麻感知算法从基础的控光技术,到面向AI的图像处理技术出发来提高成像质量,以及应用深度神经网络训练,结合视频处理和压缩技术,形成从传感器端到应用端的处理过程;黑芝麻芯片平台采用独有的神经网络架构,包括独有的图像处理,视频压缩和计算机视觉模块,与黑芝麻视觉算法结合,采用16nm制程,设计功耗2.5w,每秒浮点计算达20T。

3.乂学教育

企业概述

乂学教育,成立于2014年,是一家网络教育培训机构,采用人工智能和大数据技术,为学生提供量身定制学习解决方案和个性化学习内容。核心团队来自美国Knewton、Realizeit、ALEKS等人工智能教育公司,销售团队有全国40亿toC销售额的经验。

企业自主研发了针对中国K12领域的学生智适应学习产品,其核心部分是以高级算法为核心的智适应学习引擎“松鼠AI”,该产品拥有完整自主知识产权,能够模拟真实特级教师教学。企业发表的学术论文得到了全球国际学术会议AIED、CSEDU、UMAP认可,并在纽约设计了人工智能教育实验室,与斯坦福国际研究院(SRI)在硅谷成立了人工智能联合实验室。

主要产品

学生智适应学习是以学生为中心的智能化、个性化教育,在教、学、评、测、练等教学过程中应用人工智能技术,在模拟优秀教师的基础之上,达到超越真人教学的目的。该产品性价比高,以人工智能+真人教师的模式,做到因材施教,有效解决传统教育课时费用高,名师资源少,学习效率低等问题。

智适应学习人工智能系统

智适应学习人工智能系统模拟特级教师,采用图论、概率图模型,机器学习完成知识点拆分和个人学习画像,采用神经网络、逻辑斯蒂回归和遗传算法为学生实时动态推荐最佳学习路径,实现个性化教育。

业务模式

线上与线下,2B和2C相结合。以松鼠AI智适应系统教学为主,真人教师辅助,学生通过互联网在线上学习课程。开创教育新零售模式,授权线下合作学校,已在全国100多个城市开设500多家学校。

4.云从科技

企业概述

云从科技成立于2015年4月,是一家孵化于中国科学院重庆研究院的高科技企业,专注于计算机视觉与人工智 能。云从科技是人工智能行业国家队,是中科院战略先导项目人脸识别团队唯一代表,唯一一家同时受邀制定人 脸识别国家标准、行业标准的企业。2018年,云从科技成为祖国“一带一路”战略实行路上的人工智能先锋,与 非洲南部第二大经济体津巴布韦政府完成签约。

云从科技奠定了行业领导地位: 国家肯定,国家发改委2017、2018年人工智能重大工程承建单位;顶层设计,唯一同时制定国标、部标和行标的人工智能企业;模式创新,三大平台解决方案,科学家平台、核心技术平台和行业应用平台。

企业核心团队

创始人

周曦博士,师从四院院士、计算机视觉之父—ThomasS.Huan黄煦涛教授,专注于人工智能识别领域的计算机视觉 研究。入选中科院“百人计划”,曾任中国科学院重庆研究院信息所副所长、智能多媒体技术研究中心主任。

周曦博士带领团队曾在计算机视觉识别、图像识别、音频检测等国际挑战赛中7次夺冠;在国际顶级会议、杂志 上发表60余篇文章,被引用上千次。

核心技术团队

云从科技依托美国UIUC和硅谷两个前沿实验室,中科院、上海交大两个联合实验室上海、广州、重庆、成都四 个研发中心组成的三级研发架构。目前研发团队已经超过300人,80%以上拥有硕士学历。

技术优势

全方位多维智能学习模块适应不同场景要求;模块化设计为在工业视觉、医学影像、自动驾驶AR等领域扩展打下良好基础。

云从科技具有高技术壁垒:世界智能识别挑战赛成绩斐然,在CLEAR、 ASTAR、 PASCAL VOC、 IMAGENET、FERA以及微软全球图像识别挑战赛上共计夺得7次世界冠军;在银行、公安等行业智能识别技术 PK实战中,85次获得第一;2018年,云从科技入选MIT全球十大突破性技术代表企业。

在跨镜追踪(ReID)技术上取得重大突破。Market-1501,DukeMTMC-reID,CUHK03三个数据同时集体刷 新世界记录, Market-1501上的首位命中率达到96.6%,首次达到商用水平。

正式在国内“3D结构光人脸识别技术”,可全面应用于手机、电脑、机具、设备、家电。相较以往的2D人 脸识别及以红外活体检测技术,3D结构光人脸识别技术拥有不需要用户进行任何动作配合完成活体验证的功能, 分析时间压缩到了毫秒级以及不受环境光线强弱的影响等诸多优点,受到国际巨头公司的关注。

行业应用

目前国内有能力自建系统的银行约为148家。截止2018年3月15日,已经完成招标的银行约为121家,其中云从科 技中标了88家总行平台,市场占有率约为72.7%;在安防领域推动中科院与公安部全面合作,通过公安部重大课题研发火眼人脸大数据平台等智能化系统,在民航领域,已经与中科院重庆院合作覆盖80%的枢纽机场。

5.Yi+

企业概述

北京陌上花科技是领先的计算机视觉引擎服务商,为企业提供视觉内容智能化和商业化解决方案。致力于“发现视觉信息的价值”。

旗下品牌Yi+是世界一流的人工智能计算机视觉引擎,衣+是时尚商品搜索引擎。公司在图像视频中对场景、通用物体、商品、人脸的检测、识别、搜索及推荐均达到领先水平。

目前公司和阿里巴巴、爱奇艺、优酷土豆、中国有线、CIBN、中信国安、海信、华为、360等数十家顶级机构/产品深度合作,通过提供边看边买引擎、图像视频内容分析引擎、人脸识别引擎等基于视觉识别技术的数据结构化产品服务于海量用户,同时帮助政府机构、广电系统、内容媒体、零售商、电商、视听设备等行业实现智能分析、智能互动与场景营销。目前公司已经获得B轮融资。

企业团队

团队成员来自于斯坦福、耶鲁、帝国理工、新加坡国大、南洋理工、清华、北大、中科院等名校及谷歌、微软、IBM、英特尔、阿里巴巴、腾讯、百度、华为等名企。

创始人&CEO:张默

北京大学软件工程硕士, 南洋理工大学创业创新硕士。连续创业者, 曾任华为算法工程师、微软WindowsMobile工程师、 IBM SmarterCity 架构师,北方区合作伙伴经理,主机Linux中国区负责人,中国区开源联盟负责人,年销售额数亿。 2013年创业于美国硅谷和新加坡,2014年6月在中国设立北京陌上花科技有限公司。

核心技术与产品

技术方面,在国际顶级计算机视觉竞赛ImageNet中,成绩曾超过谷歌、斯坦福等,2015-2016年2年获得十项世界第一。2018年3月,人脸识别准确率位列LFW榜首。Yi+通过遵循无限制,标记的外部数据协议。 Yi+的系统由人脸检测,人脸对齐和人脸描述符提取组成。使用多重损失和训练数据集训练CNN模型,其中包含来自多个来源的约10M个图像,其中包含150,000个人(训练数据集与LFW没有交集)。在测试时, Yi+使用原始的LFW图像并应用简单的L2norm。图像对之间的相似性用欧氏距离来测量,最终取得优异成绩。

公司的核心产品主要包括视觉搜索引擎,图像视频分析引擎以及人脸识别和分析引擎:

行业解决方案

针对营销、安防、相机和电视的不同特点,推出相应解决方案。

营销+AI。场景化广告方案中,大屏AI助理信息流推荐、神字幕、物体/人脸AR动态贴图、video-out、场景化角标与广告滤镜等形式的广告内容推荐,适用于快消、汽车、电商、IT、金融、旅游服务等多个行业。

智慧城市+AI。使用计算及视觉助力智慧城市,在智慧安防、智慧交通、智慧园区等方面提供解决方案。在智慧安防实时识别上,实时处理直播摄像头信息,算法反应敏捷,相应迅速。建立智慧园区方案模型,考虑扩展性&灵活性、数据管理、松散耦合性、安全性、实时整合性以及功能性和非功能性需求等技术方案要素,从业务和技术两方面整合解决方案实现步骤。

电视+AI。电视+AI的解决方案赋予智能电视多样播放能力和营销能力。

相机+AI。相机更具交互能力。用户通过搜索关键字标签同步展示图片,打通相册和购物一站式体验。准确识别人物属性特征,动态适应表情变化,可以在视频以及图像中对人脸实时检测,基于深度学习技术,进行人脸相似度检测,实现面部关键点定位、妆容图像渲染,试用与粉底、唇彩以及眼影等多种虚拟试装方式。实时检测摄像头中出现的物品、场景和人脸等,添加AR效果,SDK支持本地检测、识别、追踪,平均检测帧率可达到25fps。

新零售+AI。Yi+新零售解决方案是基于公司自主研发的人脸识别、商品识别和其他图像识别算法技术为核心,建立一整套基于人脸、商品的智能零售门店管理方案。Yi+新零售解决方案主要包含数据采集、算法模型说明和部署方案三部分,其中数据采集包括人脸数据采集、商品数据采集;算法模型说明包括识别算法训练、商品识别、识别输出;部署方案包括本地部署、云端部署、本地部署与云端部署结合。

6.擎创科技

企业简介

擎创科技成立于2016年,专注于将人工智能和机器学习赋予传统IT运维/企业运营管理,为企业客户提供智能运维大数据分析解决方案,从而取代和改善对高技能运维人员严重依赖的现状。2017年,擎创科技已实现全年2000万营收,迅速成为国内AIOps领域的领跑者和中流砥柱。2018年初,擎创科技完成了数千万人民币的A轮融资,由火山石投资领投,晨晖创投、元璟资本及新加坡STTelemedia跟投。

核心团队

擎创团队的核心成员主要由BMC、微软等美国企业服务上市公司的运维老兵,与新浪、饿了么等知名互联网公司的大数据、算法专家组成,核心团队成员至少拥有10年以上的行业经验。其中CEO杨辰是国内最顶级的B端销售,曾带领团队获得10倍的业绩增长;CTO葛晓波拥有长达15年的企业级软件开发和运维经验;而产品总监屈中泠则来自甲方,创业前为浦发硅谷银行企业架构师,深知甲方对企业运维产品的需求。这个曾经深耕于运维企业服务市场的团队,如今在智能运维企业服务赛道继续领跑,让擎创科技成为最懂企业的客户,最值得企业客户信赖的软件厂商。

主要产品

“夏洛克AIOps” 作为擎创自主研发的大数据智能运维主打产品,自2016年上线以来,已从1.0版本升级至1.9版本,可应用在金融、大型制造业、铁路民航、能源电力等涉及国家发展和民生问题的多种行业。在2017全球运维大会上,夏洛克AIOps获得由中国信息通信研究院与高效运维社区联合颁发的“年度最具影响力AIOps产品”奖。

“夏洛克AIOps”充分利用自研算法辅助客户实现IT运维价值,结合客户的现有情况,规划从传统ITOM至AIOps智能运维的一站式路径,助其运营落地,由此打破数据孤岛,建立统一的大数据智能分析平台,实现以人工智能为核心,驱动传统IT运维监、管、控三个层面,并将相关运维数据及业务数据实时展现。

“夏洛克AIOps”拥有多项自研算法,犹如运维界的福尔摩斯,能迅速发现并定位运维问题的根因,实现秒级排障,最大程度避免企业产生重大损失。更有价值的是,“夏洛克AIOps”还能通过长期的数据积累和机器学习,运用新型深度神经网络算法对企业的业务数据进行预测,帮助企业提前规划IT资源,高效预防各类黑天鹅事件的发生。

商业模式

目前,擎创科技已与多家金融和制造行业标杆客户形成稳定的合作关系,包括浦发银行、浦发硅谷银行、国家开发银行、上海铁路局、银联、海尔、浙江能源等。针对不同客户,采用个性化的商业模式进行服务,目前主要有私有模式和SaaS模式两种,都具有较强的可复制性。

核心优势

计算机视觉发展报告范文第5篇

1.无论从社会认知还是应用需求角度,中国从2017年3月开始正式进入人工智能驱动的经济数字化转型阶段。

2.本研究根据大众对人工智能的认知由浅入深分为基本认知、专业认知和技术认知三个层次。从全国来看,人工智能社会认知的过程先经历平稳期,再进入快速上升期。基本认知和专业认知在2016年3月进入快速上升期,技术认知在2017年3月才进入快速上升期。

3.本研究从技术应用和行业应用两个角度考察大众对人工智能的应用需求,技术应用需求的发展先是经历成长期和平稳期,在2017年进入跃升期,行业应用需求整体上一直是上升趋势,但是目前逐渐趋于饱和。

4.无论是人工智能社会认知方面,还是应用需求方面,南方城市在排名上都比北方城市具有优势,南方城市有集中在华东和华南地区;排名靠前的城市主要为北上广深和省会城市。

5.从技术需求角度来看,北京、上海、深圳、广州、成都、苏州和重庆为“全技术需求驱动型”城市;武汉、南京、西安和长沙是“双技术需求驱动型”城市,由语音语义和深度学习需求来驱动;杭州、郑州、天津和济南是“单技术需求驱动型”城市,由计算机视觉技术需求驱动。