计算机视觉概述(精选5篇)

前言：想要写出一篇令人眼前一亮的文章吗？我们特意为您整理了5篇计算机视觉概述范文，相信会为您的写作带来帮助，发现更多的写作思路和灵感。

计算机视觉概述

计算机视觉概述范文第1篇

关键词：计算机；视觉技术；应用；分析

中图分类号：TP37 文献标识码：A 文章编号：1009-3044（2016）03-0242-02

计算机人工智能技术中的一项重要技术就是计算机视觉技术，这种技术主要是让计算机利用图像来实现认知环境信息的目的，这一目的的实现需要用到多种高尖端技术。近年来随着计算机技术以及计算机网络的普及与发展，计算机视觉技术也得到了较快发展，并且在实际生产与生活中的应用也越来越广泛。

1 计算机视觉技术概述

1.1 基本概念

计算机视觉技术主要研究计算机认知能力的一门技术，其具体主要是通过用摄像机代替人的眼睛，用电脑代替人的大脑，最终使计算机具备类似于人类的识别、判断以及记忆目标的功能，代替人类进行部分生产作业。人们目前研究的人工智能技术中的一项重要内容就是计算机视觉技术，通过研究计算机视觉技术可以让计算机拥有利用二维图像认知三维环境的功能。总的来说，计算机视觉技术是在图像与信号处理技术、概率分析统计、网络神经技术以及信息处理技术的基础上，利用计算机来分析、处理视觉信息的技术，它是现代社会新兴起的一门高新技术。

1.2 工作原理

在亮度满足要求的情况下，首先使用摄像机对具体事物的图像信息进行采集，利用网络把采集到的图像信息向计算机内部输送，然后在计算机系统内部处理加工图像信息会把事物的原始图像得到，随后利用图像处理技术进一步处理原始图像，获得优化质量效果之后的图像，分类与整理图像中有特征价值的信息，通过智能识别技术识别与描述提取到的图像信息特征，最后把得到的高层次的抽象信息存储起来，在进行识别事务时分析对比这些储存信息就可以实现事物的识别，这样视觉系统的基本任务也就完成了。其具体视觉系统如图1所示：

1.3理论框架

人类研究视觉技术虽然起步比较早，但取得较大进步是在20世纪80年代初伴随着视觉计算理论的出现。它的出现把研究视觉理论的策略问题解决了，视觉技术是一项特别复杂的信息处理过程，要想对视觉的本质准确完整的理解，必须从不同角度与层次研究与分析视觉本质。视觉计算理论研究层次大致可分为：计算机理论、算法以及实际执行。站在计算机理论的角度分析视觉技术，我们可知必须用要素图、维图、以及三维模型表像来描述视觉信息。

所以，可以把计算机视觉技术当做从三维环境图像中抽取、描述与解释信息的过程，其主要分析步骤可分为感觉、处理、描述、识别、解释等。若依据上述各过程实现需用到的方法与技术的复杂性划分层次，可大致把计算机视觉技术划分为：低层视觉处理、中层视觉处理、高层视觉处理三个层次。

2 计算机视觉技术在自动化中的应用

2.1 农业自动化中计算机视觉技术的应用

在农业自动化中应用计算机视觉技术可以全天候实时监测农作物的生长状况，便于科学管理农作物。还可以应用计算机视觉技术来检测农产品的质量，例如可以应用计算机监测技术来监测大多数蔬菜的质量，传统的人工检测蔬菜质量的方法，不仅费时费力，而且检测结果的准确性也不能很好的保证，在实际人工检测过程中还容易伤害蔬菜，可以通过利用计算机视觉技术来感应蔬菜自身释放的红外线、紫外线以及其他可见光的能量大小，然后和质量达标蔬菜的光线能量大小进行对比，根据这些对比结果可以把蔬菜质量的好坏准确判断出来，在蔬菜质量检测过程中应用计算机视觉技术，把传统的蔬菜检测方法完全颠覆了，极大的方便了农产品的质量检测，由此可见，计算机视觉技术在农业生产中有很高的使用与推广价值。

2.2 在工业自动化中计算机视觉技术的应用

计算机视觉技术在工业自动化应用的一个重要领域就是可以精密测量零件尺寸，其测量与被测对象的原理如图2所示。

光学系统、计算机处理系统以及CCD摄像头，是计算机检测系统的主要组成，被测物体由光源发出的平行光束进行照射，利用显微光学镜把待检测部位的轮廓图像呈现在摄像机的面阵CCD上，然后再通过计算机处理这些图像，进而把被测部位的轮廓位置信息获取下来，若被测对象是出现位移时，可通过两次重复测量，利用两次测量的位置差就可以得出，被测物体的位移量。

此外计算机视觉技术还可以应用于逆向工程中，应用3D数字化测量仪可以快速准确的测出现有工件轮廓的坐标值，同时还能构建曲面，保存成CAD或CAM图像，把这些图像送入CNC制作中心加工，便可制作出产品，这也就是所谓的逆向工程。由上述分析我们可知逆向工程要想实现，最关键的一环就是如何通过精密测量系统来测量样品的三围尺寸，获得各部位数据，进而做曲面处理进而加工生产。对于这一难题我可以通过利用线结构光测量物体表面轮廓技术来实现，器具体轮廓结构示意图如下图3所示。

这种测量方法的工作原理为：利用激光穿越平行、等距的振幅光栅组件，或直接采用干涉仪发出的干涉条纹，形成平面条纹结构光，再向物体表面投射，由于物体各表面的深度与曲率的不同，条纹会自动出现变化，然后再通过使用CCD摄像机对变形条纹进行拍摄。这样就可以把物体表面轮廓的变化情况分析出来。摄像机在拍摄图像的过程中，把图像信号转化为模拟信号，再转化为数字信号，然后经过传送再还原信号到图形处理系统，就得到三维轮廓图像。

在工业自动化中计算机视觉技术的深入广泛应用，不但使工业产品的生产质量得到了保障，而且跨越式的提高了工业产品的生产速度。如计算机视觉技术可以很好的检测产品包装质量，封口质量以及印刷质量等等，如我国重点指定的印刷造币机器的南京造币厂，由于货币制造印刷是由印刷造币机器来实现的，所以要严格要求其生产工艺，一丝一毫的生产差错都不允许存在，为了保障印刷制造出来的造币机器质量完全达标，必须严格精确检测生产出来的成品。在印刷造币机器的过程中要求要有非常高的计算机视觉技术，随着计算机视觉技术的不断进步，计算机视觉技术已经对印刷造币机器的需求完全满足了，实际的应用效果也非常理想，印刷造币机器在实际生产的过程中，南京造币厂把计算机视觉技术应用在了每个应刷造币机器最后的生产工序上，硬币受到重力下落的瞬间，计算机视觉技术可以瞬间采集图像的信息，准确拍摄硬币在下落过程中的图像，通过高速光纤传感器可以把硬币图像向计算机系统快速传输，利用计算机系统处理信息与识别信息的超强能力，可以及时识别硬币质量，经大量实践研究得出，在印刷造币机器上应用计算机视觉技术已经几乎没有检查差错现象的发生，由此可知，在工业自动化中计算机视觉技术的应用不但可行，而且发展空间还很大。

2.3 在医学自动化中计算机视觉技术的应用

在医学领域计算机视觉技术也得到了广泛应用，如医学中经常用到的CT图像以及X射线图都用到了计算机视觉技术，这些技术的广泛应用很大程度上方便了医生准确判断病人病情，另外，在生产药品的过程中，应用计算机视觉技术可以高效检测药品包装的合格与否，其基本流程是：传送装置先准确运输药品到指定位置，传送装置自身又可分为检测与分离两个区域，在传送药品的过程中药品的图像信息会被特定的摄像机采集，采集完成后向计算机系统传递采集信息，然后计算机系统会分析与处理这些信息，把没有包装好的药品自动识别出来，并且向分离区传递识别信息，分离区的自动装置会依据传输的分离信息，隔离开没有包装好的药品，这样就可以有效分类包装好的药品与没有包装好的药品，在药品包装检测方面应用计算机视觉技术代替传统人工检测，不但可以实现药品准确无误的检测，而且还可以大大提高检测药品包装质量的效率，完善了药品生产的自动化，由此可见，在医学自动化中应用计算机视觉技术可以积极促进医学自动化的发展。

3 结束语

总之，计算机视觉技术是一门研究计算机识别能力的高新技术，它涵盖了很多其他技术，具有一定复杂性。要想使其在自动化生产中得到更好地推广与应用，我们必须在明白其基本概念、工作原理以及理论框架的基础上，结合实际生产情况，不断进行深入研究，只有这样才能使计算机视觉技术得到更好地推广与应用，才能使这项现代化的高新技术更好的服务于社会，服务于人类。

参考文献：

[1] 龚超，罗毅，涂光瑜.计算机视觉技术及其在电力系统自动化中的应用[J].电力系统自动化，2003（1）.

[2] 李永奎，刘冬.计算机视觉技术在农业生产中的应用[J].农业科技与装备，2011（6）.

计算机视觉概述范文第2篇

关键词计算机视觉；立体匹配；研究情况

中图分类号：TP391 文献标识码：A 文章编号：1671-7597（2014）07-0001-01

随着科学技术的快速发展，计算机技术也得到了飞速的发展。将计算机技术应用于人类的视觉系统，并辅助人们观察到一些眼睛难以看到的东西，已经逐渐成为一门大家所热捧和追逐的技术。随着人们对视觉传感器技术越来越多的探索，人们也逐渐实现了古代时想拥有千里眼的梦想。目前，人们已经把视觉传感器技术和计算机技术良好的结合在一起，并把这些技术应用到食品、建筑、医药、电子、航天航空等众多领域当中。而该项技术的快速发展，也帮助人们解决了一些日常工作当中人类视觉存在盲区的问题，保证了人们工作过程的安全。视觉技术与IT技术的完美结合使得人们的生活变得更加便利，让人们亲身体会到了IT技术给人们生活带来的便捷。

1 双目立体视觉概述

双目立体视觉又称双目视觉技术，是目前计算机视觉应用领域的重要研究内容。双目立体视觉控制系统的组成因其采用的原理和应用功能的不同，组成也都各不相同。

双目立体视觉的实现原理是基于人眼的视网膜看物体的特性，从两个不同的方向来观看同一个物体的不同角度，从而实现清楚的了解到物体的图像的目的。双目立体视觉从不同的角度获得物体的投影信息，并根据匹配的结果，获取同一个物体不同偏差位置的信息。最后在依据三角测量技术，根据已经获得的这些偏差信息从而获得这些不同点对应的距离信息，并最终获得这些实际物体的具体坐标位置信息。

视差测距技术告诉我们，要清楚的观察到一个物体的全貌，需要两个观察物从不同的方向，或者固定一个观察物，移动另外一个观察物的方式，以达到拍摄同一个物体的目的。根据同一个物体在两个观察物当中的位置偏差，从而确定该物体的三维信息。一般来说，双目立体视觉的组成包括：图像获取设备、图像预处理设备、摄像机标定设备、立体匹配设备、根据二维信息实现三维重构设备等五个重要设备。

2 双目立体视觉技术的原理

立体画又可以称之为三维立体画，是一种人们可以从三维立体图中获取二维平面图信息的技术。三维立体图表面看似毫无规则，但是假如通过一些特殊的技术或者通过合理的观察手段和观察设备，就可以看到一组秩序井然的美妙图片。

三维立体图是一组重复的二维图片有序的堆积积累而成，因此可以呈现出立体效果。人体观察物体的原理大致如下：当人类通过左右眼观察所在的空间平面的时候，这些平面图都只是一些毫无秩序的图片。而当左右眼重新聚焦或者在观察画面的时候呈现一定的层次感，则人类的左右眼观察到的一组重复案在经过人体识别以后，这些画面之间将存在一定的距离差异，从而在脑中生成立体感。

双目立体视觉技术正是基于以上的原理，从两个不同的方向去观察物体，并获得目标图像的信息，并经过一定的处理获得三维重建的物体立体信息的技术。

双目立体视觉在计算机技术中实现三维重建的大致流程

如下。

1）摄像机定位，并通过单片机计算得到要获取图像信息需要的外部的参数的大概值，并根据这些参数值设定摄像机。

2）用设定参数的摄像机拍摄目标场景的画面，并采集这些画面的二维图的信息。

3）通过计算机技术实现双目匹配，并判定采集画面中的二维图像中的不同点之间的对应关系。

4）在第三步中若得到两组二维图像的关系是稠密的时候，则生成三维视差图。如果不是则进一步采集图片信息。

5）根据得到的视差图最终实现场景的三维图形的重建。

3 双目立体匹配技术的研究难点和未来的发展方向

尽管目前有很多学者都投身到双目立体匹配技术的研究和开发当中，直至目前为止也解决了很多关于视觉理论当中存在的很多缺陷问题。但是视觉问题是一个复杂且难以解决的问题，特别是在双目立体匹配问题方面更是困难重重。立体匹配技术的难点已经成为限制将双目技术应用到计算机技术当中的重要瓶颈。

立体匹配的主要手段就是找到计算机采集到两幅和多副图片的中像素的对应关系，然后根据这些像素关系判定并生成三维重建图。但是二维图像的匹配存在层层困难，主要体现在以下几个方面。

1）由于视角的问题或者观察物体存在遮挡问题，导致采集回来的图片信息存在盲点，这样子更难找到图片的匹配区域。

2）场景中的一些深度不连续的区域大都处在场景当中的边界位置，这些位置容易出现像素不高，边界不清晰等问题，这些问题也给图像匹配带了很多困扰。

3）场景当中的低纹理的图片匹配特征和匹配关系较少，而且该位置的每个像素点极为相似。假如只是通过简单的像素相似性检测的话，会检测到很多匹配结果，而这些匹配结果当中有一大部分是错误的。这样子的结果势必会导致最终的图像匹配正确率极为低下。

从以上的分析，我们可以看出立体匹配技术存在很多技术上的难点，这些都在很大程度上限制双目立体匹配技术在计算机当中的应用发展。如何才能设计出有效、准确、快速、通用性强的立体匹配算法将会是以后双目立体匹配计算发展的重要方向。也只有通过设计出一套行之有效的立体匹配算法才能使得双目立体匹配技术在计算机视觉当中得到广泛的应用。

4 结束语

人们通过眼睛可以感受到外界事物的存在，可以清楚的了解到事物的立体信息，分辨出观察物的广度和深度，以及物体的远近。因此人类视觉感知系统就是一个双目的立体感知系统。本文讲述的计算机中的双目立体匹配技术正是基于人眼视觉观察物体的原理，通过双目立体视觉原理，对计算机采集获得两幅二维图像的信息进行分析，并结合计算机的分析，最终获得同人类眼睛一样观察到物体三维表面信息的目的。双目立体匹配技术与计算机技术的完美结合帮助人们可以更加轻易的获得物体的信息。希望在不久的将来，可以将该项技术应用于人类的视网膜当中，以帮助一些视网膜存在问题的人们，让他们重新感受到光明，感受世间的温暖。

参考文献

[1]高文，陈熙霖.计算机视觉算法与系统原理[M].北京：清华大学出版社，2002.

[2]明祖衡.双目立体视觉测距算法研究[M].北京：北京理工大学，2008.

[3]刘昌，郭立，李敬文，刘俊，杨福荣，罗锋.一种优于SAD的匹配准则及其快速算法[J].电路与系统学报，2007，12（4）：137-14.

[4]陈蛟.双目立体匹配的算法研究及其多核并行化[M].南京：南京邮电大学，2012.

计算机视觉概述范文第3篇

关键词视频序列；交互式姿态跟踪；计算机视觉

中图分类号TP39 文献标识码A 文章编号 1674-6708（2011）54-0197-01

0 引言

本文提出了基于单目非标定视频的人体动作捕捉及三维重建方法，同时利用计算机视觉和基于真实物理运动学原理。本文基于图像的关键帧技术对视频进行处理：首先对关键帧进行交互式三维重建，然后进行基于图像的姿态插值，同时利用牛顿力学原理和生物约束集对重建结果进行修改和优化。

1 算法概述

首先基于用户交互式方法估计三维特征点集合和人体骨骼大小，同时用牛顿力学原理和生物约束集对重建的姿态进行评估和优化。

1.1 基于关键帧的交互式三维建模

此环节利用一种高效的算法来估计关键帧中的三维姿态，同时估计相机参数和人体骨架大小。

1.2 基于图像的三维关键帧插值

本文提出一种高效的算法自动跟踪二维图像中的特征点集，并利用图像测量技术对关键帧进行插值操作，同时可以修改并优化重建后的模型。

2基于关键帧的交互式三维建模

本文将人体分为17个刚体部分，主要包括头、颈、躯干、左右锁骨、肱骨、桡骨、胯骨、股骨、胫骨和跖骨。用关节坐标集q描述人体全部姿态，q ∈ R37 。向量l表示17段刚体部分的长度集合，l = [l1 , ..., l17]T ， lb, b = 1, ..., 17 表示第b段关节的长度。

利用以上参数可以估计k幅关键帧的三维姿态(q1 , ..., qK )以及人体骨架大小（l）。

2.1摄像头参数估计

对于移动摄像头拍摄的视频利用MatchMover [2008]估计摄像头的内参数和外参数=（tx,ty,tz,θx,θy,θz, f），（tx,ty,tz）, （θx, θy, θz）和f分别表示相机坐标、方向和相机焦距。对于固定摄像头拍摄的视频用3.2中提出的算法自动估计以上参数值。

2.2交互式三维关键帧建模

本文定义了能量方程和成本方程来估计和消除二义性问题。具体来说，通过计算以下能量方程的最小值来估计人体骨架大小l和三维姿态q1,...,qk

（1）

Ep代表骨骼投影约束，Es表示对称约束，保证重建后的三维骨架的对称部分是等长的。Er为对称约束，Ec则保证在某些视频中保证部分特征点的相对坐标保持不变，Ed可消除重建过程中出现的二义性。

本文用表示每段关节的内关节点和外关节点的深度信息，同时对方程式（1）进行初始化和优化操作。对于前者采用解析式的雅可比公式，对于后者则用Levmar library [Lourakis 2009]中的Levenberg-Marquardt 算法进行优化。

3 基于图像的三维关键帧插值技术

3.1 基于多关节的二维关键帧插值

下肢(包括股骨、胫骨和跖骨)的姿态可用表示，表示在2维图像中对应的关节点坐标，待估参数为，。

第t帧某区域内特征向量（2）

h（et）和hm（et）分别表示在特征空间内的当前目标模型和第个密度空间。

假设任意中间帧的模板模型可参数化：

Hm（βt）= βt hm（e1）+（1-βt）hm（eT）, m=1, ..., M（3）

将Hm (βt )和h（et）进行匹配估计骨骼姿态参数值，用巴特查利亚距离度量匹配距离：

用洛仑兹函数作为衡量的成本方程,通过计算以下目标函数的最小值来获得最优解：

（4）

3.2 三维姿态插值

分别表示关节点姿态、关节点运动速度和其加速度。分别为关节点的惯性矩阵、离心力、中立。向量u,fc分别为关节点力矩和触点压力。雅可比公式在触点处将关节速度转化为世界坐标内的速度。规定摩擦极限约束函数fg为fg（w1,...,wm），为环境摩擦极限函数，则通过求解以下目标函数可得出关节姿态向量q，关节力矩u，以及触点压力fg(w)和fe：

（5）

4 试验结果

我们通过对各种人体姿态进行建模来评估本系统的精度值和鲁棒性，包括行走、高低杠运动、跳跃、举重等行为。下面是实验数据：

序列帧数相机类型关键帧数每帧跟踪

多关节点数 Refinement A Refinement B

高低杠 150 pan-tilt-zoom 10 10 0 7

体操 585 static 9 10 2 0

举重 310 pan-tilt-zoom 13 11 3 4

从以上表格中我们可以看出，本系统可以用最少的用户交互来获得最佳的人体姿态三维重建结果。

5 结论

本文对通过论证对人体姿态的三维重建技术，提出了一种新的方法，该方法利用单目摄像头拍摄的视频序列，避免了双目视觉视场小、立体匹配困难、空间、光照等局限性，在计算机视觉领域有着重要的实际应用价值。

参考文献

计算机视觉概述范文第4篇

[关键词]计算机技术电力系统自动化应用

中图分类号：TM76 文献标识码：A 文章编号：1009-914X（2016）19-0387-01

背景

如今，计算机技术已经广泛地应用在电力系统，其内容主要包括下列几点：第一，计算机技术在数据处理工作中。数据处理是电力系统中一个非常重要的操作环节，而计算机最大的特点在于对数据的处理，使电力系统中复杂的数据实现了及时地收集和规范地处理，从而大大提高电力数据处理速度，使工作效率大大提升；第二，中间件在电力系统中的应用。计算机资源和通讯状况的监控上，通过中间件可以实现电力系统实时数据的高效管理。

1.电力系统自动化技术概述

电力系统由发电、输电、变电、配电及用电等环节组成。通常将发电机、变压器、开关、及输电线路等设备称作电力系统的一次设备，为了保证电力一次设备安全、稳定、可靠运行和电力生产以比较经济的方式运行，就需要对一次设备进行在线测控、保护、调度控制等。电力系统中将这些测控装置，保护装置，有关通信设备，各级电网调度控制中心的计算机系统，电厂、电站及变电站的计算机监控系统等统称为电力系统的二次设备，其涵盖了电力系统自动化的主要技术内容。

1.1 电网调度自动化

电网调度自动化是电力系统自动化的主要组成部分，我国目前电网调度自动化分为五级，即国家电网调度、大区电网调度、省级电网调度、地区电网调度和县级电网调度。电网调度自动化主要组成部分由电网调度控制中心的计算机网络系统、工作站、服务器、大屏蔽显示器、打印设备、通过电力系统专用广域网连结的下级电网调度控制中心、调度范围内的发电厂、变电站终端设备等构成。电网调度自动化的主要功能是电力生产过程实时数据采集与监控电网运行安全分析、电力系统状态估计、电力负荷预测、自动发电控制、自动经济调度并适应电力市场运营的需求等。

国家电网调度和大区电网调度控制中心的计算机设备配备比省级电网调度控制中心的规模大，服务器及网络设备容量大，功能性应用软件也有差别。地区电网调度是指城市供电网的调度，调度功能和调度范围要比大区电网和省级电网小得多，地区电网调度不对发电厂进行控制，主要对供电网内的各级变电站和配电网进行实时监控，保证安全可靠供电。县级电网调度控制中心设备规模一般要比地区电网调度小，并且工作站、服务器一般选用工业或普通商用PC机。

1.2 变电站自动化

电力系统中变电站与输配电线路是联系发电厂与电力用户的主要环节。变电站自动化的目的是取代人工监视和电话人工操作，提高工作效率，扩大对变电站的监控功能，提高变电站的安全运行水平。变电站自动化的内容就是对站内运行的电气设备进行全方位的监视和有效控制，其特点是全微机化的装置替代各种常规电磁式设备；二次设备数字化、网络化、集成化，尽量采用计算机电缆或光纤代替电力信号电缆；操作监视实现计算机屏幕化；运行管理、记录统计实现自动化。变电站自动化除了满足变电站运行操作任务外还作为电网调度自动化不可分割的重要组成部分，是电力生产现代化的一个重要环节。我国变电站自动化系统从初始研发最终到超高压变电站普及应用总共化了7～8年时间。我国变电站自动化系统20世纪90年代初先在35kV变电站投运试点，继而在110kV变电站投运；1998年前后在220kV变电站推广应用；2000年以后国500kV超高压变电站建设全部采用了变电站自动化系统方案。变电站自动化系统与上一代常规二次设备相比明显具有占地面积小、功能强、可靠性高等优点，很快在电网建设中得到普及。

3.计算机技术在电力系统自动化中的具体应用

计算机技术在配电网系统自动化中的应用随着科学技术的发展，电网的整体改造进入智能化阶段，也就是通过计算机技术的应用来实现配电的进一步智能化。当前，配电系统主要是由主站、子站以及终端这三部分构成，通过计算机技术的融入能够实现三部分之间的有效沟通，进而实现了信息资源的高度共享。而信息资源的共享能够为配电系统实现高效运行奠定基础。

2.1 计算机与电力系统融合的优势作用

要想确保电力系统的稳定、安全运行，就需要实现对系统各个部分运行情况的有效监管，而在传统的电力系统管理工作中，以上各环节工作的开展都是依赖人工来完成的，进而难免因各种误差等因素的存在而影响到电力系统的正常运转。而随着计算机技术的不断发展，计算机技术被广泛的应用于各行业之中，其在电力系统中的应用充分的体现出了自动化对于电力系统的重要性。将计算机技术应用到电网系统中，能够实现各环节的自动化处理，进而以计算机的智能化来取代人工，有效的提高了电力系统的工作效率，这对于电力系统整体服务质量的提升来讲有着极大的影响作用。以计算机技术为媒介来实现电力系统的自动化，能够在提高各项检测数据准确度的基础上，实现对部分数据信息的自动化处理，进而在降低工作人员压力与负担的基础上，确保了电力系统的稳定运行。

2.2 计算机技术在电力系统自动化中的研究热点和发展趋势

基于计算机技术的电力自动化设备的电磁兼容问题电力系统中微机型产品的应用愈来愈广泛，并已成为电力系统自动化控制类产品的发展方向。但是电力系统是一个非常复杂的系统，其电磁环境亦非常恶劣，以微处理器为核心的微机型产品很容易受到这些电磁干扰而导致误动、拒动、数据丢失或死机等故障，给电力系统的安全经济运行带来了非常严重的事故隐患。电磁兼容问题成为当前的一个研究热点。

2.3 计算机视觉技术在电力系统自动化中的应用

随着视频技术和红外成像技术在电力系统中的广泛应用，图像信息在电力系统自动化中所起的作用越来越重要，而且对图像信息分析与理解的要求也越来越高，使得在一些应用场合必须利用计算机视觉技术由计算机替代监控人员进行图像理解。电力系统是一个信息、能量变化非常迅速的系统，过渡过程往往在一瞬间完成，一旦发生故障，要尽量在短时间内消除，否则很容易造成事故的扩大化。如果能在保证电力系统安全的前提下，将基于图像识别的计算机视觉技术运用到图像信息分析与理解中，就可实现电力系统图像信息的智能处理。

2.4 计算机智能控制技术在电力系统自动化中的应用

电力系统随着电气化和自动化水平的提高而日益快速地从量和质两个方面在发展变化，现代高新技术也日益向其渗透交叉。控制理论于电力系统的安全稳定控制的巨大效益以及现实可用性和广阔前景。近年来，模糊技术、神经网络、专家系统等技术的发展又开拓了智能控制技术的新道路。

4.结语

电力系统自动化是现代计算机技术应用的一个重要领域，计算机发展过程中的每一项新技术、新成果都会以最快的速度被电力系统自动化应用，计算机技术的发展推动了电力系统自动化的进程。本文通过对电力系统自动化系统进行了简要的概述，然后阐述了计算机技术在电力系统自动化中的应用，以及推动电力系统自动化技术的发展历程，并着重探讨了计算机技术在电力系统自动化领域的研究热点和未来发展趋势。

参考文献

[1]王叶麒.电力系统自动化中智能技术的应用[J].信息系统工程，2016（04）.

计算机视觉概述范文第5篇

据统计，2017年中国人工智能核心产业规模超过700亿元，随着各地人工智能建设的逐步启动，预计到2020年，中国人工智能核心产业规模将超过1600亿元，年复合增长率将达31.7%。

随着人工智能技术的不断成熟，人工智能创业的难度逐步降低，越来越多的创业公司加入人工智能的阵营。

2018年被称为人工智能爆发的元年，人工智能技术应用所催生的商业价值逐步凸显。人工智能逐步切入到社会生活的方方面面，带来生产效率及生活品质的大幅提升。智能红利时代开启！资本、巨头和创业公司纷纷涌入，将人工智能拉到了信息产业革命的风口。

如何把握产业动向，抓住风口机会？创业邦研究中心凭借在人工智能等前言科技领域持续研究、洞察的能力，在对国内人工智能创业公司进行系统调研的基础上，推出《2018中国人工智能白皮书》，对人工智能的核心技术、主要应用领域、巨头和创业公司的布局、未来发展态势和投资机会进行了深度解析。

第一部分人工智能行业发展概述

1.人工智能概念及发展

人工智能（Artificial Intelligence， AI）又称机器智能，是指由人制造出来的机器所表现出来的智能，即通过普通计算机程序的手段实现的类人智能技术。

自1956年达特茅斯会议提出“人工智能”的概念以来，“人工智能”经历了寒冬与交替的起起伏伏60多年的发展历程。2010年以后，深度学习的发展推动语音识别、图像识别和自然语言处理等技术取得了惊人突破，前所未有的人工智能商业化和全球化浪潮席卷而来。

人工智能发展历程

2.人工智能产业链图谱

人工智能产业链可以分为基础设施层、应用技术层和行业应用层。

A基础层，主要有基础数据提供商、半导体芯片供应商、传感器供应商和云服务商。

B技术层，主要有语音识别、自然语言处理、计算机视觉、深度学习技术提供商。

C应用层，主要是把人工智能相关技术集成到自己的产品和服务中，然后切入特定场景。目前来看，自动驾驶、医疗、安防、金融、营销等领域是业内人士普遍比较看好方向。

人工智能产业链

资料来源：创业邦研究中心

第二部分人工智能行业巨头布局

巨头积极寻找人工智能落地场景，B、C 端全面发力。

资料来源：券商报告、互联网公开信息，创业邦研究中心整理

第三部分机器视觉技术解读及行业分析

1.机器视觉技术概念

机器视觉是指通过用计算机或图像处理器及相关设备来模拟人类视觉，以让机器获得相关的视觉信息并加以理解，它是将图像转换成数字信号进行分析处理的技术。

机器视觉的两个组成部分

资料来源：互联网公开信息，创业邦研究中心整理

2.发展关键要素：数据、算力和算法

数据、算力和算法是影响机器视觉行业发展的三要素。人工智能正在像婴儿一样成长，机器不再只是通过特定的编程完成任务，而是通过不断学习来掌握本领，这主要依赖高效的模型算法进行大量数据训练，其背后需要具备高性能计算能力的软硬件作为支撑。

深度学习出现后，机器视觉的主要识别方式发生重大转变，自学习状态成为视觉识别主流，即机器从海量数据里自行归纳特征，然后按照该特征规律使图像识别的精准度也得到极大的提升，从70%+提升到95%。

3.商业模式分析

机器视觉包括软件平台开发和软硬件一体解决方案服务。整体用户更偏向于B端。软件服务提供商作为技术算法的驱动者，其商业模式应以“技术层+场景应用”作为突破口。软硬件一体化服务供应商作为生态构建者，适合以“全产业链生态+场景应用”作为突破口，加速商业化。

（1）软件服务：技术算法驱动者—“技术层+场景应用”作为突破口

这种商业模式主要是提供以工程师为主的企业级软件服务。有海量数据支撑，构建起功能和信息架构较为复杂的生态系统，推动最末端的消费者体验。

此类商业模式成功关键因素：深耕算法和通用技术，建立技术优势，同时以场景应用为入口，积累用户软件。视觉软件服务按处理方式和存储位置的不同可分为在线API、离线SDK、私有云等。

国内外基础算法应用对比

资料来源：互联网公开信息，创业邦研究中心整理

（2）软硬件一体化：生态构建者—“全产业链生态+场景应用”作为突破口

软硬一体化的商业模式是一种“终端+软件+服务”全产业链体系。成功的因素是大量算力投入，海量优质数据积累，建立算法平台、通用技术平台和应用平台，以场景为入口，积累用户。亮点是打造终端、操作系统、应用和服务一体化的生态系统，各部分相辅相承，锐化企业竞争力，在产业链中拥有更多话语权。

4.投资方向

（1）前端智能化，低成本的视觉解决模块或设备

从需求层面讲，一些场景对实时响应是有很高要求的。提供某些前端就本身有一定计算能力的低成本的视觉模块和设备将有很大市场需求。前置计算让前端设备成为数据采集设备和数据处理单元的合体，一方面提升了处理速度，另一方面可以处理云端难以解决的问题。

机器视觉在消费领域落地的一个障碍是支持高性能运算的低功耗、低价位芯片选择太少。从低功耗、高运算能力的芯片出发，结合先进的算法开发模块和产品，这类企业将在机器视觉领域拥有核心竞争力。

（2）深度学习解决视觉算法场景的专用芯片

以AI芯片方式作为视觉处理芯片有相当大的市场空间。以手势识别为例，传统的识别方案大都基于颜色空间，如 RGB，HSV ，YCrBr，无法排除类肤色物体及黑色皮肤对识别精度的干扰。借助深度学习，如通过 R-CNN 训练大量标注后的手势图像数据，得到的模型在处理带有复杂背景及暗光环境下的手势识别问题时，比传统方案的效果好很多。

（3）新兴服务领域的特殊应用

前沿技术带来的新领域（如无人车、服务机器人、谷歌眼镜等），对机器视觉提出了新要求。机器视觉可以让机器人在多种场合实现应用。服务机器人与工业机器人最大的区别就是多维空间的应用。目前国内的机器视觉，涉及三维空间、多维空间，其技术基本上处在初始阶段，未来存在较大市场增长空间。

（4）数据是争夺要点，应用场景是着力关键

机器视觉的研究虽然始于学术界，但作为商业应用，能解决实际问题才是核心的竞争力。当一家公司先天能够获得大量连续不断的优质场景数据，又有挖掘该数据价值的先进技术时，商业模式和数据模式上就能形成协同效应。创业公司要么通过自有平台获取数据，要么选择与拥有数据源的公司进行合作，同时选择一个商业落地的方向，实现快速的数据循环。

第四部分智能语言技术解读及行业分析

1.语音识别技术

（1）语音识别技术已趋成熟，全球应用持续升温

语音识别技术已趋成熟，全球应用持续升温。语音识别技术经历了长达60年的发展，近年来机器学习和深度神经网络的引入，使得语音识别的准确率提升到足以在实际场景中应用。深度神经网络逐步找到模型结构和调参算法来替代或结合高斯混合算法和HMM算法，在识别率上取得突破。根据Google Trends统计，自2008年iPhone及谷歌语音搜索推出以来语音搜索增长超35倍。百度人工智能专家吴恩达预测，2020年语音及图像搜索占比有望达到50%。Echo热销超过400万，带动智能音箱热潮。

（2）语音识别进入巨头崛起时代，开放平台扩大生态圈成主流

语音识别即将进入大规模产业化时代。随着亚马逊Echo的大卖，语音交互技术催生的新商机，吸引大大小小的公司构建自己主导的语音生态产业链。各大公司纷纷开放各自的智能语音平台和语音能力，欲吸引更多玩家进入他们的生态系统。

（3）语音识别技术发展瓶颈与趋势

低噪声语料下的高识别率在现实环境使用中会明显下降到70-80%，远场识别、复杂噪声环境和特异性口音的识别是下一个阶段需要解决的问题。

麦克风阵列类前端技术不仅是通过降噪和声源定位带来识别率的提高，带环境音的语料的搜集、标注可用于模型的训练，有助于打造更新一代的语音识别引擎技术。语音巨头已经在布局。

在IOT包括车载领域，云端识别并非通行的最优方案，把识别引擎结合场景进行裁剪后往芯片端迁徙是工程化发展的方向。

2.自然语言处理（NLP）发展现状

（1）多技术融合应用促进NLP技术及应用的发展

深度学习、算力和大数据的爆发极大促进了自然语言处理技术的发展。深度学习在某些语言问题上正在取得很大的突破，比如翻译和写作。2014年开始LSTM、Word2Vec以及Attention Model等技术研究的进展，使DL有了路径在语义理解领域取得突破，并且已经有了明显的进展。对话、翻译、写作新技术成果里都开始逐渐混合入DL的框架。2014-2015年，硅谷在语义理解领域的投资热度剧增。

深度学习能最大程度发挥对大数据和算力资源的利用，语义理解的发展还需要深度学习、搜索算法、知识图谱、记忆网络等知识的协同应用，应用场景越明确（如客服/助理），逻辑推理要求越浅（如翻译），知识图谱领域越成熟（如数据饱和度和标准性较强的行业），技术上实现可能性相对较低。在各种技术融合应用发展的情况下，具备获取一定优质数据资源能力并可结合行业Domain knowledge构建出技术、产品、用户反馈闭环的企业会有更好的发展机会。

（2）NLP主要应用场景

问答系统。问答系统能用准确、简洁的自然语言回答用户用自然语言提出的问题。基本工作原理是在线做匹配和排序。比如 IBM 的 Watson，典型的办法是把问答用FAQ索引起来，与搜索引擎相似。对每一个新问题进行检索，再将回答按匹配度进行排序，把最有可能的答案排在前面，往往就取第一个作为答案返回给用户。

图像检索。同样也是基于深度学习技术，跨模态地把文本和图片联系起来。

机器翻译。机器翻译的历史被认为与自然语言处理的历史是一样的。最近，深度学习被成功地运用到机器翻译里，使得机器翻译的准确率大幅度提升。

对话系统。对话系统的回复是完全开放的，要求机器能准确地理解问题，并且基于自身的知识系统和对于对话目标的理解，去生成一个回复。

（3）创业公司的机遇

1)机器翻译方面：经过多年的探索，机器翻译的水平已经得到大幅度提升，在很多垂直领域已经能够在相当大程度上替代一部分人工，机器翻译技术的商业化应用已经开始进入大规模爆发的前夜。

2)应用于垂直领域的自然语言处理技术

避开巨头们对语音交互入口的竞争，以某一细分行业为切入点，深耕垂直领域，对创业公司也是一个不错的选择。

第五部分人工智能在金融行业的应用分析

人工智能产业链包含基础层、技术层、应用层三个层面。基础层的大数据、云计算等细分技术被应用到金融征信、保险、理财管理、支付等金融细分领域；技术层的机器学习、神经网络与知识图谱应用于金融领域的征信与反欺诈、智能投顾、智能量化交易，计算机视觉与生物识别应用于金融领域的身份识别，语音识别及自然语言处理应用于金融领域的智能客服、智能投研；应用层的认知智能应用于金融领域的智能风控。

人工智能在金融行业的典型应用情况

资料来源：创业邦研究中心

第六部分人工智能在医疗行业的应用分析

1.人工智能在医疗行业的应用图谱

人工智能在医疗行业的应用潜力巨大，目前在健康管理、辅助诊疗、虚拟助理、医学影像、智能化器械、药物挖掘和医院管理等领域均有企业在布局，其中医学影像、药物挖掘、健康管理，辅助诊疗、虚拟助理的应用发展速度较快。

图人工智能在医疗行业的应用图谱

资料来源：创业邦研究中心

2.人工智能在医疗行业的具体应用场景

医学影像。人工智能应用于医学影像，通过深度学习，实现机器对医学影像的分析判断，是协助医生完成诊断、治疗工作的一种辅助工具，帮助更快的获取影像信息，进行定性定量分析，提升医生看图/读图的效率，协助发现隐藏病灶。人工智能通过影像分类、目标检测、图像分割、图像检索等方式，完成病灶识别与标注，三维重建，靶区自动勾画与自适应放疗等功能，应用在疾病的筛查、诊断和治疗阶段。目前较为火热的应用有肺部筛查、糖网筛查、肿瘤诊断和治疗等。

药物挖掘。人工智能在药物研发上的应用可总结为临床前和临床后两个阶段。临床前阶段：将深度学习技术应用于药物临床前研究，在计算机上模拟药物筛选的过程，包括靶点选择、药效和晶型分析等，预测化合物的活性、稳定性和副作用，快速、准确地挖掘和筛选合适的化合物或生物，提高筛选效率，优化构效关系。临床后阶段：针对临床试验的不同阶段，利用人工智能技术对患者病历进行分析，迅速筛选符合条件的被试者，监测管理临床试验过程中的患者服药依从性和数据收集过程，提高临床试验的准确性。

虚拟助理。医疗虚拟助理是基于医疗领域的知识系统，通过人工智能技术实现人机交互，从而在就医过程中，承担诊前问询、诊中记录等工作，成为医务人员的合作伙伴，使医生有更多时间可以与患者互动。医疗虚拟助理根据参与就医过程的功能不同，主要有智能导诊分诊，智能问诊，用药咨询和语音电子病历等方向。

第七部分智能驾驶行业分析

1.智能驾驶行业产业链

智能驾驶行业的中心业务是以Google、百度为代表的智能驾驶操纵解决方案提供商和以特斯拉、蔚来为代表的成车厂商。该类厂商，上接上游软硬件提供商，下接公司和消费者，在整个业务链中扮演至关重要的一环。

产业链上游厂商多为细分技术提供商，如深度学习、人机交互、图像识别和新材料、新制造新能源等。

智能驾驶产业链图谱

资料来源：创业邦研究中心

2.智能驾驶市场分析

伴随着 ADAS 技术的不断更新，推断全球 L1-L5 智能驾驶市场的渗透率会在接下来 5年内处于高速渗透期，然后伴随半无人驾驶的普及进入稳速增长期。在未来的 2025 年无人驾驶放量阶段后，依赖全产业链的配合而进入市场成熟期。预测到2030年，全球 L4/5 级别的自动驾驶车辆渗透率将达到 15%，单车应用成本的显着提升之外，从 L1-L4 级别的智能驾驶功能全面渗透为汽车产业带来全面的市场机会。

按照 IHS Automotive 保守估计，全球 L4/L5 自动驾驶汽车产量在 2025 年将接近 60 万辆，并在 2025- 2035 年间获得高速发展，年复合增长率将达到43%，并在2035年达到2100万辆。另有接近 7600 万辆的汽车具备部分自动驾驶功能，同时会带动产业链衍生市场的大规模催化扩张。

根据独立市场调研机构 Strategy Engineers 的预测，L4 高度自动驾驶等级下，自动驾驶零部件成本约在 3100 美元/车，其中硬件占比 45%，软件占比 30%，系统整合占比 14%，车联网部分占比 11%。按照全球 1 亿辆量产规模计算，理想假设所有车辆全部达到 L4 高度自动驾驶水平，那么全球自动驾驶零部件市场规模在 2020 年将达到 3100 亿美元。

第八部分中国人工智能企业画像分析

随着人工智能技术的不断成熟，人工智能创业的难度逐步降低。创新的大门吸引众多创业企业进入。为了观察行业风向，助力创新企业发展，创业邦研究中心对国内200多家人工智能创业公司进行了系统调研，从发展能力、创新能力、融资能力等多维度指标，评选出“2018中国人工智能创新成长企业50强”。

地域分布

全国88%的人工智能企业聚集在北京、上海、广东和江苏。其中，北京人工智能企业最多，占比高达39.66%;其次是上海，人工智能企业占比达21.55%;位列第三的是广东，人工智能企业占达15.52%。北京以领先全国其他地区的政策环境、人才储备、产业基础、资本支持等，成为人工智能创业首要阵地;华东地区的上海、江苏、浙江均有良好的经济基础和科技实力，人工智能应用实力雄厚，也聚集了一批人工智能垂直产业园;广东互联网产业发达，企业对数据需求强烈，依靠大数据产业链推动人工智能产业发展。

行业分布

从行业大类分布来看，行业应用层的企业占比最大，为56.03%;其次是应用技术层的企业，占比达31.04%;基础技术层的企业占比最小，仅为12.93%。随着人工智能技术的发展，人工智能与场景深度融合，应用领域不断扩展，行业应用公司比重不断提升。在基础层技术方面，国际IT巨头占据行业领先地位，国内与国际差距明显，中小初创企业很难进入。

从行业应用来看，智能金融企业占比最大，为16.92%;其次是机器人企业，占比达15.38%;位列第三的是智能驾驶和智能教育，占比均为12.31%。金融行业的强数据导向为人工智能的落地提供了产业基础，智慧金融被列入国家发展规划中，庞大的金融市场为人工智能落地带来了发展前景。机器人作为人工智能产业落地输出，目前市场需求较大，商业机器人占据较大份额。中国智能驾驶市场在资本推动下进入者较多，企业积极推动应用落地，百度、北汽等大型企业尝试商业化落地智能驾驶汽车。人工智能推动教育个性化落地，相关初创企业涉入教育蓝海，推动智慧教育的发展。

收入情况

收入分布在500-10000万之间的企业最多，占比达49.14%;500万以下的企业位居其次，占比达 26.72%;位列第三的是10000-100000万之间的企业，占比为17.24%。

最新估值

企业最新估值均在亿元级别，且分布较为均衡。三成企业估值超过15亿元，还有企业估值达到百亿级别，如优必

选科技、达闼科技和商汤科技等，将来或将跻身人工智能独角兽企业。(备注：分析样本量剔除一半未披露企业)

第九部分典型企业案例分析

1.Atman

企业概述

Atman由来自微软的人工智能科学家和产业经验丰富的产品团队创办，提供专业领域机器翻译、机器写作、知识图谱、大数据智能采集挖掘等语言智能产品，致力于成为医学、新闻、法律等专业领域语言智能专家，为专业领域用户赋能，推动专业领域用户进入人工智能时代，助力专业领域文字智能水平实现跨越式提升。Atman已为强生、新华社参考消息、北大法宝、君合律师事务所等世界领先药企、新闻媒体、法律服务机构开发机器翻译、机器写作、知识图谱、大数据智能采集挖掘等语言智能产品。

目前Atman在北京和苏州两地运营，能快速响应全国各地客户需求。

企业团队

创始人&CEO：马磊

清华大学计算机系毕业，曾先后在微软研究院和工程院担任研究员和架构师，机器学习专家、多次创业者、曾主导多项人工智能重大项目，和申请国际专利共计15+项。

Atman公司核心团队由来自微软、百度、法电等领域高端人才和资深技术人才组成，公司员工40人，其中硕士以上学历占比60%，技术开发人员占比70%，一半以上来自微软亚洲研究院和工程院。

核心技术与产品

技术方面，擅长机器学习（深度学习、强化学习、群体智能）在复杂问题的应用，和国际专利15项，Atman神经网络机器翻译系统于2016年9月首秀，早于谷歌的GNMT，专业领域翻译效果在公测标准和行业客户测试中均持续领先。核心产品为垂直领域机器翻译、机器写作、知识图谱抽取构建、大数据智能挖掘等语言智能产品。

Atman的机器翻译产品可自动翻译编辑专业文献、报告、音视频和网页，支持私有部署和云端混合部署，提供包括数据隐私安全以及自学习的端到端解决方案。

机器写作可对海量数据进行快速搜索、过滤、聚类，根据行业需求自动生成专业文档，适用于所有专业写作场景，可大幅减少专业报告写作过程中的繁复工作，大幅提升专业领域写作效率。

知识图谱可实现海量数据的语义检索、长链推理、意图识别、因果分析，形成一个全局知识库。大数据智能采集挖掘系统为专业领域用户提供智能数据源管理、海量专业数据获取和非结构化数据自动解析并结合知识图谱提供auto-screening、知识重构、专业决策辅助，帮助用户建立强大的以专业大数据为基础的业务辅助能力。

2.黑芝麻

企业概述

黑芝麻智能科技有限公司是一家视觉感知核心技术与应用软件开发企业，2016年分别在美国硅谷和上海成立研发中心，主攻领域为嵌入式图像、计算机视觉，公司核心业务是提供基于图像处理、计算图像以及人工智能的嵌入式视觉感知平台，为ADAS及自动驾驶提供完整的视觉感知方案。

目前公司和博世、滴滴、蔚来、上汽、上汽大通、EVCARD、中科创达、车联天下和云乐新能源等展开深入合作，提供基于视觉的感知方案；除此之外，公司还在消费电子、智能家居等领域布局为智能终端提供视觉解决方案。目前公司已经完成A+轮融资。

企业团队

团队核心成员来自于OmniVision、博世、安霸、英伟达和高通等知名企业，平均拥有超过15年以上的产业经验，毕业于清华、交大、中科大和浙大等知名高校。

创始人&CEO：单记章此前在硅谷一家全球顶尖的图像传感器公司工作近20年，离职前担任该公司的技术副总裁一职，工作内容覆盖了图像传感器研发和设计、图像处理算法研发和图像处理芯片设计。

核心技术和产品

在汽车领域，黑芝麻可提供车内监控方案（DMS），自动泊车方案（AVP），ADAS/自动驾驶感知平台方案。黑芝麻智能科技提供的解决方案包括算法和芯片两个核心部分：黑芝麻感知算法从基础的控光技术，到面向AI的图像处理技术出发来提高成像质量，以及应用深度神经网络训练，结合视频处理和压缩技术，形成从传感器端到应用端的处理过程；黑芝麻芯片平台采用独有的神经网络架构，包括独有的图像处理，视频压缩和计算机视觉模块，与黑芝麻视觉算法结合，采用16nm制程，设计功耗2.5w，每秒浮点计算达20T。

3.乂学教育

企业概述

乂学教育，成立于2014年，是一家网络教育培训机构，采用人工智能和大数据技术，为学生提供量身定制学习解决方案和个性化学习内容。核心团队来自美国Knewton、Realizeit、ALEKS等人工智能教育公司，销售团队有全国40亿toC销售额的经验。

企业自主研发了针对中国K12领域的学生智适应学习产品，其核心部分是以高级算法为核心的智适应学习引擎“松鼠AI”，该产品拥有完整自主知识产权，能够模拟真实特级教师教学。企业发表的学术论文得到了全球国际学术会议AIED、CSEDU、UMAP认可，并在纽约设计了人工智能教育实验室，与斯坦福国际研究院（SRI）在硅谷成立了人工智能联合实验室。

主要产品

学生智适应学习是以学生为中心的智能化、个性化教育，在教、学、评、测、练等教学过程中应用人工智能技术，在模拟优秀教师的基础之上，达到超越真人教学的目的。该产品性价比高，以人工智能+真人教师的模式，做到因材施教，有效解决传统教育课时费用高，名师资源少，学习效率低等问题。

智适应学习人工智能系统

智适应学习人工智能系统模拟特级教师，采用图论、概率图模型，机器学习完成知识点拆分和个人学习画像，采用神经网络、逻辑斯蒂回归和遗传算法为学生实时动态推荐最佳学习路径，实现个性化教育。

业务模式

线上与线下，2B和2C相结合。以松鼠AI智适应系统教学为主，真人教师辅助，学生通过互联网在线上学习课程。开创教育新零售模式，授权线下合作学校，已在全国100多个城市开设500多家学校。

4.云从科技

企业概述

云从科技成立于2015年4月，是一家孵化于中国科学院重庆研究院的高科技企业，专注于计算机视觉与人工智能。云从科技是人工智能行业国家队，是中科院战略先导项目人脸识别团队唯一代表，唯一一家同时受邀制定人脸识别国家标准、行业标准的企业。2018年，云从科技成为祖国“一带一路”战略实行路上的人工智能先锋，与非洲南部第二大经济体津巴布韦政府完成签约。

云从科技奠定了行业领导地位：国家肯定，国家发改委2017、2018年人工智能重大工程承建单位；顶层设计，唯一同时制定国标、部标和行标的人工智能企业；模式创新，三大平台解决方案，科学家平台、核心技术平台和行业应用平台。

企业核心团队

创始人

周曦博士，师从四院院士、计算机视觉之父—ThomasS.Huan黄煦涛教授，专注于人工智能识别领域的计算机视觉研究。入选中科院“百人计划”，曾任中国科学院重庆研究院信息所副所长、智能多媒体技术研究中心主任。

周曦博士带领团队曾在计算机视觉识别、图像识别、音频检测等国际挑战赛中7次夺冠;在国际顶级会议、杂志上发表60余篇文章，被引用上千次。

核心技术团队

云从科技依托美国UIUC和硅谷两个前沿实验室，中科院、上海交大两个联合实验室上海、广州、重庆、成都四个研发中心组成的三级研发架构。目前研发团队已经超过300人，80%以上拥有硕士学历。

技术优势

全方位多维智能学习模块适应不同场景要求；模块化设计为在工业视觉、医学影像、自动驾驶AR等领域扩展打下良好基础。

云从科技具有高技术壁垒：世界智能识别挑战赛成绩斐然，在CLEAR、 ASTAR、 PASCAL VOC、 IMAGENET、FERA以及微软全球图像识别挑战赛上共计夺得7次世界冠军;在银行、公安等行业智能识别技术 PK实战中，85次获得第一；2018年，云从科技入选MIT全球十大突破性技术代表企业。

在跨镜追踪(ReID)技术上取得重大突破。Market-1501，DukeMTMC-reID，CUHK03三个数据同时集体刷新世界记录， Market-1501上的首位命中率达到96.6%，首次达到商用水平。

正式在国内“3D结构光人脸识别技术”，可全面应用于手机、电脑、机具、设备、家电。相较以往的2D人脸识别及以红外活体检测技术，3D结构光人脸识别技术拥有不需要用户进行任何动作配合完成活体验证的功能，分析时间压缩到了毫秒级以及不受环境光线强弱的影响等诸多优点，受到国际巨头公司的关注。

行业应用

目前国内有能力自建系统的银行约为148家。截止2018年3月15日，已经完成招标的银行约为121家，其中云从科技中标了88家总行平台，市场占有率约为72.7%;在安防领域推动中科院与公安部全面合作，通过公安部重大课题研发火眼人脸大数据平台等智能化系统，在民航领域，已经与中科院重庆院合作覆盖80%的枢纽机场。

5.Yi+

企业概述

北京陌上花科技是领先的计算机视觉引擎服务商，为企业提供视觉内容智能化和商业化解决方案。致力于“发现视觉信息的价值”。

旗下品牌Yi+是世界一流的人工智能计算机视觉引擎，衣+是时尚商品搜索引擎。公司在图像视频中对场景、通用物体、商品、人脸的检测、识别、搜索及推荐均达到领先水平。

目前公司和阿里巴巴、爱奇艺、优酷土豆、中国有线、CIBN、中信国安、海信、华为、360等数十家顶级机构/产品深度合作，通过提供边看边买引擎、图像视频内容分析引擎、人脸识别引擎等基于视觉识别技术的数据结构化产品服务于海量用户，同时帮助政府机构、广电系统、内容媒体、零售商、电商、视听设备等行业实现智能分析、智能互动与场景营销。目前公司已经获得B轮融资。

企业团队

团队成员来自于斯坦福、耶鲁、帝国理工、新加坡国大、南洋理工、清华、北大、中科院等名校及谷歌、微软、IBM、英特尔、阿里巴巴、腾讯、百度、华为等名企。

创始人&CEO：张默

北京大学软件工程硕士，南洋理工大学创业创新硕士。连续创业者，曾任华为算法工程师、微软WindowsMobile工程师、 IBM SmarterCity 架构师，北方区合作伙伴经理，主机Linux中国区负责人，中国区开源联盟负责人，年销售额数亿。 2013年创业于美国硅谷和新加坡，2014年6月在中国设立北京陌上花科技有限公司。

核心技术与产品

技术方面，在国际顶级计算机视觉竞赛ImageNet中，成绩曾超过谷歌、斯坦福等，2015-2016年2年获得十项世界第一。2018年3月，人脸识别准确率位列LFW榜首。Yi+通过遵循无限制，标记的外部数据协议。 Yi+的系统由人脸检测，人脸对齐和人脸描述符提取组成。使用多重损失和训练数据集训练CNN模型，其中包含来自多个来源的约10M个图像，其中包含150，000个人（训练数据集与LFW没有交集）。在测试时， Yi+使用原始的LFW图像并应用简单的L2norm。图像对之间的相似性用欧氏距离来测量，最终取得优异成绩。

公司的核心产品主要包括视觉搜索引擎，图像视频分析引擎以及人脸识别和分析引擎：

行业解决方案

针对营销、安防、相机和电视的不同特点，推出相应解决方案。

营销+AI。场景化广告方案中，大屏AI助理信息流推荐、神字幕、物体/人脸AR动态贴图、video-out、场景化角标与广告滤镜等形式的广告内容推荐，适用于快消、汽车、电商、IT、金融、旅游服务等多个行业。

智慧城市+AI。使用计算及视觉助力智慧城市，在智慧安防、智慧交通、智慧园区等方面提供解决方案。在智慧安防实时识别上，实时处理直播摄像头信息，算法反应敏捷，相应迅速。建立智慧园区方案模型，考虑扩展性&灵活性、数据管理、松散耦合性、安全性、实时整合性以及功能性和非功能性需求等技术方案要素，从业务和技术两方面整合解决方案实现步骤。

电视+AI。电视+AI的解决方案赋予智能电视多样播放能力和营销能力。

相机+AI。相机更具交互能力。用户通过搜索关键字标签同步展示图片，打通相册和购物一站式体验。准确识别人物属性特征，动态适应表情变化，可以在视频以及图像中对人脸实时检测，基于深度学习技术，进行人脸相似度检测，实现面部关键点定位、妆容图像渲染，试用与粉底、唇彩以及眼影等多种虚拟试装方式。实时检测摄像头中出现的物品、场景和人脸等，添加AR效果，SDK支持本地检测、识别、追踪，平均检测帧率可达到25fps。

新零售+AI。Yi+新零售解决方案是基于公司自主研发的人脸识别、商品识别和其他图像识别算法技术为核心，建立一整套基于人脸、商品的智能零售门店管理方案。Yi+新零售解决方案主要包含数据采集、算法模型说明和部署方案三部分，其中数据采集包括人脸数据采集、商品数据采集；算法模型说明包括识别算法训练、商品识别、识别输出；部署方案包括本地部署、云端部署、本地部署与云端部署结合。

6.擎创科技

企业简介

擎创科技成立于2016年，专注于将人工智能和机器学习赋予传统IT运维／企业运营管理，为企业客户提供智能运维大数据分析解决方案，从而取代和改善对高技能运维人员严重依赖的现状。2017年，擎创科技已实现全年2000万营收，迅速成为国内AIOps领域的领跑者和中流砥柱。2018年初，擎创科技完成了数千万人民币的A轮融资，由火山石投资领投，晨晖创投、元璟资本及新加坡STTelemedia跟投。

核心团队

擎创团队的核心成员主要由BMC、微软等美国企业服务上市公司的运维老兵，与新浪、饿了么等知名互联网公司的大数据、算法专家组成，核心团队成员至少拥有10年以上的行业经验。其中CEO杨辰是国内最顶级的B端销售，曾带领团队获得10倍的业绩增长；CTO葛晓波拥有长达15年的企业级软件开发和运维经验；而产品总监屈中泠则来自甲方，创业前为浦发硅谷银行企业架构师，深知甲方对企业运维产品的需求。这个曾经深耕于运维企业服务市场的团队，如今在智能运维企业服务赛道继续领跑，让擎创科技成为最懂企业的客户，最值得企业客户信赖的软件厂商。

主要产品

“夏洛克AIOps” 作为擎创自主研发的大数据智能运维主打产品，自2016年上线以来，已从1.0版本升级至1.9版本，可应用在金融、大型制造业、铁路民航、能源电力等涉及国家发展和民生问题的多种行业。在2017全球运维大会上，夏洛克AIOps获得由中国信息通信研究院与高效运维社区联合颁发的“年度最具影响力AIOps产品”奖。

“夏洛克AIOps”充分利用自研算法辅助客户实现IT运维价值，结合客户的现有情况，规划从传统ITOM至AIOps智能运维的一站式路径，助其运营落地，由此打破数据孤岛，建立统一的大数据智能分析平台，实现以人工智能为核心，驱动传统IT运维监、管、控三个层面，并将相关运维数据及业务数据实时展现。

“夏洛克AIOps”拥有多项自研算法，犹如运维界的福尔摩斯，能迅速发现并定位运维问题的根因，实现秒级排障，最大程度避免企业产生重大损失。更有价值的是，“夏洛克AIOps”还能通过长期的数据积累和机器学习，运用新型深度神经网络算法对企业的业务数据进行预测，帮助企业提前规划IT资源，高效预防各类黑天鹅事件的发生。

商业模式

目前，擎创科技已与多家金融和制造行业标杆客户形成稳定的合作关系，包括浦发银行、浦发硅谷银行、国家开发银行、上海铁路局、银联、海尔、浙江能源等。针对不同客户，采用个性化的商业模式进行服务，目前主要有私有模式和SaaS模式两种，都具有较强的可复制性。

核心优势

计算机视觉概述

计算机视觉概述范文第1篇

计算机视觉概述范文第2篇

计算机视觉概述范文第3篇

计算机视觉概述范文第4篇

计算机视觉概述范文第5篇

相关推荐更多

热门文章排行更多

相关期刊更多

计算物理

心智与计算

计算数学

精品文章排行更多