前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇计算机视觉研究的目的范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
【关键词】计算机;视觉系统;框架构思
在现代计算机技术的支持下,对人类视觉功能进行模拟的计算机系统被称为计算机视觉系统,因为视觉系统本身兼具科学性和应用性,所以计算机视觉系统本身既具有科学学科的特性又具有工程学科的特性。对其的研究不仅能够进一步了解人类本身,而且能够在工业生产领域发挥更大的作用。
1 计算机视觉系统现有理论框架
1.1 计算机世界理论框架
20世纪80年代,麻省理工学院教授Marr在视觉理论研究领域获得突破,提出了利用计算机实现视觉能力的理论框架――计算机视觉理论,这一理论主要特点是以现代信息处理的方式对人类视觉能力作用机制进行了分析,并以人类的视觉能力为基础在计算机技术的支持下形成了三个不同的计算机层次。分别是计算机理论层次、表示层次和算法层次。这三个层次分别对应着人类对视觉信息进行处理的三个环节,通过各个环节的仿生设置,计算机视觉系统就能够将初步的视觉处理能力赋予计算机。这一理论中的核心是计算机理论层次,Marr认为人类的视觉能力主要是从图像中建立物体形状和位置的描述,所以在这一层次中设计者设计的主要环节是从初步获取的二维图像中提取和细化物体的三维结构和位置,并将这些信息在一个二维平面上反映出来,即三维重建。
1.2 基于知识的视觉理论框架
基于知识的视觉理论框架最早产生于20世纪90年代,最早的提出者是Lowe。认为在人类的视觉能力发挥过程中,对三维物体的实际测算是不必要的,人类的视觉能力与三维测算能力没有直接的关系,虽然使用三维测算技术也能够实现计算机视觉系统的功能,但并不是对人类视觉功能的模仿。Lowe认为在人类的视觉活动中,会将三维物体看成二维物体,也会将二维物体看成三维物体。这种现象本身并不是偶然性的,而是一种视觉作用机制的必然。既然人类肉眼能够借助一定的作用机制和处理能力实现二维的三维化,在计算机视觉系统中就完全有可能设计出这种对人类肉眼直接模拟的机制。以感知系统感知物体的二维特性,并在其基础上直接生成三维图像,而不需要借助复杂的测量过程。
1.3 主动视觉理论框架
主动视觉理论是在现有计算机理论的基础上形成的新型理论框架,是根据人类视觉功能实现的主动性提出的。在人类实现视觉功能的过程中,人类的视觉系统并不是被动的,而是会根据视觉系统的要求调动身体的其他部位进行配合的、具有主动性的,所以在人类视觉功能的发挥过程中,视觉系统是具有主动性的,人类视觉系统的视角、关注点都会是动态变化的。
基于这一理论,主动视觉理论框架认为人类的视觉活动是一种“感知――动作”过程。根据这一原则,主动视觉理论框架认为计算机视觉系统并不需要精准的三维测算系统。而应该以计算机视觉获取系统为核心,设置主动的视觉系统。这一理念在实际的应用中主要通过对图像获取系统技术参数的调整和控制来实现,例如摄像机的位置、取向、焦距、光圈等,通过对这些参数的调整图像信息获取系统就能够从不同的视角对物体进行观察,进而获取物体的三维图像信息。
2 计算机视觉理论框架中存在的问题
计算机视觉理论框架的产生极大的支持了计算机视觉系统的研发工作,但是在计算机视觉系统的实际研发工作中,也逐渐暴露出了计算机理论框架的缺陷。当前主流的计算机视觉系统框架中,计算机视觉理论是最早产生的也是唯一一种被动的计算机视觉技术。在其理论系统中更多的强调人类视觉系统的测算能力,而没有意识到人类的视觉系统是一种主观性很强的、目的性很强的信息获取系统,完全建立在测算基础上的计算机视觉理论框架是不必要的。
基于知识的理论框架,认为人类视觉系统的功能实现主要环节是反馈,强调了人类视觉活动中主观意识的指导作用。但是它过于强调系统的目的性和主观性,完全否定了计算机视觉理论,认为人类视觉系统是个完全脱离计算机的认识过程,这种认识显然是错误的,在判断物体尺寸大小、距离远近时,测算无疑是极为必然的。
主动视觉理论并不完全排除三维重建,认为计算机视觉系统的三维重建应该建立在图像获取系统的主动性上。通过改变图像获取摄像机的角度、参数对时间、空间和分辨率等进行有选择的感知,解决了计算机视觉系统认知过程中的不稳定问题,降低了计算机视觉系统实现的难度。但是在其理论框架内部缺乏主观、高层的指导,从整体上看并不完善。
3 计算机视觉系统框架的新构思
在计算机视觉系统的研究领域,三种理论构建各有优劣。但是无疑反应了当前计算机视觉系统研发的主流思想,因此计算机视觉系统框架的新构思应该在其基础上进行,致力于克服各个理论的缺点。综合比较三种理论框架,笔者认为计算机视觉理论虽然存在某些问题,但是从整体上看这一理论框架是最具实践性和操作性的,其存在的问题完全可以借助其他理论框架加以解决,因此笔者以计算机视觉理论为主体,结合基于知识的视觉理论和主动视觉理论,提出一个更加完善和通用的计算机视觉系统构架。
计算机视觉系统视觉功能实现的主体结构还是建立在计算理论结构的基础上的,将计算理论框架中的早期视觉处理环节分为图像预处理、图像分割和二维模式识别两个部分,因为图像的预处理是在平面图像基础上的简单处理,不需要主观主导意识和目的性的参与,同时图像分割和二维模式识别能够最大限度的提升后继图像处理的效果。
在早期处理完成以后,后继的中后期处理还是分别情调了二维模式识别和三维模式识别,虽然这两种模式本身的识别原理是一样的,但是其面对的对象不同,物体的模型也不同。一般来讲,在我们的世界中二维信息具有很强的重要性,图形、文字、指纹等关键二维信息在通常情况下作用更大、应用范围更广,所以计算机视觉系统矿建的新思路中,要对二维信息进行进一步的处理。
模型库提供具体物体模型的表示。知识库不但要对物体进行抽象表示而且还要对抽象知识进行推理。人类经验的积累和知识的获取是通过学习而得到的,所以加人模型库、知识库管理,并让其从输出结果中进行学习。这将使模型库和知识库更加丰富和完善。
视觉活动本身是带有目的性的,所以在有些时候视觉系统的应用确实需要视物体的实际情况来决定,有时只需识别场景中存在的是什么物体或某物是否存在,而不要求定量恢复场景中的物体。因此,在计算机视觉系统中引人视觉目的来判断输出是否满足要求。同时,用视觉目的对图象分割和二维模式识别、中期视觉处理、后期视觉处理和三维模式识别加以控制。如果需要三维重建则由主动视觉控制成象来获得景物更完整的信息。
计算机视觉系统框架是支持计算机视觉系统实现的重要基础,所以在计算机视觉系统的研发、设计工作中,对理论框架的研究具有鲜明的现实意义,本文简单介绍了现有框架思想,并分析了其各自的优缺点,最后再这些理论框架的基础上形成了计算机视觉系统框架的新构思。认为计算机视觉系统构架应该以计算机理论为基础,以视觉活动的主观性和目的性为指导,以具体的视觉实现形式为方法。
【参考文献】
【关键词】精密测量 计算机视觉图像 关键技术
在现代城市的建设中离不开测量的运用,对于测量而言需要精确的数值来表达建筑物、地形地貌等特征及高度。在以往的测量中无法精准的进行计算及在施工中无法精准的达到设计要求。本文就计算机视觉图像精密测量进行分析,并对其关键技术做以简析。
1 概论
1.1 什么是计算机视觉图像精密测量
计算机视觉精密测量从定义上来讲是一种新型的、非接触性测量。它是集计算机视觉技术、图像处理技术及测量技术于一体的高精度测量技术,且将光学测量的技术融入当中。这样让它具备了快速、精准、智能等方面的优势及特性。这种测量方法在现代测量中被广泛使用。
1.2 计算机视觉图像精密测量的工作原理
计算机视觉图像精密测量的工作原理类似于测量仪器中的全站仪。它们具有相同的特点及特性,主要还是通过微电脑进行快速的计算处理得到使用者需要的测量数据。其原理简单分为以下几步:
(1)对被测量物体进行图像扫描,在对图像进行扫描时需注意外借环境及光线因素,特别注意光线对于仪器扫描的影响。
(2)形成比例的原始图,在对于物体进行扫描后得到与现实原状相同的图像,在个步骤与相机的拍照原理几乎相同。
(3)提取特征,通过微电子计算机对扫描形成的原始图进行特征的提取,在设置程序后,仪器会自动进行相应特征部分的关键提取。
(4)分类整理,对图像特征进行有效的分类整理,主要对于操作人员所需求的数据进行整理分类。
(5)形成数据文件,在完成以上四个步骤后微计算机会对于整理分类出的特征进行数据分析存储。对于计算机视觉图像精密测量的工作原理就进行以上分析。
1.3 主要影响
从施工测量及测绘角度分析,对于计算机视觉图像精密测量的影响在于环境的影响。其主要分为地形影响和气候影响。地形影响对于计算机视觉图像精密测量是有限的,基本对于计算机视觉图像精密测量的影响不是很大,但还是存在一定的影响。主要体现在遮挡物对于扫描成像的影响,如果扫描成像质量较差,会直接影响到对于特征物的提取及数据的准确性。还存在气候影响,气候影响的因素主要在于大风及光线影响。大风对于扫描仪器的稳定性具有一定的考验,如有稍微抖动就会出现误差不能准确的进行精密测量。光线的影响在于光照的强度上,主要还是表现在基础的成像,成像结果会直接导致数据结果的准确性。
2 计算机视觉图像精密测量下的关键技术
计算机视觉图像精密测量下的关键技术主要分为以下几种:
2.1 自动进行数据存储
在对计算机视觉图像精密测量的原理分析,参照计算机视觉图像精密测量的工作原理,对设备的质量要求很高,计算机视觉图像精密测量仪器主要还是通过计算机来进行数据的计算处理,如果遇到计算机系统老旧或处理数据量较大,会导致计算机系统崩溃,导致计算结果无法进行正常的存储。为了避免这种情况的发生,需要对于测量成果技术进行有效的存储。将测量数据成果存储在固定、安全的存储媒介中,保证数据的安全性。如果遇到计算机系统崩溃等无法正常运行的情况时,应及时将数据进行备份存储,快速还原数据。在对于前期测量数据再次进行测量或多次测量,系统会对于这些数据进行统一对比,如果出现多次测量结果有所出入,系统会进行提示。这样就可以避免数据存在较大的误差。
2.2 减小误差概率
在进行计算机视觉图像精密测量时往往会出现误差,而导致这些误差的原因主要存在于操作人员与机器系统故障,在进行操作前操作员应对于仪器进行系统性的检查,再次使用仪器中的自检系统,保证仪器的硬件与软件的正常运行,如果硬软件出现问题会导致测量精度的误差,从而影响工作的进度。人员操作也会导致误差,人员操作的误差在某些方面来说是不可避免的。这主要是对操作人员工作的熟练程度的一种考验,主要是对于仪器的架设及观测的方式。减少人员操作中的误差,就要做好人员的技术技能培训工作。让操作人员有过硬过强的操作技术,在这些基础上再建立完善的体制制度。利用多方面进行全面控制误差。
2.3 方便便携
在科学技术发展的今天我们在生活当中运用到东西逐渐在形状、外观上发生巨大的变大。近年来,对于各种仪器设备的便携性提出了很高的要求,在计算机视觉图像精密测量中对设备的外形体积要求、系统要求更为重要,其主要在于人员方便携带可在大范围及野外进行测量,不受环境等特殊情况的限制。
3 计算机视觉图像精密测量发展趋势
目前我国国民经济快速发展,我们对于精密测量的要求越来越来高,特别是近年我国科技技术的快速发展及需要,很多工程及工业方面已经超出我们所能测试的范围。在这样的前景下,我们对于计算机视觉图像精密测量的发展趋势进行一个预估,其主要发展趋势有以下几方面:
3.1 测量精度
在我们日常生活中,我们常用的长度单位基本在毫米级别,但在现在生活中,毫米级别已经不能满足工业方面的要求,如航天航空方面。所以提高测量精度也是计算机视觉图像精密测量发展趋势的重要方向,主要在于提高测量精度,在向微米级及纳米级别发展,同时提高成像图像方面的分辨率,进而达到我们预测的目的。
3.2 图像技术
计算机的普遍对于各行各业的发展都具有时代性的意义,在计算机视觉图像精密测量中运用图像技术也是非常重要的,在提高图像处理技术做以提高。同时工程方面遥感测量的技术也是对于精密测量的一种推广。
4 结束语
在科技发展的现在,测量是生活中不可缺少的一部分,测量同时也影响着我们的衣食住行,在测量技术中加入计算机视觉图像技术是对测量技术的一种革新。在融入这种技术后,我相信在未来的工业及航天事业中计算机视觉图像技g能发挥出最大限度的作用,为改变人们的生活做出杰出的贡献。
参考文献
[1]汤剑.周芳芹.杨继隆.计算机视觉图像系统的技术改造[J].机电产品开发与创新周刊,2015,14(18):33-36.
[2]马玉真.程殿彬.范文兵,计算机视觉检测技术的发展及应用研究[J].济南大学学报,2014,18(23):222-227.
[3]李华.基于计算机视觉图像精密测量的关键技术分析[J].电脑知识与技术,2013(05):1211-1212.
【关键词】动态图像序列;自动扶梯;客流量;测量
视频处理技术的产生和发展使得其应用范围越来越广泛,在这之中,动态图像序列处理技术因其在监控和管理方面的智能化特点,有着非常广泛的应用前景,其在自动扶梯客流量测量分析方面的应用为保证大型场所中自动扶梯的安全性提供了保障,对其进行研究是有着非常重要的意义的。
一、自动扶梯与其客流量
自动扶梯的定义是,由一台特种结构形式的链式输送机和两台特殊结构型式的胶带输送机所组合而成的,用以在建筑物的不同层高间运载人员上下的一种连续运输机械。其主要部件包括梯级、梯级驱动装置、驱动主机、传动部件、紧张装置、扶手装置、金属结构、梯级导轨、上下盖板、梳齿板、安全装置和电气控制系统等。自动扶梯具有连续性强,运输量大的特点,在人流集中的场所有着广泛的应用,比如在商场、飞机场、火车站、地铁站以及一些大型的娱乐场所中都可以看见人们利用自动扶梯来达到移动的目的。
自动扶梯的工作流程为:自动扶梯的梯级链作为扶梯的核心部件,一系列的梯级与两根牵引链条连接在一起,在按一定线路布置的导轨上运行即形成自动扶梯的梯路。牵引链条绕过上牵引链轮、下张紧装置并通过上、下分支的若干直线、曲线区段构成闭合环路。这一环路的上分支中的各梯级(也就是梯路)应严格保持水平,以供乘客站立。上牵引链轮(也就是主轴)通过减速器等于电动机相连以获得动力。扶梯两旁装有与梯路同步运行的扶手装置,以供乘客扶手之用。扶手装置同样由上述电动机驱动。为了保证自动扶梯乘客的绝对安全,在扶梯的主要部件处还装设多种安全装置,当扶梯有发生意外的倾向时,电气系统能及时的制停扶梯。
自动扶梯作为一种凭借运输带进行人员运输的工具,在大型场所的人员运输方面发挥着不可或缺的作用。当行人在自动扶梯的任意一端踏上梯级,就能被自动带到自动扶梯的另一端。扶梯可以一直保持相同的行走方向,但是绝大多数的自动扶梯可以根据时段和人流的需求,由管理人员对其行走方向进行控制。
自动扶梯在实际应用中,由于乘客自身情况存在差异性,因此并不能保证自动扶梯的每节台阶上都能满足理论上的人数设计,另外,在自动扶梯连续运转时,也不能保证乘客都能准确站在台阶上。因此,自动扶梯的实际运送能力与理论水平还是存在一定的差距。因此,为了保证自动扶梯的安全性,就要采取一定的措施对自动扶梯的客流量进行测量和分析。
二、计算机视觉系统
随着计算机技术的发展,计算机视觉研究的技术也越发成熟,目标检查和跟踪技术作为其中一个十分重要的部分引起了人们的广泛关注。
人类通过多种感觉器官形成对外界环境的感知,而在这些感知信息中,绝大多数的信息都是通过视觉,即通过人眼获得的。视觉作为一种高清晰度的媒介,能够在外界环境中实现信息的获得,还能对获得的信息进行处理、存储和传输。而为了填补智能机器在这个领域中的空白,从而实现捕获图像并对图像的属性进行描述及理解的目的,计算机视觉这门学科便应运而生。
计算机视觉的原理就是利用成像系统来代替视觉器官作为输入手段,利用计算机来代替人脑作为处理和解释的系统,从而使计算机能够实现如人一样的功能,通过视觉上观察到的事物和状况来理解、解释当前的事项,并依据视觉系统观察到的不同状况,自动做出适合当前状况的处理。但是要想达到这个目标,是要经过长久努力的,因此,人们在实现最终目标之前,首先确立了一个中期目标,这个中期目标就是建立起一种视觉系统。此视觉系统能够达到一定程度上的智能化,依据视觉敏感度和反馈完成一定的任务。自主车辆的直觉导航系统就是计算机视觉的一个重要的应用实例,然而,截止目前,还未能实现同人一致的对于任何环境都能进行识别和理解的能力,对于自主导航系统的实现还存在一定的差距。基于此,人们又将研究目标转向了高速公路上的道路跟踪能力,从而实现视觉辅助驾驶系统的开发,避免车辆在行驶的过程中与前方车辆发生碰撞。
需要特别指出的是,在这种计算机视觉系统中,计算机在其中的作用只是代替人脑的作用,但并不代表计算机就一定要按照人类视觉方法来处理视觉信息。计算机在处理视觉信息时,还是应该依据计算机系统本身的特点来进行,但是人类视觉系统作为目前为止人们所知的、功能最为强大和完善的视觉系统,还是应该作为计算机视觉研究的指导方向和启发方向。而这种由计算机信息处理的方法来研究人类视觉并建立起人类视觉的研究,被称为计算视觉,也是计算机研究中一个重要的研究领域。
随着人们逐渐步入信息时代,计算机技术广泛渗透于各个领域。究其原因,主要是因为很多没有经过专业计算机训练的人也要使用计算机,同时,计算机随着科学技术的不断发展,其功能性也在不断地增强。然而,这也相应为计算机的使用带来了一定的弊端,比如,计算机的使用方法也变得越来越复杂,这就在一定程度上导致了人本身的灵活性与计算机使用时的死板要求形成了强烈的反差和矛盾。前者可以通过听觉、视觉等各种感官知觉与外界进行信息交换,还可以通过大脑的处理,用不同的方式传达相同的意义,而计算机却只能依照之前编写的程序语言来运行程序来实现运行的目的。因此,为了能方便更多的人应用复杂的计算机,就必须要通过一些有效的措施来改变从前计算机为主体,人去适应计算机的状况,而应该以人为本,交换主体,让计算机来适应其使用者的需求和习惯,以人的习惯为要求指向,让计算机具有听觉、视觉等能力。同时,计算机还需要具有一定的逻辑推理能力和决策能力。而这种计算机即智能计算机。智能计算机的出现,使计算机的使用更加方便和人性化,以智能计算机为基础的系统也为各个领域的发展带来了巨大的促进作用,替代了很多繁重的工作,提高了工作效率,并且保证了工作人员的作业安全。
同时,在计算机视觉研究领域,运动目标的检测识别和跟踪技术一直都是一个热点问题,其对识别精度和实时性要求更高,其算法的好坏会给结果的稳定性和精准度带来直接的影响。而这些方法的实现都是基于动态图像序列。
三、基于改进型Hausdorff距离的人体检测
自动扶梯客流量的测量工作是极具现实意义的,通过对大型场所内自动扶梯的客流量进行测量,可以有效对客流量进行控制,提高人员和建筑的安全。而测量工作的实现是基于摄像头获得的动态图像序列,并通过序列进而识别出人数和即时速度。为了能够准确识别出自动扶梯上的各个人体,可以采用Hausdorff距离识别方法。这种方法即使在有光线问题或者遮挡问题导致人体特征现象发生时,也能完成对人体的识别。而Hausdorff距离模板又具有适应性强且计算量小的优点。但是在很多应用场合中,一旦被测图像中有些边缘信息消失或者存在大大量与人体特征无关的点时,这种距离模板的匹配就不能达到令人满意的效果。
Hausdorff距离的模板匹配及其缺陷
Hausdorff距离是用来描述两组点集间相似度的量度,是一种集合之间的定义形式。若设A、B为两个有限点集,则Hausdorff距离则可表示为:
H(A,B)=max(h(A,B),h(B,A)) (1)
h(B,A)=max{mina-b} (2)
当Hausdorff距离用于二值模板与图像之间的匹配时,首先要计算这两个二值图像的距离变换。由(2)计算出有向距离,再由(1)得出Hausdorff距离的值,从而判断出匹配情况。但是需要特别指出的是,一旦图像中存在突发的噪声时,Hausdorff距离值也可能变得很大,从而造成目标物体不能被有效检测。另外,当所测目标物因为光线的问题或者遮挡问题只有部分物体特征呈现出来时,Hausdorff距离的值也可能会很大,也就是说目标物体还是得不到检测。
针对以上方法存在的缺陷,为了进一步提高此方法的稳定性,对(2)进行了改进,有相距离表示为:
从而通过对不同区域下的界定就可以有效去除二值匹配过程中干扰因素的影响。
基于滤波的目标预测跟踪
可以采用滤波器进行预测和跟踪匹配位置中心点。此处滤波器将被用于匹配中心点在下一图像中的位置,假设这两个坐标之间不相关,则就可以实现对这两个中心点的分别预测和跟踪,极大提高了算法的执行效率。而在下一帧中检测目标时,就可以缩小搜索范围。这不仅使得该算法的执行速度得到了提高,还使之更适于自动扶梯客流量状况测量的实时操作。
四、结语
自动扶梯客流量的测量对于扶梯的安全使用有着重要的意义,相信随着科学技术的不断发展和科研人员的不懈努力,在不久的将来,一定会出现更为方便、准确的测量方法,并在各个领域上得到有效应用,为计算机视觉系统的发展提供坚实的基础。
参考文献
[1]贤云得.机器视觉[M].北京:科学出版社,2004.
[2]张强.动态图像序列中目标检测与跟踪技术研究[D].华北电力大学,2012.
生活中,每个人都问过别人“这件衣服是从哪买的?”“这双鞋是什么牌子的?”这一问题很快会被AI技术解决,只需要拿出手机对着物品拍照,就会得到商品的各种信息,并且能一键买买买。这就是美国著名图片社交网站Pinterest(拼趣)即将推出的应用图片识别购买业务。
Pinterest总裁Tim Kendall表示,“Pinterest可以即刻在存储750多亿张图片的巨大网络空间内进行搜索,从而为用户找到与所拍摄照片相似的配对图片,以及查找到哪些地方能够买到他们所需的商品。”
目前,Pinterest的估值已经达到了110亿美元,该公司的专注点正在向营收增长和创收方面转变。相比Facebook、Twiter等社交网站,Pinterest已经率先找到了一条清晰的创收道路。
从兴趣到产品
亚里士多德曾经说过,古往今来人们开始探索,都应起源于对自然万物的惊异。科技的进步也是如此,就像微软研发主管和项目负责人Mitch Goldberg所说:“我们想通过该应用向人们展示识别技术的无限魅力。”
今年2月,微软旗下的Garage实验室了一款名为“Fetch!”的应用,它可通过机器学习系统识别照片中宠物狗的品种并用文字对该品种进行简单的介绍。
随着计算机视觉领域开始利用深层神经网络这种模仿人类大脑生物过程的系统来从事机器学习,识别的精确度实现了巨大飞跃。也就是说通过机器学习技术,Fetch!识别的准确度会越来越高,随着大量图片的涌入,Fetch! 可以自我修复错误,从而更加精确地识别每一只狗的样貌、形态、动作。除了测试狗类品种以外,你还可以把朋友的照片上传至平台,看看他们能够对应出哪种宠物。
微软的这款产品基于目前最为热门的一种图像识别技术――“深度神经网络”,同样基于这种技术,微软还有另一款有趣的产品:。去年5月,有超过5.75亿图片被提交到,超过8500万来自世界各地的使用者访问了这个网站,只为寻找一个简单问题的答案――颜龄机器人认为我看起来像几岁?如果是合照,并且颜龄机器人识别出的自己比周围人年龄小,则更能引发用户的兴趣,这种“损人利己”的识别应用着实在社交媒体上火了一把。
另一让计算机视觉研究技术人员特别感兴趣的领域是生物识别,当下最为火爆的莫过于人脸识别技术了。早期的人脸识别技术多为安防领域,如海关识别走私犯、商店识别小偷等。近年来,深度学习的研究与应用使得人脸识别和人工智能的核心技术得到了极大的提升,摄像头等图像硬件的发展为人脸识别提供了很好的图像基础,如今人脸识别技术应用更加广泛,比如公司可以使用刷脸打卡来杜绝代人打卡签到现象。
其实早在2012年,谷歌就开发出了安卓系统的“刷脸解锁”技术,但因安全问题未解决,该技术一直未能得到普及。
而今年3月,电商巨头亚马逊提交了一项针购物付费的专利技术,即消费者在亚马逊网站购物时可以通过自拍或者视频来进行付费,无须再输入账号密码。在消费时系统会提示用户表现出特定的行为、情绪或手势来证明消费者就是本人,而不是拿着照片的冒名顶替者。
亚马逊表示,这项技术能使消费者更加安全地进行网上购物,因为很多用户为了省事会把所有账户都用同一个密码,或者把密码记在手机里,一旦遭遇“撞库”或者手机被盗,后果不堪设想,而刷脸技术则没有这个风险。
除了识别人脸,在识别其他生物方面也有了突破性进展,比如识别寄生虫。疟疾,是一种由疟原虫造成的全球性急性寄生虫传染病,据统计,2015年有大约有2.14亿人受疟疾的影响。
一直以来,医疗工作者是通过肉眼观察采样玻片来确定采样对象是否被疟原虫感染,这不但是对医疗工作者经验的考验,而且工作效率也十分低下,而贫困地区一直都缺乏有经验的医疗工作者。
今年2月,根据MIT Technology Review报道,Intellectual Ventures Laboratory(智能事业实验室)开发出了能够检测和评估疟疾感染的便携式显微镜。这种显微镜采用的是一个名为“Autoscope”的系统,通过计算机视觉和深度神经网络技术,采用深度学习算法来鉴别疟原虫。这款便携式显微镜今年在泰国实地测试,成功鉴别出了 170块玻片中的疟原虫如果这项技术得到普及之后,只要诊所有一台Autoscope显微镜和一些载玻片,就可解决疟疾的诊断问题,这将使疟疾诊断不再依赖于有限的专业医疗人员。
技术转化为产品
新技术的出现,让计算机不但“看见”这个世界,更能“看懂”这个世界,可以代替人眼甚至超越人眼。
人的视野是有限的,并且会受到周边条件的影响,驾驶员在开车时会有视野盲区,还会受到光线的影响,并且大雾、暴雨等极端天气也会严重影响驾驶员的视线。而计算机视觉技术就不一样了,视野会更开阔,受限制更小。根据汽车媒体《Leftlane》报道,福特公司最新的无人驾驶汽车研究计划是由激光感应(LiDAR)和雷达、摄像头形成一张周围环境的高清3D地图,不但让无人驾驶汽车看到摄像头视野范围之外的物体,而且并不受光线限制。在夜间试驾后,福特工程师Wayne Williams说:“坐在汽车里,我能感到它在走,但是我往车外看,只能看到一片漆黑。结果令人惊喜,车辆准确地沿着蜿蜒的道路行驶。”
识别场景这一领域技术的发展,使得计算机不但能当机器的眼睛,还能变成人类的眼睛。
对于双目失明的人来说,能亲自感知这个世界是梦寐以求的事,而微软2016 Build开发者大会上Seeing AI项目正是要帮助盲人实现这一愿望。
Seeing AI项目是通过计算机视觉和自然语言去形容一个人的周围环境、朗读文本、回答问题以及识别人的面部表情,可以在手机上使用,也可以在Pivothead的智能眼镜上使用。如果投入使用,将有助于为视障人士营造更公平的环境,是一款能够真正改变人们生活的产品,就像此项目的高级项目经理Anne Taylor所说的,这是“为真正重要的场景寻求解决方案”。也许不久微软能开发出一种仿生眼,直接发送视觉信号到大脑,让盲人真正看到这个世界。
关键词:机器学习;模式识别;计算机视觉;机场管制;民航安全
引言
安全管理是我们民用航空管理中的一个非常重要的问题,一直以来都受到整个行业的高度重视。机器学习作为人工智能技术的分支,已经在短短的几年时间内渗透到我们身边的各行各业,为之提供了大量的便利并极大的节省了人力及物力资源。由此我们推测,将机器学习及其相关技术应用到民航安全管理体系中,也将起到卓越的成效。本文便是对机器学习在民航安全管理的应用领域进行探索和分析。
1 机器学习介绍
1.1 定义
利用计算机对给定的数据进行分析并从中获取规律是机器学习的首要研究目标,这些数据我们称作观测样本,所学习到的规律我们称之为模型。通过这些规律模型,可以对未来将要出现的数据进行预测。
图1即机器学习的简单示例。机器学习的第一步即是选择一个规律模型,定义为决策函数f(x,?兹),该函数中的参数?兹并不确定。第二步则是通过机器学习的算法寻找出一个最适合的参数?兹?鄢,这个过程叫做训练过程。经过以上两个步骤,我们就可以使用f(x,?兹)模型对输入的x进行结果预测。
1.2 应用场景
我们所描述的机器学习,不仅仅是针对一些已经经过结构化处理的信息,还应当包含图像、音频在内的数字化数据。从范围上讲,它类似于模式识别、统计学习、数据挖掘,正是由于机器学习与这些不同领域的结合,从而形成了它在计算机视觉、自然语言处理、语音识别这些交叉学科中的研究优势。
2 民航安全管理
2.1 安全管理系统简介
民用航空中比较传统的思想认为没有危险就表示安全,然而现代的安全管理思想并不这样认为。现代的安全管理思想把安全当做一种状态,同时也是识别危险和管理风险的一个过程。由此可见,我们的安全管理系统(safety management system简称:SMS)必须是一个完整的、正规的、自顶向下的和有条不紊的综合安全管理系统。
2.2 我国的民航安全管理系统现状
分阶段发展的策略是在改革开放以来我国的民航业实施的总方针[1],并且已取得显著成效:第一阶段,通过逐渐放松进入市场的时机,让民航走上企业化发展的道路;第二阶段,在民航业内部实施全面的制度改革,为进入市场化进行机制创造条件,同时大步跨入市场化经营时期;第三阶段,抓紧时机进行民航的行业重组,这一项改革已经取得了重大突破。虽然分阶段的策略成绩斐然,然而就目前来看,我国民航业的安全管理信息化进程依旧相对落后。
3 机器学习在安全管理体系中的应用
3.1 模式识别与机场管制
模式识别是工业业界提出的概念,而机器学习主要来自于计算机学术领域,在本质上二者没有区别。机场管制也称航空管制,航空流控 航路流控 等,指的是由于起降航班班次集中,飞机按关门先后顺序排队起飞,或者由于天气、军事、目的地机场问题等原因,塔台对飞机起飞时间进行管制。机场管制的目的是保证航空安全,以及保障飞机的飞行秩序。
通过机器学习的模式识别技术,安全管理系统可以对机场终端区域的所有飞行器进行实时监控,分析处理一次雷达、二次雷达及自动相关监视系统(ADS-B)等监视设备传回的包括飞行器高度、位置、运行状态以及气象信息在内的各种大规模数据,并在异常情况出现时,或者在异常情况即将出现之前(取决于机器学习算法的数据预测功能),向塔台管制员提供预警服务,避免各种特情的发生。
3.2 计算机视觉与机场安全
人脸识别[2]是计算机视觉领域的一个非常重要的研究方向。传统的人脸识别技术在实际应用中已经非常广泛,但是从性能的角度来看,依然存在诸多问题,最重要的是,从安全的角度考虑亦存在诸多漏洞。现在已经证明出现的针对传统人脸识别的黑客技术,已经屡见不鲜。而通过机器学习改进后的人脸识别技术[3],不仅可以解决安全问题,并且十分有利于人脸识别精度的改善和人脸识别速度的提高。将优化后的人脸识别系统应用到机场的安检流程中,可以大大提高安检人员的工作效率,同样降低人工工作的强度。
同样的,计算机视觉及图像处理技术还可应用于机场场面安全管理。比如,随着通用航空的发展,无人机的数量快速增加,由于其制造成本低操作简单等特性,越来越多的单位和个人开始使用无人机从事私人的业务。这些没有规范管理的无人机,在缺乏地空空域管理的情况下,很容易就能够飞行进入机场的管制区,形成巨大的安全隐患。利用计算机视觉进行远距离摄像实时监控,有望很好的解决这个安全问题。
3.3 其他应用领域
除此之外,机器学习的各种算法模型,包括贝叶斯模型(Bayesian)、人工神经网络(Artificial Neural Networks)、深度学习(Deep Learning)、组合方法(Ensemble Methods)、回归(Regression)等等,均可根据各自的特性,应用于民航安全系统:数据预测特性可以应用于航空气象数据的分析与预测中,用以提前为管制人员提供尽可能准确的气象预报数据;语音识别及文本分析特性,可以应用于管制员与飞行员的陆空通话过程中,不仅可以监控陆空通话的内容,同时可以对参与人员的疲劳程度进行研判;大规模数据中的异常数据监测,可以应用行器设备及地面设备的维修与保障中。
4 结束语
近年来,以机器学习技术推动的人工智能已渗透到几乎所有的工业领域。而机器学习的应用场景,也就是它的应用领域,也恰好与我们信息化安全建设的方方面面都有诸多重合。对于我们民航,确切的说,对于我们民航的安全管理系统,尽早引入并应用机器学习相关技术,将会极大的改善系统的工作效率并提高安全保障的成效。
参考文献
[1]李洋.我国民航安全管理系统研究[D].中国海洋大学,2013.