前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇对计算机视觉的理解范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
关键词:双目视觉;匹配算法;计算机视觉;立体匹配;相位一致性
1.计算机视觉系统分析研究
1.1计算机视觉技术及双目立体视觉
计算机视觉是通过计算机技术实现对视觉信息处理的整个过程,是一门新的学科。视觉是人们认知事物的重要途径,视觉是人们对视觉信息获取、处理和存储的过程。随着计算机技术的发展,信号处理技术的应用,人们通过照相机来把实际的事物拍摄下来转变为数字信息,并通过计算机信号处理技术队获取的视觉信号进行处理。计算机视觉技术对图像的处理分为获取图像、特征抽象选取、事物识别及分类和对三维信息的理解。获取图像主要是通过摄像机和红外线等技术对周围视觉事物进行获取,并通过计算得到和真实事物相应的二维图像,二维图像主要是数字图像。计算机视觉系统的最基本的功能是数字图像的获取。可以看出计算机视觉研究最基本内容是三维场景距离信息的获取。在计算机被动测量距离方法中,有一种重要的距离感知技术叫作双目立体视觉。双目立体视觉技术是其他计算机视觉技术无法取代的一种技术,对双目立体视觉技术的研究在计算机视觉技术和工程应用方面都是非常重要的。
1.2计算机视觉理论框架
第一个视觉系统理论框架的提出是以信息处理为基础,综合了图像处理和神经生理学等研究内容而建立的。这个视觉系统理论框架是计算机视觉系统的基本框架,与计算机视觉技术有着密切的关系。视觉系统的研究是以信息处理为基础的,从理论层次、算法层次和硬件层次3个层次进行研究。计算机理论层次主要是表达系统各个部分计算的目的和方法,对视觉系统的输入和输出进行规定,输入作为二维图像,输出是以二维图像为基础建立起来的三维物体,视觉系统的目的就是对三维物体进行分析和识别,通过计算对二维物置和形状进行重新建立。算法层次对计算机规定的目标进行计算,算法和计算机表达有关,不同的表达可以通过不同的算法进行实现,在计算机理论的层次上,算法和表达比计算机理论的层次要低。硬件层次是通过硬件来实现算法的一种表达方法。计算机理论层次在计算机信息处理中时最高的层次,取决于计算机的本质是解决计算机的自身问题,不是取决于计算问题的计算机硬件。要更好地对计算机系统和框架进行理解最好的方法就是要区分3个不同的层次,计算机理论的含义和主要解决的问题是计算机的目的,表达算法含义和主要解决的问题是实现计算理论的方法和输入输出的表达,硬件的实现的含义和主要解决的问题是如何在物理上对表达和算法进行实现。计算机视觉处理的可以分为3个阶段,对视觉信息的处理过程从最初的二维图像的原始数据,到三维环境的表达。第一阶段基元图的构成,基元图是用来表示二维图像中的重要信息,主要是图像中亮度变化位置及其几何分布和组织结构,图像中每点的亮度值包括零交叉、斑点、端点和不连续点、边缘等。第二阶段2.5维图描述,在以观测者为中心的坐标中,表示可见表面的方向、深度值和不连续的轮廓,基元是局部表面朝向离观测者的距离深度上的不连续点表面朝向的不连续点。第三阶段三维模型表示,在以物体为中心的坐标系中,有由体积单元和面积单元构成的模块化多层次表示,描述形状及其空间组织形式,分层次组成若干三维模型,每个三维模型都是在几个轴线空间的基础上构成的,所有体积单元或面积形状基元都附着在轴线上。视觉理论框架图如图1所示。
2.基于计算机的视觉立体匹配算法研究
视觉立体匹配算法是基于人类视觉系统的一种计算机算法。立体匹配算法作为计算机立体视觉问题研究的重点,快速地实现图像对应点的匹配来获得视差图是当今研究的热点问题。立体视觉匹配算法根据基元匹配的不同可以分为相位匹配、区域匹配和特征匹配3种,其中区域匹配算法可以减少计算负担,区域匹配算法实时性高,应用前景广阔。计算机立体视觉通过对人的双眼进行模仿,在双眼的立体感知中获得信息,从摄像机拍摄的图像中获取物体的三维深度信息,这就是深度图的获取,把深度图经过处理得到三维空间信息数据,二维图像到三维空间实现转换。深度的获取在双目立体成像视觉系统中分为两步,首先在双目立体图像与图像之间建立点对点的对象关系,双目立体视觉算法研究的重点问题是解决对应点之间的匹配问题。其次以对应点之间的视差为依据对深度值进行计算。双目成像是获取同一场景中两幅不同的图像,两个单目成像模型构成一个双目成像模型。双目成像示意图如图2所示。系统的基线B是两个镜头中心的连接线,空间点w(z,y,z)作为世界坐标的值由(x1,y1)与(x2,y2)进行确定,如果摄像机的坐标位置和空间点w世界坐标的位置重合,图像平面和世界坐标轴xY的平面就是平行的。如果两个摄像机在坐标系统中的原点不同但是它们的光轴平行,那么双目成像计算人们可以看图3所示,图3表示的是两个摄像头连线在平台xY的示意。
立体视觉的成像过程是成像的逆过程,具有一定的不确定性。大量的数据信息在从三维影像向二维图像进行投影的过程会出现丢失的现象,所以视觉系统要通过自然的约束条件才能保证获取正确的解。这些约束条件在减少匹配的计算量方面可以提供有利的帮助。针对基于区域匹配快速算法,还可以应用基于视差梯度的匹配算法,这种匹配算法应用较大的搜索范围在边缘的特征点上进行搜索,采用视差梯度在非边缘区减少搜索范围。应用计算机视觉立体匹配算法可以减少成像匹配时间,大大提高了工作效率。计算机立体匹配算法征点的提取是算法的关键问题,今后的研究方向重点是对有效特征点提取方法的研究。
关键词:数字摄影测量 计算机视觉 多目立体视觉 影像匹配
引言
摄影测量学是一门古老的学科,若从1839年摄影术的发明算起,摄影测量学已有170多年的历史,而被普遍认为摄影测量学真正起点的是1851―1859年“交会摄影测量”的提出。在这漫长的发展过程中,摄影测量学经历了模拟法、解析法和数字化三个阶段。模拟摄影测量和解析摄影测量分别是以立体摄影测量的发明和计算机的发明为标志,因此很大程度上,计算机的发展决定了摄影测量学的发展。在解析摄影测量中,计算机用于大规模的空中三角测量、区域网平差、数字测图,还用于计算共线方程,在解析测图仪中起着控制相片盘的实时运动,交会空间点位的作用。而出现在数字摄影测量阶段的数字摄影测量工作站(digital photogrammetry workstation,DPW)就是一台计算机+各种功能的摄影测量软件。如果说从模拟摄影测量到解析摄影测量的发展是一次技术的进步,那么从解析摄影测量到数字摄影测量的发展则是一场技术的革命。数字摄影测量与模拟、解析摄影测量的最大区别在于:它处理的是数字影像而不再是模拟相片,更为重要的是它开始并将不断深入地利用计算机替代作业员的眼睛。[1-2]毫无疑问,摄影测量进入数字摄影测量时代已经与计算机视觉紧密联系在一起了[2]。
计算机视觉是一个相对年轻而又发展迅速的领域。其目标是使计算机具有通过二维图像认知三维环境信息的能力,这种能力将不仅使机器能感知三维环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、存储、识别与理解[3]。数字摄影测量具有类似的目标,也面临着相同的基本问题。数字摄影测量学涉及多个学科,如图像处理、模式识别以及计算机图形学等。由于它与计算机视觉的联系十分紧密,有些专家将其看做是计算机视觉的分支。
数字摄影测量的发展已经借鉴了许多计算机视觉的研究成果[4]。数字摄影测量发展导致了实时摄影测量的出现,所谓实时摄影测量是指利用多台CCD数字摄影机对目标进行影像获取,并直接输入计算机系统中,在实时软件的帮助下,立刻获得和提取需要的信息,并用来控制对目标的操作[1]。在立体观测的过程中,其主要利用计算机视觉方法实现计算机代替人眼。随着数码相机技术的发展和应用,数字近景摄影测量已经成为必然趋势。近景摄影测量是利用近距离摄影取得的影像信息,研究物体大小形状和时空位置的一门新技术,它是一种基于数字信息和数字影像技术的数据获取手段。量测型的计算机视觉与数字近景摄影测量的学科交叉将会在计算机视觉中形成一个新的分支――摄影测量的计算机视觉,但是它不应仅仅局限于地学信息[2]。
1. 计算机视觉与数字摄影测量的差异
1.1 目的不同导致二者的坐标系和基本公式不同
摄影测量的基本任务是严格建立相片获取瞬间所存在的像点与对应物点之间的几何关系,最终实现利用摄影片上的影像信息测制各种比例尺地形图,建立地形数据库,为各种地理信息系统建立或更新提供基础数据。因此,它是在测绘领域内发展起来的一门学科。
而计算机视觉领域的突出特点是其多样性与不完善性。计算机视觉的主要任务是通过对采集的图片或视频进行处理以获得相应场景的三维信息,因此直到计算机的性能提高到足以处理大规模数据时它才得到正式的关注和发展,而这些发展往往起源于其他不同领域的需要。比如在一些不适合于人工作业的危险工作环境或人工视觉难以满足要求的场合,常用计算机来替代人工视觉。
由于摄影测量是测绘地形图的重要手段之一,为了测绘某一地区而摄影的所有影像,必须建立统一的坐标系。而计算机视觉是研究怎样用计算机模拟人的眼睛,因此它是以眼睛(摄影机中心)与光轴构成的坐标系为准。因此,摄影测量与计算机视觉目的不同,导致它们对物体与影像之间关系的描述也不同。
1.2 二者处理流程不同
2. 可用于数字摄影测量领域的计算机视觉理论――立体视觉
2.1 立体视觉
立体视觉是计算机视觉中的一个重要分支,一直是计算机视觉研究的重点和热点之一,在20多年的发展过程中,逐渐形成了自己的方法和理论。立体视觉的基本原理是从两个(或多个)视点观察同一景物,以获取在不同视角下的感知图像,通过三角测量原理计算像像素间的位置偏差(即视差)来获取景物的三维信息,这一过程与人类视觉的立体感知过程是类似的。一个完整的立体视觉系统通常可分为图像获取、摄像机定标、特征提取、影像匹配、深度确定及内插等6个大部分[5]。其中影像匹配是立体视觉中最重要也是最困难的问题,也是计算机视觉和数字摄影测量的核心问题。
2.2 影像匹配
立体视觉的最终目的是为了恢复景物可视表面的完整信息。当空间三维场景被投影为二维图像时,同一景物在不同视点下的图像会有很大不同,而且场景中的诸多因素,如光照条件,景物几何形状和物理特性、噪声干扰和畸变以及摄像机特性等,都被综合成单一的图像中的灰度值。因此,要准确地对包含了如此之多不利因素的图像进行无歧义的匹配,显然是十分困难的。
在摄影测量中最基本的过程之一就是在两幅或者更多幅的重叠影像中识别并定位同名点,以产生立体影像。在模拟摄影测量和解析摄影测量中,同名点的识别是通过人工操作方式完成的;而在数字摄影测量中则利用计算机代替人工解决同名点识别的问题,即采用影像匹配的方法。
2.3 多目立体视觉
根据单张相片只能确定地面某个点的方向,不能确定地面点的三维空间位置,而有了立体像对则可构成与地面相似的立体模型,解求地面点的空间位置。双目立体视觉由不同位置的两台或者一台摄像机(CCD)经过移动或旋转拍摄同一幅场景,就像人有了两只眼睛,才能看三维立体景观一样,然后通过计算空间点在两幅图像中的视差,获得该点的三维坐标值。现在的数字摄影测量中的立体像对技术通常是在一条基线上进行的,但是由于采用计算机匹配替代人眼测定影像同名像对时存在大量的误匹配,使自动匹配的结果很不可靠。其存在的问题主要是,对存在特殊结构的景物,如平坦、缺乏纹理细节、周期性的重复特征等易产生假匹配;在摄像机基线距离增大时,遮挡严重,能重建的空间点减少。为了解决这些问题,降低双目匹配的难度,自1986年以来出现了三目立体视觉系统,即采用3个摄像机同时摄取空间景物,通过利用第三目图像提供的信息来消除匹配的歧义性[5]。采用“多目立体视觉技术”可以利用摄影测量的空中三角测量原理,对多度重叠点进行“多方向的前方交会”,既能较有效地解决随机的误匹配问题,同时又能增加交会角,提高高程测量的精度[2]。这项技术的应用,将很大程度地解决自动匹配结果的不可靠性,提高数字摄影测量系统的准确性。
关键词: 食品物流; 运作模式; 计算机视觉; 实时监控
中图分类号:TP393 文献标志码:A 文章编号:1006-8228(2013)08-87-02
0 引言
为了加强食品安全的有效追踪和监控,山东省自2011年5月以来,建成了黄河三角洲高效生态冷链产业物联网管理运营中心,开通了“冷链产业物联网管理平台”。黄三角冷链产业物联网管理平台依托食品产销对接系统和食品品质安全管理系统,实现了食品全程监控和追溯。然而,目前这一管理平台只能实现食品运输流程的监控和出现安全问题之后的追溯,而不能实现食品质量的实时监管。对消费者健康的保障和对社会稳定、经济发展的需求日益增长,通过一个可视化的食品物流信息化监控体系运作模式来进行食品安全监控的重要性日益突出[1]。
1 监控体系运作模式
监控体系运作模式利用计算机视觉技术,通过图像分析,提取食品数字图像中的特征信息,实现食品品质安全信息的快速、客观、准确检测,能为食品生产、加工、物流和销售过程的自动化跟踪和监管提供信息支持,让食品行业彻底实施食品的源头追踪以及在食品供应链中提供完全透明度的能力[2]。
1.1 食品图像的分析
计算机图像处理步骤包括图像预处理、目标边缘、检测与图像分割、特征提取以及模式识别,为后续图像特征提取提供分析对象。食品图像质量检测流程如图1所示。
[进行食品边缘检测][图像处理和模式识别软件][获取食品颜色][食品图像][食品分析系统]
图1 食品质量检测流程
为了在食品物流中实时监控食品的品质,我们利用计算机视觉技术实现直观可视化的监控。通过计算机视觉技术可以对食品进行像素级的图像获取,并能根据食品的形状变化和表面颜色的识别实现对食品外观的初步检测。同时在物流运输过程中能够实时对检测不合格的食品进行筛选和处理,避免了消费者购买到腐烂变质和表面缺陷的食品。实现实时物流跟踪,建立信息追溯和信息共享机制,成为当前食品物流配送的关键。物流可视化运作模式可以大大加快数据的处理速度,使时刻都在产生的海量数据得到有效利用;可以在人与数据、人与人之间实现图像通信,从而使人们能够观察数据中隐含的现象,为发现和理解食品流动过程中出现的问题和及时解决问题提供了有力工具。
1.2 建立智能移动货仓
在本物流可视化运作模式中,设计了在移动货仓上安装摄像头并连接到信息管理平台,通过摄像头对货仓打开次数及货物的提取、装载情况等进行记录。当在运输过程中需要对食品进行提取、调换等其他操作时,只有工作人员向物流信息平台发送请求指令,主管人员确认身份后,指令下达到货仓,方可进行工作。这样可以有效避免在运输过程中遗漏、丢失或者更换货物,管理流程如图2所示。
为了在食品生产、加工、运输、销售过程中及时了解食品物流的情况,给食品原料中夹带了RFID标签;在RFID标签中对食品的仓储过程、入库、出库情况进行标示,物流信息管理平台可以根据计算机视觉处理系统得出的数据与RFID信息进行比对,避免了货物在物流过程中出现异常情况[3]。
2 可视化食品物流功能结构
在食品物流监控体系中,通过摄像头CCD获取食品图像,传送到计算机视觉系统。系统对图像进行处理和分析,然后将分析结果提交到物流信息管理平台。食品质量管理员可以根据信息系统给出的信息通知到货仓告知物流现有情况;同时,在顾客购买食品时可以通过RFID技术,采用系统提供的终端接口,对货物的生产、加工、运输、分发、销售等情况进行追溯查询。系统结构图如图3所示。
可视化食品物流运作系统基于B/S体系架构,并且利用软件自动采集图像信息,并将货物信息、条码信息、尺寸信息和重量信息合成到图片中,同时这些信息也记录在服务器的关系数据库中。通过服务器端的Web服务,可以实现用户在局域网/广域网内,查询相应的信息内容[4]。
3 结束语
利用计算机视觉技术可以获得食品品质的空间位置信息,能够减少传统人工检测带来的高强度劳动,减少检测主观性和人工成本,释放人力资源。通过获取食品的数字图像,可以传输给远距离的分析者或者分析系统,从而实现食品品质信息的区域分析和共享。利用计算机视觉技术无缝地实现对货物的全程可视化追溯,是今后食品物流方面研究的重点,为实现食品便捷的反向查询,进一步保证食品的安全奠定了基础。
参考文献:
[1] 全英华.我国现代食品物流发展现状和对策[J].物流科技, 2011.5:67-68
[2] 陈非.物流可视化信息平台探究[J].科技创新导报,2011.31:198-120
关键词 计算机图形学 第三方演示 课程群 分组实践
Abstract At present, computer graphics has become an important part of undergraduate computer education, and it is also plays an important role to cultivate innovative talents to adapt to the information age. Based on the teaching of computer graphics course by the author as an example, analyzes the existing problems in the teaching of computer graphics, and put forward improvement ideas from three aspects: according to the different needs of students utilizing the third party demonstration teaching and cross curriculum interpretation, introducing course group to replace single course, employing group practice examination instead of individual, and other forms to improve the quality of teaching.
Keywords computer graphics; third party demonstration; course group; group practic
计算机图形学是一门介绍显示、生成和处理计算机图形的原理和方法的课程。它在计算机总体教学体系中属内容综合性较强且发展迅速的方向之一。该课程既有具体的图形软硬件实现,又有抽象的理论和算法,旨在为学生从事相关工作打下坚实基础。学生须以高等数学和线性代数的基本理论和较熟练的程序设计能力作为本课程学习的基础。课程的难点在于计算机图形学研究范围广,与其他学科交叉性强,且知识不断更新变化。在教学实施过程中,难点是理解和掌握相应的基础理论和算法,以及利用计算机图形学相关工具进行图形学实际问题的解决。
本课程对学生的培养学生围绕以下三个方面展开: (1)建立对计算机图形学的基本认识,理解图形的表示与数据结构、曲线曲面的基本概念。(2)理解并掌握基本图形的生成算法,并能对现有的算法进行改进,理解图形的变换和裁减算法。 (3)面向算机图形的程序设计能力,以底层图形生成算法为核心构建应用程序。相应的考查方式由理论授课、上机实习和课外作业三个单元构成。从近年的授课实践和考试情况分析,该教学内容难度设置合理,深入浅出且相互承接成为体系,学生总体反馈良好。但也存在一些矛盾和问题。以下将对几个问题进行重点阐述与思考,并提出课程改革思路。
1 计算机图形学与计算机辅助设计衔接问题
笔者所在院校是具有航空航天背景的工科院校,“CAD计算机辅助设计”是飞行器设计、机械设计与制造等多学科的重要课程。相关学科学生期望通过对计算机图形学知识的深入理解,促进CAD设计工具诸如Catia、Solidwork和Rhino等先进工具的运用能力。然而,目前的计算机图形学课程的教学和考察环节倚重低层算法讲解与基于OPENGL等的程序设计,除综述外并未具体引入CAD相关内容。产生的问题是,一方面,飞行器设计及机械设计与制造等专业的学生由于程序设计能力不足,难以驾驭较复杂的程序设计任务,在学习过程中心理压力较大;另一方面,由于授课均为教师为计算机相关专业背景,该课程的讲授并未衔接CAD相关技术,学生难以构建二者之间的联系。
解决方案:
本质上,该问题是由于选课学生的学习动机和基础不同造成的。以单一的教学和考查方式难以兼顾这类面向具体应用的学习需求。在教学方法上,采用第三方案例教学法和交叉讲解法相结合以解决此问题。具体的,将CAD等应用场合以具体案例形式讲解,授课教师邀请飞行器、机械设计相关教研组研究生以4~6学时的讲台演示的形式呈现CAD工具完整设计过程。授课教师则以交叉讲解方式为学生讲解运用到的计算机图形学知识点,同时与学生交互式的问答和探讨。在考查形式上,考虑到不同的学习动机和基础,采用多样化实践环节考查。计算机专业学生以OPENGL程序设计为考点,而外专业学生以CAD等面向应用的实践工具为考点,以兼顾各专业的学习需求。
2 计算机图形学与计算机视觉相结合的问题
当前,虚拟现实技术(VR)和人工智能技术(AI)两个最重要最热门的研究领域。虚拟现实的基础理论支撑是计算机图形学,例如三维场景的生成与显示。而人工智能的一个重要应用场景是计算机视觉,例如基于图像智能识别的自动驾驶技术和场景理解技术。很多学生对以计算机视觉为代表的人工智能技术怀有浓厚兴趣,同时,学生又难以区分计算机图形学和计算机视觉的关系。同时,二者在近年来的研究中呈现相互融合的趋势。如基于三维立体视觉的机器人与场景实时定位与重建。如何在计算机图形学课程中,很好地体现两门课程的不同,避免学生的混淆,拓展学生的知识面,都是具有现实意义的课题。
解决方案:
实际上,计算机图形学和计算机视觉可不失一般性的概括为互逆的关系:计算机图形学是由概念设计到模型生成,最终绘制图形图像的过程;而计算机视觉则是从原始图像中再加工并分析理解、以产生新图像(如二维到三维)或输出语义信息(如图像自动标注与理解、目标检测与识别)。将计算机图形学纳入“视觉处理课程群”框架,使学生首先掌握课程群中各课程的侧重点,着重理解图形学在课程群中的作用。精心选取2~3个计算机视觉和图形学交叉的当前主流研究方向,展开概念层面的演示讲解,不深究具体算法,着重阐述两种技术的相互依赖关系并对比二者的区别。相关领域的演示还包括增强现实、人机交互、计算机辅助诊断等等。鼓励学生自主学习,最终使学生在做中学、用中学,提高独立分析新问题和综合运用知识解决问题的能力。
3 如何平衡算法讲解和程序应用技能
计算机图形学涉及的算法多,核心算法是该课程的必讲内容,在算法细节的讲解过程中学生容易产生畏难厌学情绪,注意教学方法以调动学生的兴趣尤为重要。另一方面,对学生的考察方式最终是通过编程实践完成。学生在编程实践中常常遇到大量调试问题,同时要阅读大量文档以了解OPENGL接口函数的调用方法,这个过程占用了很大工作量。
解决方案:
在理论教学部分,着重讲清计算机图形学原理和概念、全面解析经典算法思想。课程强调对理论核心思想的阐述,用通俗易懂的语言,条例清晰的逻辑,进行简明透彻的阐述,附以直观、形象的动态演示系统,力图使学生在较短的时间内、有效地掌握基本理论。分析图形学各种经典算法的原理、可行性及几何复杂性,尽可能多地比较算法之间的思想差异,分别指出它们的优缺点和应用场合,并促进学生思考如何在保证算法的准确性、可靠性的前提下,提高算法的效率。同时注重接近国际前沿的研究内容,注重讲授经典知识和最新进展相结合,以激发学生的学习兴趣,提高课堂效率和活跃度,力争以较少的课时阐述计算机图形学的基本原理、基本方法,加大实践环节比重。通过往年学生完成的优秀课程作业作品的展示,激发学生的创造热情。改革实践环节的考查方式,以项目小组形式取代对个体的考查。原则上每组3~5人,自由组合。在课程结束前,采用小组现场演示讲解的方式,展示小组成员通过编程实践环节完成的一个项目。学生在项目小M中锻炼了团队协作能力,降低了个人工作强度,同时互相学习和督促的氛围使课程作业的质量得以大幅提高。以基础实验――目标性重建实验――自主性训练的层次化实践框架模式,逐步培养学生自主研究,独立解决问题、分析问题,确定解决方案的能力,树立正确的科学研究习惯,培养学生的科学研究能力。
总之,合理设计实践教学案例,进一步实现课程体系和实践内容的统一,建立一个多层次、立体化的实践教学体系,注重学生的参与性与实践性,引导和鼓励学生进行创新实践和课外研学。改革考核方式和考试形式,加大实践环节在成绩中的比重,强化实践能力培养,寓教于乐的同时引导学生追求卓越。此外,计算机图形学技术是发展非常快的一个研究及应用领域,且对编程要求较高,应注重实验室机房投入更新必要硬件,并保障软件编程环境的正常运行。
L鼙疚氖苤泄┦亢蠡YBA15035,江苏省教改项目JGLX13_008资助
参考文献
[1] 孙家广,胡事民.计算机图形学基础教程.北京:清华大学出版社,2005.2.
[2] 唐荣锡,汪嘉业,彭群生等.计算机图形学教程(修订版).北京:科学出版社,2000.
[3] LIU Hailan.On development and application of computer graphics[J].Computer Knowledge and Technology,2010(3):9551-9552.
[4] 娄凤伟.创造性思维与计算机基础教学[J].教育探索,2002.
关键词:机器视觉技术;大米;品质检测
中图分类号:TP391.4 文献标识码:A 文章编号:0439-8114(2012)05-0873-04
Application Progress of Machine Vision Technology in the Quality Inspection of Rice
WAN Peng,LONG Chang-jiang,REN Yi-lin
(College of Engineering, Huazhong Agricultural University, Wuhan 430070, China)
Abstract: The research dynamic of machine vision technology was reviewed from the aspects of rice varieties, germ, crack, yellow grain rice, and so on; and the shortcomings of the machine vision technology in rice quality inspection were proposed for its further application.
Key words: machine vision technology; rice; quality inspection
我国是世界上最大的稻米生产国,稻米年产量常年保持在1.8亿t左右,占世界稻米总产量的1/3,居世界第一位[1]。我国也是大米消费大国,有近2/3的人口以大米为主食,全国大米年消费总量保持在1.35亿t左右[2]。我国的水稻研究在世界上处于领先地位,但是在国内外贸易、加工和消费等领域中仍然存在诸多问题[3,4]。
我国曾经是世界三大稻米输出国之一,但是由于我国大米的品质不高,再加上大米的生产标准、质量技术标准、检验检疫技术等与发达国家存在较大差距,在相当程度上影响了我国大米在国际市场上的竞争优势,大米的年出口量已退居六七位。2008年以来,随着世界稻米产量的下降,各国对大米出口配额进行调整,导致国际大米的价格出现了疯涨,而我国出口的大米因品种不稳定、品质较差,在国际市场上竞争力较低,市场份额逐渐减小。
为了提高大米的品质,不但需要选育优质的稻米品种,还需要加强大米品质的检测。但是,由于我国对大米品质的检测研究起步较晚,同时也缺乏方便简单的检测方法和快捷准确的检测仪器,在对大米品质进行检测的过程中,主要依靠人工识别、感官评定等方法进行检测,这些方法主观性较强,准确度较低,可重复性较差,工作效率也较低,因此在实施过程中的有效性受到了质疑[5]。
机器视觉(Machine vision)又称计算机视觉,是指利用计算机实现人的视觉功能,是研究采用计算机模拟生物外显或宏观视觉功能的科学和技术,是一门涉及数学、光学、人工智能、神经生物学、心理物理学、计算机科学、图像处理、图像理解、模式识别等多个领域的交叉学科[6]。机器视觉技术在农业上的应用研究始于20世纪70年代末期,主要进行的是植物种类的鉴别、农产品品质检测和分级等。随着计算机软硬件技术、图像处理技术的迅速发展,它在农业上的应用研究有了较大的进展[7,8]。
目前,大部分的大米品质检测指标根据国家标准采用人工进行检测,容易产生许多问题。随着机器视觉技术的发展和在农产品无损检测领域的广泛应用,采用机器视觉技术对大米的品质进行检测,不仅能够提高大米品质的检测效率,而且能够克服主观因素的影响,降低检测误差,使得大米品质的检测变得更加快速和准确[9]。
1 基于机器视觉技术的大米品质检测装置
基于机器视觉技术的大米品质检测系统由检测箱、检测台、光源、CCD图像传感器、镜头、图像采集卡和计算机系统等几个部分组成[10,11](图1)。
大米品质检测系统是一个内空的箱体,箱子的底部是检测台,顶部为光源和摄像头;检测箱内表面粘贴有背景纸,使光在箱体内形成均匀的漫反射,避免样品在检测时形成镜面反射。光源提供样品检测照相时所需的亮度,为了提供充足的光线,同时尽量消除光源照射样品时在背景上产生的阴影,通常选用环形荧光灯管作为光源[12]。CCD图像传感器是获取数字米粒样品图像的关键部件之一,它将大米图像由光信号转换为表示R、G、B颜色值的模拟电信号,并输入图像处理设备进行后续处理[13]。计算机软件系统用于对采集到的数字图像进行分析、处理和识别,实现对特定目标的检测、评价等[14]。
2 基于机器视觉技术的大米粒形检测
大米的粒形是实现大米分级和质量检测的最基本参数。根据《GB1345-1986大米》中的规定,评价大米质量的检测指标主要有加工精度、不完善粒、杂质、碎米等,这些检测指标与大米的粒形直接或间接相关。由于人工评价是通过肉眼观察对大米粒形进行评价,因此受检测环境、视觉生理、视觉心理等诸多因素以及评价人员对大米标准理解程度不同的影响,即便是同一份大米样品,很难保证大米粒形检测结果的稳定,而采用计算机视觉技术进行检测则可以有效避免主观因素的影响,保证大米粒形检测结果的准确性[9,15]。
中国农业大学孙明等[16]借助于MATLAB图像处理工具箱对大米粒形进行测定。首先定义单粒大米子粒的粒长(A)与粒宽(B)的比值为粒形,检测时先求出大米粒的椭圆离心率R,通过公式:
■=sqrt■
将大米子粒的椭圆离心率转变为长宽比A/B,即求出大米子粒的粒形。试验结果表明,该方法具有操作简单、检测速度快、重复性好的优点。
武汉工业学院张聪等[17]提出了一种基于计算机图像分析识别大米破碎粒的方法,即先采用数码相机获取大米图片,再对大米图片进行分析处理。识别时先将大米图像的边缘曲线变换为极坐标形式,再结合大米粒形的一般形状,用椭圆模板定位米粒,获得一组与米粒平移、旋转和尺度无关的形状描述数据,再运用小波变换提取奇异点及特征参数。试验结果表明,该方法简单有效,用于米粒定位与识别时的可信度高。同时,刘光蓉等[18]也研究了通过扫描仪获取大米的图像,再采用计算机图像处理技术将彩色图像转化成灰度图像并进行进一步的处理,最后获得大米子粒的二值图像,然后利用八邻域分析法提取大米图像的轮廓。试验结果表明,这种方法的检测效果良好。
此外,袁佐云等[19]还提出了采用最小外接矩形计算大米粒形的方法。包晓敏等[20]分析了采用Roberts算子、Sobel算子、Prewitt算子、模板匹配法和快速模糊边缘检测法对大米粒形进行边缘检测,并通过对大米图像的分割试验验证了快速模糊边缘检测法最为有效。
3 基于机器视觉技术的大米加工精度检测
大米加工精度是指大米背沟和粒面留皮程度,即糙米皮层被碾去的程度。大米的加工精度是决定大米外观质量的主要因素,加工精度越高,米粒表面残留糠皮量就越少,胚乳表面光洁度、口感、外观品质也就越好。我国国家标准规定各类大米按加工精度分等级[9]。因此,大米加工精度的检测具有十分重要的意义。传统大米加工精度的测定有多种方法,国标中规定大米加工精度的判定采用试剂染色法[21],通过染色剂使米粒胚乳和胚乳表面残留糠皮呈现不同的颜色差异便于肉眼观测,该方法受到光照条件、视力、情绪等诸多因素以及各种染色参数的影响,操作繁琐、效率低、误差大,不能满足快速、客观检测的需要。
河南工业大学张浩等[22]研究了机器视觉技术结合数字图像处理技术检测大米加工精度的方法,首先获取大米的图像,利用米粒区域和背景区域的亮度差异将大米图像转化为灰度图像,再利用边缘检测函数求出分割阈值,将米粒从背景中分割出来,并计算米粒区域的面积;然后利用米粒区域中糠皮部分和胚乳部分R-B特征值差异,将大米图像分解为R、G、B分量图,以R-B矩阵代替大米图像,再将R-B矩阵转化为灰度图,用边缘检测函数求出分割阈值把糠皮部分分割出来,计算糠皮部分面积。最后测得大米留皮率为米粒糠皮部分面积与米粒区域面积之比。
江苏理工大学许俐等[23]将计算机图像处理技术与色度学理论相结合研究了大米加工精度的自动检测方法。检测时先将大米染色,然后采用机器视觉系统获取大米图像,再根据染色后大米的胚乳、皮层以及胚芽所呈现的不同颜色特征,采用不同的区分方法获取米粒不同部位的面积即像素的个数,然后根据胚乳面积与大米图像总面积的百分比计算大米的加工精度。
此外,无锡轻工大学田庆国[24]根据色度学原理,采用图像处理技术对染色后的大米进行检测,识别大米的加工精度,并建立了大米染色后的颜色值与加工精度之间的数据库。西华大学的刘建伟与日本岐阜大学的三轮精博[25]合作研究大米加工精度与碾白程度之间的关系时,采用改良后的大米精度鉴定NMG溶液,按照品红石碳酸溶液染色法(GB 5502-85)对大米进行染色获得米粒表皮呈绿色、糊粉层呈蓝色、胚乳呈蓝红色的大米样品,米粒干燥后采用测差计检测样品的颜色计算大米的加工精度。
4 基于机器视觉技术的大米垩白检测
垩白是指稻米粒胚乳中不透明的部分。垩白之所以不透明是因为稻米子粒中淀粉粒排列疏松,颗粒间充气引起光线折射所致。按其发生部位可将垩白区分为腹白、心白和背白等类型。通常用垩白粒率、垩白大小和垩白度等概念描述稻米的垩白状况。垩白是衡量稻米品质的重要性状之一,不仅直接影响稻米的外观品质和商品品质,而且还影响稻米的加工品质和蒸煮食味品质[9,26]。
黑龙江农业工程职业学院于润伟等[27]研究了采用机器视觉技术和图像处理技术检测稻米垩白的方法。先用机器视觉装置获取大米的原始图像,再采用图像处理方法对大米图像进行预处理,然后应用大津算法自动选取分割阈值对稻米图像进行两次分割,分别得到大米子粒的二值图像和垩白区域的二值图像,再根据区域内部像素点的联通性,将不同区域分别进行标记,计算出子粒数和垩白粒数,同时计算出二者对应的面积(像素点个数)。研究结果表明,该算法的自动检测结果与人工检测相关性大于90%。
中国农业大学侯彩云、日本东京大学Seiichi等[28]采用微切片三维图像处理系统对大米的品质特性进行探索性研究,结果表明借助于三维可视化技术分析大米的微切片,不仅可以观察大米垩白部分内部的组织结构以及在蒸煮过程中的变化,还可以利用灰度直方图定量计算出垩白米粒中各部分垩白的面积和体积。同时,侯彩云等[29]还利用自行研制开发的机器视觉图像处理系统对大米的垩白度及垩白粒率进行检测,试验结果表明所研制的装置具有客观、准确、快速和重现性好等特点,在大米的快速分等定级中具有良好的应用前景。
江苏大学黄星奕等[30]研究了采用遗传神经网络计算大米垩白度的方法。先采用机器视觉系统提取垩白米的图片,然后采用数字图像处理技术提取米粒的垩白区域与胚乳非垩白区域的交界区域内的像素,再采用遗传算法建立一个人工神经网络识别系统对这部分交界区域内的像素进行识别。试验结果表明,采用机器视觉系统的检测结果与人工检测结果的误差小于0.05。
此外,凌云等[31]提出了一种基于分形维数的垩白米检测算法。孙明等[32]采用了MATLAB软件开发平台构造了基于计算机视觉的大米垩白检测算法,完成了对大米垩白参数、垩白度以及垩白粒率的测定。吴建国等[33]从实际应用出发,采用计算机和扫描仪结合开发了机器视觉系统的垩白测定软件。而曾大力等[34]利用视频显微镜对大米粒进行扫描,结合计算机图形分析,直接计算大米的垩白大小和透明度,初步探讨了视频显微扫描技术在大米垩白分析中的应用。湖南农业大学萧浪涛等[35]开发了基于微软Windows 98平台的大米垩白度测定软件Chalkiness 1.0,该软件与计算机和图像扫描仪相结合能够组成一套高效的大米垩白度测定系统。
5 基于机器视觉技术的整精米率检测
整精米是指糙米碾磨成国家标准一级大米时米粒产生破碎,其中的完整米粒以及长度达到完整精米粒平均长度4/5以上(含4/5)的米粒。整精米率是指整精米占净稻谷试样质量的百分率,它是稻米加工品质优劣的指标,是稻米贸易中商家最关注的内容,与碾米厂的经济效益密切相关。正确识别整精米是检测整精米率的关键。目前整精米率主要采用人工方法进行检测,该方法难以满足对稻米品质快速、准确的检测要求[9,36]。
中国农业大学尚艳芬等[37]开发了一套基于机器视觉技术的整精米检测系统用于识别整精米和碎米。该方法通过提取并分析稻米的粒长、粒形等特征参数,提出了同一品种并在同一生长条件下生长的大米粒形具有相似性的前提假设,据此求得标准米,再通过偏差计算、粒长、粒形分析等对整精米和碎米进行识别。采用该方法开发的整精米识别系统对整精米和碎米识别的准确率与人工检测结果的相关系数可到达0.99。
于润伟等[38]首先通过图像识别系统采集大米的原始图像,再采取动态阈值分割等图像处理方法把米粒图像变成二值图像,然后根据区域内部像素的连通性计算出单个米粒的像素个数;再根据先期计算的整精米长度/面积比换算出米粒长度,最后根据米粒长度判断整精米和碎米。研究结果表明,该算法的自动检测与人工检测的相关性大于99%,可用于整精米的自动检测。
6 问题和展望
机器视觉技术在农产品的品质检测方面具有广泛的应用,国内外的学者在此领域进行过广泛研究。但机器视觉技术在大米品质检测领域的应用尚处于起步阶段,仍有许多等待解决的技术问题,需要进一步深入研究。
1)目前的大米品质检测装置多为静态检测装置,即将大米放于检测箱中通过机器视觉系统获取图片或通过扫描仪获取图片,大米相对于摄像头静止不动;获取图像之后再采用计算机软件系统对图像进行分析处理。这种检测方法效率低下,因此,动态地获取大米图像并进行分析检测是下一个要解决的难题。
2)采用机器视觉系统检测大米品质时,多采用的是串行化算法,即先获取大米图像,然后采用某种算法对大米图像进行处理,再检测大米的某项品质指标;之后再采用某种算法对大米图像处理大米的另一项品质指标,这种检测方法在处理群体米粒图像时极大地影响了检测速度,因此开发并行处理算法对大米图像进行分析检测可以有效提高机器视觉系统的工作效率。
3)目前对大米品质指标进行检测分析时缺少统一的检测装置,有的研究者采用CCD摄像头获取大米的图像进行分析检测,而有的研究者采用扫描仪获取图像进行分析检测,检测装置不同、检测条件不一致难以达到相同的检测结果,因此有必要研制具有实用价值的大米品质检测装置,使基于机器视觉技术的大米品质检测能够具有统一的标准。
总之,伴随着计算机科学技术的迅速发展,机器视觉技术在大米品质检测中的应用将越来越广泛。
参考文献:
[1] 庞乾林.稻米知识纵览[J].中国稻米,2004(3):44-47.
[2] 刘月好.陈米产生的原因与处理方法[J].粮食加工,2004(1):30-31.
[3] 庄丽娟,刁慕容.中国谷物外贸格局与发展趋向分析[J].中国农垦经济,2004(8):25-26.
[4] 山世英,彭玉珊.我国农产品出口遭遇技术性贸易壁垒的原因及对策[J].山东农业大学学报,2004,6(2):41-43.
[5] 李里特.粮油产品规格化、标准化是农业现代化的迫切任务[J].中国粮油学报,2001,16(5):1-5.
[6] 刘传才.图像处理与计算机视觉[M].厦门:厦门大学出版社,2002.
[7] 赵晓霞.计算机视觉技术在农业中的应用[J].科技情报开发与经济,2004,14(4):124-126.
[8] 熊利荣,陈 红,丁幼春.机器视觉技术在农产品破损检测上的应用[J].农机化研究,2005(5):204-205.
[9] 李天真,周柏清.基于计算机视觉技术的稻米检测研究[J].粮食与食品工业,2005,12(4):50-53,55.
[10] 凌 云,王一鸣,孙 明,等.基于机器视觉的大米外观品质检测装置[J].农业机械学报,2005,36(9):89-92.
[11] 张巧杰,王一鸣,凌 云,等.稻谷品质检测技术与装置研制[J].现代科学仪器,2006(1):128-130.
[12] 赵志强,熊元姣.计算机视觉检测系统的设计方案[J].工业控制计算机,2005,18(10):1-2.
[13] 唐向阳,张 勇,李江有,等.机器视觉关键技术的现状及应用展望[J].昆明理工大学学报(理工版),2004,29(2):36-39.
[14] 张纪明.基于PC的机器视觉系统研究[J].可编程控制器与工厂自动化,2006(11):107-110.
[15] 任宪忠,马小愚.农产品粒形识别研究进展及其在工程中应用现状[J].农业工程学报,2004,20(3):276-280.
[16] 孙 明,石庆兰,孙 红,等.基于计算机视觉的大米外观品质检测[J].沈阳农业大学学报,2005,36(6):659-662.
[17] 张 聪,管庶安.基于图像分析的大米形状识别[J].粮食与饲料工业,2006(6):5-7.
[18] 刘光蓉,周 红,管庶安.基于图像处理技术的大米轮廓检测[J].粮食与饲料工业,2004(6):14-15.
[19] 袁佐云,牛兴和,刘传云.基于最小外接矩形的稻米粒型检测方法[J].粮食与饲料工业,2006(9):7-8.
[20] 包晓敏,汪亚明,黄振.计算机视觉技术在大米轮廓检测上的应用[J].浙江工程学院学报,2003,20(2):104-107.
[21] 吕季璋,陈效贵,范慕蕙,等.GB/T 18105-2000米类加工精度异色相差分染色检验法[S].北京:国家质量技术监督局,2000.
[22] 张 浩,孟永成,周展明,等.基于图像处理技术大米加工精度的检测研究[J].中国粮油学报,2006,21(4):135-137.
[23] 许 俐,钱敏娟,方如明,等.大米加工精度的图象识别方法[J].农业工程学报,1996,12(3):172-175.
[24] 田庆国.图像处理技术在大米碾白精度测定中的应用[J].粮食与饲料工业,1997(10):10-11.
[25] 刘建伟,徐润琪,三轮精博,等.大米加工精度与碾白程度检测的研究[J].中国粮油学报,2004,19(3):5-8,61.
[26] 周新桥,邹冬生.稻米垩白研究综述[J].作物研究,2001(3):52-58.
[27] 于润伟,朱晓慧.基于图像处理的稻米垩白自动检测研究[J].中国粮油学报,2007,22(1):122-125.
[28] 侯彩云,SEIICHI O,YASUHISA S,等.三维图像处理系统在稻米品质检测中的应用研究[J].农业工程学报,2001,17(3):92-95.
[29] 侯彩云,王一鸣,凌 云,等.垩白米粒的计算机图像识别[J].农业工程学报,2002,18(5):165-168.
[30] 黄星奕,吴守一,方如明,等.遗传神经网络在稻米垩白度检测中的应用研究[J].农业工程学报,2003,19(3):137-139.
[31] 凌 云,王一鸣,孙 明,等.基于分形维数的垩白米图像检测方法[J].农业机械学报,2005,36(7):92-95,91.
[32] 孙 明,凌 云,王一鸣.在MATLAB环境中基于计算机视觉技术的大米垩白检测[J].农业工程学报,2002,18(4):146-149.
[33] 吴建国,刘长东,杨国花,等.基于计算机视觉的稻米垩白指标快速测定方法研究[J].作物学报,2005,31(5):670-672.
[34] 曾大力,藤 胜,钱 前,等.视频显微扫描技术在稻米垩白研究中的应用[J].中国农业科学,2001,34(4):451-453.
[35] 萧浪涛,李东晖,蔺万煌,等.一种测定稻米垩白性状的客观方法[J].中国水稻科学,2001,15(3):206-208.
[36] 郭英群.对国家标准中整精米率定义及检测方法的探讨[J].粮油仓储科技通讯,2005(6):52-53.