首页 > 文章中心 > 计算机视觉常用技术

计算机视觉常用技术

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇计算机视觉常用技术范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

计算机视觉常用技术

计算机视觉常用技术范文第1篇

关键词:计算机;视觉技术;应用;分析

中图分类号:TP37 文献标识码:A 文章编号:1009-3044(2016)03-0242-02

计算机人工智能技术中的一项重要技术就是计算机视觉技术,这种技术主要是让计算机利用图像来实现认知环境信息的目的,这一目的的实现需要用到多种高尖端技术。近年来随着计算机技术以及计算机网络的普及与发展,计算机视觉技术也得到了较快发展,并且在实际生产与生活中的应用也越来越广泛。

1 计算机视觉技术概述

1.1 基本概念

计算机视觉技术主要研究计算机认知能力的一门技术,其具体主要是通过用摄像机代替人的眼睛,用电脑代替人的大脑,最终使计算机具备类似于人类的识别、判断以及记忆目标的功能,代替人类进行部分生产作业。人们目前研究的人工智能技术中的一项重要内容就是计算机视觉技术,通过研究计算机视觉技术可以让计算机拥有利用二维图像认知三维环境的功能。总的来说,计算机视觉技术是在图像与信号处理技术、概率分析统计、网络神经技术以及信息处理技术的基础上,利用计算机来分析、处理视觉信息的技术,它是现代社会新兴起的一门高新技术。

1.2 工作原理

在亮度满足要求的情况下,首先使用摄像机对具体事物的图像信息进行采集,利用网络把采集到的图像信息向计算机内部输送,然后在计算机系统内部处理加工图像信息会把事物的原始图像得到,随后利用图像处理技术进一步处理原始图像,获得优化质量效果之后的图像,分类与整理图像中有特征价值的信息,通过智能识别技术识别与描述提取到的图像信息特征,最后把得到的高层次的抽象信息存储起来,在进行识别事务时分析对比这些储存信息就可以实现事物的识别,这样视觉系统的基本任务也就完成了。其具体视觉系统如图1所示:

1.3理论框架

人类研究视觉技术虽然起步比较早,但取得较大进步是在20世纪80年代初伴随着视觉计算理论的出现。它的出现把研究视觉理论的策略问题解决了,视觉技术是一项特别复杂的信息处理过程,要想对视觉的本质准确完整的理解,必须从不同角度与层次研究与分析视觉本质。视觉计算理论研究层次大致可分为:计算机理论、算法以及实际执行。站在计算机理论的角度分析视觉技术,我们可知必须用要素图、维图、以及三维模型表像来描述视觉信息。

所以,可以把计算机视觉技术当做从三维环境图像中抽取、描述与解释信息的过程,其主要分析步骤可分为感觉、处理、描述、识别、解释等。若依据上述各过程实现需用到的方法与技术的复杂性划分层次,可大致把计算机视觉技术划分为:低层视觉处理、中层视觉处理、高层视觉处理三个层次。

2 计算机视觉技术在自动化中的应用

2.1 农业自动化中计算机视觉技术的应用

在农业自动化中应用计算机视觉技术可以全天候实时监测农作物的生长状况,便于科学管理农作物。还可以应用计算机视觉技术来检测农产品的质量,例如可以应用计算机监测技术来监测大多数蔬菜的质量,传统的人工检测蔬菜质量的方法,不仅费时费力,而且检测结果的准确性也不能很好的保证,在实际人工检测过程中还容易伤害蔬菜,可以通过利用计算机视觉技术来感应蔬菜自身释放的红外线、紫外线以及其他可见光的能量大小,然后和质量达标蔬菜的光线能量大小进行对比,根据这些对比结果可以把蔬菜质量的好坏准确判断出来,在蔬菜质量检测过程中应用计算机视觉技术,把传统的蔬菜检测方法完全颠覆了,极大的方便了农产品的质量检测,由此可见,计算机视觉技术在农业生产中有很高的使用与推广价值。

2.2 在工业自动化中计算机视觉技术的应用

计算机视觉技术在工业自动化应用的一个重要领域就是可以精密测量零件尺寸,其测量与被测对象的原理如图2所示。

光学系统、计算机处理系统以及CCD摄像头,是计算机检测系统的主要组成,被测物体由光源发出的平行光束进行照射,利用显微光学镜把待检测部位的轮廓图像呈现在摄像机的面阵CCD上,然后再通过计算机处理这些图像,进而把被测部位的轮廓位置信息获取下来,若被测对象是出现位移时,可通过两次重复测量,利用两次测量的位置差就可以得出,被测物体的位移量。

此外计算机视觉技术还可以应用于逆向工程中,应用3D数字化测量仪可以快速准确的测出现有工件轮廓的坐标值,同时还能构建曲面,保存成CAD或CAM图像,把这些图像送入CNC制作中心加工,便可制作出产品,这也就是所谓的逆向工程。由上述分析我们可知逆向工程要想实现,最关键的一环就是如何通过精密测量系统来测量样品的三围尺寸,获得各部位数据,进而做曲面处理进而加工生产。对于这一难题我可以通过利用线结构光测量物体表面轮廓技术来实现,器具体轮廓结构示意图如下图3所示。

这种测量方法的工作原理为:利用激光穿越平行、等距的振幅光栅组件,或直接采用干涉仪发出的干涉条纹,形成平面条纹结构光,再向物体表面投射,由于物体各表面的深度与曲率的不同,条纹会自动出现变化,然后再通过使用CCD摄像机对变形条纹进行拍摄。这样就可以把物体表面轮廓的变化情况分析出来。摄像机在拍摄图像的过程中,把图像信号转化为模拟信号,再转化为数字信号,然后经过传送再还原信号到图形处理系统,就得到三维轮廓图像。

在工业自动化中计算机视觉技术的深入广泛应用,不但使工业产品的生产质量得到了保障,而且跨越式的提高了工业产品的生产速度。如计算机视觉技术可以很好的检测产品包装质量,封口质量以及印刷质量等等,如我国重点指定的印刷造币机器的南京造币厂,由于货币制造印刷是由印刷造币机器来实现的,所以要严格要求其生产工艺,一丝一毫的生产差错都不允许存在,为了保障印刷制造出来的造币机器质量完全达标,必须严格精确检测生产出来的成品。在印刷造币机器的过程中要求要有非常高的计算机视觉技术,随着计算机视觉技术的不断进步,计算机视觉技术已经对印刷造币机器的需求完全满足了,实际的应用效果也非常理想,印刷造币机器在实际生产的过程中,南京造币厂把计算机视觉技术应用在了每个应刷造币机器最后的生产工序上,硬币受到重力下落的瞬间,计算机视觉技术可以瞬间采集图像的信息,准确拍摄硬币在下落过程中的图像,通过高速光纤传感器可以把硬币图像向计算机系统快速传输,利用计算机系统处理信息与识别信息的超强能力,可以及时识别硬币质量,经大量实践研究得出,在印刷造币机器上应用计算机视觉技术已经几乎没有检查差错现象的发生,由此可知,在工业自动化中计算机视觉技术的应用不但可行,而且发展空间还很大。

2.3 在医学自动化中计算机视觉技术的应用

在医学领域计算机视觉技术也得到了广泛应用,如医学中经常用到的CT图像以及X射线图都用到了计算机视觉技术,这些技术的广泛应用很大程度上方便了医生准确判断病人病情,另外,在生产药品的过程中,应用计算机视觉技术可以高效检测药品包装的合格与否,其基本流程是:传送装置先准确运输药品到指定位置,传送装置自身又可分为检测与分离两个区域,在传送药品的过程中药品的图像信息会被特定的摄像机采集,采集完成后向计算机系统传递采集信息,然后计算机系统会分析与处理这些信息,把没有包装好的药品自动识别出来,并且向分离区传递识别信息,分离区的自动装置会依据传输的分离信息,隔离开没有包装好的药品,这样就可以有效分类包装好的药品与没有包装好的药品,在药品包装检测方面应用计算机视觉技术代替传统人工检测,不但可以实现药品准确无误的检测,而且还可以大大提高检测药品包装质量的效率,完善了药品生产的自动化,由此可见,在医学自动化中应用计算机视觉技术可以积极促进医学自动化的发展。

3 结束语

总之,计算机视觉技术是一门研究计算机识别能力的高新技术,它涵盖了很多其他技术,具有一定复杂性。要想使其在自动化生产中得到更好地推广与应用,我们必须在明白其基本概念、工作原理以及理论框架的基础上,结合实际生产情况,不断进行深入研究,只有这样才能使计算机视觉技术得到更好地推广与应用,才能使这项现代化的高新技术更好的服务于社会,服务于人类。

参考文献:

[1] 龚超,罗毅,涂光瑜.计算机视觉技术及其在电力系统自动化中的应用[J].电力系统自动化,2003(1).

[2] 李永奎,刘冬.计算机视觉技术在农业生产中的应用[J].农业科技与装备,2011(6).

计算机视觉常用技术范文第2篇

小时候,我们都有过这样的梦想:生活实景都变成游戏,随时随地看到的场景、人物、好看的好吃的好玩的都能动起来,穿越时空,虚拟和现实世界梦幻叠加。“衣+”将AR技术和人工智能技术深度结合,使用复杂的计算机视觉技术和深度学习算法,去理解场景,然后增强场景,帮你达成这个愿望。仿佛拥有一双慧眼+超强大脑,而且这只是“衣+”暂时制定的一个小目标而已。

AR技术是通过计算机系统提供的信息叠加用户对现实世界感知的技术,将虚拟的信息应用到真实世界,并将计算机生成的虚拟物体、场景或系统提示信息叠加到真实场景中,从而实现对现实的增强。更通俗一点的说法是,它是一种全新的人机交互技术,利用摄像头、传感器、实时计算和匹配技术,将真实的环境和虚拟的物体实时地叠加到同一个画面或空间。用户可以通过虚拟现实系统感受到在客观物理世界中所经历的“身临其境”的逼真性,还能突破空间、时间,以及其他客观限制,感受到在真实世界中无法亲身经历的体验。

“衣+”是世界领先的人工智能计算机视觉引擎,致力于让计算机看懂世界,属于人工智能中的感知和认知智能,在图像视频中对场景、通用物体、商品、人脸的检测、识别、理解、搜索及推荐均达到领先水平。陌上花自主研发的深层次多属性深度学习网络,是人工智能在云和端上计算的核心基础。在国际顶级计算机视觉竞赛ImageNet2015和ImageNet2016中,先后获得五项和三项世界第一。

“衣+”技术团队正在做这样一个尝试,利用AR技术结合人工智能大数据技术感知认知世界,并增强了交互方式,这将大大改变人们的生活,将深度学习的人工智能科技和AR技术相结合应用到视频、直播、时尚、购物、美食、出行、运动、旅行等生活体验的各个方面,提供全生活场景智能服务,打造前所未有的智能视觉体验。

增强现实技术,不仅展现了真实世界的信息,而且将虚拟的信息同时显示出来,两种信息相互补充、叠加。在视觉化的增强现实中,用户利用AR设备,把真实世界与电脑图形合成在一起。“衣+”AR技术结合人工智能,以计算机视觉技术为基础实现感知认知,能将人眼看到的所有信息,包括商品、物体、食物、服饰、汽车、建筑等,都精准匹配出同款及相关商品。它的展现方式更加生动、立体、多样化,能够带给用户高品质、高时效、一站式的服务体验。

“衣+”AR技术和人工智能的结合实现了对现实世界的感知和认知的能力,可以在图像视频中完成对场景、通用物体、商品、人脸的检测、识别、理解、搜索等。如今,每个月有上亿次的商品推荐通过“衣+”边看边买引擎来完成,帮助用户搜索、识别他们所看到的物品。目前“衣+”支持服饰、3C数码、商超、家居、日用品、交通工具等超过几百类商品的检测和识别。

通过对海量数据进行深度学习,“衣+”视觉引擎能够检测识别视频或图像中的商品,并通过分析商品特征,准确判断商品类目等商品信息。在餐饮方面,当用户用不同的手持终端对餐厅的食品进行拍摄后,餐厅的位置以及菜品的食材等将即刻呈现在手持终端上,使就餐体验的科技含量越来越高。

此外,“衣+”利用技术手段可以实现对视频和图像中的物体的位置、名称、运动轨迹、轮廓等属性的实时分析。目前已支持超过10000类常用物体、大于400类室内外场景的识别。

计算机视觉常用技术范文第3篇

关键词:计算机智能视频监控;运动目标检测方法;目标跟踪方法

中图分类号:TP311 文献标识码:A 文章编号:1674-7712 (2012) 10-0104-01

随着人工智能技术日新月异的发展,基于人工智能的计算机视觉技术也得到了广泛的推广和应用,成为计算机智能领域一个重要的发展方向。到目前为止,计算机视觉技术已经过20余年的发展,其在社会人文,军事技术及工业生产领域得到了广泛的应用,并以其独具特色的技术优势逐渐形成了一门具有一定先进理论支撑的独立学科。其中,著名学者Marr提出的视觉计算理论已成为计算机智能视频监控领域的主导思想,为大多数该领域内的研究人员所接受。从广义上讲,计算机视觉技术的实质就是实现对在复杂环境中运动物体的几何尺寸、形状及相关运动状态的识别和认知,即把实际空间中的三维对象转换为计算机视觉系统识别的二维图像。近年来,计算机视觉技术以其迅猛的发展态势及成熟的应用技术成为了业界的新宠,并得到了广泛的应用,取得了瞩目的成绩。

一、运动目标检测方法分析

(一)运动目标在静止背景条件下的检测分析

1.差分检测法

将同一背景不同时刻两幅图像进行比较,可以反映出一个运动物体在此背景下运动的结果,比较简单的一种方法是将两图像做“差分”或“相减”运算,从相减后的图像中,很容易发现运动物体的信息。在相减后的图像中,灰度不发生变化的部分被减掉,则前区为正,后区为负,其他部分为零。由于减出的部分可以大致确定运动目标在图像上的位置,使用相关法时就可以缩小搜索范围。

2.自适应运动检测方法

当两帧图像的背景图像起伏较大时,简单的差分法难以得到满意的解。此时可以考虑用自适应背景对消的方法,该方法可以在低信杂比的情况下压制背景杂波和噪声,检测出非稳态图像信息。在背景杂波较大时,常用的门限分割不能分出这种运动目标。在图像序列中,每一个像素点的灰度值都是这一点所对应传感器的输出信号值与噪声值的叠加,因此,如何克服噪声的影响确定一个最佳门限将目标与背景分离,就成为弱小目标检测的一个重要环节。

(二)目标在运动背景条件下的检测方法分析

块匹配法是目标在运动背景条件下的主要检测方法。基于块的运动分析在图像运动估计和其他图像处理和分析中得到了广泛的应用,比如说在数字视频压缩技术中,国际标准MPEG1-2采用了基于块的运动分析和补偿算法。块运动估计与光流计算不同,它无需计算每一个像素的运动,而只是计算由若干像素组成的像素块的运动,对于许多图像分析和估计应用来说,块运动分析是一种很好的近似。这里主要介绍块匹配方法。块匹配方法实质上是在图像序列中做一种相邻帧间的位置对应人物。它首先选取一个图像块,然后假设块内的所有像素做相同的运动,以此来跟踪相邻帧间的对应位置。各种块匹配算法的差异主要体现在:匹配准则、搜索策略及块尺寸选择方法上。

1.匹配准则

典型的匹配准则有:最大互相关准则、最小均方差准则、最小平均绝对值差准则、最大匹配像素数量准则等。

2.搜索策略

为了求得最佳位移估计,可以计算所有可能的位移矢量对应的匹配误差,然后选择最小匹配误差对应的矢量就是最佳位移估计值。因此,人们提出了各种快速搜索策略。这种策略的最大优点是可以找到全局最优值,但十分浪费时间。因此,人们提出了各种快速搜索策略。尽管快速搜索策略得到的可能是局部最优值,但由于其快速计算的实用性,在实际中得到了广泛的应用。下面讨论两种快速搜索方法:二维对数及三步搜索法。

二维对数搜索法开创了快速搜索算法的先例,分多个阶段搜索,逐渐缩小搜索范围,直到不能再小而结束。其基本思想是从当前像素点开始,以十字形分布的5个点构成每次搜索的点群,通过快速搜索跟踪最小误差MBD点。

三步搜索法与二位对数法类似,由于简单、健壮、性能良好等特点,为人们所重视。例如其最大搜索长度为7,搜索精度取一个像素,则步长为4、2、1,只需三步即可满足要求,因此而得名三步法。其基本思想是采用一种由粗到细的搜索模式,从原点开始,按一定步长取周围8个点构成每次搜索的点群,然后进行匹配计算,跟踪最小块误差MBD点。

三、运动目标跟踪方法

成像跟踪系统经过图像的预处理、图像的分割识别等一系列信息处理,最终实现对目标位置的实时精确测量。跟踪策略基本上可分为两大类:波门跟踪和相关跟踪。

(一)波门跟踪法分析

参考被跟踪目标外观的实际尺寸形态,事先确定好跟踪窗口就是我们通常所定义的“波门”的概念。与传统的图像处理方法不同,采用波门跟踪法进行图像的分析和处理,其原始状态的图像数据仅仅限于波门内的数据,这样系统一旦捕捉到目标,不仅可以避免传统技术对整幅图像处理过程的耗时缺点,而且这种跟踪技术应用和操作更为简单,跟踪及成像效果也能够得到切实的保障。

(二)相关跟踪法分析

当被跟踪的目标物体出现运动、姿态的调整或由于自然条件等因素造成了背景的杂波干扰时,目标图像的分割及提取工作由于目标矩心及形心的不确定将难于进行。这种情况下,就可以采用相关跟踪的方式进行处理。这种基于图像匹配为基础的相关跟踪技术是以图像相识性度量为基础,获取现场图像中实时的最接近目标图像值的一种跟踪方式。由于分析及处理过程中,不需对用于分割及提取的特征值进行处理,因而可以应用于对图像数据的原始资料的处理方面,这种方法不仅可以使图像的信息得以全部的保留,而且适合众多复杂的环境及场景,是一种操作简单,结果精确的测量方法。

四、结语

近年来,各行各业对视频监控的需求不断升温,但已有的视频监控产品不能满足日益增长的需要。因此,计算机视觉和应用研究学者适时提出新一代监控—视频智能监控。它是目前国内外计算机视觉研究领域热点问题之一。因而,在生产实践中,不断加强对其的分析和研究具有非常重要的现实意义。

参考文献:

计算机视觉常用技术范文第4篇

关键词: 木材表面缺陷; 计算机视觉; 检测系统; 木材加工

中图分类号: TN911?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)12?0148?04

Abstract: Since the manual detection for wood surface defect in the process of wood processing exists the problems of low efficiency and large quality difference, a real?time on?line automatic detection system of wood surface defect was designed by means of computer vision technology. The system can find out whether the wood surface has defect, detect the size and location of the wood surface defect accurately, and store the information to guide the wood processing equipment for wood processing. The system has the characteristic of accurate and fast detection speed. The conclusion from various experiments indicates that the system′s recognition accuracy rate can reach up to 92.33%, and the average detection time is 2 ms, which shows that the system is feasible.

Keywords: wood surface defect; computer vision; detection system; wood processing

0 引 言

木材表面缺陷是指降低木材商品价值和使用价值的各种特征的总称,这些缺陷不但会影响木材强度,还严重影响木材加工和木制装饰的质量及外观[1?3]。常用的木材表面缺陷检测的方法有:人工检测、超声波检测、X射线检测、激光扫描、计算机视觉技术检测[4]。

目前,计算机视觉技术已在许多领域得到了广泛的应用,在木材表面缺陷的检测中也取得了显著的成果[5?10]。文献[11]中,提出一种改进Sobel算子提取木材表面缺陷边缘的算法,并使用神经网络模式识别检测木材表面缺陷,该文献介绍的方法能够提高木材表面缺陷边缘的检测精度,识别的准确率较高,但需要大量具有代表性的木材图像作为训练样本,算法的复杂性也导致检测效率不高。文献[12]提出一种基于数学形态学分割木材表面缺陷的方法,并使用最小二乘支持向量机分类器检测木材表面缺陷,缺陷分割算法能够有效避免木材纹理对分割结果的影响,但在实际处理分割时,需要根据应用背景选择不同的参数值来得到分割的种子点,通用性有待提高。文献[13]介绍了一种基于HIS空间二维最大信息熵的分割方法,它对木材表面缺陷图像的分割结果较好,但是分割的处理时间较长,实时性不强。虽然对木材表面缺陷检测的研究有很多,然而,应用计算机视觉技术,实时在线检测并定位木材表面缺陷却未见报道。

木材加工过程中木材表面缺陷的检测大多仍依赖人工完成,检测的效率会随着检测人员的疲劳加重而有所下降,并且不同操作员的经验差异导致同一块木材的检测结果也会有所不同[13]。因此,研究一种能够代替人工进行木材表面缺陷检测的方法对木材加工行业非常重要。

本文利用计算机视觉技术,开发了一套木材表面缺陷在线实时检测系统,为木材加工行业提供了一个有效的方案。该系统可以检测出木材表面缺陷的大小以及位置信息,通过串口通信模块与下位机进行双向数据传递,进而指导木材加工设备对已检测木材进行作业。

1 系统设计方案

系统结构如图1所示,主要包括木材表面缺陷检测平台和木材表面缺陷软件检测系统。检测平台主要包括传送机构、结构光源、CCD工业相机、接近开关等。CCD工业相机为维视MV?VD120SC,分辨率为1 280× 960,焦距为8 mm,帧率为15 f/s,像素尺寸为4.65 μm ×4.65 μm,传感器光学尺寸为,信噪比大于54 dB,数据位数输出 8 b,输出方式为USB 2.0,供电要求为5 V(USB接口或外接电源供电),外形尺寸为56 mm×50.6 mm×50.6 mm。机架使用欧标型3030铝型材,由3030角码、M5不锈钢内六角圆柱头螺钉、M5配3030铝型材的T型螺母、M8尼龙脚垫、12W?T8?LED灯管、UCP208立式轴承座、宽450 mm PVC输送带和沪工DC 5 V接近开关等构成。

软件检测系统通过数据线与相机相连,实时获取传送带送来的木材图像,并快速地进行缺陷检测,最后将相关木材表面缺陷的信息传递给木材加工设备。木材经传送带进入相机拍摄区域时,安装在机架一侧的接近开关检测到木材的接近并将信号传给检测系统,检测系统控制下位机使得传送带电机失电,传送带停止。下位机的计时器开始计时,随之检测系统控制相机获取木材图像,并检测木材表面缺陷,并向下位机传递检测结果,下位机再控制木材加工设备对木材进行后续的加工。当计时器计时到达设定的时间后,下位机使传送带电机得电,传送带移动一个单位距离(确保与上一张检测图像无过多重复,并无检测区域丢失),然后电机失电,传送带停止,重复前面的步骤。当木材完全离开相机拍摄区域,接近开关将信号传给检测系统,检测系统进入待机状态。整个系统的工作流程如图2所示。

2 系统软件设计

本软件使用Microsoft Visual Studio 2013 作为开发平台,采用C++作为主要开发语言,操作界面使用MFC/C++开发。通过调用OpenCV和CameraDS相关函数来实现实验图像的获取,具有获取速度快,兼容大部分数字摄像机等优点。

2.1 系统安全设计

如图3所示,本软件根据用户不同的实际需求提供了自动检测和手动检测两种模式。手动模式下,用户才可以对检测系统的参数进行设置,设置好参数后,按下“获取图片”按钮,然后再按下“缺陷检测”按钮,信息提示窗口将显示木材表面缺陷的中心坐标、缺陷大小、缺陷检测所用的时间等。按下“继续”按钮,传送带带动木材运动一个单位距离,传送带停止运动,重复上述操作便可实现再一次的缺陷检测。自动模式下,系统会根据手动模式下设置的参数进行自动检测。

为了提高本系统的稳定性与安全性,在安全操作方面做了一些设置。自动模式和手动模式两种模式只能在一个检测循环结束后进行切换。例如,当要从手动模式切换到自动模式,自动模式的选择只能在缺陷检测完成后,“继续”按钮弹起后才起作用。而从自动模式切换到手动模式需要在缺陷检测完成后,即信息提示框中显示缺陷信息后方可实现。这样的设置可防止传送带传送时间出现差异,导致部分木材表面缺陷部位未能被检测到,也可防止缺陷检测中途遭到中断。

2.2 参数设定

为了得到准确的检测结果,用户首次使用本系统需要手动设置与检测有关的参数,点击“参数设定”按钮,弹出对话框如图4所示。

2.2.1 分割阈值设定

本软件使用二值化函数对木材表面缺陷图像进行阈值分割,阈值的设定将直接影响检测的结果。二值化函数的作用是将图像中灰度值大于设定阈值(图4中设为90)的像素点的灰度值修改为255(白色),小于或等于设定阈值的则被修改为0(黑色)。使得木材表面缺陷的部分变为黑色,木材正常的部分变为白色。

2.2.2 时间间隔设定

“时间间隔”测试前先打开相机,在木材表面位于拍摄区域的下边缘处作个小标记,准备好秒表,按下“测试”按钮的同时按下秒表计时,眼睛观察拍摄区域,当小标记到达拍摄区域的上边缘时停止计时,将秒表上显示的时间输入到相应的编辑框中。

2.2.3 最大舍弃面积设定

“最大舍弃面积”表示面积小于该值的区域将不被定为缺陷而舍弃,因为木材表面可能存在灰尘、污点、木屑等,它们的面积相对于缺陷的面积小的多,应该被舍弃。

2.2.4 像素标定设定

“像素标定”的含义为寻找图像中像素点的距离与实际物理距离的转换关系。例如:假设长度为1 mm的小线段,在图像中的像素距离为10,那么在图像中像素距离为100的线段,实际长度则为10 mm。根据这个转换关系,只需统计缺陷部分区域的像素面积和中心位置即可知道木材表面缺陷的实际大小与位置。按下“测量”按钮,在弹出对话框,按下“打_相机”,如图5所示。按照右侧的标定操作说明示意图,在待测的木材上面放一把尺子,将尺子与参考线对齐,读出参考线在尺子上的长度。点击“确定”退出当前对话框,然后把参考线的长度输入到编辑框中。最后点击“保存”退出“参数设定”对话框。

2.3 缺陷检测

“参数设定”完成后,按下“打开相机”按钮,左侧的框中将会动态显示图像,再按下“获取图片”按钮,框中显示按下按钮时获取的那帧图像。调节显示框下的滑动条可调节图片的对比度,再按下后面的“保存”按钮,可作为下次操作的参考数值。按下“缺陷检测”按钮,图中的木材表面缺陷将会被框出来,而且框中左上角显示的编号与右侧的提示框的序号对应,可方便查看检测是否准确。检测的结果如图6所示。缺陷大小的计算是通过统计缺陷轮廓的像素点的个数,再根据像素标定得到的转换关系来转换为实际面积的大小。而缺陷的中心默认为矩形框的中心。

2.4 检测结果的修改与保存

软件界面的右上角的两个按钮可查看检测结果的历史记录。本软件还能够对检测的结果进行修改和保存。点击“保存结果”按钮,软件会将右侧的信息提示框中的信息保存到Excel文档中,点击“修改结果”,将打开Excel文档,用户可根据历史记录来修改或删除软件误检测的结果。

3 系统测试

3.1 系统测试环境

PC主机为CPU Intel Xeon E3?1230 v5 340 GHz;内存为8 GB;操作系统为Window 10 专业版;主板为Gigabyte X150M?PLUS WS?CF;开发平台为Microsoft Visual Studio 2013;版本为12.0.21005.1;应用程序框架为MFC;本地编译工具为VC++;开发语言为C++。

3.2 系统整体测试

测试方法:使用相机拍摄木材图片,其中包含无缺陷、有污点、有缺陷、有划痕、有灰尘的各种不一样的木材图片。分别统计每个样本的准确率Ai和检测木材表面缺陷的准确率A如下:

式中:Si为每个样本检测结果的总数;Ei为每个样本中误检测和漏检测的数量总和;n为样本总数。

部分木材表面缺陷检测结果如图7所示。假设下面9张木材照片为测试的总样本,第1张照片有一个缺陷,且被正确检测出来,则S1=1,E1=0,A1=1,第2张照片有一个缺陷,且被检测出来,但有两个误检测结果,则S2=3,E2=2,A2=0.33,同理,A3=1,A4=1,A5=1,A6=0.5,A7=1,A8=1,A9=1。最后算出检测的准确率:A=(A1+A2+…+ A9×100%=87%。

使用前面讲述的测试方法对300张木材图片进行检测,统计出本软件检测木材表面缺陷的准确率为92.33%,平均检测时间为2 ms,能够基本满足木材加工企业的加工要求。

4 结 论

本文提出了一种基于OpenCV的木材表面缺陷检测系统,经实验有如下结论:本系统能够快速准确地检测定位木材表面的缺陷,检测的准确率达到92.33%,平均检测的时间为2 ms;系统软件操作界面简单易用,稳定可靠,具有一定的实用性;该系统能够灵活应用到多种木材加工生产线上,具有较好的通用性。它为木材加工流水线实时自动检测木材表面缺陷提供了一种可实现的方法。

注:本文通讯作者为邹湘军。

参考文献

[1] 王林,白雪冰.基于Gabor变换的木材表面缺陷图像分割方法[J].计算机工程与设计,2010(5):1066?1069.

[2] 金仁莲.关于木材缺陷及木材检验技术要点探讨[J].农民致富之友,2016(2):140.

[3] 戴天虹,吴以.基于OTSU算法与数学形态学的木材缺陷图像分割[J].森林工程,2014(2):52?55.

[4] 牟洪波.基于人工神经网络的木材缺陷检测研究[D].哈尔滨:东北林业大学,2006.

[5] TSAI D M, HUANG T Y. Automated surface inspection for statistical textures [J]. Image and vision computing, 2003, 21(4): 307?323.

[6] 王海涛,甄理,杨春霞,等.基于计算机视觉的铁轨表面缺陷检测系统[J].无损检测,2011(11):38?41.

[7] 赵红颖,于微波.计算机视觉技术在发动机缺陷检测系统中的应用[J].光学精密工程,2000,8(3):283?286.

[8] 胡亮,段发阶,丁克勤,等.带钢表面缺陷计算机视觉在线检测系统的设计[J].无损检测,2003(6):287?290.

[9] 熊建平.基于计算机视觉的墙地砖表面缺陷检测[J].电子测量技术,2015(5):53?55.

[10] FUNCK J W, ZHONG Y, BUTLER D A, et al. Image segmentation algorithms applied to wood defect detection [J]. Computers and electronics in agriculture, 2003, 41(1/3): 157?179.

[11] 尹建新.基于算机视觉木材表面缺陷检测方法研究[D].杭州:浙江工业大学,2007.

计算机视觉常用技术范文第5篇

关键词:多模态;检索;图像特征

0 引言

现阶段基于图像检索普遍采用方式是人工对上传到网络中的数字图像进行文字标注,根据每幅图像的视觉特征人为的设置他们的文字描述。在检索时,使用标注的文字作为关键字来检索我们想要的数字图像。这种依据图像标注的文字匹配检索的方法简称为“字找图”,它的缺点为:(1)由于需要大量的人工对每幅图像进行文字标注,数字图像的数量是海量的,标注工作是非常耗费人力和时间;(2)由于每个人对图像的认识不同,所以,在标注的过程中会按照自己对图像的认识来选择标注文字,这样会使不同的人对图像的标注不同,而在检索中会产生很大误差;(3)不同国家使用的标注文字不同,所以在匹配文字时也会产生很大的偏差;(4)有的图像里面含有大量的内容,不可能用几个关键字就能表达清楚。为解决标注图像检索的缺陷问题。学者着手开展对内容的图像检索技术的研究。基于多模态的图像检索的改善了此类瓶颈问题,主要从被检图像库根据海量图像特征进行检测和匹配,获取图像之间的相关性特征信息。

1 基于多模态的图像特征匹配方法

(1)直接从图像中寻找匹配线索,而不是通过人为的文字标注,正因为这个特点,突破了传统的关键字标注的耗费人力时间的缺点,而是直接对图像本身进行处理和分析,使检索更贴近图像本身。

(2)检索可以是人机交互的,当使用一种特征选取方式检索的结果不能满足人们的需求时,人们可以人工的改变特征选取方式使检索结果向于人们需求的方向接近。这样避免了计算机检索图像时的不灵活性,加入了人为的因素。因此,人和计算机结合检索能使效率和准确率更高。

(3)基于内容的图像检索是一种相似性检索,可以将检索结果进行相似性排序,我们可以采取逐步求精的算法,不断减小检索的范围,直到定位到准确目标,这与传统数据库精确匹配有很大的不同。

由于这些方法,基于多模态内容的图像检索渐渐成为人们研究的重点,此类技术可以应用在社会安全、遥感、医学、数字图书馆、建筑、计算机辅助设计、地理信息系统、商标版权管理、等诸多领域。

2 基于纹理识别的多模态的图像检索系统的框架和技术

基于纹理识别的多模态图像检索系统组成部分如图1所示。

(1)输入模块:分析和获取图像的纹理特征值,并将特征向量输入图像特征数据库。

(2)描述模块:利用查询抽象检索技术,实现将用户需求抽象提取相关图像特征语义,并完整描述成计算机能进行识别的特征向量。

(3)检索模块:与图像数据库的图像纹理特征值进行相关性匹配,根据机器学习和神经网络技术,对跨语义的特征向量进行学习和筛选,获取最符合查询要求的图像信息,并返回给用户。

3 基于图像纹理特征的检测方法

图像有三大底层特征,分别是颜色特征、纹理特征和形状特征。纹理特征是显著的视觉特征,其弱化了颜色和亮度的作用,但它吸收了表面结构的排列与组织次序,而且表现出了上下文的关系,反映出了同质再现的视觉特征。

纹理源于人们对物体表面触感的概念,这种固有的内在特征反映了物体表面的组织结构或者上下文内容的关系等诸多有用的信息,或者反映了图像像素间的灰度变化情况或者颜色变化情况。组成纹理的基本元素叫作纹元或者纹理基元,是一个触发视觉感知并且特性相对稳定的基本单元,这些单元在一定的区域内的不同位置会以不同的形态再现,主要是灰度或色彩模式呈现不同特点,其包含多个像素,在物体表面呈现三种:周期性、准周期性或随机性。

如今,神经网络、最近邻分类器、决策树和支持向量机等模式方法已经广泛的应用到了许多领域,譬如图像分类、视频处理、检索等。模式类就是由一些共同属性所决定的,模式分类就是根据对象的特征或属性进行分类。

按照学习方法的监督程度,也就是根据否存在先验知识并且是否使用到这些先验知识,模式分类方法可以分为监督分类和非监督分类。

监督分类对各对象分类的依据是通过训练样本,选择合适的特征参数,以此建立判别函数。监督分类必须要有分类区域的先验类别知识用以建立判别函数,从而获得训练分类器,它把图像分解为多个组成部分,求解各部分之间的空间关系。一般监督分类在训练阶段需要手工选择分类区域从而可以确定模型。

在没有先验知识情况下,非监督分类能够有效地分类,是因为其根据图像像元间的相似度和从分析数据上得到的统计特性,它不需要获取判别函数集而去进行场地训练。熟知并且常用的K-means和ISODATA法就是非监督分类方法,也是一种聚类分析方法。这种方法是将图像视作一些特征的集合,先对这些特征进行聚类分析,得到特征单词和特征码,再用统计方法对特征单词和特征码进行统计分析,最后根据统计特征进行有效分类。

前面一种分类是根据监督程度来划分,模式分类方法还可以分为经验型分类方法和理论型分类方法,此时是根据有无前人分类算法的思想。经验型方法中比较常用的有最近邻分类器、RBF网络和神经网络等。理论型模式分类算法比较常用的有贝叶斯分类器,支持向量机,这种分类算法数量较少,远没有经验型分类方法多。贝叶斯分类器通过计算样本概率的差异,将样本进行分类,但是分布函数的求取较为困难;支持向量机方法SVM基于统计学习理论,在实际应用中取得了一定的成效。