首页 > 文章中心 > 计算机视觉总结

计算机视觉总结

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇计算机视觉总结范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

计算机视觉总结

计算机视觉总结范文第1篇

【关键词】计算机 视觉 图像处理 技术

一、引言

随着计算机技术的不断发展,在20世纪60年底产生了计算机视觉学这一学科。计算机视觉是借助计算机以及各种设备,进行生物视觉模拟的一种技术。计算机视觉学的主要任务,是借助已掌握的图片、视频等资料,进行计算与处理,和人类及其他生物的视觉过程一样,

得到相应形式的三维数据信息。计算机视觉学的发展,在工业、农业的生产中,地质勘探、天文、医学观察等领域也有着重要的应用价值。因此,视觉学的研究和应用转化受到了越来越多的重视。

二、计算机视觉学的图像分割研究

(一)数据驱动的分割研究

在计算机视觉学应用过程中,经常进行的数据驱动分割有下面几项内容:第一种是边缘检测的分割、第二种是区域分割、第三种是边缘和区域相互结合的分割。第一种基于边缘检测的分割,这种分割的基本方法:首先对检测图像的边缘点进行检测,然后根据一定的法则进行轮廓的连接,获得分割的区域。基于边缘检测的分割其难点是边缘检测时如何处理好抗噪声性能、检测的精度之间的矛盾。所以,在研究的过程中,提出了多种多尺度边缘检测的方法,按照实际问题进行多尺度边缘信息设计等方案,以获得更为合适的抗噪性能和检测的精度。第二种基于区域的分割,它的基本思想是按照图像数据的特点,将整个图像的空间划分成为几个不同的区域进行图像处理。

(二)计算机视觉学模型驱动的分割

经常使用的模型驱动分割有下面三种,第一种模型是基于动态轮廓的模型、第二种模型是组合优化模型、第三种模型是目标几何与统计模型。第一种是基于动态轮廓的模型用在进行分割目标的动态轮廓,因为其能量函数使用的是积分运算,有着很好的抗噪性能,对于目标的局部模糊也不敏感,所以其适用性很广。但这种分割方法容易收敛到局部最优,因此要求初始轮廓应尽可能靠近真实轮廓。通过组合优化的方法进行分割问题的处理,是使用一目标函数综合表示分割的相关要求以及约束,把分割变为目标函数的优化求解。因为目标函数多数情况下作为多变量函数存在的,因此可以通过使用随机优化的方法来实现。

(三)计算机视觉学图像分割的半自动方法

通过对人工参与程度的分,我们可以得出图像分割,主要有三种类型即:人工图像分割、半自动图像分割、自动图像分割等。人工图像分割指的是操作者使用鼠标,将分割区域的轮廓进行勾画的方法,人工图像分割的缺点是费时费力,而且很容易就会受到一些主观因素的影响,并且人工图像分割的可重复性较差。自动图像分割不需要借助人机交互就能完成,但是也很难实现同一批图像处理的满意分割效果。半自动分割这种形式指的是将人机交互同自动分割结合在一起,半自动分割可以实现对不同图像与处理需求的适应,并且可以大大降低计算过程的复杂性。在计算机技术不断发展的背景下,计算速度和容量有了大幅度的提升,计算机图像处理及视觉应用取得了丰硕的成果。

三、计算机视觉技术的分析

(一)以模型为研究对象的处理方法

在以模型世界作为研究对象的视觉学研究过程中,以Roberts的开创性工作作为一种标志,在他的工作过程中,引进了三维物体与二维物体成像的关系,使用较为简单的边缘特征提取、组合线段等手段和方法。他对三维关系的分析只是按照简单的边缘线段的约束关系,缺乏对人类或其他动物视觉系统感知三维空间关系的充分考虑。但是早期的这些研究工作,对计算机视觉学的研究和发展发挥了良好的促进意义,但是对于较为复杂的景物就不能够奏效。

(二)以计算理论为主体的视觉模型

随着计算机视觉研究的不断深入,在二十世纪七十年代,计算机视觉技术的研究,开始向着更为理性的阶段发展,主要表现在:不同本征特性的恢复,恢复的内容有三维形状恢复、运动恢复、光源恢复等等。研究的出发点是光学、生理学以及射影几何的视角出发,对成像及其逆等问题进行研究。在这个过程中,一些学者提出了以表示作为核心、通过算法作为中间转换过程的视觉处理模型,例如:著名的计算机视觉学研究者Marr就提出了这些观点,在他的理论里面,对表示的重要意义进行强调,并且从不同层面上对信息处理问题进行了研究。

(三)计算机视觉的应用研究

在现实生活和生产的过程中,计算机视觉主要应用在照片资料、视频资料处理上,例如:航空照片的处理、卫星照片的编译、医学领域的辅诊断、移动机器人视觉导航等等。其中,工业机器人手眼系统的研发,成为计算机视觉应用最具代表性的成果之一。因为工业生产、施工等现场等因素具有一定的复杂性,这种环境下的光照、成像特点等等可以控制,这就使得计算机视觉的应用更为简单,对于系统的实际构成有着很好的作用。移动机器人与工业机器人不同之处就是移动机器人具有一定的行为能力,这就需要研究者解决机器人的行为规划问题。在移动机器人种类、智能化水平不断提升的背景下,对视觉能力的要求也越来越高,这也使得计算机视觉有了更为广阔的应用前景。

四、结语

综上所述,计算机视觉学作为人类科技发展和社会进步的一种学科体现,在前进和发展的过程中,通过研究者和应用者的不断总结和探究,取得了丰硕的成果。在未来视觉技术发展的道路上,仍然有大量的工作需要进行研究。

参考文献:

[1]韩祥波, 刘战丽. 计算机图像处理技术在农产品检测分级中的应用[J]. 安徽农业科学 , 2013,(34)

[2]赵萍, 李永奎, 林静, 白雪卫. 数字图像处理技术在农产品方面的应用[J]. 农机化研究 , 2012,(11)

计算机视觉总结范文第2篇

【关键词】Opencv;计算机视觉技术;系统;研究

随着计算机技术的快速发展,计算机设备逐渐被应用到社会生活的各个方面,尤其是在当前计算机视觉技术和图像处理技术快速发展的时期,各个科技领域中的计算机视觉技术已经逐渐成熟。计算机视觉技术主要是利用计算机智能化来替代人眼,即对于客观存在的三维立体化世界的理解和识别,整个实现过程均是以计算机技术作为基础。随着计算机视觉技术的不断发展,现今其已逐渐成为了一门神经生理学、计算机工程、信号学、物理学、应用数学等综合性学科。计算机视觉技术系统其在高性能计算机基础之上来实现对大量数据的获取,并且通过智能算法来对获取数据进行处理,从而完成对数据集成。

一、视频中运动物体检测原理

对于视频中的运动物体检测主要分为两中方法,其一为宏观检测法;其二为微观检测法。宏观检测法是对获得的整幅图像进行检测,而微观检测法则是对所需要的区域进行图像检测。视觉技术在检测运动物体的时候,首先对图像进行采集,并对采集的信息数据进行预处理,将图像进行分割,然后分别提取运动物体的影象,从而实现参数的更新。图像采集过程中采用背景差分法,实现对背景图像的提取,其通过一定算法采用人为手段获取没有背景的图像。另外在进行运动物体检测的时候还可以采用帧间差分法,其主要是实时获取帧图,然后实现一帧一帧图像比值的比较,从而获取具有差值的图像。运动物体进行检测的时候需连续获取帧图,将这些帧图组合起来,其实就是物体的运动轨迹,然后同分割技术就能勾勒出物体的轮廓。随着计算机视觉技术的不断深入研究,发现此两种方法单独使用仍然存在的一些缺点,于是研究人员将二种检测方法进行融合,形成一种综合检测方法。综合检测法将两者检测方法的优势进行了融合,并将其灵活的应用到了生产和生活之中,取得了十分不错的效用。

二、基于Opencv的计算机视觉技术探究

(一)基于Opencv的运动物体检测

运动物体在进行检测的时候,基于Opencv的检测原理主要为:根据物体某项特定信息,例如,颜色、轮廓、性状等,在复杂背景中利用这些特定的信息将物体分离出来。整个图像的分离过程首先是进行视频流捕捉,然后是进行视频的格式转换,再将图像进行预处理,从而提取前景物体,减少环境因素对图像处理的误差,最后根据物体特征提取,并完成对运动物体的跟踪。从图像中提取所需的目标物体,其实质就是对整个屋里轮廓进行检测和分割,根据每个图像的帧差异来进行提取。

(二)基于Opencv图像预处理

视觉技术应用于复杂的环境之中,由于存在着光照的变化,其场景中所出现的环境因素对视频采集设备性能影响很大。环境因素会使得获取的图像信息的质量降低,并且在图像中无法避免的存在着噪点,这对于运动物体的检测和图像采集会造成很大的影响。当获取视频帧图像之后需对其数据进行预处理,通常有平滑度滤波处理、图像填充、图像背景更新等。

1.平滑度滤波处理

由于在进行视频图像采集的时候存在着噪点,那么我们就需要对其进行噪点处理,以求减小噪声。滤波平滑度滤波处理,其具有线性和非线性两种方式,其中线性方式进行处理器运算简单、运算速度快,但是在进行处理之后的图像都会呈现不清晰的情况。而非线性方式尽心给处理之后,虽然能够很好的减小噪点,确保信号的局部特点,但是其运算的速度会较慢。

2.图像填充

对于帧图像进行处理,通常采用检测边缘填充法或者是腐蚀膨胀法来完成,其中填充法是指当检测出目标物体之后,利用边缘检测方法来对物体进行辨识,然后利用形态学的漫水填充法进行填充。图像的腐蚀膨胀则主要是由于摄像机的性能等问题造成的。

3.实时背景更新

在进行图像差分之前,需要对背景图样进行确定,并且需要对其进行初始化处理。以方便以后在进行检测时候能够对实时背景图进行差分计算,只有这样,才能够获得极佳的前景效果。在进行图像差分时,首先需要根据指定法来确定第一帧背景的图像,并将其指定为第一张背景图片,然后在检测过程中根据算法对背景实施更新。整个图像在进行更新时,其主要的流程为:判断并读取图像是否为第一帧;将Opencv处理的图像转化为单通道灰度值;将实时采集的图像进行高斯平滑度处理,去除噪点;最后使用形态学滤波处理噪点。

(三)提取前景运动物体图像

检测运动物体的时候,只有在检测流程中确保精确度,才能够获取满意的前景跟踪效果。此过程中主要分为两个步骤,第一步为二值化图像之后进行分割;第二步,图像分析前处理,进行充分填充,确保前景图的完整性。其中,前景图的提取主要分为下面几个步骤:首先对前景图像和背景图像进行差分,然后对差分的图像进行二值化,再对背景中的前景图像边缘进行检测,根据轮廓进行填充图像。由于摄像头存在于不同的场景和环境之中,不论是室外或者是室内随着场景的变化都会对图像的采集产生影响。那么在前景图中提取目标就需要在检测系统中采用有效手段来完成背景实时更新。

阀值二值化分割法可以对检测的物体进行前景和背景差图分割,从而使目标物体能够分离出图像,且阀值分割先要确定每个像素的点是否处于灰度范围值之内。将图像中的像素灰度与确定的阀值进行比较,其结果解释所有像素点分为2类,一类像素的灰度小于阀值,另外一类就是大于阀值。阀值二值化分割时,确定分割的阀值T,然后分割图像。选取合适的阀值进行分割,可以有效的减少光照因素影响,常用的动态阀值主要有直方图来法与最大类方差法这另种分割方法。

三、计算机视觉三维技术

计算机视觉技术的核心为分割问题、运动分析、3D立体场景重构等,立体视觉主要是从多幅图像的参照中获取目标物体的三维几何信息。计算机视觉所模拟出的3D立体画面只需要摄像机从不同的角度同一时间针进行图像捕获,将2D信息进行3D重构,进而将计算机程序重建于真实的三维场景之中,以恢复物体的真实空间信息。

(一)视觉系统

视觉系统捕获图像的过程,实则可以看成为对大量信息进行处理过程,整个系统处理可以分为三个层次,其一,理论层次;其二,描述层次;其三,实现层次。在摄像机视觉系统之中,输入的是2D图像,但是输出为3D信息,而这就可以实现对图像的位置、距离等信息的如实描述。视觉系统分为三个进阶层次,第一阶段为基础框架;第二阶段为2.5D表达;第三阶段为三维阶段。在第二阶段中实现的2.5D表达,其原理是将不完整的3D图像信息进行表达,即以一个点为坐标,从此点看去某一些物体的部分被遮挡。第三阶段的三维阶段,则是人眼观察之后可以从不同的角度来观察物体的整体框架,从而实现了将2.5D图像信息的叠加重合运算,进一步处理之后得到了3D图像。

(二)双目视觉

人们从不同角度观看同一时间内的同一物体的时候,可以利用算法测量物体间的距离。此法被称为双目立体感觉,其依据的原理是视觉差原理,利用两台摄像机或者一台摄像机,对两幅不同的图像进行不同角度观察,并且对其观察的数据进行对比分析。实现双目立体视觉与平面视觉图像获取,其主要的步骤为:

(1)图像获取

从两台不同的摄像机,捕获帧图像,由于环境因素会造成图像差异困难。为了更好的跟踪目标、检测,当捕获图像之后,需要对图像进行预处理。

(2)摄像标定方式

获得真实坐标系中的场景点中的与平面成像点占比见的对应关系,借用三维立体空间中的三维坐标,标定之后确定摄像机的位置以及属性参数,并建立起成像的模型。

(3)特征提取方式

所谓的特征提取方式主要是为了提升检测、跟踪目标的准确性,需要对目标物体进行特征提取,从而实现对图像分割提取。

(4)深度计算

深度信息主要是根据几何光学原理,从三维世界进行客观分析,因为距离会产生不同的位置,会使得成像位置与两眼视网膜上有所不同。简单来说,客观景物的深度可以反映出双目的视觉差,而利用视觉差的信息结合三角原理进行计算,可呈现出深度的图像信息。

(三)摄像机模型

摄像机在标定过程中确定了其建立的基础为摄像机的模型,摄像机模型在标定过程中关系到三个不同坐标系的转换,分别为2D图像平面坐标系、摄像机自身坐标系以及真实的世界坐标系。摄像机在摄像的时候起本质是2D图像坐标转换,首先要定义摄像机的自身坐标系,将坐标系的原点设置为光心,X、Y、Z成立三维坐标系。其次则是建立平面的图像坐标系,用以透视模型表示,其原点也在广心的位置,称之为主点。实际应用中,物理的距离光心的位置d≠f焦距,而且会远远大于焦距,为了解决如此问题就提出了平面概念。在光轴z上设置一个虚拟的图像平面,然后在此位置于平面关于光心对称。接着,在设置的虚拟2D坐标系中,光轴和原点重合,并且摄像机与垂直平面的垂直方向相同,真实图像上的点影射到摄像机坐标系。

(四)3D重构算法

视频流的采集,主要是采用Kinect设备、彩色摄像头、红外发射摄像头、红外接收摄像头。使用微软提供API控制Kinect设备,在操作之前需调用NUI初始化函数,将函数的参数设置为用户信息深度图数据、彩色图数据、骨骼追踪图数据、深度图数据。上述的视频流的打开方式不同,既可以是一种打开方式,也可以是多种打开方式,尤其在进行Kinect传输数据处理的时候,需遵循三条步骤的运行管线。此三条管线分别为:第一条为处理彩色和深度数据,第二条为根据用索引添加颜色信息,并将其放入到深度图之中,第三条为骨骼追踪数据。

四、总结

随着计算技术的快速发展,视觉技术逐渐被广泛的应用于我们日常的研究之中。本文通过对视觉技术的相关问题进行分析,探究了图像处理、分割、前景提取、运动物体观测以及重构3D图等问题,为实现视觉技术更加深入研究做出了相应的贡献;为广大参与计算机视觉技术研究同仁提供一个研究的思路,为实现视觉技术的腾飞贡献薄力。

参考文献

[1]张海科.基于Opencv的人手识别与跟踪定位技术研究与实现[D].云南大学,2013.

计算机视觉总结范文第3篇

【关键词】计算机视觉;数字色彩;感性认知

一、色彩的视觉生理机制与计算机色彩设置的关系

眼睛是人类的视觉器官,视觉系统就像一架摄相机,具有较完善的光学系统及各种使眼球转动并调节光学装置的肌肉组织。光线透过眼的折光系统到达视网膜,并在视网膜中形成物像,同时兴奋视网膜的感光细胞,然后,信息沿视神经传导到大脑皮质的视觉中枢产生视觉。实现阅读的第一反应区域处于大脑后方的枕叶皮层(视觉皮层),人类的视觉系统自动对视觉输入构建结构,并在神经系统层面上感知形状、图形、物体。

视觉能够感受到物体细节,通常称为视觉视敏度,也就是对所观察的实物细节或图像细节的辨别能力,具体量化起来就是能分辨出平面上的两个点的能力。人眼的分辨能力是有限的,在一定距离、一定对比度和一定亮度的条件下,人眼只能区分出小到一定程度的点,如果点更小,就无法看清。以光学色彩为基础的计算机显示器,荧屏上的数字色彩是由许多红、绿、蓝紫三原光小色点构成,以不同比例的混合得出自然界的各种颜色。在各种颜色的反射光快速地先后刺激或同时刺激人眼过程中,显示器色光点过于细小,超出人眼能够分辨的视敏度,待传到人眼中识别时,视觉不能识别全部微妙变化的色彩波段,视觉对相似的色彩归纳在一起,光在人眼中留下的印象在视觉中混合,将信息传入大脑皮层,印象由人的视觉器官完成视觉混合。色彩混合后明度是被混合色的平均明度,混合效果近看色彩丰富,远看色调统一。

电脑显示器工作时的正常显示状态是根据人的视觉明视而设计的,开机工作状态下,感知显示图像的始终是视锥细胞。视觉明视中感受相当光照水平和颜色刺激的视锥细胞中含有感红色素、感绿色素和感蓝色素,三类视椎细胞分别对红绿蓝色(RGB)光敏感。这意味着,人类的色觉与计算机显示器类似,人们感知世界的视觉状态基本处于视觉明视,通过红绿蓝色像素探测形成多种颜色,使人在视觉明视中感知到真实的色彩。

二、计算机视觉色彩感知中的敏感源

在适当的条件下,视觉对光的强度具有敏感性。眼睛对暗适应越久,对光的反应越敏感。视觉对光强度(明度)感受存在一段适合阈值。强度阈值内可以读取色彩,而在强度的阈值以外,人眼只能看出光亮却看不出颜色,明度过高分辨不出颜色。计算机显示亮度的设置是参考视觉感受亮度的共性阈值而设计的,适合阈值范围内,视觉可以读取计算机显示器中色彩。

视觉对光波长的敏感性不同于对光强度的敏感性。视网膜的不同部位对色调的敏感性是不同的。视网膜中央凹能分辨各种颜色,从中央凹到边缘部分,对颜色的辨别能力逐渐减弱,先丧失红、绿色的感受性,最后黄、蓝色的感受性也丧失,成了全色盲。在整个光谱上,人眼能分辨出大约150种不同的颜色(光波),但人对光波(颜色)的辨别感受能力因不同波长而不一样。

在视觉感知计算机色彩过程中色彩认知心理的共性经验可以产生敏感源。色彩认知心理来源于生活共性经验的理性“归纳”。视觉生理机制的共同特征使色彩视觉感知存在基本相同的生理基础。色彩的直接心理效应来自色彩的物理光刺激对人的生理发生的直接影响,视觉生理及视觉心理等方面的共性特征使人们在色彩视觉意象存在相似的感受。视觉感知过程中,以往的认知结构对现有的认知过程的影响,生活经验影响人的认知心理变化过程,心理之间的相互联系、相互制约,使人类认知过程相近的模式。著名的认知心理学家布鲁纳认为,在人们认知的过程中,必须考虑到通过视觉感官对客观联系的色彩信息进行组织,结合视觉经验感知新的客观事物,用归纳方法能找出事物的共性,“感知”出相互联系的客观事物中相近的东西。

色彩心理共性源于“经验色”。人类可以通过本能的眼睛或是肢体触探物质本身的微妙变化感知生活,不断产生认知“经验”。在历史和风俗的影响下,色彩所蕴藏的深层意义来至生活经历的联想,视觉色彩通过联想链来理解传播信息。在生活实践中,不同的色彩刺激结合识别色彩的习惯与经验,形成明显的情绪感,产生不同的情绪反射,使人既能感觉积极兴奋,也能使人消沉或感伤,其影响最明显的是色相。纯度的关系也很大,高纯度色有兴奋感,低纯度色有沉静感。明度也可以表现情绪,暖色系中高明度、高纯度的色彩呈兴奋感,低明度、低纯度的色彩呈沉静感。利用色彩视觉心理经验有利于完成认知任务,对于实际生活具有很强的指导性,这些“经验”向我们明确地肯定了色彩对人心理的影响具有共性。

色彩心理共性源于人们学习和推理。在认知过程中人类情感普遍交流的同时产生相互认同,不断找到与周围的环境现象结合的个人经验。知识学习积累物质的色彩、材料、形状、物理的空间、运动与时间等认知共性,这些共通的经验,可以在大量事实研究中归纳出一些自然规律,诠释事物,形成可以指导和影响社会发展的观点。

三、计算机数字色彩设计

人们在各自分隔的世界里共同生活,色彩视觉感知受人的经历、记忆力、看法和视觉灵敏度等各种因素的影响,但相近的生活习性,相似的生活经验,使人们会采用相近的方式理解色彩。感性色彩的科学设计可以满足计算机视觉的准确性,提高网络平台交互速度,促进经济,满足视觉风尚,帮助高效实现计算机交互。人类共通的视觉经验,产生感知色彩的一般规律,可以归纳出以下计算机数字色彩设计法则。

(1)经验影响感知,应用色彩隐藏的寓意引导,尽可能与图像结合表达。例如,每人看云和水滴会联想熟知的图形,看火会联想到红橙色的激动与热辣。人们能快速识别图像,而且触发相关信息回忆。使用经验图标,一般人们不需要学习,就能识别所提示的意思。

(2)看到和选择比回忆和输入要容易。为用户提供色彩鲜明的选项,在颜色之外使用其它提示,让它们从中选择,而不是强迫用户回忆选项再告诉电脑。

(3)使用缩略图紧凑地描绘全尺寸的图像。缩略图能让人一次性看很多选项,熟悉的图形内容会引起注意,方便选择。使用独特的色彩,用饱和度、亮度及色相区分内容。

(4)避免使用色盲人无法区分的颜色(例如,色盲人可以识别白色和不同深浅的绿色地图)。

(5)将强烈的对抗色分开(强烈的对抗色使人产生难受的闪烁感)。

(6)利用色彩引导边界视力,提供低分辨的线索,引导眼球运动。对视觉选择性感知,边界视野中的暗色和静止物体经常不被注意到,边界视线中物体的运动通常会被察觉。例如,出错提示在点击电脑按键位置1-2厘米边界视力以外,出错提示将不被看到。

(7)物体之间的相对距离会影响人们感知它们是否及如何组织在一起。(互相靠近物体看起来为一组)。例如,计算机图形设计,拉近距离或分组框和分割线隔开,减少用户视觉凌乱。相似物体视觉归属于一组,色彩中的类似色可以归属成一组。

(8)视觉倾向于感知连续的形式而不是离散的碎片。例如,形间断,但色彩相同,视觉自动连续成完整图形。例如,计算机音量滑动条范围的色彩连续,滑动条手柄连续整体感知(灰色地、红色条)。

(9)人们倾向于分解复杂的场景来降低复杂度,视觉自动组织并解析数据,简化数据。例如,图计算机图形中应用此原理,平面色彩显示三维物体和复杂的二维图形解析为三维场景(假空间错视)。

计算机视觉总结范文第4篇

关键词:涂胶机 双目立体视觉 图像标定

中图分类号:TP273 文献标识码:A 文章编号:1672-3791(2015)01(b)-0000-00

随着现代机器视觉处理技术发展,目视系统制造工艺得到巨大进步,高分辨率、低非线性失真目视系统价格已大大降低。飞速发展的计算机视觉系统在汽车生产领域使用日愈广泛,双目视系统通过图像定位获取物体的精确坐标,并将物置信息提供给机器操作分支进行精确操作。在计算机视觉系统和工业检测中需要对景物进行三维立体坐标测量、精确定位和定量分析。双目视系统是计算机视觉的重要部分,能够对视觉范围内的物体进行自动识别定位,对数据进行分析后实现系统现场标定。目视系统需要将三维场景中的物体和二维图像进行连接,具有高效率、高精确度和低成本等特点,在现代工业中得到广泛应用。一般常用的目视系统模型分为线性针孔模型、拟透视投影模型和正交投影模型三类。

1 透视变换模型标定

双目视系统的需要从二维图像中计算出空间物体的三维信息,运用透视变换模型需要获取物体图像信息,再根据所获取的图像信息分析物体的三维立体坐标,从而进行识别并得到物体准确的位置信息。所谓的目视系统标定是指通过几何模型参数将空间物体和图像进行点对点连接后,进行数据分析标定的过程。几何模型参数决定了空间物体表面的几何位置和图像对应点间的相互关系,对双目视系统定位具有关键性的作用[1]。

在视觉导航、监控跟踪等立体视觉系统应用中,对图像定位处理的效率要求较高,建立高效快捷的双目视系统模型是社会发展的现实要求。在实际应用中,常使用线性目视系统模式进行图像标定处理,反而忽视了目视系统非线性因素的影响。

2 目视系统标定重要性

目视系统标定具有如下几个重要作用:

1:从计算机图像中导出三维信息

目视系统标定经过多次试验和计算能够得到一个目视系统模型参数,该参数决定了计算机图像和空间物体表面进行点对点连接的相互关系,能够提供给定坐标点的图像坐标,并确定实际物体目标点的空间位置信息。目视系统标定在机电元件自动装配、机器人标定、轨迹分析及在线检测等方面运用广泛。

2:确定自动行驶车辆上的空间位置

利用目视系统标定可以确定自动行驶车辆和移动机器人的空间位置信息,如果知道目标点的空间坐标和图像坐标,可以通过目视系统参数标定技术进行分析,从而得到目视系统的方向信息。

3:已知物体的三维信息可导出物体的二维计算机图像坐标

在进行模型驱动的机器视觉检测和装配中,有关于物体的方向假设和立体空间坐标问题时,可以利用目视系统参数转化为该图像的假设,然后将假设的图像和物体三维图像进行比较,如果假设图像满足物体三维信息,则可确认或拒绝对该物体和物体空间位置假设成立。

3 目视系统的标定原则

目视系统的标定包括图像获取、参数计算、图像预处理等关键步骤,在进行图像标定时一般需要在目视系统前放置特制的标定参照物,获取该物体图像后计算内、外部系统参数[2]。采用点特征提取方式标定参照物,并根据每个特征点相对于世界坐标系OwXwYwZw 的位置进行精确的测量。得到物体坐标点的数据进而可以解出目视系统内、外部参数。

下面用矩阵形式写出这些方程:

(1)

从以上方程中可以知道, M矩阵乘以任意一个不为零的常数都不会影响 与 的关系,我们可以任意使m34=1,可以得到M矩阵中其他元素的2n个线性方程。这些未知元素的个数为11个,将其记为11维向量,可以将(1)式简写成:Km = U

其中,K为(1)式左边2n×11矩阵;m指代未知的11维向量;U为(4)式右边的2n维向量,K,U为已知向量。当2n>11时,用最小二乘法可以求出上述线性方程解为: m =(KTK)-1KTU 。

m向量与 =1构成了所求解的M矩阵。从以上式子可知,若有空间6个以上的已知点和它们的二维图像坐标匹配的话,就可以求出M矩阵。一般在进行标定时都会使标定模板上有数十个已知坐标点,使方程的个数远远多于未知数的个数,用最小二乘法求方程解,从而降低误差。

求出M矩阵后,如果需要解目视系统的内部、外部参数,可由(4)式表示的关系算出目视系统的全部的内部、外部参数。不过,所求得的M矩阵与(4)式所表示的矩阵M相差一个常数因子 。指定 =1虽然并不影响投影关系,但在分解M矩阵时必须进行考虑。将(1)式M矩阵与目视系统内部、外部参数的关系写成

(2)

其中,miT(i=1~3)从式子(1)中解出,作为M矩阵第i行的前三个元素组成的行向量。二mi4是M矩阵第i行第四列元素;riT(i=1~3)是作为旋转矩阵R的第i行;tx,ty,tz分别为平移向量T的三个分量。且r1T ,r2T ,r3T ,之间有如下的约束关系:

, , ,

, , (3)

由式(2)可以得到

(4)

比较以上式子可知: m3= ,由 是正交单位矩阵的第三行, ,因此,可以从 求出 即 ,再由以下式子可以求得 , , , , :

(5)

(5)式中的×表示向量运算符号,根据(5)所得参数可以得到(6)式中的参数。

(6)

从以上方程式中可以知道,根据空间6个以上一直点及其坐标信息和图像,可以按照方程(5)和(6)求出目视系统的内、外部参数。

4 总结

本文根据汽车涂胶机目视系统图像坐标和针孔目视系统模型定位等方面展开讨论。在此基础上,说明通过目视系统标定和图像点坐标可以唯一地确定空间中的一条射线。利用两个标定过的目视系统观察同一个待测点,它的空间三维坐标可以用两条这样的射线的交点计算出来,说明了双目视觉的基本原理,并讨论了投影矩阵的求解方法。

参考文献

计算机视觉总结范文第5篇

1)等高线生成及等高线分析:等高线图是人们传统上观测地形的主要手段。可以在等高线图上精确地获知地形的起伏程度、区域内各部分的高程等等。等高线图可以从格网数字地形模型仍TM)中获取,也可在不规则三角形格网T(NI)中生成。

2)立体透视图分析:当用户需要从直观上观察地形的概貌时,用绘制透视图的方法(还可以用色彩)可以更逼真地显示地形。

3)坡度分析、地表面积计算及挖、填土方体积计算:建立DTM后就可以用之计算坡度、面积和挖、填土方体积,以其作为土地适宜性评价的因子。

4)断面图分析:断面图主要有利于工程设计和工程测量,如工程勘察的纵向图分析、地质钻孔分析等。

一 CIS技术在矿区土地管理信息的具体形式

在以往的测量中,选择的测量方式还是完全采用机械的形式,但是在使用了计算机CIS技术精密测量后,完成了许多以往技术所不能达到的任务。在我们的研究中,计算机CIS技术测量的原理是通过摄像机将被处理的对象采集进行影像采集,在多个控制点的数据采集完成后,系统会自动将这些图像进行整合,得出相关的几何多变参数,再在计算机上以具体的数据显示出来,以供矿区技术人员使用参照。

在上面所说的摄像机并不是我们通常意义上生活中使用的摄像机。它是一种可视化较强,表针比较敏感的测试仪。可以将视觉中的二维形态通过显影,记录在机械的光谱仪上,再将这种的二维图像做数学处理,有二阶矩阵转换为三阶矩阵,通过播放仪呈现出三维的影像。这时的图像变为立体化,更有层次感,效果上也有了明显的变化,这是一种显示方法。此外还有一种造价较高的仪器,我们不常使用,就是图像提取器。同样是采集控制点的数据,将数据整合在系统之内,然后对于原始的图像进行预处理,不再经过有曝光这个程序,将图像中关键点的坐标在整个内部轴面上体现出来,提取数据帧数,再运用机器的智能识别系统,对控制点的坐标进行数据分析,自动生成图形,这也可以用于精密测量。它的优点就是使用上极其的方面,基本只要架立仪器和打开开关,其他的工作机械系统都会自动的完成。使用的困难就是造价极其的高,不适合一般企业使用。在基于计算机视觉图像测量中使用上的原理如下:

(1) 计算出观察控制点到计算机视觉图像测量仪器的有效距离;

(2) 得出观察点到目标控制点之间的三维的运动几何参数;

(3) 推断出目标控制点在整个平面上的表面特征( 大多时候要求形成立体视觉) ;

(4) 还通过观察可以判断出目标物体的几何坐标方位。

在整个计算机CIS技术精密测量的在矿区土地信息管理中最关键的元件就是压力应变电阻仪,这也是传感器的一部分。压力应变电阻仪的使用方式是将应力片粘贴在控制点位上,事先在物体表面打磨平整,清理干净后,涂抹丙酮试剂,在液体完全风干后就可以黏贴应力片,通过导线的联接,形成了一小段闭合的电路,时刻让计算机CIS技术系统可以感应到并作跟踪观察。因受到来自不同方面谐波的影响后,应力片会产生一定数值的电阻,在电路中,这些电阻会转化为电流,视觉图像系统接收到了电流后就会显示在仪表盘上相应的数据,我们就可以根据仪表盘中的数据记录测量中的数据,很好的解决了原始机械在使用过程中大量的做无用功所消耗资源的现象。传感器对每个应点都进行动态的测量,将数据模转换成现实中的图像,精确的成像可以测算出控制点的位置,用计算机视觉图像精密测量结合数据方面的相关的分析,得出矿区施工中的可行性报告分析,减低了施工中的成本,将施工的预算控制在一个合理的范围之内。

当无法观察到控制点是,计算机CIS技术测量可以通过接收信号或是相关的频率波段来收集数据,不会因为以往测量的环境不好,距离太远,误差太大的影响。

二 计算机CIS技术测量的关键技术分析

在计算机CIS技术测量中解决了很多以往很难完成的任务,但是在使用过程中还是发生了很多的问题。尤其在土地信息的选择中,无法使用高帧数的图片显示,无法将计算机测量的关键技术的优点发挥出来。我们就计算机CIS技术测量的关键技术中常见的问题进行讨论。

1. 降低失误的概率

在很多的数据误差中,有一部分是出现在人为的因素上面。对于机器的不熟悉和操作中的疏忽都会在一定程度上对图像的视觉感模拟带来麻烦。对于网络设备的配置上,要经常性的学习,将配置在可能的情况下设置的更加合理和使用,保证网络连接系统的安全性。为防止更多因操作带来的误差,选用系统登入的制度,用户在通过识别后进入系统,在采集数据后,确定最终数据上又相关的再次确定的标识,系统对本身有的登录服务器和路由器有相关的资料解释,记录好实用操作的时间,及时备份。

2. 对于权限的控制

权限控制是针对测量关键所提出的一种安全保护措施,它是在使用计算机CIS技术测量的关键技术中对用户和用户组赋予一定的权限,可以限制用户和用户组对目录、子目录、文件、打印机和其他共享资源的浏览和更改。图像中的运行服务器在停止的情况下可以做出不应答的操作指令,立刻关闭当前不适用的界面,加快系统的运行速度,对于每天的日志文件实时监控,一旦发现问题及时解决。对于数据终端的数据可采用可三维加密的方法,定时进行安全检测等手段来进一步加强系统的安全性。如果通过了加密通道,系统可以将数据自动的保存和转换为视图模式,对于数据的审计和运行可以同时进行,这样就可以很好的保证大地测量中的图像数据安全,利用防护墙将采集中废弃的数据革除在外,避免数值之间发生紊乱的现象,进一步改善计算机CIS技术。

3. 开启自动建立备份系统

计算机CIS技术测量的关键技术的完善中会常遇到系统突然崩溃或是图像受到严重干扰导致无法转换的一系列情况,发生这种情况最大的可能性就是系统在处理多组数据后无法重新还原成进入界面。这时为保证图片转换成数字的系统数据不丢失,我们对系统进行备份。选定固定的磁盘保存数据,定期将产生的数据(转换前的图像和转换后的数值)导出,保证程序的正常运行。当系统一旦发生错误,可以尽快的恢复数据的初始状态,为测量任务的完成争取更多的时间。我们还要减少信号源周围的干扰,定期的更新系统数据库,保持数据采集的稳定性,把摄像机记录出的数据节点保存在相应的技术图纸上,用这样的方式来知道测量工作。系统备份的数据还可以用于数据的对比,重复测量后得出的数据,系统会自动也备份的数据进行比对,发现误差值在规定以外,就会做出相应的预警,这样也能在工作中降低出现误差的概率。

三 CIS技术测量的关键技术遇到的困难和使用前景

计算机CIS技术测量的关键技术作为一种新兴技术在使用时间上不过十几年,其使用的程度已经无法估算。正是因为它的简单、使用、精度高以及自动化能力卓越的特点受到了矿区土地信息管理部门的广泛青睐。在测量调控方面的这些可靠性和稳定性也是有目共睹的。这项关键技术中涵盖的学科非常的多,涉及到的知识也很全面,一旦出现了机器的故障,在维修上还是一个很大的问题,如何很好的解决计算机视觉图像技术的相关核心问题就是当下亟待解决的。

我们都知道,人的眼睛是可以受到吱声的控制,想要完成矿区土地观测是十分简单的,但是在计算机CIS技术中,毕竟是采取摄像机取景的模式,在取得的点位有的时候不是特别的有代表性,很难将这些问题具体化、形象化。达不到我们设计时的初衷。所以在这些模型的构建中和数据的转换上必须有严格的规定和要求,切不可盲目的实施测量,每项技术操作都要按规程来实施。

四 结束语