首页 > 文章中心 > 计算机视觉基本原理

计算机视觉基本原理

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇计算机视觉基本原理范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

计算机视觉基本原理

计算机视觉基本原理范文第1篇

1对以下出现的名词的说明

餐饮库房是本平台新开发的一个库房,体检系统是地方公司开发的一个系统,药库管理系统是军队疗养院信息系统的一个模块,物资管理系统是总后配发的物资系统。

2存在的问题及解决办法

2.1餐饮库房库存出现负数原因是餐饮库房管理员没有正确维护餐饮分类设置模块。本院有两个餐饮中心,他们各自管理自己的库房,这样就产生了两个餐饮库房。在没有本平台之前,餐饮库房一直是手工管理,所以我们就设计了一个简单的餐饮库房管理功能。先把餐饮中心的购入材料作一个分类,每个分类有三种库存管理标记,出入库管理标记、全进全出标记、消费出库标记,通过对三种标记的不同组合就达到了管理库房的目的。在出入库管理标记上打勾,表明此分类材料纳入库存管理。在全进全出标记上打勾,表明此分类材料一入库,系统就自动全出库,此分类材料的库存始终为零。此库存管理标记适合单价较低、量较大、品种较多、几乎每天都要入库、难以管理出库的分类,如蔬菜肉类。在消费出库标记上打勾,表明当有餐饮消费账单产生时,系统自动扣该分类材料库存。

2.2体检、客房账单结算时出错原因是没有设置体检项目和客房的合作比、提成比。合作比指的是本院跟外单位合作的体检项目,需要付给外单位的分成比,合作比分非合作(本院项目,不跟外单位合作)、比率提(按百分比分成)和金额提(按固定某一个金额分成)三种。提成比是给介绍人的一种劳动报酬,分不提成、比率提和金额提三种。当增加了新的体检项目和客房房间后,一定要及时、准确地设置好合作比和分成比,否则收费室收取不了费用并且会影响科室的收入分摊。

2.3药品、物资单据报账出错药品、物资入库报账出错有两个原因,一是未进行药品、物资分类对照,二是财务会计人员未为药品、物资的厂商设立核算账户。

2.4药品、物资单据报账时不提示错误,但单据明细为空原因是该入库单据有新的品名,需要报账人员进入药品、物资分类定义模块进行手工提取,把新的品名从药品系统和物资系统里提取过来。

2.5药品、物资报账单据明细中出现重复的明细药库管理系统的价表中存在两条或两条以上药品编码相同终止时间为空的记录,所以就导致了药品报账单据明细中出现重复明细。物资报账单据中出现重复明细是由表与表之间的一对多对应引起的。

2.6因价格原因入错库而作了退库处理的单据,在本平台中怎么处理因为入错库而作了退货处理的单据,实际上不是真正意义上的退货,在本平台中不能对此类单据进行退货报账。所以我们就设计了一个小模块来处理此类退货单据,实现办法如下:找出该退货单的入库单,把这两条单据都选中,做作废处理。

2.7同一挂账单位的多个挂账账单可以分批次结算在模块的设计初期,只能对同一挂账单位的所有挂账账单进行一次结算,这种设计思想不符合实际,后面就重新编写了程序,做到可以自由选定某几个挂账账单进行结算。

2.8 体检账单生成模块中的“追加校验”功能本平台首先是从体检系统中取体检人员的体检单号、姓名、体检日期、体检项目、项目价格等字段。举个例子,有个体检人员叫张三,预定是2008年8月10日来体检,体检项目已确定,但是那天他没有来体检,那本平台指定提取2008年8月10日的体检人员信息,就会把张三的体检信息提取过来并保存在全成本的数据库中。2008年8月12日,张三参加体检了,他重新选定了体检项目,我们就在体检系统中指定他的体检日期是2008年8月12日,重新登记了他的体检项目,在没有“追加校验”功能时,主键只有一个,是体检单号,那指定提取2008年8月12日的体检人员信息,因为张三的体检单号存在于数据库中,所以系统不会再重复提取。增加了“追加校验”功能后,主键是体检单号和体检日期,先搜索有无重复的体检单号和体检日期,如存在,删除此条记录,然后插入一条新的记录。

3讨论

计算机视觉基本原理范文第2篇

【关键词】株高 HALCON 双目视觉 误差修正

1 引言

计算机视觉技术是近几年来发展较快的信息处理技术,随着图像处理技术的专业化、计算机硬件成本的降低和速度的提高,计算机视觉的应用已变得越来越广泛,其中不乏在农业中的应用。

株高是植物生长指标的重要参数,是一个物种争夺阳光的能力的主要决定因素[1]。对于作物来讲,株高参数是作物产量预估不可或缺的参数。

然而对于具体的利用机器视觉方法直接测量株高的研究还是比较少的,本文就是利用HALCON软件,采用双目计算机视觉方法来实现株高的测量。

2 双目视觉原理

双目视觉的基本原理是从两个视点观察同一景物,获取不同视角下的两幅图像,然后根据三角测量原理计算不同图像对应像素间的视差(disparity ),获取景物的三维信息,从而实现场景三维重构。

根据两个摄像机位姿的不同,双目视觉有多种模式,常用的有双目横向模式,双目横向会聚模式以及双目纵向模式(也称双目轴向模式)。

为了增加测量精度,基线一般不能太小,但基线长度也不可太长,否则,由于物体各部分相互遮挡,两个摄像机可能不能同时观察到目标点。

图1是会聚双目成像中的视差原理图。图中给出两镜头连线所在平面(XZ平面),两镜头中心间的距离(即基线)是B,两光轴在XZ平面相交于(0,0,Z)点,交角为(未知)。现在来看如果已知像平面坐标点(x1, y1)和(x2, y2 ),如何求取世界点W的坐标(X,Y,Z)。

根据相似三角形的关系可以很明显得出: (2.1)

(2.2)

(2.3)

其中r为从(任一)镜头中心到两系统会聚点的距离(未知)。将式(2.2)和(2.3)联立, 可得:

(2.4)

上式把物体和像平面的距离Z与视差d直接联系起来,若想求解式(2.4),除视差d外,还需要知道x1和x2本身。另外,由图1可以得到:

(2.5)

代入式(2.2)或(2.3)可得:

代入式(2.2)或(2.3)可得:

(2.6)

现实测量中,两相机的光轴与世界坐标Z轴的夹角不可能相等,不过即便如此,也只会引入几个待确定的三角函数,而这些三角函数在相机标定时即可确定。

3 测量过程

实现该测量过程包括如下几个功能模块:图像获取、摄像机标定、特征提取、立体匹配与三维信息恢复、后处理。本实验采用是分比率为960×720的双摄像头。被测区域大小约为56cm×42cm,所以采用的标定板应为被测区域1/3大小的HALCON专用的200mm标定板。标定数为24×2张图片。利用HALCON自带的标定助手,可以轻松实现单目标定。

双目标定时,需要有15张以上左右相机相同时刻拍摄的标定板的图片。再利用for循环,find_caltab函数,find_marks_and_pose函数以及binocular_calibration函数,可以实现双目标定。将标定过程中,获得的摄像机的内参以及两个摄像机相对位置关系作参数传递给函数gen_binocular_rectification_map,可以很好地实现双目视觉校正的目的,得到两幅校正后的图像,还能得到校正后虚拟立体视觉系统中两个摄像机的内参和外参。

不同种类的植物其株高定义不同,测量方式也不尽相同。本文研究的株高只针对直立型的,是指从植株根部露出土壤部分到植株最高处的株高。

先利用gen_binocular_rectification_map函数为map_image函数提供控制参数,再通过map_image函数对采集到的图像做校正处理,利用threshold函数,fill_up_shape函数以及select等函数找出校正后图像中植株的最低和最高点,利用intersect_lines_of_sight函数,可获得植株最低点和最高点的真实三维坐标,最后通过几何运算得到双目测量结果。

我们在图像采集时就应该考虑到,摄像头应该稍微带一点俯拍的角度,保证左右两幅图像上最高处均为现实坐标中的最高处。切忌俯拍角度不可太大,否则由于拍摄角度而引起的像差会很大,对结果将会有很大的影响。

经过以上几步骤得到的三维坐标,常因各种原因而存在一定的误差,需要进行误差校正。我们对已知高度的对象进行了测量,得出结果如表1:

通过上述数据得出的修正关系如下:

y=-0.0002x2+1.0699x (3.1)

其相关系数R2=0.9993

4 实验结果

我们对三种植物进行了测量得出的结果如下:

从测量结果中可以看出,修正后相对误差控制在2%之内,可以接受。误差引入的原因可能如下:

1、标定板的选择决定了标定精度。一定要选用高精度的标定板,且标定板的大小应约为测量范围1/3大小。

2、相机是图像获取的根本,高质量的图像离不开高分辨率相机,但是高分比率,高解析度的相机又会带来成本上的提升。本文中,对于390.0mm左右的对象,1个像素的误差可以带入约0.4mm的实际误差。

3、本文所采用的算法只能针对比较理想,比较直的植株,算法的不断优化,才能不断减少误差,提高精度。

5 结语

本文介绍了一种基于HALCON的,利用双目视觉测量株高的方法。对于直立型植物,通过对立体匹配与三维信息恢复结果的误差修正,其株高测量相对误差不超过2%,方法具有一定的可借鉴性。

参考文献

[1]章毓晋.计算机视觉教程 [M].北京: 人民邮电出版社,2011.

作者简介

郝慧鹏(1988-),男,内蒙古乌兰察布人,硕士研究生,主要研究方向为计算机视觉技术在农作物检测上的应用。

指导老师

田跃(1956-),男,北京人,北京科技大学数理学院物理系教授,北京市弱磁检测及应用工程技术研究中心副主任。

作者单位

计算机视觉基本原理范文第3篇

关键词:手伸及界面;定标;最小二乘法

一、引言

汽车已逐渐走进普通百姓家,“以人为本”的设计思想在汽车设计上日益受到重视。车辆驾驶室的品质对于减轻驶乘人员的疲劳、预防职业病、提高人车系统的工作效率和行车安全有着重要作用,因而需要测量驾驶室内驾驶员手伸及界面参数。普通的数码相机对于量测用摄相机的测量缺陷(如物镜畸变大等)已有较好的克服,一些新的算法的应用,也使测量精度有较大的提高;且数码相机可以和计算机直接进行数据交换,进行数字图像处理,所以普通数码相机已常用于进行测量工作。

传统的驾驶员手伸及界面参数的测量方法为手工测量,且占用驾驶员比较多的时间,本文提出了汽车驾驶员手伸及界面测量新方法,通过使用普通数码相机来对驾驶室进行图像信息采集,利用计算机视觉基本原理求取驾驶员手伸及界面相关参数。

二、基本原理

(一)线性模型摄像机定标

计算机视觉的研究目标是使计算机具有通过一幅或多幅图像认知周围环境信息的能力。利用数码相机能较好地采集三维数字图像,通过单个或多个数码相机从不同方向拍摄的两幅或两幅以上二维图像,从二维图像中萃取出物体的三维信息。测量系统中大都采用小孔成像模型,其中数码相机定标是实现三维测量的重要环节。

图1为数码相机定标模型。设空间坐标系为(X,Y,Z),数码相机像平面的图像坐标系为(u,v)。P为空间任一点,其三维物坐标为(x,y,z),在图像平面上的像坐标为p1(u1,v1),p2(u2,v2)。数码相机的物相关系如下:

XYZ10 0 0 0-u■X-u■Y-u■Z0 0 0 0XY Z 1-v■X-v■Y-v■Z・

M=u■m■v■m■①

式中i=1,2,实际计算中取mi34=1。 M=[millmi12...mi33]为系统变换矩阵中的元素,即11个线性定标参数。对每张图片来说,有11个未知数,而一对物体与图像的对应点只能有4个方程组,因此至少需要6个控制点参与定标解算。

完成系统定标后根据②式,用系统变换矩阵M和被测点P在数码相机像面上的坐标p1(u1,v1),p2(u2,v2),求P点的三维空间坐标(X,Y,Z)。

m■ -m■ u■ m■ -m■u■ m■-m■u■m■ -m■v■ m■ -m■v■ m■ -m■v■XYZ=u■ -m■v■ -m■②

(二)非线性模型摄像机定标

在实际工作时,当计算精度要求较高,且摄像机是使用数码相机而非量测用摄像机时,在远离图像中心处会有较大的镜头畸变,线性模型不能准确地描述摄像机的成像几何关系,因此采用非线性模型来描述。对于系统的畸变,已经提出很多求取摄像机参数补偿畸变的方法,Tsai提出摄像机两步定标算法,使用一个直接的线性变换并且考虑了系统的径向畸变,并指出:主点位置的细微变化不会对三维测量造成很大的影响。由于只考虑径向畸变差,且只用到3次项,因而摄像机定标方程得到很大简化。即:

Δu=(u-u0)(k1r2+k2r4+k4r6)

Δv=(v-v0)(k1r2+k2r4+k3r6)③

Weng考虑了含有径向畸变和切向畸变补偿模型,如④式所示

Δu=(u-u■)(k■r■+k■r■+k■r■)+t■(r■+2(u-u■)■)+2t■(u-u■)(v-v■)Δv=(v-v■)(k■r■+k■r■+k■r■)+t■(r■+2(v-v■)■)+2t■(u-u■)(v-v■)④

其中,r2=(u-u0)2+(v-v0)2,u0=-(m11m31+m12m32+m13m33)/(m231+m232+m233),v0=-(m21m31+m22m32+m23m33)/(m231+m232+m233),(u,v)是实际的图像点坐标,Δu与Δv是非线性畸变值,它与图像点在图中的位置有关,(u0,v0)为像主点坐标,原点为CCD数字影像中心像元。由①式和④式可得两个非线性方程组,对每张图片来说,有16个未知数,一对物体与图像的对应点只能有4个方程组,因此至少需要8个控制点参与定标解算,可使用最小二乘原理平差。

(三)基于最小二乘法的摄像机定标

本实验采用DLT(直接线性变换)定标算法直接求取定标矩阵的11个线性定标参数,由于在采用Tsai和Weng方法后所得到的实验解算结果差别不大,所以本文采用解算含有径向畸变参数的Tsai方法,以11个线性定标参数作为初始值,其余补0,共14个初始值来解算,用迭代的方法来解算非线性模型摄像机定标的14个参数。

在测量汽车驾驶员手伸及界面参数时,对于部分距离较长线段的测量,其误差总是比较大,无法达到测量精度要求。本文基于上面所述的方法,在得到含径向畸变的14个定标参数后,用另一些未曾参与解算、分布均匀的控制点残差和原本参与解算的控制点残差进行误差拟合,并内插出控制点的像坐标改正值,用改正后像坐标重新进行解算,重复执行,直到达到限值;以此来提高定标矩阵参数的精确度。

三、实验结果和分析

实验采用310万相素精度的OLYMPUS数码相机,定标物为三维黑白格子,大小为150mm*150mm*150mm,其中每个网格大小均为25mm*25mm。

采用单数码相机,保持靶标和被测对象的相对位置不变,在两个或两个以上位置分别拍摄两幅或两幅以上二维图像(本文解算使用两幅图像)。拍摄时,应尽量使相机绕以靶标为圆心的弧线上移动,即保持相机和靶标的距离相同;两幅图像间的拍摄角度应在20-50°,拍摄角度过低则二维图像所含物体深度信息少,定标解算精度差,拍摄角度过高则两幅图像的场景差别大,空间点难匹配。

拍摄图像时应尽可能选取光亮的场景,减少图像的噪音;在选取图像上点坐标前应对图像进行数字图像预处理,求取其边缘图像;选取图像上测量点时,应尽量选在物体外形变化或物体的边缘,手工选取图像上的点坐标,简单方便,可减少图像点匹配误差。

拍摄驾驶室内图片,处理后得到其边缘图像如图2所示。选取“AB、CD、EF、GI”这4段线段来进行测量,包括其中一块挡板的相对高度“AB”,挡板和座位中间的距离“CD”,方向盘的直径“EF”,两块挡板间的距离“GI”(其他参数由于编幅关系没有列出),如图3所示。

求解数定标参数时,选取的定标物控制点应采用较强的分布图形,即控制点均匀且充分覆盖定标物图像。

在实验中采用Tsai方法(含有径向畸变参数)比采用DLT直接解算的测量结果有明显改善,另外实验还采用了Weng方法,解算含有径向畸变和切向畸变的补偿模型,解非线性方程组后对于距离较长线段的测量结果的误差和采用Tsai方法所测量的误差相差不大,而采用本文算法,对于较长距离线段有较好的实验结果。实验数据见表1。

实验误差分析:

定标物的误差:定标物的制作不够精细,打印的纸张无法精准达到预设的数值,则物点三维坐标值产生误差。

图像边缘的误差:边缘检测产生误差,如方向盘由于拍摄角度的不同,使边缘图像的提取在两张图像产生差别。

测量的误差:在量取挡板到座位之距离时,由于座位上是软质材料而产生变形,实际量取值产生误差,但两块挡板间的距离由于边缘提取准确,所以误差较小。

算法的误差:计算过程中计算机有舍入误差,使得结果有偏差;用广义逆矩阵解定标矩阵时,本身有误差;优化算法及最小二乘法都是取计算结果误差最小的解,同样存在误差。

四、结论

采用数码相机,不需专业的量测用摄影相机;利用已知尺寸的定标物对视觉系统定标,不需事先精确测定系统参数。该技术适合于测量时间紧拉、参数多的非接触测量。

证明本文所提出的测量方法简单、方便、快速,实用性强。

参考文献:

1、马颂德,张正友.计算机视觉-计算机理论与算法基础[M].科学出版社,1997.

2、张靖瑜,董明得,吕乃光,邓文怡.用广义逆法解决摄影测量系统的非线性问题[J].北京机械工业学院学报,2001(1).

3、伍雪冬.计算机视觉中摄像机定标及位姿和运动估计方法的研究[D].湖南大学,2004.

4、龙兴明.三维测量中的图像处理技术研究[D].重庆师范大学,2005.

5、苗红杰,赵文吉,刘先林.数码相机检校和摄像测量的部分问题探讨[J].首都师范大学学报,2005(1).

6、蔡祥鹏,林建,张翔.基于数字图像处理方法的三维测量[D].福建农林大学,2007.

计算机视觉基本原理范文第4篇

Discussion and practice on "image processing technology"

Zhang Yongmei, Ma Li, He Li

(School of Information Engineering, North China University of Technology, Beijing 100144, China)

Abstract: The disadvantages, the characteristics and the content of the current teaching for "Image Processing Technology" are analyzed. Four teaching procedures including the selection of textbooks and expansion materials for initiative learning, application of modern teaching models and methods, strengthening teaching practice and reforming appraisal methods have been discussed and practiced. The result shows that it has obtained better teaching effects, improved the students' interest in learning and motivation to participate in scientific research, as well as the ability to solve practical problems.

Key words: teaching content; teaching method; assessment way; teaching practice

0 引言

图像信息是获取信息的重要来源,图像处理研究对于科学理论研究和工程应用有重要影响。研究图像处理和通信是导向智能计算机、智能机器人或多媒体通信系统的必由之路。现有的图像处理技术在很多方面给人们生活、学习、工作带来极大的便利,如:视频广播、遥感图像、医学图像(计算机X射线断层扫描技术CT,以及核磁共振成像MRI)等,计算机的发展使处理更复杂的图像成为可能。

图像处理是计算机应用领域中的一个重要方面,是模式识别、计算机视觉、图像通讯、多媒体技术等学科的基础,是一门涉及多领域的交叉学科。在图像处理技术课程的教学中,不但要让学生掌握其基本概念和原理,还要让不同层次的学生能够理解和掌握图像处理在其应用领域的最新发展,故传统的常规教学已经不能满足课程的发展要求。目前的教学不足之处主要体现在:传统的图像处理技术教学大多数偏重于理论,缺乏图像处理技术与实践相结合的环节。本文结合计算机学科的特点和多年的教学经验,对图像处理技术课程的教学模式与实践进行了探讨。

1 课程特点和教学内容分析

人类通过眼、耳、鼻、舌、身接受信息,感知世界。约有75%的信息是通过视觉系统获取的。图像处理是利用计算机处理所获取视觉信息的技术[1]。图像处理技术的理论基础涉及了众多学科,包括数学、物理、信号处理和计算机科学等多个学科的知识,其内容广泛,理论抽象,不易理解。图像处理技术还有很强的实用性,因此理论和实践的结合是本课程的关键,注重基础理论和技术的教学,以及加强学生实践能力和课题研究能力的培养是本课程的主要教学目的。

图像处理技术已经成为众多高校的一门重要课程,该课程主要介绍图像的数学描述、图像的数字化、图像变换、图像增强、图像恢复、图像编码、图像重建、图像分割与边缘提取、图像的分析和识别等基本的图像处理方法,使学生能熟练地掌握图像处理的基本过程,并能应用这些基本方法开发图像处理系统。通过这样的内容设置,使学生能够真正掌握图像处理技术的基本思想和技术,为深入学习打下坚实基础[2]。

2 教学环节的探讨和实践

2.1 教材的选用和自主学习扩充性资料的选用

图像处理技术发展日新月异,虽然该课程已经有很多可选教材,但大部分教材内容比较陈旧,许多新的算法,新的思想都没有提到,学生无法从这些教材中获取图像处理最新的技术和发展趋势,因此我们选择了章毓晋编著、清华大学出版社的《图像工程》系列教材。该教材全面介绍了图像工程的第一层次――图像处理,图像工程的第二层次――图像分析,图像工程的第三层次――图像理解的基本概念、基本原理、典型方法、实用技术以及国际上相关研究的最新成果。同时我们要求学生将国外的经典图像处理的书籍作为参考书目,如:Rafael C Gonzalez主编的《Digital Image Processing》,并建议学生关注图像处理的一些重要期刊和国际会议,如:IEEE Transactions on Medical Imaging、IEEE Transactions on Pattern Analysis and Machine Intelligence、IEEE International Conference on Image Processing、电子学报、CT理论与应用研究、模式识别与人工智能等。这样学生能熟悉一些专业术语,了解最新的前沿动态,并具备一定的英文文献阅读能力,为今后的科研和工作打下了坚实基础。

要求学生自主学习一些最新方法和技术,例如,深入分析中华人民共和国设计制造的玉兔号月球车的结构,给出玉兔号月球车如何通过全景相机、测月雷达、粒子激发X射线谱仪、红外光谱仪等仪器,对月表进行三维光学成像、红外光谱分析,开展月壤厚度和结构科学探测,对月表物质主要元素进行现场分析等探测的原理和方法。又例如,探讨将遥感图像应用于5.12汶川大地震的方法,2008年5月14日上午,中国科学院的两架高性能遥感飞机飞赴汶川,对地震灾区开展遥感监测和灾情评估工作,这两架飞机可分别提供高分辨率光学和雷达图像,具有全天候快速获取大面积灾情数据的能力,探讨如何根据汶川地震前、后图像,给出建筑物、河流、山体等关键区域的变化检测结果,为国务院和相关部门的抗震救灾工作提供咨询服务和决策依据。

2.2 采用现代化教学模式与方法

为了使复杂的算法和抽象的知识更加形象化,便于学生理解和提高学习兴趣,我们充分运用现代电子技术、工具和方法,采用多媒体形式进行课堂教学,利用VC、MATLAB编写一些典型的图像处理程序,并在课堂上演示这些程序,增加了课堂的信息量,提高了学生的学习兴趣,激发了学生自主学习,同时也为实验环节的开展奠定了一定的编程基础[3]。

此外,我们深入分析MOOCs、SPOCs以及“翻转课堂”教学模式等国际流行教育新概念,尝试开展图像处理技术的MOOCs,包括从课堂教学、学生学习进程、学生的学习体验、师生互动过程等教与学过程的完整系统在线实现。MOOCs是一个改变学习方式的时代产物,受到全球各地的重视。国内教育部三个教指委(计算机类专业、软件工程专业、计算机课程)2013年底专门召开会议研讨MOOCs。我们建立了校内MOOCs平台并对学生开放,将其作为课堂外学习的有效补充,这样可以方便学生随时随地学习,或者进行预习和复习。我们尝试了结合图像处理技术的MOOCs,探索创新教学模式与方法,稳步提高教学质量。

2.3 加强实践教学

图像处理技术可以广泛应用于数字电视、视频通话、宇宙探测、自然灾害预测、环境污染的监测、气象云图等应用领域,而教材一般只涉及到理论知识和算法,或者是对应用的简单介绍,对其设计实现介绍得很少,所以必须加强实践教学,将理论与实践结合起来,使理论指导实践,实践加强理论[4-5]。要求学生利用VC或者MATLAB进行实际程序设计,培养学生分析问题、解决问题的能力,具备图像处理系统的开发能力。

根据课程的教学要求设置了四个课外实验。①图像变换实验。要求对输入的图像,分别采用傅里叶变换、离散余弦变换、小波变换进行图像变换,分别给出变换前后的图像,并分析图像变换前后的视觉效果。②图像增强实验。将给定的图像进行增强处理,要求至少使用线性变换增强、对数变换增强、指数变换增强以及伪彩色增强处理,分析增强后的视觉效果。③图像编码实验。将给定的图像进行压缩处理,要求采用 Huffman编码方法,并计算压缩比。分析图像压缩后的视觉效果,并对图像压缩效果进行客观评价。④图像分割与边缘提取实验。分别利用边缘检测法、阈值分割法进行图像分割;分析图像分割后的视觉效果。学生完成所有实验后,我们安排了实验指导课,解决学生在实验中遇到的问题,进一步提高学生的算法设计能力和编程能力。

在课程教学中,我们还安排了三次专题讨论课,由教师指定具体题目,学生通过查阅相关文献,深入分析基本原理和方法,设计相应的算法,编程实现,并给出实验结果及分析,充分调动学生学习的积极性,提高学生利用理论知识解决实际问题的能力。三次专题讨论课分别是:

⑴ 数字图像表示及其处理专题讨论课。题目为:用VC或者Matlab实现常见图像文件格式的显示;常见的图像文件格式,以及用VC或者Matlab实现图像格式转换;给出国内外先进的图像处理系统软、硬件,名称、作用,以及先进性的体现。

⑵ 图像变换专题讨论课。题目为:给出小波变换常用的小波基的基本原理、具体应用,以及用VC或者Matlab的具体实现;给出小波变换、脊波变换、子波变换的基本原理、具体应用,用VC或者Matlab的具体实现;给出小波变换以及小波变换在图像处理中的具体应用,以及用VC或者Matlab的具体实现;给出快速傅里叶变换算法的具体内容,以及时间复杂度或者运行时间的分析。

⑶ 图像编码专题讨论课。题目为:给出小波变换图像编码的基本思想与特点,编码中需要解决的问题,实验结果及分析;给出基于感兴趣区域的小波图像编码方法的基本思想,具体步骤,实验结果及分析;给出几种图像编码质量评价方法,具体实现,实验结果及分析;给出基于子波变换的图像编码基本思想与特点,具体步骤,实验结果及分析。

此外,鼓励学生积极参与本校教师主持的科研项目,如国家自然科学基金、863项目、科技支撑计划,以及北京市自然科学基金等项目。这些项目涉及到视音频检索、视音频理解、视音频处理、网络信息分析、文字处理、信息检索、网络行为分析、图像识别等研究方向。通过参与项目,系统地锻炼了学生的科研能力和思维创新能力,也为今后的科研工作打下了坚实基础。

2.4 改革考核评价方式

考核是对学生学习成果的检验,考核目标不仅要检验学生对课堂教学内容的掌握程度,而且要对提高学生发现问题、思考问题、解决问题的能力起到作用。为了避免出现平时不努力,考前突击的情况,我们对传统的考核方式进行了改革。本课程的考核由两部分组成:平时成绩(占30%)和期末考试成绩(70%)。将平时的上课出勤、作业、实验和专题讨论成绩列入平时成绩。在整个教学过程中,严格要求学生,使学生重视教学的各个环节。

计算机视觉基本原理范文第5篇

关键词:刑事模糊图像 Retinex算法 增强

中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2012)11-0133-01

数字图像技术的发展给刑事科学技术工作带来了极大的方便,刑事图像技术也由传统的刑事照相技术发展为成熟的数字刑事图像技术。新时期的刑事图像技术学致力于刑事科学技术的光学成像研究和刑事图像处理研究,模糊图像的处理是刑事图像处理工作中极具挑战性的难题。

1、刑事模糊图像形成因素

模糊图像处理是对由于介质、客观环境等因素造成的模糊图像和退化图像进行校正处理,使其清晰化,以利于图像研判。刑事图像的模糊有多种因素造成:一是非正确曝光退化,如非线性退化等;二是离(散)焦模糊,对焦不实使物体不能清晰的成像于焦平面上;三是运动模糊,运动模糊是指在曝光瞬间,照相机与被摄物体间有相对运动;四是噪声干扰致使图像模糊不清;五是监控视频模糊,如安装位置不合适、光线太暗或太亮、目标运动过快、摄像镜头对焦不实等,往往使影响资料变得模糊不清。

2、Retinex算法原理及应用特性

2.1 Retinex理论概述

Retinex(视网膜“Retina”和大脑皮层“Cortex”的缩写)理论是一种建立在科学实验和科学分析基础上的基于人类视觉系统(Human Visual System)的图像增强理论。该算法的基本原理模型最早是由Edwin Land(埃德温·兰德)于19世纪70年代提出的一种被称为具有颜色恒常性的色彩理论,并在颜色恒常性的基础上提出的一种基于此理论的图像增强方法。Retinex 理论的基本内容包括物体的颜色是由物体对长波(红)、中波(绿)和短波(蓝)光线的反射能力决定的,而不是由反射光强度的绝对值决定的;物体的色彩具有一致性,不受光照非均性的影响,即Retinex 理论是以色感一致性(颜色恒常性)为基础的。鉴于Retinex原理,对于观察图像S中的每个点(x,y),用公式可以表示为:

S(x,y)=R(x,y).L(x,y)

其中,S(x,y)为所观察的图像,R(x,y)是反射物体图像,L(x,y)为入射光图像。

2.2 Retinex算法的应用特点

Retinex理论的基本思想就是将原始图像看成是由照射图像和物体反射属性组成,照射光图像直接决定一幅图像中像素能够达到的动态范围,物体反射属性决定了图像的内在性质,因此,在原始图像中去除或降低照射图像的影响从而保留本质的反射属性是Retinex理论的基本思想。Retinex算法具有锐化、颜色恒常性、动态范围压缩大、色彩逼真度高等特点。

传统的图像增强算法,如线性变换、非线性变换、图像锐化等只能增强图像的某一类特征,如压缩图像的动态范围,或增强图像的边缘等。Retinex算法可以在动态范围压缩、边缘增强和颜色恒常三方面达到平衡,因此可以对各种不同类型的图像进行自适应性地增强。

3、Retinex算法对数字模糊图像处理的适用

3.1 Retinex算法对图像的预处理

在多种以Retinex为核心的算法中,单尺度(Single-Scale Retinex,SSR)算法和多尺度(Multi-Scale Retinex, MSR)算法是最具有代表性和最成熟的算法。利用多尺度Retinex灰度图像增强算法对灰度图像进行增强,在图像的预处理阶段对噪声进行滤除,做到改善图像颜色恒常性,压缩图像动态范围,提高对比度,有效显示淹没在阴影、光照等区域中的细节,为下一步的特征提取提供必要的条件。

3.2 Retinex算法对场景模糊图像的增强

场景的干扰常常致使物体成像模糊,如雨雾天条件下,户外景物的对比度和颜色发生退化,计算机视觉系统无法正确检测与跟踪场景中目标,这就需要对雨雾天图像或视频作清晰化处理。Retinex 理论及相关算法是图像增强的新思路,其理论基础是色彩的恒常性,它通过模拟人眼观察场景的方式,恢复因图像采集设备限制而丢失的场景细节,达到增强图像对比度,还原物体真实色彩的目的。

3.3 Retinex算法对图像细节特征的增强

在图像处理和计算机视觉领域,特征提取被广泛运用,其效果很大程度上取决于图像的质量。图像在采集的过程中,多变的光照条件、物体间相互遮挡、采集设备自身限制等因素都会影响图像质量,要想对质量差的图像进行特征提取非常困难。基于Retinex理论的图像增强算法能减少计算时间,将多种计算函数相结合,能够有效地重建图像细节达到增强图像的目的,使增强后的图像更适合于细节特征的提取。

Retinex算法是数字图像处理的新算法,与其他传统图像处理算法相比,具有很大的优势,能大量保留提取图像的细节特征。在刑事图像处理工作中,技术人员所感兴趣的就是对侦破案件有用的细节特征。刑事图像工作遇到的问题及其产生原因都是其他领域图像处理所共有的,因此,Retinex理论同样适用于刑事图像处理研究,将基于Retinex理论的各种改进的Retinex算法直接应用到刑事模糊图像处理工作中,势必会给当前的刑事模糊图像处理工作打开新的局面。

参考文献

[1]李权合,毕笃彦,时平,何宜宝.基于Retinex和视觉适应性的图像增强[J].中国图形图像学报,2010,15(12):1728-1732.

[2]乔小燕,姬光荣,陈雾.一种改进的全局Re tinex图像增强算法及其仿真研究[J].系统仿真学报,2009,21(4):1185- 1197.