首页 > 文章中心 > 计算机视觉的基本概念

计算机视觉的基本概念

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇计算机视觉的基本概念范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

计算机视觉的基本概念

计算机视觉的基本概念范文第1篇

【关键词】摄影测量;计算机视觉;数字化

科技迅速发展,摄影测量技术经过多次改革,到目前已经进入数字化的摄影测量技术阶段,这个新技术对整个摄影测量专业理论知识教学、科学研究和企业生产都有重要的影响,这些影响不仅仅是表现在表面,它已经使摄影测量的概念和涉及到的专业的知识都有影响。从测绘学科的角度来说,数字测量技术已经从传统的摄影测量技术发展到现在新型数字化测量技术,简便快捷;从摄影测量学科来说,数字摄影测量技术已经从经典的摄影测量转化到现在与计算机相结合的高科技技术。数字测量技术既给人们带来机遇,又给技术人员带来挑战,但是其在发展中还存在很多问题。作为新时代的我们,应努力抓住机遇,勇敢的面对挑战,提高自身的知识储备量和技术,使自己能在快速发展的经济市场中站住脚步。

一、摄影测量发展现状

由于摄影测量生产的转型,影像扫描仪已被大量地应用,全国扫描仪数量已超过100台。同时航空摄影机(如RC30)也在加速引进。应用于航空摄影过程中的GPS/IMU系统也已引进,Z/I公司的数字航空摄影机DMC已开始在中国应用。与此同时,高分辨率的遥感影像以及其定位参数(RPC)文件的应用,只要极少量的外业控制点,就能迅速生成正射影像图,它已在城市、土地的变迁、规划中得到愈来愈广泛的应用。航空激光扫描Lidar也愈来愈成熟。

由于新一代传感器、定位系统的迅速发展与应用,以及数字摄影测量工作站的发展及其大规模的推广,这样对摄影测量自身发展提出一个非常严峻而又现实的问题:摄影测量向何处去,除了摄影测量与新一代遥感传感器、GIS、GPS 更进一步地结合外, 摄影测量自身从理论到实际将如何发展,还有没有发展前景,在国际上同样对摄影测量发展提出了疑虑,美国Ohio大学Schenk教授在其著作“数字摄影测量学”的序言中指出:摄影测量与猫一样,他们有一个共同的特点,他们都有几次生命,摄影测量的终结已经被多次预测。但是他对此问题作了明确的回答:数字摄影测量是一门相对年轻的、并且迅速发展的学科。它的许多基本概念与方法来自影像处理与计算机视觉。但是不管它们对它的影响有多强烈, 数字摄影测量还是一门有自己特色的学科。

二、数字摄影测量给学科带来的机遇与挑战

摄影测量与遥感是一门“从影像重建被摄物体表面”的学科,摄影测量侧重于重建物体的几何表面,并进行“量测”;而遥感则侧重于重建物体的物理表面,恢复问题表面的物理属性。因此,从本质而言, 摄影测量与遥感是研究影像的获取、理解、加工、处理的科学与技术,使人们更容易直观地理解与应用有关信息。从测绘学科的角度来理解,摄影测量是一门“量测的学科”,著名的摄影测量学者HeIva (1995)就认为“摄影测量的范畴是量测”;而从信息科学和计算机视觉科学来看,它是从影像来重建三维表面模型的科学与技术―计算机立体视觉。但是,人们一般并没有将摄影测量与计算机立体视觉联系在一起。这是由于摄影测量在上世纪摄影技术出现不久就被学者发现其测量功能,并被使用,而计算机立体视觉实在新世纪环境下创造并被使用的,因此摄影测量的历史要比计算机立体视觉的历史长得多,并早已成为测绘产业的重要组成部分;而且,长期以来,摄影测量是依赖于精密的光学机械仪器,特别是在模拟摄影测量时代, 摄影测量以模拟摄影测量仪器为代表, 与计算机没有任何联系。我们必须清楚地认识到,摄影测量发展到今天,已经超越了传统摄影测量的范畴,它已经不属于摄影测量工作者“独家所有”。这是摄影测量工作者面临的最严峻的挑战。

同时,数字摄影测量也为我们带来了发展机遇。在模拟摄影测量时代, 摄影测量的教学、科研以及生产的组织与流程,一切均以模拟摄影测量仪器的制造者为中心。摄影测量仪器的理论、结构,各种控制器、仪器的定向理论与操作方法,变换光束测图的理论等,均以相应的仪器为中心。进人了解析摄影测量时代,由于计算机引人了摄影测量,大大地拓宽了摄影测量教学、科研的领域,这也提供给学者们更多的研究方向。

三、数字近景摄影测量――摄影测量发展的崭新领域

到目前为止数字摄影测量的发展,无论在理论上还是在实际上,,主要还是围绕着利用航空(航天)摄影测量测绘地形图展开的,而对于数字近景(地面)摄影测量的研究甚少。同时随着数码相机的广泛应用,价格愈来愈低廉。数码相机在测量中的应用将是摄影测量发展的必然趋势。

在此领域数字近景摄影测量与计算机视觉有着天然的密切联系,因为计算机视觉的研究目标是使计算机具有通过2维图像认知3维环境信息的能力,这种能力将不仅使机器感知3维环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、存储, 识别与理解,两者之间有很多相似之处,但两者间又有明显的差异。不论差异大小,不可否认的是,数字近景摄影测量已成为数字摄影测量发展的必然趋势。

四、结束语

数字摄影测量在目前还是一个较为年轻的学科,主要采用计算机技术,将获取到到信息数字化,通过计算机进行测绘和分析,提取出对人们有用的信息,这一改变,使数字摄影测量很快被企业所接受并得到快速发展。总而言之,数字摄影测量技术的出现不能仅视为简单的科学进步而已,应该透过现象看本质,深刻认识到他已经从概念开始改变,并影响到科学研究领域,正在逐渐改变企业的生产产品水平。面对这些情况,我们应该努力提高自己的理论知识储备量,提升专业素养,及时抓住一闪而过的机会,迎接各种挑战,在激烈的竞争不断进步。

参考文献

[1] 李利,马颂德. 从2维轮廓线重构3维二次曲面形状[J].计算机学报,1996,19(6):401.

[2] 马颂德,张正友.计算机视觉-计算理论与算法基础[J].北京:科学出版社1998.

计算机视觉的基本概念范文第2篇

提起数字媒体,人们通常会想到传媒行业,其实数字媒体的应用绝不局限于传媒。随着宽带网络的普及,人们在日常业务处理过程中,正面对越来越丰富的网上媒体和内容,包括各种视频、音频、文本、图像等。下面,就让我们跟着诸位数字媒体方面的专家一起来分享这个缤纷的世界。

三维几何建模与形状表示

北京大学视觉与听觉信息处理国家重点实验室主任教育部长江学者奖励计划特聘教授 查红彬

精彩问答

在背景比较复杂、有干扰的情况下模型检索的效果怎么样?

在模型检索的时候并没有考虑背景,因为这是做模型检索比较容易的部分。模型检索一般是没有背景的,但也可以做,但是要推广到背景比较复杂的物体上识别可能有很大的问题,因为这时候匹配不仅仅是局部匹配,而是两个子集和子集的匹配问题,到目前为止,我们只是做没有背景的模型检索。

为什么要重新谈论三维形状表示问题?在多媒体信息处理领域里面,有两个比较重要的方向,这也是计算机科学技术领域里两个重要的方向,一个是计算机视觉,一个是计算机图形学。计算机视觉是从图像中通过识别或重建处理,得到一个对对象物的描述。反过来说图形学,是对一个对象和场景的描述,通过绘制和动画生成图像和视频。它们从处理过程来说是逆过程,这两个领域之间有密切的关联。

我们现在考虑计算机三维建模或模型的描述,考虑的不仅仅是计算机视觉或计算机图形学所包含的内容。这里面简单列举一下,比如基于模型的三维物体识别和场景识别,这两个应该是典型的计算机视觉里面考虑的应用。除了这以外还可以用模型干别的事情,比如绘制,还包括基于这样模型的设计、变形、动画等等。除了两个单独研究的应用之外,还要想怎么把两者结合起来,把虚拟和真实的东西无缝连接到一起,这些都牵涉到三维模型。

我们考虑的三维模型跟以前相比,应用领域大了很多,要达到这个要求,对模型的表达、形状的表达也都有了更高的要求。

怎样找到一些更新更有效地表达形式来符合这些要求呢?这里有四个方面,现在能不能建立一个形状空间,把考虑的对象完整地在形状空间里面表达出来。第二点就是针对形状的特性,表达要具有柔性,对象物的表面不都是连续的,也有一些非连续性和不规律性,这些特性怎样能够进行柔性处理。第三个是需要一些描述是局部性的,另外一些要求描述是整体性的,这两者之间如何有一个很好的结合方法。第四是在大量的计算当中,包括变形和动画中有很多编辑的工具,所以我们要求对现在的形状表达有一些比较高的要求。

在计算机视觉里面有一个老大难就是识别,已有模型,但是眼前看到的是一部分三维数据,怎么用这部分数据和模型数据匹配来识别它呢?这就牵涉到局部匹配,我们要解决局部匹配需要什么描述?我们要有一个模型,从大量的数据中建立一个模型库,并从中抽取很多特征,把这些特征进行组织。这里面牵涉三个比较大的问题,第一个是形状空间怎么构造,没有很好的特征表达或整理的形式,后面的匹配以及其他的工作就很难做。第二个是怎么定义基于这种特征的相似度。第三个是怎样在形状空间当中搜索到最优的匹配。

针对这些问题我们最近一两年做了一些工作,最近提出一个广义形状分布(Generalized Shape Distributions)描述方式,主要目的有两点,能不能在三维形状表示过程当中,找到一些最关键的描述指令,并从中找到相互关系,把整体和局部结合起来。如果把之间的关系描述出来,就能把局部结构性的信息用整体观点加进去,这两件工作就是我们做这件事情的主要目的。

在形状描述问题上,我们还有很多工作要做,除了局部、整体描述之外,我们要想办法把他们结合到一起。今后几年要用更多的模式识别的办法,来解决面临的图形学或虚拟现实和计算机视觉当中的很多问题。

生活中的计算机视觉

香港中文大学信息工程系终身教授

微软亚洲研究院视觉计算组负责人 汤晓欧

精彩问答

微软亚洲研究院视觉计算组在原创思想这一块,引领下一个方向有没有什么考虑,您谈到很多对人们日常生活影响很大的应用,但是在背后的更深层的考虑,更新的创意在哪里呢?

我们的研究者都很年轻,我本人也才工作七年的时间,很多的算法已经发展这么多年了,所以在开始的时候比较容易想出来的方法,现在已经很难有那么多的原创内容。我们的工作是去找一些非常原创的内容,有的是理论上的,有的是新的发明,这可以有很大的影响。

图像通过闪光灯的分割,前景和背景深度差会不会影响分割效果,距离会不会影响分割效果呢?

我们这个通过闪光灯对图像进行分割的技术,会一定程度上受到光的强度和距离的影响。

我们主要的研究领域包括计算机视觉、模式识别、图像处理和视频处理。下面就为大家介绍几个比较典型的应用。

如何将图片的前景和后景分离?我们现在照两张图片,一张打闪光灯,一张没有打闪光灯,这样拍出来的照片背景没有变化,但前景变化很厉害。在开闪光灯的情况下拍的照片,前景和后景可以利用一些技术很容易地分开来。

把一个图片的前景切割出来放入另一张图后,那剩下的图片缺一块的怎么办呢?如何修复剩下的图片呢?在例举的图片上,大家可以看到不同的区域,我们可以由一个算法,从其他的地方借过来,再贴上去,经过这样的处理后,图像基本上和原来没有太大的区别。

如此的修修补补又有什么用呢?比如说,你对这张图像不是很满意,你可以把图片上不喜欢的部分划出来,然后利用一些技术将划出来的空白部分填上。更有用的地方在于,你照了不想被别人看到的照片后,除了删除,你多了一个选择。你可以把不想让别人看到的照片部分去掉,并利用一些算法把空白的地方填补上,而且让别人看不出来。

现在大家的电脑上都会有很多照片,怎么快速地浏览这些照片呢?我们可以把这些图像都放在一个屏幕上,可屏幕毕竟有限,怎么才能把照片放得更多一些呢?我们现在做的是可以随机把照片放到桌面上,但是电脑会对每张照片上的重要信息进行筛选,在放尽可能多的照片的同时,让每张照片上最重要的信息不被遮掩,而且均匀地分布在桌面上。这样大家看起来就更清楚了。这个算法就是怎么让所有图像均匀分布,同时把所有背景都要盖上。我们可以对图像进行各种处理,同时我们也可以利用一些技术知道别人有没有处理图像,对图像有没有做过手脚。

现在我们来说说视频方面。比如说抖动很厉害的图像,怎么把物体移到中间?一个办法是把除移动图像外的公共部分切出来,但是移动越大,公共部分就会越来越小,更好的办法是用一些技术把空处填上。

现在MSN的功能已经越来越丰富。比如说一段电影,你看到一件比较中意的衣服,只要你把鼠标移动衣服的覆盖范围,你就能很清楚地知道这件衣服的品牌及价格。如果你把鼠标在那件衣服上轻点,电脑就会直接跳转到这个衣服的相关网站。

你在视频聊天的时候如果不想让对方看到你所处的环境,你就可以很轻松地把背景模糊掉。如果大家对自己的长相不是那么有信心,我们可以帮你改变一下你的长相。为自己添一幅酷酷的墨镜,换上一个性感的大嘴巴,这些都能轻而易举地完成。

多媒体传感器网络

北京邮电大学教授、博士生导师

智能通信软件与多媒体北京市重点实验室主任 马华东

传感器研究是IT非常热门的话题, 首先我为大家介绍一下多媒体传感器网络的基本概念。从早期的巨型机到今天的小型机,生物芯片尺寸越来越小,但是效率越来越高;网络设备联网和数据交换的需求越来越大,设备之间的传输量也越来越大;从信息处理的角度来看,内容逐渐占据了主导地位,由数据为中心转到以内容处理为中心。这三方面的演化是今天讨论多媒体传感器的背景。

传感器网络是一组传感器节点,由组织方式协作地感知采集和处理感知对象的信息,它的基本特点是造价低、能量敏感、通信能力有限、计算能力弱、动态变化。现在的需求是要求通信能力越来越强,计算能力应付节点的处理的要求。

右图是目前主流的传感器节点的配置,从配置来讲还是比较低的,现在信息处理侧重压力、温度、光、震动等简单的数据或者是标量数据。人类获取信息80%是视觉信息,10%左右是听觉信息,也就是说90%左右的信息是多媒体信息。传感器网络就是对音频、视频信息获取后提供给使用者,使其对环境信息有一个全方位的了解,对传感器网络的应用是非常广泛的。

从网络的结构来讲,基本结构和原来传感器网络差别不是很大,这里面强调增加音频、视频获取处理,网络传输整个过程的各个环节,同时这里面最好可以交互。有了这个概念以后,深入分析一下主要特点,首先是网络能力的增强,这样一个传感器网络应该集信息的采集、处理传输、转发、能量供应等方面,除了传统的标量数据,音频、视频的图像数据,都可以进行采集处理。

现在多媒体传感器网络目前有哪些问题呢?从需求来看,现在网络是异构的信息,媒体信息的格式,种类很多,并且差异非常大,数据量比较大,特别是音频、视频信息,格式比较复杂。这些信息传输过程中需要高速实时地传输,对网络传输速率也提出了比较高的要求。媒体信息的安全问题,也是网络需要考虑的,还有服务质量的问题。针对这些需求,我们可以看到,通信资源和计算资源这两者之间存在非常大的矛盾,或者非常大的鸿沟,如何解决这两者之间的差距就是我们研究的问题所在。

最后谈一下多媒体传感器网络研究的挑战,首先是节点的芯片设计,这是基础,这里面需要采用多种技术,包括软硬件协同设计的技术,各种技术结合,降低成本、能耗、体积、提高运算速度和可靠性。第二是三维场景的覆盖问题,方向性传感模型是一个简单的二维图形,实际上是三维图形监测,这是一个三维场景方向的问题,研究这个就复杂多了。还有一个问题是服务质量保证问题,在新的网络当中服务质量体系是什么样,也是研究的方向。再一个是信息处理,为了使网络传输数据量比较快,能不能在节点做信息处理的计算。当然信息的安全也比较重要,用这些节点获取多媒体信息怎么保证安全的质量,使应该看到的人看到这些信息,不应该看到的人看不到这些信息。

在多媒体传感器网络中,我们还是做了一些工作,和一些同行学者也有一些交流,这里面也有一些质疑,说多媒体传感网络和原来传感器网络设计初衷是不是吻合的,原来没有想让它处理这么多信息,原来体积比较小,加上这些信息以后,无疑使它的体积增大,这里面和初衷之间是不是有矛盾,传感器网络研究有没有必要性,如果有必要性可行不可行,这都是我们目前研究的问题。

计算机视觉的基本概念范文第3篇

关键词:可视化技术;图像理解

中图分类号:TP391.4

可视化技术是计算机图形学的一个重要研究方向,是图形科学的新领域。它是指是运用图形学原理和方法,将大规模的科学数据-数值和图像,转换为可视的图形和图。它能够给予人们深刻与意想不到的洞察力,在很多领域使科学家的研究方式发生了根本变化。它涉及的研究领域很广,成为计算机科学研究领域中不可缺少的组成部分,例如计算机图形学、图像处理、计算机视觉等,它也是理解复杂现象和大规模数据的重要工具。

自从1986年可视化概念提出以来,发达国家纷纷开始研究可视化理论、方法,开发可视化工具与环境,它们的研究成果已广泛应用于石油勘探、气象预报、航天航空、核武器研制、医学图像处理等科学与工程领域以及自然科学领域中。

90年代初,我国开始了科学计算可视化技术的研究工作,一般需要使用巨型计算机和高档图形工作站处理庞大的数据量以及相关复杂的图像生成算法。所以,在高水平的大学、大公司和国家级的研究中心才有实力对可视化技术进行研究和应用。近几年来,随着处理器功能的不断提高,可视化技术的飞速发展,它的应用已经扩展到科学研究、工程、军事、医学、经济等各个领域,但是,与国外先进水平还有差距,因此还需要在在医学、地质、海洋、气象、航空等行业加大应用力度。

1 可视化的基本概念

可视化是一种计算技术,它将符号转换成几何,使研究者能观察到他们的研究工作。可视化技术能够将看不见的事物通过计算机变为能够看见的事物,提供了科学发现和展现事物的新途径,改变了科学家原有的研究方式,能够给人们意想不到的启示。

根据可视化技术的交互性、多维性、和可视性的特点,以及考虑结合程度,可视化技术可以分为后置处理,实时跟踪处理和实时绘制及交互控制三个层次。后置处理指的是将计算结果解释或显示为可视化的图形,目前大部分应用软件属于这一层次;实时跟踪处理强调它的实时性,因此要求计算与显示必行同步进行,这样能够随时发现执行中的错误以便日后改正;实时绘制及交互控制一方面强调它的实时性,另外能够根据显示结果随时改变执行过程中的参数以便得到满意的结果,因此具有交互界面。近二十多年来,在美国、德国、日本等发达国家的著名大学都在致力于可视化技术的研究,而且已经重点向实时处理和交互控制方面发展。

2 国内外比较著名的研究成果

2.1 流体可视化软件

这是美国国家超级计算机应用中心(NCSA,National center of supercomputer Application)的研究成果。该软件通过多个相联系的模型,在交互及分布环境下研究暴风雨的形成规律。其中安装在NCSA的超级计算机CRAY-YMP进行模型计算,VGX工作站则用来实现二、三维图形显示,提供用户接口,二者之间使用网络连接。

2.2 医学可视化技术

医学数据的可视化,已成为数据可视化领域中最为活跃的研究领域之一。由于近代非侵入诊断技术如CT、MRI和正电子放射断层扫描(PET)的发展,医生已经可以非常容易获得病人有关部位的一组二维断层图像。因为核磁共振、CT扫描等设备能够产生人体病变区域的多个方面多个剖面的图像,或者重建为具有不同细节程度的三维真实图像,使医生对病灶部位的大小、位置,不仅有定性的认识,而且有定量的认识,从而及时高效地诊断疾病。CT图像打破传统的胶片感光成像模式,借助于计算机重构人体器官或组织的图像,使医学图像从二维走向三维,使人们从人体外部可以看到内部。利用可视化技术软件,能够重构有关器官和组织的三维图像,例如美国加洲的ADAC实验室,约翰.霍普金斯大学等开发出的软件已在许多医院得到应用。利用可视化技术可以以获得心脏的三维图像,并用于监控心脏的形状、大小和运动,为综合诊断提供依据,例如中国协和医科大学等进行的主动脉病变的临床诊断和冠状动脉搭桥术(CABG)后的血管显示等。正是应用了可视化技术,变不可见为可见,从而大大提高了手术的成功率。

耿国华教授实现了医学图象数据库系统MidBASE。在数据库设计、基于内容的图象检索、嵌入三维可视化构件、WEB方式远程查询等方面特色明显。已在多个医院使用,效果良好[1]。

2.3 地学可视化技术

科学可视化应用到地学中,产生了地学可视化。1990年的勘探地球物理学家协会的举办“科学可视化”专题讨论会,促进了地球物理勘探中的可视化研究。进而在1995年举办的“可视化技术用于发现和开发更多的油气资源”会议,使得科学可视化技术在油气工业中的应用成果大放光彩。目前,美国的SGI公司在可视化技术方面是处于世界领先地位,它在地学中主要应用于油田开发、油藏数值模拟、石油地质、地震勘探、钻井、测井、遥感测绘等方面。

2.4 人类胚胎的可视化

这是美国依利诺大学芝加哥分校研制的成果。首先依据美国卫生和医学国家博物馆所得到的胚胎数据重构人类胚胎模型,其次将该模型进行三维显示。这一成果预示着人类可以远程访问人类性态数据,可以进行分布式计算。

2.5 数字博物馆的可视化技术

数字博物馆最突出的特点是:虚拟现实技术。虚拟技术通过计算机图形构成三度空间或把现实环境编制到计算机中去,产生逼真的虚拟环境,从而使得用户在视觉上产生一种沉浸于虚拟环境中的感觉。数字博物馆借助这样的技术,对珍贵藏品进行三维可视化的建模。在追求视觉真实感受的同时,最大限度地保存了物体真实数据。研究者可以直接测量模型得到标本的形态结构信息,为远程标本研究提供可靠翔实的基础,真正地做到了辅助科学研究及数据保存的作用。例如中国地质大学地学数字博物馆、中山大学生物数字博物馆、清华大学美术数字博物馆、西北大学考古数字博物馆、北京航空航天大学航空航天数字博物馆等,这些数字博物馆不仅为学者提供了一个高水平高质量的学习平台,有利于院校之间的学术信息和研究资源的共享,而且满足用户的交互性、参与性和沉浸性。

2.6 大场景及文物的虚拟修复可视化技术

大场景与文物虚拟修复还原和展示的研究涉及多个研究领域,需要综合应用数字图象处理、计算机图形学、模式识别、可视化技术等研究领域。目前,在我国很多研究机构已在与大场景和文物的虚拟修复技术相关的领域内进行了一些研究工作,也取得了一些研究成果。但是,还没有研制出完全自动的虚拟修复和还原系统,并且这些研究成果相对独立,没有一个综合文物复原和大场景虚拟还原展示的系统。

3 结束语

NCSA(美国国家超级计算应用中心)是国际上从事可视化研究的权威单位,一直从事可视化算法如软件的开发研究。而在国内,清华、北大、国防科大、中科院软件所等单位相继开展了可视化算法的研究及可视化工具的开发,都已取得了一大批可喜的成果。随着计算机硬件条件的改善和诸如人工智能、机器学习等可视化算法的成熟,可视化技术一定会产生一个大的飞跃。

参考文献:

[1]荣国栋,孟祥旭.Inspeck3D-DF三维扫描仪在数字博物馆中的应用[J].计算机工程与应用,2002,38(16):237-239.

计算机视觉的基本概念范文第4篇

关键词:计算机图形学;教学效果;教学方法;学习方法

中图分类号:TP3 文献标识码:A

文章编号:1009-0118(2012)05-0129-02

一、引言

“计算机图形学”是计算机专业教学中的一门重要的专业基础课程,它的后续课程有:图像处理、多媒体技术、模式识别、计算机视觉以及虚拟现实等,在计算机专业的教学过程中占有很重要地位。“计算机图形学”课程最大特点是理论与实践结合较强,传统的教学模式很难满足这个要求,严重影响到课程的教学质量和教学效果。因此,“计算机图形学”课程的教学改革势在必行。

二、分析教学中存在的问题

“计算机图形学”主要研究与计算机图形表示、图形计算、图形处理和图形显示的相关原理与算法,它的内容丰富,涉及了数学、物理学、计算机科学、美学、心理学及艺术学等诸多方面的知识,具有很强的理论性、实践性和综合性。

在几届的课程教学中,作者先后使用偏理论教学和偏实践教学,都没能取得很好的效果。目前国内高校对这门课程的讲授常使用这两种方法。偏理论的教学过于强调理论知识(相关的数学基础知识、算法的推导、程序的实现),学生很难理解和掌握,普遍反映:“上课听得懂,下课再问就不知道了”,学习态度从困惑变成厌倦,因为学生不知道这些知识有什么用。偏实践教学则是从实用角度出发,理论知识涉及得少且浅显。学生兴趣提升了却没有抓住课程的本质,错误的认为计算机图形学就是图片处理和动画制作。总结上述两种教学方法存在以下几个方面问题:

(一)知识点的混淆。由于本课程所学的内容多,学生在学习过程中没有清晰的知识框架和整体思路。知识越学越多、越学越乱。例如,在实际教学过程中,几种扫描转换算法讲授后,有些学生已区分不出各种算法所解决的问题。

(二)内容知其然不知其所以然。计算机图形学涵盖许多原理、算法、程序,这些内容都不容易理解和掌握,大部分学生不感兴趣。这就与他们原本对这门课程的理解有偏差,所以感觉很盲目,没有学习目标,最终丧失学习兴趣和热情。

(三)实践环节得不到应有效果。学生在有限的时间内很难完成对分析能力和编程能力要求很高的实验任务,进一步加深对该课程的排斥。

针对以上出现的问题,在有限的学时内,如何使学生系统地掌握计算机图形学的基础知识、重要的基础理论和生成图形的常用方法,值得深入的探讨。

三、课程教与学的改进

教学方法包含教师的教授方法和学生的学习方法。计算机图形学的教与学都应把握课程的整体结构和发展方向,强调理论学习与实践应用的结合。使学生在深刻理解图形学本质的同时,建立起这门学科的整体框架,为后续课程打基础。

(一)教师的教授方法

教师在学习过程中起着指导和协助作用。如何在课程的基本原理和基本技能传授给学生后,引导学生将所学的知识应用到实践中,去发现图形图像及其相关领域的问题;激励学生积极地分析和解决问题。

1、兴趣培养。古人云:“知之者不如好之者,好之者不如乐之者”,让学生了解计算机图形学与自己的生活、工作、学习密切相关,兴趣就会油然而生。例如,从学生比较熟悉或推崇的某游戏或软件开始,介绍支撑该产品的计算机图形学基本知识和理论;或者展示计算机图形学在计算机动画、科学计算可视化、计算机艺术、多媒体应用等应用领域的最新研究成果和发展趋势。使学生萌生求知欲望,这是非常关键的一步。

2、合理安排。计算机图形学课程内容涉及图形显示处理流程、图形硬件设备、图形系统、二和三维图形的生成和处理算法、裁剪、几何变换、交互技术、三维消隐等方面,每一项内容又包含很多的技术、方法以及经典算法思路。教师不可能在有限的学时数内每个知识点逐个展开讲解,那样也不利于学生对知识的学习和掌握。怎样给学生展现一个清晰的计算机图形学课程内容脉络和整体框架呢?结合学生的认知能力,选择有代表性的讲授,强调基本概念、基本原理、经典算法(如Sutherland-Cohen算法、Bresenham算法、Z缓冲器算法、光线跟踪算法等),做到突出重点、点面结合。例如,圆、椭圆的扫描转换的内容完全可在讲授直线段扫描转换算法后安排学生自学,因为它们的基本思想是相同的。这样,可以用节省的时间传授学生最大量的新知识,同时可以培养学生的自学能力。

3、形式多样。俗话说“一幅画胜过千言万语”,传统的黑板讲解结合生动有趣的多媒体教学,用flash、OpenGL等工具把复杂枯燥的数学推导和算法描述做成动画演示,使复杂问题简单化,抽象问题具体化。例如,Bezier曲线,B样条曲线,NURBS曲线曲面,数学公式抽象难懂,计算量大,学生普遍难以理解。使用OpenGL(OpenGL提供了近350个不同的调用函数,用来绘制复杂的三维景象)制作出他们的三维模型,动态演示算法执行过程,抽象的理论与具体的实物对照,从而加深理解。

4、注重实践。培养学生技术应用能力靠上机实验,合理安排实验课程是关键。学生要在边做边学、边学边做中加深对理论知识的认识和理解。教师结合学生的动手能力,制订切实可行的实验设计方案。

(二)学生的学习方法

学生要熟练掌握计算机图形学课程的知识精髓,课堂学习是远远不够的。要积极主动成为学习的主体,本文提出了几点建议供学生参考。教师也可以根据自身教学的实际情况借鉴使用。

1、扎实的数学基础、很强的编程能力这是学好该门课程的必要条件。例如,连续、一阶连续、二阶连续、曲率、绕率、参数表示、矢量、法向量、矩阵、矩阵运算等,都是计算机图形学中常用到的基础知识。这些都需要学生课前熟练掌握。

2、充分利用网络,开阔眼界。关注计算机图形及其相关学科领域的发展动向;基础算法产生背景、算法的应用领域、相关的学术报告和会议文献等,进而扩展知识的深度和广度。这不仅限于学好这门课程,其它课程也是适用的。

3、理顺计算机图形学课程的学习内容和整体架构,将每个知识点用知识树的形式串联在一起。如果一个问题有多种解决方法,可以采用对比的学习方法,将所学的原理、算法、程序进行比较,找出它们之间的区别与联系。例如:Bezier、B样条、NURBS曲线曲面间的比较,CSG树、边界表示法、八叉树表示等实体造型技术的比较等。

4、认真做好每次上机实验。运用学到的知识,发现问题、分析问题、解决问题,提高动手能力,这是学习的最终目的。

四、结合语

计算机图形学是一门实用较强的综合学科。在了解和掌握现有的和前人积累的知识同时,更重要的是知识的模仿和继承,突出探求知识能力和创新意识的培养。经过几年的教学探索和研究,上述的教学改革可以达到很好的教学效果。

参考文献:

\[1\]龚绍文.大学青年教师教学入门—大学施教学初步\[M\].北京:北京理工大学出版社,2007.

\[2\]潘革生.高等学校计算机图形学教学理念探讨\[J\].广西科学院学报,2008,24(4):380-383.

\[3\]孙家广.计算机图形学\[M\].3版.北京:清华大学出版社,1999.

计算机视觉的基本概念范文第5篇

关键词:小波;图像压缩;图像去噪

Abstract: the article introduces the image wavelet analysis of the basic theory and based on the wavelet transform of decomposition and reconstruction principle, by using wavelet transform to 2 d image decomposition, the original image into different direction and different frequency component of the sub image. At the same time to contain the noise image wavelet decomposition, and then selecting proper threshold, the wavelet coefficients of the quantitative threshold value, and then a high frequency coefficients reconstruction, realize image denoising. Finally using MATLAB simulation platform is simulated, the simulation results show that, using the wavelet analysis to do image compression and denoising can get very good compression effect and denoising effect, and the engineering application of practical significance.

Keywords: small wave. Image compression; Image denoising

1 引言

小波分析是当前应用数学和工程学科中一个迅速发展的新领域。小波就是小的波形,“小”指它具有衰减性;“波”则指它的波动性[1]。小波分析已在信号处理、语音合成、图像识别、计算机视觉、数据压缩等诸多领域得到应用。

长期以来,人们主要利用离散余弦变换DCT(Discrete Cosine Transform)作为主要的图像压缩编码方法,并成功地应用于各种标准,如JPEG,MPEG-1,MPEG-2。但是,基于DCT的图像变换编码容易出现方块效应与蚊式噪声。基于小波变换的图像压缩编码很好的解决了这一问题,小波变换是全局变换,在时域和频域都具有良好的局部化性能。

由于小波变换是一种信号的时频分析,它具有多分辨率的特点,可以方便地从混有强噪声的信号中提取原始信号,被誉为分析信号的显微镜。目前主要从变换方法上进行研究,通过选择不同的基函数或利用框架来进行变换(非抽取小波变换)或通过选取最优基来进行变换(小波包,多小波),在图像处理方面得到了更好的去噪效果。

文章首先介绍小波的相关基本概念;然后对其在图像处理中的压缩与去噪进行分析,运用MATLAB仿真平台进行了仿真验证,借助仿真结果直观展示小波在图像处理中的强大功能。

2 小波分析的基本理论

小波是一个满足条件的函数通过平移和伸缩而产生的一族函数如公式(1)所示:

,, (1)

公式(1)定义的小波称为小波基函数或母函数,式中b为平移的距离,a为伸缩的尺度[2]。如果任意的一个函数f作周期延伸,则可以成为上有意义的函数。即若满足:

(2)

则每个函数f均属于一个平方可积的函数,也可写作,R为实数构成的空间。对于任意的一个函数,为在R上平方可积;且基本小波,那么f的连续小波变换可定义为[2]:

(3)

其中表示小波基的共轭函数。

对任意的及,若f(t)在t处连续,则可以由小波变换得到其逆变换为[2]: (4)

对于的一个二维信号, 用表示其小波基函数,表示的尺度伸缩及二维移位,即:

(5) 则二维连续小波变换为[3]:

(6)

小波逆变换为:

(7)

其中 (8)

在实际图像处理中,需要把连续小波及小波变换离散化才有意义。对连续型的小波进行离散化后的小波及相应得小波变换,称为离散化小波。

3基于小波变换的分解与重构

实际中由于人的感觉器官和仪器对信号有着一定的分辨率,所以对于信号的认识是在一定尺度上进行的,对低于一定尺度的信号的细节是无法认识的。进行小波分解的意义就是要在不同的尺度上根据不同的目的,选择不同的尺度对信号进行分解。

对于大多数信号,其低频分量相当重要,它常包含着信号的特征;而高频分量则给出信号的细节或差别。在小波分析中,用近似来表示信号的低频分量;而用细节来表示信号的高频分量。通过计算离散小波变换的系数可以得到原始信号的近似与细节。

图1显示了对原始信号进行分解的过程。 通过分解可以将信号分解成许多低分辨率的成分。

图1 小波分解的结构图

这样就可以将原始信号S表示为经分解后的各层近似信号与细节信号的和,来实现对原始信号的重构。如图1所示的信号可表示为S=A1+B1=A2+B2+B1=A3+B3+B2+B1。实际中常根据信号的特征或是适当的标准来选择合适的分解层数。

4利用小波分析进行图像的压缩与去噪

4.1 图像的压缩

对于图像来说,为实现快速或实时传输以及大量存储,就需要对图像数据进行压缩。从而可在同等通信容量下,传输更多的图像信息,也就可以增加通信能力。

一种可进行压缩的基于离散余弦变换的图像压缩,就是在频域对信号进行分解,去除信号点之间的相关性,并找出重要系数,滤除次要系数,以达到压缩的效果。但该方法的缺点是在处理过程中不能提供时域的信息[4]。在这个方面,小波分析就具有其优越性。由于小波分析固有的时频特性,可以在时频两个方向对系数进行处理,这样就可以对感兴趣的部分提供不同的压缩精度。

图像压缩的主要参数之一是图像压缩比,它定义为压缩后的图像数据量与压缩前的图像数据量的之比。压缩比越好,压缩后的图像文件数据量越小,但同时图像质量有可能损失会越多。对于二维图像进行小波变换就是模拟人类视觉进行的图像分解,将原始图像分解成不同方向、不同频率成份的子图像。由于人眼对低频失真较为敏感,而对高频失真不甚敏感。因此,在实际处理中,可以根据人的视觉敏感程度对低频高度子图像和高频细节子图像分别采用不同的量化、编码方法,以确保在失真较小的情况下得到最高的压缩比[5]。

4.2 图像的去噪

噪声可以理解为妨碍人的视觉器官或是造成系统传感器对所接收图像源进行理解或分析时出现了偏差。一般情况下噪声是不可预测的随机信号, 它只能用概率统计的方法去认识。噪声对图像处理十分重要, 它可以影响到图像处理的输入、采集和处理的各个环节以及输出结果的全过程。

传统的去噪方法是将噪声污染的图像信号通过一个滤波器, 滤掉噪声频率成分。但对于短时瞬态信号、非平稳过程信号、含宽带噪声信号, 若采用传统方法处理则有着明显的局限性。基于小波分析的图像去噪可以充分对小波进行时频局部的分析, 灵活地进行奇异特征值的提取,及时变换滤波, 在低信噪比的情况下进行有效滤波并检测信号的波形特征[5]。

利用小波分析去噪的基本步骤如下:

(1)选择合适的小波基函数, 对含有噪声的原始信号进行小波变换;

(2)利用软阈值或硬阈值门限处理相应的小波系数, 获得新的被压缩的小波系数;

(3)通过小波逆变换, 获得去噪后的信号。

其中对于小波基的选取至关重要。小波基的选取主要考虑以下几个因素[6]:①正交性:能有效去除信号的相关性;②支撑集性:避免滤波过程的截断误差, 保证优良的空间局部性质;③对称性:可使量化误差较小, 保证小波的滤波特性有线性相移, 不会造成信号失真;④正则性:用来度量小波函数的光滑性, 对最小量化误差起重要作用。 但是,小波基的选取没有统一的依据, 一般而言, 所选择的小波基应与原信号有较大的相似度。

5仿真及结果分析

本次仿真是以matlab7.0作为平台,借助matlab所提供的小波分析工具箱,对图像的压缩及去噪进行仿真。使用wavedec2和appcoef2函数进行两层二维小波分解和获取小波分解的近似分量;并且使用detcoef2函数来获取两层二维小波分解的细节分量,最后使用wrcoef2函数对各层的分量进行重构。由于Daubechies(dbN)小波不仅具有是连续性和正交性, 而且是紧支集最小的小波。因此这种小波的滤波器系数个数少, 在分解与重构算法中所需的计算量少[6]。所以,本次仿真采用Daubechies小波系中的db4小波作为小波基函数,选取matlab中自带的 trees.tif图,如图2所示,对其进行二层分解后重构。图3显示了进行二层分解后重构的图像。

图2 原始的图像

图3 两层分解重构的图像

将一个图像进行小波分解后,可得到一系列不同分辨率的子图像,不同分辨率的子图像对应不同的频率。对于一个图像而言,表现一个图像最主要的部分是低频部分,所以压缩的方法就是进行小波分解,去掉图像的高频部分而只保留低频部分。图4对比显示了原始图像和进行压缩后的图像。表1显示了进行两次压缩前后数据量所占空间大小的变化。

图4 原始图像和压缩后的图像

从表1可以看出经过第一次压缩后的压缩比约为1/4,再经过第二次压缩后压缩比为1/14,二次压缩后数据量明显减少,但图像的显示效果较第一次的要差,但总体上仍可显示出原始图像的整体外观。一般要在压缩比和图像质量效果之间进行折衷,以获得良好的图像质量和较低的压缩比。

仿真还可以通过函数ddencmp和wdencmp来进行图像的压缩,并且获取小波分解系数中置0的系数所占百分比以及压缩后图像剩余能量百分比。仿真中仍然采用db4小波。运行后在命令窗口中输入perf0,perfl2可分别得到小波分解系数中置0的系数所占百分比为46.9243,压缩后图像剩余能量百分比99.9786。由此可知,压缩后的图像保留了原始图像47%的系数,但却保留了99.9%以上的能量,取得了很好的压缩效果。

图5显示了利用小波进行图像去噪的过程。仿真中采用ddencmp函数获取去噪的默认阈值,然后用wdencmp函数对小波进行去噪处理,这里选用软阈值,保留近似分量,仍然采用db4小波。从图中可以看出,利用小波进行去噪后,可有效地恢复原始图像。

图5 小波图像的去噪

由以上仿真可以看出,小波分析在图像数据压缩和去噪方面显示出了非常好的效果.小波分析还可以研究不规则图形和混沌运动,弱信号检测,奇异特征值得提取等,并且还应用于数学、计算机、地信和医学等诸多学科,越来越成为一种广泛使用的分析工具。

参考文献

[1] 钟诚. 小波变换及其应用研究[J]. 中国科技信息. 2008, 2: 70-71

[2] 彭玉华. 小波变换与工程应用[M]. 北京: 科学出版社, 1999: 13-20

[3] 章为川, 戴如意. 基于小波的图像去噪及压缩[J]. 电脑知识与技术. 2007, 13: 184-185, 207

[4] 杨先麟, 朱艳芹. 小波分析在图像处理中的应用[J]. 国外电子测量技术. 2007, 26(6): 19-22

[5] 王树亮,任灵萍,郑成增.基于小波变换的图像压缩方法[J].计算机工程与应用, 2004, 40(10): 68-70

[6] 魏宝琴,李白萍. 最优小波基的选取原则[J]. 甘肃科技. 2007, 23(10)