首页 > 文章中心 > it技术

it技术

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇it技术范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

it技术

it技术范文第1篇

[关键词] IPTV互联网数字电视

IPTV(又称网络电视)通常是指通过IP网络传送电视节目的技术。近年来,IPTV已成为业界的热门话题之一。因为它是继互联网、移动电话和数字电视之后出现的又一种新的通信技术,是人们进行信息交流的一种新形式。IPTV业务的开展将会使人们的生活方式发生新的革命性变化,并有可能成为电信、广播电视、互联网和IT制造等行业的新的业务增长点。

一、IPTV的组成与特点

IPTV系统总体上可划分为三个部分:发送部分、传输部分和接收部分。每一部分都由一些专用设备组成,完成相应的功能,以保证系统的顺利运行。

发送部分完成电视节目的录制、编辑、存储、检索和发送等工作,并将传统的视听内容转换成能在IP网络上传输的数字信号。主要设备有摄影机、照相机、录音机、节目编辑器、编码器、存储器和播放器等。

传输部分负责把上个环节送出的节目内容高质量的传送到用户接收端。主要设备有IP视频服务器、路由器、存储阵列、交换机、以TCP/IP为主要协议的宽带骨干网、城域网和接入网等。

接收部分负责识别、接收传送部分送来的信息,并将其转换成人们能够直接识别的视听内容。接收部分主要有三种形式:机顶盒(STB)+电视机、PC机和电视手机。

IPTV不同于普通电视。普通电视只能按电视台节目播出表选择收看,如果错过了播出时间,你就无法收看所喜欢的节目。IPTV既可像普通电视一样按电视台播出时间表收看,也可不受电视台播出时间表的限制,通过点播随时看到你所喜欢的内容,还可以像互联网用户一样上网浏览、冲浪、聊天、博客,而且还可以打IP电话。

IPTV也不同于目前的互联网。目前互联网用户虽然也能收看音视频节目,但其内容远不及电视节目丰富,效果也没有普通电视节目好。借助IPTV,用户可以看到内容和普通电视节目一样丰富、效果与普通电视一样逼真的节目。

二、IPTV的运营模式

自从英国Video Network公司于1999年率先推出IPTV业务以来,国外已有30多家电信运营商进入了IPTV市场。2005年,我国有关部门也在上海、杭州和哈尔滨等地进行了IPTV运营实验,拉开了我国IPTV商用化的序幕。综观各大运营商的IPTV实验网络,IPTV的运营模式主要有以下几种:

1.在电信网基础上开展IPTV业务。英国、法国、意大利、奥地利、比利时等许多欧洲国家的电信运营商和美国的RBOC公司都进行了这种运营模式的实验。2005年,我国上海大宁多媒体谷宽带网络发展有限公司也在上海闸北大宁小区开通了“互动电视示范区”,其技术基础就是对现有的电话网进行改造,使其带宽增加到上网2M、互动电视4M。这种模式的优点是网络改造费用较低,缺点是网络带宽有限,收视效果欠佳,IPTV运营商缺少广播电视行业等节目内容提供商的支持,节目内容不够丰富。

2.在数字电视网基础上开展IPTV业务。传统的有线电视网络大都是树型结构的单向混合光纤同轴电缆(HFC)网,在这个网络中用户只能被动收看电视台播放的节目。随着数字电视技术的推广,国内外不少电视运营商对传统的有线电视网进行了双向改造,在推广数字电视的同时推出了时移电视和视频点播(VOD)等交互。2005年9月,我国杭州网通与广电在当地政府的协调下在数字电视网基础上开展了IPTV业务的实验,数字电视用户每月收费14元,如果需要使用IPTV业务再加35元。这种模式的优点是节目资源丰富,网络带宽充足,但由于我国有线电视还没有实现全国联网,数字电视技术标准中也没有考虑IPTV业务,数字电视用户如果需要IPTV业务除了安装数字电视机顶盒以外还要安装IPTV机顶盒,对此用户难以接受,从而会影响IPTV业务的推广。

3.在互联网基础上开展IPTV业务。互联网覆盖范围广、用户多,具有很好的互通性和交互性,是开展IPTV业务的良好平台。但由于目前互联网的传输带宽、流量控制和服务质量保障(QoS)等还远远不能满足开展IPTV业务的要求,需要逐步进行改造。另外,由于互联网的开放性,也给网络的监管带来了一定困难,使网上传播内容的健康性难以得到保障。

4.采用新的网络架构开展IPTV业务。2005年,上海宽带技术及应用工程研究中心在上海市开通了“长三角高性能宽带信息示范网工程”,它是采用新的网络架构新建的一个与电信骨干网相连的光纤城域网,可为网内用户提供高达46M以上的独享带宽,为开展IPTV业务奠定了基础。显然,这种模式技术先进,带宽充足,但初期投入很大,原有网络不能充分利用,造成很大的资金浪费,另外,由于受城市地下管线数量的制约,在有些地区也没法推广。

5.在网络融合的基础上开展IPTV业务。综上所述,在任何单一网络基础上开展IPTV业务都存在一些固有的弊端。可见,要想推动IPTV业务健康有序的发展,必须实现宽带电信网、数字电视网和下一代互联网的融合,实行资源整合,协同发展。目前,我国大部分网络都无法完全胜任IPTV业务的大规模发展,任何一个部门或行业都无法独占IPTV业务的市场,也无法阻挡其他运营商开展IPTV业务的进程。因此,无论是网络提供商还是内容提供商,也无论是设备制造商还是软件开发商,在开展IPTV业务的过程中都要转变观念、从长计议、通力合作,以实现多方共赢。香港、浦东和哈尔滨等地的经验也充分说明了这一点。

三、IPTV面临的问题

1.政策问题。在我国,IPTV 业务的开展涉及到信息产业部和广电总局分别管辖的电信和广电两个不同行业。信息产业部和广电总局都有权对IPTV 业务中的不同部分进行监管,但到底由谁来主导IPTV业务宏观发展的政策,却一直是一个争论不休的话题。目前,虽然广电总局拥有发放IPTV 牌照的审批权,但由于电信和广电分别从属于不同的行业管理部门,行业之间的利益之争使行业间的政策协调短期内还不会有明确的结果。即使在同一行业内部,也依然存在着政策不够统一的问题。

2004 年10 月, 广电总局颁布的《互联网等信息网络传播视听节目管理办法》中明确规定,电信企业只能开展基于PC的IPTV 业务, 不能经营“ 机顶盒(STB)+电视机”的业务。上海文广集团虽然获得了广电总局“开办以电视机、手机设备为接收终端的视听节目传播业务”的许可,但却无权开展基于PC 的IPTV 业务。2005年12 月26 日,还发生了泉州广播电视局公开叫停上海文广集团在当地开展IPTV 业务的事件。

种种迹象表明,如果不出台明确的相关政策,任凭这种混乱的局面发展下去,将会使整个IPTV 业务的发展进入一种进退两难的境地。

2.市场问题。要建立并不断扩大IPTV市场,就必须有吸引用户的节目内容、合理的使用价格和灵活的营销方式。

IPTV不单纯是节目点播, 它具有互动性的和可在线参与的特点。因此,要吸引更多的用户使用IPTV 业务就得提供比普通电视更有特色的节目内容。从目前各IPTV 运营商提供给用户的节目内容来看, 基本上还都是简单地将各电视台和电视节目制作机构为普通电视频道制作的节目放到网上进行实时直播或供用户点播,专门为IPTV 播放制作的具有较强互动性的节目内容还十分匮乏,这就很难保证IPTV对用户有足够的吸引力。

人们的消费能力都有一定限度。作为消费者来说,希望不花钱或少花钱就能享受到满意的服务。但对IPTV 业务运营商来说,过低的使用费会没法支撑该业务的良性发展。当前,我国有线电视使用费每月只有十几元,数字电视用户的使用费也比IPTV低。因此,IPTV 要占领市场, 其使用价格就要控制在一个合理的范围内。另外,在网络开通过程中,机顶盒也是一笔不小的开支,如果完全由运营商免费赠送的话,长期下去运营商将很难承担相关成本;但是,如果一开始就向用户收取这笔设备费的话,会大大提高进入IPTV业务的门槛。因此,如果不能很好地解决使用价格问题,IPTV 的发展将会受到很大制约。

在营销方式上,IPTV 目前采用的是“最低使用费+收费电视+增值业务”的单一模式。这种方式没有区别不同用户之间的差异。从长远看,IPTV用户会涵盖社会的各个层面。因此,如何针对不同的用户群体采取不同的营销方式也是需要迫切解决的问题。

3.技术问题。从目前IPTV业务的试运营情况看,主要有以下几个方面的技术问题需要解决:

(1)视频编码技术:目前,IPTV 业务中使用的视频编码技术主要有H.264、MPEG2和MPEG4,虽然这些技术已成为国际标准,但我们如果采用将会面临交付昂贵的专利费问题;AVS虽然是我国自主研发的IPTV视频编码技术,但还没有被列为国际标准,有些技术还有待进一步验证与完善,对此许多设备制造商还在观望。

(2)内容存储技术:存储设备的成本在整个IPTV 系统中占相当大的比重。目前运营商多利用现有的本地存储设备来满足IPTV 业务的需要,但随着存储内容的快速增长会迅速消耗掉这些资源,迫切需要行之有效的解决方案。

(3)网络传输技术:现有的网络都是根据自身业务特点设计的。电信运营商的IP网络适合交互型业务的开展,但对实时和单向大流量业务的支持能力有限。广电系统的HFC(混合光纤同轴电缆)网本质上是一种单向网络,要实现交互则需要双向改造。另外,现有网络的带宽,特别是城域网和接入网的带宽也无法满足多媒体业务的大规模开展,无法承载大量的高带宽需求的用户,更无法提供足够的服务质量保证。同时,现有网络的路由设备普遍缺乏对组播技术的支持,因此,在开展IPTV业务时需要重新改造。

(4)多媒体终端技术:目前,IPTV 终端的最终功能和结构形式还没有最后确定,设备制造商不敢投入过多的资金和人力进行研发,更无法形成生产规模。

(5)技术标准问题:由于缺乏统一的技术标准,使各设备制造商提供的设备在通信协议和编码格式等方面缺乏应有的互通性,网间内容难以平滑传输,从而会增加网络建设与运营的成本。

四、结束语

IPTV是一种新的综合型多媒体业务,具有良好的市场前景。虽然IPTV业务在发展中遇到了这样那样的问题,但这并不能掩盖其发展的巨大潜力。我们要抱着积极的态度,从平等互利、共同发展的愿望出发,通力合作、携手共进,尽快出台相关政策和技术标准,组织技术攻关,促进IPTV业务快速有序的健康发展。

参考文献:

[1]何宝宏:IPTV技术与标准问题探讨[J].世界电信,2006,2

[2]汪卫国:全球IPTV业务发展分析[J].世界电信,2006,2

[3]俞义方:IPTV的商业模式、运营模式及业务发展[J].中兴通讯技术,2006,3

it技术范文第2篇

IPTV即交互式网络电视,利用宽带网的基础设施,以家用电视机或电脑作为主要终端设备,集互联网、多媒体、通信等多种技术于一体,通过互联网络协议(IP)向家庭用户提供包括数字电视在内的多种交互式数字媒体服务的崭新技术。

IPTV与传统TV节目的最大区别在于“交互性”和“实时性”,实现的是无论何时地都能“按需收看”的交互网络视频业务。对于“IPTV”的理解,也有两种观点:(1)“IPTV=IP+TV”模式,即在这种实现方式中,IP业务和TV业务在CABLE中是完全独立并行的。(2)“IPTV=TV over IP”模式,即包括TV在内的所有业务都承载在IP之上。

IPTV有两个基本特点:基于IP技术和个性化的按需服务,与传统电视相比其最大的特点是交互性和实时性。用户可按需获取宽带IP网提供的媒体节目,实现实质性互动。其次,IPTV借助先进高效(768kb/s时接近DVD水平)的视频压缩技术(MPEG-4、H.264等),为用户提供高质量的数字媒体信息服务。此外,IPTV还可以为用户提供包括数字电视节目、可视电话、VOD、网络游戏、网上购物和远程教育等在内的交互式多媒体信息服务。

二、IPTV的物理结构

从物理结构上看IPTV系统分为三个子系统:网络系统(业务传送平台)、服务端系统(包括节目源、业务平台)、用户端系统组成。

(1)节目(内容)源。节目源是各类媒体信息及视频服务商提供的各类节目。(2)业务平台。对内容继续编辑集成,面向用户提供IPTV业务的平台。(3)内容分发网络。IPTV业务具有个性化、交互性特点,点播类IPTV业务必须采用内容分发网(CDN/VDN)技术,需要在互联网基础网络之上叠加构建一个专用的内容分发网(CDN/VDN)。(4)用户端。用户端设备的主要功能是接收和处理媒体流,向用户呈现媒体流。IPTV终端分为PC电脑、IPTV机顶盒+电视机、手机三种平台。

三、IPTV主要技术

IPTV技术主要包括音视频编解码技术、流媒体传送技术、宽带接入网络技术、IP机顶盒技术。(1)音视频编解码技术。IPTV音视频编解码技术在整个系统中处于重要地位,IPTV作为IP网络上的视频应用,对音视频编解码有很高的要求。目前主流的视频编码格式有以下几种:MPEG-2、MPEG-4、H.264/AVC、微软的WMV-9、Real公司的视频格式,前三者为公开的国际标准,后两者为企业的私有标准。(2)音视频服务器。音视频服务器是一种对视音频数据进行压缩、存储及处理的专用计算设备,它在广告插播、多通道循环垫播、延时插出、硬盘播出及视频节目点播等方面都有广泛的应用。(3)IP单播和组播技术。单播主要完成数据从一方传送到另一方的任务,传送数据时必须在发送方和接收方之间建立通道,网络软件中的单播方式多以TCP的连接方式工作。组播是一种允许一个或多个发送者(组播源)发送单一的数据包到多个接收者的网络技术。(4)IP QoS技术。不同的业务对网络的要求是不同的,如何在分组化的IP网络实现多种实时和非实时业务成为一个重要话题,人们提出了QoS的概念。(5)数字版权管理(DRM)技术。数字版权管理是随着电子音视频节目在互联网上的广泛传播而发展起来的一种新技术。首先在互联网上音视频节目的传播上得到应用,并逐步应用到其他业务领域。(6)宽带接入网络技术。IPTV接入可以充分利用现有宽带接入技术,主要有xDSL、FTTx+LAN、Cable Modem等三种。目前,xDSL技术中最常用的技术有ADSL和VDSL。FTTx技术是光纤到x的简称,它可以是光纤到户(FTTH)、光纤到局(FTTE)、光纤到配线盒/路边(FTTC)、光纤到大楼/办公室(FTTB/0)。

it技术范文第3篇

手工条件下进行审计工作,主要是利用算盘、计算器等工具,采用审计查账法、审计分析法、审计调查法等方法对被审单位进行审查;在电算化条件下,审计人员主要利用计算机这一先进工具采用计算机审计技术开展审计工作,这无疑是审计技术的一大进步。由于计算机技术日益进步且管理方法日益电算化,计算机作为重要的审计工具越来越具有不可替代的作用。

(一)对审计实施方法的影响

目前,人们一般把运用计算机进行审计的技术称为CAAT技术。所谓CAAT就是Computer assisted auditing techniqu的缩写,即计算机辅助审计技术,是由一种或一系列专门针对某项审计职能而设计的计算机程序组成。在审计中借助它进行符合性测试或实质性测试。从而获取企业内部控制的审计证据。作为辅助审计技术,只要被审计的计算机信息系统不进行大的变动,就能使审计人员在短时间内正确无误地处理大量数据;审计人员还可以直接审计被审计单位电算化系统本身并打印出数据副本;可以长期作为获取审计证据的方法。因此,计算机辅助审计技术是一种经济、适用、长期受益的IT方式,被各审计单位广泛采用。具体地讲主要有以下几种:

1、数据检验技术。数据检验技术是指审计人员设计出一些虚拟的经济业务数据,提交给被审计单位的计算机数据处理系统进行处理。根据检测的目的,检测数据应包括合法和非法的数据。将系统对检测数据的处理结果与审计人员的预期结果进行对比,以确定系统控制是否存在并有效地执行。

这种方法简单易行、成本较低;但检测数据可能影响被审计单位计算机系统的正常运行,检查的范围也受审计人员对该系统的了解和想象力的局限。

2、平行模拟技术。平行模拟技术是审计人员模拟被审计单位对实际数据的处理情况而设计的一系列程序,它可以将被审计单位的真实数据用审计人员的程序重新处理一遍,以验证数据处理的正确性,平行模拟技术在日常审计中主要动用的方法是ITF(Integrated Test Facility)。ITF是一个建立在活动数据文档基础上的程序,使得审计人员能够不影响企业真实营运或财务数据的情况下对系统进行测试。大部分的电子商务软件包都配有ITF设置。审计人员可以通过VAN或第三方网络供应商对控制系统进行交易测试,当然前提是企业必须授权VAN接受审计人员启动的交易并将其发送至客户的信箱中,这种交易测试可以持续进行或者周期性进行,再将测试结果与期望结果相比较,从而得到验证;另一种替代方案是建立一种特定的审计交易类型(在VAN登记),重复现行发生的交易,并将结果反馈给审计人员,由审计人员对结果进行评估。

平行模拟技术具有不破坏被审计单位的数据文件,审计人员可以在不增加很多成本的情况下,扩大样本规模,独立地进行测试的优点;但这种技术的使用对审计人员的要求较高,如要求审计人员要注意所选取的数据要有代表性,所设计的审计程序也要达到被审单位计算机系统的处理能力。

3、嵌入审计模块。嵌入审计模块技术是指在被审计单位的计算机数据处理系统中加入为完成审计目的而编写的程序。嵌入的审计模块是被审计单位的计算机数据处理系统的一个组成部分,它可以按照审计人员的要求,以特定的时间间隔,或在系统中的数据达到某种条件时,为审计人员生成和输出有关的报告、嵌入审计模块主要以在线监测的方式被运用在审计工作中。在线监测是考虑到电子商务的交易数据可以会消失或改变的情况,而通过网络系统在交易进行的过程当中对企业业务的敏感和重要环节的即时监测,从而发现异常情况,掌握审计证据的技术。在线监测系统应该对计算机信息系统进行24小时全天候监测,迅速提交用户告警的详细信息和进行准确的告警定位,从而提醒审计人员异常情况的出现;也可以进行在线查询和实时测试,获得系统的实时运行数据。另外,监测系统还可以依据所储存的各项监测数据进行统计分析,掌握企业信息系统的运行情况,提示客户进行及时的维护预防。

嵌入审计模块技术虽然可以对被审计单位的计算机数据处理系统进行动态的监控,但它要求在系统设计时就应予以考虑,并应建立必要的控制措施,防止未经授权的人员接触和使用嵌入的审计模块及其生成报告。由于嵌入模块审计技术的使用条件比较苛刻,只适用于选定的范围。

4、远程审计。远程审计是指基于计算机网络,通过人机合作,对被审计单位进行的非现场的审计工作,远程审计主要实现审计信息网上传送和信息资源共享,审计人员只要把自己的计算机与网络连通,并取得被审计单位给予的审查权限,就可以在任何地方通过网络完成除实地盘点和观察外的大部分审计工作。审计人员可以通过网络审查远距离外的计算机信息功能;调用系统的审计功能或使用审计软件对系统的经济信息进行抽样、审查、核对和分析;使用电子邮件向被审计单位的银行、客户和供应商等进行函证;在网上复制有关文件或数据等审计证据、编写工作底稿等等,审计项目负责人可以在网上制定审计计划,给在不同地点的各审计人员分配审计任务;在网上复核助理人员的工作底稿,并对助理人员给予指示与帮助;随时了解审计项目进展情况,协调各审计人员的工作;草拟和签发审计报告,远程审计尤其适用于对电子数据的审阅、核对、复算、询查,但对于需要实物鉴定或就地盘点的审计证据,还必须依靠就地审计的方式,如观察或盘点等获得。

远程审计技术充分利用计算机网络的超越时空的特点,更具时效性,可明显节约审计费用,它的运用范围较广。

(二)对审计报告的影响

IT审计结果最终应以报告书形式归纳,向企业的最高领导提交。原则上,IT审计报告由承担该审计的IT审计人员完成,并在得到IT审计负责人的认可后方可提交。一般来说,IT审计报告大致由综合审计意见及个别审计意见两部分组成。

1、综合审计意见

综合审计意见包括本次审计的概要,重要的问题以及综合的结论。大致包括以下各项:(1)IT审计对象范围、实施日期及实施过程的概要;(2)IT审计目的;(3)重大问题及改进对策方案的概要;(4)本次审计的综合结论。

2、个别审计意见

个别审计意见是指在IT审计过程中发现的个别问题。大致包括以下内容:(1)问题所在及现状;(2)考虑这些问题的危险性及影响;(3)IT审计人员提议的改进对策。

IT审计报告是对IT审计实施的最后归总,目的是让被审计部门的最高领导明白该信息系统在可靠性、安全性与有效性等方面整体的状况及重大问题所在,IT审计报告必须简洁明了,重点突出,要考虑到有些企业领导不是信息系统专业的,因此技术用语或专业用语要尽量少用,在不得不用的情况下,最好附加一些说明。另外,对于企业最高领导想了解的问题或存在的疑问等,必须给予明确的回答。

在起草IT审计报告时要注意:(1)专业用语不能过多;(2)劝告的内容不能过于抽象,要尽量具体;(3)对于缺陷,一定要有明确的证据;(4)要有具体的解决实施方案,并考虑实施的可能性;(5)解决方案要考虑费用与效果比,费用不能过高;(6)详细的技术事项另付说明;(7)报告书中不能有对个人的攻击;(8)要考虑机密信息的保护。

IT审计报告书的内容包括:(1)IT审计人员制作IT审计报告的时间;(2)对信息系统的可靠性、安全性及有效性进行评价的结果;(3)系统存在的问题;(4)根据存在的问题提出的改进劝告;(5)根据改进的劝告提出的改进方案;(6)其他的必要事项。

需要指出的是,IT审计不是以提交报告书为结束,而是对审计报告中提出的问题特别是重大问题,要跟踪整改的状况,确立IT审计跟踪制度。

被审计部门要在规定期限内提交整改计划,IT审计师随时与被审计部门接触,了解跟踪整改的状况。如整改进展缓慢,要帮助找出原因,促使整改的完成。IT审计要达到最终目的,审计结果的跟踪是不可缺少的,并要使其成为一种制度。

此外,IT审计师还要对一年中的审计活动进行汇总,向经营者(被审计部门)提交年度报告。年度报告包括以下项目:(1)IT审计人员的变动;(2)IT审计人员的教育培训;(3)按照基本计划预定的IT审计活动的实施状况;(4)特别重大的问题及整改状况;(5)下年度IT审计计划的主题。

it技术范文第4篇

1. 熟悉ugccnet标准协议;

2. 在熟悉ugccnet协议的基础上,进行标准文本的英文版翻译只要负责第4章和第5.2节,并进行英文版文本的三轮校对,对文本中所有句子和语法进一步完善;

3. 熟悉ieee-sa标准模版,并针对ieee标准撰写格式规范,将ieee 1888标准移植到ieee-sa标准模板,并添加工作组相关信息;

4. 主要学习了sip, soap,xml,ipso-wp-1, ipso-wp-2, obix, bacnet, bacnet数据通信协议的web services及xml编码格式,以及sip在数字家庭中的应用等协议和应用内容,并结合ugccnet标准文本在组内进行讨论,实现对ugccnet标准文本的补充和完善;

5. 总结归纳ieee投票流程,并在组内进行讨论,使流程条理化,细节更为准确。具体投票流程为:ieee balloting阶段的投票发起,投票组织,draft提交,信息反馈和revcom(评审委员会)审查等规定,在线仔细研读,形成报告材料;

6. ieee 1888相关材料的准备,讨论和完善。进行ieee 1888投票准备,整理ugccnet q&a的整理,并对ugccnet文本中面向对象数据模型进行完善;

7. 中日绿色it合作项目。项目准备工作,进行自控技术方案和自控设备选型的相关调研;

8. 公司部门的其他事务。协助部门领导进行中日绿色it合作项目日方来访工作安排。

it技术范文第5篇

2001中南地区广播电视技术讨论会技术论文二等奖     多媒体信息是未来人类获取信息最主要的载体,因此它已成为目前世界上技术开发和研究的热点。视频信息作为多媒体信息中最被关注、数据量最大的一员,现在也正面临着一场其意义不亚于从模拟到数字的技术进步革新:从传统的矩形DCT变换编码到根据视频内容、划分对象、分别变换编码的新的编码方法。

一、传统的编码方式

    传统的视频编码是以视频信号的数字量为编码对象的,与视频信息的内容无关,无论是M-JPEG、MPEG-1还是MPEG-2,都是以DCT矩形变换块为变换编码单元,对DCT块内图像的亮度和色度进行特征取样,提取像素;采用帧间编码、运动估测技术,在参考帧帧内DCT编码的基础上,对DCT块内图像的像素特征进行差值预测编码。基于矩形DCT编码的视频编码在设计思想上只考虑到对信号数据进行处理的需要(比如小的比特率以利于传输、高的比特率以保证质量),但未考虑视频信息--图像内容本身的含义和重要性,以及视频信息应用者的主观需求(比如部分内容的提取功能)。另外,这种基?quot;块"的压缩算法在低码率时容易产生"方块效应"和"抽帧",大大缩小了视频信息的应用领域。

    小波变换是一种新的变换编码方法,它与DCT变换相比,考虑到了视频信号对不同应用环境的自适应性(不同的清晰度与比特率),可以将基础图像层与增强图像层分离编码传输,用户可根据实际情况选择是否打开增强图像层。但无论用户选择是或否,被传送的视频信息却都是一样的。

二、 基于内容对象的编码

    1、 VO与VOP概念的引入

    传统的视频编码方式是将整个视频信号作为一个内容单体来处理,其本身不可再分割,而这与人类对视觉信息的判别法则,也就是大脑对视神经导入的视觉信号的处理方法是完全不同的。这就决定了我们不可能将一个视频信息完整的从视频信号中提取出来,比如:将加有台标和字幕的视频恢复成无台标、字幕的视频。解决问题的惟一途径就是在编码时就将不同的视频信息载体--视频对象VO(Video Objects)区分开,独立编码传送,将图像序列中的每一帧,看成是由不同的VO加上活动的背景所组成。VO可以是人或物,也可以是计算机生成的2D或3D图形。VO具有音频属性,其属性赋值可能?quot;有"或者是"无"。但音频的具体内容数据是独立于视频编码、传输的。VO概念的引入,更加符合人脑对视觉信息的处理方式,并使视频信号的处理方式从数字化进展到智能化。提高了视频信号的交互性和灵活性,使得更广泛的视频应用和更多的内容交互功能成为可能。

    现代图像编码理论指出,人眼捕获图像信息的本质是"轮廓-纹理",即人眼感兴趣的是VO的一些表面特性,如形状、运动、纹理等。VO的表面往往是不规则的、千变万化的,但可将其视为一定视角下,n个形状规则的、具有一定纹理的剖面的组合的连续运动,这些剖面的组合称为视频对象面VOP(Video Object Profile)。VOP描述了VO在一定视角条件下的表面特性。VOP的编码主要由两部分组成:一个是形状编码,另一个是纹理和运动信息编码。VOP纹理编码和运动的预测、补偿在原理上同MPEG-2基本一致,而形状编码技术则是首次应用在图像编码领域。

    2、新的编码技术

    合成VO的独立编码 在以前,2D或3D动画被看作是视频的一部分,并一概以视频的方法来处理。实际上,根据合成VO的合成机理和特性,大部分合成VO都可以用通用的有关图形文本的多种表达方式来描述。非复杂性合成VO将被视为一种独立于视频的数据类型来编码,并定义了其描述框架、通用的数据流结构和灵活的接口。而复杂性合成VO和自然VO的编码方法,将采用以下的编码方法。

    基于矩形窗口的VOP分割 考虑到与现有标准的兼容,目前已得到应用的VO编码技术,比如MPEG4,仍采用了基于矩形窗口的内容分割法。编码时,首先利用像素特征统计,将每一个VOP都限定在一个矩形窗口内,称之为VOP窗口(VOP Window),取窗的原则为:长、宽均为16像素的整数倍(便于对现有标准的兼容和将来的扩展),同时保证VOP窗口中非VOP的宏块数目最少。目前标准中的视频帧可认为是一个无VOP的特例,在编码过程中将形状编码模块屏蔽掉就可以了。在一个VOP窗口内,VOP剖面的形状也是采用8×8像素的矩形形状。针对不同的VOP,可以根据不同的应用场合和运动、变化的特点,采用固定的或可变的VOP帧频(即VOP刷新频率)。

    矩形窗口分割法并不能体现VOP的具体形状信息。为了确认采用矩形窗口分割法的VOP的形状信息,就引入了形状编码技术。形状编码其实并不是什么新技术,它在计算机图形学、计算机视觉领域早有应用。而目前的视频编码标准中的位图技术其实就是形状编码的简单特例。位图采用矩阵的形式来表示二值(0或1)的形状信息,具有较高的编码效率和较低的运算复杂度。VOP的形状信息有两类:边缘信息和灰度信息。边缘信息用0、1来表示VOP的形状,0表示非VOP区域,1表示VOP区域。对于包含一定透明度的VOP区域,可以用灰度信息(取值0~255之间)来表示透明程度,其中0表示完全透明,255表示完全不透明。对于模糊边缘部分,可将其视为灰度信息从周围已知VOP区域的灰度值向0值的过渡区域,采用内插法确定其形状信息。

    基于小波变换的VOP分割 基于矩形窗口的VOP分割依旧存在"块效应"问题,而基于小波变换的VOP分割则可以很好的解决这个问题,而且由于这种分割方法的本身就包含了VOP的形状信息,所以无需另对形状信息进行判别与编码。基于小波变换的VOP分割方法是目前最为活跃的视频编码课题研究领域,各种算法不断的被发表,但基本上可以划分为两类方法:

    1、利用图像灰度特征分割:不同的图像具有不同的灰度分布,利用小波变换,将图像变换到小波域,产生各层、各子带图像。小波变换后,大部分的能量是集中在低频子带图像上,即大面积的平均灰度区域信息主要在低频子带图像中体现。根据信息论的原理,确定多个灰度阈值,可以将具有不同灰度的VOP从低频子带图像中分离。同时再利用高频子带图像以及模糊数学模型,确定每一个VOP的边缘信息。利用图像灰度特征分割的小波变换,是沿扫描方向的单方向变换。

    2、利用图像纹理特征分割:纹理是一种局部特征反复出现的结果,它体现了图像的局部频域信息。对于一幅数字图像,进行多方向的小波变换是可行的,比如对一帧画面进行垂直方向或对角线方向的小波变换。经过多种小波变换后可得到不同方向的各子带图像,它们各自蕴涵着不同纹理的局部频谱信息和纹理走向等信息。对具有相同频谱特征的图像局部进行聚类分析,并根据纹理频谱和纹理走向确定该聚类的纹理边缘。根据信息论原理和运动估测,将运动矢量具有相关性的聚类二次归类于不同的对象(即VOP),并影射成不同灰度显示。多级小波变换的结果最多可线性的影射成0~255灰度级显示。进行小波变换的方向越多,各方向的夹角越小,图像分割也就越准确,但计算量也随之迅速膨胀。根据局域纹理中心频率的变化自适应地选择小波变换的级数(几个方向的变换)和方向,有助于在图像分割的准确性和计算量之间达到平衡。正如本文前面所述,人眼捕获图像信息的本质?quot;轮廓-纹理",故基于多方向小波变换的提取图像特征、分割纹理图像的方法符合人眼视觉生理的特点,是纹理图像分析的重要发展方向。

    无论是哪一种方法,当得到不同VOP的不同灰度表示之后,通过类似于键技术的多通道处理,即可得到多个原始的彩色VOP。目前实验表明,基于小波变换的图像分割在边界上仍有些模糊,但总体效果还是相当满意的,达到了分割纹理图像的目的。

    VOP运动信息编码和运动补偿 人眼在观看图像时,会自动跟踪人所感兴趣的VOP。即人看的不是时间轴上的信息,而是VOP的运动轨迹---光流轴上的信息。光流轴是VOP上的一点在活动图像上的运动轨迹,它在不同的帧中位于不同的空间位置,其意义在于:VOP自身的各种变化都将映射于光流轴上的一点。光流轴信息的独立编码将带来诸多好处:(1)在编码时,对于刚性VOP,由于它在运动中不会发生形状和纹理上的变化,故该VOP只需要完成一次采样、编码,而后就只需发出几个运动矢量指明它的光流轴即可;对于非刚性VOP,只需在发生变化时才需要重新采样、编码,这就使得不同的VOP采用不同的VOP帧频成为可能,将编码的数据率最低限度的降低。(2)VOP在运动中的各种变化都将"留迹"于光流轴,当在进行运动补偿时,比如不同制式之间的转换或者慢动作的制作,就可以根据光流轴映射信息,采用内插法得出时间轴上某一确定点的VOP状态,达到无损转换的目的。(3)在时间轴上,简单的将一个图像序列的两路信号叠加,随即噪波和图像的活动部分都得不到增强;若在光流轴上进行信号叠加,活动图像的降噪问题就得到了简单解决。

    VOP的运动估测是指:分析两个或更多帧上的VOP,确定光流轴,以判断下一帧中VOP可能出现的位置。VOP的运动补偿是指:根据VOP光流轴的取向和光流轴上VOP自身变化得映射信息,矫正VOP在时间轴上的运动矢量。运动预测和运动补偿技术可以去除图像信息中的时间冗余成分,VOP的运动信息编码可视为从像素向任意形状的VOP的延伸。

     纹理编码 在已得到实际应用的MPEG-4中,VOP的纹理编码基本上仍采用基于8×8像素块的DCT方法,有3种模式:帧内编码模式(I-VOP)、帧间预测编码模式(P-VOP)和帧间双向预测编码模式(B-VOP)。编码时,对于完全位于VOP内的像素块,则采用经典的DCT方法;对于完全位于VOP之外的像素块则不进行编码;对于部分在VOP内,部分在VOP外的像素块则首先采用图像填充技术来获取VOP之外的像素值,之后再进行DCT编码。

    依据视觉特性的纹理编码目前仍处于理论研究阶段,其目标是:建立常见纹理局部特征符号集,定义描述纹理分布、走向的多媒体语言。以人脸为例:人脸定义参数(FDP)描述了特定人脸纹理形状模型与通用人脸模型之间的差别,通过接收到的各种FDP,能把通用的人脸模型变换成由其形状和纹理确定的特定人脸。人脸动画参数(FAP)描述了特定的人脸表情与中性表情的变化关系,通过接收到的各种FAP能生成人脸的各种表情以及与声音同步的嘴唇活动等。这样的合成编码不仅可极大地提高编码效率(可获得1kbps的超低码率),而且为制作新的人脸等对象提供了方便。

    分级编码 多媒体的应用场合具有不同的信道带宽、处理能力、显示能力及用户需求,要求在解码端支持时域、空间及质量的上伸缩性,即分级编码。分级编码可以通过视频对象层VOL(Video Object Layer)的数据结构来实现。每一种分级编码都至少有2层VOL,低层称为基本层,高层称为增强层。空间伸缩性可通过增强层强化基本层的空间分辨率来实现,因此在对增强层中的VOP进行解码之前,必须先对基本层中相应的VOP进行解码。同样对于时域伸缩性,可通过增强层来增加视频序列中某个VO(特别是运动的VO)的帧率,使其与其余区域相比更为平滑。

三、 新的技术标准--MPEG 4

    首次采用VO编码技术的视频编码标准是由MPEG 4。MPEG 4于1999年年初正式成为国际标准(标准号为ISO/IEC 14496),在1999年12月的后继版本中增加了可变形、半透明视频对象及其工具的先进功能,它进一步提高了编码效率,并与第一版反向兼容。

    1、MPEG 4标准的构成

    1) DMIF(The Dellivery Multimedia Integration Framework):多媒体传送整体框架协议。MPEG-4标准将众多的多媒体应用集成于一个完整的框架内,旨在为多媒体通信及应用环境提供灵活的算法及工具,用于实现音视频数据的有效编码及更为灵活的存取。它解决了多领域中多媒体应用个性化交互操作的问题。

    2) 解码器:定义了MPEG-4系统特殊的解码模式(SDM),要求特殊的缓冲区和实时模式。

    3) 音频编码:支持自然声音和合成声音,支持音频的对象特征。

    4) 视频编码:支持自然和合成的视觉对象,合成的视觉对象包括2D、3D动画和人面部表情动画等。

    5) 场景描述BIFS(Binary Format for Scene description):关于一组VO的时空结构关系的参数信息,主要描述了各VO在一具体背景下的相互关系与同步等问题,以及VO及其背景的知识产权保护等问题。BIFS与VO对象特征信息的编码、传输是相对独立的。场景描述信息编码及其的独立传输是实现用户端编辑操作的关键:在解码之后和场景合成之前,用户可以通过对BIFS参数的重新设置来对VO 进行多种编辑操作,如增减、缩放、平移,甚至一些特技效果。

    下面的表格反映了MPEG体系的部分技术指标。MPEG-4是高比率有损压缩(比如将一个9 GB的DVD视频压缩拷贝到只有700MB空间的CD-ROM上),其图像质量始终无法与MPEG-2相比。当MPEG-4与MPEG-2的码率输出相同时,其质量仍稍逊于MPEG-2。同时,MPEG 4对硬件的要求也较高。事实上,我们注意到MPEG-4在保证令人满意的图像质量的情况下,更注重较低的数据率和灵活的交互功能。

    2、MPEG 4编码器

    MPEG 4编码简化原理图如图一。

    对于输入视频序列,通过分析确认n个视觉目的对象为编码对象,将其认定为n个VO(n=1,2,3…),对每一个VO编码后形成这个VO的VOP数据流。VOP的编码包括对运动(采用运动预测方法)及形状、纹理(采用变换编码方法)的编码。由于VOP具有任意形状,因此要求编码方案可以处理形状(Shape)和透明(Transparency)信息,这就是与只能处理矩形帧序列的现有视频编码标准的根本区别。在MPEG-4中,矩形帧被认为是VOP的一个特例,这时编码系统不用处理形状信息,退化为类似于MPEG-1、MPEG-2的传统编码系统,同时也实现了与现有标准的兼容。除去VO的其余图像部分--背景,仍采用传统的矩形DCT变换编码;VO场景描述信息(VO自身信息,如VO对象的知识产权、和VO间的位置、逻辑关系等)也要进行编码,最后和VOP流、背景一起送入MPEG 4帧复合器,生成MPEG 4流输出。

    需指出的是:在VO分割后,每一个VO都需要一个VOP编码通道,在图一中只画出了一个。多个VOP帧发生器的输出在MPEG 4帧复合器中可实现灵活地多路复用编码或同步并行传输编码,以适应各种传输环境和要求。MPEG 4解码是以上编码过程的逆过程。可以看出,独立于背景的VO编码可以实现接收端的用户对VO对象进行选择性地操作。

    3、MPEG 4视频编码功能与特点

    MPEG 4标准的制定有两个目标:低比特率的多媒体通信和多工业的多媒体通信的综合。即MPEG-4遵循灵活的编码工具框架体系,设计了一个开放的编码系统,对于不同的应用采用不同的编码算法,以达到低比特率通信的目标。MPEG-4解码器是可编程的,相应的解码信息可与内容本身一起传输下载。与现有的MPEG-1和MPEG-2视频压缩相比,MPEG-4视频有一些重要的改进:

    1)基于内容的交互功能: MPEG-4提供了全新的交互方式,根据制作者的具体自由度设计,在有限的时间内可实现对多媒体VO的时域随机存取(从不同的源获取内容或向不同的源发送内容)、快速搜索、改变场景的视角、改变场景中物体的位置、大小和形状,或对该对象进行置换甚至清除。

    2)支持自然及合成信息的混合编码(NHC:Synthetic and Natural Hybrid Coding):MPEG-4支持合成信息的编码,可对合成的VO及其活动信息进行参数化描述。对于频繁出现的视觉对象则分别定义了它们的纹理形状和动画参数。

    3)高效编码:包括视频VO数据的高效编码和多个并发数据的有效同步编码。

    4)基于内容的伸缩性:是指分级编码后,纹理、图像和视频基于内容的伸缩性,视频序列中时域、空间及质量的伸缩性,表现为时域实时或非实时、数据率大小及重建的图像质量上。

    5)可变的最终输出:不同的码率意味着支持不同的功能集。功能集的底层是VLBV核心(VLBV:Very Low Bit Rate Video),它为最低达5-64kbits/s视频操作与应用提供算法与工具,支持较低的空间分辨率(低于352×288像素)和较低的帧频(低于15Hz)。VLBV核心功能包括:矩形图像序列的有效编码、多媒体数据库的搜索和随机存取。MPEG-4的HBV(HBV: High Bit Rate Video,范围在64kbits/s-4Mbits/s之间)同样支持上述功能,但它同时还支持较高的空间与时间分辨率。其输入可以是ITU-R 601的标准信号,因此其典型应用为数字电视广播与交互式检索。

    与MPEG-1和MPEG-2相比,MPEG-4的特点是其更适于交互式AV服务以及远程监控。MPEG-4是第一个允许用户端操作的的视频编码标准。MPEG 4的特点非常适合于互联网上的交互式影视服务:可适应各种应用终端的物理网络环境,可实现对视音频内容的交互操作,具有下载解码能力(在一定的硬件基础上,可下载解码工具,对不同编码方式的内容进行解码处理)。MPEG-4的设计目标还有更广的适应性和可扩展性:因特网多媒体应用、交互式视频游戏、实时可视通信、交互式存储媒体应用、广播电视、演播室技术及电视后期制作、多媒体内容存储和检索、采用面部动画技术的虚拟会议、多媒体邮件、移动通信条件下的多媒体应用、可视化合作实验室场景应用、远程视频监控、通过ATM网络等进行的远程数据库业务等等。

    从矩形帧到VOP,MPEG-4顺应了现代图像压缩编码的发展潮流,即从基于DCT的传统编码向基于对象和内容的现代编码的转变。从这个意义上讲,MPEG-4视频编码技术翻开了图像编码史上崭新的一页。

四、 MPEG 4视频产品

    在2001 NAB会展上,多家公司推出了他们的MPEG 4产品。Amnis公司推出了基于IP平台的MPEG4视频流技术,展示了可以重放MPEG1, MPEG2和MPEG4的桌面软件。Envivo 公司陈列了他们的应用于IP网络或MPEG2节目数据广播的MPEG4端到端解决方案。该方案是纯软件的,支持视频、音频和合成的2D动画的MPEG4方式编码,以及对MPEG 4文件的版权保护。Optibase公司推出的MGW系列是一个插件式的多通道流服务器系列,可插入不同的编码模块以适应不同的需求,其中MGW 4000是支持MPEG4(兼容MPEG1和MPEG2)的流服务器。Optibase还推出了支持多媒体和交互MPEG4流的IP实时编码、分配平台。最后,Optibase展示了从MPEG 1到MPEG 4的实时转码技术。Philips 提供了一个从制作到重放的、端到端的网上MPEG-4解决方案:包括互动内容编辑器(支持网上MPEG-4视频流的搜索、剪辑和编辑)、实时软件MPEG-4编码器(甚至支持简单视频和AAC音频的无线编码)、通用多点分配IP平台和解码软件(WebCine' player支持Win95,Win2000和NT操作系统;WinCE用于手提电脑;Trimedia是一个网上广播机顶盒)。SUN 公司也推出了他们的通用MPEG-4流服务器。

    微软在它现在的WIN98和WIN2000操作系统中也已加入了一个MPEG-4的播放器,叫做Divx。它可以回放仍是以.AVI为后缀的MPEG 4文件。Divx可以附加到MPEG-4的数据流中,并可以进行设置以适应不同的使用要求。Divx视频编码技术是由 Microsoft MPEG4 V3 修改而来,使用MPEG 4压缩算法,打破了ASF的种种协定。但MPEG4毕竟是一种高比率有损压缩,其图象质量始终无法和 DVD 的 MPEG2 相比,即便是在MPEG4码率和DVD码率差不多时,总体效果还是有距离(在杂乱的细节上稍有模糊)。所以目前的MPEG4 只能面向于娱乐和欣赏方面的市场。

    市场上的第一张DIVX-MPEG4格式的影碟《活火熔城》,长98分钟,采用512×288 16:9格式,帧频24帧/秒,64KB立体声音频。影片由720×480 16:9 30帧/秒的MPEG2制式转刻,刻在单张CD盘片上。

六、结 尾