MPEG-4标准和应用
宽带应用专家| 流媒体世界| 2002-12-02
一、MPEG是什么? MPEG是运动图像专家组的简称,全称是ISO/IEC JTC1/SC29/WG11,即国际标准化组织和国际电工委员会第一联合技术组第29分委会第11工作组,负责数字视频、音频和其他媒体的压缩、解压缩、处理和表示等国际技术标准的制定工作,制定的标准推动了VCD、DVD、数字电视、高清晰度数字电视等产品的发展。 JPEG是联合图像专家组的简称,全称是ISO/IEC JTC1/SC29/WG1,即国际标准化组织和国际电工委员会第一联合技术组第29分委会第1工作组,负责静止图像编码国际标准的制定,所制定的JPEG、JBIG、JPEG2000等标准在传真机、数字相机等产品中得到了广泛应用。

二、MPEG制定的标准

MPEG-1和MPEG-2是MPEG组织制定的第一代视、音频压缩标准,VCD、DVD及数字电视和高清晰度电视等产业的飞速发展打下了牢固的基础,曾获得了著名的Emmy奖。MPEG-4是基于第二代视音频编码技术制定的压缩标准,以视听媒体对象为基本单元,实现数字视音频和图形合成应用、交互式多媒体的集成,目前已经在流式媒体服务等领域开始得到应用。MPEG-7是多媒体内容描述标准,支持对多媒体资源的组织管理、搜索、过滤、检索,已基本完成。正在制定的MPEG-21的重点是建立统一的多媒体框架,为从多媒体内容发布到消费所涉及的所有标准提供基础体系,支持连接全球网络的各种设备透明地访问各种多媒体资源。

目前,MPEG系列国际标准已经成为影响最大的多媒体技术标准,对数字电视、视听消费电子产品、多媒体通信等信息产业的重要产品产生了深远影响。

三、MPEG4的特点

MPEGMoving Picture Experts Group)专家组继成功定义了MPEG—1MPEG—2之后,于19937月开始制订全新的MPEG4标准,并分别于1999年初和2000年初正式公布了版本1和版本2。到200110月,MPEG4已定义了19个视像类(Visual Profile),其中新定义的简单演播室类(Simple Studio Profile)和核心演播室类(Core studio Profile)使MPEG-4MPEG-2类别保留了一些形式上的兼容,其码率可高达2Gbps。随着MPEG-4标准的不断扩展,它不但能支持码率低于64kbps的多媒体通信,也能支持广播级的视频应用。MPEG-4标准将广泛运用于数字电视、动态图像、万维网(www)、实时多媒体监控、基于内容存储和检索的多媒体系统、互联网上的视频流与可视游戏、基于面部表情模拟的虚拟会议、DVD上的交互多媒体应用、基于计算机网络的可视化合作实验室场景应用、演播电视等,它将推动电信、计算机、广播电视三大网络的最终融合,从而成为今后一段时间压缩标准的主流。

1、 MPEG-4 标准的主要特点和功能

MPEG—4视频编码标准支持MPEG—1MPEC2中的大多数功能,提供不同的视频标准源格式、码率、帧频下矩形图像的有效编码,同时也支持基于内容的图像编码。图1MPEG4支持的码率与相应功能集之间关系的示意图。

在这一功能集的底层是VLBVVery Low Bit Rate Video)核心。它为码率在564kbps范围内的视频操作与应用提供算法与工具,支持较低的空间分辨率(低于352 X 288像素)和较低的帧频(低于15Hz)。VLBV核心支持的专用功能包括:矩形图像序列的有效编码、多媒体数据库的搜索和随机存取。

MPEG—4HBVHigh Bit Rate Video)同样支持上述功能,其码率范围在64kbps—10Mbbps之间,它与VLBL核心采用相同或相似的算法,但它支持更高的空间与时间分辨率,允许传输和存储适用于演播室的高质量视频信号,其输入可以是ITU-R Rec.601的标准信号,典型应用为数字电视广播与交互式检索。MPEG4最终支持的码率将高于MPEG—2   MPEG4 提出了基于内容(Contentbased)的存取概念,使用户可与场景进行交互。它对运动图像中的内容进行编码,其具体的编码对象就是图像中的音频和视频,称为AV对象(AVOAudio Video Object)。AV对象可以组成AV场景(AVOsAudio Video Object in a scene)。因此,MPEG—4标准的基本内容就是高效率地编码、组织、存储、传输AV对象。MPFG4标准支持8项新的或改进的功能,可分为以下3类:

1)      基于内容的交互性

基于内容的多媒体数据存取工具;基于内容的码流操纵和编辑;自然与合成数据的混合编码;增强的时间域随机存取。

2)      高压缩率

提高编码效率;对多个并发数据流的编码。

3)      灵活多样的存取

错误易发环境中的抗错性(Robustness);基于内容的尺度可变性(Content-based scalability)。

2MPEG-4标准的构成
1
DMIF

DMIF即多媒体传送整体框架,它主要解决交互网络中、广播环境下以及磁盘应用中多媒体应用的操作问题。通过DMIFMPEG-4可以建立具有特殊品质服务(QoSQuality of Service)的信道和面向每个基本流的带宽。

2)数据平面

MPEG-4中的数据平面可以分为两部分:传输关系部分和媒体关系部分。为了使基本流和AV对象在同一场景中出现,MPEG-4引用了对象描述(OD)和流图桌面(SMT)的概念。OD传输与特殊AV对象相关的基本流的信息流图。桌面把每一个流与一个CATChannel Association Tag)相连,CAT可实现该流的顺利传输。

3)缓冲区管理和实时识别

MPEG-4定义了一个系统解码模式(SDM),该解码模式描述了一种理想的处理比特流句法语义的解码装置,它要求特殊的缓冲区和实时模式。通过有效的管理,可以更好地利用有限的缓冲区空间。

4)音频编码

MPEG-4的优越之处在于,它不仅支持自然声音,而且支持合成声音。MPEG-4的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。

5)视频编码

与音频编码类似,MPBG—4也支持对自然和合成的视觉对象的编码。合成的视觉对象包括2D3D动画和人面部表情动画等。

6)场景描述

MPEG—4提供了一系列工具,用于组成场景中的一组对象。一些必要的合成信息就组成了场景描述。

3MPEG-4 标准的视频编码技术

为了支持基于内容的交互性,即支持对内容独立地进行编、解码,MPEG4视频检验模型引入了视频对象面(VOPVideo Object Plane)的概念。假设输入的视频序列的每一帧都被分割成多个任意形状的图像区域(视频对象面),每个区域可能覆盖场景中特定的感兴趣的图像或视频内容。输入进行编码的VOP可以是任意形状的,且形状和位置可随帧而变。属于场景中同一物理对象的连续VOP序列称为视频对象。同一视频对象的VOP序列的形状、运动和纹理信息被编码传输,或者编码为一个隔离的视频对象层(VOLVideo Object Layer)。

MPEG4视频编码器的基本结构包括形状编码(对于任意形状的VOS)、运动补偿和基于DCT的纹理编码(采用标准的 8 X 8 DCT或根据形状的自适应DCT)。具体的编码方法为:首先对输入的原图像序列进行场景分析和对象分割,以划分不同的VOP,得到各个VOP的形状和位置信息,它可以用alpha平面来表示。发送端只需传送alðha平面,接收端就可以确定VOP的形状和位置。alpha平面所需的比特数较多,需要进行压缩编码。显然,只要对VOP的轮廓进行编码和传送,接收端就可以恢复alpha平面,轮廓信息在轮廓编码器中进行编码。提取的形状和位置信息又用来控制VOP的运动和纹理编码。对运动和纹理信息编码仍然采用经典的类似MPEG-12标准的运动预测/补偿法。输入第N帧的VOP与帧存储器中存储的N—1帧的VOP进行比较,找到运动矢量,然后对两帧VOP的差值进行量化、编码。对不同对象的运动和纹理信息的编码可因地制宜地采用不同的方祛,以提高编码效率。编码后得到的纹理信息,与运动编码器和形状编码器输出的运动信息和形状信息复接形成该VOP的比特流层。不同视频对象的VOP序列分别进行编码,形成各自的比特流层,经复接后在信道上传送。传送的顺序依次为形状信息、运动信息和纹理信息。接收端的解码过程是编码过程的逆操作。

虽然MPEG4标准体系完整广泛,但此标准之部分相关技术尚处开发阶段。

四、MPEG4的应用

MPEG4的应用前景将是非常广阔的。 它的出现将对以下各方面产生较大的推动作用:数字电视、动态图象、万维网(WWW)、实时多媒体监控、低比特率下的移动多媒体通信、内容存储和检索多媒系统、Internet/Intranet上的视频流与可视游戏、基于面部表情模拟的虚拟会议、DVD上的交互多媒体应用、基于计算机网络的可视化合作实验室场景应用、演播电视等。

基于MPEG4标准的解决方案纷纷推出,有的为硬件方案,有的为软件方案。前者为设计一个MPEG-4专属解码芯片,但由于部分MPEG4相关技术(如:串流格式),尚处百家争鸣时期,主流尚未浮现,这使得芯片厂商仅能择一而为之。再由成本角度来看,因为多加了解码芯片,系统成本也随之提高。后者软件方案则用既有的系统CPU来进行解码。此法较具有弹性,可随时依市场需求态势改版更新,又因省去了解码芯片而降低系统成本。

目前已经开发好的基于MPEG4标准的方案有:视频会议、远程监控、交互教学、远程医疗、视频通讯,等等。

五、结束语

MPEG4标准可用博大精深四个字来形容。其涵盖领域之广大,已超越了单纯视音频编解码范畴,成为以对象内容为主体的多媒体展示架构。

对多媒体内容创作业者而言,MPEG4使多媒体内容更多元化、更具有弹性、多媒体组件能更容易被再利用。它将现今各自发展的技术及应用,如互联网、动画、视频、音频、互动电视等整合至单一架构之下,而且提供更佳的资源管理方法和保护著作权的机能。

对网络服务业者而言,MPEG4是透明度很高的信息传递工具。它可以藉由与其它国际标准的兼容相通而存在于各种形式网络上,如有线电视网络、电信网络以及无线传输等。尤其在单纯以视频音频传输为主的应用中,相较于MPEGlMPEG2MPEG4仅需较小的比特率,即可达成相同音画质效果,如此即意味着较高的频宽使用效率。

对终端消费者而言,MPEG4能让消费者在原创作者限定的操作功能范围之内,与节目内容中的对象互动,体会前所未有的娱乐效果。而且在移动式低传输速率网络中,促使多媒体应用得以实现。这包括了交互式多媒体广播和移动通讯。

因应市场的需求,我们将会看到更多、更灵活的MPEG4应用。比如手机、机顶盒、电视的互动,有线、无线多媒体内容的传送,节目制作与增值服务业的串联等等,都将会是MPEG4的贡献。

责任编辑:lmtwadmin

版权声明:凡本网注明来源“流媒体网”的所有内容,版权均属流媒体网所有,转载需注明出处。凡注明来源非“流媒体网”的所有内容,其目的在于传递更多信息,并不意味着流媒体网赞同其观点或证实其内容的真实性。