掀起H.264的面纱(2)

2006-02-06 21:04:38来源:现代音响技术 作者:陈志远热度:
H.264的变化之一是在帧内编码I画面中,又加入了帧内预测编码技术,即解码时可用周围数据的差分值来重构画面。帧内预测以特定大小的块作为基准单元,从周围像素中预测编码化的模板。H.264的基准块大小分4×4和16×16两种,前者有9种预测模式,预测方向见图3。后者也有4种模式。因为原图像左右、上下都有一定的相关性,不同部分的差分值总比不进行帧内预测的原始值要少,故量化后的编码量就减少了,而且高频成分也比原图像为少。
运动预测块中采用了全面预测技术,效果极好。H.264在运动矢量的检出时,能选定最合适的大小来进行,因而运动矢量检出的精度较高。见图4。MPEG-2只有一个运动矢量检出模式,MPEG-4有2个,而H.264有7个之多。运动矢量探索单元分得细,就能找到更多的静态部分,真正的运动矢量就能单独求出,抑止了运动细节的编码量。
在预测中,可以利用的参考帧帧数也增加了。在H.264中,根据画面清晰度的不同能有4到6个校正帧可用,因而能搜索到突然消失那样的蒙太奇画面。H.264中,720×480像素的D1格式画面可以从前4帧的不同位置中预测第5帧画面。

全面预测和帧内预测在MPEG-2时代并非想不到,因当画面像素数和画面品质要求提高时,运算处理量就会爆发性地增加,实时运用时有可能出现中断。为此,MPEG-2和MPEG-4的运动预测规格都指定了最低限,运动矢量检出编码时的自由度不能太大。

H.264采用全面运动预测和I画面帧内预测后,编码量得到削减,但LSI的运算处理量增大。为此,引入了DCT变换的简化处理技术,来减轻LSI的负担,画质也有所改善。

具体技术是把原来的离散余弦变换DCT改变为近似的整数变换,即把DCT正交变换时用的系数1,0.414变成2,1;cos(π/8),cos(π/8)2变成1/(5)1/2,1/5。使原来必须用浮点运算进行的余弦函数运算,可用整数运算进行。同时还削减了系数的种类,使运算量减少。由于不必严格规定运算精度,还可以用SIMD(单指令多流数据)等操作快捷命令来执行。
H.264又一项减少运算量的方法是在很多地方引入层次化运算,把在矩阵数据块变成小块运算,使计算式变得更加简单,见图5。
在DCT中采用时,8×8像素块层次化到2×2像素块,变换就变得快捷。运动补偿中也可利用。检出运动矢量时,最初的模块大,运动矢量的检出范围大,搜索快捷。当检出到有动作的部分再调入小模块细分析。H.264进行运动预测的模板多,一旦先进全面检索,需要的时间就很长,运算量也大。用层次化处理,先进行模板的收缩,接着小范围检索,就能减少计算量。在帧内预测中利用层次化后,残差计算的范围就能变小,同样有利于减少计算量。

H.264与MPEG-2和MPEG-4的不同还存在于纠错编码块中,H.264的纠错编码为内容自适应可变长度码(CAVLC)和内容自适应二进制算法编码(CABAC),能提高纠错能力。而MPEG-2和MPEG-4杰霍夫曼编码。另外,还加入了MPEG-2和MPEG-4没有环路滤波器,有降低噪声的效果。H.264的整数变换以4×4像素块为单位,已比原来的8×8像素块的块噪声少,再次降低,画质得到了进一步提高。

从应用角度看,H.264有三个层面,分为主要用于电视会议等通信的基线层面,面向高画质用途和录像的主层面以及面向内容配送的扩展层面。各层面的清晰度和编码速度取值不同。

基线层面的主要技术为图像只含有I画面,P画面,系统内有环路滤波,1/4帧间预测,4:2:0 YUV格式输入,基于VLC的纠错编码,弹性宏块指令等。主要层面则在基线层面基础上加入了CABAC运算编码技术和基于双向预测的B画面,滤波(接口)等技术,但不含弹性宏块指令。扩展层面则在基线层面里加入B画面和滤波编码等。

H.264分有4.1种不同样式的图像水平。水平1的编码速度较小,最大只能达64kbps,像素格式为QCIF(176×144),30帧/秒和Sub QCIF(128×96),60帧/秒。适合手机、PDA等屏幕播放视频用。水平2的编码速度可达2Mbps,图像的像素格式为CIF(352×288),30帧/秒。水平3、水平4分别对应SDTV、HDTV图像格式,编码速度为10Mbps,20Mbps。另外,还有能支持更高清晰度的水平5,编码速度高达135Mbps。故总称为4.1水平。在各水平更细的分类中,最大编码速度也还有不同规定。
最后,把H.264与MPEG-2/MPEG-4主要的不同技术比较与下表1。
针对H.264的特点,编码软件和编码LSI开发的厂家都把编码/解码运算量的减少作为方向来研究,所以,实用前景大好。大多数半导体厂认为在H.264中使用削减运算量方法后,能获得相当于MPEG-2编码LSI的2倍左右的处理能力。

由于技术的日益成熟,半导体厂商已在进行H.264的编码/解码LSI的开发。特别是HDD录像机和DVD录像机等设备中,采用H.264的实例已很多,更引起了半导体厂商的关心。加之,H.264采用的动画编码方式和音频编码方式具有多样化特性,今后几乎将会是全部厂商的主要规格之一。

以目前芯片将H.264实用化的研究也在进行之中。用德州仪器(TI)公司制造的DSP[TMS320C64××]对以H.264预先编码的图像已证实能进行实时解码。TI公司正在开发的C6×系列DSP LSI,将在视频编码电路和存储控制电路中,加入对应H.264和MWV等的编码/解码功能。
TI公司推出的可以对MPEG-4编码/解码的用于便携机开发的TMS320DM270,只要用上新的CPU提高处理能力,就可用于H.264的编码/解码。

已经有MWA9的编码/解码DSP样品出厂的美国模拟设备公司也在向H.264前进。

图6是美国InStat/MDR公司对H.264功能LSI产量的预测。预测还只基于H.264的许可制度与MPEG-2一样的前提下进行的。
H.264的许可制度有望较友善

H.264替代MPEG-4的呼声很高,除了其高性能外,作为国际标准和公正的无差别许可制度也致关重要。

MPEG-4的许可体系引起了几大行业,特别是信息配送行业的强烈反对,使得新国际标准的许可收费不得不向更为友善的方向发展。表2是几种视频压缩技术的许可收费价格。
表中可见,MPEG LA公司提出的MPEG-4配送过程也要付费是空前绝后的。视频压缩产品只对终端收费合乎常情,因而招至了很大反抗,直到今日仍在遭人反对。而且对采用MPEG-4的产品和服务还分成6种标准:用户记录视频,互联网视频,车载移动视频,特有用户视频,存储视频和企业视频。连简单的移动电视服务,如从现场到电视中心通讯时,若使用MPEG-4视频的话,也需支付移动视频的许可费。

因此,连原定在地面数字电视的编码方式中采用MPEG-4的日本ARIB,也因许可费问题而开始研讨是否改用H.264。拥有各种内容服务业者的移动内容论坛MCF也于2003年5月23日,致涵MPEG LA公司反对内容收费,要求重新考虑许可条件。MPEG LA也已松口表示希望以能相互满意的形式交涉。

随着掌握压缩技术的企业增加和用户巨增,H.264的许可管理收费受到二个方面的压力。一、用户要求低价格,最好免费使用;二、持有压缩技术的企业增加,供应空间大,不得不低价出售。目前具有高压缩率特征的活动图像编码技术的企业不少,如,美国数据流公司的XVD,能在一片CD-R碟片上放入2小时图像,并能实时编码。美国On2技术公司的活动图像编码技术VP5和新版本VP6,国内推出的EVD就采用这种编码技术。美国AOL(America Online)公司也有新压缩技术在进行许可操作。微软的WMV 9也在向家电产品扩展,如美国工艺家庭娱乐公司使用WMV 9压缩,将HDTV画质的“终结者2:审判日”放入DVD-ROM内。
为此,H.264的许可制度设计有两点引人之处:第一,部分格式将无偿使用,H.264的基线层面全员免费,无偿使用;其二,许可体系要比MPEG-4单纯,公正无差别对待用户和专利持有者。以及其它能促进普及的优惠政策,如早期低价格许可等。

基线层面的免费是以ITL-T主要活动的企业为中心推动的。现得到美国苹果公司和美国Cisco系统公司、中国联想公司、芬兰诺基亚、美国On2技术公司、德国西门子、美国德州仪器公司等的支持,并有美国政府为其撑腰。

基线层面免费的最大目的是加速H.264的普及。当基线层面普及以后,收费的主层面和扩展层面就能带动起来。尽管主要层面和扩展层面要收费,但从趋势看,许可费应较为便宜,因为各种编码技术的许可费都有不断下降的趋势,目前很热门的美国微笑WMV 9的许可费就比MPEG-2和MPEG-4要低,见表2。而且微软的契约期为10年,比MPEG-2和MPEG-4还长。

从MPEG-2向MPEG-4的发展看,编码器(电路加软件)和解码(电路加软件)的费用就降到1/10,WMV9更低。可以预计H.264的许可费用会比WMV 9还低。

前文提到的45个团体的联合会传出说法,如果H.264采用MPEG-4 Visual一样的许可体系,H.264就可能不被采用,态度强硬。标准中的专利收费收益已远不止收回投入的开发成本,而是在不断地获取暴利,故降低收费在所必然。

当然,只要没有定局,变化依然存在。专利持有者的想法也各有不同,采用无差别对待原则是否行得通。专利实施充满着大量利益诱惑,追名逐利者大有人在。目前已经有两家公司申称对H.264具有许可管理权。在专利应用前就开始抢专利管理权的现象是前所未有的,两家公司还都有渊源。一家是实际持有MPEG-2和MPEG-4 Visual许可管理的美国MPEG LA公司。另一家是进行MPEG-2 AAC和MPEG-4 Audio许可管理的美国杜比实验室的子公司美国Vialicensing公司。最终有哪一家公司管理,还是分割管理,现在都不清楚。

但又好、又便宜,始终是技术发展的方向。

责任编辑:DVBCN编辑部

为您推荐

AVS-M手机电视系统面世 专家批评H.264臃肿

尽管AVS尚未成为IPTV国家标准,但中科院计算所不想仅仅被动等待,而是希望以手机电视领域为切入点,打消整个产业链的观望心理,推动AVS产业化进程。12月19日,中科院计算所与广州富年公司联手推出AVS标准的手机电视系统AVS-M,这套系统基于中科院计算所的AVS编码、解码标准,由富年公司提供后台系统和终端的软件解决方案,而非芯片。上海中科计算技术有限公司常务副所长、AVS-M项目技术负责人陈益强博士认为,由于19日正式推出的AVS-M系统尚不涉及芯片设计、终端生产等产业链环节,因此对运营商和服务提供商来说,推出AVS-M手机电视服务的成本很低,风险很小。

算通科技成功研制出采用H.264压缩标准的编码器产品

算通科技于2007年全新推出的编码器产品------E601型,此编码器采用H.264压缩标准,作为新一代的压缩标准H.264,其算法更趋完备。 此外E601H.264编码器支持立体声音频编码,支持MPEG-1Layer2音频编码和AAC编码。在编码效率上具有重大的改进,运营商以现有的设施为基础,可传送更多高质量的内容,大大降低在有线、卫星和电信网络传送广播级质量视频的成本,同时非常适用于IPTV、移动电视、视频存储播放、新闻传递等领域。 算通科技的E601H.264编码器产品将在CCBN2007及NAB2007展会上全新亮相,届时欢迎大家莅临展馆参观指导。

NEC电子新款机顶盒SoC集成H.264解码功能

该两款新产品将视频及音频等数字信号解码功能以及图像显示功能等接收数字信号系统必须的功能集成在一颗芯片上。EMMA3SL/HD支持高清(以下简称HD)播放,EMMA3SL/SD支持标清(以下简称SD)播放。新产品的主要特征有:(1)可支持压缩率为目前普及的MPEG2两倍以上的新一代H.264视频标准;(2)内置了音频数据处理DSP,因此可支持新一代音频规格Dolby®DigitalPlus(注1)和HE-AAC;(3)集成了USB、Ethernet等外部接口功能。此外,EMMA3SL/HD中内置了近年来市场中不断普及的如HDMI接口等高清数字家电接口。使用该新产品的用户,可根据自身需要设

NEC推出适用于H.264标清(SD)机顶盒系统芯片

NEC电子日前完成了2款适用于东欧、俄罗斯、印度、南非等地区的系统芯片方案,支持新一代“H.264”标清(以下简称SD)视频标准的机顶盒(以下简称STB)系统的开发,并以“EMMA3SL/LP”、“EMMA3SL/L”的产品名于即日起提供样品。该两款图像处理芯片将视频及音频等数字信号解码功能以及图像显示功能等接收数字信号系统必须的功能集成在一颗芯片上。此外,EMMA3SL/LP内置了高级安全规格,防止不正当使用收费数字电视的功能。新产品的主要特征有:(1)即使是压缩率为目前普及的MPEG2两倍以上的新一代H.264视频标准,该芯片也可支持H.264SD播放;(2)由于内置了系统搭建所必须的各种