比较各种AAC与杜比睿波
杜比睿波是MPEG-4 AAC音频编解码系列技术的加强和优化版本。杜比设计它的目的是为了提高这种格式的功能性、灵活性与可靠性,同时充分保持向前向后的兼容性,它完全兼容ISO/IEC 14496-3:2005中定义的MPEG-4 AAC、MPEG-4 HE AAC、和MPEG-4 HE AAC v.2。
先进音频编码(AAC)是一种为了实现高效存储与传输而开发的用于压缩数字音频的感知编码方法。在还音时,经过解压的文件所提供的音质与原始音源几乎无法区分。就原理而言,AAC与MP3类似,但是它还具备一些优势:
更高效的压缩
更高的取样率
更好的频率响应
更多声道
为了提高编码效率并降低比特率,HE AAC增加了频带复制(SBR)技术。除了SBR之外,HE AAC v.2使用参量立体声(PS)来进一步增强效率和降低比特率,它传输带有参量信息的单声道,然后从中提取出立体声。SBR和PS都具有向后与向前的兼容性。所产生的结果是HE AAC以160kbps的比特率能够带来5.1音频,以32kbps的比特率带来接近CD音质的立体声,以24kbps的比特率提供品质优良的立体声。
杜比睿波以AAC系列编解码技术为基础。杜比睿波解码器包含一个HE AAC v.2解码器,它能解码AAC、HE AAC和HE AAC v.2比特流,从而发挥出这些技术的全部潜力。
杜比睿波和标准MPEG-4 HE AAC之间的主要区别在于是否支持音频元数据。MPEG-4 HE AAC技术规范描述了一些可选的元数据参数,用以控制诸如机顶盒与电视机中的消费类设备中的音频信号的复制。
杜比睿波集成了让系统发挥广播音频系统之功能所需的一切元数据参数,如杜比数字和杜比数字+。在以下方面它也提供一些重大的改进:
解码器的稳定性:与一般的HE AAC元器件相比,杜比睿波大大优化了切换声道配置的时间,在使用带有杜比睿波编码器的系统时,还提高了可靠性。
误码掩盖:杜比睿波增加了精妙的误码掩盖机制,可以确保可靠的广播音效。
解码器对于内存与计算复杂性的要求:杜比多码流解码器平台内的杜比睿波解码已经整合进入针对H.264片上系统(system-on-chip)架构而优化的合并代码库。
编码器音质:杜比睿波所提供的音质优于其它参量音频编解码器的音质。
既然在基于MPEG-4 AAC的比特流中加入音频元数据只是可选项,那么杜比MS10多码流解码器的优点就在于在其转码器中有这么一种机制,当流入的标准的MPEG-4 HE AAC比特流不包含元数据,在解码这种比特流时该机制能够优化音质。只有当杜比多码流解码器所处理的杜比睿波码流时由适当的杜比睿波编码器所产生时,整个广播系统才能实现最佳的性能。
杜比多码流解码器能把多种AAC内容处理成PCM,同时将该内容转码成杜比数字格式用于多声道码流的输出。得到支持的AAC格式包括:
杜比睿波
aacPlus
MPEG-2/4 AAC
MPEG-4 HE AAC
MPEG-4 HE AAC v.2
最初设计杜比MS10多码流解码器平台时只支持DVB设备((LATM/LOAS格式)。但是在源代码的可交付件中已经包含对在为ARIB(ISDB-T)系统而设计的广播系统中使用杜比多码流解码器的支持。要充分支持ARIB就需要对元器件开发工具包(IDKs)和系统开发工具包(SDKs)进行修改。
对杜比睿波拓展特性的支持是在专用的代码库中实现的,该代码库是杜比MS10多码流解码器的一部分。这种扩展后的代码库提炼出了现有的HE AAC或aacPlus解码器的功能与可靠性,因此它是杜比多码流解码器的重要而独特的成分。但是,杜比多码流解码器对所有的AAC元器件与比特流提供充分的向后与向前兼容性;杜比多码流解码器总是能够解码任何形式的AAC音频,同时杜比睿波码流可以在任何HE AAC解码器平台上解码(尽管在功能与形状上有所降低)。
广播混成vs接收机混成
广播服务提供音频描述为时已久。比如PAL制式就实现了第二调频伴音副载波来承载第一调频副载波上所携带的主音轨的另一个版本,通常第二调频伴音副载波用来承载立体声传输中的右声道。尽管这种“广播混成”的方法仅限传输单声道主音轨和伴随音轨,但它是为视障人士提供基本服务的高效方式。图3显示的是欧洲广播商用来标记那些提供音频描述服务的传输方式的标志。
这种广播混音法是在传输之前的后期制作中将主音轨与评论音轨进行混成,数字电视系统仍然沿用这种方法,因为早期的接收机只具备基本的功能,而数字传输的节目源经常仍然储存在模拟介质上。这种方法也与NTSC系统所采用的方法类似,NTSC系统的副音频节目(SAP)将主音轨与音频描述音轨的预混版作为单声道信号携带。但是由于美国国内的附属广播架构问题,存在着一些技术上的阻碍因素干涉SAP信号通过有线和卫星系统进行传输,因此观众不太能够享受到这种服务。
许多欧洲的公共广播商所提供的大部分节目都带有音频描述服务,他们正面临着继续以“模拟风格”传输其音频描述服务的挑战——就是说,仍然把主音频放在左声道上,把音频描述放在右声道上,基本上就是将主广播音轨作为立体声携带但是作为双单声道信号处理。这就要求广播接收机只将左声道或右声道传给其音频输出端。但是因为这不是DVB的要求,DVB强制规定不同的音频服务必须使用不同的音频PID进行传输和信号处理,因此接收和录制这些服务就成为了一项大的挑战。
时至今日,在很多国家以广播混成方式传输音频描述服务已经成为一种标准的做法。为了通过更高效的方式以接收机混成法的形式为视障人士提供服务的诸多努力最终促成了一项规范的产生,该规范现已成为DVB的一部分。
ETSI TS 101 154的附录E描述了将包含描述音轨的分离式单声道信号与主音轨作为单独的比特流一并传输的基本方法。合适的广播接收机可以接下来在设备自身以内将主音轨与评论音轨混成,因此产生了“接收机混成”这一术语。
图4显示的是支持为杜比MS10多码流解码器所支持的音频编解码器进行混音的接收机混成架构以及来自其它来源的架构,如MPEG-1 Layer II。
[FS:Page];
(待续)