微博

QQ

高效的宽频处理:是魔术还是神话?

2009-09-08 Tim Carroll (Linear Acoustic公司) 《传播与制作》


     近来,有一种音频处理系统的营销业绩再现辉煌,它的设计原理是用单一增益元件来控制音频信号的全频范围。自电话和广播诞生之初,这类被称为宽频处理器的系统就已投入使用,当时的频率响应和电平变化都非常有限。
     毫无疑问,现在时代不同了。现代化的全频宽音频声道在电平和音质方面有时会有显著变化,宽频处理技术是否仍能有效控制其响度呢?

宽频处理架构
     最简单的宽频处理模式就是用一个检波器来控制一个衰减器。
     宽频处理器的任务是为频宽较窄的音频(由训练有素的专业操作员控制)提供保护或额外的平滑处理,或者是控制动态范围相当窄、通过电话系统传输的语音信号时,还是可以产生比较令人满意的效果的。
     现代版的宽频处理器增加了更为复杂的控制环路,能够根据输入的音频信号以不同速率调节衰减量。还可以对控制信号进行加权处理,以减少极低频率的影响,从而最大程度降低最低频谱部分中的强信号对整个频谱的调制作用。这种调制作用称为互调失真。 虽然加权处理和控制环路速率切换可以提升性能,但不可避免会存在过冲问题,因此,宽频处理往往需要辅之以宽频限幅。

现代版本
     杜比数字(AC-3)系统通过其元数据动态范围控制(DRC)机制来实现宽频增益控制。控制字节在编码器中生成,然后应用于解码器中的增益元件,最终形成宽频处理器。该系统对所有声道进行检波和增益控制1,其优势是可以获得数毫秒的超前处理(),这是因为音频编码本身存在不可避免的延时。
     杜比数字的动态范围控制系统是一套极其复杂的多速控制信号系统,这些信号经过严密的加权处理,可最大程度降低互调失真效应。

宽频与频谱平衡
     有些人认为应当维持原始的频谱平衡,对这一说法我们必须谨慎考量。如果原始频谱平衡与广播公司的标准相符,当然一切都没问题。然而,如果由于时间仓促、技术不佳或者其他一些原因造成制作效果有失水准,进而导致原始频谱平衡情况不好,则宽频处理器不仅帮不上忙,还可能使情况更糟。
     人们常常忽视弗莱彻(Fletcher)、芒森(Munson)等人久经考验的心理声学研究成果,图1所示的等响度曲线正是以这些研究成果为依据而产生的。显而易见的是,人耳并不是线性的,对不同响度的信号作出的频率响应也是不同的。

高效的宽频处理:是魔术还是神话?
图1 等响度曲线(弗莱彻-芒森曲线)

     可以看出,较低电平下再现的信号很大程度上取决于人类听觉系统在不同频率下的灵敏度。最安静的曲线(底部线条)显示,当频率约为200Hz和15kHz时,人耳的灵敏度比频率为3.5kHz时低20dB。大多数人都非常熟悉几十年来在接收器中常见的响度控制元件。这类控制元件用于最大程度减少由于在较低电平下听音而感知到的频率响应变化。
     宽频处理器对所控制的音频作出一致的处理。当增益降低许多分贝时,声音往往比原来要显得乏味、单薄。这是无法避免的。有时必须要大幅降低电平,而观众听来始终还是一样的乏味。

在处理过程中加入ITU
     随着ITU BS.1770的发展,现在诞生了一种简单有效的方法,可以对响度进行客观、可重复的测量。表面上看,下一步顺理成章就应当是用这种新方法来取代或增强宽频处理器所采用的检测方法。这种方法的本质基本上属于加权和累计RMS(均方差),非常适合进行长时间测量。
     要实现精确测量,关键是要有充足的积分时间。研究显示,要获得有效的测量结果,至少需要三秒钟时间,而且时间越长,效果越好2。显然,这种速度对于控制在线广播的节目流的响度来说太慢,根本无法有效控制商业广告等内容的响度突变,因为这些内容可能会突然变得非常大声,响度远远超过与之连接的其他节目。如果采用的处理结构是用ITU控制的AGC并辅以限幅器,则意味着内容会受到严重的限幅,直到累计测量值能够适当地降低增益为止。
     采用这类处理方式在听觉上会带来以下后果:由于内容的响度过大、而增益的减少速度却仅与积分器的响应速度相同,使限幅器管理起来非常吃力,因而内容在音频密度上会发生显著变化。 也就是说,解决办法与问题截然相悖: 积分器需要一定时间才能获得准确的结果,而响度突然加大的节目却需要快速调节才能避免过度限幅。

多频处理
     主要得益于20世纪70年代无线电广播处理技术的发展,将音频分割成多个频段的方法不但极大地减少了互调失真,还能够更有效地控制所需的前置放大前置放大处理带来的限制。既能实现更好的响度控制,又可以减少可闻失真,这在历史上还是头一回,此外还有一项附带的好处—频谱平衡也能同时得到很好的保护。唯一遗憾的是,随着广播业开始追求越来越高的音频密度,进而打响“响度之战”的时候,多频处理技术作为终结这场战役的有力武器,始终没有获得赞赏。同时,随着广播音频处理器制造商卖力地将相同或类似产品推广到电视行业,这种压制的处理技术也出现在了电视领域。和所有被滥用的处理技术一样,多频处理结构也遭到了超越必要界限的过度使用,因此造成的严重后果令该项技术的众多优势显得暗淡无光。不过,与许多事情一样,我们也切不可因噎废食,“把婴儿和洗澡水一起倒掉”的做法是不足取的。 
     除了现代数字广播系统提供的极宽的动态范围和频率响应能力外,前置放大这根“棘刺”的拔除堪称是听觉效果上的最大改进。这样一来,就可以立即实现处理比率的大幅降低,同时使多频处理技术的诸多优势重现光芒。

高效的宽频处理:是魔术还是神话?
图2 多核处理结构

     图2显示了典型的现代多频处理结构。请注意,处理流程的顺序是从左到右,速度也是从左到右由最慢变为最快,实际处理速度直接取决于特定部分能在何种程度上对音频进行调节而不产生可闻失真。
     处理流程的开头是一个类似ITU的宽频加权AGC模块,可以对输入的音频电平进行平滑处理,将其调节到最适合后续多频处理部分的理想范围内。 这样有助于减少过度处理现象,同时还可以在该部分使用“门限”机制,以防背景噪声被提升。

[Page]
     分频器具有精心挑选的分频点,可馈入各个AGC,这些AGC均经过悉心调节,可对选定范围的频率作出最佳响应。这些AGC的处理速度比宽频AGC要快,同样,它们也根据后续的多频超前处理限幅器的需要,将音频适当地置于各个频段之中。
     超前处理限幅器可以非常准确地控制峰值,因为它们是在施加增益控制时,提前几个采样对音频进行测量。“超前处理”顾名思义,其行动速度快于实时,因而可以极其有效、而且“了无声息”地进行修正,另外由于峰值修正是逐个频段独立进行的,因而效果更好。
     整个处理过程之后是一个限幅器,用于捕获前面各个环节产生的所有过冲现象。 大多数情况下,最后部分所起作用不大。但是,如果处理器中的节目存在显著变化,它可以有效防止过载。
     各个频率范围的处理流程会随时间而改变,这使得本就较为繁复的信号通路变得更为错综复杂。有些处理器采用自适应时钟同步,因而能够始终优化对输入音频的响应。然而,与简单的宽频处理器不同,各个处理环节只执行自己擅长的任务。有些环节虽然速度快,但操作的增益控制范围受到限制,而有的环节虽然处理的频率范围更加广泛,但速度很慢。

总结
     至此,我们可以明显看出,要处理响度变化显著的复杂音频而又不产生可闻失真,依靠宽频处理技术是无法实现的。
     有人认为,宽频处理是保持原始内容不变的唯一方法,这种观点在人类听觉系统科学中根本找不到现实依据—人类听觉系统本身就是一种多频系统,并且以非线性方式对声音作出响应。
     只需要一个简单的测试就可以迅速揭示真相。宽频处理技术无论多么完善,都只有两种可能:要么保持音效良好,但无法控制响度突然变化的问题;要么能够控制响度问题,但同时会产生可闻失真。
     尽管宽频处理在设计上毫不复杂,但经验表明,这种设计无法行之有效地以在解决问题的同时获得良好的音效。 切记,一部完善的多频处理器能够轻松的通过参数调整,作为宽频处理器来使用,但反之可不行。

视听科技视频号 广告
发表评论