【摘要】本文介绍了立体声音频信号相位对听觉和广播调制的影响,分析了立体声音频信号相位监测的基本原理,列举了常见的两种立体声音频信号相位监测的算法,最后提出了对立体声音频信号相位监测的建议。
【关键词】相位 相关系数 监测
一. 声音的相位关系对听觉心理影响
我们确定声源位置的方法是通过神经中枢系统利用双耳对声音的声级差、相位差和听觉的延时差以及声音信号的频谱特性来确定的。如果在一个立体声系统中,我们的前方的左、右扬声器发出完全相同的声音信号,且我们处于与左、右两个扬声器相对称的位置,即与两个扬声器的距离恰好相等。这样,我们的双耳所接收的信号就是声级相同的同相信号。此时,我们所感受到的信号就好像在两扬声器之间中点的声源发出的声音一样,也就是说,两个直接的声源,即左、右扬声器建立了一个幻象声源。如果改变来自两个扬声器每一扬声器的信号强度,那么这个幻象声源的位置也会随之移动。例如,增大左扬声器的信号强度,那么到达听音者的双耳之间就会出现声级差,幻象声源会向左移动。
除了声级差之外,声音信号到达两耳之间的相位差也会引起不同的效果。我们的大脑将两个同相信号当作是来自于某一特定位置的同一个声源,而该声源的定位则取决于这两个信号之间的声级差。而如果存在相位差,大脑将两认为这两个声音来自不同的声源。因此,两信号之间的相位差会弱化声源的定位而降低幻象声源的存在,此时我们会感觉到声源来自于一个宽广的空间范围。相位差大的两个声音信号,将消除大脑中幻象声源的错觉,我们的大脑不再意识到幻象声源的存在。在一个立体声系统中,我们可以用驱动左、右扬声器的声音信号之间的相关度这个术语来描述上述特性。两个相同的、同相声音信号的相关度等于+ 1。在这种情况下,这两个声音信号将产生定位准确的幻象声源。如果两信号非常相似,例如两信号具有很小的相移,那么它们的相关度值接近于+ 1。这两个信号也将产生一个幻象声源,不过这时听音者对幻象声源定位的准确性就要差些。
假设这两个声音信号的差别增大,或者说它们具有较大的相移,那么它们之间的相关度值就趋近于0。如果用这样的不相关信号来驱动多声道系统的各个扬声器,将不会产生位置确定的幻象声源。在这种情况下,听音者所感知的声音信号是分散的、声源位置不确定的、仿佛是来自周边的声音。如果两声音信号趋近于相位相反的状态,那么这两个信号将互相干扰,会觉得声音好像来自于扬声器位置之外。相位相反的两个信号即相位差为180°的两个相同信号,它们之间的相关度为- 1。
二. 信号反相对FM与AM广播调制的影响
1. 立体声调制原理
·将L(左声道)和R信号(右声道)进行叠加(即L+R)称这种和信号为M信号;将L信号与R信号相减即L-R,我们称这种信号为S信号。
·将S信号调制于38KHZ的副载波(调幅制AM),调制后再将38KHZ的已调幅载波通过一个称为平行器的将38KHZ副载波抑制掉,仅留下38KHZ已调波的上下边带分量。将S信号进行这样的处理目的是使S信号变成±S。
· 将L+R信号和上下边带信号与19KHZ导频信号同时加到环形调制器中进行混合叠加成为立体声复合信号。
· 将立体声复合信号与主载波(88?108MHZ)以FM方式进行调制后发射出去。
·编码后的复合信号可用下式表示:
A(t)=(L+R)+(L-R)cosωt+ρcos(ω/2)t 。
式中:(L+R) 为主信号项M,
(L-R)cosωt 为副信号项S,
ρcos(ω/2)t 为导频信号,
ω 为38kHz 副载波的角频率,
ω/2 为导频信号的角频率,
ρ 为导频信号的振幅。
其中, 主信号S项(L+R) 供调频收音机解调出音频信号, 它使调频收音机也能收听到立体声广播。
2. 立体声信号的解调
立体声信号的主要部分是差信号±S,在单声道接收机中此信号被去加重电路滤除了,在立体声解码中就必须依靠S信号,将S信号和M信号相加、减来获得L、R信号。M+S=(L+R)+(L-R)=2L、M-S=(L+R)-(L-R)=2R。由于单声道接收机中只使用M(L+R)信号,而当出现反相的情况时M信号的能量等于L、R信号能量的差值,故将影响接收机的收听效果。
在实际工作中, 我们会遇到由于各种原因造成的完全反相问题( 一是立体声平衡连接线其中之一倒相, 二是声学环境出现声学倒相), 即左信号L 和右信号R 相位差为180°, 其结果是, 复合信号中主信号项(L+R) 几乎为零。即A(t)=0+(L-R)cosωt+ρcos(ω/2)t 。它使普通调频收音机在鉴频级不能解调出L、R 音频信号,同时去加重电路滤除掉(L-R)cosωt、ρcos(ω/2)t, 最后使扬声器不能发声,影响接收机的收听效果。
3. AM信号的影响
目前国内广播电台在制作和播出传输阶段,音频信号处理基本是双声道方式,发射台一般将双声道信号进行L+ R 处理,或只采用某一声道作为激励信号。当L+R信号处理的情况下,节目信号反相将导致信号和能量减弱,当信号完全反相时甚至导致发射机无激励信号无声音情况,影响接收机的收听效果。
三. 相位与相关度理论
1. 相关度理论
在统计学中,皮尔森相关系数,有时也简称为PMCC,通常用r或是ρ表示,是用来度量两个变量X和Y之间的相互关系(线性相关)的,取值范围在[-1,+1]之间。皮尔逊积矩相关系数在学术研究中被广泛应用来度量两个变量线性相关性的强弱,这种相关系数常被称为“Pearson的r”。
两个变量之间的皮尔逊积矩相关系数定义为这两个变量的协方差与二者标准差积的商,即

上式定义了总体相关系数,一般用希腊字母ρ(rho)表示。若用样本计算的协方差和标准差代替总体的协方差和标准差,则为样本相关系数,一般用r表示:

另外一个与上式等效的定义相关系数的公式是通过标准化以后变量均值的积定义的。假设样本可以记为 ,则样本Pearson相关系数为

其中
,和分别为标准化变量,样本均值和样本标准差。在统计规律的基础上,人们找到了在瞬时状态下r的表达式:

音频信号一般可以认为是理想正弦波信号,因此结果简化为:

为两信号相位差 
2. 相关系数与相关性的关系
在数学领域,以及应用到经济学、统计学等各学科的科学分析、统计研究中。许多学者都提出了通过相关系数大小判断变量相关性的标准。但是这些标准或多或少的与该领域的实际情况相关,不一定完全适合音频领域。相同相关系数对相关性大小的判断取决于不同的背景和目的。同样是0.9的相关系数,在使用很精确的仪器验证物理定律的时候可能被认为是很低的,但是社会科学中,在评定许多复杂因素的贡献时,却可能被认为是很高的相关性。根据统计学规律,一般情况下相关系数与相关度有如下关系:
相关性 |
负值 |
正值 |
不相关 |
-0.09~0.0 |
0.0~0.09 |
低相关 |
-0.09~-0.1 |
0.1~0.3 |
中等相关 |
-0.09~-0.3 |
0.3~0.5 |
显著相关 |
-0.09~-0.5 |
0.5~1.0 |
3. 音频声道间相关性与声像的影响
如果某双声道音频的两个信号具有+1的相关度,那么就可以在这两个扬声器之间给出准确的幻象声源的位置。幻象声源定位指针的位置由邻近声道中两个信号之间的电平关系所决定。如果某双声道音频中两个声道的音频电平相等,那么音象就会出现在与该声道对相对应的两角之间的中点上,表示听音者感觉到这两只对应扬声器之间的中点上存在着一个幻象声源。如果两个声道具有不同的音频电平,那么幻象声源的位置会向电平较高一侧的扬声器移动,与此相对应,幻象声源定位指针也会向音频电平较高的声道相关的那个角移动,当某双声道音频中的两个信号之间的相关度降低时,会给其对应幻象声源的定位带来某种程度上的不确定性。非立体声源产生的相关度在0.9以上。在立体声记录中,两信号之间的相关度数值一般在0.5 到0.7 之间,但却可以建立一种可以被听众所接受的、相关值在一个广阔范围内的声音印象。不相关信号产生的是一种漫射式的环境声,其典型的相关度在0.2 至-0.3 之间。由于这样的信号不能产生位置确定的幻象声源。如果两信号完全不相关,即相关度等于0,表明使听音者感受到的一种散射式的环境声。此时尽管该邻近声道对不能建立幻象声源,如果两信号间的相关度进一步减小,向-1接近,但如果相关度降至比-0.3 更小,表示这是一种人们可能不希望出现的反相状态,当-0.3 至-1.0认为是一种反相状态。
四. 音频相位检测的实现方法
音频相位检测的实现方法目前没有在任何的国内或者国际标准中做出规定,根据我们对目前国内音频相位检测设备的调研结果对音频信号相位监测国内目前主要通过两种算法实现:相关度算法和拟合度算法。相关度算法多见于检测仪器厂家,可模拟数字电路实现,模拟、FPGA,DSP适于实时分析。在音频应用系统中相关度基本算法和耦合度算法多都比较常见。
1. 相关度算法
使用相关度算法来实现相位检测,在音频检测仪器厂家中十分常见,如RTW、TC、Tektronix等公司。
相关度相关度算法是通过模拟电路、FPGA法、DSP法来实现的,相关表实际实现过程如图1:

相关表显示的相关系数r,满足下表的规则:
L,R相关性 |
相关性系类数r |
完全相同 |
+1 |
完全相反 |
-1 |
|相位差Φ|<2nπ+π/2 |
0<r<1 |
2nπ+π/2<|相位差Φ|<2nπ+π |
-1<r<0 |
|相位差Φ|<2nπ+π/2,或其中1路为0,或不相关 |
0 |
对于理想正弦波信号,经限幅放大为方波信号,相关度算法表达式的结果简化为:

为两信号相位差 

根据图2所示,对于稳态信号,相关系数在-0.75时,左右声道相位差约为150°?160°或200°?210°
2. 拟合度算法
拟合度算法主要出现在国内的音频信号监测厂商的产品中,是一种国内流行的统计学算法,现以国内某音频监测设备生产厂商,对其原理进行说明:
每次音频采样是1024组数据,判断其左右声道电压正负情况,若相反,认为一个反相位。若1024组采样值中反相数量超过1024ד反相概率”个时,认为该次采样是反相的。例如,反相概率设置为60%,那么1024个采样中如果有1024*60%=614个采样点是反相位的,就认为该次采样是反相的。而对于一段时间内音频信号是否反相的判断则还需要如下几个定义:
(1)“检测时间”:在采样率不变的情况下与采样率成正比,能够通过采样率计算得“检测时间”与采样次数的换算关系,即得到多少次采样对应所设定的检测时间。
(2)“敏感度”是在一段检测时间内出现反相的比例,实际发生报警的条件为:反相次数大于检测时间对应的采样次数乘以“敏感度”。
(3)若有“报警延时”,则满足上述条件后还需要等待报警延时所设定时间(转换为采样次数)后发送报警信息。
例如,当检测时间为1秒时,1秒钟约有48次1024采样组(48k采样率时),若敏感度设置为50%,48*50%=24,即48次1024组采样中有24个采样组是反相时,则认为此音频是反相的。由于立体声音频有短时间的反相是正常现象,所以上面提到的反相概率、检测时间、敏感度和报警延时都是经验值,设置这些参数的目的是消除音频解码中正常反相的误报。

五. 总结与展望
音频相位检测一般是通过相关系数来表示的,相关系数在-1~1之间取值,但行业内缺乏音频相位显示表标准,没有规定音频相位表指针的变化与相位的关系,以及相位指示表的上升下降时间,这样造成不同的厂家生产出来的相位指示表监测同一段音频信号,表头显示的内容会有明显的差异。
相位监测方法,在算法上目前行业中计算相关系数的方法主要有相关度算法和拟合度算法两种,同时监测信号的性质是随机的。RTW、泰克等相关仪器上均未配备类似功能,DHD播出调音台在手册中明确不推荐使用配置函数中的相位检测逻辑,仅提供相位相关表,借由人员来分析判断相位异常。根据我们对目前几种带有相位监测报警功能的系统进行分析,结合我台的实际应用经验,认为两种算法原理上都基本可行,两种算法都能够对音频信号反相进行有效的监测,但由于算法的原理不同除了-1、0、1三个特殊点以外,两种算法计算出来的相关系统存在差异,而实际应用中对反相的监测相关系数的临界值一般规定在为-0.75,当音频反相处于此临界值附近是容易造成两种算法实现的系统一种认为音频反相,另外一种认为不反相。为了解决以上问题,统一相位监测,对相位监测采用素材测试法。建议规定若干音频片断,使用不同监测系统进行监测,测试被测系统的相位监测结果,以达到统一相位监测结果的目的。B&P
参考文献
1.《环绕声音频的监视》 Tektronix公司
2.《广播用相关监测仪器的研制与开发》 陈锋 天津人民广播电台录制部
3.《皮尔逊积差相关指数学原理:线性代数观点》黄富廷 国立台东大学特殊教育学系
4.《BA1404调频立体声发射芯片的原理与应用》朱永辉 《国外电子元器件》 2000年04期