人耳的听觉过程是一个复杂的生理过程,它直接和人耳的机械结构和听觉神经系统特点有关。
人耳特性与人的眼睛特性一样,是非常惊人的。任何一种高精尖的物理仪器对它都会望尘莫及。人耳能经得起自然界最强的声音,同时也能感觉到极微小的声音。例如,对于一个20岁左右健康的年轻人,他可听到的最小声压约为2e-5Pa,这只有一个大气压的五十亿分之一。这种极微小的声压,在频率接近1,000Hz时,使人耳鼓膜产生数量级仅为1e-9cm的位移,这个距离小于氢分子直径的十分之一。
人耳听觉机构
人耳听觉机构实际上与人的眼睛的视觉机构的复杂程度差不多。人耳听觉机构由具有不同作用的3部分组成,即外耳、中耳和内耳。
下图我们每个人耳朵的结构,虽然每个人的耳朵形状不完全一致,但其内部结构基本一致,我们能够听到美妙的音乐,是因为耳朵拥有如此构造的原因。

鼓膜相当于传声器的振膜,而锤骨、砧骨和镫骨相当于什么?
相当于话放!把鼓膜微小的震动通过杠杆的结构进行了震动放大!
然后把这个信号传输到耳蜗里,由耳蜗再变成生物信号。

放大了再看看这一部分的结构

内耳是人耳听觉系统和听觉器官中最复杂和最重要的部分。内耳中有一个专司听觉的部分,它是一个螺旋形的圆通道,称作耳蜗。耳蜗是一个由骨质所组成,具有蜗牛形状的中空器官,内部充满一种无色的淋巴液体。另外,耳蜗处还有一个也是被弹性膜遮住的称为圆形窗的小孔。圆形窗的作用相当于一个施压装置。在内耳中,接受声音振动后,起“感觉”部分的是一个螺旋线似的胶质薄膜,称为基底膜。这是一个十分重要的振动膜,它从卵形窗直到耳蜗顶端沿耳蜗的整个通道分布着。
耳蜗中的淋巴液被基底膜分隔成两部分,只是在耳蜗基底膜的底端蜗孔处被分隔的两部分淋巴液才混合在一起。沿基底膜表面分布着专司听觉的毛状神经末梢约25,000条,其中最重要的听觉神经主干为前庭神经和蜗神经。

耳蜗及里面的毛细胞,就是换能器,把声能转化为化学能,再变成生物电,通过神经进行传导。这样我们的大脑就得到了“声音”信号。
而耳蜗里面的毛细胞,是很脆弱的。随着年龄的增长,比较短的毛细胞会发生脱落,而对于短的毛细胞,则对高频更敏感(高频的波长比较短)。所以年龄增长,则高音的听感越来越差。我们在工作中,也应该注意有意识的进行修正。
声音属于波数据,有频率属性。根据耳蜗的结构可以发现,人类耳蜗对声音的传导主要是在数据的频率空间,而不是特征空间,和视觉一样属于类似于短时傅立叶变换的模式。

人耳蜗中中大约有30,000个神经纤维,而单个神经元数据传输的极限大约在200bit/s。当然,在特定声音频率范围内,只有部分神经纤维会参与了数据传输,而且相邻感受器之间有卷积效应,相当于模糊。这虽然有助于提高信息的精确度,但却导致了最高分辨率(在1,000-2,000Hz)只有3-4Hz左右,而在一般音乐频率范围内(<1KHz或>2KHz)分辨率更小。
如果你神经衰弱导致耳鸣,那你听到声音一般就是你最强的听力范围,因为该范围神经最密集。

大脑在现有的理论和研究中被分为了不同的区域,每个区域执行了不同的功能。你可以理解为,有的地方是大脑这台计算机的声卡(听觉皮层,auditory cortex,位置在颞叶,负责声音信息的处理)、有的地方是显卡(视觉皮层,visual cortex, 负责处理图像信息,在枕叶的位置),还有控制触觉、味觉等的。
而这些模块具体执行什么工作,是由它接受什么样的信息来决定的。比如耳朵听到了声音(其实是声波震动了耳内的毛细胞,耳朵不是主动去听的,而是被动的,抖M的,呵呵),将这个声音变成了电信号,传输到了颞叶(敲掉耳朵附近的骨头,下面就是颞叶脑花了)。那么颞叶就接收并处理了听觉信息,我们也就根据这个把它叫做听觉皮层了(颞叶不等于听皮层,还有其他的功能哟,就不细说了)。至于为什么是传到颞叶而不是其他的地方,那是写在你基因里的。而眼睛看到的信息就传到了枕叶视觉皮层上了(敲开后脑勺的骨头,就是它啦)
然后我们说,眼睛瞎啦(盲),眼睛就接收不到信息了,那么视觉皮层也就没有信息可以处理。不过大脑不会就这么让它吃闲饭的。神经可塑性(你可以把这种现象为你大脑中的一个工程师),就把大脑中的各种线缆(神经网络)重新接通,比如将传输声音的线缆接到原来是听觉的线上面去(这只是一种比喻,具体的机制和过程是很复杂的),那么你的听皮层就开始处理视觉信息啦。这个新的处理声音的皮层加上原来处理声音的皮层,是不是处理声音的硬件就变大啦?这可以理解为你的声卡升级了。所以盲人的听觉在一定程度上是会变强的。
此外正常人的听觉器官和大脑都能很好的对音乐进行过滤优化,保留有利信息去除噪音,达到最佳效果,这种自带优化现象被称作“心理声学”。与一般的脑放不同,“心理声学”属于被动技能。所以,理论上64-128 kbit/s的声音数据基本上可以达到正常人的听力分辨能力的极限,实际则可能更低。但是,分辨能力往往只是通过“心理声学”对声波进行优化和重新构架,往往达不到对原始声音数据的精确反馈。而目前主流音乐的发展中更加注重对音乐的细节刻画,使得现代人对器材在不同频率范围内音乐的解析度的需求都有很大提高。人耳听觉系统不仅是一个极灵敏的“传声器”,而且还具有“声分析器”的作用,对声音有相当大的选择本领。例如,在噪声场中,人们能够听出某些特殊频率的声音,能够选择出所需要的声音信息,就好像有一组十分可靠“声滤波器”一样(鸡尾酒会效应)。与此同时,人耳听觉系统还具有判别声音响度、音调和音色的本领。
有的人耳朵天生无法分辨声音细节,这类患者的耳蜗一般都有物理缺陷,比如耳蜗有形状上的偏差;部分毛细胞坏死或者功能丧失;或者大脑对声音的后期处理能力过强导致过渡过滤。很可惜,这类残疾问题是无法通过技术手段解决的。
老年人听力退化也会产生类似效果甚至失聪。
因为音乐的魅力在于细节,任何一点噪声和细节的改变都能很大程度改变音乐艺术家所要表达的情怀。这类人大多会失去对音乐的兴趣,有的大概一辈子也无法领悟如何欣赏音乐,无法理解何为低频上的下潜深度和解析力,以及高频上的明亮程度,无法和正常人一样欣赏音乐。
所以如果你想用心体会音乐,你会发现杂音就是在玷污音乐让耳朵吃屎。只有彻底还原现场的氛围才能正真入门欣赏音乐。
所以,当你认真去听了现场音乐,或是真正的高保真音响后,你会发现,原来熟悉的音乐,还有那么多的细节我以前是没有听到的。
我们应该推动HI-FI的发展,培养人们欣赏音乐的素养,而不是拿个能响的手机、MP3之类的,听动词大次、动词大次、动词大次……
据统计,在人的一生中,每过10年听力损失几乎倍增,但是,相比男性、白人及拉美裔人士,任何年龄段的女性及非裔人士明显较少出现听力损失。推测是因为雌激素和肤色较深的黑色素,也对耳朵有保护作用,这也许可以解释这些人群中听力损失率较低的原因。
很多老年人的听力损失,都是由于在年轻时期被过度的噪音影响所致,因此从青年时期就必须注意耳机的音量,音量过高会加快听力损失。

特别是我们做音响工作的,要非常注意不要过度的使用大音量来刺激我们珍贵的耳朵。一般情况下,尽量少用耳机。