04 聽到聲音 Hearing Sound

聽力的範圍

能夠聽到聲音並不是一件稀奇的事情,因為強大的聲音會振動身體,就連單細胞生物也能感覺到。但是,能夠像人類一樣聽得那麽清楚,簡直就是奇跡。功率10~15瓦的聲音移動鼓膜的幅度比氫原子的直徑還小,即使是功率這麽小的聲音,我們也能夠輕鬆聽到。

我們能夠聽到的聲音的強度範圍也同樣令人驚異。人類可以聽到的聲音中,最安靜的聲音(聽力閾值,0分貝)和疼痛閾值(約130分貝)之間的差距十分巨大——130分貝,這個數值相當於價值1000億英鎊的便士數量(1013)。

我們還可以聽到相當廣泛的頻率範圍:大約10個八度,比鋼琴鍵盤還多幾個。而對於遠遠低於和高於這一頻率範圍的聲音,雖然我們無法真正聽到,但卻可以感覺到,這一點將在第6章做出解釋。我們對於聲音的頻率有非常好的辨別能力:大多數人都能察覺到大約1/4個半音的差異;在理想條件下,我們甚至能夠分辨大約1/12個半音的差別。相比之下,我們對聲音方向性的判斷能力則相當一般。即使在十分有利的條件下,我們也隻能確定水平方向10°左右、垂直方向20°左右的聲源的方向。在這方麵,許多其他動物都遠遠超過了我們。

也許我們所有聽覺能力中最令人驚歎的一點是,即使談話的聲音不到背景噪聲水平的10%(假設背景噪聲的頻率分布很廣),我們也能夠聽清楚:這遠遠超過任何機器的極限。

我們的耳朵有兩種功能:聽覺和平衡。平衡完全由半規管負責(見圖14)。耳朵的其餘部分就可以自由地根據我們的需求演化出最合適的係統。但我們的發聲器官卻不是這樣,作為人類進化過程中出現相對較晚的器官,它必須自己擠進臉頰和下巴之間,並與它們共享之前用於呼吸、進食、舔舐、吮吸、親吻和戰鬥的那些身體結構。不過,對一個訓練有素的演員或技藝嫻熟的歌手而言,他們的發聲係統可以像斯特拉迪瓦裏小提琴一樣完美地工作。

圖14 耳朵(中耳和內耳經大比例放大)

耳朵能聽到什麽

如圖15所示,我們的聽覺係統還沒有進化到可以測量聲音的物理功率。例如:短笛的最大功率約為0.08瓦,而長號的最大功率約為6瓦,但長號聽起來比短笛更安靜,這意味著長號演奏者必須比短笛演奏者更加用力(實際上短笛演奏者從來沒有在任何常見樂曲中全力演奏過)。實際上,所有樂器的功率都很低。一個響亮的管弦樂隊全力演奏的功率可能達到60瓦。如果這樣的演奏持續兩分鍾,產生的能量足夠煮開一湯匙的水。

圖15 聽力與頻率的相關性

此外,這些能量從聲源產生後會向各個方向傳播,因此,如果你坐在離這樣一個管弦樂隊10米遠的地方,隻有不到0.01%的能量會到達你的鼓膜。實際上,鼓膜所探測到的不過是空氣帶來的一係列快速撞擊,除了它們撞擊的力度和到達的速度之外,這一過程並沒有傳遞其他任何信息。我們之所以能夠體驗到一個充滿情感和富有意義的聲音世界,要歸功於解剖學、電化學和神經學上都高度進化的處理係統的精確協調。

外耳:捕捉聲音

耳郭是耳朵的可見部分,像漏鬥一樣,主要起著收集聲音的作用。耳郭前後不對稱的形式也有助於收集聲音在傳播方向方麵的信息。一些哺乳動物的外耳可以移動,有助於他們感知聲音的方向。雖然有些人也有這種能力,但這除了娛樂價值之外沒有任何用途。

由於耳道是一個約3厘米長的圓柱體,而共振波長為這個長度的兩倍,那麽相對應的頻率為3000赫茲左右。該頻率能量的增加會導致其他頻率能量的損失,因此耳道就像一個帶通濾波器。

在耳道的末端是鼓膜,一個約1厘米寬的圓形皮膚盤。它與耳道呈一定角度傾斜,以最大限度地擴大其麵積,從而接收盡可能多的能量。鼓膜略呈圓錐形,這使得它比扁平形狀能傳遞更多的能量。3000赫茲以上的頻率在鼓膜上不會形成共振,鼓膜的表麵以一種混沌的方式運動;而對較低的頻率而言,由於其波長比鼓膜尺寸大,因此鼓膜會做整體運動。因此,它能夠以極小的濾波形式傳輸盡可能廣泛的頻率範圍。實現這種近乎平坦的頻率響應一方麵是通過外耳的不對稱形狀,另一方麵則依靠膠原纖維的內部支架。

鼓膜必須緊繃著,但是又不能僵硬,這一點很重要,是通過咽鼓管對內外部壓力進行平衡實現的(我們通常將咽鼓管畫成開放的,但通常情況下它並不是開放的,除非有明顯的壓力變化導致其打開,這時會產生一種獨特的哢哢聲)。

中耳:聲音增強

鼓膜與三塊被稱為聽小骨的微小(實際上是最小的)骨骼相連,這些骨骼占據著充滿空氣的中耳。它們的主要作用是將鼓膜寬而淺的運動轉化為對第二層鼓膜的高壓“輕敲”,這層膜叫作“圓窗”,也是進入內耳的通道。聽小骨起了杠杆的作用,使力增加了1.5倍。然而,這種力增強的主要方式其實是通過鼓膜和圓窗的麵積之比實現的,將力集中在一個更小的區域,從而將壓力增加大約20倍。聽小骨還通過聽覺反射為內耳提供一些保護(見第8章)。

內耳:從聲音到電流

內耳充滿**,就像鼓膜把通過空氣傳播的聲音轉化為通過骨頭傳播的聲音一樣,圓窗可以將骨骼傳播的聲音轉化成通過**傳播的聲音。聲音將沿著一個被稱為耳蝸的長約2厘米的盤管傳播。在它的末端有一個孔(螺旋孔),聲波通過這個孔後沿著第二根管道傳播回來,第二根管道沿著第一根管道的延伸長度與其連接。當聲波完成它的雙程傳播返回時,它必須被消除,否則它會反射回耳蝸幹擾新到達的聲波。所以,第二管終止於另一層膜——卵圓窗。當聲波到達卵圓窗時,卵圓窗向外膨脹,將聲能轉化成熱能,然後消散。

基底膜將聲波轉換成神經脈衝,它像長棍麵包的餡料一樣在耳蝸的管子之間流動。如果沒有像蝸牛那樣卷起來(拉丁語中,耳蝸即蝸牛),耳蝸中並排的管子就會長達5厘米。由於耳蝸的長度與聲波的波長有關,因此所有哺乳動物的耳蝸長度都非常類似:大象的耳蝸也隻比人類的長50%,所以卷曲可能隻是一個節省空間的方式,不具有任何聲學功能。小鼠和其他小型哺乳動物無法容納全尺寸的耳蝸。它們的耳蝸長約1厘米,因此它們隻能聽到3~4個八度的音程,相比之下,我們和大多數其他大型動物都可以聽到8~10個八度的音程。在基底膜上的是柯蒂氏器,其上生長了9排短毛(每排約400個),稱為靜纖毛(stereocilia)。這些短毛沿著膜的長度延伸,並且有神經纖維與它們相連。這些纖維聚集在一起形成聽覺(耳蝸)神經,其將脈衝傳遞到大腦。

基底膜隨著聲波的敲擊而運動。它的底部比尖端更硬更寬,這意味著較低頻率的聲音會引起靠近尖端部分的振**。這些振**導致靜纖毛移動,然後附著有靜纖毛的毛細胞向大腦發送電化學脈衝。由於大腦知道各個毛細胞的位置,它可以通過這種方式確定聲音的頻率(這被稱為聽覺係統的位置說)。然而,當聲音低於1千赫時,整個基底膜都會振**。在這種情況下,一些其他的機製變得重要起來:靜纖毛細胞隨著聲波脈衝發射信號。舉例來說,對一個100赫茲的音調,靜纖毛細胞每秒發射100次信號。

然而,細胞無法在一秒內發射超過500次信號。因此,為了應對更高的頻率,它們麵臨的問題與一支裝備了燧發槍的軍隊遇到的問題類似,如果說重新裝彈需要一分鍾,那麽小隊怎麽能產生間隔10秒的持續的槍聲呢?答案是將隊員分成6組。第一組發射並開始裝彈,10秒後第二組發射,以此類推。在第六組開火10秒後,第一組將完成裝彈並將再次開火。毛細胞正是以這種方式分組工作的。假設第一組在聲波周期達到峰值時向大腦發出信號,第二組則在該周期已經下降到最小值的一半時發出信號,第三組在周期最小值時發出信號,而第四組則在周期返回至最大值的一半時發出信號。以這種方式,這樣的四個單元組可以對頻率比其最大發射頻率高4倍的音調進行響應。

基底膜上的毛細胞也以一種非常不同的方式協同工作。那些排在基底膜第八排或者更外層的毛細胞通過瞬時改變它們的長度來響應傳入的聲波。這種運動放大了內層毛細胞(唯一向大腦發送信號的毛細胞)上的立體纖毛的振動,因此產生了顯著的放大效果。這樣我們能夠聽到的聲音的最低值又降低了40分貝(到了我們原本聽覺下限的萬分之一)。這種活動會產生微弱的聲音,稱為耳聲發射。因為嬰兒太小,無法說清他們是否聽到或到底聽到了什麽,所以耳聲發射對於確定嬰兒聽力係統的功能非常有用。此外,當內耳受到損傷時,耳聲發射就會減弱,所以它們也是聽力學專家檢查聽力情況的有效手段。這種聲音太安靜了(是件幸事),人基本上無法聽見,所以要用非常靈敏的入耳麥克風進行測量。

神經與大腦:從客觀到主觀

從基底膜發出的神經信號並不是模仿聲波,而是包含三個信息的編碼消息,即:(a)有多少神經纖維在同時發射信號;(b)這些纖維沿著基底膜排了多遠;(c)纖維信號發射的時間間隔是多久。大腦通過(a)和(c)可以提取響度信息,通過(b)和(c)可以提取音高信息。

圖16 大腦中聽覺、語言和言語活動的位置。主聽覺區識別聲音,布羅卡氏區既分析又生成語義元素,韋尼克區處理的是語音序列(聽到的、發出的和記住的聲音),緣上回負責發音,角回負責語義處理

我們還沒有完全弄清在大腦的聽覺和語言中樞(見圖16)裏發生了什麽,但處理過程的第一階段是從聽覺神經的輸入數據流中提取顯著特征。這些特征被用來不斷地更新、修改和精煉我們腦海中關於所聽到的事物的模型,比如一個曲調、一句話,或者一段令人煩躁的引擎噪聲。大腦通過預測聲音接下來會怎麽變化來測試模型的準確性。在預測的過程中,大腦會嚐試確定聲音的每個組成部分對於這段聲音的含義所做出的貢獻大小,這個過程被稱為層次編碼。例如,如果有人試圖哼出《飛越彩虹》,哪怕他哼錯了大部分調調,我們也能識別出這首歌,這也證明了我們在聲音預測方麵有驚人的能力。哺乳動物的大腦對傳到耳朵裏的聲音的理解速度幾乎令人難以置信——對一隻狗說“鬆鼠”,如果它能聽懂這個詞,它幾乎能瞬間對其做出反應。

回歸

從進化的角度來說,聽音樂對大腦來說是一件相當不尋常且新奇的事情。通常在聽音樂的過程中,興趣的焦點是外部世界的某個物體,因此聽覺係統的一個重要功能就是定位那個物體。對於高頻的聲音,來自左側的聲音將首先到達左耳,同時由於頭部對聲音的阻擋,大腦會感覺到右耳處聲音的音量比左耳低。當聲波的長度大於兩耳之間的距離時,大腦會比較兩耳中聲音的變化程度。如果一個長波從左側傳來,它的每一個波腹都會率先到達左耳,所以左耳的壓力剛開始是最大的。隨著波的傳播,左耳的壓力下降,而右耳的壓力上升,直到波腹通過,壓力再次下降。然而,當一個波的波長超過4米時,從左耳到右耳的這段距離不會有什麽變化,因此無法判斷它的方向。

大腦用頭部和肩部形狀對聲音的影響來確定聲源是在雙耳水平的上方還是下方。擁有兩隻耳朵的優勢不僅是可以判定聲音的方向,還有其他用途,例如,有的時候即使外界沒有聲音,聽覺神經也會發出信號,但如果這些信號隻來自一側,大腦就會拒絕接收。

大腦的處理係統已經進化到會對它接收到的聲音做出合理的假設,這導致了諸如優先效應(也被稱為第一波前定律或哈斯效應)這樣的現象。大腦的假設是,第一秒到達的聲音表明了聲源的方向。因此,隨後的聲音被認為與第一個聲音來自同一個方向。這使我們能夠在黑暗的空間中定位聲源,而不會被來自四麵八方的回聲所混淆。但這樣的假設會產生誤導,尤其是在那些非自然發生的情況下。比如,讓接收者聽一個位於偏左45°方向、距離大約1米遠的揚聲器傳來的聲音,然後用另外一個更加響亮且完全相同的聲音將其逐漸取代,隻是這個新的聲音來自右側45°方向的揚聲器,但是接收者聽到的聲音似乎仍來自左邊。

對試圖在人群中交流的人來說,雞尾酒會效應會非常有用。在雞尾酒會效應中,特定的詞句(比如一個人的名字)會從嘈雜聲中赫然而出。這也適用於非言語的聲音:指揮家往往對特定的樂器或樂句高度敏感。這種效果之所以產生,是因為無論我們是否在主動傾聽,大腦都在不斷地建立模型,優先找出有重要意義的聲音,比如人的名字。

聽覺是非常豐富且複雜的,正如語言學家羅蘭·巴特(Roland Barthes)所指出的那樣,聲音以三種方式作用於我們的大腦:作為“指示符號”(令人震驚的爆炸聲)、作為“符號”(一個單詞的字麵意思)和作為“能指”(由“結束”這樣的單詞引發的無意識聯想)。根據拉貝爾的說法,聽力在很大程度上也是一種社交活動:

豐富且有起伏的聽覺內容在很大程度上打破了私人和公眾之間的界限。聲音起作用是通過形成連接、群組和結合,這強調作為關係投射的個人身份……把一個人編織進一個更大的社會結構中……為實現共享空間的意義做出貢獻。

拉貝爾還指出,無論我們喜歡與否,聲音都讓我們與他人——哭鬧的嬰兒、吵鬧的鄰居或歡呼的足球支持者產生親密接觸。正如他所說:“聲音創造了一種關係地圖,這種關係往往是情緒化的、有爭議的、流動的。”

聽小骨

鼓膜是造化“工程”的奇跡,但實際上沒有鼓膜我們也能聽清,因為聲波也可以通過頭部的骨頭——特別是耳後的乳突骨到達內耳。將耳朵沒入浴缸,在很大程度上等於切斷了空氣傳播的途徑,所以這時聲音主要是通過骨骼傳播到達大腦的。然而,乳突骨傳導係統相當不敏感。使用空氣傳導,我們可以聽到的聲音比乳突骨所能檢測到的最弱聲音還低40分貝左右。但是,另一方麵,通過骨傳導我們能夠聽到頻率高至30千赫的聲音,這遠高於空氣傳導的最大頻率。不過,可能過高頻率的聲音對我們來說沒什麽價值,它們都以同樣的方式編碼,那些高頻的聲音和20千赫的聲音聽起來音高是一樣的。

寬吻海豚的骨骼聽覺係統要先進得多。它們的下顎長著牙齒,牙齒間隔有規律,角度相同,形狀非常相似,且各自高度取決於它們的位置。這些加起來就構成了一個聚焦陣列,隻要聲源位於正前方,特定波長的聲波就會被顯著放大。因此,海豚可以聽到非常小的聲音,並且可以通過把頭轉動到響度最大的方向來定位聲音。

耳聾

聽力係統是一個脆弱的係統,耳膜或聽骨受到嚴重損害的情況並不罕見。當這種情況發生時,我們必須依靠骨傳導以及人工輔助。例如,愛迪生用他的牙齒把聲音從留聲機傳到乳突骨,那台留聲機上現在仍能看見牙印,述說著當年的故事。

上麵這種情況稱為傳導性聽力損失。如果內耳或聽神經受損,其結果是感音神經性(或說“神經性”)聽力損失,影響的主要是人對高頻率低強度聲音的聽力。在溫和的情況下,它會導致一種叫作“響度重振”的情況,在這種情況下,聲音的“可聽性”會出現突變。在一個聲音響度逐漸增加的環境中,有的人一開始什麽也聽不見,之後會突然聽到特別響亮的聲音。因此,“沒有必要大喊大叫”的抗議活動就是針對那些為了讓對方能聽到自己的聲音而突然提高嗓門說話的人。

感音神經性聽力損失是最常見的類型,其最常見的原因是毛細胞受到物理損傷。當聲音非常高時,鼓膜會破裂(鼓膜也會因頭部受到撞擊或感染而受損)。然而,值得慶幸的是,鼓膜破裂不僅可以愈合,而且通常能恢複得和之前一樣好。

全世界大約有3.6億人(超過全球人口的5%)患有“嚴重妨礙健康”的聽力損失。相對於聽力較好的人,患病成年人的聽力損失大於40分貝,患病兒童的聽力損失大於30分貝(兒童約占患者總數的10%),則可以定義為患有嚴重妨礙健康的聽力損失。年齡在65歲以上的人中大約有1/3正遭受著這種聽力損失的折磨。

在治療耳聾方麵,根據每位患者的具體情況,可以采取不同的治療手段。對於傳導性聽力損失,如果患者還保有部分聽力功能,根據佩戴者的特定聽力損失模式量身定製助聽器是最有效的辦法。這種助聽器通常也具備降噪功能,並且會使用定向傳聲器,以便患者能夠集中於他正看著的聲源。這類助聽器還可以加裝一個振動元件來刺激乳突骨。助聽器在治療感音神經性聽力損失方麵不太成功,因為信號會被響度重振效應所扭曲。

對完全失聰的人來說,耳聾治療困難更大,但在過去幾年中,人工耳蝸植入的出現給他們帶來了新希望。2012年,通過刺激幹細胞生長成毛細胞,失聰的沙鼠能夠恢複45%的聽力,少數沙鼠甚至恢複了90%的聽力。未來的某天,這種方法可能會適用於那些因螺旋神經節神經元受損而喪失聽力的人(這類人約占失聰人群的10%)。一些動物失去靜纖毛後很容易就能再長出來,如貓頭鷹,或許可以通過基因誘導,將這種功能用來造福人類。但貓頭鷹聽力中其他獨有的特性我們並不會使用,比如,貓頭鷹的聽力在春季時最佳,這很可能是因為春季它們需要為自己的雛鳥捕捉更多的獵物。

除了聽力損失,還有其他很多與聽力相關的問題。最常見的就是耳鳴,也就是耳朵裏嗡嗡響。其成因還不太清楚,而且聲音的響度、類型和持續時間很大程度上會因人而異。它通常與過去的感染、用藥(特別是某些抗生素)或創傷有關,而且常常伴隨著聽力損失。

語言的結構

大約100萬年前,我們祖先的聽覺係統產生了微妙的變化,從而能夠分辨語言。人類對自己發聲係統的進化知之甚少。雖然大多數動物都有以可控的方式進行發聲的能力,但相較而言,人類語言的複雜性卻是無法估量的。因此,與研究其他器官(比如腿)的進化不同,我們不能回顧過去那些古老形態,研究其種種發展形勢,然後探究人類怎樣適應這些變化,並進化出與之相配的係統。

在發聲係統最基本的形式中,發出聲音非常簡單。圖17顯示了發聲所涉及的結構。空氣通過一根管子(氣管)從肺部排出,管子上裝有片狀的發聲褶皺(聲帶),它限製空氣流動,當肌肉繃緊時就會振動。增加這種張力會增加振動頻率,但是褶皺的長度會為頻率設置下限,這導致男性聲音的基頻為125赫茲,女性為200赫茲,兒童則為300赫茲(或更高)。對男孩來說,青春期時的聲帶長度會突然增加,這就導致了聲音的變化,即我們通常所說的變聲。

圖17 發音器官

低頻聲音從氣管末端發出後,進入由軟齶覆蓋的聲道後部,在聲道的前麵是硬齶,這樣形成了一個腔,其中的聲音形成名為共振峰(formant)的共振。元音的特征波長就在這裏被設置好,然後通過抬高舌頭來改變聲道的體積,或將聲道分成兩個相連的腔來改變元音的波長。

輔音比元音涉及更多的發聲器官,通常持續時間較短,而且在許多情況下,輔音在發聲過程中就會發生變化。輔音主要有四種類型,分別由它們的發音方式來定義。

爆破音是因氣流突然停止而形成的(因此它們的另一個名字是塞音)。摩擦音和流音則分別需要帶有和不帶有湍流的部分塞音。鼻音把氣流轉向鼻腔。滑音(半元音)包括從一個元音到另一個元音的快速過渡。如表4所示,這個命名係統的不同尋常之處是可以根據發音的位置對輔音進行細分。它同時也顯示了輔音是否發聲,也就是說聲帶是否參與發聲。(腹語演員試圖發出唇音或唇齒音的這一過程會出現需要抵抗嘴唇不自主開合的障礙。有技巧的腹語藝術家可以通過發這些音時加快語速,來規避這個問題。)

由於聲道共振的波長隻取決於其結構,所以改變聲速就會改變這些波長的頻率。因此,吸入氦氣(密度為空氣的14%)會發出“唐老鴨”的聲音,而吸入氙氣(密度是空氣的4.6倍)會發出更為罕見的沙啞聲。

表4 英語輔音

然而,如果我們隻是用我們的發聲器官說話,生活將是一件枯燥的事情。從生理學上講,唱歌和說話沒有什麽不同,隻是發聲的每一個方麵都受到了更精細的控製,音高常常與一個額外定義的值關聯。吹口哨則不涉及聲帶,它需要在嘴唇周圍產生湍流,將能量轉移到聲腔,聲腔起著亥姆霍茲諧振器的作用。要大喊大叫,隻需從肺部獲得更大的空氣力量即可。在竊竊私語中,發聲器官的工作原理與正常說話時一樣,隻是這時聲帶既沒有振動,也沒有完全放鬆,因此當空氣通過它們時,會產生湍流(這被稱為內收)。由於更多的空氣可以在聲帶之間通過,而不激發聲波,所以低語必然是相對安靜的。

我們的聽覺係統比我們最先進的機器都要複雜得多,並且已經進化得非常適合我們,但大自然賦予我們的能力是有限的。除極少部分人外,我們現今所使用的通信技術中的聲音,已經大大超過大部分人的發聲或收聽範圍。正是為了滿足我們對通信的需求,我們才利用電流,甚至是電子,來滿足這一需求。第5章將圍繞如何實現這個功能而展開。