05 電子聲 Electronic Sound

從聲音到電流:麥克風

19世紀20年代,查爾斯·惠斯通(Charles Wheatstone)發明了麥克風。它是一種由兩塊金屬板組成的純聲學設備,通過一根有彈性的杆子和一段女裝裁縫常用的絲帶固定在耳朵上。使用的時候需要把自己的頭靠在聲源上(惠斯通很貼心地建議使用一個燒水壺),如果運氣好的話就可以聽得更清楚。意料之中(惠斯通卻覺得很意外),這個設備並沒有流行起來。

現今聲學設備的前身是碳質麥克風,由大衛·休斯(David Hughes)於19世紀70年代發明。與惠斯通的設備不同,碳質麥克風可以將聲音轉化成電。在這種設備中,一個薄金屬片(膜片)壓住充滿碳顆粒的容器,下壓的力改變碳顆粒的電阻,電流從中流過。雖然性能很差,但碳質麥克風在電話中使用了幾十年。

雖然在過去的幾年裏,出現了很多種形式的麥克風設計,幾種專業的類型現在還有,但目前常用的隻有三種類型,即動圈(或動態)麥克風、電容式麥克風和壓電式麥克風。

圖18 動圈麥克風

在動圈麥克風(見圖18)中,膜片連接到環繞固定磁鐵的線圈上。線圈運動時產生低電壓,從而產生一股弱電流。低電壓意味著這種麥克風的質量不足以進行測量工作,所以動圈麥克風主要用在音樂會和錄音棚中。

圖19 電容式麥克風

在電容式麥克風(見圖19)中,膜片形成一個電容板(因此得名)。電容器由一對平行的金屬板組成,其間有一層薄薄的空氣或其他不導電的材料(稱為電介質)。將一塊金屬板連接到電池的負極上,電池就會給這塊板充電。金屬都含有自由電子,而另一塊金屬板上的自由電子會受到和負極相連的金屬板上電場的排斥。被排斥的電子從平板中流出,從而使金屬板帶正電荷。因此,現在整個電容器上都有一個電壓(稱為極化電壓),麥克風可以隨時工作了。膜片板隨著聲波的壓縮和膨脹而移動。巨大的電阻阻止電荷快速逸出,因此聲波被轉換成電壓波動的模式。電容式麥克風具有良好的頻率響應特性,在實驗室和聲級計中被用作測量麥克風。它們對突發聲音的反應也比動圈麥克風快。

晶體麥克風和陶瓷麥克風利用了壓電效應,這種效應是利用了石英或其他一些晶體材料在受到輕微壓縮時會產生電壓這一性質。大多數固定電話都使用這種麥克風,呼叫中心使用的受話器裏也是它。

出於我個人對曆史或專業上的興趣,我將其他類型的一些麥克風列在下麵。

駐極體麥克風是由永久充電材料(在電學中相當於磁鐵)製成的。它們的功能與電容式麥克風類似。

微電子機械係統(MEMS)麥克風是直接蝕刻在矽片上的電容式麥克風,麵積隻有幾平方毫米,而且價格低廉,特別堅固,這意味著它們可以被用於手機及許多其他設備中。

光學麥克風使用閃亮的矽薄膜作為膜片,它可以反射來自發光二極管(LED)的光。當薄膜被聲波振動時,光探測器測量光的變化,然後電子電路將這些變化轉換成電信號。這種麥克風結構緊湊、堅固耐用,不受局部電磁場的影響,因此,在病人進行核磁共振掃描期間,他們可以用這種麥克風和工作人員進行交流。

壓力區麥克風是專門設計在硬反射表麵附近使用的(如必須直接朝向舞台地板放置)。對於傳統的麥克風,麥克風表麵的反射會幹擾麥克風直接接收到的聲音,但是壓力區麥克風克服了這個問題,因為它的膜片離麥克風表麵非常近,以至於大多數波長都會重疊。

帶式麥克風使用金屬帶而不是小的膜片,與鼓膜和大多數其他類型的麥克風不同,它對金屬帶兩側的壓力差產生回應。這意味著金屬檢測到的是隨聲波移動的空氣分子的速度,而不是聲壓模式。通常解說員會在嘈雜的環境中使用這樣的麥克風,因為來自四麵八方的聲音會同時影響金屬帶的兩側,從而使得麥克風不會對這些聲音做出反應。在這個應用場景中,麥克風在靠近上唇的地方有個凸起,這有助於引導解說員的聲音,使它隻撞擊金屬帶的一側。

在嘈雜的環境中準確捕捉聲音的另一種選擇是項鏈式麥克風,這是一種小型的可以夾在物體上的駐極體麥克風或動圈麥克風。項鏈式麥克風的優點是體積小,要將它藏在衣服下麵簡直輕而易舉。

聲強探頭由一對麵對麵的麥克風組成,它測量同一聲波不同部分的壓力,由此可以計算出分子速度並進一步得到聲強。

選擇麥克風的一個重要標準是方向性。比如,理想的全向麥克風對來自任何方向的聲音都有著同樣的敏感度。再比如,在捕獲完整的音效場景時常常需要使用全向麥克風。單向麥克風隻能從一個方向接收聲音,非常適合在嘈雜的環境中接收語音或歌曲。

除帶式麥克風和聲強探頭外,隻要聲波波長比膜片的尺寸大,那麽對這種類型的聲波麥克風都是全方向的。如要使麥克風主要針對從正前方或正後方(雙向)傳來的聲音敏感,隻需讓麥克風前後方都向空氣敞開。膜片不會對四麵傳來的聲波做出太大的反應,因為前部壓力的升降與後部壓力的升降非常相似。但是任何入射到麥克風正麵或背麵的波都會很容易地被接收到。

實現定向的一個簡單方法是將麥克風安裝在截麵為拋物線的反射器的焦點上。隻要麥克風比反射器小,這個拋物麵的形狀就可以將入射聲波反射到膜片上。另一種選擇是將麥克風安裝在一個管道的末端,管道兩側有裂縫,以製造槍式麥克風(又叫遠程拾音器)。聲波沿著管道暢通無阻地傳播,一直傳到麥克風,但來自其他方向的聲波則通過縫隙進入麥克風。每一個這樣的聲音都會進入多個狹縫,形成許多版本,每個版本都有不同的相位。因此,這兩種版本將在很大程度上通過相消幹涉互相抵消。霰彈式麥克風廣泛用於戶外錄音,常常配合攝像機一起使用。不過,這種麥克風對頻率的依賴度很高。

從電到聲:揚聲器

揚聲器與麥克風的原理恰恰相反。如果給一個動圈、電容、晶體或陶瓷麥克風提供一個變化的電流,這些麥克風將因振動產生聲波(這樣的麥克風因此被稱為互易換能器)。大多數實際的揚聲器是反過來的動圈麥克風,稱為動圈式揚聲器(見圖20)。顧名思義,一個電信號被傳送到一個線圈(音圈),該線圈連接到一個錐形的膜片上。線圈包圍著磁鐵,信號在線圈形成的電磁場中使線圈和膜片發生運動。

圖20 揚聲器

因為揚聲器對電能的利用效率比較低,大部分進入揚聲器的電能都轉換成了熱能,隻有大約1%的能量可以被聽到。因此,放大是至關重要的。如今,有了晶體管,放大變成了一件很簡單的事情,主要挑戰變成了確保每個頻率被放大到一個適當的程度。考慮到聽覺係統的非線性屬性,如果要保持輸出聲音音高不變,就必須對不同的頻率進行不同程度的放大。謹慎地選擇放大倍數非常重要。除了會對聽力產生有害影響,揚聲器也很容易被損壞,尤其是人為製造的聲音,因為這種聲音可能會在一個極短的時間內快速變大。此外,如果麥克風發送到揚聲器的聲音又反過來被麥克風接收到了,就會建立一個正反饋回路,導致一種我們非常熟悉的呼嘯音產生。

揚聲器是音樂生產鏈中最不高保真(hi-fi)的環節。雖然原理簡單,但它們的設計會麵臨許多實際的挑戰。揚聲器必須保證當信號降至零時,音圈能精確地回到它的起始位置,而且在任何情況下都不會發生振**,但是又必須處在可以自由移動的狀態。錐體必須在振動時保持其形狀不變,必須非常輕,但又足夠堅硬,以免在重力作用下下垂。與此同時,它必須大到在低頻時也能移動大量空氣(足夠強大的聲波才能被聽到),但又小到足以在高頻時每秒來回移動超過10 000次。此外,其外殼不能與任何頻率產生共振。

實際上,分組使用揚聲器要容易得多。這些揚聲器通常都會組成一個單元,包括一個頻率在2000赫茲以上的小型高音喇叭,一個較大的中頻揚聲器(50~5000赫茲)和一個低音揚聲器(30~800赫茲)。對於那些喜歡低音的人,可能還會加一個低音炮(20~200赫茲)。

低音炮通常是有源揚聲器,也就意味著它們有自己的放大器(因此需要配供一個電源)。其他大多數的揚聲器都是無源的,由外在的信號進行驅動,這些信號常常通過高保真(或其他)係統中的放大器進行了增強。

一個沒有外殼的揚聲器幾乎是無聲的,原因很簡單,揚聲器前方產生的高壓脈衝會悄無聲息地溜到後方,填充剛剛在那裏形成的低壓區。因此,可以把揚聲器放在一個密閉的盒子裏。然而,如果盒子很小,當隔膜向外運動時,盒子裏的空氣很難被壓縮。還有一種解決辦法是將隔膜放在一個稱為擋板的環的中心。擋板必須足夠大,這樣當壓力脈衝跑到隔膜後麵的時候,那裏的低壓區就已經消失了(換句話說,聲波走的距離比最長波波長的1/4要長)。

亥姆霍茲諧振可以用來擴展揚聲器在低頻聲方麵的表現性能。在安裝揚聲器的盒子前麵開一個孔,腔體就會與低頻聲音產生共振。如果盒子的共振頻率低於揚聲器的共振頻率,當揚聲器的膜片向初始位置移動(反射回波)時就會產生壓力脈衝,脈衝在盒子中運動直到出現在盒子開口處,在那裏它將與一個隔膜前方剛剛產生的新脈衝處於同相位。這兩個同相脈衝會相互加強。這適用於一切脈衝,隻要這些脈衝產生的聲波頻率在膜片和盒子的共振頻率之間。

這樣做的缺點是有時可以聽到從端口吹來的氣流,另一個缺點是聲音不會那麽清脆,因為每個信號後麵都有一個短的衰減共振“尾巴”。此外,形成頻率低於該端口頻率的聲波的脈衝會被來自膜片的後續波抵消。超過這兩個共振頻率的聲波既不被增強也不被減弱。

我們的大腦非常善於填補聲音的空白,我們可以利用這一點來改善基頻非常有限的揚聲器。在自然界中,一組200赫茲、300赫茲、400赫茲和500赫茲的音調幾乎總是基頻為100赫茲的諧波(泛音)。因為大腦的聽覺中樞(見圖16)“知道”這一點,所以它會自信地斷定100赫茲確實存在。但是,如果一組音調來自一個小型揚聲器,那麽很可能實際上不會有100赫茲的音調。這種效應被稱為缺失的基頻,這也是為什麽在埃皮達魯斯劇院(見第1章)聽那些缺失低頻的音樂卻不會覺得奇怪,因為觀眾的聽覺中心自動補足了這些頻率。這也解釋了為什麽盡管早期電話的低頻傳輸信號並不好,

但是仍然有相對足夠的清晰度。

高性能麥克風、擴音器和揚聲器使唱片業發生了革命性的變化,而且由於唱片本身不需要更改,這種變革可以快速進行。緊接著,社會也發生了變化,一時間,幾乎所有人都能接觸到音樂,並選擇自己喜歡的音樂。

聲音研究專家喬納森·斯特恩(Jonathan Sterne)稱,這種新的聲音媒體“對經驗和存在的基礎提出了質疑”。此外,這種聲音媒體對表演者同樣產生了深遠的影響,正如音樂曆史學家羅伯特·菲利普(Robert Philip)所指出的,許多人對他們在錄製表演中聽到的錯誤數量感到震驚。音樂學家馬克·卡茨(Mark Katz)認為,這些表演者陷入了一個“反饋循環”,他們試圖呈現出越來越多的“完美”表演,但當他們聽到錄音結果時,卻一次又一次地失望。於是,表演變得不那麽個性化,失去了自發性,開始更加標準化。聽錄音的體驗也帶來了另一種反饋,例如,小提琴顫音最初是一種留聲機效果,但很快就被表演者模仿。

接下來的一次聲音革命是1933年立體聲留聲機的發明。它是通過在凹槽的兩側分別錄製互成90°以及與鉛直麵成45°的兩個信道來實現的。立體聲唱片的引入,意味著原則上可以再現整個原始表演的三維聲場。這就產生了揚聲器理想放置位置的問題,這一問題一直吸引著音樂愛好者。同時,也引出了“保真度”(fidelity)的概念,因為人們現在追求的效果是再現一個原始的表演。20世紀70年代之前,許多流行音樂作品從未像現在這樣演奏過,當時音樂的大部分內容都是在樂隊離開後添加的,這種情況隨著後期處理和混合技術的進步而有所改善。然而,對古典音樂來說,保真的錄音仍然是關鍵。盡管數以百萬計的業餘愛好者和專業聽眾、錄音機、表演者和演奏者對“保真度”有著數十年的興趣,但我們仍然無法對“保真度”進行量化。

存儲的聲音

當擴音技術和揚聲器的設計得到完善之後,人們主要擔心的是記錄的脆弱性。一種關於如何處理、收藏、清潔,以及經過訓練後正確播放錄音的文化因此形成了。自動換片器的出現讓一部分人很高興,不過另一些人則將其視為最令人掃興的發明,還有人認為它是新興的唱片破壞機。之所以會這樣,一部分原因是自動換片器具有神秘感,另一部分原因是傳統黑膠唱片,尤其是後來被稱為專輯的密紋唱片(LP)質量極高,這讓它們被尊崇的程度空前絕後,甚至至今仍有銷售。

1964年,模擬盒式磁帶作為一種強大又袖珍的唱片替代品被引入市場,並開始流行起來。盡管磁帶很容易買到,但許多人寧願買一張黑膠唱片,然後(非法地!)把它燒製到磁帶上聽,同時保持錄音的原始精度。無線電廣播也可以用這種方法錄製,組合音響由無線電、盒式錄音機和唱機組成,因為它錄製盒式磁帶時最方便,所以變得很受歡迎。

但是磁帶有兩大缺點,選擇音樂時轉帶子(倒退或者前進)耗費時間,而且不可避免地發出高頻嘶嘶聲。杜比係統的許多變體在一定程度上減弱了嘶嘶聲。這些係統都是在錄製一個音軌時將高頻信號增強,然後在回放時抑製整個音軌來生效。這是一種叫作壓展(壓縮和擴展的合成詞)的技術。

立體聲使人們對研究新的聲音設備充滿興趣,並取得了很多新成果,磁帶的製作也進一步發展。混音帶就是磁帶製作上的一個新成果,另一個新成果則是索尼隨身聽,它讓音樂愛好者無論身在何處都能聽音樂,不過,這有時會惹惱坐在旁邊的人。

我們需要做的是完全拋棄模擬錄音,也就是說,將聲音以連續變化的形式存儲(無論是物理的,如黑膠唱片,還是磁性的,如盒式磁帶)。在數字係統中,信號被編碼為一串數字,以這種形式存儲、傳輸或複製不會降低信號,也不會產生背景噪聲。

乍一看,為了捕捉複雜聲波的複雜性(如圖9所示),我們似乎必須測量和編碼該聲波的許多點的振幅。事實上,對聲音的采樣頻率是希望保存的最高頻率的兩倍就可以了。因此,要編碼一個包含最高頻率為8千赫的信號,我們就必須以16千赫進行采樣(這就是眾所周知的奈奎斯特定理)。如果以較低的速率采樣,編碼的數據就會失真,這就是所謂的混疊效應。

1982年光盤(CD)的推出導致了從模擬到數字的大規模轉變。在CD上,數字編碼的信號存儲成光盤閃亮金屬塗層上(塑料基片中)的深色凹坑,通過激光掃描即可讀取,因為光盤上光滑的區域可以反射激光,但凹坑無法反射激光。CD播放機將反射翻譯為1,非反射翻譯為0,1和0的字符串將音頻信息編碼成二進製數字序列。

當然,如今購買、存儲和播放音樂都是極為普遍的行為,甚至無須使用物理媒介。音頻文件可以簡單地下載到電腦上,通過各種設備播放。計算機通常是MP3播放器的一部分(MP3原意是“動態影像專家組音頻層III”)。

MP3音頻文件的神奇之處在於它們攜帶的文件非常小,大約隻有CD文件的十分之一,這意味著一分鍾的MP3音樂可以壓縮到兆字節。能夠壓縮到如此令人吃驚的程度,是依靠一種叫作霍夫曼編碼的技術實現的。在這種技術中,出現概率高的符號用較短的方式進行編碼。另一方麵,該技術對那些一丟失就引起人們極大關注的頻段(主要是語音頻率)會進行更加充分的編碼,而對那些不受人們關注的頻段則輕描淡寫。

由於MP3播放器在決定歌曲壓縮過程中需要去掉哪些信息時,同時考慮了音樂和聽者,斯特恩得出結論:

MP3包含了對交流、聽或說、“心靈的耳朵”如何工作以及對音樂創作的實際與哲學層麵的理解。每一個MP3的編碼是由各種聲音組成的一個世界,其中還有聲音實踐的整個曆史。MP3編碼器通過計算不斷變化的錄音內容與聲音間的間隙,並據此構建聲音間的時間對應關係來形成文件。MP3編碼器工作得很好,因為它將想象中的傾聽者定義為“非理想條件下的不完美的聆聽者”,猜測這些聽眾不會一直將注意力集中於他們正在聆聽的聲音,而編碼器的猜測經常是對的。

高效的音樂編碼利用了這樣一個事實,即經過數十億年的發展,我們的聽覺係統已經進化到會對與我們最相關的聲音做出反應。再加上聲音本身的局限性,我們對聲音世界的直接接觸被限製在一個頻率範圍內,而這個頻率範圍隻是實際存在的聲音的一小部分。那些聽不見的領域將是第6章的主題。