第三章 係統發生語言學:建立語言關係

第一章提到,定義物種的方法之一是將其視為擁有共同祖先的最小生物群,直至再無其他獨特派生特征使亞群體之間相互區別。這種定義方法有兩大基本屬性:一是存在共同祖先,二是沒有個別基因突變。從這個角度來看,這一方法本質上還是曆史性的。

若將這一方法運用到語言分類上麵,一種“語言”可以定義為:某個單一祖先語言係統的曆史分支集合,直到亞群體語言使用者之間再無明顯區別。這種曆史方法具有一定的優勢:我們可能會說“英語”在英格蘭的使用時間已有千年甚至更久,但是,住在倫敦說著現代“英語”的人肯定無法理解(當然也無法被理解)喬叟時代甚至莎士比亞時代的“英語”使用者。“英語”的定義有一個曆史維度,這一維度超越了我們所理解的所謂“相同”語言的概念。

對比生物學上將物種分為屬、目、門等(或者用當前流行的“高階進化支”的說法)的做法,可以進一步將語言間的曆史關係擴展至雖擁有共同祖先卻曆經變化早已各不相同的語言群,因此可以根據語言的不同曆史將其歸入不同的語係。對此,達爾文在《人類的由來》中再次做出預判:“同其他物種一樣,語言也可以被層層分類,可以根據自然演化分類,也可以通過其他特征來進行人為分類。”彼時正值1871年,關於語言的曆史分析及其相互關係風頭正勁,並逐漸被奉為唯一的科學方法。在這一背景下,達爾文的這一說法相對來說可信度較高,並且直到今天仍然值得我們反思。

語言變化

本章所討論的話題就是建立這種語言關係的基礎。而提到語言關係,很重要的一點在於曆史發展過程中不可避免的語言變化。此話怎講?先來看下麵這個思維實驗。暫且不論“民族語”定義的6906這一數字是否準確,甚至無須在意這一數字是否有意義。提到世界語言多樣性,我們都明白這意味著世界上有很多種不同的語言。現在想象一下,這種多樣性在瞬間神秘消失。想象一下出於某種語言魔法,世界上的人突然之間開始使用同一種語言,比方說世界語(有些人真的是很樂於見到這種現象)。先不管這到底是好事還是壞事,也不要考慮如此一來是否會造成知識流失等,現在隻要想象一下這種情形就對了。

你覺得接下來會發生什麽呢?事實上幾乎可以確定,在接下來的20~30年間,一定會出現地方變化,至少會有地方口音。考慮到世界在變化且在不同文化中變化方式不一,不僅會出現地方特色文字和表達方式,語言也會產生鄉土特色。可以說,50年內將會出現明顯的方言差異,而一個世紀之後,方言間的差別會繼續增大,某一地區的人們將很難理解另一地區人們的語言。至於多久可以將兩種方言定義為不同語言,就要看語言差別同社會和政治現實在多大程度上保持一致了。

將這個實驗繼續推進,會得到一個無法逆轉的結果:上述語言間的差異會不斷增大,達到現代羅曼語言如西班牙語、葡萄牙語、法語、意大利語、羅馬尼亞語等之間的差異程度。但所有這些語言的曆史發展仍然表現出單一源語的線性發展,我們的思維實驗中的“單一源語”就是世界語。語言學家們所謂的語言間的“基因”關係也正是此意:所有語言其實都是單一原始共同“祖先”向不同方向發展的結果。

需要注意的是,這裏所說的“基因”關係與字麵意義上的生物關係無關。關於匈牙利語的起源就存在一些爭議。從嚴格的語言學角度來看,匈牙利語與芬蘭語和愛沙尼亞語相關,屬於烏拉爾語係。但基因研究發現芬蘭人和匈牙利人之間並無明顯的生物學聯係,因此關於其起源又有了其他多種假說。其中最合理的一個解釋是:一個移民自中亞的烏戈爾部落來到了被稱為現代匈牙利的區域並征服了當地居民,後者很快開始使用征服者的語言。因此,雖然這三種語言使用者之間的生物關係有所不同,但從語言學角度來看,匈牙利語與芬蘭語和愛沙尼亞語存在“基因”關係。

這一情形也有例外。當一小股維京人(或斯堪的納維亞人)征服現代法國的部分地區後,開始使用當地語言——古法語,促進了諾曼法語的發展。這一語言接著被引入英國,雖不至於被完全接受,卻也極大地影響了英語的發展。具有諷刺意味的是,入侵者的語言實踐(羅曼語,而不是日耳曼語)改變了英格蘭人說的日耳曼語。在大多數情況下,這些入侵者和英國人的生物聯係可能比語言聯係要近得多。

回到討論的關鍵之處,一旦人群中出現可以限製同質化的分界線,語言統一必然會帶來語言多樣性。明顯的內部分界線大多是地理分界線。如果河流、群山、沙漠等將不同人群分隔,那麽一個地區的語言變化將無法在另一地區得到顯現,反之亦然。這就足以產生不同的表達方式,最終形成不同的語言。

但是語言為什麽會變化呢?為什麽我們想象場景中的那些人不能一直說著魔法賦予的世界語呢?事實是,即便忽略科技和社會發展帶來的詞匯變化,語言也處在不斷變化中。關於這一點原因有很多,而曆史語言學家的工作正是要找到一個全麵綜合的解釋。

產生變化的兩大主要原因:(一)說話者傾向於簡化發音;(二)聽者所聽並非言者所言,聽者按照所聽內容進行相應的語言實踐。

第一類情況的很多例子都可以歸入語音同化範疇。例如,拉丁語中“octo”的兩個輔音字母發音位置不同:第一個是軟齶音,發音時舌頭要觸及硬齶的後部,而第二個是齒音,發音時舌頭要觸及上齒。這就意味著舌頭要快速完成兩個不同動作。若在同一位置發音,情況將得到簡化,比如在意大利語“otto”(奧托)中,軟齶輔音由一個稍長的齒塞音代替。這樣做的人數越多,次數越頻繁,有些使用者就會認為這才是該單詞的正確發音方式,“octo”也就會被“otto”代替,意大利語的發展曆史顯然如此。與之類似,瑞典語“dricka”(喝)和“tacka”(謝)同樣存在同化過程:剛開始有鼻音輔音且有一個塞音緊隨其後(如英語“drink”“thank”中的“nk”),後來舍去鼻音部分,僅保留了一個較長塞音。

在現代英語中,我們也可以觀察到語音同化現象在時時發生。例如,有人把“football”(足球)讀作 [fubb?l]。與常見的規範書寫不同,此處(包括其他地方)的方括號代表音標,同字典中的發音指導類似。音標的價值在這裏顯而易見:[u] 是指“foot”中的元音,而 [?] 是指“ball”中的元音。

還有一些概念上類似同化的變化是出於發音考慮,但也有一些變化來自錯誤認知。發音清晰度不夠造成的誤聽便是其中一種。例如,鼻輔音 [m]、[n] 若處於塞音 [p]、[t] 前,要比在單詞開頭之類的其他位置更難區分。聽者可能會對說話者的發音產生誤解,比如可能會把 [gr?npa] 聽成 [gr?nmpa](其中 [?] 代表“grand”一詞中的元音)。當然,在這個例子中說話者可能已將鼻音同化為塞音,但就算沒有,聽話者也很難判定該詞中的鼻輔音來自 [n] 而不是 [m],除非他早就認識這個單詞。

錯誤認知的另一個來源是言語信號天然的模糊性。因此,在某些語言中,無論音節中前後的 [bh] 部分如何,濁音送氣輔音 [bh]、[dh]、[gh] 都帶有一種特別的“呼氣”特性,這也可能是輔音的送氣特質的主要聲學證據。因此,[b] 和 [d] 中間的送氣音 [a] 可以代表任何的“bhad”“badh”或“bhadh”。如果說話者傾向於默認送氣特質來自前麵的輔音,那麽原先的“badh”就可能被理解成“bhad”或最終被其取代。

幾乎每一個單詞的發音都會產生一定程度的變化,要想對單詞有一個恒定的理解,聽者必須繞過這些變化。而他們一旦繞行錯誤,就會造成語言變化。例如,單詞“athlete”的輔音順序相對困難,在其中加入一個短元音變成“athelete”的發音現象時有發生。對於不認識這個單詞的聽眾來說,他聽到的一會兒是“athlete”,一會兒又成了“athelete”,他可能因此得出結論:這個單詞原本是“athelete”,發音時缺少元音是出於發音省略考慮。單詞中間的元音在發音時確實經常被省略,比如將“family”讀成“famly”。因此,元音的偶然出現無法清晰佐證它們是不是原單詞的有機組成部分。雖說兩種推論都不無道理,但在某個具體個案中,錯誤推斷將會使語言發生變化。

在我們周圍,諸如此類的重組和誤解無時無刻不在發生。重點在於任何一種特定的變化既非必然出現,也非完全可測。也就是說,我們能夠預見可能會發生何種變化,但變化卻不具備單一性和獨特性;更重要的是,我們無法判定某種變化一定會出現。因此,語言社區不同,即便基本體係相同,產生的變化也會有所不同,進而會導致社區語言的不同。而那些進入語言體係的變化則會通過一代又一代人得到內化。兒童通過周圍環境學習語言,而他們自身的語言實踐又再次成為語言的新基準,這一新基準本身又會經曆多次變化,以此類推。這些變化不斷累積,社會語言差異也會隨之增大,就像最初的羅馬拉丁口頭語發展成多個地方羅曼語言一樣。

語言變化的規律

上文提到的變化看起來似乎會對單個詞語造成影響,但19世紀末有研究發現情況並非如此。一般說來,如果某種發音變化影響某些單詞的某個位置,這一變化在其他地方會產生同樣效果。在德語的早期發展階段,位於單詞結尾的濁塞音 [b]、[d]、[g] 被相應清音 [p]、[t]、[k] 替代(可能出於在單詞尾部保持聲帶振動的困難),這一變化的影響範圍並不僅限於少數單詞,而是涉及所有滿足條件的單詞。19世紀60年代的一群曆史語言學家注意到了這一點,並提出發音變化規律的普遍原則。從這個角度來看,改變的並非單個單詞,而是發音類型。另一個學派——新語言學派則提出了對立觀點,他們認為“每個單詞都有其曆史”,但這一理論很快陷入空洞的論述,在很大程度上遭到了遺棄。

在這一理論的發展過程中,德語發展史上一係列被稱為格林定律(Grimm's Law)的語音變化產生了重大作用。格林定律這一名稱源自格林兄弟之一,他既是一位曆史語言學家,同時也是一位民間恐怖故事收集者。請看表2中的對比。

表2 語言間詞匯發展變化與類似特征

表格信息量巨大,我們可以把關注點放在前三個單詞上。最初本該有清塞音 [p]、[t]、[k],後麵兩個有濁塞音 [d]、[g],最後三個應該有送氣濁音 [bh]、[dh]、[gh]。此推斷基於從所有語言得來的大量證據,而非僅由於某個語言相對於其他語言的“古老”地位。德語的發展曆史似乎可以看作是以下三類變化的組合:

輕塞音變成清擦音(例如,[p] → [f]);

濁塞音變成清音(例如,[b] → [p]);

濁音送氣音變成簡單濁塞音(例如,[bh] → [b])。

這一係列被稱為格林定律的變化是一條普遍原則,能夠解釋為什麽大量德語單詞的形式不同於其他印歐語係語言。通過對該法則的進一步修正,一些明顯的例外也被迅速囊括進來。但總有一些單詞“拒不服從”,如表3所示,表示同一個單詞的古英語和梵文形式不同,可以看出古英語中的t或d其實源自t。

表3 “變成”一詞的梵文與古英語單詞形式對比

同一個單詞,為什麽原先的t在某些形式中如預期一樣變為t,而在其他形式中卻變成了d?從適用性來說,這一發音變化是非常規的,隻適用於部分詞匯。

語言學家卡爾·維爾納(Karl Verner)給出了一種解釋:t變成t需要同時滿足以下三個條件:(一)t不位於句首;(二)其周圍音節為濁音(包括元音,鼻音,[r],[l]);(三)原重音不在前麵音節。維爾納這一解釋的關鍵之處在於對原重音的考量。表3所列梵文單詞中的重音位置則是另一回事了。

維爾納的解釋解決了格林定律存在的明顯問題,看似不過細枝末節,在當時卻至關重要。針對格林定律中發音變化反複無常的特點,維爾納大大降低了這一概率。他指出發音變化總是會遵循一定規律,即便有所例外也是互不相關的變化各自作用的結果。

語音變化的這種無例外性原則成為語言曆史研究的基礎。隨後幾年,美國語言學家萊納德·布龍菲爾德(Leonard Bloomfield)指出:無論是印歐語係那種語言體係完整、擁有書寫文字曆史的語言,還是阿爾岡昆語係(Algonquian family)那種沒有書寫文字的語言,這一原則全都適用。這一激動人心的發現使得這一原則進一步得到了強化。近期,在澳大利亞土著語言中同樣發現了這一規律。澳大利亞土著語是帕馬啟恩永甘語族(Pama-Nyungan family)的重要組成部分,該語言號稱有讓語言比較方法全部失效的曆史。

現代語言的發展過程中總有一種發音法則貫穿其中,毫無例外。這一說法似乎頗有神秘色彩,但威廉·拉波夫(William Labov)在20世紀70年代對美國城市居民發音變化的研究為其注入了更多實質性內容。簡單來說,拉波夫發現:除去地理因素,大量發音變化與一係列社會因子相關。他的研究還清晰表明,發音因素與年齡明確相關。從本質上來看,可以通過追蹤代際間單個發音因子變化來觀察發音變化過程。這一發現加上人們對發音變化中語音和感覺因子鑒別力的提高,使得這一規則的可信度更高了。

語言變化與語言間關係

這一切跟我們關心的問題關係何在?答案分為兩方麵。一方麵,語音變化的產生雖有規律,其發生率卻不可預估。同諸如詞形變化、句法變化、語義變化以及詞匯變化等其他語言變化一樣,這也是語言多樣性產生的因素之一。另一方麵,要評估一組不同語言從同一語言發展而來的可能性,即其是否具有曆史相關性,發音變化也提供了一種方法。

推論如下:如果說一組不同語言代表同一祖先的不同發展分支,那麽其中每一種都應該代表這一祖先受一係列常規變化影響的結果。生物演化亦是如此。物種雖由同一祖先進化而來,但由於後續基因突變不同最終會形成不同物種。當然,源語中的某些單詞可能會消失或者通過借用外來詞被其他單詞替代,但這種變化起碼在可控範圍內(或者至少被我們牢記在心)。語言變化的常規性允許我們將每種語言都視為源語的係統性變形,這是由產生這種狀態的特定係統性過程決定的。這反過來又意味著源自同一祖先的每種語言都代表著源語的一種變化。

以此為基礎,在一組源自同一祖先的不同語言中,對應單詞之間的不同(以非發音變化為模板)同樣應該呈現出係統性:不同係統變化結果之間的不同。也就是語言對比研究的基本方法——比較法。

簡單來說,要想比較一組(或更多)語言來確定其是否相互關聯,應該從兩種語言中抽取大量單詞樣本,以判定是否存在係統性相似。例如,對比拉丁語和英語就會發現大量單詞的區別在於拉丁語詞匯含p、t、c (c = [k]),而英語詞匯含f、th、h。以此為依據可以認為,先前這些單詞的同一位置發音相同,都是[p]、[t] 或者 [k]。要注意,我們做出這一推斷並非因為拉丁語要比英語“古老”得多,而是因為眾多古代和現代語言(如希臘語、梵語、俄語)的證據顯示,應該如此解釋上例所涉及的語音變化。

因此可以假定單詞“father”中的f原始發音為 [p],並將這一重構發音記為*p(當然我們無法確定其準確音值)。在曆史語言學中,若某個音或單詞前麵帶星號(*),則表示這是基於相對證據重構而非直接觀察的結果。在語言學的其他領域,星號還經常被用於表明一組單詞在當前語言中並非語法完整的句子。第六章對句法功能的討論中將會出現這類星號。

現在可以確定,拉丁語將*p以[p](如“pater”)的形式保存下來,而英語在其對應單詞“father”中將*p轉換為 [f]。我們越是能夠在源語的基礎上解釋對比語言中大量詞匯形式的獨特變化,就越能證明二者是相互聯係的。

這一論述的邏輯其實以費爾迪南·德·索緒爾(Ferdinand de Saussure)以及隨後的語言學家提出的“符號任意性”為基礎。除去一小部分擬聲詞(例如動物叫聲),絕大多數單詞的形式與其意義無關。“樹”在英文中叫“tree”,在芬蘭語中被稱為“puu”,但這兩個單詞的所指沒有任何差別。不同的語言對於同一個事物有不同的說法是很正常的;但要是反過來,意義相同(或相似)的單詞形式上也有係統性聯係,那就得好好解釋解釋了。

當然,也有一種可能性——其中一種語言僅僅是從另一種語言那裏借用詞匯(或者是二者都從第三方借用)。還有一種可能性,也是我們感興趣的地方,就是這兩種語言都由同一共同語發展而來,並且共同語中的單詞在發展過程中經曆了不同變化,最終形成上述兩種語言。能排除越多單詞借詞的可能性,就越能證實語言間的常規聯係,也就越能說明二者的相似性來自曆史關係。事實上,對於外部曆史已無法考證的語言,這也是能證明其曆史關係的唯一科學辦法。

要確保這一說法邏輯完整,關鍵在於兩種語言間相關性是否呈現係統性。要證實語言A和B源自同一祖先,就要證明兩種語言中大量存在可追溯至同一形式的表述。這些相同形式都來自其共同語,並經曆了一係列常規變化。在解決這一問題時總是會被其他因素幹擾,做到絕對確定是奢望,但獲取壓倒性優勢卻並非妄想。目前很多被廣泛認同的語係就是這種情況:印歐語係與其分支日耳曼語族、意大利語族以及斯拉夫語族等,還有南島語族、烏拉爾語族以及其他。還有一些語係,關於其是否存在仍然富有爭議,原因就在於這類“鐵證”仍然很少。所謂的“阿爾泰語係”(Altaic family)就屬於這種情況。如果這一概念成立,阿爾泰語係將囊括突厥語、蒙古語以及滿-通古斯語族(使用地區為東西伯利亞和中國東北)。雖說其中每一種分組都自成單位,清晰可見,但它們彼此間的關係卻很模糊,這些語言均來自同一共同語的說法也並非板上釘釘。

在此需要再次強調,比較法的運用確實是建立語言間聯係的唯一科學方法。即便方法正確,僅憑生物學意義上的遺傳基因仍然不足以判斷語言關係,上文提到的匈牙利語和諾曼法語就是例證。其他諸如尋找類似句法規則或單詞形式的對比也不足以成為有力證據,因為在沒有共同祖先的語言中也可以輕易找到這些相似點。若要論證“阿爾泰語係”的存在,不能僅靠指出其三大構成語都重後綴輕前綴、都使用元音和諧律(一個單詞中所有元音某些特性須保持一致)等規律了事。不同於單詞形式(本應該是任意的)間的係統聯係,這種寬泛的結構平行對於建立語言間共同起源關係並無助力。

雖說比較法是證明語言曆史關係的一大利器,在實際運用過程中卻障礙重重。研究者必須確保他們處理的皆為真正的傳承詞,而非借用詞匯。還有那些形式比較固定的詞匯也必須排除在外,比如育兒詞匯、擬聲詞以及其他類似的詞匯。這些詞匯在不同文化中的形式都相類似,但其原因與共同遺傳並不相關。

這類詞中最常見的是“父親”“母親”這一組出現在兒童早期語言中的詞語,其形式部分取決於兒童早期的語音能力。雖說類似“媽媽”“爸爸”這類詞出現在很多不相關的語言中,但它們並非完全保持一致。有趣的是,在一小部分彼此之間沒有任何曆史聯係的語言中,這組單詞的意思完全相反。例如,格魯吉亞語中“mama”指“父親”,“deda”指“媽媽”。但就算發現被比較的兩種語言中“mama”都指“母親”(或父親),也並不代表二者之間有聯係。

很顯然,對於要研究的語言需要嚴格把控,以便明確具體的比較內容。很多錯誤提議之所以構思不當,就在於提出議案的學者受到誤導,沒有充分理解研究係統,將蘋果和橘子胡亂比較。

同時還須警惕語言之間的偶然性相似。現已消亡的澳大利亞語言“Mbabaram”中,讀音為 [d?g] 的單詞就是英語中的“dog”,但該語言與英語沒有任何共同祖先,也不存在借用。“Mbabaram”中的 [d?g] 不過是原始形式*gudaga經過常規發音變化的結果。

即便一切操作都準確無誤,對比研究有時也無法得出確切結論。語言在發展曆程中會經曆流失、替代、重建,隨著時間流逝,同一語言的兩大分支語言間的共享詞匯(形式有變化)會不可避免地減少。目前的估算顯示,任何兩種源自同一共同語的語言在經過8000年的發展變化後,二者間的係統性相似點將不複存在。雖說具體的時間期限很難確定,但相比於語言起源的10萬年或更久之前,這一時間點毫無疑問離現在更近。因此,即便所有現代語言都確實源自單一“原型語”,我們也可能永遠無法證實其科學性。

不論是從語言關係還是從語言定義的連續性來看,語言定義都有一個曆史維度。探索語係的深度和廣度雖對量化語言數目並無益處,卻可以讓我們更好地了解世界語言的多樣性。無論過去多種語言的曆史如何,現代世界的狀態表明,這一切或將立刻終止,語言大消亡即將到來。這就是第四章的話題。