第六章語言的基因類型

在第五章我們講到，就世界語言種類而言，按照常規定義區分無法得出滿意結果。以國家來定義顯然社會意義重大，但這跟純語言層麵的區分不應混為一談。以相互理解為標準看似順理成章，實則困難重重，結果也不盡如人意。更糟糕的是，語言和方言的嚴格分界線到底在哪兒？這個問題幾乎無法回答。

科學的語言學能否為計算世界語言種類提供一個更好的方法？從語言學中語言形式的係統性差異來看，結果自然清晰明了，卻也相當驚人。

這種計數方法基於一個基本的語言分類：外化語言（I-language）和內化語言（E-language）。具體來說，前者將語言視為一係列通過言語、手勢（或衍生出來的書寫）形式實現的語音、單詞、短語和句子的集合；而後者將其視為語言使用者的知識體係，以此為基礎，他們能夠運用話語表達自己，理解他人。

我將後者稱為內化語言，指話語使用者的認知組織。正是得益於這種認知組織，我們才說某人“說”或“懂”某種語言。這樣的人能夠說出並理解對應語言中的句子（這些句子本身就是外化語言的一部分）。這一過程得以進行，要依賴內化語言知識同外部環境（例如嘴裏的食物、血液中的酒精等）、認知的其他方麵（包括記憶以及人對世界的認知等）以及其他一係列因素的交互作用。

語言差異之語法差異

內化語言和外化語言的差異可以粗略類比為生物學上基因型和表現型的差異。前者指語言或生物體的抽象模式，後者指這一模式在具體環境中的表現形式。當然，這一類比並非完全準確，但至少能說明部分問題。基因型是構建生物體的“菜譜”，表現型則是這一“菜譜”在某一特定環境中的具體表現形式。同樣，內化語言提供建構語言結構的“菜譜”，並同外化語言中通過單詞、短語、句子進行表達理解的其他體係協同作用。

當然，個人的內化語言是其生物表現型的一部分，而不是其基因型，這一點在第八章還會重申。這裏的類比是抽象層麵的，與生物學現實無關。

第一章提到，在生物學中，人們試圖通過表型差異來區分生物體，從而產生了形態種概念。對於這一方法，生物學家普遍不太看好，認為其容易誇大偶然性差異，他們更多傾向於將生物基因組成的差異作為定義物種的依據（至少自基因技術及遺傳物質確定機製取得進展以來便是如此）。這又進一步促進了遺傳種概念的產生，對應到語言研究中，就是識別兩種內化語言的差別並將明顯不同的兩種體係區別對待。

通過外化語言表麵可觀察到的詞匯和句法等“表型”特征來區分語言，會遭遇諸多問題。截然不同的語言可以共享詞匯（通過借用），而“相同”語言的不同使用者可能會因受教育情況或表達方式的不同在詞匯選擇方麵天差地別。不同的語言可能會表現出同樣的句型，而同一種語言也有可能呈現出多種句型。語言學家發現，就區分世界語言這個目的來說，無論語言的外圍使用情況多麽有趣，外化語言至多算一個棘手的研究對象，不僅抓不住還不可靠。相比之下，內化語言要可靠得多。使用者可以憑借語言相關的抽象知識表達自身、與人交流並進行閱讀。

下麵以英語的過去式為例來說明這種知識。英語中有很多“不規則”動詞，如“吃”（eat/ate）、“帶”（bring/brought）、“找”（find/found），還有特殊的係動詞“是”（be/is/was），這些都必須單個記憶。但對大多數動詞來說，過去式和現在式的構詞方式類似，隻須添加後綴。過去式的後綴統一寫為-ed，發音要麽是[?d]（例如，waited [weit?d]；[?] 屬於中性元音，如appetite中第二個音節中的短、弱元音），要麽是[t]（例如，missed [mist]），要麽就是[d]（例如，rowed [r??d]）。這些不同形式的語音形態並非隨意分布，動詞t或d結尾時-ed發音為 [?d]，以清輔音（如 p，t，k，f，s或者ch）結尾時發 [t]，其他時候（以元音或濁輔音結尾）發 [d]。

-ed的三種不同發音形式不過是英語詞匯的知識點之一，同不規則動詞的過去式（ate，brought和found等）一樣，需要一一學習。但學起來遠沒有那麽簡單。隻要給說英語的人一個新的動詞，他們都可以毫不猶豫地說出其過去式，並且詞形變化遵循同樣的原則。假設讓他們看一幅圖，上麵寫著“The man is dending/plipping/sprimming his cat”，然後問“發生了什麽事”，得到的回答都將是“那個男人在 [dend?d]/[plipt]/[sprimd] 那隻貓”。也就是說，語言使用者不僅了解自身語言中的單詞，同時還了解支配單詞形式的原則（或規則），並且能夠利用這一規則來創造與熟悉新詞。因此可以說，英語使用者內化語言的部分特征包含了單詞變化規則。

現在我們將上述事實同蘇格蘭語使用者的內化語言進行比較。蘇格蘭語是低地蘇格蘭的一種語言，與英語密切相關。但從中古英語時期到大約15世紀末的這段時間，二者相互分隔。第五章我們也提到，說蘇格蘭語是英語的一種變異方言也好，說它是一種獨立語言也罷，這種區分並非基於語言自身的事實，而是取決於蘇格蘭語使用者及其鄰居的社會和政治觀點。

同其近鄰標準英語一樣，蘇格蘭語的動詞過去式變形方法也多種多樣，不規則動詞很多，須一一學習。例如：bite/bate，“bite/bit”（加引號的是英語，未加引號的是蘇格蘭語，下同）；rive/ruive，“tear/tore”；begin/begoud，“begin/began”等。但大多數動詞（即規則動詞）都有三種語音變化形式，也是以動詞詞尾的發音為依據。變化原則局部有些不同（蘇格蘭語中，單一標準原則的影響力不及標準英語，因此局部變化的標準化程度不及英語），但有一條原則卻一樣。以塞輔音（p, t, k, b, d, g）結尾的動詞，添加-it（如drap/drappit，“drop/dropped”；want/wantit，“want/wanted”；keek/keekit，“peep/peeped”；sab/sabbit，“sob/sobbed”；mynd/myndit，“remember/remembered”；big/biggit，“build/built”）。以s，sh等清阻音（非塞音）或響輔音（l, m, n, r, ng）結尾的動詞，添 -t，例如：loss/lost，“lose/lost”；fash/fasht，“brother/brothered”；dirl/dirlt，“vibrate/vibrated”；ken/kent，“know/knew”；soum/soumt，“swim/swam”等。最後，以除d之外的濁音響輔音如v，z，[d?]（judge的第一個和最後一個音）結尾或者是元音結尾的動詞，添加 -d。例如：deave即“deafen”的過去式為deaved；lowse即“loosen”的過去式為lowsed；wadge即“wadge”的過去式為wadged；lue即“love”的過去式為lued；pey即“pay”的過去式為peyd。

對蘇格蘭語使用者來說，上述規則是其內化語言的組成部分，如同另一規則是標準英語使用者內化語言的組成部分一樣。麵對“dend”“plip”和“sprim”之類的新單詞，蘇格蘭人會得出諸如“dendit”“plippit”和“sprimt”之類的過去式，而英語使用者得出的則是“dended”“plipped”和“sprimmed”。綜上所述，這兩種係統構建過去式的“菜譜”不盡相同，這也意味著，“語言基因”不同會導致表型的不同，具體體現在兩種可能的新詞構成法上。

上述兩種語言的內部知識、內化語言或簡單說來是語法，至少存在一條不一致的規則，因此可以說它們呈現出兩種不同的體係（或語言）特征。就此不妨提議，與其通過不同的外部形式，不如通過語法差異來評估語言種類。如此一來，結果可能與我們通常理解的“不同語言”相吻合，也可能會有所衝突，但至少有一點好處——起碼我們描述的都是客觀語言現實，而不是社會和政治觀念的主觀問題。

語法中的常數和變量

這會很自然地引出一個問題：到底什麽因素才有潛力將一種內化語言同另一種區別開來？事實上，語言使用者的知識中有一部分是恒定不變的。請看下麵的句子：

（1）a. Doris expected to appoint her as the new chair.（多麗絲期待任命她為新的主席。）

b. I wonder who Doris expected to appoint her as the new chair.（我好奇多麗絲期待誰來任命她為新主席。）

兩句話中的代詞“her”分別指誰？很顯然，第一個例子中的“her”可以指世界上任何一位女性，唯獨不能是多麗絲。人們就這個結論可以達成共識，不是出於其意思（多麗絲所處位置可能可以決定新主席人選，但上句的表述無法表達這一意思），而是出於其語法形式。在第二個例子中，雖然單詞順序相同，將“her”解讀為多麗絲完全有可能（如果不考慮上下文，甚至大多數人會傾向於如此理解）。

下麵第二組句子情況類似，不過這次代詞

（“she”或者“her”）在句中出現在多麗絲前麵。

（2）a. She intended to appoint Doris as the new chair.（她有意任命多麗絲為新主席。）

b. Her mother intended to appoint Doris as the new chair.（她的母親有意任命多麗絲為新主席。）

同樣，第一句中代詞“she”可以指多麗絲除外的任意女性，而第二句中對“her”的解讀則沒有這一限製。事實很清楚，這一次的推論也並非來源於句子意義，而是其語法結構。

下麵第三組句子的形式稍微有點複雜，卻同樣可以作為例子進一步說明問題。

（3）a. Doris was amazed at how quickly she recovered.（多麗絲驚訝於她恢複得如此之快。）

b. How quickly Doris recovered amazed her.（多麗絲恢複得如此之快，讓她很驚訝。）

c. She was amazed at how quickly Doris recovered.（她驚訝於多麗絲恢複得如此之快。）

d. How quickly she recovered amazed Doris.（她恢複得如此之快，讓多麗絲很驚訝。）

上例中，除了（3）c的句子，其他情況下代詞“she”或者“her”都可以和多麗絲指涉同一人，而在（3）c句子中，“she”必須指多麗絲之外的其他人。

因此，語言使用者內部知識中必然存在一條語法原則。依照該原則，代詞在某些情況下可以指涉相同句子中的其他個人，而在某些情況下則不可以。相關原則可以簡單表述如下：

（4）共指關係，即滿足下述兩種情況，代詞可以共指同一句子中的另一個體（其先行詞）：a. 代詞位於先行詞之前；b. 代詞在結構上屬於“上位”。

所謂語法結構上的“上位”到底是什麽意思？語言學文獻有諸多探討，但上述例句中的含義還是相對容易理解的。

一個很有趣的問題在於，我們關於上述原則的知識到底來自哪裏？有一點毋庸置疑，那就是從來沒人教過我們這些。據我所知，這一現象直到1967年左右才由語言學家約翰·羅斯（John Ross）和羅納德·蘭蓋克（Ronald Langacker）發現。在此之前，幾乎沒人注意到這一點。更加讓人驚訝的是，對上述原則加以闡明，人們發現：作為一種語言內部知識，這一原則適用於被認真研究過的所有語言。

語法差異：參數

由此看來，某些語法知識（例如代詞意義闡釋）共存於所有語言。英語中的形容詞一般位於名詞前（英語中說“紅色的氣球”，而不是“氣球紅色”），法語則相反。如果能夠全麵收集此類變量參數，那麽語言使用者內化知識中所有該類型參數的對應值都可以被視為一種獨立語言。

但若把這一規則運用到某個語言地區，如意大利北部，結果會怎樣呢？以否定句為例。標準意大利語中否定詞位於動詞之前（Maria non mangia la carne，“瑪利亞不吃肉”），而皮埃蒙特語裏否定詞位於動詞之後（Maria a mangia nen la carn，“瑪利亞她吃不肉”）。標準意大利語和皮埃蒙特語的語法有所不同，因此可以被視為兩種不同的內化語言。

這兩套體係中否定語法還有其他的不同之處。在標準意大利語中，否定形式不能與第二人稱祈使動詞同時出現，而要使用不定式：“不要吃”是“Non mangiare”，意為“不要去吃”，而不是*“Non mangia”“不吃”（注意在本章中，一組單詞前加*表示這組單詞並非符合語法規範的句子，語義上至少不是字麵意思）。而皮埃蒙特語允許出現否定祈使句：“不要吃”就是“Mangia nen”，直譯為“吃不”。在標準意大利語中，“Non ho visto nessuno”（沒有見過某人）之類的句子需要使用雙重否定，而皮埃蒙特語卻不需要使用否定詞。諸如此類，不一而足。這裏的否定詞至少從三個方麵說明了兩種語法的不同之處。

不過，這才隻是個開始。詳細考察意大利北部不同地區的語法體係可以發現更多變化，可以相互區分很多內化語言。從理論上來說，若地域不同，參數之間也相互獨立。仍以北意大利地區為例，假設有10種維度來區分兩種內化語言。從目前已發現的變量來看，記錄在案的已超過10種，所以這一估計其實相當保守。如果這10個維度各自不同，那一共會產生210種，也就是1024種不同的語法。但事實上，學者們在這一地區發現的語法種類在300 ~ 500種之間。

即便考慮到簡化情形，情況也同樣如此。在上述討論中，標準意大利語和皮埃蒙特語否定語法的不同之處體現在三個方麵，這是否意味著在另一種內化語言中也存在這三方麵的差異呢？實際上，關於意大利北部地區語言體係的研究表明情況並非如此。研究發現，以動詞前否定、不定式否定祈使和雙重否定為特征的標準意大利語模式在熱那亞、威尼斯、特蘭托和特裏雅斯特等差別很大的地區語言中得到了完全複現。同樣，以動詞後否定、否定祈使句和非雙重否定為特征的皮埃蒙特模式在都靈、米蘭、奧斯塔和帕維亞地區得到了複現。由此看來，與其說是三種獨立的對比體係，不如說存在一個單一勢能參數。選擇這個參數的其中一個維度值時（例如，否定標記詞的前置還是後置），其他兩個維度值也會隨之改變。

要想認真討論這些問題，必須以對語法結構的清晰分析為基礎，以便對語言中否定詞差別有一個係統的認識。理想情況當然不是隻羅列一大堆語法特征，而是提供語法結構分析。如此一來，改變一處語法就能自動按邏輯推演出最終的結果。

即便限定在意大利北部地區的語言範圍內，本書也不足以在這方麵進行深入探討。但僅僅是浮光掠影地簡單看看，其價值也不容小覷。有可能的話，我們應該嚐試用一個參數來總領各種最小的語法差別。這樣做顯然好處多多，內化語言係統中的語言千差萬別，通過一個抽象概念將多種差異聯係並統一起來至少能使其條理清晰。當然，具體能有多少好處還要看這一方法能推進到何種程度。

“無主”參數

有些語言要求句子中必須明確呈現出主語，即便可以從上下文中推測，而有的語言卻允許無主語的句子存在。這一語言差異知名度高，貌似是作為統一參數的不錯選擇。在標準意大利語中，句子“Ha già telefonato”完全正確，可以根據語境解釋為“她已經打過電話了”或者是“他已經打過電話了”。但在英語中省略主語卻不可能，“已經打過電話了”本身不是一個完整句子，沒有主語，不符合英語規範。

即便主語本身沒有實質內容且不指涉實物，英語仍然強製要求主語出現。“It is raining/snowing/hailing/thundering”（它在下雨/下雪/下冰雹/打雷），在這些句子中，“it”本身並無對應指涉物，和意大利人直接說“piove/nevica/grandina/tuona”（下雨/下雪/下冰雹/打雷）意義是相同的，不過意大利語省略了顯性主語。事實上，意大利語中壓根兒沒有相關元素可以充當主語。上述場景中，英語使用“it”或“there”等無意義（或虛詞）主語，意大利語中沒有（也不需要）這些主語，無主句用起來也很得心應手。

兩種語言還有一大區別，意大利語中的主語可以隨意接在動詞後麵。“Ha telefonato Gianni”（打電話吉阿尼）這個句子完全沒有問題，但其英語對應句*“has telephoned John”（打了電話約翰）卻不符合語法，必須表述為“John has telephoned”（約翰已經打了電話），主語要按常規置於動詞前。

還有一個區別相對而言稍顯隱晦，但同樣跟主語有關，那就是疑問句的形式。在兩種語言中，特殊疑問句（不可以用“是/否”來回答的疑問句）都涉及將部分句子內容用疑問詞替換並前置。因此，我們可以用英語說：“Who did you say that John met？”（你剛才說約翰見了誰？）或者用意大利語說：“Chi hai detto che Gianni ha incontrato？ ”但要想在英語中用從句提問主語的內容，就沒那麽簡單了。我們不能說：*“Who do you think that will come？”（你覺得誰會來？）期待的答案可能會是我覺得約翰會來。相反，我們必須省略“that”，說：“Who do you think will come？”意大利語卻無須這樣調整，對應的問題就是：“Chi credi che verrà？ ”這裏的“che”直接對應英語中的“that”。

英語和意大利語的主語有四大不同：（1）存在刪除談話雙方都明了的主語的可能性；（2）天氣動詞及其他類似動詞是否需要虛詞主語；（3）陳述句中主語是否可以接在動詞後；（4）用從句對主語提問時，是否可以直接將問題前置而無須其他變化。表麵上看，這些差異互不相關，但有可能跟前麵提到的否定詞一樣在語法中處於共變關係。

帶著這樣一個思路，語言學家希望在研究其他語言時，也能發現上述幾方麵的規律。他們確實發現一些語言整體上要麽與意大利語一致，如西班牙語、羅馬尼亞語和希臘語，要麽與英語一致，如法語、羅曼什語、德語、尼日利亞埃多語等。在某些語係尤其是羅曼語族內部，這種二元對立貌似沒有問題。但羅曼語族之外有個例子，簡明扼要卻頗具典型性。在黎凡特阿拉伯語中，空主語相關屬性符合意大利語模式，而約旦地區以及與其關係密切的巴尼哈桑貝都因阿拉伯語遵循的卻是英語模式。

可是，很快就出現了例外的情況。首先，漢語和日語等語言中代詞省略相當自由，主語位置和其他語言現象與意大利語卻沒有特別聯係。還有些語言中，主語在某些情況下可以省略（例如，芬蘭語中第一人稱和第二人稱主語；希伯來語中的過去式），但與上文提及的語法現象也不甚相關。

很顯然，這些案例與我們通過對比英語和意大利語概括出的主語省略原則相互獨立，它們並沒有直接將上述推論證偽，而是提供了代詞被認定為“可以推知”的其他情況。不過，很快就有其他語言被發現似乎能說明英語和意大利語的差異無法形成體係。例如，在冰島語中，主語在通常情況下都不可以省略，也不可隨意置於動詞之後，這一特點與英語或德語相同。冰島語的天氣詞匯中同樣需要使用虛詞主語，而且在補語從句中對主語進行提問時無須更改從句的結構：

（5）Hver heldur pú aδ hafi framie gl?pinn？

Who believe you that has committed the-crime？

你認為是誰犯了罪？

非洲（班圖語支）鄧亞語（Denya）給上述關聯假設提出了一個重大挑戰。除了不允許主語位於動詞之後，該語言整體上與意大利語類似。與我們的第一印象不同，對多種語言的深入研究發現，語言的語法特征並非如我們所願——保持步調一致並處於共變關係之中。

英語和意大利語間的主語差異並非放之四海而皆準，人們也早已放棄用一個單一參數來統括多種差異。但宏觀參數派和微觀參數派的爭論仍在繼續。前者認為尋找世界語言中的大規模聯係應該是語言研究的中心目標，而後者認為這種大規模聯係要麽不存在，要麽由於目前人類語言語法結構知識過於細碎而不足以支撐我們識別這些聯係，因此當前應該更多關注語法中的一些細微離散差異。

解決二者之間的分歧對於普遍語言結構理論當然十分重要，但這不是本書探討的重點。語言變化最終無論是用少數幾種宏觀參數來標記，還是用大量微觀參數來描述，又或者是處於二者之間，我們都可以說，根據語法來為某種語言定位使得我們能將各種內化語言區別開來。用這種方法來區分（並計算）世界語言，可確保其完全立足於語言本身，而不受社會、政治等外部因素的影響。本章開篇也提到，從某種程度上說，可以將內化語言係統的語言特征視為其基因型，用語言學研究發現的一係列結構參數來表示。將語言差異弱化為其語法差異可以化解其他方法中存在的問題。

就算能將語言變化的獨立維度最小化，也還是會有大量參數無法弱化。僅在意大利北部地區，類別就在10種以上。若就世界範圍來說，必須對世界語言可能存在的語法差異進行徹底研究才能得出結論。倫敦人到意大利聽到的形形色色的“意大利語”其實可能有很多共同之處，而這些語言作為一個整體可能又和世界其他地區的語言差異顯著。

隨著參數的增加，可能的語法體係呈指數增長。即便參數控製在25~30之間，可能的語言種類也可以用巨大來形容。假設有30個獨立參數，語言數量會超過10億；40個二元參數則會產生上萬億種語言；若有100個參數，可能的語言數目將不可想象。從這個角度來考慮內化語言，一個好處是語言學習者完全不能也無須考慮所有參數再進行選擇。另一好處是，如果在掌握某種語言係統時隻需簡單確定一係列固定參數的對應值，那這個操作就很容易實現。

顯然，並非每一種變量組合都會實現，但如果所有參數都能像意大利北部地區那樣統一在一種語法之下，那麽世界語言的種類絕對會遠遠多於“民族語”所說的6909種。

第六章 語言的基因類型

第六章語言的基因類型