9、跳舞小人
在領導的直接過問下,中大和中科院牽頭對FAST的發現啟動了新的研究計劃。這裏麵涉及了一大堆事情,尤其是60K黑體輻射信息的破解研究,汪海成都是事後才知道的。
就在他要被潛伏在漆黑異界的心魔奪走神智,吸入無邊無際的真空時,現實的鎖鏈把他拉了回來,緊緊捆回地麵。鎖鏈泛著銅鏽,肮髒惡臭。
房主電話打來的時候,白泓羽發現導師臉色驟變,一通電話來回變了好多張臉孔。汪海成掛了電話,她擔心地問:“還好吧,老板?”問了兩遍,汪海成才反應過來看她。
“不好。”汪海成答道,“很不好。”身為導師,汪海成也知道這些破事兒跟白泓羽說不著。但這些天的連續刺激讓這對師生的神經都脆弱了不少,在貴州射電望遠鏡旁熬過了幾個孤寂的夜晚後,兩個人好像結成了奇特的聯盟,那幾天,隻有兩個人類相互支撐著,對抗著詭異難明的黑暗天頂。
回到珠海後,這個聯盟不自覺地延續了下來。
汪海成簡單地告訴了白泓羽有關房子的事情。“我要起訴。”他下了決心。汪海成原以為學生會支持自己,沒想到白泓羽咬著嘴唇一言不發地看了汪海成半天,輕聲說:“如果這房子最後買不到呢?”
這話裏滿是關切,類似事情發生得太多了。每個大城市,在某個特定的時候,都會像超新星爆發一樣迎來一波房價暴漲,每波暴漲之後就會有許多原本一樣的人被分成了兩隊:一隊人落地生根,房子成為自己人生的最大財產,然後房子像鐐銬一樣把他們和這座城市束縛在一起,無論霧霾還是擁堵,都對城市不離不棄;另一隊人被怒濤拍得老遠,一步步看著之前還下得去手的房子變成下不去手,繼而變成沒錢下手,最後變成限購沒有資格下手。幾年之後,他們不得不跟那個生活了多年的城市告別,離開自己熟悉的工作,和結交多年的朋友。再過幾年,兩隊人就成了從立場到身份都彼此迥異的兩個階層。
白泓羽跟汪海成道別,汪海成忙著打電話找人推薦房產律師。不知為何,白泓羽之前欲言又止的樣子一遍又一遍地浮上他的心頭。這是一個活潑得經常讓人忘記她有多漂亮的姑娘,自己雖然老開玩笑問她怎麽還沒找到一個可以談婚論嫁的男朋友,但對於自己的學生是一個女人這事兒,他一直沒有太實在的感知。
汪海成是浙江人。據說往上數五代,也是名門望族,但那是新中國成立前的事情了,汪海成出生的時候,父母都是普通工薪階層,和大多數江南地區的人一樣,一來重教育,二來講經濟。汪海成小時候喜歡音樂,想學小提琴,家裏就在他上小學的時候出錢請了小提琴老師,給他買了琴,每個月的學費大概占父親三分之一的工資。學了四年小提琴之後,老師告訴父母,孩子的興趣遠比天分突出,於是重教育就讓位給了講經濟。而那把小提琴也由老師牽線賣給了別的小朋友,畢竟一把琴也不便宜。
為了這個事情,汪海成和家裏很是哭鬧了一段時間,對天文的興趣也是在這個時期慢慢占了上風——可能也跟家裏的經濟狀況有關,看星星不用花太多錢,也不用請老師,沒有級可考,自然就不會因此被父母終止,星空也是不可能被奪走的。雖然天文不像音樂特長那樣有考試加分,但漫溢到物理和數學的興趣卻能換來更好的成績,家裏沒有任何反對的理由——天文也不像音樂那樣容易引起早戀,這就更讓父母滿意了。
如果家裏有錢,自己是不是還在高高興興地拉著沒有天分的小提琴?汪海成心裏是沒有譜的,也許自己一樣早就放棄了,但那時他才十歲,幻想著小提琴是屬於自己的世界,那個世界被生生奪走,留下了一個巨大的傷疤,一直沒有愈合好。傷疤細長,一邊連著對自己才能的自卑,另一邊勾著對家裏不夠有錢的怨恨——這種怨恨隱匿著,不能說出口,和其他許多糟糕的欲望一樣頑強地潛伏著。
傷疤就是一條毒蛇,哪怕汪海成今日已經是副教授,但依然被它咬著。而現在,房子又一次引發了他的傷痛:沒本事賺到靠自己買房子的錢,家裏也不富裕,支援了二十來萬首付,再多就拿不出來了。但那時候汪海成還沒意識到疤痕是怎麽扭曲了自己的生活:他自認為是因為太宅,愛好太無趣才不敢向喜歡的女孩子告白,實際卻是源於自卑。就像才能不足而失去了小提琴一樣,不夠優秀的自己也一定會失去心愛的女孩,傷疤的恐懼讓他在愛情麵前畏縮不前。
現在,很不幸的,社會偏見更加劇了汪海成在愛情方麵的自卑,珠海的樓盤廣告就飄著紮眼的文字:“不下手,別人見的是丈母娘,你見的隻是阿姨。”他年紀也不小了,家裏催著他早點考慮終身大事。事業、愛情,最後還是落在了房子上——至少廣告、同事、朋友、親戚,他們所有人都是這麽說的。
這位中山大學的年輕副教授抱著這樣複雜的憤怒,根據朋友的推薦,去見了房產律師。雖然律師事務所和學校間有公交直達並不遠,他還是叫了出租車,雙方簽字蓋章按手印的購房合同被他裹了一層又一層,放在雙肩包裏緊緊地抱在胸前,生怕出什麽幺蛾子。
律師看完合同條款的第一句話是:“從你提供的資料看來,這麽說吧,我們有很大把握能勝訴。簡單地說是這樣的,上個月深圳剛判了一個案子,跟你的情況基本一樣,贏了。”
就在汪海成他走進律師事務所的同時,中科院聯合中山大學搭好了信息破譯小組的班子,開始破譯那個連續幾天都在深夜裏化作怪物,把汪海成從夢中驚醒的60K黑體輻射信息。
戴森雲是汪海成他們在FAST上的獨立發現,但60K黑體輻射異常則被全球射電天文台觀測到了——地球上每個天文台,不管當時天線在掃描哪個位置,都記錄下了同樣的異常輻射。這也是匯報之後破譯小組加緊成立的原因:沒有信息優勢,就必須有效率優勢。
為了大致搞清楚輻射信號的分析工作進展,白泓羽還專門惡補了密碼學的基本知識。
早在幾千年前,人類就開始使用密文來進行通信,借以掩飾所需傳遞的實際信息。根據考古資料記載,公元前古羅馬愷撒大帝就已經開始使用被稱為“愷撒密碼”的加密方式和自己的朋友通信。直到二十世紀之前,準確地說,是兩次世界大戰之前,人類的加密方式都停留在愷撒密碼的水平上。
這種最初級的加密方式又被稱為古典加密法,也就是置換法——根據預先設定的特定規律,用特定的符號替換明文原文,生成一套無法直接辨別的密文。隨著二十世紀初連續兩次世界大戰的爆發,戰爭雙方通信和諜報需求暴漲,古典加密法就顯得過於簡單了。它隻使用一套固定的加密算法和密碼字典,密文本身雖然不知所雲,但依然保持了加密前明文的語言規律。柯南?道爾的經典小說《福爾摩斯之跳舞的小人》非常完美地揭示了破解這種密碼的辦法:通過密文裏出現的符號進行頻率分析,再和語言規律進行對比,一步步確認密文可能對應的原文。隻要有足夠的密文樣本來分析頻率規律,總能把密碼還原成原始語言。
相互監聽和破譯直接關係到戰爭的命運,而這時的古典加密法已經很容易被破解,為了滿足戰爭的需要,更有效的加密方式應運而生。
一個思路是直接使用不為普通人所掌握的原始明文進行加密,比如二戰期間美軍曾利用印第安少數民族納瓦霍人的語言作為戰場密碼——正是因為無法理解原始語言的規律,這一度成為日本軍隊無法破譯的神秘密碼。但是,當信息論和語言學被引入密碼學之後,這樣的手段失去了意義。不過,這倒產生了巨大的連帶價值——大量曾經無法解讀的考古文字被重新破譯了。學者們發現人類畢竟還都是人類,不管他們使用什麽樣的文字,無論是象形還是注音,他們所要表達的意思內涵總是相同的,隻要樣本量足夠大,總是能找到對應規律,通過頻率分析找出答案。
頻率分析手段麵對自然語言幾乎是無敵的,隻要樣本量夠,一定有辦法破解,所需要的隻是足夠的計算力而已。這直接導致了戰爭各方對運算能力的需求急速增長。從草稿紙到計算尺,再到電子打孔計算機,算力演進的軍備競賽成了決定戰爭勝負的重要因素。
在二戰剛剛結束的1946年,算力的軍備競賽創造了一個偉大的成果,為破解德軍密碼而研發的ENIAC姍姍來遲。ENIAC,這個遲來的人類第一台計算機從此改變了我們文明的進程,地球走進了由恐怖運算能力構成的信息時代。
白泓羽這時才第一次意識到,密碼學是人類二十世紀科技大爆炸的最重要肇因之一!
然而,她並沒有意識到,人類文明已經再次站在因為密碼而驟變的路口。
隨著頻率分析這個無敵武器的泛濫,加密方式終於不得不進行革新——用複雜密鑰字典來代替簡單密鑰字典,以掩蓋密文的頻率規律。換句話說,原文的A在某些時候會被加密成X,在某些時候又會被加密成Z。密文字頻與原文字頻的聯係被破壞,除非找到對應的加密字典,否則很可能永遠無法解開密碼。
二十世紀的冷戰時期,間諜曾一度使用唯一的一次性密碼字典:沒有任何規律的解碼字典所含的信息量已經遠遠超過了密文本身。除了發信人和收信人,任何人都無法破解密文的內容。但這種手法失敗得出人意料:許多情報因為一次性密碼字典丟失而變成了廢紙。
冷戰之後,隨著計算機的普及,二進製數據代替自然語言成了通信的基本載體。語言頻率分析法最終宣告失效——二進製數據文件有無數種可能的格式,要進行頻率分析,第一步必須了解原文文件的編碼規律——圖像、語音等各種文件的頻率複雜度遠在語言文字之上。
然而,加密手段在計算機可怕的算力模型下飛速發展,區塊鏈、公鑰、私鑰,加密算法的多重疊加達到了難以想象的程度,複雜字典也終於被拋棄了——在沒有密鑰的情況下,單純依靠密碼碰撞來破解,需要全球算力運行幾千年。
但無論如何,加密邏輯依然是不變的:將明文原文通過特定的加密算法進行加密,加密算法結合特定的密鑰,兩者決定加密的實際過程。如果既不知道密鑰,也不知道加密算法,密碼的破解是非常困難的。
雖然白泓羽隻是粗淺地研究了密碼學,但作為一個科學素質滿分的專業人才,這已經足夠讓她意識到問題了。
所有的人類語言學分析也好,密碼頻率分析也罷,都基於一個關鍵基礎:人類的世界共識。
因為大家都是人類,身體都是由蛋白質、脂肪、糖類、水等元素構成,人類無論在哪裏生活,都以基本成分相同的物質作為食物,需要水分和氧氣;有兩個性別,女性懷孕,胎生;雙目視覺,有立體景深,視覺能偵測的電磁波範圍在380nm-760nm,通過520nm(綠色)、480(藍色)、700nm(紅色)三種原色組合理解視覺空間。人類一切智慧交互的信息都圍繞著這些物質基礎進行理解:食物可能在不同文化中指代麵包、米飯、烤肉,但不會指代月亮。這些物質共識決定了信息的組織結構:人類的嘴作為消化道的入口和發聲器官,語言裏自然會把說和吃的語意進行混合,同樣如果人類是腔腸動物,食物的消化和排泄都通過口器進行,那麽“吃飯”和“拉屎”很可能是同一個詞。
那麽,一個信息不是來自人類,甚至不是來自地球,我們要怎麽去破解這些信息的智慧內容?
白泓羽想起一些科幻作品裏人與外星文明的交流,這時候就覺得很滑稽。想要理解來自人類以外的信息,必須和對方麵對麵地用同樣的指代一對一完成語意對應。但是這也很難,你怎麽知道外星文明往看起來像嘴一樣的器官裏塞東西是吃飯,而不是**?你怎麽確定外星文明是單性繁殖還是多性繁殖?
白泓羽眼前似乎出現了一群章魚一樣的奇異生命,懸浮在高密度的維生液裏,隔著透明的落地窗和自己交流,自己和汪老師站在落地窗的一邊。汪老師拿起一個麵包放進嘴裏,說:“食物,吃飯。”然後章魚心領神會地抓起什麽東西塞進可能是頭部的一個孔裏。一串咕吱咕吱的怪響過後,章魚像是頸部的體表出芽似的長出一圈小號的章魚頭顱,然後幾十個頭顱掙紮著從母體分離出來,長出觸手,撲上去把母體分屍吃了個精光。之後,幾十條小章魚異口同聲地在落地窗另一頭叫著:“阿庫達,阿庫錄!”
想象著這樣混亂的場麵,白泓羽就忍不住低頭捂嘴——妄想裏汪老師嚇得張大了嘴,半個麵包從嘴裏掉下來的樣子栩栩如生。白泓羽控製不住的那些稀奇古怪的想象,既讓自己感到無語,同時又忍俊不禁。如果汪老師在,看到她莫名其妙地發呆,然後又嗬嗬傻笑,肯定會大叫:“正常一點,姑娘,記住自己是一個正常的人類女性。”
想要完全理解一段首次接觸的信息的智慧意義幾乎是絕無可能的,但是能不能判斷出這些信息是否來自智慧文明,信息中包含文明意義呢?
不好說,當年人類射電望遠鏡第一次發現脈衝星的時候,因為它精準的周期性電磁信號,也曾被認定是智慧生命的廣播。天文學對於宇宙的了解還太少,要判斷一堆規律信號到底源自天體規律還是文明智慧,未必像人們想象的那麽容易。
正陷入這種失落情緒的時候,白泓羽接到了院長的電話。
“小白,我記得你有生物碩士學位,對吧?來逸夫樓一趟,四樓,407。”
“院長,出什麽情況了嗎?”
電話那頭傳來一聲沉重的呼吸,“60K黑體輻射信息,我們懷疑有了結果。”
白泓羽看了下表,從向領導匯報完畢到現在,還不到六個小時。
領導過問之後,60K黑體輻射信息的破譯工作作為絕密級項目開始運行。在這樣的保密要求下,找核心研究人員就是一件很麻煩的事情。能力夠強,又要政治過硬,關鍵是還能在很短時間內借調過來。這樣的人選自然要先從有軍工背景的研究機構裏找,樂觀估計,一周之內能篩選出初步人選就不錯了;之後再安排人事手續,評估,政治考核和保密培訓,運氣好的話,一個月後或許可以開始工作。
這個時候,項目隻有一串編號,連名字都還沒有,誰也沒想過連專業研究員都沒有加入時能出什麽成果。
所以僅僅六個小時之後,他們得到一個結果的時候,可以想象相關人員都是什麽表情。他們的第一反應不是“是什麽結果?”,而是“哪兒來的什麽鬼結果?”。
搞出結果的是軍區信息所的初級工程兵,叫趙侃。瘦高個子,尖嘴猴腮,一口武漢口音的塑料普通話。之所以派他過來,一是因為信息所就他一個人沒有急活兒纏身,二是需要有人提前準備研究設備、保密網絡、監控程序、沙盒數據庫之類。等真正負責的專家來了,肯定還需要有人維護軟硬件打打下手,解決點雜事兒,這也是他的工作。趙侃有權接觸數據,但是誰也沒指望他能獨立開展什麽有成效的工作。如果在企業裏,他這樣的人就是修電腦的網管,在互聯網公司裏則被稱為“IT”。
因為知道專家短時間內還無法到位,而辦公室保密網絡既沒有外網,更別提什麽娛樂,趙侃實在閑得無聊,於是決定折騰點事兒。60K黑體輻射數據量很大,播放了大概有二十四小時,這些輻射有非常明顯的峰穀波動。趙侃也不懂什麽高級的數據處理算法,他用原始辦法建了一個數據表,電磁波峰記錄為1,平緩的波穀記錄為0。這些數據他一個個手動輸入,足足打了一個小時,直到記錄了一大堆二進製數據之後,他終於覺得累了,這才停了下來。
趙侃的第一個想法,是可以當作摩斯碼,把01當作點劃來處理,看看能得到什麽結果。這次翻譯嚐試以一堆亂碼告終,但這讓他發現二十四小時的播報實際是周期循環的,換句話說,有效的部分並不長,大約隻有十來分鍾的信息,然後這段信息不斷重複了二十四個小時。
接下來,趙侃把連續峰值的部分都加了起來,用0作為間隔。111011010111101換成了302010401,這讓他發現了一個基本但重要的事實,即連續的峰值最多重複四次,絕對沒有出現過四個以上的連續波峰。如果去掉0這個明顯的間隔符號,數據就變成了元素隻有1到4的數列:32141……這時候,有效信息量已經變得非常小,隻有幾百比特,也就是不到1KB的量。
這個結果是很讓人失望的,幾百比特如果用字符來表達,隻有短短幾百個字。這個信息量小得太離譜,完全不足以用來分析其中的語意——如果這裏麵真有的話。對於趙侃來說,這倒談不上多失望,因為他並不真正理解地外文明信息的意義。
以趙侃一個中專畢業,靠技術培訓上崗的信息工程兵的水平,這些簡單的信息處理已經是他能力的極限了。
隨後他又花了一個多小時,把所有的60K黑體輻射信號按這個簡單的編碼方式處理成了數據。如果趙侃係統學習過數學,那他肯定知道這些數據符合四進製數據的規則。而他現在輸入的記錄本身違反四進製數據的記錄方式——四進製的標準記錄方式是使用0到3的數字,不是1到4。
可能隻是出於好奇心,趙侃在結束自己的沒事找事前做了一個違反操作規程的事情:他把這個數據丟進了信息所的爬蟲天網。
爬蟲天網是一個大型的分部式網絡預警係統,通過不斷過濾互聯網數據裏的信息進行自我學習,最終從網絡熱點中監控和預判各種可能出現的異常。畢竟互聯網很早以前就已經代替了所有媒體,成了最重要的傳播方式,在新的形勢和挑戰下,敵對勢力為了達到對網絡信息的利用和攻擊,竊密早已是公開的秘密。要應對各式各樣的滲透和攻擊,光靠亡羊補牢是行不通的,爬蟲天網就是以A.I.自進化學習的方式預判可能發生的信息攻擊,提前堵住漏洞。
這套係統的建設和實驗已經進行了很長時間,爬蟲天網的數據觸角早就滲透了QQ、微信、微博、論壇、網站後台等絕大多數常規網絡數據,暗網的隱秘空間也被基本覆蓋,但因為自我學習效率還不是很高,實際效果並不理想。反倒是信息收集效果意外地好,幾乎可以說是無所不知,隻是它還不知道該怎麽利用和處理這些無所不包的信息。需要調查的特征觀測數據被丟進爬蟲天網之後,係統會查找爬蟲觸角所有的相關信息,去核對這個特征數據的可能模式。
兩個小時之後,爬蟲天網反饋了一個非常奇特的結果:來自南京大學模式動物研究所的非公開數據庫。數據庫的題頭是“國家遺傳工程:小鼠資源庫”。
以趙侃的知識水平,他沒法判斷這其中可能隱含什麽意義。因為這些操作多少都有點違規之嫌,他還猶豫了一下是應該上報,還是把這些結果都抹掉——這個結果看上去也沒啥關聯性,可能連巧合都算不上。
最後,這個信息工程兵還是老老實實把結果報給了自己的領導。
二十分鍾之後,白泓羽被叫了過去。
這時的汪海成還在忙著準備材料,跟律師溝通如何起訴,為了在這個房價不斷暴漲的時代維護自己的一點權益而努力掙紮。