主持人:“這就是一個多月前CATNIP在CCES上的第一次公開亮相,但當時人們對它背後的技術,以及即將引發的爭議仍一無所知。今天我們有幸請到了CATNIP的發明者、國家重點實驗室項目負責人、人工智能及圖像識別專家—宋秋鳴教授。宋教授你好。”

一名西服男子入鏡,四十歲上下,表情略拘謹。

宋教授微笑:“主持人好,大家好。”

主持人:“先問一個小問題,為什麽要給這套係統起名叫貓薄荷,在我們女生看來這很有點賣萌的意味。”

宋教授:“嗬嗬。確實如此,其實它的全稱是Camera of Architectural Transcendent Network Information Processing,也就是結構式超網絡信息處理照相機。因為我女兒喜歡貓,所以給湊了這麽一個名字。貓聞到貓薄荷時,會刺激它的費洛蒙受器,電信號傳遞到大腦,產生興奮感和一些超常舉動。我們也希望這個小東西能夠給沉悶已久的學界帶來一些新鮮刺激。”

主持人:“說得太好了宋教授,那麽能否請您用較為淺顯易懂的語言向觀眾們介紹一下這套係統的工作原理呢?”

宋教授:“有點難,我試試吧。大家知道,人工智能發展其中一個重要方向就是讓機器模擬人類大腦的思考過程,而最關鍵的第一步就是讓機器學會像人一樣接受信息。人類有非常複雜的感官係統,但信息最主要的輸入方式還是視覺,這就涉及兩大領域的識別:文字和圖像。目前在淺層感知領域,如語音識別、文本分詞、人臉識別等已經比較成熟了,但從淺層感知到特定語義組合的映射,比如,從動作姿態來分辨一張全家福中不同成員之間的關係,對一首詩歌裏的情感指向進行分類這種,目前還隻能在限定領域通過大量訓練來實現過得去的效果。至於像人類那樣複雜的認知能力,機器其實還處於非常早期的階段,大家可以看這張圖。”

屏幕上出現四乘四的圖片矩陣,每張圖都是關於貓的,是在不同環境下,從不同角度拍攝的不同種類的貓。

宋教授:“啊,這是我女兒挑的照片。對於人類來說,即便是一個小孩,隻要他見過貓,不管是大貓小貓,黑貓白貓,貓頭貓尾,他都能夠分辨出來。但對於機器則不是這樣。”

十六張圖中的十三張都被打上紅叉,隻剩下三張貓咪頭部正麵特寫,萌態可掬。

宋教授:“之前我們做的機器圖像識別,無法像人一樣,從事物的不同狀態中提取出某種底層不變性。抱歉我又要拿貓舉例子一隻貓胖了瘦了,掉毛了生病了,或者給它穿戴上各種裝飾品它打個嗬欠、發怒、舔舌頭,它都是同一隻貓。而對於機器來說圖像的尺寸、背景、光照、位移、旋轉、畸變、遮擋……都會影響它的判斷,它隻能根據既定算法進行有限層級的映射,而無法模仿人腦通過多層神經網絡進行分層遞階的多粒度計算……”

主持人:“抱歉打斷您一下,這部分內容或許對於欠缺背景知識的我們來說有點難以理解,那麽您發明的CATNIP係統是如何解決這個問題的呢?”

宋教授麵露尷尬:“不好意思,一不小心就說多了。確切地說我們的一隻腳才剛剛跨過門檻,離真正解決問題還早著呢,這個係統也隻是整個大計劃中的一個前驅項目。我們的靈感其實來自語義分析,大家知道,信息的意義其實並不在於信息本身,而存在於其結構中,就像文本意義存在於上下文,圖像的意義存在於時空結構之中。我們能否通過索引對象存在於整個時空結構中的信息來幫助機器識別對象,這是整個項目靈感的源起。”

主持人:“我問一個外行話,如果機器都無法準確識別對象怎麽能去尋找它存在於……嗯,所謂時空結構中的信息呢?”

宋教授:“你這個問題提得非常好。就像照片裏的小貓,你是先知道什麽是貓,再去找貓在哪兒,還是先知道貓在哪兒,再去識別什麽是貓?這就是一個雞生蛋蛋生雞的悖論。目前我們的神經科學和生理學知識尚無法解釋人類的認知過程是如何發生的,更不用說教會機器了。於是我們采用了另一種思路。”

主持人:“這聽起來就像是推理小說啊。”

宋教授:“嗬嗬,這個比喻有意思。我們是這麽做的,從語義上給定一個對象,通過對接外部數據庫去抓取相關的信息,包括語義和圖像,並按時間序列構建起意義連續體,然後我們把真實的對象擺到機器麵前。比如說,一隻貓,機器會在捕捉到的動態畫麵與意義連續體之間尋找可能的流形映射,當它確定兩者之間能夠建立映射時,也就是說它‘認出’這隻貓時,就會‘哢嚓’一下,按下快門。當然這隻是個簡化的比喻,背後有許多艱深的算法,我們希望以這種倒推方式找到提升機器識別能力的辦法,它更多的是一個數學上的問題。”

主持人:“聽起來蠻有意思的,那怎麽會想到把這項技術從實驗室裏帶到CCES呢?”

宋教授:“嗯,這個我不確定能不能說,之後我跟領導確認一下,如果不方便公布你們就剪掉吧。”

主持人:“沒問題。”

宋教授:“其實這個項目除了來自國家的專項基金外,還有幾家大科技公司的資助,他們希望能從前期就介入,看看這項技術商業化的前景如何;另外一點,我們需要更多的樣本幫助機器進行深度學習,而真實環境中的對象遠遠比實驗室裏的模擬條件來得複雜。正好我的組裏有一個狂熱的攝影愛好者,他幫忙設計了這個,我們稱之為‘錦上添花’的照相模塊,包括調焦、光圈、快門以及濾鏡庫的調用等功能。”

主持人:“這會不會涉及數據隱私的問題?”

宋教授:“所以我們采取了邀請製,所有對象都必須經過資格篩選,並簽署具有法律效力的協議書。”

主持人:“之前網上討論得非常火熱的是,一些受邀請的用戶曬出了CATNIP給自己拍攝的照片,並分享了他們的感受,其中有人說,這些由機器拍出的照片‘比真人拍攝更有感情’,甚至能夠‘觸動心靈深處’。對此您有何評論?”

宋教授:“這個,我隻能說,機器所有的行為都是受程序及算法控製,它是camera而不是cameraman,那種能夠產生情感的機器隻存在於科幻電影裏。”

主持人:“您自己用CATNIP拍過照片嗎?”

宋教授:“我自己沒有,不過……我替我家人拍過。”

主持人:“哦?是您的女兒?”

宋教授:“不不,她的數據量太少。是我的父親。”

主持人:“我有個不情之請,能否讓我們看一下CATNIP為您父親拍下的照片?”

宋教授皺了皺眉頭,又非常迅速地展平:“這恐怕不太方便吧。”

主持人小聲地說:“這是節目讚助商的要求,對方說已經跟您溝通過了。照片也已經在我們的素材庫裏了。”

宋教授不自然地清了清喉嚨:“那……好吧,實際上,是我父親在特護病房裏拍的,大概是上個星期。”

主持人:“非常抱歉,希望他早日康複。那麽我們來看看這張照片。”

一張清瘦老人的照片出現在畫麵中,使用了高反差單色濾鏡突出肌理,人物輪廓有一圈圓形光暈,老人雖有病容,卻麵露安詳,奇怪的是幾道故意做舊的磨損痕跡從麵部爬過,像是碎裂又重新拚合。

宋教授沒有說話,隻是深深吸了一口氣。

主持人:“關於您的父親,您有沒有什麽故事可以與我們分享的?”

宋教授依然保持沉默,像是憶起了什麽久遠的往事,目光開始閃爍不定。