第15章 大數據時代

第十五章 大數據時代

“微軟公司生產了一款數據驅動的軟件,主要是為工程建設節約資源提高效率。在這個過程裏可以為世界節約40%的能源。拋開這個軟件的前景不看,從微軟團隊致力於研究開始,可以看他們的目標不僅是為了節約了能源,更加關注智能化運營。通過跟蹤取暖器、空調、風扇以及燈光等積累下來的超大量數據,捕捉如何杜絕能源浪費。

而且隨著全球範圍內個人電腦、智能手機等設備的普及和新興市場內不斷增長的互聯網訪問量,以及監控攝像機或智能電表等設備產生的數據爆增,使數字宇宙的規模在2012到2013兩年間翻了一番,達到驚人的2.8ZB。IDC預計,到2020年,數字宇宙規模將超出預期,達到40ZB,人均數據量將達5,247GB。

你能想象如此巨大的數據就僅有0.4%得到了分析。為什麽這麽低?因為這些數據來源分散。

網絡日誌,RFID,傳感器網絡,社會網絡,社會數據,互聯網文本和文件;互聯網搜索索引;呼叫詳細記錄,天文學,大氣科學,基因組學,生物地球化學,生物,和其他複雜和/或跨學科的科研,軍事偵察,醫療記錄;攝影檔案館視頻檔案;和大規模的電子商務。

同時物聯網、雲計算、移動互聯網、車聯網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器,也無一不是數據來源或者承載的方式。

那麽大家有沒有想過這樣一個未來情況:我們手機、平板電腦、PC、車載電腦、數碼相機、mp4、mp3以及監控攝像、公司資料、實驗數據,甚至於是軍事機密,一切數據都被放入到數據庫,沒有了儲存設備。不用攜帶,不會丟失,隨時可以查閱,網絡資源的下載也像是複製和粘貼一樣方便。

整個大數據庫就像是一個大的社區。每個人在大數據庫都一個自己的儲存空間,就像是你在社區裏有一套房子一般。為了保密,你可以將自己的房子打造成銅牆鐵壁,或者有大數據庫為您提供隔離式的儲存空間,又或者您直接指定可以訪問數據的設備。

黑客將像小偷一樣被您拒之門外。

有人會說,我的電腦殺個毒,掃描個盤都要一個多小時。你如何保證我在用大數據庫時不是卡的想睡個覺先?(哈哈!)

我敢保證的是未來20年時間裏,製約大數據庫發展的隻會是網絡速度。

我為什麽敢保證?因為我們已經完成了大數據庫的技術積累。在未來1年內,千度即將投資1000個億美元的資金用於大數據庫的建設。”

發布會上的記者喧嘩了起來。沒有人想到在全世界還在努力推動著大數據庫這輛牛車時,千度已經坐上了法拉利。

“李總!您能詳細的說明一下您所說的技術積累嗎?是什麽樣的技術能夠讓大數據提前來臨?”

“就在一個月,我們千度收到三份技術設計,一份為大數據庫仿大腦神經三維存儲設計。大家都知道人類大腦能夠儲存10萬億位的信息量。這樣的存貯能力可與1萬台計算機的存貯容量相媲美。而這份天才般的設計就是仿真的大腦,他是利用三維空間的關聯式儲存,並不是單純意義上的數據,理論上他的存儲空間是目前全球網絡數據總量的10倍。

另一份是關於大數據庫存儲掃描程序的,將像是我剛剛說的,如硬盤文件掃描,稱之為‘神經網絡掃描模塊’,是通過聯想式關鍵詞鏈接方式進行的。打個比方,畫一個圓,你能想到什麽?太陽?燒餅?披薩?圓規?

光有‘神經網絡掃描模塊’還不行,還需要智能識別分析,初級的人工智能,幫助你找出任何你需要的東西。”

“李總,您剛剛也說的,網速是限製你大數據庫運行的一個方麵。我想現時代,怕會有很多人因為網速跟不上,而拒絕使用大數據吧。你怎麽看待這個問題?”

“我的未來設想是沒有個人儲存設備的,人人都用大數據,用大數據幫助我們更準確的定位我們的生活。而現下,使用大數據的時代才剛剛開始。千度的大數據庫歡迎任何人使用,我們目前定位的對象多是高校,集團企業和政府、科研部門等,在個人服務上會向後延長3到5年時間。”

“李總,大數據庫需要多久就能投入使用?”

“千度已經就元件,設備和Internet等國際性硬件廠商企業進行了初步的洽談。在合同商定之後,就開始基礎建設。到時我們千度就建造一棟標誌性的建築用於存放大數據庫。這棟建築也就是我們千度公司的明星片。”

“李總,大數據庫是否接受國際數據並入?”

“我很樂意國際上的企業和集團能夠信任我們,千度不會拒絕朋友。大數據庫是可以進行區域劃分的,即時,我們會設立國際數據區域。不過公共區域還是會隻有一個的,畢竟數據屬於全世界。”

“那裏李總如何處理語言文字問題?”

“因為是聯想式的掃描,有可能是會找到不同語言版本的最佳答案,在這一點上,用戶是可以選擇優先序列的。”

“李總,您能透露這三種設計的來源嗎?”

“可以,在這方麵我們和設計者有過溝通,設計者也願意公開身份。他叫餘烽,是suzhou大學的計算機係碩士,目前聽說在負責su大的生物電腦研製。不久將會有結果。”

“李總,您的意思是說,這三個設計不是研究所或者實驗室的成果,而是個人研究發明的?而且都是同一個人?”

“設計者餘烽的背後是不是有團體就不得而知了。但這三份設計的確出自一人之手。”

“那麽李總!千度得到這三份設計,又付出什麽代價呢?”

“這一點是商業機密,不方便透露,我可以說一下的是,我們千度會在未來五年時間裏為其投資共5000億美元。”

“李總,不是我不相信,這確實不能讓人信服,千度對三種設計的評價又是什麽?”

“天才的設計,天馬行空的想象,能夠幫助千度跨越一個世紀。同時三份設計資料經過千度技術部、華夏科學院和麻省理工學院三家研究機構的共同評估,一致認為有90%的可行性。”

“為什麽不是100%,90%是否太過冒險?”

“還有10%是最後的拚裝問題,需要設計者本人親自組裝。”

“您是說,餘烽不但是一位科學家還是一位高級技工?”

“這是我們從資料上看出來的,大數據庫的組裝過程極為複雜,你可以想象一下人類大腦有多複雜他就有多複雜。我們發現目前為止還沒有人能完全理順大數據庫的頭緒。不過這不影響他的可行性報告。”

千度公司的熱鬧之後,記者們前往su大,然而都被一位年輕漂亮又能幹的女秘書拒之門外。

原因隻有一個,忙!