在2013年剛開始熱議“大數據”這個觀念的人們,會發現自己不知不覺已落伍過時。2014年的人們顧不上再空談其概念和意義,他們蜂擁到大數據的各個富礦當中,埋頭于各種開發應用。據業內人士預測,大數據技術很快會出現在社會各個領域。
從數據本身來講,大數據的3個V(volume,velocity and variety/數據量大,輸入和處理速度快,數據多樣性)都是呈指數級發展的,翹首向上的曲線圖明白無誤地告訴人們,大數據的下一個數量級(無論叫什么)也將很快到來。一篇名為《2020年的數字宇宙》的研究報告計算出,從2005年到2020年,“數字宇宙”的規模將增加300倍之多,從130EB增加到40ZB,也就是40萬億GB,約為地球上所有海灘上的沙粒數量的57倍。
從古至今,海邊沙子、天上星星,一直都是“不可勝數”的同義詞,而在大數據時代的今天,它們竟成了不在話下的“小數據”。
大數據技術很快會出現在社會各個領域
伴隨數據爆炸式發展,數據處理技術也飛快發展,目前還屬于新奇玩意的數據批處理和存儲技術,轉眼就成了通用的計算基礎設施,成了企業數據架構的核心組件。這意味著,目前還掌握在數據科學家手中的專業,將很快成為一般技能,幾年之內,人們運用MapReduce和Hadoop等大數據工具,也許就像當年接受MS Office時的情況一樣。
再看看資本方面。根據業界權威Gartner發布的統計,被大數據技術所驅動的IT支出,也呈現出成倍增長的勢頭,到2016年,全球將達到550億美元,比2011年翻一番。
到了這個時候,再懷疑新技術革命是不是新一輪忽悠已沒有意義,無論是資本驅動,還是技術驅動,總之,現實正緊追忽悠,忽悠正變成現實,兩者合一了。
Google公司每天要處理超過24 PB(2的50次方字節)數據,Facebook每天收錄30億次點擊和上傳,Twitter上每天有超過4億條微博發布。這些領跑大數據時代的公司,當然不是在自娛自樂,它們都極為認真地看待它們每日每時收集到的海量數據,把數據當作其核心資產。雖然巨頭們還不急于推出太過驚世駭俗的應用,但人們明白,由于信息構成了世界的本質,一旦大數據開始不受約束地顯示其力量,世界的各個領域都將被顛覆。
在目前這個階段,大數據對個人的顛覆已輕松完成。曾幾何時還被視為個人隱私堅固盾牌的三大措施——告知與許可、模糊化、匿名化,在大數據時代都已名存實亡。隨著數據量越來越大,數據來源越來越多,個人毫無抵抗地變成了透明體。若一個小小的智能電表都有能力憑它所收集的用電數據推測你的生活方式和起居規律,那又何況你的手機、電腦和銀行卡?又何況街上無處不在的攝像頭?一家英國報紙曾說過,如果《一九八四》的作者喬治•奧威爾活到現在,他會發現在他的倫敦公寓60米范圍內,起碼有30多架攝像頭在監視著他的一舉一動。世界早已進入了“超級老大哥”時代,個人的自由意志在喪失,個人的生存價值在消散。
大數據對團體的顛覆也輕而易舉。一個廣為人知的案例是:為了揭示日本相撲賽事中非法操縱比賽的情況,芝加哥大學的經濟學家們使用了11年中超過64000場比賽的記錄數據,果真發現了消極比賽的發生規律,讓業內的潛規則大白于天下。
這還屬于很初級的應用。在目前的PB級時代,大數據技術剛剛成熟,還只是小試牛刀,從巨量的歷史數據中隨意抽取一部分相關關系,建立幾個簡單的算法模型,預測一下流感的傳播、機票的打折、電影的票房、交通的狀況…顯得很無害,很友善,很為人民服務。但每年數百億美元所養育的大數據技術當然不只是為了小小的“練習題”,十年之內,大數據的規模就將從PB級跨入EB級(2的60次方字節),再跨入ZB級(2的70次方字節)。坐擁歷史上空前規模的數據量和空前發達的數據處理技術,“超級老大哥”們還會滿足于小規模、小范圍的顛覆嗎?
如果能夠輕而易舉破解日本相撲業內部不為人知的“行規”,那么,從理論上講,任何一個團體和組織的內部“行規”、隱秘知識、核心機密,都有可能通過海量的公開數據進行破解。而且,面對呼嘯而來的大數據海浪,組織的規模和內部的信息封鎖都不再構成障礙,安保能力的增長只是算術級的,數據能力的增長卻是指數級的,在這場競賽中,開始可能道高一尺魔高一丈,后來就會道高兩尺魔高八丈,可以肯定,大數據全勝!
問題來了。主權國家這個人類社會的利維坦,不過就是個較大規模的組織。十年之內,今天看起來還巍然屹立堅不可摧的國家,也終將面臨大數據浪潮的滌蕩。就像破解日本相撲賽事,很快就會有人宣布,他利用大數據技術精準地破解了某個國家的特殊行為模式。
希臘的債務危機是如何形成的?日本的右傾化會走多遠?伊朗核計劃的真實狀況如何?“薄荷四國”的提法是噱頭還是現實?……這類題目的話語權將很快從政治分析師轉到數據分析師手中,前者憑借經驗和邏輯所建立起來分析框架,將被后者的海量數據沖得稀里嘩啦。
在新加坡國立大學馬凱碩教授近日發表的一篇文章中,作者開篇即提出問題:“中國強硬的新姿態背后傳達出怎樣的信息?是一個強有力的政府在宣告中國從今將表現得像一個真正的大國;還是一個弱勢政府屈服于國內民族主義風潮?真相如何,外界不得而知,但我們能夠推斷,如果中國繼續堅持強硬立場,其在亞太地區獲取多少利益,便要在全球層面付出多少代價。這是中國未來不得不面對的新困境。”
在大數據時代,人們很快就不這樣說話了。針對一國政府與國內民族主義風潮的互動關系,甚至會有現成的模型,隨時通過大數據進行檢驗。至于一國在地區層面與全球層面的利益交換,也可以輕易數據化,得出基于量化指標的結論。
十年之內,各國政府都會設有應對大數據國際政治的專門機構。中國政府會發布大數據報告,揭示日本的軍國主義歷史演變軌跡;日本也會針鋒相對,發布關于中國軍力增長的大數據分析,甚至預測出中國建立海外軍事基地的時間。隨著各國政府從大數據分析中獲得的新知識、新觀察、新洞見越來越多,國際政治的整體局面必將大為改觀。
但國家本身卻不是這場數據革命的主導者,而是被動的接受者和追隨者。“除了上帝,其他人必須用數據說話”,據說這是硅谷經理人的信仰,那些每日每時都在收集著“富可敵國”的數據資源的巨頭企業,其實也早已擁有了“強可敵國”的大數據力量,在所有人都必須用數據說話的時代,它們就是新的上帝。是它們在引領變革,在將硅谷的信仰的行為規范推向全世界。如此看來,Google,Facebook,Twitter等公司在目前這個階段的相對低調和隱忍,更顯得其狀不祥,大有風暴前短暫平靜的模樣。
而一個基本事實是,最大的大數據公司都在美國,用國家來衡量,美國早已是囊括了大數據資源最多的國家。如果大數據終將導致權力的重新分配,美國將再次占據優勢。這是大數據時代國際政治格局的另一個維度,也不得不正視。
參考閱讀:文揚:互聯網的顛覆浪潮終將沖向政治領域(一)
相關文章
「 支持烏有之鄉!」
您的打賞將用于網站日常運行與維護。
幫助我們辦好網站,宣傳紅色文化!
歡迎掃描下方二維碼,訂閱烏有之鄉網刊微信公眾號
