一、讓總經理王高飛緊張敏感的海外合作伙伴
2014年11月,新浪微博總經理王高飛親自下令把徽劍我的新浪微博給封了,理由是我在造謠新浪微博。
起因是新浪微博公開了其數據分析合作伙伴,然后我指出其合作伙伴中有問題。
當我發出這條微博后,不到半小時,徽劍、徽通社兩個賬號都被新浪微博封號。新浪微博總經理王高飛發出一條微博。
那么是不是我徽劍真的造謠了呢?這個effyis的公司究竟是什么呢?先看新聞報道:
2014中國大數據技術大會上一位專家的發言
這可是由中國計算機學會(CCF)主辦,CCF大數據專家委員會承辦,中科院計算所與CSDN共同協辦的帶有學術性質會議上的專家發言。不會也是造謠吧?
這兩條報道可以證實兩點:
1、這家叫Effyis的公司在“銷售注冊用戶超過5億的新浪微博全部數據”,包括“微博發布的數據”等等。
2、這家公司還被日本企業買了。
有人會說,他們是不是只搜集商業信息,那也沒事啊?那么我們再來看日本hottolink公司(也就是收購effyis的公司,同時也是新浪微博另一家在上海的數據合作公司的母公司,也在新浪微博數據合作名單里面,大家搜索下)的網站報告。
相信即便不懂日語,也能從里面的漢字看個大概吧?看了以上內容,您非要說這兩家日美公司只是純粹的商業分析,我真的無語了。這個告訴我們,他們完完全全就是通過各種渠道搜集中國的商業、政治、社會等信息。而新浪微博,為了錢,把數據合作接口對其開放了,為其創造了極大的便利。
還有更多的內容,大家可以去搜索下。
二、通過新浪微博的數據分析可以得到什么?
有人會問,新浪微博那些數據都是公開的,有什么秘密可言?
先來說說題外話――筆跡分析,關于這個,徽劍我曾經在我的微博上做了短暫的表演,就是讓我的粉絲寫字,我來分析他們的性格,前后分析了幾十個人,貌似沒人說我分析錯了。可以這么說,像我一樣的筆跡性格分析人員,能夠通過一個人寫的字,來分析出一個人的性格特征。
那么在數據分析領域,特別是語義行為分析的研究前沿,通過語義行為來分析一個人的特征,就跟一個人的筆跡一樣,通過一個人的發言,可以判斷出這個人的喜好、性格,進而判斷出他的消費能力、政治取向,甚至可以評估出一個人是否容易出軌,一個人是否貪財,是否是一個很好的合作伙伴等。
一個人的發言,就是這個人的筆跡。他發言的內容,他選擇的語氣,都能反映這個人的情況。徽劍我恰好是一名有點數據分析技術水平的“自封小腕”,也曾做過一些數據分析業務,尤其是在漢語語義的大數據分析上,有較深入的研究。比如我們就曾經通過新浪微博董事長曹國偉的閱讀習慣,分析出曹國偉是否喜歡情趣內衣。我們還通過新浪微博互相之間的好友關系、互動,分析出一堆名人之間關系。比如當初王石和田樸君的關系,我們就是從他們互相間的微博互動的細節分析出來的。
早期的情報機構,就會從一些媒體報道,來分析一個國家的政府行為特征。往往一個很小的細節,就能暴露細節后的大量問題。有時候一張照片,一段話,就能曝光太多的信息。
那么回到新浪微博,我們知道,新浪微博可以公開提供以下情況:
1、個人的身份信息(特別是認證個人)
2、個人的好友互動
3、個人的微博內容。
4、支持者(即粉絲、轉發者)的情況
那么通過對新浪微博的身份信息,可以判斷這個人的發言價值。通過其支持者,可以判斷出其發言內容被大眾認可的程度,或者說對大眾群體的影響程度。那么從他的好友互動,可以看到一些比如拉幫結派等行為。從微博內容可以看出的問題太多了,比如他的收入水平,他的性格,進而他的購物特征。比如微博上很多人喜歡把私人問題放微博上講,比如賣房買車,比如有沒小孩子,甚至到那里去旅游等的,一旦把你幾百、幾千條微博全部匯總,你這個人大致上的情況也就出來了。
一旦對個人情況了如指掌,而且這個人數還不是幾個人,而是5億人,考慮到重復帳號,至少也是上億人。情況就很恐怖了。
商業角度:中國各個地方的商業消費習慣,大家的各行業購買潛力、消費特征等,都可以輕易被商家獲取。如果數據分析光是了如指掌那還是小事。相信很多用戶在微博上因為提到某個字眼,比如減肥,就會發現一堆賣減肥藥的跑來評論或者@ 你吧?這就是很簡單的數據分析應用,發現關鍵詞,就去發廣告。
如果換成政治角度:中國上億人的政治傾向、政治判斷能力、對時局的看法等等,也是同樣了如指掌。而且是被美國日本了如指掌。甚至實施上面說的這種類似廣告的輿情鼓動、傳播呢?平時無所謂,戰時呢?緊張時期呢?
三、大數據分析就一定侵犯隱私么?
那我們再來談談大數據是不是侵犯隱私這個話題。
市面上的大數據分析有兩種情況,一種是數據方自己分析,這種也包括分析方為其服務,所有分析成果都是歸數據方自己的。還有一種是分析方從數據方處以各種形式獲取數據(包括購買許可、自己采集等),然后分析結果歸分析方所有,分析方可以拿這個結果去為第三方服務。
顯然,第一種數據分析過程情況不會違反任何隱私,因為所有的數據都是數據方自己平臺的事情,至于分析結果如何使用,那是另外一個話題。第二種數據分析過程問題就來了,因為第二種涉及到數據交易,換句話說,涉及到數據方向分析方出售數據的行為。
顯然在這里,出現的不是數據分析問題,而是數據提供的內容和方式。
我們都知道,法律明文規定,不能買賣出售個人資料。因此數據方向分析方提供數據,必須基于匿名為前提,因為一旦不是匿名,就涉及到明確的個人隱私,這是司法問題。
在我不知道你是誰,不能清晰確定的你的個體身份的話,我對你公開的分析,即使用于商業用途,我也是不違法的,因為我只是在分析一個網絡形象個體。但是一旦知道這個人是什么人,清晰知道這個人是誰時候,是在分析一個真實的個人。而這種分析的機會,又是通過商業合作“買”來的,那么你就構成了完整的買賣個人數據產業鏈。
新浪微博聲稱自己的對外微博數據合作只是基于關鍵詞檢索的,但是他們卻忘了,這個關鍵字檢索可以查詢到內容,然后內容又可以追溯到個人。
換句話說,對于一個數據分析方,他可以通過數據接口,大量、高效地獲取新浪微博上的內容,然后通過web技術對內容做用戶匹配,做精確鎖定。這種情況下,你是不是公開個人身份,有什么意義么?
再看看新浪微博注冊資料里面有什么?
公開的可以獲取的,居然就有郵箱和其他通訊資料。有人會說,新浪微博并不提供用戶的身份證等信息給第三方,但是確忘了,新浪微博上有大量的認證用戶,對于一個認證用戶來說,是可以確定他真實身份的,如果同時又把他郵箱等通訊資料提供出去,
我不相信新浪微博的數據分析客戶,只是純粹的、盲目地分析那些內容,而不會去分析這些內容是誰發的,不會去對比下用戶的身份信息。更不相信新浪微博會對數據分析客戶屏蔽這些認證用戶的資料。
同樣,我們來看百度、搜狗等的廣告聯盟,他們也會根據用戶使用搜索時候的習慣,記錄下來,并加以分析,那么他們是否也涉嫌侵犯隱私呢?我們仔細看看,百度等廣告聯盟,記錄的是你通過百度等搜索時候,輸入的搜索詞,或者是網民打開了含有推廣鏈接嵌入的頁面內容,來評估你的喜好,進而判斷你的其他情況。他們給廣告主并不提供你的信息(其實他也沒太多信息),更不會去關聯搜索跟蹤。百度、搜狗這種廣告聯盟,他們的數據分析就是建立在全匿名基礎上,因此他們不會構成對用戶隱私的侵犯。
我們再看看淘寶的數據分析,那就更簡單了,你什么時候見過淘寶把自己用戶的資料提供給第三方么?當然那些賣家泄露買家資料,跟淘寶就沒關系了。
大家從上面分析可以看出,大數據分析,是沒有問題的,問題在于新浪微博違反了大數據分析的基本道德。開放了真實認證用戶身份資料給分析方,這是嚴重泄露隱私的司法問題。
刑法第二百五十三條之一 國家機關或者金融、電信、交通、教育、醫療等單位的工作人員,違反國家規定,將本單位在履行職責或者提供服務過程中獲得的公民個人信息,出售或者非法提供給他人,情節嚴重的,處三年以下有期徒刑或者拘役,并處或者單處罰金。
竊取或者以其他方法非法獲取上述信息,情節嚴重的,依照前款的規定處罰。
單位犯前兩款罪的,對單位判處罰金,并對其直接負責的主管人員和其他直接責任人員,依照各該款的規定處罰。
有人會說,這些認證信息不是公開的嗎?沒錯!
新浪微博自己試圖在這里規避責任,提供高速的內容數據接口,表面看是盲目的,新浪微博沒有提供具體身份信息,但是無論如何數據關鍵詞檢索,最終都要找到具體用戶,比如有人投訴,你最終必須找到這個投訴用戶是誰吧?
然后新浪微博告訴你,我不在數據接口提供這個用戶的資料,但是我告訴你用戶的名字……然后數據分析方通過web方式去查找這個用戶?這不哄鬼么?
簡而言之,你網站上有大量用戶信息,而且是開放的,別人通過正當的瀏覽,看到并記錄這些信息,是不違法的,因為別人看到或者說獲取這些信息的過程是合法的。但是你網站方去向第三方賣這些用戶信息,你網站就是違法的,因為網民并沒有授權你去賣他們的信息。
新浪微博,其實很清楚這個信息的敏感性,看前面微博的內容,他不停強調自己不提供用戶資料,但是數據分析方,很容易找到用戶資料這個他回避了。用的是自以為巧妙,有人罵你,微博告訴你,罵你是什么內容、罵你人的名字,至于罵你這個人的資料,請去自行查看。
四、不得不說,在新浪微博發言的隱患
經過徽劍我的分析,您現在明白了吧。
對于普通網友來說,你的言行舉止,被商家拿去做真實用戶行為分析,你愿意么?
對于官員來說,你的言行舉止,被國外機構拿去做政治動向分析,你愿意么?
對于政府來說,你們把新浪微博捧得越高,在上面搞的什么問政越多,海外機構對中國的社會民情獲取就會越方便,你愿意么?
那么有人會問,既然新浪把這些數據開放,作為網民,應該怎么做?徽劍在這里給你點小小建議:
如果您是普通個人,盡量減少在新浪微博上的發言,資料不要填詳細,或者改成錯誤的。尤其是不要在新浪微博談及個人比如家庭收支、購房買車、孩子成長等消費信息。除非你為了忽悠別人把你當股評家,否則談及你買了那些股票絕對不是好話題。實在要談,你可以找一些封閉的圈子之類應用去談。
有人會說,你徽劍以前怎么也在微博上那么積極發言?答:以前我并沒有留意到新浪微博對外的數據合作居然到了這種程度,只是在新浪公開其合作伙伴后,我才反應過來。而且這兩個月來沒有玩微博,頸椎也好了,工作效率也提升了,算是因禍得福吧。
如果您是政府官員,個人建議,不要在新浪微博上開設認證賬號,或者發布能夠證實你個人身份的言論。更不要在網上談及任何政府政策有關的話題,包括爭辯。如果你是政府智囊機構的人員,更要學會閉嘴。
特別提醒哪些所謂熱衷新媒體的政府領導、部門,新媒體是沒錯,但是新浪微博被海外監控著呢!你可以去其他微博等地方開賬號的。后續我會有文章,專門針對在新浪微博開設政務微博的價值做分析,會用嚴謹的推理告訴你們,在新浪微博上搞政務微博,就是一場鬧劇。有人會說一旦發生輿情事件怎么辦?徽劍在后面會在這篇里面,分析新浪微博是如何一手制造輿情事件,一手來搞所謂平息手法。這個話題比較大,這里不多談。
至于司法機關應該做的事情:
第一,公安機關追究新浪微博這種用用戶數據牟利的行為,嚴格處理有關當事人,并限制以后的這種數據出售行為。新浪微博表面上規避了直接提供用戶資料的方式,但是基于新浪微博提供的數據,其合作方很容易查看了解用戶的資料。
第二,國家安全機關需要清查新浪這種對外出售數據,購買方的背景,以及已經產生的后果做出應對。想想看,中國有關部門能夠接入臉書和推特的數據接口么?
因為徽劍我這里提到了國家安全,而徽劍在網上又是比較知名的“五毛大統領”,因此肯定部分“改革”“自由”網民會有逆反心理,會說,我就一普通人,不怕。那么我告訴你一個商業情景:
新浪微博把你的數據出售后,未來隨著數據分析水平的提高,你在微博上的賬號會收到更多的@或者評論,甚至一旦跟其他渠道產生關聯數據后,比如你在新浪微博上討論如何買房子,結果你手機就收到房地產公司的銷售電話。你一討論生孩子,你郵箱就就收到賣尿布的廣告。你愿意么?你到哪里去旅游,你就收到當地酒店甚至小姐發來的拉客短信,你高興么?
雖然我徽劍是知名的“五毛大統領”,但是我告訴你,你面前確實是一堆狗屎,你不會也非要逆反地去嘗嘗吧?
當然你們不動腦子,非要去嘗,我也沒轍,只能看樂子了。
附言:
關于王高飛的一個笑話,這個笑話是我在知乎上看到的。
按照網友說,這個ID是王高飛的,王高飛用這個ID發了一條微博,炫耀觀看毛片,這位名叫網友指出其看的是盜版,結果很快發現,新浪微博就把他的賬號給封了。
想想也是醉了,作為一家互聯網上市公司的負責人,在自己公司平臺上,用小號炫耀觀看盜版色情影片,被人指出后,惱羞成怒,把指出的網友給封號。如此…….中國互聯網,不,全世界互聯網能找出第二個么?
好吧,廢話不說了。近期徽劍會陸續寫5-10篇長篇文章,曝光新浪微博、還有各種自媒體的內容。至于您要看徽劍的文章,都會首發于徽劍個人公眾帳號huijianonline不過我個人比較懶,歡迎大家點題。徽劍個人聯系方式里面有。
徽劍版權申明:所有徽劍的文字,在保留版權申明情況下,任何傳統、網絡媒體(包括自媒體)均可以自由轉發,無需支付稿酬,但是不得篡改或者斷章取義。當然如果能給個樣刊或者發個鏈接通知下,那便是極好的。如果發現篡改或未保留版權申明,同樣徽劍本人也將保留司法處理的權利。
相關文章
「 支持烏有之鄉!」
您的打賞將用于網站日常運行與維護。
幫助我們辦好網站,宣傳紅色文化!
歡迎掃描下方二維碼,訂閱烏有之鄉網刊微信公眾號
