(Iterated Prisoner's Dilemma)
作者:iamanewbee
[b]【特權階級在1978年首先背叛了,所以改良永遠沒有出路,至于屁民,余下怎么做已經有了答案。要建立人人合作的誠信社會,鏟除不合作的特權階級是前提條件。】[/b]
囚徒困境(Prisoner's dilemma)是指以下這個經典實驗(在好萊塢的電影里也經常得見):
警方逮捕A、B兩名嫌疑犯,但沒有足夠證據指控二人入罪。于是警方分開囚禁嫌疑犯,分別向雙方提供以下的選擇:
若一人認罪并作證檢控對方(“背叛”),而對方保持沉默(“合作”),此人將即時獲釋,對方將判刑5年。
若二人都保持沉默(“合作”),則二人同樣判刑1年。
若二人都互相檢舉(“背叛”),則二人同樣判刑3年。
用得益表格的形式就是:
A合作B合作: A 1年 B 1年
A合作B背叛: A 5年 B 0年
A背叛B合作: A 0年 B 5年
A背叛B背叛: A 3年 B 3年
很顯然,如果著眼全體利益,A和B都應該合作(保持沉默),全體利益達到了最好的2年刑期。但是人的本性是自私的,只會著眼個人利益,無論對方是什么選擇,選擇背叛(認罪并作證檢控對方)都能夠把自己刑期降到最低。所以A和B都會選擇背叛,最終結果是兩人同樣判刑3年,全體利益達到了最差的6年刑期。
囚徒困境應用到你和唐駿的面試,是同樣的結果。你和唐駿都可以選擇實報學歷(合作),或者造假學歷(背叛)。誠實或者造假的得益表是:
你誠實唐誠實: 你繼續面試 唐繼續面試
你誠實唐假造: 你面試失敗 唐繼續面試
你假造唐誠實: 你繼續面試 唐面試失敗
你假造唐假造: 你繼續面試 唐繼續面試
從個人利益出發,理性的你和唐駿都會選擇假造,最終結果是兩人都靠造假學歷繼續面試。
這個例子可以從兩個人擴大到N個人,從個人利益出發,每個理性的人都會選擇造假學歷繼續面試,對整個社會的凈后果是用人單位受騙而承受最大損失。
這個例子也可以從假學歷推廣到抄襲論文、三聚奶粉、香精香米、地溝油、等等。正如某位網友所說的,"要能賺唐駿這么些錢,罵唐駿的多少齷齪事都做了"。完全正確,人的兩個本性---自私和理性---決定了人必然陷入囚徒困境,必然為私利而不顧全體利益。道德、信仰、輿論、法律等等也許能夠稍微壓抑自私,但無法改變人性,也就無法讓人擺脫囚徒困境,這就是為什么中國5千年來(換埃及是7千年,換美國是2百年,等等)改朝換代,實行各種道德信仰輿論法律,弄虛做假毒害全體的行為屢教不改、屢禁不止。
萬幸的是,擺脫囚徒困境的可能是有的,如果我們引入一個新的變數 --- 重復。
重復囚徒困境(Iterated Prisoner's Dilemma)是指A、B兩人重復多輪囚徒困境試驗,而且每人都知道以前對方所做的決定。這時的每個人都可以制定一套策略,決定每輪試驗是否選擇合作或者背叛。一個顯而易見的策略是“永遠背叛”,因為這個策略在每輪試驗都是力求個人利益最大化。換言之,“自私的人永不吃虧”。
把重復囚徒困境推廣到N個人,每個人的策略都是“永遠背叛”,整個社會就達到一個平衡,即一個“人人自私”的社會。說這個社會達到一個“平衡”,指的是企圖改變這個社會的“微調”都是徒勞的。我們可以假想,在這個人人自私的社會里,其中某人在某輪囚徒試驗中選擇了“合作”,很顯然,在那輪試驗中他得到的利益將是會所有人中最小的。而他也對此次的吃虧留下了深刻印象,在下一輪試驗中會牢記要“背叛”。
把這個結論推廣到現實社會,就是: 如果其他人都是唐駿,你想不買假文憑都難!如果人人都在抄襲論文、造三聚奶粉、造香精香米,你不去賣地溝油只能說明你是傻子將被社會所淘汰!
萬幸的是,1959年以來,無論是理論還是電腦模擬,都已經證明,“永遠背叛”并非唯一的一個可以讓全體社會達到“平衡”的策略,“人人自私”不是唯一的一個社會平衡態。
讓我們來看一個叫做“恩怨分明”(tit for tat)策略。這個策略很簡單:
第一輪試驗: 選擇“合作”。
以后的每輪試驗: 選擇上一輪試驗對方作出的選擇。 (如果對方上一輪合作,我就這一輪合作,否則就背叛。)
把重復囚徒困境推廣到N個人,每個人的策略都是“恩怨分明”,很顯然,整個社會就達到一個“平衡”,一個“人人合作”的平衡態。我們可以假想,在這個人人合作的社會里,如果有人選擇了“永遠背叛”的策略,在第一輪試驗中他將是獲得利益最大的人,但是在以后的每輪試驗中,與他對弈的都會選擇背叛,而不與他對弈的繼續合作,N輪試驗下來,他將是得到利益最小的,而其他合作的人將得到穩定持久的利益。他會對此印象深刻而最終放棄“永遠背叛”的策略,整個社會回到“人人合作”的平衡態。
把這個結論推廣到現實社會,就是: 人人都實報學歷、原創論文、供應真奶粉真香米、杜絕地溝油。如果出現唐駿造假文憑,就放他入下一輪面試,然后灌他毒米地溝油!
和恩怨分明類似的,以個人利益為出發點卻讓社會利益達到最大化策略有很多,大致都有如下特點:
1. 初始友好: 一開始總是選擇合作,而且絕不首先背叛。
2. 有效懲罰: 如果對方背叛一定以同樣的背叛作為懲罰。
3. 愿意寬恕: 如果對方改邪歸正從背叛改為合作,就愿意原諒對方回到合作,不永遠記仇。
4. 絕不嫉妒: 不貪圖達到整個社會所有人中的最大的得益者。
既然理論上已經證明,“人人合作”的社會是可能的,那么為什么中國還沒有實現?要把理論變為現實達到社會“人人合作”的平衡態,有兩個關鍵:
1。社會結構允許任何人對任何人實施“恩怨分明”或者類似的策略。
可以想象,如果有人可以在某輪試驗中選擇“背叛”而不為人知,或者為人知曉但別人無法對他實施懲罰,“永遠背叛”的策略會大行其道,“人人合作”的平衡態會頃刻垮臺。
那么中國是否存在選擇“背叛”而不為人知?是否存在信息不透明不對稱?我想是有的。
那么中國是否存在無法對“背叛”實施懲罰?是否存在特權階級、壟斷勢力、體制內、仆人?是否存在暴力抗法、有法不依?人情代法?是否總想找熟人走后門繞過法規?我想都是有的。
2。全體人群中有足夠多的人采用“恩怨分明”或者類似的策略,或者說有足夠少的人采用“永遠背叛”的策略。
如果多數人已經采用“永遠背叛”的策略,社會將走向“人人自私”,因為那也是一個平衡態。所以“恩怨分明”者在社會所占比例(即所謂的critical mass)至關重要。這解釋了為什么有些國家可以達到“人人合作”的平衡態,有些即使引進了同樣的法律、制度等等卻不能找到(至少不能很快達到)“人人合作”的平衡態。這也解釋了為什么一個國家的貪官污吏攜款潛逃到另一個國家卻可以奉公守法。等等…
那么中國是否已經有過多的人采用“永遠背叛”的策略導致社會“人人自私”?我沒有統計過,希望沒有多到無可挽回的地步吧。
綜上所述,在中國要達到個人和整體利益同時最大化的“人人合作”的平衡態,有太多需要改變的地方。社會結構需要改變,信息渠道需要透明,特權階級需要消滅,后門傳統需要杜絕,采用“恩怨分明”或者類似的策略需要達到一定高的比例,等等。每件事都不可能一夜成就,每件事都太困難。在可以預見的未來,“永遠背叛”的唐駿將繼續大行其道,而看清這點的每個人也會出于自身利益最大化的需要而同樣采用“永遠背叛”策略。
囚徒困境,名副其實,非常困境。
「 支持烏有之鄉!」
您的打賞將用于網站日常運行與維護。
幫助我們辦好網站,宣傳紅色文化!
注:配圖來自網絡無版權標志圖像,侵刪!
聲明:文章僅代表作者個人觀點,不代表本站觀點——烏有之鄉
責任編輯:wuhe
歡迎掃描下方二維碼,訂閱烏有之鄉網刊微信公眾號
