囚徒博奕與道德教育 辛一山
囚徒困境”是博弈論里最經(jīng)典的例子之一。講的是兩個嫌疑犯(A和B)作案后被警察抓住,隔離審訊;如果兩人都坦白則各判7年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白則因證據(jù)不足各判1年。
在這個例子里,博弈的參加者就是兩個嫌疑犯A和B,他們每個人都有兩個策略即坦白和不坦白,判刑的年數(shù)就是他們的行動回報?赡艹霈F(xiàn)的四種情況:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,這是博弈的結(jié)果。A和B均坦白是這個博弈的納什均衡。這是因為,假定A選擇坦白的話,B最好是選擇坦白,因為B坦白判7年而抵賴卻要判十年;假定A選擇抵賴的話,B最好還是選擇坦白,因為B坦白判不被判刑而抵賴確要被判刑1年。即是說,不管A坦白或抵賴,B的最佳選擇都是坦白。反過來,同樣地,不管B是坦白還是抵賴,A的最佳選擇也是坦白。結(jié)果,兩個人都選擇了坦白,各判刑7年。在(坦白、坦白)這個組合中,A和B都不能通過單方面的改變行動增加自己的收益,于是誰也沒有動力改變自己的選擇,因此這個組合是納什均衡。
囚徒困境反映了個人理性和集體理性的矛盾。如果A和B都選擇抵賴,各判刑1年,顯然比都選擇坦白各判刑8年好得多。當(dāng)然,A和B可以在被警察抓到之前訂立一個"攻守同盟",但是這可能不會有用,因為它不構(gòu)成納什均衡,沒有人有積極性遵守這個協(xié)定。
這個例子只是一次性的博弈結(jié)果,而如果進行同樣性質(zhì)的多次博弈演繹之后,囚徒的選擇就會偏向于合作,而且對于背叛者實行報復(fù),結(jié)果“一報還一報”變成為最佳選擇。理論上的解釋是:短期行為背叛有利,長期的行為互動會形成一定的合作模式。背叛者總體要吃虧。
雖然這是一個囚徒例子,但相對于社會道德教育也是具有相同的意義。社會里人們的行為可分解為短期行為和長期行為。在社會發(fā)展的初級階段人們會為了獲取眼前利益而選擇相互背叛,但人們通過長期的社會活動經(jīng)驗總結(jié)出一套社會相互合作的行為規(guī)則,這就是囚徒博弈多次演繹結(jié)果的體現(xiàn)。這樣的一套行為規(guī)則,我們把它確定為道德規(guī)范。最為成熟社會道德規(guī)范模式是我們中國人總結(jié)出來的,那就是儒家所宣傳的倫理道德。簡單的概述就是:“仁、義、禮、智、忠、信、孝、勇”。中國古代的倫理道德系統(tǒng)周全、龐大,它涉及所有的社會生活門類。
倫理道德追求的是長期的目標(biāo),它的效用就像現(xiàn)在的商家追求品牌效用一樣,有品牌自然就有效益。一個社會的道德倫理越發(fā)達,就說明它的文明水平越高。這種趨勢就像囚徒博弈的超級演繹,只有合作才是人類低成本高效益發(fā)展的正確途徑,F(xiàn)在我們廢棄了祖先總結(jié)出來的一整套倫理道德經(jīng)驗,整個社會限于無序之中,人們就像原始狀態(tài)剛進化時那樣著眼于眼前的利益。只要能夠獲得利益不在乎說謊、欺騙,可這樣的行為就像典型的囚徒博弈一樣最終只會給自己帶來傷害。
現(xiàn)在社會的毛病那么多,腐化、貪污、謊言、欺騙、不講信譽、……等等全都是追求短期化目標(biāo)的結(jié)果,大家也苦于找不到解決的辦法。這等于是捧著金飯碗到處要飯,實際的解決大量社會問題的辦法,祖先早已經(jīng)為我們設(shè)計好了。為什么我們要固執(zhí)的堅持錯誤的觀念反對原來行之有效的道德倫理教育?
大家都知道短期化行為不好,但怎么使得人們句有長期化行動的目標(biāo)和需求?這些祖先也為我們準(zhǔn)備好了。只是簡單的收拾一下就可以有大的轉(zhuǎn)變,馬上行動起來注重社會的道德倫理教育吧!
注釋:道德是社會或特定群體的共同期望值,是一種行為的標(biāo)準(zhǔn)。人們對這樣的標(biāo)準(zhǔn)有希望其他的人都能達成的期望。道德可以減少社會整體的損耗。道德有限制和懲罰不道德的有力機制。
-----------這看上去很難.
因為如果我開始用道德倫理約束自己.期望群體的低耗能.
結(jié)果是我是那個被判刑10年囚徒.
所以除非大家都有這意識.不然沒有人會獨自選擇抵賴.
-----------您戳痛了當(dāng)今道德倫理建設(shè)的傷疤。
中國的道德建設(shè)在功利機制下任重而道遠。
十年樹木,百年樹人。教育是百年大計。
有多少執(zhí)政者對這句話置若罔聞啊。
真懂這句話而又付諸于行動的人,又有多少呢?
...