2023-12-24

"囚徒困境"最優解

賽局理論的"囚徒困境":

兩個一起犯案的囚徒, 如果能夠堅持都不認罪(信任同伴), 警方查無人證物證, 雙方都會無罪獲釋, 瓜分贓款(3分). 如果一方不認罪(信任同伴), 另一方認罪(背叛同伴), 不認罪的一方會被判重刑(0分), 認罪的一方被豁免釋放, 獨得贓款(5分). 如果雙方都坦白認罪(背叛同伴), 雙方都會被判輕刑(1分).

要自私自利, 為非作歹的人去信任同伴, 似乎違反了本性, 所以成為了困境. 但這種困境實際上存在於所有交易協商之中(在自利與互利的矛盾中達到雙贏). 所以, 最好的長期策略(得分最多)是什麼?

社會科學家Robert Axelrod要學生設計電腦遊戲程式, 來找出最優解.

學生提出了數十種程式對策, 大體上可分為兩組: 善意組(信任優先)與惡意組(背叛優先). 細節上不一樣, 極端的如完全寬恕(被背叛後也總是信任)與絕不寬恕(背叛一次就永遠不信任).

乍看之下, 似乎選擇背叛同伴是最有利的: 總是得分, 永遠不會失分.

但是這數十種對策經過數百次的電腦運算對陣, 產生了積分的排名, 善意組囊括了前十名.

第一名的善意策略也是最簡單的: 信任優先, 但如果對方背叛, 下一次就也不信任, 直到對方改變.(以其人之道還治其人之身).

名列前茅的策略有三項共同特性:

1. 善意(信任優先)

2. 立即報復(不當爛好人)

3. 寬恕(對方改變, 我也改變)

由於現實中可能會有一些突變狀況 (溝通出差錯而造成的假性背叛), 有人提出較寬容的策略: 對方背叛兩次之後, 我方才背叛. 但這個策略積分不高.

社會科學家計算之後提出最優解: 信任優先, 立即報復與寬恕, 但每十次報復只執行九次, 一次忽略(主動寬恕).

這個解法揭露了人性的黑暗與希望...

(https://www.youtube.com/watch?v=mScpHTIi-kM&t=380s)


沒有留言:

張貼留言