Total Pageviews

2021/06/12

[閱讀筆記] Algorithms to Live By - 賽局理論 (Game Theory)

 賽局理論 (Game Theory) — 別人是怎麼想的?

  1. 學校裡把文學情節分成幾類:人對自然、人對自己、人對人、人對社會。前面幾個章節聚焦於人對自然、人對自己;本章節將轉為探討人對人、人對社會,也就是對 20 世紀產生重大影響的賽局理論。近數十年來,賽局理論和電腦科學交互激發,產生演算法賽局理論這個領域,已開始影響 21 世紀。

演算法

(人對自然、人對自己)

思維與所面臨的困境

最佳停止法

我們無法回到過去,改變先前的決定。

開發與善用的兩難

我們的時間有限。

鬆弛與隨機性

在處理行程規劃和注射疫苗等挑戰,最能發揮效用。


  1. 20 世紀最具影響力的經濟學家 John Maynard Keynes 說過:「成功的投資是預料別人預期什麼 (anticipating the anticipations of others)。」換句話說,這支股票的價值不在於我們認為它值多少,而是我們認為別人認為它值多少。例如,賣家以 80 元賣給認為能 90 元賣出的買家。

  2. 遞迴 (recursion) 例子:在《007 首部曲:皇家夜總會》中,James Bond 說過:「玩撲克牌時,你玩的不是自己手上那副牌,而是你的對手。」你玩的是無止盡的遞迴,你拿到的牌 🠊 你認為對手拿到的牌 🠊 你認為對手認為你拿到的牌 🠊 你認為對手認為你認為他拿到的牌  🠊  ... 。

  3. 均衡 (equilibrium) 是一套可供雙方遵循,並讓雙方知道對方行動後,也不想改變自身行動的策略。此狀態稱為均衡,是因為其很穩定,也就是雙方即使再在怎麼考慮,都不會改變自身選擇,我滿意我的策略,你也滿意你的策略。舉例來說,在剪刀石頭布中,均衡是指完全隨機從這三種手勢出一種,出每種手勢的機率是 13。使這個均衡穩定的因素是,雙方都採取這種 13- 13 - 13 的策略,對雙方而言,除了堅持隨機,別無他法 (若 A君 一直出石頭,另一方 B 君就會注意到開始出布,A 方就開始出剪刀,最終雙方又回到13- 13 - 13 的策略)。

  4. 賽局理論廣泛影響經濟學和社會科學領域,然而除非賽局參與者找得到奈許均衡,它的預測能力才會造成影響,但是電腦科學家已經證明,純粹尋找奈許均衡是難解問題

  5. 囚徒困境 (prisoner’s dilemma):是指雙方都採取了背離其共同利益的行動。(Ref: https://reurl.cc/a5eV94, https://reurl.cc/Q7YX20 )

囚徒困境 (prisoner’s dilemma) 問題描述

最後勝出的策略

  • 這個策略是由數學心理學家Anatol Rapoport所提出的,幾乎是所有策略中最簡單的:

    • ① 一開始的時候總是選擇合作;

    • ② 之後選擇你的對手上一回的策略:如果你的對手上一回背叛,就也選擇背叛;如果對手上一回合作,就也選擇合作。

  • 一開始總是友善 (be nice) 待人,之後如果別人上一盤是友善的,我就友善待他;如果別人上一盤選擇背叛,我就「以眼還眼」。這個策略的驚人之處在於:是所有策略中最簡單的,幾乎沒有任何的心機與計算,卻竟然是所有策略中最有效的。另外,最後的結果可以把所有的策略分成兩群:高分群跟低分群,而高分群的程式竟然只跟一個特性有關:友善的態度,亦即,永遠不先選擇背叛別人

囚犯困境應用於人生智慧

  1. 總是對其他人釋出善意作為開端:「名聲」是很重要的,因為別人都會記得你曾經做過的選擇。

  2. 適當的「以眼還眼」是必要的:當對手之前選擇背叛時,用「背叛」來處罰對手。

  3. 具有高度的可預測性 (predictable),反而更能讓別人願意跟你合作,在長時間獲得最佳的利益

  4. 在巨大的利益面前,很可能重複的囚犯困境變成「只玩一場」的囚犯困境,這時人跟人之間的信任變得不值一提:這時請千萬小心提防,採取必要的措施,因為很可能那些最信任的人,看起來最不可能背叛的人,都會屈服在這只需要玩一次的遊戲中。


  1. 自主行為代價 (price of anarchy) 用來衡量合作與競爭兩者間的差距,合作是指集中設計或協調的解決方案,競爭是指所有參與者各自試圖取得對自己最有利的結果。自主行為代價很低,代表這個系統無論是否有被細心管理,運作狀況與放任不管差不多;自主行為代價很高,代表如果有細心管理,狀況就能好轉,若沒有介入,就可能引起災難。囚徒困境顯然就是後者,可惜的是,世界上所有賽局都是如此。

  2. 公有地悲劇 (tragedy of the commons)

問題描述

當有一個公共資源是由每個市民共享時,每個人都可以直接從中獲得好處,也會因此嚐到資源濫用的後果。由於資源與資源使用者之間擁有非常微弱的 feedback loop,當資源被濫用、消耗殆盡後,每個市民都沒得用

🐄 以公有地放牧為例

想像農莊有一塊公有地,每個人都可以放牲口吃草,但容量有限。理論上,所有人只能放一定數量的牲口,讓每個人的牲口都有草可吃;但實際上,多放一點牲口對自己有利,影響則似乎很小,不會有立即嚴重後果。最後導致草地完全被破壞,大家的牲口都沒草可吃

🌳 以加州紅木為例

加州紅木是地球上極為古老與雄偉的生物,不過從賽局理論來看,是一種悲劇。紅木長這麼高的理由,在於其試圖長得比其他紅木高,最後過度伸展的害處大於超過被其他紅木遮蔽的害處

若森林同意以某種方式休戰,生態系統就不用像軍備競賽,不必較量誰較高,彼此都能充分進行光合作用。但此狀況必須借助賽局以外的權威,從上到下改變報酬,才能獲得良好結果。不過,在大自然難以做到這點。

以員工都不休假為例

所有員工都希望多休假,但也希望比別人少休一點,以便獲得忠誠、認真、負責的評價,獲得更多升遷機會。每個人都以別人為基準,然後比這個基準少休一點,這個賽局的奈許均衡是 0,這是少者獲勝的比賽

Evernote 曾提供 $1000 美元讓員工休假,而成為新聞。以賽局理論來看,是錯誤的方式,$1000 美元讓目標變得誘人,但無法改變賽局規則 (少者獲勝的比賽),獲得加薪或升遷的吸引力 > $1000 美元

企業可透過機制設計 (mechanism design) 來改變賽局規則,例如,訂定最低強制休假日數,不需花一毛錢,就可以改變賽局規則

以華爾街股市交易時間為例

華爾街的機制設計 (mechanism design)  就是指交易時間,即使是在華爾街鐵石心腸、手段殘酷、以毫秒之差執行交易的資本家,每天下午四點也會停火,讓股票經紀人可以休息,不會被追逐不睡覺均衡的競爭者突襲。

♰ 以記得安息日為例

美國是少數沒有規定最低休假日數 (paid vacation) 的已開發國家,但在麻州、緬因州和羅德島等地,有明令禁止在感恩節營業。

「記得安息日」這類宗教規定,明快地解決店東的問題。在禁止殺人、通姦和竊盜等其他反社會行為的命令,加入神的力量,同樣可解決生活在社會群體中的某些賽局問題。神在這方面的力量比政府大得多,天父的力量永遠大過教父

避免公共資源被濫用的三個方法

  1. 教育與告誡 (educate and exhort):讓資源使用者理解,資源濫用的後果。

  2. 將公共資源私有化 (privatize the commons):當資源私有化後,個人的濫用只會影響到自己,不會影響他人。『資源私有化』的效果會比『教育與訓誡』來得好,但是不是每種資源都可以私有化,例如臭氧層、魚群等,都是無法私有化的資源。

  3. 規範公共資源的使用方式 (regulate the commons):即「機制設計」,例如道路資源是大家共用的,透過紅綠燈來決定誰先行;又如廣播或是電信信號,需要向政府申請核可才可以使用,若沒有加以規範就會出現互相蓋台的情形。


  1. Mark Twain 曾說:「只要你發現自己站在多數人這一邊,就該仔細思考一下。」從其他人身上學習不一定特別理性,風潮和時尚是仿效其他人的行為,不是基於世界的客觀事實基礎的結果。更糟的是,假設其他人的行為是有用的指引,可能會導致一窩蜂,導致經濟災難。例如,如果大家都在投資房地產,買間房子似乎是不錯的選擇,畢竟房價一定會漲,對吧?

  2. 資訊瀑布 (information cascade) 效應:當每個人低估自己所掌握的個人資訊,而決定去跟隨其他人的時候,就會形成一個不斷壯大的羊群,這些學者用 information cascade 效應來描述這個群聚的過程所帶來的長遠影響。簡單來說,當做某件事/決定的人數超過一定人數之後,人們往往就會停止依賴自己的知識,轉而模仿其他人的行為,於是群體就會做出錯誤的決策。。如 David Hirschfelder 所說:「只要有人無視於自己手中的資訊,決定盲從跟隨前人,就會造成一個結果,他的行動對後來的決策者不具參考價值。」

  3. information cascade 可解釋股市的暴漲與暴跌,並產生以下結論

information cascade 結論

說明

留意公開訊息多於私人訊息

  • 我們只知道對方在做什麼 (what),但不清楚為什麼 (why);

  • 我們似乎比較在意所做的決策是否符合共識,而非符合事實

  • 我們在看別人怎麼做的時候,別人或許也在看我們。

人未必依據自身理性想法做決策,而是盲從追隨前人

  • 否決自己的懷疑時必須格外謹慎,即使真的這麼做了,應該在採取行動時設法表達出我們內心的猶豫。

賽局規則有時候會糟到無藥可救

  • 一旦深陷賽局,或許我們無法改變什麼,但 information cascade 理論或許可以避免讓你陷入這類賽局


  1. 群眾優勢能讓大量的 information cascade 看似可靠,但實際上通常只是外行引導外行的盲目跟風。想想美國投機性的房地產泡沫化現象,許多經濟學家認為這是引發 2008 年全球金融危機的元凶。從 1997 ~ 2006 年,美國整體房價實際漲幅高達 85%。同一時期,專門借貸給信用不佳購屋者的次級房貸,市占率從 5% 成長至 20%。當時不少人認為買房是一種安全的長期投資,一窩蜂地看好房價會持續上漲,有房就不怕沒飯吃,甚至能更上一層樓。(Ref: https://reurl.cc/o9YRV5 )

  2. 美國 911 恐攻事件翌年,許多美國人出門選擇開車,不敢搭飛機, 以為這樣更安全 。結果顯示,當年有 1600 人死於交通事故,是那次飛機劫持死亡人數的六倍。威斯康辛大學心理學者 Corrine Enrigh 認為,光是收看 911 事件週年紀念的新聞報導,就足以讓人覺得發生第二次恐怖攻擊的可能性大增。恐懼和憤怒總能凌駕理性,平面媒體經常刊登各種激動、情緒化的臉孔,滋養著我們最古老的本能。正如作家 Nassim Nicholas Taleb 的觀察:「我們的理性不足,無法應付媒體的接觸。」(Ref: https://reurl.cc/o9YRV5 )

  3. 拍賣機制 (Ref: https://reurl.cc/L0n2VK, https://reurl.cc/e9kQ8j )

拍賣機制

說明

最高價得標拍賣法

(First-price Sealed-bid Auction)


  • 參與者將投標金額密封,投標者只能出價一次,開標時由最高價者得標並依價付款,這種方式廣泛應用於土地、公共工程的競標上。

  • 此法會遇到遞迴問題,我們為了不要付出過多標金,會猜測對方會出多少;對方也會猜測你的出價,並隱藏自己的出價。【過度思考】

荷蘭式拍賣

(Dutch Auction)

🐟

  • 又稱遞減式拍賣 (descending auction),賣方由高往低喊價,過程中如有人願意購買,此價即為成交價。這種拍賣方式是起源於荷蘭的鬱金香拍賣而得名,台灣蔬果、魚肉批發市場也是採用這種拍賣方式,通常適用於有一定數量的商品拍賣。

  • 你可能會採用複雜的策略來隱藏你的估價 (ex. 25 美元)。你會一到 25 美元就買?還是按兵不動、等待更低的價格?要省錢,就要承擔失去機會的風險。【過度思考】

英式拍賣

(English Auction)


  • 又稱遞增式拍賣 (ascending auction),是最常見的拍賣方式,競標者出價由下往上喊,喊價最高者得標,競標者可多次重複提高出價,常見於蘇富比藝術品拍賣會,台灣的夜市競拍等場所。

  • 可能受  information cascade 的影響,不斷墊高價格,超乎當初設定的標價。【過度花費】【information cascade 】

  • 在電信頻譜執照標售的過程中,由於各家電信廠商認為贏者通吃,因此對於頻譜志在必得,往往在競標過程中出價的價格高於頻譜的隱含價值,最後得標者雖然贏得標案,卻形成「贏家的詛咒」(winner’s curse) 也就是贏家反而吃虧的情形;甚至可能造成電信廠商虧損,或是將高額競標成本轉嫁給消費者,讓通訊成本大幅上揚,這些情況都不是政府所樂見的事情。

維克里拍賣

(Vickrey Auction)

  • 即次價密封投標拍賣(Second-price sealed-bid auction)。投標者在不知道其他人標價的情況下遞出標單,標價最高的人得標,但只需付次高的標價。這類拍賣在策略上類似英式拍賣,且會讓投標者有以實際價值出價的動機

  • 此法鼓勵參與者「誠實」,依據標的物在心中的「真實價值」下標,而不會故意惡作劇而亂出價。也就是你認為這個標的你認為這個標的值多少就下多少,就是最好的策略。

  • 比如某人想賣房子,七、八個人都想買,他怎樣才能把房子賣出最高價?價高者得的方法,會讓買家故意不喊高價。這時房主不妨試試「維克瑞拍賣」:還是最高出價者得房,但是,得房者以次高價格付款。在這種拍賣制度下,報低價不但不能贏得拍賣,還將使出高價者以出低價者報出的價格獲得商品,所以,買房的人有更大的動機報出高價,搶購房子

小結

  • 拍賣,就是在供小於求、一物難求、賣方主動的情況下,通過消費者競標的方式,獲得最高成交價的一種策略,比如荷蘭式拍賣、維克瑞拍賣等。

  • 逆向拍賣,就是在供大於求、庫存壓力大、買方主動的情況下,通過商家競標的方式,盡量用低價滿足價格敏感者,實現消化庫存的目的——典型的案例有Priceline、ScoreBig、Greentoe等。


  1. 揭示原理 (Revelation principle):通過機制設計,在激勵相容的約束條件下,使拍賣參與人主動披露自己的資訊,以達到消除資訊不對稱的效果。維克里拍賣 (Vickrey Auction) 即是實現這樣原理的機制設計,投標者在不知道其他人標價的情況下遞出標單,標價最高的人得標,但只需付次高的標價。在這種拍賣制度下,報低價攪局者不但不能贏得拍賣,還將使出高價者以出低價者報出的價格得標,迫使出價者誠實出價

  2. 如果改變策略沒有幫助,可以嘗試改變賽局。如果無法改變賽局,至少你多少可以控制要加入那些賽局。通往地獄的路是由遞迴、惡性均衡及 information cascade 所組成。尋找由誠實所主導的賽局,接著好好做自己就好。


No comments: