思辨賽局：看穿局勢、創造優勢的策略智慧心得

動機

好看!! 讓我之後想去看Algorithmic Game Theory

ch1: 各種小故事

猜數字: 考慮到其他參賽者的策略與目標，與他們的策略如何影響你的策略

給5次機會猜，每猜錯一次就扣獎金

一般猜數字就是用binary search，但是對手一定想的到所以會想要用一個可以誤導binary search的數字

49? 但對手想到你會想到你會反制binary search，所以又再往前一步 48?

想到你的想到回去選49?或47?

以退為進: 預測所有對手的行動

一個耐力比賽，三個人撐到最後的贏，由最贏的選一個被淘汰的

最弱的人知道其他兩人一定會選自己到下一場比賽，所以最弱的就自己輸，下去休息

妙手: 個人利益換群體利益與混合策略

如果對方認定真的有妙手存在，對方勢必要多派人防守，進而使其他人的得分上升

如果左手是妙手，反而要使用右手進攻，後面會提到混合策略讓總得分上升

但混合策略需要真的混合，也就是不可預測，讓對手不知道怎麼應對不會說每次都勝利，但只要是反覆進行賽局下，這樣可以讓總收益上升

要不要做老二: 為了保持領先而模仿

模仿分兩種

不論對方策略好不好都模仿
等一段時間，確認成功與否才模仿

一般商業都是等一段時間再模仿，因為商場很少贏家通吃的事發生，所以等越久越有利

永不妥協: 讓承諾看起來像真的

永不妥協不好實行

會連累到其他談判 (影響他人)
自己要有辦法演到像真的 (自己會不會動搖)

減肥: 與未來的自己的賽局

現在想做不代表未來也會繼續或是想做

所以要提供激勵改變未來的選擇，或是說項未來的自己能做的是變少

只有個人捐款的法案: 囚徒困境

現在有個法案是只容許個人捐錢給政黨(上限5000美)，其他方式都禁止

這時只要說，如果法案沒過，就給投最多同意票的黨10億美 這樣法雸會過，同時也不用付錢(法案過了)

想要贏大的: 虛張聲勢

如果只在牌好時加碼，這樣其他人就不會跟所以需要其他人認為自己在虛張聲勢，引導其他人加碼

但有時虛張聲勢可以騙其他人放棄，使爛牌有的贏

人的心理與情緒: 理論對於有經驗的比較準

賽局理論對於會玩得很準，但是如果對方亂玩，就會有非預期的結果所以要把心理與非理性納入考量

參於賽局時需要理解對方的想法、他們知道什麼；是什麼驅動他們、他們怎麼看你己所欲、亦勿施於人

一場賽局都是更大賽局的一部份

ch2: 循序賽局，逆推求解

賽局根據，出招的時間序分成下面3種

循序賽局: 一次一個人出招
- 拔旗子遊戲
同步賽局: 同時出招
- 囚徒困境
循序 & 同步
- 足球比賽

向前預測，向後推理: 樹的每一層都是自己與對手的回合，從中有許多動作，之後到leaf會有自己與對手的收益

如果說每個leaf的雙方收益總和都一樣，就是零和賽局
可以調整tree上的東西讓能到的leaf不同
- branch
  - 讓對方不做某種動作
  - 自己不做某種動作
- leaf
  - 讓收益的計算方式改變

像下面這棵樹是說服charlie投資與fredo會不會捲款的tree

如果fredo像讓charlie投資，要承諾charlie他不會捲款

下面是總統與國會各自偏好的法案，所產生的利益

國會送法案到總統那邊簽，之後有以下賽局樹

如果總統有否決權(veto)

剛剛總統與國會的例子，讓我們看到

單人決策中，有更多選項不是壞事
在賽局中有更多選項，反而傷害了兩者的利益!!

下面是一個搶旗遊戲，雙方輪流拿1,2,3個旗子，直到某一隊拿完全的旗子就獲勝書上沒有論證的過程所以這邊給一個

我們想要到我們這邊時就是小於等於3個旗子，所以思考有什麼情況是一定會讓對手不管怎麼選都是只剩小於等於3個旗子?

答案就是4個旗子

但不能在這邊停下來，再往下想如何留給對手4個旗子? 要留給對手多少旗子才能保證我們可以留給對手4個旗子?

其實就是8個

所以就是控制留給對手4的倍數的旗子

為何搶旗遊戲逆推可解? 因為搶旗遊戲的所有東西都是可確定的，也就是

雙方目標、目的
雙方手段、行動

都是確定的 (沒有心理或是利他因素的參與)

人不是總是逆推求解最終通牒賽局: A提議分$，B選要不要接受，如果B不同意就兩人都沒$ 一般來說不論分多少，只要有B都應該接受，但實際情況是A分的比例通常不會低於10%

可能有3個原因

A不懂逆推求解
A的其他考量 (利他心理)
B不同意提案

書上是說第一個不太可能成立，因為這很好想，所以問題一定是2或3其中一個理由或是兩個都有

所以有了獨裁者賽局: 直接分不管對方同意於否這時應該是獨裁者全拿吧? 但實驗結果還是雙方都有$，但比起最終通牒賽局的$還要少10%

對此有人猜是利他、公平、羞恥。其中比較有趣的是羞恥，有個版本的賽局是可以給1塊$讓對方不知道獨裁者獨吞了所有$ 而大多數獨裁者都同意這個提案

文化也會影響，在鼓勵分享的文化中，分$的額度會超過50%

超級複雜的tree 像棋局，想用tree去求解十分難，所以

需要設計好評斷當前局面的方式 (計算價值)
預測一部份，不用一次預測到底 (在棋子不多時專業選手就能預測這局的勝負)

你應該在最大推理範圍中，把向前預測、像後推理的規則與引導你判斷中盤局面價值的經驗結合起來

成功逆推的關鍵預測對方會做什麼行動，而非你站在他們立場會採取什麼行動當你嘗試站在對方角度看問題，你必須知道他們知道的，不知道他們不知道的訊息

如果雙方都分析出所有雙方的行動與反行動，這樣雙方對賽局將會如何會有一致的看法(均衡)

越早冒險越好如果是第一次冒險失敗還有機會思考其他策略，這個越早冒險越好的策略也適用於其他生活方面

ch3: 囚犯困境 & 合作

現在是同步賽局，可以把行動組合成一張表右上是上面的收益，左下是右邊的收益

從RE的角度去看

80的話
- 第一格是平手
- 第二格是輸
70的話
- 第一格是贏
- 第二格是平手

所以如果是RE，不論對手怎麼做，RE都應該設定成70 這就是RE的優勢策略(有優勢策略選他就對了)

但這裡帶出一個特別的賽局，囚徒困境雙方都選優勢策略(個人利益最大化)，但最後的總收益反而變少這打臉傳統經濟學的追逐個人利益可以帶來集體的最佳結果

對此需要一個方式讓大家做某個行為

獎勵
- 增加效益
- 獎勵的形式
  - 實質利益
  - 承諾
    - 有對方食言的風險
- 獎勵的來源
  - 內部: 提供對手一定的好處
  - 外部: 由受益的人給雙方獎勵
- 不能在完成動作之前就給獎勵!!
懲罰
- 可能立刻見效
- 增加代價
  - 選擇欺騙可能拿到短期好處
  - 但產生長期的代價

以牙還牙: 一開始合作，之後看對手怎麼做，之後就怎麼做

具有
- 清晰
  - 對手不用特別思考你行動的目的
- 善意
  - 不會主動引發欺騙
- 寬容
  - 不會一直懷恨在心，願意回復合作
- 報復
  - 永遠不會讓騙子逍遙法外
在賽局中有相對出色的成績，但不能正面擊敗對手
優點
- 總是讓比賽結果相近 (鼓勵合作)
缺點
- 不能被誤解或是出錯，讓對手錯認我們的行動
  - 不小心選錯就被當成背叛
- 少一個宣布【到此為止】的方法
  - 容易被激發，但不容易被原諒 (雙方都用以牙還牙)

所以怎麼達成合作成功的懲罰

覺察欺騙
- 才能快速啟動懲罰行動
  - 提高欺騙成本
  - 減少欺騙好處
- 如果賽局不只一人同時行動
  - 要確認是否存在欺騙
  - 找出欺騙者是誰
  - 不然，會變成無盡的割喉戰
清晰性
- 可接受行為的界線
- 欺騙的後果
- 如果上面兩個定義不清
  - 容易失誤、被誤會成欺騙
  - 無法清楚的權衡
懲罰的類型
- 只有一次的賽局
  - 導致其他方面的損失 ()
- 重複賽局
  - 導致後面賽局的損失
- 能否阻止欺騙者取決於
  - 欺騙的收益
  - 未來對於現在的重要性
確定性
- 所有人都要相信
  - 背叛會懲罰
  - 合作會獎賞
- 明確告知規則 (不一定是書面，可以是不成文規定)
規模
- 如果懲罰的規模夠大 (像核彈)
  - 不用執行就有嚇阻效果
    - 如何處理失誤
      - 需要某種程度的放寬
- 規模要大到可以嚇阻大部分的欺騙，但某種程度的放寬
重複性
- 未來的價值 (像利率)
- 彼此關係延續的可能性
  - 如果是one-shot的商品，就很有可能選擇削價競爭
  - 會不會在其他方面受到背叛
- 經濟規模隨時間的預期變化
  - 預期變好或市場平穩就不會選現在背叛
  - 預期變壞或波動期時就會選現在背叛
  - 變化的種類
    - 穩定的增加、衰退
    - 波動
- 賽局成員的結構
  - 結構穩定與預期會保持就不會選現在背叛
  - 有無關或新的人就會選現在背叛
accessibility
- 當規則確定後
  - 所有都可以輕鬆地知道或是get需要的訊息
- 雖然說每個人都有欺騙的動機
  - 只要讓每個人認為設計好的規則共同的優先利益
    - 如此每個人
      - 利用自己的知識找出規則漏洞
      - 增加集體採用聯合制裁的可信度

康德的定然律令

只做那些會成為普遍法則的事
有人認為自己做的決定的思考與對方一樣
- 所以選合作，認為對方也會選合作
實際上，如果對方不知道對手選合作，人們選合作的比率比較高
- 知道對方選合作，另一方選合作的比率反而比較低

企業聯盟

合謀
- 定期聚會
  - 協商界線
  - 及時懲罰與辨認失誤
- 溝通
  - 需要一種不能被發現的協議
    - 如果想要這地區的競標，就出該地區電話號碼末3碼的數字
    - 依據地域劃分市場
- 尋找背叛
  - 決一死戰條款
    - 保證最低價、買貴退差價
    - 顧客對低價敏感，作為背叛偵察機
    - 一旦有人背叛，自動降價
      - 使對方沒有因為降價而產生的好處
  - 最惠顧客條款
    - 對所有顧客提供特定客戶的最惠價格
      - 這意味廠商不能公然競爭，不能提供其他價格給對手的顧客
        保證合作
  - 一擊必殺條款
    - 決一死戰條款的延伸
    - 利用納許均衡求平衡點，之後只要發現背叛就直接降到這個點

ch4: 納許均衡

如果要打大獵物需要兩個人一起，但有兩種獵物，同時分別在不同方位再來，兩人的家也在不同方位，如果沒有想獵大獵物可以獵兔子

這裡沒有最佳策略，因為打大獵物的總收益居然一樣!!

回憶之前的囚徒困境，我們是有最佳策略的

所以要知道對方想什麼才能得出最佳策略，但對方也是這麼想所以就陷入【我認為…他認為…】的循環

納許均衡

先看對於每個RE的策略，RR應該怎麼回應 選所有收益中最大的

下面用粗體標出最佳收益

注意到40000是兩個的最佳收益，所以可以預期在沒有其他介入的情況下，兩者應該都會選40000

這就是納許均衡，每個人都相信對方會以我們認為的最佳行動做事，而他們也這麼認為我們也會依據他們認為的最佳行動做事 (也就是同一個格子中都是雙方的最佳回應)

納許均衡只會有一種嗎? 不會，像第一個就有三個納許均衡

納許均衡是最好的解嗎? 不一定，看看囚徒困境

納許均衡一定存在嗎? 如果容許混和策略，納許均衡一定存在

求解納許均衡

先踢掉對方絕對不會選的選項 (BB絕對不會選42或38)
1. 對BB而言，42的所有收益都比41爛，所以絕對不會選42
  - all(a > b)
2. 對BB而言，42中沒有任何優勢選項，所以絕對不會選42
  - not any(exist(best))

任何一個劣勢策略或絕非最佳回應策略，絕對不會成為最佳回應，所以可以踢掉

清完表格後，找同一格中互為最佳回應的格子，那就是納許均衡

焦點

所以還有辦法處理第一個賽局嗎? 我們需要一個我們與對方覺得很清楚的想法或是概念，讓選擇更集中形成焦點

像是書上提到要兩組在不知道對方長什麼樣子，也沒有特別識別的手段下與另一組相會所以雙方都要考慮到什麼對對方都是明顯的地點(帝國大廈、中午、手勢)

所以焦點出自很多地方，歷史、文化、地理… 焦點可能是一時興起的事物!! 所以可能有爆紅之類的現象，或是選美小姐第一的人不一定臉蛋是最好的

換言之，焦點就是共識談判就是在尋找雙方不會退讓的焦點

性別戰與膽小鬼遊戲

剛剛的所有賽局都是所有人對任何一個納許均衡解都沒差，因為收益都一樣但如果現在不一樣且還有利益衝突?

像下面的賽局是有各自的偏好，所以有兩個納許均衡

所以雙方需要溝通，但

要怎麼讓對方知道，對方也確定知道，同時正確的理解
要怎麼讓自己的堅持可信

對於膽小鬼遊戲與性別戰的雙方來說，大家都想要納許均衡解但膽小鬼遊戲不同於性別戰在於兩個人要做出相對的選擇才會有納許均衡解下面是把獵場分成南北，北邊小但獵物多，但如果兩人都去北邊就會打架，最後什麼都沒有

這種問題的解法與性別戰一樣需要溝通

前往連續

之前只有兩個行動，到剛剛行動多一點(38~42)，但如果是連續的整數呢?

找交點

理論的極限

當交易人數不多，且都無法得知其他交易者的成本或價值時，就會很快達到納許均衡

賽局中的參與者有不同的偏好或評價，其不同於經濟學所假設的純粹自利行為

但，一旦把現實中的【社會的】或【利他的】傾向考慮進去，均衡的概念，在逐步行動賽局中是向後推理，在同步行動賽局中是納許均衡，就能充份解釋觀察的結果

當賽局不只一種納許均衡，所有人就會遇到額外的問題，需要找出一個焦點能否成功取決於，背景、環境因素；如果有共識就會有好選擇，沒有，不均衡就會持續下去

新手行為通常與納許均衡不一致，但經驗累積後，行為通常就能收斂在均衡點有處理這種不確定性，並讓參加者對其回應的均衡，quantal response equilibrium

ch5: 混和策略

從足球罰球開始，這沒有納許均衡 (如果對手知道要踢右，就會往右跳，知道對手要守左，就會踢右)

這裡於之前看到的【我認為…他認為…】的循環一樣，但是在此

如果我們的推論是依據任何模式或是規律，就會被對手利用變成他自己的有利條件記住，時時刻刻都要思考【他們知道什麼我不知道的事嗎】

在此單靠唯一一種策略(單純策略)，是不行的，最好的就是踢右邊 (70%) 所以為了達成納許均衡，我們需要加入隨機性，也就是混和策略

像是50對50去分左右腳，所以

守右邊: 0.5*95+0.5*70 = 82.5%
守左邊: 0.5*58+0.5*93 = 75.5%

這兩種都比只踢右邊高，而對手一定選最小的，所以會去守左邊但又不能只守左邊，所以對手也必須用混和策略!! (達成納許均衡)

你應該選擇自己的最佳混和策略的理由是，逼迫對手也使用他的最佳混和策略

之後呢，雙方會找到均衡點，此時最大報酬的最小值會等於最小報酬的最大值 (minimax定理) 也就是一個人的得等於另一個人的失，所以只要求一邊就好

那什麼時候該使用混和策略? 如果對手在行動前知道我們怎麼做回應會對我們有害的話

那最佳混和策略在哪? 用40對60去分左右腳，所以

守右邊: 0.4*95+0.6*70 = 79%
守左邊: 0.4*58+0.6*93 = 80%

等等，守左右邊的數字好像靠近了!! 這就是最佳混和策略的目的，只要找到一組比例，讓所有對手策略的收益都一樣，就是最佳混和策略

守右邊: 0.383*95+0.673*70 = 79.6%
守左邊: 0.383*58+0.673*93 = 79.6%

在完全衝突(零和賽局)下，如果讓你的對手事先知道你的真實選擇對你不利，那妳可以利用隨機選擇自己的單純策略而獲利 你的混和策略比例應該是: 不管對手採取任何單純策略，你拿到的平均報酬都相同

怎麼真的隨機? 人會陷入多次反推的陷阱(出這麼多次正面，下次總該是反面了吧) 所以需要一個客觀、獨立、祕密的機制，像是當下手表的秒針在哪

混和動機賽局的混和策略

如果我們把混和策略用在之前有多個納許均衡的賽局會發生什麼事下面是之前狩獵的賽局

找慣例先從左邊開始看設我們認為對手選stag的機率是x，之後我們讓兩個行動的收益一樣 4x+0(1-x) = 3(1-x)+0x

所以對手選stag的機率是x是3/7 這時

不論我們的策略怎麼混和，最後的報酬都一樣
- 前提是對手選stag的機率是x是3/7
因為這個賽局是對稱的，所以對手會算出我們選stag的機率是x是4/7
最後的效果反而不好
- 我們選stag但對手選bison: 3/7 * 3/7；我們選bison但對手選stag: 4/7 * 4/7
  - 總和是(9+16)/49，超過一半是雙方都沒有報酬!!
- 平均報酬是4*(3/7) = 1.71，比原本的納許均衡爛!!
同時這種混和策略不穩定，只要差一點就會變成偏向其中一方，這樣混和策略就瓦解了

對此只能讓雙方協調出其他混和策略，像各一半(假設一天下雨機率是50%，就看有沒有下雨) 這樣，0.5*3+0.5*4 = 3.5

我們認為的機率因為這些算的是我們認為的機率，所以只要我們的報酬有變，就會影響到對方選擇的機率像報酬從3,4變成6,7 這樣x就變成7/13

實際賽場中的混和策略混和策略會讓我們有機率用到冒險的策略，但重點不是冒險的策略會不會成功，重點是讓對手看不透我們的策略

基於這種看不透可以，用低管理成本完成管理

把懲罰調很重，之後就可以減少用於檢查的資源
- 在被檢查人眼中，因為被查到成本太高，所以不會傾向於做犯法的事
- 而要做反制，也是用混和策略 (飛彈中藏一些假飛彈)

但我們知道有的時候還是會出現不好的狀況，所以如果可以協調就能拿到更好的收益像從商家隨機發折價卷(可能兩家同時發)，變成輪流發

用代數解均衡點下面兩張圖剛好講到minimax

接著看一個有趣的case 如果守門員防右邊的效率上升，導致射門員右邊成功率下降成60% 這樣，守門員使用左邊的比率會上升，變成50%!!

why? 因為射門員觀察到右邊成功率下降，所以減少射到右邊，導致守門員使用左邊的比率會上升換言之，進步反而暴露你的弱點!! 從這個角度看，改善弱點的方法反而是不要一直用這個弱點技能

ch6: 策略行動，改造賽局樹

策略行動定義為能夠改變賽局，以確保參與者採去行動後能的到更好的結果

像是在膽小鬼賽局中，先對手把方向盤拆掉我們的選擇變少(少一個row)，但對手的最佳選擇只剩下認輸對手有更多自由，但是是失敗、成為懦夫的自由

承諾: unconditional的策略行動我就是做，不管你之後做什麼；但多了這一個動作，能改變原本的結果

像是賴床

多了設定鬧鐘後

如果把上面的tree畫成table

會發現設鬧鐘其實是劣勢策略(收穫都比不設低)

這是循序賽局，不是同步不用應對對手的所有策略
這是策略行動，重點是對手要做我們希望的動作

威脅與約定: conditional的策略行動如果對手做了(或沒做)我們希望(或不希望)的動作，我們就會做某件事(回應規則)，而這件事可能傷害到我們

約定特別一點，因為只要對方做了之後，對方就沒有利用價值了，所以約定傾向於食言

記得，回應規則是事先設定

所以這需要

搶先說
可信: 真的發生了一定要做

例子就是前面提到的競爭對抗條款(對方低價，我們就跟進)

嚇阻與強迫: 威脅與約定的再細分嚇阻: 阻止他人想做的事強迫: 讓他人做不想做的事

警告與保證: 威脅與約定的no-op版如果威脅與約定的回應規則，就是我們的最佳行動(或是說對我們有利的行動)，這種特例叫警告與保證具有公告的作用

像是只要對手不降價，我們就不降價

讓出先行權? 可以等其他對手把他們的行動或是策略行動做完再動作像是第一章的大公司會跟隨小公司的策略一樣，以維持均衡

威脅與約定的差異威脅是要對方不要做約定是我們會做

代價
- 威脅比較低，因為只要對方不做就不會讓我們做出需要代價的事
  - 公司威脅員工不努力就不會有分紅
- 約定就要做了(除了食言)
設定期限 (嚇阻與強迫)
- 嚇阻不用設定期限
  - 【什麼時候能吃?】【永遠都不能吃，不然會有很慘的事發生在你身上】
- 強迫就要定期限(要看到對方完成)
  - 對此產生【臘腸戰術】
    - 如果對方不太想實踐這個威脅，就可以一點一點地打破
      - 【下午一點打掃】【要讀書，明天再掃】(之後一直上演)
    - 所以通常強迫用獎勵會比較好
      - 做完就有點心吃
  - 讓懲罰隨時間增加，獎勵隨時間減少

威脅與約定要有清晰性與確定性才有可信度規定要清楚，不一定是有或沒有(一個門檻)可以像是隨績效變好獎金自然變多

巨大的威脅如果威脅太大就不用執行，但是如果遇到真的要執行的那一刻可能就很尷尬(像丟核彈) 這是因為我們不知道應該提出多大的威脅，對此人會盡可能壓低威脅的規模，讓真的做的時候的代價降低

因此應該從小威脅開始，一步一步慢慢上升，又名邊緣策略像是在在審問時，左輪只塞一顆子彈，之後只要每一次對方不吐實就扣一次板機，讓風險上升(與膽小鬼賽局很像)

ch7: 提升可信度

如果單憑言語就想影響其他參與者的信念與行為，那麼這些言語一定要有適當的策略行動支持

改變賽局報酬 (使破壞承諾的代價高於遵守承諾的代價) 2. 把威脅變警告、把約定變保證 2. 寫下合約來支持你的決定 3. 同意在違背承諾時接受懲罰 4. 要預防再談判(或是重寫合約) (負責執行承諾的人必須具備某種獨立的動機來完成自己的使命) 5. 想要減肥所以立約，只要有人抓到偷吃東西就可以拿到$ 6. 但如果立約人求情的話? 想用請客躲過這一次? 7. 可以依賴第三方 (像法院、信用機構) 8. 無法完全防止再談判 9. 如果雙方都想改的話 7. 適用於商業行為 8. 因為受害方一定會吵，因為重要的是貨物不是合約的補償 4. 建立與運用聲譽 5. 什麼時候用聲譽 6. 在同一時間與不同對手進行多個賽局 7. 在不同時間與同一個對手進行多次賽局 8. 建立方式 9. 有人知道(直接為人所知、透過傳言) (像公開聲明) 9. 實施強硬行動的證明 10. 經過測試
改變賽局，使你背棄承諾的能力受到限制 5. 切斷聯繫: 我無法干涉我之前做過的決定 6. 讓行動不可逆轉使其變成可信 (像遺言、遺囑) 7. 困難點 8. 如何確定對手會不會照遺言走? (我有可能沒辦法監督) 7. 破釜沉舟: 切斷自己的退路 8. 膽小鬼賽局的丟掉方向盤 9. 讓結果失控或聽天由命: 執行回應規則與判定違規的不是我 10. 奇愛博士的末世毀滅機 (但一次把世界毀了就太過了) 11. 改用邊緣策略!!
結合前面兩個 9. 分割大承諾，讓破壞小承諾的收益不足以抵銷違背其他承諾造成的損失 10. 小步前進: Divide And Conquer 11. 一次買100公斤的古柯鹼有做背叛的價值 12. 分成一次1公斤做100次
引入第三方 12. 透過團隊來建立可信度 13. 團隊的成員之間會互相監督 (互相牽制) 14. 戒酒團體 15. 連坐罰 16. 只懲罰犯錯的其他人可以忽略或是打掩護 17. 但連同忽略或是打掩護一起罰就不一樣了 14. 雇用代理人 15. 前面有提到執行回應的代理人 16. 同時還有負責談判的代理人 17. 像是與朋友或是有親密關係的談判，當事人去談就可能退讓 18. 或是設立規則給當時談判的人 19. 政府機關的標案的相關規則

降低對手的可信度

合約: 訂新合約
聲譽: 保密 3. 聲譽只對公開的場合有用，所以只要保密說這是兩人的事就好
破釜沉舟: 不要把敵人逼到絕境 5. 讓對手有安全退路的錯覺，避免殊死戰
溝通: 只要對方收不到威脅或是約定，任何策略行動都沒用 7. 小孩如果哭太大聲，就算父母說再哭就沒飯吃也沒用
小步前進: 臘腸戰術 9. 一小步一小步的違反對方的威脅
雇用代理人: 要求直接與當事人談判

保證書店回購二手書會降低學生購書成本? 出版商想從每一位學生上賺30元，但如果這本書會被二手書交易2次，這樣出版商要一次從第一個人身上賺90元同時，也會讓出版商盡快推出新版本或修訂版，削弱二手書於此，如果是最後才買到的人遇到新版本推出一定很嘔，所以當學生預期這時刻快到的時候可能乾脆不買書到此可以看到消滅二手書市場對學生與出版商都比較有利(除了書店)

另外，就算保證書店回購二手書，書店還是可以壓低價格

改成出版商承諾不會出修訂版，同時學生不賣二手是一種解法或是向出版社租教科書，同時付訂金保證出版社一定會把教科書拿回去，同時把二手書市場消滅 (承諾問題的解法，租賃代替銷售)

ch8: 訊號

大部分時間，人的利益與他所表達的話語是一致的

利益衝突越大，可信的資訊越少。對於這種對手的所有言論，唯一的理性回應是完全忽略對手的所有言論不要以為他是真的，也不要以為他不是真的

要思考賽局的均衡採取相應的行動

行動勝於語言

某些人知道的其他人多，同時這些資訊會對賽局產生影響，影響所有人的報酬

知道額外資訊的人試圖隱藏訊息有渴望真相的人具有較少資訊的人希望從知道的人套出實情

這時唯一可以信任的是行動再知道別人會以某種方式理解自己行為的情況下，每個人都應蓋針對對方的資訊內容，反過來操縱對方的行為

訊號傳遞: 選擇洩漏對自己有利資訊的行為 (只有他有這個訊息，做這件事對才是有利的) 訊號干擾: 採取行動以減少洩漏或避免不利資訊篩選: 設計一種環境，讓他發現再持有某種訊息下才去某種行動是最好的，而在另一種資訊下才去另一種行動是最好的或是同一行動因為具有不同資訊導致最後報酬不同

為了使行動成為有效的訊號，行動不能被其他騙子模仿如果真相與你想傳達的訊息不同，這樣就算他們模仿你的訊號也得不到好處

二手車如何傳遞我的車品質很好? 提供保固

假設保固一定有效，設定

好車的修理費: 500
壞車的修理費: 2000

而一般有保固價差在800

這時如果賣家知道自己的車很好可以提供保固，賣家可以多賺300；但壞車的賣家就不行

反過來，買家想要知道車子好不好可以提議，加800多給保固 (其實可以從600開始喊到2000為止)

在此保固可信的理由是好與壞的維修費之間的價差太大了!!

劣幣逐良幣設定一個二手車市場

壞車
- 賣家底價: 1000
- 可能出價: 1500
好車
- 賣家底價: 3000
- 可能出價: 4000

照效率市場來說，好壞車都能在1000~1500與3000~4000中出售但是只有賣家知道自己的車好與壞(資訊不對稱)，假設買家只知道好壞車各佔一半，所以

平均出價是0.5*(1500+4000) = 2750

這個價格比好車的賣家底價還低，這樣就變成劣幣逐良幣

而現實市場有其他手法對應這個問題

找懂得區別好壞車的人
確認賣家的賣車理由
- 家人變多要換大車
- 搬家

逆選擇與正選擇剛剛劣幣逐良幣是吸引賣家

這裡是吸引買家看保險業，通常風險程度越高的越會去保險，但如果只是提高價格，反而會嚇跑風險小的客戶，這是逆選擇

正選擇是透過規則選出希望服務的客戶像是信用卡餘額轉移服務，信用卡客戶分成

當期全繳
分期繳完
卡奴

第1,3種賺不到錢，第2種可以所以這個服務讓想要分期的人有更大的空間，自然就吸引第2種人了!!

消滅資訊不對稱的代價: 要花多少雇一個MBA 假設

MBA要花20萬(包含學費與上MBA沒拿到一般pay的機會成本)，之後花5年還完
一般pay是50000

這樣要花多少雇MBA? 20除以5是40000 所以公司每年至少要多給40000，書上再多給10000也就是雙倍一般pay 而這就是資訊不對稱的代價

假設能僥倖過MBA的機率是50% 這樣對於沒把握過MBA的人來說，MBA能帶給他的平均收入是25000，而只有這樣沒辦法在5年還完MBA的錢

但如果多給到80000呢? 80000乘一半是40000，這樣剛好可以還完MBA的錢!! 如此一來就不能嚇阻僥倖過MBA的人

其他消滅資訊不對稱的方法 (這裡是類似請領工傷補助的情境)

檢查、監督 (成本高)
申請人長時間填表申請
- 如果時薪高的就會自動退出
實物津貼
- 直接給需要的東西，像是不能走就直接給輪椅，不是給錢讓他去買

不傳送訊號也是一種訊號課的評分分成

合格與不合格
A+,A,A-,B+,….

如果學生知道自己能拿到A+差不多的分數，一定會選用第2種評分方式的課這樣一來，使用第1種方式的課只會剩下不太好的學生對此，如果其他人(面試官)來看會認為，他如果不選第1種評分方式的課就是表示他想隱藏他能力不好就算他有可能能力其實超好

記住，做任何事都會傳遞訊號，不做也是一種訊號

拒絕傳遞訊號主要理由是區隔，像是面試通常要穿西裝，但是如果只穿牛仔褲，不是對方不懂禮節，就是她其實不需要那些禮節

你能出多少錢? 差別訂價有人不在乎出多一點錢，有人在乎，要怎麼從他們手中賺最多的錢? 出不同版本，豪華版與閹割版

這裡來看一個航空公司(這裡叫PITS)定價的故事，reserved prices是使用者的出價

現在PITS要從使用者的出價中找出要給普通票與特級票多少錢基本上的目標是商業客都買特級票，一般客都買普通票 (需要資訊篩選，所以下面要透過價格來完成)

特級票先訂最高的300，普通票定140

從商業客的角度來看，他們願意花225買普通票，這樣還有剩下85(225-140)可以花這就是消費者剩餘，出價與定價的差

而300元除非能夠多提供達85元以上的價值的服務，不然商業客會選普通票所以特級票要反映這個消費者剩餘，最後定價是215(300-85)

這種壓低特級票價，讓商業客去選這個票的策略叫激勵相容約束(incentive compactibility constraint)

我航空公司，PITS，想從商業客賺多一點，要怎麼做? 去調商業客的消費者剩餘，像是從85變成60，所以這樣特級票價變成240 但是連帶普通票價就會變成165(225-60)

然而140是一般客的出價，165明顯高於這數字，我們這樣會失去一般客!! 這是一般客的底線，又叫參與約束(participant constraint)

最後PITS應該把價格訂成140, 215

如果商業客的比例(原本是30對70現在變成50對50)比較高，其實可以犧牲一般客!!

納入一般客: (140-100)*50+(215-150)*50 = 5250 我們不要一般客: (300-150)*50 = 7500

ch9: 選擇會外溢，所以需要合作(公共政策)取代均衡

相對的成功第一名的成本到底多高? 如果每個人都很努力就要花很大的力氣才能get第一名

所以只要大家都不讀書就好，因為排名是相對的，一定有第一名這點與企業聯盟一樣

這裡有一個有趣的例子，之前香菸還可以打廣告時，大家花大錢在行銷上之後政府禁止，反而讓公司利潤大幅改善第三者的集體協定讓企業聯盟反背叛運作良好

均衡不是最優 BART(捷運)不論多少人都是走40分鐘橋一般是走20分鐘，但每多1000人就多10分鐘

均衡是橋配4000人，剩下都BART，這樣所有人都是走40分鐘但這樣是最好的嗎? 如果把橋配2000人，這樣可以省下，10分鐘*2000人 = 20000分鐘因為每多1人就是造成別人不便，但是多的人不用付出代價，受傷的是在之前在橋上的人

那怎麼維持這個模式?

發2000份通行證
定價
- 設定，1小時值12元，所以10分鐘值2元
- 捷運票價是10元
  - 橋的過路費設成12元

標上價格才能透過他達成新的均衡，才能用看不見的手

該超速嗎?

如果其他人都超速，妳為了安全必須超速
跟在別人後面比較不會被罰

與前面的BART例子比，這裡不會收斂在均衡點，反倒是會往兩邊(極端走) 因為走橋會讓橋的吸引力下降，但超速或是守法，只要人越多越有吸引力

所以要怎樣才能達成守法? 讓大部分的人守法就好，所以可以訂重罰，不用把速限拉高

歷史的力量: 積習 x軸是總共有多少打字員用QWERTY鍵盤 y軸是新打字員學QWERTY鍵盤的比率中間的對角線是使用QWERTY的平衡點(可以想成y軸是in，有多少新血，x軸是out，現存的人) 曲線是有多少人用對到會有多少人學 (from 隨機逼近理論)

起初有大量的QWERTY(所以在98)

有3個均衡點
- 0,0
- 72,72
- 98,98
只要超過均衡點就是指數往上或往下 (這均衡十分脆弱)
- 只要超過72就是往98前進
- 低於72就是往0衝
從眾讓我們得到這種結果 (目前大多人都是QWERTY)
- 想要丟掉QWERTY十分困難
- 但還是有機會
  - 大廠或是大戶一起投入新鍵盤
    - 像消滅3.5mm
  - 也就是說，沒必要改變所有人，只要改變起關鍵性作用的部分就好

其他例子是汽油引擎、輕水反應爐，都是早期大量投入，導致後面無法翻轉的例子

別讓它引爆這裡來看黑人與白人社區的形成

與QWERTY類似的圖，但是極端是0或100 均衡在input等於當前的比例的時候，這裡中間是在70

同樣的，這是脆弱的平衡，更壞的是，基本上一但到了極端就回不去了(遷徙自由)

所以要怎麼阻止?

禁止放上出售的牌子 (延緩引爆)
提供保險保證不會因為混居比例改變而讓房屋價值下降 (阻止因為預期而導致的引爆)

危險的斜坡書上的例子是有一群人要爭一個高位

透過每年評分(滿分10分)沒有到門檻就out，現在可以透過投票設定門檻

有人設定成2，這樣會有

分數為2的反對
剩下都不會反對
- 比2高: 不用反對
- 比2低: 如果反對會被看出來自己的分數比2低

這種情況會一直持續，直到有人設定11分，讓所有人都搶不到

投票中只有唯一一個剛好的人承受所有損失，所有贊成者只有一點點好處，就讓這投票一路往前，最後一次引爆帶所有人下去只有一個人意識到這個問題沒用，因為他不一定可以阻止這個過程

書上有一個例子是議員想加薪，但是遇到民眾反對，所以有人就想只有我投反對應該還是會過最後，案子一直過不了，隨著一次一次過不了(一直一直修正)，反對的理由越來越充分，加薪就無望了

打從一開始就不該開始這種事情，這需要大家協調才能避免，一次把事情處理掉(讓所有人都知道自己最後會在哪)，不是分成小步小步不然，這樣只要出現一個巨大的失敗可以把前面所有東西都吃掉

ch10: 競價，當成你已經能得標後，別人會怎麼出價

最一般的競標
- 英式拍賣
  - 想喊的就喊，直到沒有人要喊，用次高價成交
  - 最佳策略
    - 超過自己的估價(超過一分就想轉身離開的數字)就退出
      - 估價的要素
        共同元素 (油田的油含量)
        私人元素 (自己的採油技術)
        還有誰在競價 (一張不起眼的椅子卻有知名家具商出高價競標!?)
        有多少人在競價
        其他人什麼時候退出
    - 英式拍賣只會看到共同元素 & 私人元素
- 日式拍賣
  - 想要就手舉著，直到價格漲到受不了就手放下，成交價是倒數第二位放下時的價格
  - 最佳策略
    - 同上
    - 日式拍賣能看到上面所有估價要素
- 維克里拍賣
  - 寫下自己的出價，由出價最高的人get，付第二個高的價格
  - 最佳策略
    - 同上
- 3個都是
  - 出價最高得標
  - 給次高價
- 在私下的競標中
  - 別人的訊息不重要
    - 不論用哪種拍賣最後的成交價都一樣
- 買家的溢價 (多抽平台費)
  - 看起來是買家要付，但其實是賣家要付
    - 因為買家可以先把這段算進來，買家最後出價都一樣，但到賣家的錢變少
如果還有其他差不多的東西也同時在競標
- 線上競標
  - 流程與維克里拍賣類似，但是是程式幫跑
- 估價多少?
  - 如果自己估400元，其他類似的出現250元
    - 現在估價也取決於其他相似的代售物品
  - 狙擊出價
    - 到最後一刻才出價
      - 因為大部分都不知道自己的真實估價
向前預測，向後推理
- 像一個結果導向主義一樣行動
- 在一開始就以終為始，然後才行動
  - 避免贏家的詛咒
- 假裝已經得標後開始思考這個數字
  - 假設我們要買一家公司
    - 前提
      - 預測市值是200~1200
      - 我們有能力讓他的真實市值變1.5倍
      - 現在問題是我們最高只能到多少才不會虧?
    - 贏家的詛咒
      - 直接求中點加上1.5倍: 700*1.5 = 1050
      - 如果對方接受，代表真實市值在200~1050
    - 假裝已經得標後，接著算
      - 我們需要一個數字是求中點加上1.5倍不虧的數字(均衡點)
        (200+x)/2 * 1.5 = x
        答案是600
  - 密封競價拍賣
    - 維克里拍賣，但付自己寫的價格
    - 最佳策略
      - 比自己的估價低一點 (才有賺)
      - 同樣要利用前面的方法來看自己的出價
  - 荷式拍賣
    - 與日式相反，從最高往下掉，直到要的人叫停
    - 最佳策略
      - 同上
收益等值定理
- 估價在私密且對稱的狀態下
- 不論任何拍賣
  - 賣家通常都會拿到相同的錢
    - 所以把自己的估價當成最高的
      - 之後用你認為的第二高來出價 (你下一個競標者的最高出價)
    - 不論另外設定各種規則
      - 買家都有辦法把相關成本回給賣家
      - 或是說買家會根據規則調整出價
買家會根據規則調整出價，所以賣家通常都會拿到相同的錢
- 國債拍賣 (總共1億)
  - 一開始是挑最低利率的得標
    - 只有紅線以上的得標
  - 後面改統一利率，如果延續前面的表格就是所有得標者都是3.72%
    - 這樣不是更不好嗎?
      - 這是因為這是前面的拍賣方式
      - 如果改成統一利率，會有不同的出價，反正
        賣家通常都會拿到相同的錢
        但這樣調出價這就不用思考太多
類似出價的賽局
- 先佔賽局
  - 先出手才有機會得到市場，但失敗就gg，所以要什麼時候出手?
    - 同時出手
      - 太早出手如果失敗就gg，晚出手就gg，剩下就是同時
    - 這還是沒講時機啊
      - 你成功機會與失敗機率相等的時候
        你成功是他失敗
        他失敗是你成功
        這不就是同時出手
- 消耗戰
  - 看誰hold比較久，有最佳策略嗎?
    - 沒有
      - 你認為他們要停了就會繼續忍
      - 它們認為你還要忍他們就會忍
        loop
    - 你的出價策略完全看對面
      - 但實際上根本沒辦法知道!!
  - 只能與對方協調，中止這個賽局
競標頻譜執照 (很神)
- 現在有兩個執照，NY,LA
- 只要有針對比較低價的可以選擇加價(本來就比較高的就不用動)
- 直到沒有要加價為止
- 每一家最多一張
- 下圖是兩家公司的估價
- ver1
  - AT&T直接抄MCI的底價，這樣AT&T在賺1元(另一張讓給MCI，但MCI沒有賺)
- ver2
  - AT&T在NY出1，另一個出0
  - 這樣MCI會怎麼出，別忘了他們不是要帶一張不然就是因為到了底價而停止
    - NY出0，另一個出1
  - 這樣AT&T賺9元，MCI賺8元
- 這裡很有趣
  - 如果改成一般的一張一張競標就不會有這種結果!!
    - 電信商不能沒有帶走任何一張，但又有不同的地區偏好!!
      - 變成所有競標都要好好投入，但又怕沒錢撐到想要的執照
  - 把兩個賽局合併就能產生處理兩個賽局的策略!!
    - 如果你不喜歡現在的賽局，那就尋找更大的賽局

ch11: 討價還價 aka 怎麼算餅多大&怎麼分餅

假設
- 酒店一天賺1000
- 輪流提要求
- 資方只能yes/no
- 只能明天給回應，只有共識才能開始賺錢
向前預測、向後推理
- 實際發生的事情應該從這個邏輯推到極致來思考
  - 從最後一天開始，看怎麼分剩下的錢 (total: 1000)
    - 公會提拿1000，資方0
      - 資方也只能接受，都最後一天了
  - 往前一天 (total: 2000)
    - 資方提拿500，公會(1000+500)
      - 資方知道如果到最後一天，工會會拿到1000
      - 所以現在的部分對半分
  - 再往前一天 (total: 3000)
    - 公會提拿2000，資方1000
      - 從前一天的基礎上今天對半分
因為工會在最後一輪有全拿或全失的提議方，所以最後一天可以全拿
但這個優勢隨談判回合多就不明顯
- 看看一開始，雙方的錢幾乎一樣
  - 這個告訴我們一個簡單的法則: 對半分(split the total down the middle)
在剛剛的例子中，雙方的大餅是剩下的天數
而決定怎麼分餅，是看
- 各方的等待成本
  - 看有什麼辦法可以抵銷沒有共識的損失
- 像是以前面的例子來說
  - 如果員工可以在罷工時起賺到300(一天)
    - 這樣原本的1000中就要先分給工會，不然比300低就沒有共識的價值
  - 如果資方有辦法策動一部份人使店可以重新開始營業賺到500(一天)
    - 這樣原本的1000中就要分500給資方
  - 這樣一套下來，餅剩下多少?
    - 1000-500-300 = 200
- 剛剛提到的300與500，就是雙方的協議最佳替代方案(BATNA, best alternative to a negotiated agreement)
  - 無共識的最佳方案
- 所以整個談判的關鍵是 (餅是?)
  - 共識的價值比各方的無共識的最佳方案總和還要多多少
要出多少機票錢?
- 2家公司都請了同一個律師，現在飛行路線是一個三角形，試問兩家公司要怎麼分總機票錢?
- 加總平分? 只平分中間段?
- 從BATNA來看
  - 如果雙方沒有共識，律師就要兩個點到律所來回
    - 這樣就是2486+1332=3181，但三角形路線的總和是2818
    - 所以只要有共識(使用三角形路線)，就能省下1000
    - 2家公司平分這1000，之後扣回去變成各付
      - 2486-500 = 1986
      - 1332-500 = 832
只要他比我痛苦就好
- 從BATNA來看，只要BATNA越好能吃到的餅越多
  - 所以可以想辦法(威脅、承諾)調整雙方的BATNA
    - 威脅、承諾可能讓雙方的BATNA變少，但只要最後談判可以拿到更好的結果就ok
      - 對對方的傷害更大
  - 像員工阻止資方營業，最後員工200，資方只剩下300
    - 這樣餅剩多少?
      - (1000-200-300) = 500
      - 這樣公會拿200+250 = 450 (原本是400)
      - 資方拿300+250 = 550 (原本是600)
如果都知道早點對半分比較好，為什麼還會罷工?
- 談判因為人為因素(情緒、各方的BATNA、懷疑)容易導致誤解
- 各方對成功的定義不同
- 各方必須猜對方的等待成本(BATNA)
  - 為了證明自己的等待成本低，所以開始製造成本
    - 正是對於談判何時應該結束沒有共識，才導致罷工
- 這就是邊緣策略，一路從往破滅的方向走 (很像膽小鬼賽局與消耗戰)
  - 重點是讓發生的可能性上升的fu讓另一方退讓
罷工的其他點
- 同時談多個爭議
  - 各方重視的不一樣
    - 像醫療保險，個人去買會比較貴，但公司去看可以拿到更好的價格
    - 但也有可能變成在其他方面談判的籌碼
- 虛擬罷工
  - 照常營業，但是當天的所有收入都捐出去
    - 重點是雙方都不會拿到錢
      - 長期利潤難以衡量，所以公司也有可能低估短期的成本
      - 等到雙方都很苦後，就會想好好談了
        同時，其他人還有好處
  - 啟動時間點在雙方還在談判的時候

RUBINSTEIN BARGAINING 設定δ是折舊的比率，L是我們最低可以接受的比率假設我們今天拒絕，這樣對手明天能到最多δ(1-L)(所以他們明天一定要接受)，所以明天能拿到1-δ(1-L) 對此，今天我們的底線就是δ(1-δ(1-L))

同樣假設我們今天拒絕，M是我們的上限(超過直接接受)，利用對稱性，對面的最低是δ/(1 + δ) (這時在明天) 所以我們能拿的是1-δ/(1 + δ) (這時在明天) 所以今天我們能拿的是δ/(1 + δ)

這很神奇，如果雙方都很能等(δ為1，也就是不會隨等待貶值)，這樣比率就是0.5!! 如果折舊是0.5，最後數字是1/3 想像一個割派的情況，但每次都輪流拒絕，而對手可以拿到剩下的部分所以第一局對手拿0.5，第二局你拿0.25，之後一直除2，但對手總是拿到你的2倍!! 所以比例是2:1就是1/3

ch12: 預期與投票

投到最後反而是我不想要的上了!?
- 人們預測某個候選人很穩，就會把票給他們推崇的極端候選人
  - 最後很穩的候選人與極端候選人都一起出局
- 同時人不想把票浪費在保證不會上的人
  - 所以民調重要
票只有在打破平局才有價值
- 當我們的票無關緊要時，可以隨意投票
- 當我們的票意義重大時，就要策略性的投票
  - 當真相無關緊要時，我們才能說出真相
有辦法避免策略性投票嗎?
- no
- 所以只能從各種方式中去挑
多數決的缺陷
- 有3人
  - Mr. Robespierre (R), Mr. Danton (D), Madame Lafarge (L)
- 如果抓出任意2人做多數決，會發現彼此互剋!! (三角形)
  - 可以改成取差距大的多數決優先
    - R對D是75對25
    - D對L是65對35
    - L對R是60對40
      - 這個差距不大所以不算
    - 這樣就變成 R > D, D > L
    - 換個視點成R最多只有60票反對，D是75，L是65，所以R勝利
      - 取最多反對票的候選人中的最少票的原則
        康多賽投票規則
        缺點: 要投很多票!!
        可以改成讓選民寫下排名
- 但上面的例子如果用當前法國的制度?
  - 第一輪選兩個(除非有人拿絕對過半的票)
  - 第二輪一般多數決
  - 這樣結果變成
    - 第一輪剩下R與L
    - 第二輪D的支持者投給L
      - L勝利!!
  - 如果R的支持者意識到這件事
    - 就會策略性投給D
      - 但這樣D會直接過半!!
在存在投票循環的狀態下，投票結果對投票程序高度敏感
- 怎麼判刑?
  - 3種做法
    - 現行制度
      - 先看有沒有罪，之後量刑
    - 羅馬傳統
      - 從最重的罪往下看，如果都沒有最適合就無罪
    - 強制判刑
      - 先量刑，之後看有沒有罪
  - 現行制度
    - 如果選有罪，之後就一定是死刑
    - 所以這一開始就是選死刑或無罪
      - 最後無罪
  - 羅馬傳統
    - 如果決定死刑，就不用再看了
    - 如果決定不要死刑，就變成無期確定
    - 所以這一開始就是選死刑或無期
      - 最後死刑
  - 強制判刑
    - 如果決定死刑，最後就是無罪
    - 如果決定無期，最後就是無期
    - 所以這一開始就是選無罪或無期
      - 最後無期
選民如何影響候選人
- 所以選民為了讓整體傾向自己的立場，要變的極端
  - 假設
    - 0~100表示保守程度，當前偏保守，60分
    - 你是中間選民，50分
      - 如果說出真實意象，最後落在59.9
      - 如果極端，最後落在54.9
- 對此，候選人會根據各方的選民數量做出妥協(平均)
- 會變成這樣是因為平均會考慮到
  - 立場
  - 強度 (所以變得極端)
- 如果要處理這問題就是讓候選人採取中間立場 (政黨也是)
  - 這樣選民沒有必要極端
  - 一路從左開始往右走，直到左右力量相當
    - 如果有對手?
      - 像是對手選48，這樣在任者只要選49
      - 像是對手選51，這樣在任者只要選50
  - but，這只有在單一議題有用
為什麼憲法要2分之3才通過?
- 延續前面的中間立場的問題，如果有多個議題的話?
- 變成現任者要選一個最中間的位置
  - 重心
- 這個與兩人分蛋糕有點像
  - 一個切，另一個選
  - 但現在時現任者壓住一個點，給另一個人切
- 看上面的三角形，只要現任者在重心，不論挑戰者從哪邊攻擊
  - 現任者一定有4/9的小三角
- 如果繼續推到多維
  - 保底都有1/e比例的選票，大約36%
    - 就算選民常態分布不是平均分布
  - 也就是說，至少要64%才有辦法撼動現任者的地位
- 所以憲法選2/3確保不會那麼常變動
預期使我們扭曲
- 我預期A會上
  - 所以我可以投給B，因為A少我這票沒差
- 我預期A與B不應該上
  - 如果A有其他人會投導致他會上，我應該就要投B，保證公平
先手必勝
- 兩個基金會各有25萬
  - 可以給
    - 遊民
    - A大學
    - B大學
- 雙方都覺得遊民最重要
  - 但有各自偏好的大學
- 如果A基金會希望給A大學多一點預算，但不損及遊民，要怎麼做?
  - A基金會先把25萬都給A大學
  - 這樣B基金會只能撥20給遊民，5給B大學
    - 原本可以雙方各出10給遊民，這樣大學各有15
    - 因此A基金會的搶先行動，搶了B大學的10萬
- 你可能願意冒著失去你想要東西的風險來得到更多好處
  - 只要你還可以指望別人會來幫你挽回顏面
- 如果你可以指望別人在意後幫你挽回局面
  - 那你就有動機去扭曲你的真實偏好
  - 利用其他人的真實偏好增加你可獲得的好處

ch13: 激勵: 買努力 aka 怎麼測量努力，買努力的保證

道德風險
- 想驗證有沒有認真做事
  - 自己下去再做一次?
    - 那幹嘛分配工作
- 為努力付款
  - 努力不好被觀測
    - 報酬無法直接以努力為基礎，報酬只能與某種結果綁定
    - 結果的組成
      - 努力
      - 運氣
        讓多個員工做同樣的工作
        互相成為比對的基準
        同樣的書稿讓多個學生debug
        第一個找到bug的有錢
  - 固定獎金
    - 我可以假裝有做事，最後說因為場外因素失敗
  - 按價計酬
    - 如果自己能做的不多，這樣參與的意願就不高
      - 想是為已經到第三版的書挑錯
  - 所以要混和使用
  - 錢不能太少，太少乾脆不要
    - 太少會傳出一種這件事不重要的訊號
- 其他付款方式
  - 非線性(門檻)
    - 不能太高
      - 如果打從一開始就不可能，那還要做嗎
    - 不能太低
      - 有設與沒設一樣
  - 胡蘿蔔與棍子
    - 基本工資: 參於約束
      - 低工資: 棍子，要好好工作才有基本收入
      - 高工資: 胡蘿蔔，好好工作會有獎金
    - 好壞績效之間的利差
      - 利差越大越有效果
效率工資 (效益溢價)
- 假設
  - 外面的行情價: 40000
  - 個人的努力費用: 8000
  - 發現偷懶的機率: 25%
- 工資要多少才能確保他不會偷懶且努力?
  - 第一個是買他的努力: 48000 (抓到偷懶就沒有)
  - 第二個要多加多少才會讓他認為偷懶不值得
    - X為抓到偷懶之後每年要失去多少，沒有抓到就給他
    - 有25%的機會被抓，0.25X
    - 乘上利率，先當成10%，0.25X*10
    - 所以偷懶一次8000，之後每年失去0.25X*10
      - 8000 < 2.5X => 3200
如何設計工資
- 假設
  - 完成遊戲的收入是20萬
  - 雇一個一般工程師5萬，成功機率60%
  - 雇一個專業工程師7萬，成功機率80%
- 工資要開多少
  - 先看要請誰
    - 20萬 * 60% - 5萬 = 7萬
    - 20萬 * 80% - 7萬 = 9萬
    - 找專業的
  - 獎金給多少
    - 我們不知道他有沒有認真，這是創意性的工作啊
    - 只能從最後成果下手
    - 一般與專業的成功差距是20%與2萬
      - 獎金: 2萬 / 20% = 10萬
  - 要給多少
    - 10萬獎金如果給一般的來做有60%成功
      - 偷懶的預期收入: 10萬 * 60% = 6萬
    - 基本報酬: 一般的行情價 - 偷懶的預期收入
      - 負1萬
    - 所以
      - 失敗: 負1萬
      - 成功: 10萬+負1萬 = 9萬
      - 平均支出: 80%*9萬+20%*負1萬 = 7萬
  - boss的平均收入
    - 20萬*80% - 7萬 = 9萬
    - 可以看成用50%的股份換工程師的努力與1萬
      - 20萬*80% + 1萬 = 9萬
      - 成功獎金就是公司的一半
- 不能用罰金的話?
  - 找近似的獎金制度
    - 像把失敗的錢變成0，這樣平均支出變成8萬，boss的平均收入也變成8萬
    - 但這樣努力的難以觀察程度就會有影響
      - 之前因為是剛好7萬是可以直接反應可以直接看到工作品質高低的數字
  - 分紅或配股
    - 風險問題
      - 可能因為風險導致估價低於平均支出該有的價格
    - 只能妥協，接受可能有低努力的結果
      - 員工有多的風險就要有補償

ch14: 各種小故事

該交換嗎

現在有5, 10, 20, 80的信封，給兩個人，之後讓他們確認有多少錢，最後給一次機會可以與對方換。他們該換嗎?

no 你拿80就不用換對方想跟你換，代表對方一定不拿80 如果你拿20，你也不用換你拿10或是5也不用換，因為對方會想到這點，也不會更你換，除非他拿得比你低，但這樣你也不用換了

先行者劣勢1

現在到最後一局，A與B各有700與300，之後他們在轉盤上對賭，最後有最多籌碼的贏

B梭哈300到3的倍數上(賠率是2比1)，A應該怎麼應對(壓紅或黑與壓多少)
如果B想贏超過A應該怎麼做
壓3的倍數300(照做)，這樣不論贏或輸，對方的總和絕對不會超過A
假設A下200在紅色(賠率是1比1)，這時B應該壓黑色300，只有贏他才是獲勝的唯一可能

先行者的劣勢是會暴露你的行動

先行者劣勢2

現在有3人做決鬥，3人準度分別是

30%
80%
100%

決鬥分兩階段，每階段各有一次開槍機會，問怎樣第一個人的生存機率最大

這與第一章的以退為進很像，他應該放棄開槍，讓其他人決鬥，因為它們都想幹掉對方最後就是看第一位的30%能不能打到了

弱者透過讓出自己的第一次機會可能得到較好的結果

先行者優勢

現在有個遊戲，挑一點之後把從這點到右上的所有點拿掉，剩下最後一點的輸

怎麼證明先行者有取勝策略

不論後攻怎麼拿，先攻都可以直接做出來所以就算後攻有取勝策略，先攻一定可以優先開局

沒有什麼事情是後攻可以對先攻做，而先攻不能搶先做的

囚徒困境來收購

有一家族企業，為了以後不讓企業被其他人吃掉，所以在董事會議程加一條提議通過需要過半，如果提議未通過，提案者與附議者就是解除董事職務，並將其股權平分給其他董事投票是轉一圈，看同不同意

當然最後一定被收購了(提案者有51%)，how?

hint: 使用向後推理，以終為始，確保最後兩位有動機投同意

過
- 一個人投不同意
  - 照規則
    - 每人get，``20% / 5 = 4%
- 二個人投不同意
  - 除了規則，加上提案者的51%
    - 有過，12.25% / 3 + 51% / 2 = 29.8%
    - 沒過，(12.25% + 51%) / 3 = 21.1%
- 所有人同意
  - 都給錢，由自己指定新董事會
不過
- 不用考慮

囚徒困境來收購2

現在有人要收購公司，分兩階段，50%之前都是105一股，超過50%後就是90一股，當前股價100一股如果收購成功，

收購失敗，就回去100 所以要讓出嗎?

要

低於50%與剛好到50%，都會拿到105，所以要出讓
高於105，如果不出讓這樣最後變成90，但出讓至少還有97.5

但這裡有趣的是，因為照這樣所有人都會出讓，這樣均價變得比當初的當前股價低

老實沒有好處

手機費很複雜，都不會把所有該寫的都寫出來，why?

如果真的列出來，這樣就一定要在其他地方做出彌補(因為消費者都會知道哪邊要避開) 最後就是與其他看起來比較低的相比，變得不利

另外，消費者也預期公司一定會有另外的費用，如此一來老實的除了貴還是貴最慘的是，消費者也不知道對手的真實收費如何，所以也無從比較

最後整個變成，前面看起來很便宜，之後很貴；所以公司都要比看起來便宜，去反覆地搶客與被搶利潤就花在這個地方

一個方法就是立法規定廣告的價格必須是包含所有費用，像書就是包含運費與保裝費

為孩子定價

舊式所羅門王的找誰是真的媽媽的故事，但現在用罰金來處理

但罰金要

夠高
真的母親要付得起

確保小孩會來看我且不會搞

父母最後可以用遺產來讓小孩們做點事，想回來看看父母

所以他們定，如果沒有看夠每周的次數，那該小孩的遺產就平分給其他乖乖的小孩

但之後所有小孩合謀，都不會去看，因為他們知道父母絕對會把遺產給他們

對此要怎麼做才能讓他們守規矩，同時不能把遺產給別人或拋棄

如果真的發生，就把所有遺產給看最多的小孩

一美元的價格

現在競標一美元，但特別的是出價最高與第二高的都要給他們出的價，最高的get這一美

這要怎麼玩

打從一開始就不要玩因為出價最高與第二高的都要給他們出的價，所以一旦不幸成為第二就要去追第一，之後loop 直到沒錢可以玩的時候

另外一個方式是共謀，一個人出一個單位的錢，剩下的人不出，這樣就是其他人的獲勝了

要等多久

假設一個橋，7點半到11點會出現壅塞，一台車9點加入車陣中，請問他產生的總等待時間多長?

11-9是2 可以想像成這台車每開上橋，在旁邊等到壅塞結束要多久用一輛車看出總等待時間

不論如何吃角子老虎機都很坑

業者稱他們的其中一台機器的投報率大於1，我們能猜出是哪一台嗎

應該不能

投報率是只吐出累積獎金的機率，就算投報率高，但看到一直沒有回報，一定會被認為是不好的機器
也可以投報率不高，但一直吐小獎，這樣大部分的人都會用這台投報率其實不好的機器

動機#

ch1: 各種小故事#

猜數字: 考慮到其他參賽者的策略與目標，與他們的策略如何影響你的策略#

以退為進: 預測所有對手的行動#

妙手: 個人利益換群體利益 與 混合策略#

要不要做老二: 為了保持領先而模仿#

永不妥協: 讓承諾看起來像真的#

減肥: 與未來的自己的賽局#

只有個人捐款的法案: 囚徒困境#

想要贏大的: 虛張聲勢#

人的心理與情緒: 理論對於有經驗的比較準#

ch2: 循序賽局，逆推求解#

ch3: 囚犯困境 & 合作#

ch4: 納許均衡#

納許均衡#

求解納許均衡#

焦點#

性別戰與膽小鬼遊戲#

前往連續#

理論的極限#

ch5: 混和策略#

ch6: 策略行動，改造賽局樹#

ch7: 提升可信度#

ch8: 訊號#

行動勝於語言#

ch9: 選擇會外溢，所以需要合作(公共政策)取代均衡#

ch10: 競價，當成你已經能得標後，別人會怎麼出價#

ch11: 討價還價 aka 怎麼算餅多大&怎麼分餅#

ch12: 預期 與 投票#

ch13: 激勵: 買努力 aka 怎麼測量努力，買努力的保證#

ch14: 各種小故事#

該交換嗎#

先行者劣勢1#

先行者劣勢2#

先行者優勢#

囚徒困境來收購#

囚徒困境來收購2#

老實沒有好處#

為孩子定價#

確保小孩會來看我且不會搞#

一美元的價格#

要等多久#

不論如何吃角子老虎機都很坑#

動機