2021/09/21

[閱讀筆記] HOW NOT TO BE WRONG - 結語:如何做才能正確

 

  1. 老羅斯福總統於 1910 年在巴黎演講提到:並非會批評的才算數;只會指出差強人意,或行動有成者哪裡可以做得更好,這類人都不能算數。功勞應歸給真正在競技場上的人,他們臉上布滿灰塵、汗水與血跡;他們會犯錯,會有不足之處,因為任何努力不可能沒有錯誤與缺陷。那些充滿熱誠奉獻的人、那些投身有價值目標的人,最佳狀況就是終於抵達成就勝利的高峰,最差的狀況就是在勇往直前中不幸失敗。他們的地位永遠不會與那些又冷漠、又膽怯、既不知勝利、也不知失敗的人為伍。老羅斯福總統對於那些又冷漠又膽怯,坐在邊線當事後諸葛的人嗤之以鼻。

  2. 當氣象報告說有 40% 的機會下雨,而且確實下雨了,你會對預測失去信心嗎?不會的,因為你知道天氣本質上就有不確定性,一口咬定明天 100% 不會下雨的預報,通常是錯誤的服務。氣象預報給你不確定的答案,但是是嚴謹的不確定

  3. 期望值不是你期望的數字,而是對各個結果的機率性妥協。Laplace’s Law (拉普拉斯定律) 計算期望值:假設買 n 張彩券有 w 張中獎,期望值= w+1n+2。想算出公車遲到機率嗎?你參加的壘球隊的贏球機率?只要算一下過往發生次數 + 1,再除以機會數 + 2 即可。拉普拉斯定律的優點在於,無論只有一個資料點或是有數百萬個資料點,它一樣有效。例如,地球上已經連續看見太陽約 1.6 億次,明天太陽還是會升起的機率與 100% 無差別。

  1. 美國哲學家、邏輯學家 Willard Van Orman Quine 曾說:相信某件事就是相信某事為真,因此合乎理性的人相信他自己每一個信念均為真;然而經驗告訴他,可以預期某些信念結果為偽,只是他還不知道哪些信念最後不為真。簡單地說,合乎理性的人相信,自己每個信念均為真,並且其中有些會為偽。

  2. 中國有位年輕人呂超,他能正確背誦圓周率 π 到小數點後 67,890 位,那真是了不起的記憶力。但那會有趣嗎?不會的,因為 π 後面的小數點一點都不有趣。就任何人所知,那就跟一長串亂數一樣。不過 π 本身是有趣的,π 並不是它的各項展開數字,它只是由那串數字寫出來罷了。就如同 La Tour Eiffel 可以標示在北緯 48.8586 度、東經 2.2942 度一樣,就算你在多加幾位數,也無法告訴你,La Tour Eiffel 何以是 La Tour Eiffel。

  3. 第一等的智力測驗,就是看能不能同時在心理容納兩種衝突的觀念,並還有能力維持正常機能。使用歸謬法時,這種能力是不可或缺的,你需要在心中持有一個你相信是錯誤的命題,但推理過程假裝它是對的:假設 2 的平方根是有理數,雖然我想證明它不是。這是非常有系統地做一場清醒的夢,我們有能力做且不至於短路。

  4. 不只是在做數學要白天證明、晚上反證。對於你所持有的信念,不管是社會、政治、科學、哲學等,以反證來施加壓力是一種好習慣。在白天相信你所願意相信的,但是到夜晚,與你最珍愛的命題打對台。用盡你的力氣去思考,就像你相信你原本不相信的事。如果無法說服你放棄現有的理念,你就會知道更多為什麼你會相信所相信的事,你就已經更接近證明了。

  5. 你會觀察到,好東西多了並不見得總是更好;只要給予足夠機會,不太可能發生的事情,也有可能會發生;做決策時,不要只關注最可能的未來,應該看到所有可能未來興起的雲霧,注意到哪些比較可能、哪些比較不可能;對於群體信念與個體信念的規則應該相同的想法,不再堅持;或者,你找到一個甜蜜點,在此可以放任直覺奔放在形式推理造就的軌道網。這些事發生時,即使沒有寫下任何方程式,但你就是在做數學,你正以額外手段擴充嘗試。你什麼時候在用到數學?你打從出生就開始用數學,也不停在用數學,你要好好的運用數學。

2021/09/20

[閱讀筆記] HOW NOT TO BE WRONG - 第18章:「我從虛空中創造出一個新奇宇宙」(Out Of Nothing I Have Created A Strange New Universe)

 

  1. 法律的條文如同定理的公設 (axioms),可以用邏輯演繹的方式,導出判決。法律上的形式主義,表現在堅守程序與法條條文,特別是在與常識發生干戈之時。大法官史卡利爾是司法形式主義最強的支持者,他很直接地說:「形式主義讓國家有法治,而非人治。」

  2. 首席大法官 John Robert 在 2005 年任命聽證會上,有一段流傳甚廣,以棒球比喻自己職責的發言:法官與司法都是法律的僕人,而非顛倒過來。法官就像棒球比賽裡的裁判,裁判不制定規則,而是執行規則。裁判與法官的角色極為關鍵,他們要確定每個人都按照規則走。然而他們的角色是很有限的,沒有人去看球比賽是去看裁判的。 

  3. 皮亞諾公設 (Peano axioms)

人類開始注意到數學的「可加性」

早在遠古時代,我們的老祖先就在儲藏獵物、分配食物時,逐漸產生對數的感覺。當  2 隻 牛、 3 隻 羊、 5 隻 豬擺在一塊,只有這些東西可過冬時,強烈的求生欲使老祖先朦朧地意識到這其中有一種共性,並開始擺弄著自己僅有的  10 隻 手指計數。

因此,當某位古代先祖第一個意識到「 1+1=2」,從而認識到兩個數相加得到另一個確定的數時 ,就發現了「數學」一個非常重要的性質 ——可加性,這是人類文明史上一個極其偉大的時刻

皮亞諾公設 (Peano axioms)

  • 皮亞諾的這五條公理用非形式化的方法敘述如下:

    • ① 0 是自然數;

    • ② 每一個確定的自然數 a,都有一個確定的後繼數 a' ,a' 也是自然數;

    • ③ 對於每個自然數b、c,b=c若且唯若b的後繼數=c的後繼數;

    • ④ 0不是任何自然數的後繼數;

    • ⑤ 任意關於自然數的命題,如果證明:它對自然數0是真的,且假定它對自然數a為真時,可以證明對a' 也真。那麼,命題對所有自然數都真。

  • 其中,一個數的後繼數指緊接在這個數後面的數,例如,0的後繼數是1,1的後繼數是2等等;公理5保證了數學歸納法的正確性,從而被稱為歸納法原理。

  • 根據這五條公理可以建立起一階算術系統,也稱皮亞諾算術系統。


  1. 數學是群體的事業,雖然我們會對放上最後一塊磚的人給予特別的榮譽,但是每次一次的增長,其實是巨大心智網路朝共同目標努力的結果。Mark Twain 曾說:需要上千人力才能發明電報、蒸汽機、留聲機、電話、或任何其他重要東西,最後都是一個人記上功勞,其他人都遭遺忘。

2021/09/19

[閱讀筆記] HOW NOT TO BE WRONG - 第17章:沒有民意這種東西 (There Is No Such Thing As Public Opinion)

 

  1. 政府都希望透過民調來了解民意,但你會發現民調結果充滿矛盾。例如,多數人同意,透過削減支出與增加稅收來平衡州政府預算;但是當問到是否要砍教育、健保、交通、年金的經費?是否要增加所得稅、營業稅?沒有一個項目獲得支持。多數美國人認為,自己能受益的計畫,才是最該不計成本該保留的 (我沒說過我們不自私,只說過我們不愚蠢)

  2. 民意根本不存在,更精確地說,民意只是有時候會存在,在多數人對某項事務有清楚見解時,才能講民意

  3. 如果沒有民意這件事,民選代表如何做事?最簡單的答案是:如果人民沒有給你一致的訊息,就照你的意思去做。如果你是優秀的政治家,你就會說:「人民選我是要我來領導,而不是來看民調臉色。」

  4. 人並非完全理性的個體,我們日常生活常會出現矛盾與不協調的行為。個體之所以看起來不理性,有可能他們不是個體。我們每個人都是一個小小的民主國家,內部有驅動我們的各種辯論的聲音,我們盡量努力去平息爭議以及取得妥協。結果並非永遠合乎理性,它們好歹讓我們蹣跚前進,不會犯太多可怕錯誤。民主確實亂糟糟,然而它就是能發揮功效。

  5. 假設一開始 Amy 有兩個擇偶對象 Adam 與 Bill,Amy 需做出困難選擇;但是當 Clause 出現後,局面開始改觀,Clause 是個「無關的選擇」,魅力與可靠度與 Adam 高度雷同,但智力有差異,是個 Adam 略傻版,使 Adam 看起來更棒。經研究,有 ⅔ 的女性選擇 Adam。所以,如果你是正在追尋愛侶的單身漢,你就該選擇跟你一位跟你很像,卻又稍稍缺乏那麼點吸引力的人來當你的電燈泡

  1. 排序複選制 (IRV, Instant-runoff Voting) 是一種排序投票制度。在候選人超過兩名的情況下,選民在選票上按喜好排列其支持的候選者。計票時,首先依照選票上的第一選擇來計算候選人的得票,得票最少的候選人將被淘汰,然後將其得票依第二選擇重新分配給其他候選人,按票數再排序後,再將最少票的候選者排除,並將其選票分配給餘下的候選人,如此類推,直至有候選人取得過半數選票為止。(https://reurl.cc/MAZ2VK, https://reurl.cc/mLqp2l) 例如:

  1. Condorcet 的投票悖論 (The Condorcet Voting Paradox)

Voting Paradox

  • 當談論「個人選擇」時,如果一個人喜歡 A > B,同時喜歡B  >  C,那麼他就應該喜歡A  > C;

  • 但當我們談論「集體選擇」時,一個群體喜歡 A  >  B,同時喜歡B  >  C,卻不一定等於他們會喜歡A > C。

以美國總統大選為例

  • 就算談論同一群人,這群人喜歡 Donald Trump > Hillary Clinton,喜歡 Hillary Clinton > Bernie Sanders,他們仍有可能喜歡 Bernie Sanders >  Donald Trump。

  • 如果 Sanders 參選,很可能可以搶回一些因求變或不喜歡 Hillary而投給 Trump 的人,也可能令一些因不喜歡 Hillary 而沒有出來投票的民主黨人出來投票。但 Hillary 能拿到的一些主流民主黨選票和中間游離票,會否嫌桑德斯「太左」,的確是個問號。

  • 將 Condorcet's paradox 和今次大選的結果合併來思考,可以提醒我們,Trump 勝出,不一定代表他是最受美國民眾支持的政治人物,因為制度安排加上現實狀況,可以碰巧將一個不是真的那麼大受歡迎的人推上台。(https://reurl.cc/a95po3)


  1. 孔多塞陪審團定理 (Condorcet Jury Theorem, CJT)

Condorcet Jury Theorem

  • 如果開會的時候,與會者在一個對、一個錯的二選一的選項中投票,越多人做出正確決定的機率超過50%,越多人一起開會,就越可能得出好的結論。投票得出結果的正確性由 p 是否大於或小於 1/2 決定:

    • 如果 p > 1/2 (即每個投票人有更大的投出正確選項的可能),則投票人數的增加將會增大群體得出正確結論的可能。當投票人數趨近於無限大時,群體投票得出正確結論的可能性無限接近於一。

    • 然而如果 p < 1/2  (即每個投票人有更大的投出錯誤選項的可能),則投票人數的增加會增大群體犯錯誤的可能:此時最適當的陪審團人數應為一人。


  1. 根據「最適多數決」理論 (Optimal majority),如果把太多人湊在一起,每個人平均發言的時間就會被縮短,討論品質也會下降;因此,在這樣的會議上,要盡可能湊到相對多元的多方利害關係人,但人數又不能太多(亦即,這個過程恐怕無法真的做到「全民參與」),這樣才能有好的討論品質,也才能幫助大家在這個過程中得到相對好的結果。(https://reurl.cc/mLL65G)


2021/09/18

[閱讀筆記] HOW NOT TO BE WRONG - 第16章:肺癌令你抽菸嗎?(Does Lung Cancer Make You Smoke Cigarettes?)

 

  1.  假設婚姻與抽菸,兩者是負相關

不同說法

強調重點

說明

代表性說法

真實狀況直述句解釋相關

如果你癮君子,就不太會是已婚者

(If you’re a smoker, you’re less likely to be married)

更動說法


假設語氣解釋因果

假設你有抽菸,你就不太會是已婚者

(If you were smoking, you would be less likely to be married)


  1. 相關不蘊涵因果 (correlation does not imply causation),又稱為 相關不代表因果,是科學和統計學經常強調的重要觀念,意思是若兩個事物(統計學上會用變數代表)有明顯的相關時(即當一件事出現,另一件事也出現),不一定表示兩者之間有因果關係。例如說看到死刑判決越多,謀殺犯罪率越高,不代表兩者間有關,尤其不代表死刑導致更多謀殺,有可能是謀殺案件增加導致更多死刑判決,或其他因素同時導致更多謀殺與更多死刑判決。(https://reurl.cc/xGZD2z)

  2. 要確立一個因果關係,其實也是很困難的,因為生物學及醫學的世界太複雜,往往都會有些干擾因子(Confounding factors)去影響你。

  3. 偽因果關係的例子 (https://reurl.cc/mLndO7)

🍦🏊 冰淇淋的銷售量越高,海灘溺水的人數也越多

雪糕銷售與溺水人數表面上看似有關係,其實只不過是因為氣溫越高,越多人買雪糕,同時也越多人游泳,所以溺水的人也越多。但其實這個偽關係是由氣溫高這個「干擾因子」引起的。

🏊⚡ 泳池溺水人數與美國核電廠發電量也是高度相關

這兩者高度相關,並非代表核電廠發電會「導致」人在泳池中溺水,而是因為氣溫高,耗電量大增 → 核電廠發電量增加,去游泳的人也變多 → 泳池溺水的人也多。


  1. 確定性因果關係 (deterministic causality)

因果關係成立條件

如果要得出 X 導致 Y 的結論,下列三個條件都要成立︰

  • ① X 發生在 Y 之前

  • ② 若 X 不發生,則 Y 也不發生

  • ③ 若 X 發生,則 Y 一定發生

分析因果關係的希爾準則 (Bradford Hill's Criteria)


Hill's Criteria

說明

① 時序性

(Temporality)

若 X 導致 Y,那 X 一定發生在 Y 之前。這是 9 個準則中最重要的,若不符合時序性,因果關係可立即被否定

② 強度

(Strength)

即觀察一個事件對另一個事件的影響有多強,但如果病人用 micafungin 後,夜晚排尿由1公升減至100毫升,我們對它們兩者有因果關係的信心自然大得多。

③ 一致性

(Consistency)

即兩件事件的相關性在不同情況之下都會出現,一般在學術界中,如果越多不同的團隊做研究都得多相同的結果,我們覺得這些研究證明的因果關係的可信度是越高的。

④ 劑量反應關係

(Dose-response relation)

即接受的劑量越高,反應也應該越大。

⑤ 可逆性

(Reversibility)

將因子移除會令另一因子發生的程度減低。

⑥ 生物合理性

(Biological plausibility)

即相關是否有一個合理的解釋。如吸煙引起肺癌,我們有一個很合理的解釋,就是煙草中的致癌物質會破壞細胞的DNA,增加基因變異的機會,故引起肺癌。

⑦ 同調性

(Coherence)

沒有與現有的其他理論衝突。

⑧ 類比性

(Analogy)

將某個已知的因果關係,類比至其他相似的關係上,並依此推論其因果關係存在與否。

⑨ 特異性

(Specificity)

一個果只有一個因。因為生物學及醫學上的複雜性,一個果往往都可以又不同的原因促成,例如肝癌可以是由B型肝炎病毒、C型肝炎病毒、喝酒,甚至是發霉的花生所引起的。



  1. 想要檢定來分辨「相關」是來自「因果」,還是與「因果」無關,是一個令人感到抓狂的困難問題,即使你原本以為答案顯而易見,例如肺癌與抽菸的關係,並不單純。1947 年,英國罹患肺癌致死人數,較幾十年前增加 15 倍,當時沒人能指出確切原因,可能是工廠廢氣、汽車廢氣、未能指認出的汙染源、抽菸 (在當時抽菸的流行程度大爆發) 等。

  1. 公共政策制定者不像科學家,他們沒有權利享有不確定性,只能以現有訊息為基礎,做出最好預測並訂下決策。以抽菸導致肺癌為例,此研究結論毫無疑問,科學家與政策制定者會協同合作:科學家估算我們有多少未定數,而政策制定者在標出的不確定下,決定該採取什麼行動。

  2. 🍆 吃茄子有害健康?

假說

  • 假定我們有 75% 確信結論是對的,推動拒吃茄子使每年可以減少 1000 位美國人死亡

  • 然而,我們也有 25% 的機會得到錯誤結論,迫使茄子愛好者去吃其他不健康的食物造成每年多死 200 人的情況

期望值計算

  • 75%1000+25%(-200)=750-50=700

  • 依據期望值,不管茄子商會如何抗議,不管結論是否 100% 正確,就決定向大眾公開,政策制定者建議的期望值是每年可救 700 人。

  • 請記住:期望值並非照字面上那樣,代表我們預期會發生的值,而是當同樣決策反覆不斷執行後,期望發生的平均值。


  1. 假若公共政策制定者自我要求遵守更嚴格的證據標準,只要沒有完全確定是正確的,就拒絕發出任何建議,那麼原本可以拯救的生命就會因此喪失。但有一件事可以確定:用可能會出錯為理由來避免給予建議,會是失敗的策略

2021/09/17

[閱讀筆記] HOW NOT TO BE WRONG - 第15章:高爾頓的橢圓 (Galton’s Ellipse)

 

  1. Francis Galton 的研究已證明,只要研究的的對象受機率的力量影響,平均值迴歸就會起作用。

  2. 散佈圖 (Scatter Diagram / Scatter Plot) 

說明

是品管七大手法之一,用來分析一對參數間之關係,將成對之數據繪製在X-Y圖上,藉此找出兩者間之關係。

常見的幾種散佈圖

Francis Galton 發現身高與遺傳呈現平均值迴歸的現象

由遺傳與機率互相影響的散佈圖,具有一種絕非隨機的幾何形狀,它們看起來或多或少都被圈在一個橢圓形裡面,而中心恰好是親子都剛好是平均值的點。

散佈圖之製作

  • ① 針對想要了解兩者關係的參數﹐收集 50 ~ 100 對數據。

  • ② 繪出 x-y 軸,兩者等長較易於解讀,兩者間若有因果關係,將因至於橫軸,果置於縱軸。

  • ③ 將所收集之數據繪在圖上。

  • ④ 解讀散佈圖。

氣溫與冰淇淋銷量間的關係

可以透過 scatter plot 看出,天氣越炎熱,冰淇淋銷量越好,但關係不是非常完美:

過去 100 年間,sea level 的變化

可以透過 scatter plot 看出,sea level 逐年上升,成正相關

Reference


  1. 真實生活的數據畫出來的散佈圖,通常都會排出粗略的橢圓

2004 年 John Kerry 與 2008 年 Barack Obama 的得票率

每一個點代表一個眾議院選區,這個橢圓明顯瘦長,代表兩者得票率高度相關,這些點明顯的在對角線上,反映出 Obama 得票表現優於 Kerry 的事實 (正相關)。

Google 與 GE (General Electric) 每日股價變化狀態

兩間公司每日股價變化成正相關

SAT 平均分數與 State of North Carolina 州立大學學費間的關係

兩者關係成正相關

2004 年小布希在美國 50 個州的得票率散佈圖

較富裕且自由主義主導的康乃狄克州 (CT) 出現在右下方,共和黨居多且財力有限的愛達荷州 (ID) 出現在左上方。兩者呈現負相關,富裕州偏民主黨,非富裕州偏共和黨,橢圓呈現西北往東南走勢


  1. 《The Triumph of Mediocrity in Business》提出其研究發現,原本具領先優勢的企業,會隨著時間進展,喪失其原本優勢,雖然他們還是優於平均,但整體來說,已不再是特別傑出的一群企業。隨時間進展,企業表現趨於平庸也是平均值迴歸的一種現象,高超的管理與商業眼光固然扮演重要角色,但是運氣大概也有相等的分量

  1. 代數的好處在於容易寫下式子,並打進計算機;幾何的好處在於能把我們的物理直覺與情境連結起來,特別是當你能畫出一幅圖像時。當你有能力用幾何語言講清楚一段數學,就會感覺自己真正搞懂了。

  2. 相關係數計算

題目說明

某財務軟體公司在全國有許多代理商,為研究它的財務軟體產品的廣告投入與銷售額的關係,統計人員隨機選擇10家代理商進行觀察,搜集到年廣告投入費和月平均銷售額的數據,並編製成相關 (https://reurl.cc/xg6G24)

Scatter Plot

透過 scatter plot 可以看出,廣告費投入與銷售額兩者間呈現正相關。

計算過程

  • excel function:CORREL(年廣告費投入資料, 月均銷售額資料), 例如,CORREL(A2:A11, B2:B11)

  • 相關係數 = 0.9942

  • 相關係數 r = 0.9942 > 0.63,廣告投入費與月平均銷售額之間有高度的線性正相關關係

很可能不是碰巧發生的相關性


Sample Size

被視為具有統計顯著性的最小相關性

5

.88

10

.63

15

.51

20

.44

25

.40

30

.38

60

.26

100

.20



  1. 計算喜歡起司與喜歡起司蛋糕間的「相關係數」


  1. 計算結果只能看出是否有相關性,「不是」因果關係。例如,血液濃度的 HDL 與心肌梗塞有關,但是經過研究,服用菸鹼酸來刻意提高 HDL 濃度的受試者,得到心肌梗塞與腦中風的比例與一般人一樣。從測試結果可發現,菸鹼酸可以提高HDL 濃度,高 HDL 濃度能降低心肌梗塞與腦中風的風險,但是,這不代表菸鹼酸能降低心肌梗塞與腦中風的風險。人的身體是極為複雜的系統,我們只能量度其中極少的特徵,更不要說想擺布它。以我們觀察到的相關因素為基礎,會有非常多藥物有可能達到治療效果,但當你將其拿來逐一實驗,大部分都以失敗收場。

  1. 以下是根據 2011/12/15 公共政策民意調查所繪製的圖,圖裡有 1000 個圓點,每一個點代表每個選民,回答的 23 個民調問題,可看出此選民是偏左或偏右,支持歐巴馬、肯定民主黨的選民會偏右邊;喜歡共和黨的選民會偏左。我們會發現,當選民獲得的訊息越多,只是讓原本左右兩邊的人走向更極端,居中人口稀疏地帶更加稀疏。大體來說,未決定的選民之所以未決定,並不是因為他們不受政治教條的偏見影響,客觀且小心提衡量各個候選人的優缺點,而是他們幾乎沒在注意這件事

  1. 數學工具就跟其他科學工具一樣,能偵測到某類現象,卻不能偵測別類現象,正如你的相機沒有能力偵測到伽瑪射線 (或γ射線)。當你知道自然界或社會裡的兩種現象不相關,請把這件事放在心上:這並不意味著兩者毫無關係,只是不存在「相關」的原始設計中,所以無法偵測到那類關係。