Total Pageviews

2022/07/05

[閱讀筆記] The Math of Life and Death - ㊃ 不要相信真相:揭露媒體的數據假像 (Don't Believe the Truth: Debunking Media Statistics)

 

  1. 在這個假新聞盛行的時代,很難知道能相信誰。雖然很多人不相信,但是大多數的主流媒體仍維持著以事實為根據。然而,許多媒體所報導的「事實」卻仍有不同,問題就在於觀點的偏頗。例如,2017 年 Donald Trump 的稅改法案,不同的新聞台記者,給予不同的報導內容

新聞台

記者

報導內容

Fox

Ed Henry

重大勝利、總統迫切需要一場勝仗

MSNBC

Lawrence O’Donnell

將投票支持該法案的共和黨參議員稱為「我在國會見過最醜陋的豬」

CNN

Jake Tapper

史上國會通過的重大法案中,是否曾出現這種為獲得大眾支持的先例?


  1. 用刻意「遺漏」的手法,忽略其他數據,就能創造出完全扭曲的報導。有時候,研究本身不可靠,可能是樣本數太少、樣本不具代表性或帶有偏見,用了誘導性提問,又或選擇性報告 (selective reporting),都可能導致統計數據不可靠。

  2. 刻意將統計數據從脈絡中撥離,也是常見的愚弄手法。例如,某個疾病的案例增加 300%,但並未告訴你是從 1 名增加為 4 名,或是從 50 萬名變成 200 萬名,情境脈絡就是有這麼大的影響力。

  1. 生日問題 (birthday problem):一群人中,至少有兩個人生日相同機率有多高?雖然還要視人數多少而定,但這機率卻出乎意料地高。只要人數在 23 人以上,就有高於 50% 的機率。《Statistics Hacks

假設

  • 假設生日在人口中是均勻分布相同的 (uniformly distributed),表示一年中每一天出生的人數大致相同。

  • 雖然有四年一次的閏年發生,但是 2/29 出生的人很少,可忽略。

全機率法則 (Law of Total Probability)

此問題有兩個互斥 (mutually exclusive) 的可能結果:

  1. 至少有兩個人的生日相同

  2. 沒有人的生日相同


有時候,判斷一件事情不發生的機率,會比較容易。你可以發現,當群組大小增加越多,相同生日的機率快速上升:

  • 假設只有兩個人,兩位生日都不相同的機率是:364365=0.997,相同機率 = 1-0.997=0.003

  • 人數增加到三人,不相同機率:364365363365=0.992,相同機率=1-0.992=0.008 (機率增加 2.7 倍)

  • 人數增加到 10 人,不相同機率=364365363365362365361365360365359365358365357365356365355365=0.883,相同機率 = 1-0.883=0.117 (機率增加 39 倍)

  • 人數增加到 23 個人,不相同機率是 0.462,相同機率高達 0.538 (你的勝率大概一半)

  • 人數增加到 30 個人,不相同機率是 0.3,相同機率高達 0.7 (你的勝率高達七成!)

  • 人數增加到 50 個人,不相同機率是 0.03,相同機率高達 0.97 (你的勝率高達 97%!)


  1. 下次你去酒吧,可以用上述生日問題,來跟你朋友打賭,看能否找到兩個生日在同一天的人。在某場與朋友的聚會,我觀察當時共有 40 個顧客,經過上述的計算,我的勝率高達 89.12%,最終順利喝到免費啤酒。

  1. 恐攻新聞:2017/5/22 曼徹斯特發生恐攻,新聞報導這是因為 2013/5/22 也發生恐攻,這是經過精心策畫的恐攻計畫。

運用「生日問題」來破解上述恐攻新聞的論述

  • 從 2013 年 4 月到 2018 年 4 月這五年間,伊斯蘭恐怖攻擊分別對西方國家發動 39 次恐攻,如果所有事件都是隨機在一年當中任何一天發動攻擊。

  • 在這 39 次恐攻的期間,根據生日問題的算法,高達 87.82% 的機率會發生在同一天。要是這 39 次都發生在不同日期時,才要感到驚訝。


  1. Small sample fluctuation:廣告常會用百分比來展現使用前後效果,因為其樣本數很小,所以他會告訴你使用後 82% 有效,但是不會告訴你 樣本只有 34 個,其中 34 人中,有 28 個人有效,以免被發現樣本數少的令人尷尬。

  2. 發表偏差 (publication bias) 或稱為抽屜問題 (file drawer problem):是指使用統計顯著性作為發表與否的門檻,可能會大幅扭曲某些假設獲得的證據。投資人跟科學家一樣,只看到因巧合而成功的那次就信以為真,但是卻忽視為數眾多的失敗案例 (ex. 沒有通過檢定的案例就收進抽屜)。《how Not To Be Wrong:The Power of Mathematical Thinking

  3. 確認偏誤 (Confirmation bias) :是心理學上的一種現象,簡單的說,就是人們都會傾向於尋找能支持自己理論或假設的證據,忽略不能支持自己理論或假設的證據。這種選擇性的擷取資訊來強化自己理論或假設的現象,幾乎在每個人身上都看得到,但能意識到的人卻很稀少,更不要說能去盡力避免了。《Antifragile: Things That Gain from Disorder

  4. 小樣本是否告訴能告訴我們很多資訊,取決於我們如何做抽樣,所做的抽樣是否能代表全部母體,這就是所謂的統計顯著性 (statistical significance)。統計顯著性告訴我們所見是否為事實,而不是偶然發生的。《Standard Deviations: Flawed Assumptions, Tortured Data, and Other Ways to Lie with Statistics

  5. 政治民調從業人員發現,必須更了解統計知識,才能得到準確結果;但政客卻發現,如果能更理解統計上的操控、挪用與舞弊,就能做盡壞事卻不受懲罰。

  6. 👮 🚶🏿‍♂️ 當「黑人的命也是命」(Black Lives Matter)」活動風起雲湧時,許多人主張警察遇到黑人嫌犯會直接開槍,而非逮捕。但是,根據統計數據顯示,美國黑人面對最大的危險,其實是其他黑人。

  1. 絕對風險 vs 相對風險

🥓 太陽報宣稱,有吃培根的人,增加 20% 機率罹患大腸癌

  • 太陽報宣稱的是相對風險 (A 組與 B 組比較):(6 - 5) / 5 = 0.2

  • 絕對風險:在暴露或為暴露於特定風險因素的情況下 (ex. 吃或不吃培根),出現某種預期結果 (ex. 大腸癌) 的人口比例,例如,每天食用 50g 的加工肉品,會讓罹患大腸癌的絕對風險從 5% 提升到 6%。


  1. 如果是一篇刻意危言聳聽的文章,你就會發現文章裡不會提到絕對風險。絕對風險通常只會是兩個小數字:一個是罹患該疾病或使用某療法的族群,另一個代表的是其他人口。如果你想找出標題背後的真相,可以做後續追蹤調查,看有沒有媒體提供絕對數據。

  2. 絕對風險 vs. 相對風險 (https://reurl.cc/yeqrDy)

絕對風險 

  • 指的是某件事發生的機率,無論是被閃電擊中、感染疾病或彩票中獎。 它可以表示您一天、一年或一生中的風險。

  • 例如,在美國,每 77 次車禍中就有一次是致命的。 因此,如果發生車禍,屬於致命車禍的絕對風險是 1/77 或 1.3%。 它一般不表示發生車禍的風險,而僅表示您遇到致命車禍的風險。

相對風險

  • 是一種比較兩種不同條件下的風險的方法。 它可以是從事不同活動的兩組人之間的比較,也可以是兩種不同條件下某件事風險的比較。

  •  研究發現,與在良好天氣開車相比,發生致命車禍的風險會隨著降雨量的增加而增加。 下毛毛雨時發生致命車禍的風險增加了 27%,即相對風險增加了 27%。 下大雨時發生致命車禍的風險是好天氣下的兩倍半,因此相對風險為 250%。


  1. 決策者會因資訊採採正面或反面的說法,而導致決策者做出南轅北轍的決定,這是因為你只用 System 1 來思考做決策,完全沒用到 System 2。《Thinking, Fast and Slow

  1. Fourfold pattern 《Thinking, Fast and Slow


Gains

Losses

可能性

【確定性效應(Certainty effect)】

 若面臨 95% 的機會來贏得 $10,000 的賭局,人們若有較大的機會去得到大額的回報,其會因為害怕失望而傾向風險趨避 (risk averse),人們願意接受確定期望值較低的回報 (sure gain)。

面臨 95% 的機會損失 $10,000,內心雖然是希望避免損失,但是心態卻是尋求風險 (risk seeking)落在此類別的通常都是有著不幸遭遇的人,其面臨的都是不利的選擇,卻接受擁有很高的失敗機率的選擇,冀望有微小的機會來避免巨大的損失

可能性

【可能性效應(Possibility Effect)】

 若面臨只有 1% 的機率贏得樂透頭獎,人們會因為頭獎的獎金非常誘人,而不管其極低的機率而購買,因為沒有買樂透就沒有贏得頭獎的機會,儘管其機率非常低。此時人們就會因為希望獲得頭獎,態度轉變成風險追求 (risk seeking),反而會拒絕其他期望值較高的選項。

【可能性效應(Possibility Effect)】

若面臨可能有 5% 的機會損失 $10,000,人們卻因為害怕鉅額損失而傾向風險規避 (risk averse),如人們常願意購買超過期望值的保險,深怕因為一些罕見意外或疾病造成自身損失,這也是保險公司的獲利之道。人們常購買過多的保險來預防罕見疾病,其實只是為了消除心中的憂慮,購買內心的平靜


  1. 只要測試結果與機率有關,就會受到回歸均值 (regression to the mean) 的影響。例如,真實的考試中,成績當然和熟練程度有關,但也帶點運氣的成分,要看你的事前複習是否剛好猜到考題。運氣成分在選擇題考試特別明顯,就算學生完全沒有相關知識,也能猜對答案

  2. 回歸是雙向的,因為它僅僅反映了「隨機波動」。身高很高的父母,通常子女會矮一點;身高很高的子女,通常父母會矮一些。這種現象不限於身高,回歸均值存在於無法靠觀測準確反映的任何遺傳特性中,包含身高、體重、智力、足部尺碼、頭髮密度等。異常的父母通常擁有不太正常的子女,異常的孩子通常擁有不太異常的父母。《Standard Deviations: Flawed Assumptions, Tortured Data, and Other Ways to Lie with Statistics

  3. 當學術能力和運動能力等特點得不到完美測量時,觀測到的表現差異會誇大實際能力差異。表現最優秀的人與平均水準的距離,很可能不像看上去那樣遙遠,表現最糟的人也是如此。因此,他們隨後表現將回歸均值。回歸均值也不是意味能力像均值收斂、大家很快會有平均水準,它只意味著,極端表現在經歷好運和壞運的群體間輪換。回歸均值也不代表成功和不成功的公司會走向令人沮喪的平庸。《Standard Deviations: Flawed Assumptions, Tortured Data, and Other Ways to Lie with Statistics

  4. 如果你不喜歡在某個重要的高風險考試上得到的分數,你該再考一次嗎?《Standard Deviations: Flawed Assumptions, Tortured Data, and Other Ways to Lie with Statistics

均值迴歸 (regression toward the mean) 的現象

① 第一次得到最低分的人,第二次得到的分數會變高

② 第一次得到最高分的人,第二次得到的分數會變低

重考的決策準則

說明

① 你的分數

  • 你的分數 < mean,你第二次有很高的機率會得到較高的分數。再試一次,這次你的研讀時間也可能不用花那麼多。

  • 如果你的分數 > mean,只是沒有達到你想要的理想分數,不值得再花時間與精力去考第二次。

② 測驗可靠度

  • 當測驗可靠度 (reliability) 越高,代表機率在決定分數上所扮演的角色就越小

  • 大多數的標準化測驗都會公佈他們的可靠度水平,我們可以將測驗直插入到測量的標準誤 (standard error) 方程式中,大致了解同一個人從測驗到再次測驗之間可能的分數變動。Standard Error=Standard Deviation1-Reliability


  1. 雙盲測試 (double-blind test) 是公認的臨床試驗的黃金標準做法,若採用雙盲隨機對照試驗,對照組與治療組兩個病況改善的差異,就可以歸因於療法本身,排除回歸均值效應、安慰劑效應 (placebo effect)。

  2. 常見臨床試驗法 (Ref: https://reurl.cc/kVWmDL )

單盲

雙盲

三盲

對於研究對象的分組及所施加的處理因素(如選用藥物)情況,只有研究者知道,而受試對象不知道

受試對象和試驗執行者(干預措施執行者及結果測量者) 雙方均不知分組情況,不知道試者接受的是哪一種干預措施

受試對象、試驗執行者和資料分析與報告者三方均不知道受試者接受的是哪一種干預措施,全部採用編號密封

方法簡單,容易進行

臨床試驗最常採用的一種盲法形式,可以有效避免受試對象和試驗執行者主觀的偏倚因素對試驗結果的影響

可以使偏倚減到最小的程度

單盲不能避免研究方主觀因素造成的影響。主管醫生可能通過許多方法去影響患者的療效, 比如,醫生對接受新療法的患者觀察特別仔細,護士對新療法組患者更加關心和熱情,這些都可能影響或暗示受試對象產生不同的反應。

有特殊副作用的藥物容易被破盲;雙盲試驗不適用於危重患者

儘管三盲試驗是減少偏倚最有效的方法,但在實際工作中使用並不普遍。在許多臨床研究中,醫師既是試驗設計者與觀察者,也是資料分析和結果評價者,很難真正做到三盲


  1. 判斷統計數否遭操弄的檢查表

#

問題

1

是否願意提供背景變數與資料來源

2

是否提供調查的樣本數、提問內容、抽樣族群

3

是否採用不相等的表達、百分比,用的是相對數據而非絕對數據

4

是否有實驗組與對照組的試驗研究

5

如果本來就屬於極端值的統計數據,突然上升或下降,就要注意是否有回歸均值的狀況


  1. 只要發現某個統計數據沒頭沒腦的出現,就跟自問:①「比較對象是什麼?」、②「動機是什麼?」及 ③「這是完整事實嗎?」只要找出這三個問題的答案,已經能讓你在判斷數據是否真實的道路上邁進一大步。光是找到這三個問題的答案,就足以說明許多事。

  2. Darrell Huff 在 《How to Lie with Statistics》(別讓統計數字騙了你) 提到:「統計雖然擁有數學的基礎,但統計學的藝術成分並不少於科學成分。」到頭來,我們有多麼相信自己所碰上的統計數據,取決於那位藝術家所畫出的圖像有多完整。

  3. 《How to Lie with Statistics》提出的例子 https://reurl.cc/gzd3V4 

慎選樣本

  • 《時代雜誌》1950年代在評論紐約《太陽報》某項報導時,曾寫到「1924 年畢業的耶魯大學畢業生,平均年薪為 25,111 美元。」

  • 當時一般人平均年收入低於 10,000美元,兩者之間的平均年收入有兩倍以上的差距,代表只要考上耶魯,就是高薪保證。

  • 《時代雜誌》並沒有註明其調查的母體是哪些人,由於畢業了25年,光是要取得聯絡地址就十分的困難,其中較容易取到的不外乎是飛黃騰達的一群,而舉凡是較為落魄的一群,就幾乎取不到聯絡地址

選擇性平均

  • A公司為了能吸引更多的員工,便說自家公司的平均年薪是 20,000 美元,許多人聽到後便會想要到A公司上班,但其實在A公司中,許多人的年薪都不到 8,000 美元

  • 有時,平均數反而不是一個呈現整體狀況的好方法,特別是在有極端值的狀況,此時,如果不用中位數或是種數來呈現整體狀況,將有可能出現幾乎每個人都低於平均的狀況,如果使用中位數或眾數,提供的訊息會比使用平均數要好得多了。

刻意隱藏的小數字

  • 奧克拉荷馬市在 1890 ~ 1952 年的平均溫度為60.2℉。”此溫度相當於15.76 ℃,或許有些人會認為還滿涼爽的,但在此數據背後的事實是最高溫為113℉ (45℃),最低溫為 -17℉ (-27.22℃)。

  • 不如直接把最低、最高溫都寫出來,這樣反而比較清楚。

誇張的圖表

  • 因為圖片長度、寬度不同,進而影響到閱讀者的視覺感受,同時也讓閱讀者產生出不同的想法

似相關而非相關的數字

  • 在美西戰爭當中,海軍的死亡率是9%,而在同一時期中,紐約市的老百姓的死亡率則是16%,負責招募新兵的人後來就用這些數字來「證明」,加入海軍比不加入要安全。

  • 但這不全然是對的,因為海軍是由健康良好的人民組成的,老百姓裡卻包括嬰兒、老年人和病人,而這些人的死亡率較高,所以海軍的死亡率當然較低,所以這兩群人根本不能比較。

錯誤因果結論

  • 身高越高的人比身高越矮的人重,在大部分的時候,此關聯成立,但是也是可以找到身高 165 卻比身高 175 的重,所以我們可以說身高和體重之間有一定程度的正相關,在這一部分我們得到了一個結論:只要樣本小一點,你就有可能在你想像得到的任何兩種特質或事件之間,找到相當程度的關聯,既使一項關聯確實存在,而且也的確由因果關係造成,但是對單獨個案來說,這個關聯還是可能會完全不適用;當數字與結論放在一起時,不代表數字就可以支持這個結論,所以我們一定不能讓統計及數字攪亂了因果關係。

統計操控

  • 某年的投資金額的利潤從 3% 上升到 6%,可以說是上升3個百分點,也可說是上升100%。

  • 小數點和百分比能讓不確定的數字看起來精確,而任何根據稀少案例所計算出來的百分比,誤導的機會都不小,不如直接把原始數字寫出來,這樣反而比較清楚

2022/07/04

[閱讀筆記] The Math of Life and Death - ㊂ 數學法則:瞭解數學對法律的重要性 (The Laws of Mathematics: Investigating the Role of Mathematics in the Laws)

 

  1. 如果用數學形式呈現一種確定性假象 (illusion of certainty),原本心存懷疑的人,忽然間都欣然接受。

  2. 許多民主國家的法庭都遵循「無罪推定」原則:承擔舉證責任的是原告,而非被告。幾乎所有國家都放棄「有罪推定」的做法,原因在於「有罪推定」必然會造成偽陽性增加 (無罪變有罪)、偽陰性減少 (有罪變無罪) 的狀況

無罪推定

有罪推定


  1. 👮 在現代國家中,日本刑事司法系統是明顯的例外,日本是偏向有罪推定,定罪率高達 99%,當中有絕大部分是以自白認罪為基礎。日本高定罪率的原因:

  1. 日本警方無須起訴就可將嫌犯拘留三天,偵訊過程無須律師在場,也無須留下紀錄;

  2. 警方會於居留期間施壓,希望在取得具體證據前,就獲得自白供詞;

  3. 日本嫌犯為了避免審判過程過於高調而讓家族蒙羞,常會做出虛假自白 (false confession)。


  1. 聯合國在《世界人權宣言》裡,將無罪推定列為國際人權。18 世紀的英國法官暨政治家 William Blackstone 曾說:「就算讓十個有罪的人逃脫,也勝過讓一個無辜的人受苦。」此觀點讓我們站穩偽陰性的立場,只要我們無法證明嫌犯有罪,就可能獲判無罪;而且,就算確實有證據證明被告有罪,還需說服陪審團或法官、排除合理懷疑,否則被告就會揚長而去。

  2. 在蘇格蘭的法庭裡,還有第三種判決,就算是名義上,但足以降低偽陰性比例:如果陪審團或法官無法充分相信被告無辜,不應判無罪,而是判為「犯罪未經證實」(not proven)

  1. 相依事件 (dependent event) 與獨立事件 (independent event)

相依事件 (dependent event)

獨立事件 (independent event)

其中一項機率會影響另一項的機率,例如,👶 男嬰猝死機率是女嬰的兩倍,因此性別與猝死兩者具有相依性

兩件事情發生的機率互不相干,例如,🎲 骰子沒有記憶,也不關心未來,每次擲骰都是獨立事件。

【獨立事件】計算既是女性、智商又 > 110 的機率

  • 性別不影響智商:男女機率是 1/2,智商超過 110 的機率是 1/4;智商與性別兩者是獨立事件,智商高低與性別無關。

  • 因為你感興趣的是數個連續事件是否全部 (all) 會發生,所以會用「乘法原則」,機率 = (500/1000) * (250/1000) = 1/2 * 1/4 = 1/8。

【相依事件】既是女性又有自閉症的機率

  • 性別會影響自閉症發生機率:男性有自閉者的機率是 8/500,女性則為 2/500,顯示男性發生機率是女性的四倍;

  • 患有自閉症患者中,女性只有 2/10 = ⅕;

  • 既是女性又有自閉症的機率 = 2/1000。


  1. 當你在玩 21 點 (blackjack) 時,是否曾經連續拿了很多手壞牌,使得你增加賭注,認為情勢隨時可能改變,你就陷入賭徒謬誤 (Gambler’s Fallacy),以為連續拿了好幾次壞牌,拿到好牌的機率會增加套用到純粹機率的遊戲上時,會是一連串「獨立事件」,事件間彼此毫無關係,每個個別的結果都與它之前的結果無關,這個事實經常被總結為「骰子沒有記憶」。《Statistics Hacks

  2. 總體本來就包含各形各色的人,一旦我們思考不夠仔細,就假設某個統計數據可以代表當中所有個體,發生以全概偏、刻板印象,就犯了生態謬誤 / 區群謬誤 (ecological fallacy)

  3. 根據英國 2010 的資料數據顯示:女性平均壽命 83 歲,男性平均壽命 79 歲,總人口平均壽命 81 歲。根據此數據,你可能就會產生「區群謬誤 (ecological fallacy)」,誤以為從街頭隨機挑一位女性,她的壽命一定會高於隨機挑選的男性,這又稱為簡化推論 / 籠統概化 (sweeping generalization)由於極端值會影響算數平均數,這樣會讓平均壽命的算術平均數遠低於中位數。英國男性死亡年齡的中位數是 82 歲,這代表有一半的男性會活到 82 歲以後

  1. 簡化推論 / 籠統概化 (sweeping generalization) 例子 (https://reurl.cc/l5KK76)

例子

解說

超速是不對的,所以救護車不應該超速。

救人優先,救護車可以不受到速限控制,因此這是謬誤。

鳥會飛,駝鳥是鳥,所以駝鳥會飛。

在演化的過程中,有些鳥類放棄了飛行能力,「鳥會飛」只是通常的狀況,並非絕無例外的鐵律,因此這是謬誤。

人類族群有傳統的神祉和神話傳說

皮拉罕人沒有傳統的神祉和神話傳說

______________________________

∴皮拉罕人不是人類

如果單單因為皮拉罕人沒有傳統的神祉和神話傳說,就否定皮拉罕人是人類,就是犯了此項謬誤。


  1. 五的規則 (Rule of Five):任何從母體中隨機抽取的五個樣本,母體的中位數有 93.75% 的機會,會落在這五個樣本中最大和最小數值之間。假設你要考量公司是否要增加遠距辦公的機會,因此要考量每名員工平均花在通勤的時間,所謂五的規則就是你隨機選五名員工,假設你得到的數值是 30, 60, 45, 80, 60 分鐘,最高與最低分別為 30 與 80,此是全體員工的母體中位數有 93.75% 的機會,會落在這兩個數字之間。雖然樣本數很小,範圍可能很大,但是若能比你先前的範圍大幅縮小,那它作為一項衡量就很有價值。《How to Measure Anything: Finding the Value of Intangibles in Business

  1. 辛普森悖論 (Simpson’s paradox)

辛普森悖論說明

  • 班傑明·狄斯累利 (Benjamin Disraeli) 是十九世紀的英國文學家、政治家,曾經兩次擔任英國首相,他認為:「世上有三種謊言,就是:謊言,天大的謊言,與統計數字。」

  • Simpson's paradox (辛普森詭論) 提出一個論點,「即使分組比較都佔優勢的一方,也會在總評中是居於劣勢的一方。

  • 發現干擾因素不是件容易的事情,我們應當留意是否存在可能改變結論的干擾因素。《Standard Deviations: Flawed Assumptions, Tortured Data, and Other Ways to Lie with Statistics

男女並無平均分配至實驗組與對照組:看似藥物能有效改善病情

若將男女拆開來看,並檢視改善率:安慰劑的效果似乎勝出,尤其女性更是如此【發現性別是干擾因素

若將男女等量分配至實驗組與對照組:藥物的效力輸給安慰劑

當控制性別此「混淆變數」後,可以再度證明藥物的效力輸給安慰劑


  1. 更多辛普森悖論的例子 《Standard Deviations: Flawed Assumptions, Tortured Data, and Other Ways to Lie with Statistics

Examples

說明

✈️ 阿拉斯加航空公司擁有優於另一家航空公司準點飛行紀錄,整體卻不如競爭對手

⛈️ 阿拉斯加航空公司擁有許多飛往 Seattle 的航班,常因當地天氣問題導致班機延誤。

👵 瑞典女性死亡率低於哥斯大黎加,但瑞典擁有較高的女性整體死亡率

因瑞典擁有更多的老年女性,老年人擁有較高的死亡率。

🏥 一項醫療手術對小型與大型腎結石的治療成功率,皆高於另一種術式,但整體成功率卻低於另一種術式

因為此一醫療手術常被用於治療大型腎結石,大型腎結石的成功率本來就較低。


  1. 檢察官謬誤 (prosecutor's fallacy):係取一不甚相關、或有關但未正確考慮條件機率的數據,認定被告「無辜的機率」很小。(https://reurl.cc/1oRWAm)

例子

破解檢察官謬誤

小明買一張樂透彩券,很幸運地中了頭彩。結果他被檢察官約談,理由是被懷疑收買內部員工。檢察官的論據是,大樂透頭彩的中獎機率只有約一千四百萬分之一,所以小明只有一千四百萬分之一的機率是無辜的。

大樂透中獎機率與小明無辜機率無關

某市發生一起兇殺案,現場證據不多,但死者掙扎時疑似抓到了來自兇手身上的皮膚,實驗室鑑定結果發現小明與之相符,於是小明被起訴。檢察官說,這種檢驗平均每1000人只會有一人符合,因此小明有罪的機率是999/1000。

正確的計算方法要使用貝氏定理。小明有罪的先驗機率若為P,則小明確實有罪的機率為 (0.999*P)/(0.999*P+0.001*(1-P)) ,而P 值是變動的,端視對小明不利的證據而定。假定對小明不利的唯一證據是小明住在案發城市,而該市人口為1,000,000,則 P 為 1/1,000,000,代入上式可知小明確實有罪的機率低於1/1000。

在某犯罪現場發現犯人血跡,此血型僅有 10% 的人擁有,剛好嫌疑人擁有此血型。所以,現場抓到的嫌疑犯且具此血型的人,無辜的可能性只有 10%。

倫敦人口有 1000 萬,擁有此血型約佔 100 萬人 (1000 萬 * 0.1),因此此嫌疑犯是犯人的機率是百萬分之一。


  1. 👮 案發地點發現嫌犯精液 DNA,DNA 圖譜相符機率是 1/300萬,因此被逮獲嫌犯有罪機率近乎百分百;最後檢察官發現搞錯了,要找到其他人DNA 圖譜相符機率高達 1/2500,被逮獲嫌犯的有罪機率大幅下降至 1/1200。

DNA 圖譜相符機率是 1/300萬,嫌犯有罪機率近乎百分百

DNA 圖譜相符機率是 1/2500,嫌犯有罪機率大幅下降至 1/1200


  1. 把不可靠的檢測做兩次,結果還是會比做一次來得好Math on Trial: How Numbers Get Used and Abused in the Courtroom》(https://reurl.cc/439z7L, https://reurl.cc/YjzaN0)

前提

  • 🎲 公正骰子擲出 6 點的機率是 1/6;

  • 灌鉛的骰子擲出 6 點的機率是 ½

機率運算

  • 【公正骰子】骰 10 次並骰出 6次 6點的機率 :C610(16)6(56)4=10!4! 6!(16)6(56)4=0.00217

  • 【灌鉛骰子】骰 10 次並骰出 6次 6點的機率 :C610(12)6(12)4=10!4! 6!(12)6(12)4=0.20508

  • 可能是灌鉛骰子的機率 = 0.20508 / (0.00217+0.20508) = 0.9895

實驗兩次的結果


  1. 科學上在做系統性文獻回顧 (systematic review) 時,也常採用上述方式。例如,醫學領域的系統性文獻回顧就是如此,雖然過去已經做過多次獨立試驗,但個別的受試者人數不足以為特定療法的療效下定論,系統性文獻回顧會將多項獨立試驗的結果結合起來下判斷。經過結合,在療法的療效或其他事項上,常常能得到在統計上具顯著性的結論。

  2. 系統性回顧可以用大量資料的統計,協助釐清少量文獻可能的偏差。例如諾貝爾獎得主的生物化學家 Linus Pauling 認為維他命 C 可以幫助我們活的更久,而且感覺較好並且預防感冒(Pauling, 1986)。但是之後 Paul Knipschild 做了文獻回顧發現,其實只有一、二個臨床試驗強烈建議維他命 C 可以預防感冒,但是有更多的文獻顯示,維他命 C 並沒有如 Pauling 所描述的好處(Knipschild, 1994)。

  3. 我們一旦過度沉迷於某個奇妙的數學論證、複雜的運算、又或是叫人印象深刻的數字,就常常會忘了問最重要的問題:這項計算用在這裡,到底對不對?

  4. 只要有人能夠從操控數字中得到利益,我們就該對數字抱持懷疑,要求得到更多解釋;任何人只要對自己的數字真實性有信心,就該樂於提供解釋

  5. 現代開始出現愈來愈多可量化的證據形式,於是數學論證在現代司法系統也扮演更形重要的角色;但如果落入壞人手中,數學也能用來妨礙正義,使無辜民眾失去生計、失去生命。