Total Pageviews

2022/07/04

[閱讀筆記] The Math of Life and Death - ㊂ 數學法則:瞭解數學對法律的重要性 (The Laws of Mathematics: Investigating the Role of Mathematics in the Laws)

 

  1. 如果用數學形式呈現一種確定性假象 (illusion of certainty),原本心存懷疑的人,忽然間都欣然接受。

  2. 許多民主國家的法庭都遵循「無罪推定」原則:承擔舉證責任的是原告,而非被告。幾乎所有國家都放棄「有罪推定」的做法,原因在於「有罪推定」必然會造成偽陽性增加 (無罪變有罪)、偽陰性減少 (有罪變無罪) 的狀況

無罪推定

有罪推定


  1. 👮 在現代國家中,日本刑事司法系統是明顯的例外,日本是偏向有罪推定,定罪率高達 99%,當中有絕大部分是以自白認罪為基礎。日本高定罪率的原因:

  1. 日本警方無須起訴就可將嫌犯拘留三天,偵訊過程無須律師在場,也無須留下紀錄;

  2. 警方會於居留期間施壓,希望在取得具體證據前,就獲得自白供詞;

  3. 日本嫌犯為了避免審判過程過於高調而讓家族蒙羞,常會做出虛假自白 (false confession)。


  1. 聯合國在《世界人權宣言》裡,將無罪推定列為國際人權。18 世紀的英國法官暨政治家 William Blackstone 曾說:「就算讓十個有罪的人逃脫,也勝過讓一個無辜的人受苦。」此觀點讓我們站穩偽陰性的立場,只要我們無法證明嫌犯有罪,就可能獲判無罪;而且,就算確實有證據證明被告有罪,還需說服陪審團或法官、排除合理懷疑,否則被告就會揚長而去。

  2. 在蘇格蘭的法庭裡,還有第三種判決,就算是名義上,但足以降低偽陰性比例:如果陪審團或法官無法充分相信被告無辜,不應判無罪,而是判為「犯罪未經證實」(not proven)

  1. 相依事件 (dependent event) 與獨立事件 (independent event)

相依事件 (dependent event)

獨立事件 (independent event)

其中一項機率會影響另一項的機率,例如,👶 男嬰猝死機率是女嬰的兩倍,因此性別與猝死兩者具有相依性

兩件事情發生的機率互不相干,例如,🎲 骰子沒有記憶,也不關心未來,每次擲骰都是獨立事件。

【獨立事件】計算既是女性、智商又 > 110 的機率

  • 性別不影響智商:男女機率是 1/2,智商超過 110 的機率是 1/4;智商與性別兩者是獨立事件,智商高低與性別無關。

  • 因為你感興趣的是數個連續事件是否全部 (all) 會發生,所以會用「乘法原則」,機率 = (500/1000) * (250/1000) = 1/2 * 1/4 = 1/8。

【相依事件】既是女性又有自閉症的機率

  • 性別會影響自閉症發生機率:男性有自閉者的機率是 8/500,女性則為 2/500,顯示男性發生機率是女性的四倍;

  • 患有自閉症患者中,女性只有 2/10 = ⅕;

  • 既是女性又有自閉症的機率 = 2/1000。


  1. 當你在玩 21 點 (blackjack) 時,是否曾經連續拿了很多手壞牌,使得你增加賭注,認為情勢隨時可能改變,你就陷入賭徒謬誤 (Gambler’s Fallacy),以為連續拿了好幾次壞牌,拿到好牌的機率會增加套用到純粹機率的遊戲上時,會是一連串「獨立事件」,事件間彼此毫無關係,每個個別的結果都與它之前的結果無關,這個事實經常被總結為「骰子沒有記憶」。《Statistics Hacks

  2. 總體本來就包含各形各色的人,一旦我們思考不夠仔細,就假設某個統計數據可以代表當中所有個體,發生以全概偏、刻板印象,就犯了生態謬誤 / 區群謬誤 (ecological fallacy)

  3. 根據英國 2010 的資料數據顯示:女性平均壽命 83 歲,男性平均壽命 79 歲,總人口平均壽命 81 歲。根據此數據,你可能就會產生「區群謬誤 (ecological fallacy)」,誤以為從街頭隨機挑一位女性,她的壽命一定會高於隨機挑選的男性,這又稱為簡化推論 / 籠統概化 (sweeping generalization)由於極端值會影響算數平均數,這樣會讓平均壽命的算術平均數遠低於中位數。英國男性死亡年齡的中位數是 82 歲,這代表有一半的男性會活到 82 歲以後

  1. 簡化推論 / 籠統概化 (sweeping generalization) 例子 (https://reurl.cc/l5KK76)

例子

解說

超速是不對的,所以救護車不應該超速。

救人優先,救護車可以不受到速限控制,因此這是謬誤。

鳥會飛,駝鳥是鳥,所以駝鳥會飛。

在演化的過程中,有些鳥類放棄了飛行能力,「鳥會飛」只是通常的狀況,並非絕無例外的鐵律,因此這是謬誤。

人類族群有傳統的神祉和神話傳說

皮拉罕人沒有傳統的神祉和神話傳說

______________________________

∴皮拉罕人不是人類

如果單單因為皮拉罕人沒有傳統的神祉和神話傳說,就否定皮拉罕人是人類,就是犯了此項謬誤。


  1. 五的規則 (Rule of Five):任何從母體中隨機抽取的五個樣本,母體的中位數有 93.75% 的機會,會落在這五個樣本中最大和最小數值之間。假設你要考量公司是否要增加遠距辦公的機會,因此要考量每名員工平均花在通勤的時間,所謂五的規則就是你隨機選五名員工,假設你得到的數值是 30, 60, 45, 80, 60 分鐘,最高與最低分別為 30 與 80,此是全體員工的母體中位數有 93.75% 的機會,會落在這兩個數字之間。雖然樣本數很小,範圍可能很大,但是若能比你先前的範圍大幅縮小,那它作為一項衡量就很有價值。《How to Measure Anything: Finding the Value of Intangibles in Business

  1. 辛普森悖論 (Simpson’s paradox)

辛普森悖論說明

  • 班傑明·狄斯累利 (Benjamin Disraeli) 是十九世紀的英國文學家、政治家,曾經兩次擔任英國首相,他認為:「世上有三種謊言,就是:謊言,天大的謊言,與統計數字。」

  • Simpson's paradox (辛普森詭論) 提出一個論點,「即使分組比較都佔優勢的一方,也會在總評中是居於劣勢的一方。

  • 發現干擾因素不是件容易的事情,我們應當留意是否存在可能改變結論的干擾因素。《Standard Deviations: Flawed Assumptions, Tortured Data, and Other Ways to Lie with Statistics

男女並無平均分配至實驗組與對照組:看似藥物能有效改善病情

若將男女拆開來看,並檢視改善率:安慰劑的效果似乎勝出,尤其女性更是如此【發現性別是干擾因素

若將男女等量分配至實驗組與對照組:藥物的效力輸給安慰劑

當控制性別此「混淆變數」後,可以再度證明藥物的效力輸給安慰劑


  1. 更多辛普森悖論的例子 《Standard Deviations: Flawed Assumptions, Tortured Data, and Other Ways to Lie with Statistics

Examples

說明

✈️ 阿拉斯加航空公司擁有優於另一家航空公司準點飛行紀錄,整體卻不如競爭對手

⛈️ 阿拉斯加航空公司擁有許多飛往 Seattle 的航班,常因當地天氣問題導致班機延誤。

👵 瑞典女性死亡率低於哥斯大黎加,但瑞典擁有較高的女性整體死亡率

因瑞典擁有更多的老年女性,老年人擁有較高的死亡率。

🏥 一項醫療手術對小型與大型腎結石的治療成功率,皆高於另一種術式,但整體成功率卻低於另一種術式

因為此一醫療手術常被用於治療大型腎結石,大型腎結石的成功率本來就較低。


  1. 檢察官謬誤 (prosecutor's fallacy):係取一不甚相關、或有關但未正確考慮條件機率的數據,認定被告「無辜的機率」很小。(https://reurl.cc/1oRWAm)

例子

破解檢察官謬誤

小明買一張樂透彩券,很幸運地中了頭彩。結果他被檢察官約談,理由是被懷疑收買內部員工。檢察官的論據是,大樂透頭彩的中獎機率只有約一千四百萬分之一,所以小明只有一千四百萬分之一的機率是無辜的。

大樂透中獎機率與小明無辜機率無關

某市發生一起兇殺案,現場證據不多,但死者掙扎時疑似抓到了來自兇手身上的皮膚,實驗室鑑定結果發現小明與之相符,於是小明被起訴。檢察官說,這種檢驗平均每1000人只會有一人符合,因此小明有罪的機率是999/1000。

正確的計算方法要使用貝氏定理。小明有罪的先驗機率若為P,則小明確實有罪的機率為 (0.999*P)/(0.999*P+0.001*(1-P)) ,而P 值是變動的,端視對小明不利的證據而定。假定對小明不利的唯一證據是小明住在案發城市,而該市人口為1,000,000,則 P 為 1/1,000,000,代入上式可知小明確實有罪的機率低於1/1000。

在某犯罪現場發現犯人血跡,此血型僅有 10% 的人擁有,剛好嫌疑人擁有此血型。所以,現場抓到的嫌疑犯且具此血型的人,無辜的可能性只有 10%。

倫敦人口有 1000 萬,擁有此血型約佔 100 萬人 (1000 萬 * 0.1),因此此嫌疑犯是犯人的機率是百萬分之一。


  1. 👮 案發地點發現嫌犯精液 DNA,DNA 圖譜相符機率是 1/300萬,因此被逮獲嫌犯有罪機率近乎百分百;最後檢察官發現搞錯了,要找到其他人DNA 圖譜相符機率高達 1/2500,被逮獲嫌犯的有罪機率大幅下降至 1/1200。

DNA 圖譜相符機率是 1/300萬,嫌犯有罪機率近乎百分百

DNA 圖譜相符機率是 1/2500,嫌犯有罪機率大幅下降至 1/1200


  1. 把不可靠的檢測做兩次,結果還是會比做一次來得好Math on Trial: How Numbers Get Used and Abused in the Courtroom》(https://reurl.cc/439z7L, https://reurl.cc/YjzaN0)

前提

  • 🎲 公正骰子擲出 6 點的機率是 1/6;

  • 灌鉛的骰子擲出 6 點的機率是 ½

機率運算

  • 【公正骰子】骰 10 次並骰出 6次 6點的機率 :C610(16)6(56)4=10!4! 6!(16)6(56)4=0.00217

  • 【灌鉛骰子】骰 10 次並骰出 6次 6點的機率 :C610(12)6(12)4=10!4! 6!(12)6(12)4=0.20508

  • 可能是灌鉛骰子的機率 = 0.20508 / (0.00217+0.20508) = 0.9895

實驗兩次的結果


  1. 科學上在做系統性文獻回顧 (systematic review) 時,也常採用上述方式。例如,醫學領域的系統性文獻回顧就是如此,雖然過去已經做過多次獨立試驗,但個別的受試者人數不足以為特定療法的療效下定論,系統性文獻回顧會將多項獨立試驗的結果結合起來下判斷。經過結合,在療法的療效或其他事項上,常常能得到在統計上具顯著性的結論。

  2. 系統性回顧可以用大量資料的統計,協助釐清少量文獻可能的偏差。例如諾貝爾獎得主的生物化學家 Linus Pauling 認為維他命 C 可以幫助我們活的更久,而且感覺較好並且預防感冒(Pauling, 1986)。但是之後 Paul Knipschild 做了文獻回顧發現,其實只有一、二個臨床試驗強烈建議維他命 C 可以預防感冒,但是有更多的文獻顯示,維他命 C 並沒有如 Pauling 所描述的好處(Knipschild, 1994)。

  3. 我們一旦過度沉迷於某個奇妙的數學論證、複雜的運算、又或是叫人印象深刻的數字,就常常會忘了問最重要的問題:這項計算用在這裡,到底對不對?

  4. 只要有人能夠從操控數字中得到利益,我們就該對數字抱持懷疑,要求得到更多解釋;任何人只要對自己的數字真實性有信心,就該樂於提供解釋

  5. 現代開始出現愈來愈多可量化的證據形式,於是數學論證在現代司法系統也扮演更形重要的角色;但如果落入壞人手中,數學也能用來妨礙正義,使無辜民眾失去生計、失去生命。

No comments: