如果用數學形式呈現一種確定性假象 (illusion of certainty),原本心存懷疑的人,忽然間都欣然接受。
許多民主國家的法庭都遵循「無罪推定」原則:承擔舉證責任的是原告,而非被告。幾乎所有國家都放棄「有罪推定」的做法,原因在於「有罪推定」必然會造成偽陽性增加 (無罪變有罪)、偽陰性減少 (有罪變無罪) 的狀況 。
👮 在現代國家中,日本刑事司法系統是明顯的例外,日本是偏向有罪推定,定罪率高達 99%,當中有絕大部分是以自白認罪為基礎。日本高定罪率的原因:
聯合國在《世界人權宣言》裡,將無罪推定列為國際人權。18 世紀的英國法官暨政治家 William Blackstone 曾說:「就算讓十個有罪的人逃脫,也勝過讓一個無辜的人受苦。」此觀點讓我們站穩偽陰性的立場,只要我們無法證明嫌犯有罪,就可能獲判無罪;而且,就算確實有證據證明被告有罪,還需說服陪審團或法官、排除合理懷疑,否則被告就會揚長而去。
在蘇格蘭的法庭裡,還有第三種判決,就算是名義上,但足以降低偽陰性比例:如果陪審團或法官無法充分相信被告無辜,不應判無罪,而是判為「犯罪未經證實」(not proven)。
相依事件 (dependent event) 與獨立事件 (independent event)
當你在玩 21 點 (blackjack) 時,是否曾經連續拿了很多手壞牌,使得你增加賭注,認為情勢隨時可能改變,你就陷入賭徒謬誤 (Gambler’s Fallacy),以為連續拿了好幾次壞牌,拿到好牌的機率會增加。套用到純粹機率的遊戲上時,會是一連串「獨立事件」,事件間彼此毫無關係,每個個別的結果都與它之前的結果無關,這個事實經常被總結為「骰子沒有記憶」。《Statistics Hacks》
總體本來就包含各形各色的人,一旦我們思考不夠仔細,就假設某個統計數據可以代表當中所有個體,發生以全概偏、刻板印象,就犯了生態謬誤 / 區群謬誤 (ecological fallacy)。
根據英國 2010 的資料數據顯示:女性平均壽命 83 歲,男性平均壽命 79 歲,總人口平均壽命 81 歲。根據此數據,你可能就會產生「區群謬誤 (ecological fallacy)」,誤以為從街頭隨機挑一位女性,她的壽命一定會高於隨機挑選的男性,這又稱為簡化推論 / 籠統概化 (sweeping generalization)。由於極端值會影響算數平均數,這樣會讓平均壽命的算術平均數遠低於中位數。英國男性死亡年齡的中位數是 82 歲,這代表有一半的男性會活到 82 歲以後。
簡化推論 / 籠統概化 (sweeping generalization) 例子 (https://reurl.cc/l5KK76)
五的規則 (Rule of Five):任何從母體中隨機抽取的五個樣本,母體的中位數有 93.75% 的機會,會落在這五個樣本中最大和最小數值之間。假設你要考量公司是否要增加遠距辦公的機會,因此要考量每名員工平均花在通勤的時間,所謂五的規則就是你隨機選五名員工,假設你得到的數值是 30, 60, 45, 80, 60 分鐘,最高與最低分別為 30 與 80,此是全體員工的母體中位數有 93.75% 的機會,會落在這兩個數字之間。雖然樣本數很小,範圍可能很大,但是若能比你先前的範圍大幅縮小,那它作為一項衡量就很有價值。《How to Measure Anything: Finding the Value of Intangibles in Business》
辛普森悖論 (Simpson’s paradox)
更多辛普森悖論的例子 《Standard Deviations: Flawed Assumptions, Tortured Data, and Other Ways to Lie with Statistics》
檢察官謬誤 (prosecutor's fallacy):係取一不甚相關、或有關但未正確考慮條件機率的數據,認定被告「無辜的機率」很小。(https://reurl.cc/1oRWAm)
👮 案發地點發現嫌犯精液 DNA,DNA 圖譜相符機率是 1/300萬,因此被逮獲嫌犯有罪機率近乎百分百;最後檢察官發現搞錯了,要找到其他人DNA 圖譜相符機率高達 1/2500,被逮獲嫌犯的有罪機率大幅下降至 1/1200。
把不可靠的檢測做兩次,結果還是會比做一次來得好 《Math on Trial: How Numbers Get Used and Abused in the Courtroom》(https://reurl.cc/439z7L, https://reurl.cc/YjzaN0)
科學上在做系統性文獻回顧 (systematic review) 時,也常採用上述方式。例如,醫學領域的系統性文獻回顧就是如此,雖然過去已經做過多次獨立試驗,但個別的受試者人數不足以為特定療法的療效下定論,系統性文獻回顧會將多項獨立試驗的結果結合起來下判斷。經過結合,在療法的療效或其他事項上,常常能得到在統計上具顯著性的結論。
系統性回顧可以用大量資料的統計,協助釐清少量文獻可能的偏差。例如諾貝爾獎得主的生物化學家 Linus Pauling 認為維他命 C 可以幫助我們活的更久,而且感覺較好並且預防感冒(Pauling, 1986)。但是之後 Paul Knipschild 做了文獻回顧發現,其實只有一、二個臨床試驗強烈建議維他命 C 可以預防感冒,但是有更多的文獻顯示,維他命 C 並沒有如 Pauling 所描述的好處(Knipschild, 1994)。
我們一旦過度沉迷於某個奇妙的數學論證、複雜的運算、又或是叫人印象深刻的數字,就常常會忘了問最重要的問題:這項計算用在這裡,到底對不對?
只要有人能夠從操控數字中得到利益,我們就該對數字抱持懷疑,要求得到更多解釋;任何人只要對自己的數字真實性有信心,就該樂於提供解釋。
現代開始出現愈來愈多可量化的證據形式,於是數學論證在現代司法系統也扮演更形重要的角色;但如果落入壞人手中,數學也能用來妨礙正義,使無辜民眾失去生計、失去生命。
No comments:
Post a Comment