Total Pageviews

2021/08/07

[閱讀筆記] Standard Deviations: Flawed Assumptions... - 第六章 美國有多少非裔職業運動員? (Common Nonsenses)

 第六章 美國有多少非裔職業運動員? (Common Nonsenses)

蒙提霍爾問題/一個名叫佛羅里達的女孩/條件機率的混淆/假陽性問題/罕見病問題/達特茅斯鮭魚研究

  1. 法國著名的天文學家和數學家 Pierre-Simon Laplace (1749/3/23-1827/3/5) 曾說:「機率只不過是以計算形式呈現的常識而已。」我們應當對缺乏思考的計算保持警惕。自從電腦問世,計算是一件相當容易的工作,重點是這樣的計算是否有道理

  2. Monty Hall problem:在電視節目 Let’s Make a Deal (我們來做個交易吧) 中,參賽者經常得在三扇門間選一個。對於這種情況,有個統計決策能幫助你贏得 Buick 汽車,而非一輩子供應的 Rice-A-Roni 食品。

門後是汽車的初始機率 (在初始狀態,你失敗機率有 ⅔ )

door1

door2

door3

33.33%

33.33%

33.33%

重新描述開始時車子位置的機率 (車子仍 33%、非車子為 66%)

door1

door2

door3

33.33%

66.66%

假設主持人打開 door 2,不是贏家的機率變成如下

door1

door2

door3

33.33%

0%

66.66%

  • 當主持人打開一扇什麼都沒有的門,你都該選擇更換選擇。當然你還是可能會錯,但如果你接任任何要換的提議,你就有比較大的機會贏得汽車

  • 上述策略須滿足三個條件

    • 主持人知道門後是什麼

    • 主持人揭露其中一個未被選取的門,且大獎不在其後

    • 你原本的選擇是隨機的

三種可能的情況,假設你都猜 Door 1,主持人翻開第一扇門都不是汽車



🚪

Door 1


🚪

Door 2


🚪

Door 3

主持人開第幾扇門

當開第一扇門,發現不是汽車後的決定

不換

🚗

🍲

🍲

1

🚗 (直接猜中)

🍲

🍲

🚗

🍲

3

🍲

🚗

🍲

🍲

🚗

2

🍲

🚗


Ref: https://brilliant.org/wiki/monty-hall-problem/ 

Bayes Theorem 

  • 公式:P(Ak | B)=P(B | Ak) P(Ak)iP(B | Ai) P(Ai)

  • 初始狀態,每扇門後是汽車的機率:P(D1)=P(D2)=P(D3)=13

  • 假設你先選 Door1 ,主持人打開 Door3,發現門後不是汽車,機率變成:P(car | D1)=12P(car | D2)=1P(car | D3)=0

  • 分母:P(car | D1) P(D1)+P(car | D2) P(D2)+P(car | D3) P(D3)=1213+113+013=16+13=36=12

  • 堅持 Doo1 不換門,獲得汽車的機率:P(D1 | car)=P(D1) P (car | D1)P(car | D1)P(D1)+P(car | D2)P(D2)+P(car | D3)P(D3)=131212=13

  • 換 Door3,獲得汽車的機率:P(D2 | car)=P(D2) P (car | D2)P(car | D1)P(D1)+P(car | D2)P(D2)+P(car | D3)P(D3)=13112=23

Ref: https://www3.nd.edu/~jstiver/Exec_Micro/Monty%20Hall.pdf 


  1. 我們看到黑人在職業運動佔有很高比例,因此下意識覺得很大一部分黑人都是職業運動員。如果將話題從種族變成性別,這錯誤將更明顯。NBA 所有球員都是男性,但在 NBA 打籃球的男性占美國男性群體比例很少。許多非裔美國孩子希望成為下一位 Michael Jordan、Magic Johnson、Lebron James、Kevin Durant,遺憾的是,他們幾乎無法成功。這是條件機率的混淆,擁有夢想與抱負很好,但認清現實更重要。學術與體育都很重要,兩者皆應當受到尊重,兩者相比,從事學術更有可能得到一份好工作

  2. 【假陽性問題】假設大麻檢測率有 95% 的檢驗準確率、估計 5% 的人有吸食大麻,被檢驗出陽性且真的有吸食大麻的人,機率有多高

樹狀圖

Bayes Theorem 計算過程

  • P(有吸食大麻)=.05

  • P(陽性 | 有吸食大麻) = .95

  • P(陽性)=.05.95+.95.05=.095

  • P(有吸食大麻 | 陽性)=P(有吸食大麻) P(陽性 | 有吸食大麻)P( 陽性)=.05.95.095=.5

  • 被檢驗出陽性且真的有吸食大麻的人,機率只有 50%;代表被檢測出陽性的員工,高達 50% 沒有吸食大麻


  1. 假陽性問題也出現疾病檢測中,和大麻檢測類似,即使疾病檢測有很高的準確率,得到陽性檢測的患者,仍很有可能沒有罹患該疾病。

歷史資料

樹狀圖

Bayes Theorem 計算過程

  • P(有惡性腫瘤)=.01

  • P(陽性 | 有惡性腫瘤) = .8

  • P(陽性)=.01.8+.99.1=.107

  • P(有惡性腫瘤 | 陽性)=P(有惡性腫瘤) P(陽性 | 有惡性腫瘤)P( 陽性)=.01.8.107=.0748

  • 被檢驗出陽性且真的有惡性腫瘤的人,機率7.48%;代表被檢測出陽性的患者,高達 92.52% 沒有罹患惡性腫瘤

在醫學上,偽陽性是可被接受的,盡早發現、盡早治療


  1. 假陽性 (false positive) 問題與條件機率的混淆有關。在某些情況,一項檢測很有可能顯示陽性結果,但陽性檢測結果並不能認定疾病的存在,通常還要做更進一步的檢查來做再次確認。對於罕見疾病來說,假陽性會更常見。

  2. 醫療檢驗提供診斷用的篩選資訊,但病人經常會理解錯誤,有時甚至醫生也會。了解稱作「敏感度 (sensitivity)」和「特異性 (specificity)」的機率特徵能提供更為準確且 (有的時候) 令人安心的畫面。(Ref: Statistics Hacks: Tips & Tools for Measuring the World and Beating the Odds)

可能的醫療檢驗結果


病人實際該症狀 (A)

病人實際該症狀 (B)

檢驗結果顯示該症狀

true positive

真陽性

敏感度 (sensitivity)

false positive

偽陽性

檢驗結果顯示該症狀

false negative

偽陰性

true negative

真陰性

特異性 (specificity)

敏感度 (sensitivity)

特異性 (specificity)

  • 若一個人真的有該疾病,檢驗結果為陽性的機率有多高

  • 即 A 欄中,有多少比率會得到陽性的檢驗結果

  • 若一個人沒有該疾病,檢驗結果為陰性的機率有多高

  • 即 B 欄中,有多少比率會得到陰性的檢驗結果

如果一個人得到陽性的檢驗結果,那麼這個人真的有該種疾病的可能性有多高?從病人的角度來看,可被視為這些檢驗基本的有效性考量。病人會問,醫生,我可以相信這些檢驗結果嗎?有可能哪裡出錯嗎?

10,000 名女性乳房攝影結果 

(base rate = 12%, 敏感度約 90%, 特異性約 92%)


病人實際乳癌 (A)

N = 120

病人實際乳癌 (B)

N = 9,880

乳房攝影指出癌變

真陽性

敏感度

90%N=.9120=108

偽陽性

8%N=.089,880=790


乳房攝影指出癌變

偽陰性

10%N=.1 120=12


真陰性

特異性 (specificity)

92%N=.929,880=9,090

  • A 欄與 B 欄必定是獨立的,各自加起來為 100%,因此能估算偽陰性與偽陽性的比率

  • 898 名拿到陽性結果的女性,有 790 名是錯的,只有 108 名是正確的,因此乳房攝影結果為陽性的受驗者,後續的追蹤檢查最常見的結果實際上是沒有癌症的。較敏感的檢查通常會產生更多的偽陽性,但在生死之間的嚴重狀況中,似乎是我們可接受的代價。

  • 9120 名陰性結果的女性中,有 12 名真的有癌症,因此錯過治療

Bayes 的條件機率方法,是「如果這樣,那麼...發生的機率會是怎樣?」是一種條件機率問題,Bayes 的條件機率是檢視事件發生的自然發生頻率。估計在一個人拿到陽性結果的條件像,那個人擁有某種疾病機率的基本公式是:true positivestrue positives + false positives。假設 base rate = .012、seneitivity = .90、specificity = .92,以條件機率表達,公式為 base rate sensitivity(base rate sensitivity)+(1-base rate)(1-specificity)=.012.90(.012.90)+(1-.012)(1-.92)=.1202,代表若一名女性拿到陽性的檢查結果,真的有乳癌的可能性為 12.02%。


  1. 檢驗報告面面觀:檢驗醫學是臨床醫師在疾病篩檢、診斷與治療與追蹤的重要參考依據,而隨著醫療技術的進步,雖然不斷有推陳出新的新儀器與方法,但每種檢驗方法的敏感性(sensitivity)與特異性(specificity)都不同,且會依使用的檢驗試劑廠牌有差異性,因此在使用新方法前,檢驗室會先進行驗證評估,選擇適當檢驗試劑將差異降低,而不會造成醫師在臨床參考上的困擾。

檢驗特性

說明

敏感性(sensitivity)

高敏感性的檢驗,偽陰性率低,因此結果陰性時越能排除得病。

特異性(specificity)

高特異性的檢驗,偽陽性率低,因此結果陽性時越能確認得病。

  • 以流感快篩檢驗為例,其特異性可達90-95%,因此快篩結果陽性時,幾乎能確認受到流感病毒的感染;但快篩檢驗的敏感性卻只有 50-70%,陰性結果並不能用來作為排除流感病毒感染,仍是必須依患者的臨床症狀來加以判斷。

  • 最佳的檢驗方法當然是有病的人檢驗結果都是陽性,無病的人檢驗結果都是陰性,但實際上,大多數的檢驗方法是無法同時兼顧兩者,只能依據臨床上的需求來選擇檢驗方法


2021/08/06

[閱讀筆記] Standard Deviations: Flawed Assumptions... - 第五章 資訊圖表失言 (Graphical Gaffes)

 第五章 資訊圖表失言 (Graphical Gaffes)

我的天哪/虛驚一場/讓他們吃蛋糕吧/有彈性的數線/將惡作劇翻倍/學生謊言/洋基隊的門票很划算/圖像的製作藝術

  1.  圖表錯覺 (美國諾貝爾科學獎得獎數):間隔區間不同會扭曲圖表

圖表一、得獎數大幅下降

因最後一段時間區間只累積四年,累計基準不同,造成得獎數萎縮的錯覺

圖表二、得獎數持續成長

最後一個時間區間,一樣是 10 年後,與前面的計算基準一致,真相才被還原


  1. 圖表惡作劇:若在線形上選擇範圍較小的數值範圍,資料的起伏就會變大;相反地,若選擇範圍較大的數值範圍,資料的起伏就會被撫平。

當圖表左邊縱軸的起點是 10,000,可得到家庭收入成長遠高於 CPI 的結論

在家庭收入選擇較小的數值範圍 (10,000 ~ 50,000,不是從 0 開始),家庭收入線形的起伏就會變大,造成家庭收入成長曲線遠高於 CPI 的錯覺。

當圖表左邊縱軸的起點是 0,右邊縱軸從 40 開始,卻得到相反結論

當 CPI 選擇較小的數值範圍 (40 ~ 200),CPI 線型的起伏就會變大,造成 CPI 成長曲線高於家庭收入的錯覺。

應將家庭收入扣除通膨因素後,得出下圖的結論


  1. 圖表幻術

洋基球場的票價並未劇烈漲價

時間放縱軸、票價放橫軸,與我們平時的習慣有差異,導致我們一時看不出圖表含意。

洋基球場的票價逐年劇烈漲價

將相同的資料,將上圖的縱軸與橫軸對調,即可得出相反的結論。


  1. 圖像製作的藝術

美國政府為降低通膨所採取的升息行動

因通膨而縮水的美元價值

由下圖可知 Carter 縮水狀況較溫和,Regan 縮水較多 (鈔票變小許多)

實際情況

  • 上圖缺少橫軸與縱軸,看不出起始點是否為 0。

  • Reagan 的鈔票是 Carter 的 1/4,但看起來價值似乎縮水 3/4。

  • Carter 任內的物價年成長率是 10.7%,然而 Regan 任內的物價年成長率為 3.7%,這樣的實際資訊與上圖所提供的資訊南轅北轍。


  1. 視覺化圖表不僅是一種藝術,更是為沒耐性的人帶來樂趣。有用的視覺化圖表可以準確且一致性地展示資料,協助我們理解;垃圾圖表則會分散注意力,使我們感到困惑與煩躁

  2. 垃圾視覺化圖表檢查清單

垃圾視覺化圖表檢查清單

  • 時間是否有放在縱軸,若有,將其調整至橫軸

  • 縱軸的數值區間是否一致,若不一致,圖形就不準確

  • 橫軸的數值區間是否一致,若不一致,圖形就不準確

  • 縱軸與橫軸起始值是否從 0 開始,選擇較小的數值範圍,會放大線型起伏