albert's blog: [閱讀筆記] HOW NOT TO BE WRONG - 第7章：死魚不會讀心 (Dead Fish Don’t Read Minds)

2021/09/09

[閱讀筆記] HOW NOT TO BE WRONG - 第7章：死魚不會讀心 (Dead Fish Don’t Read Minds)

某人出書宣揚不吃玉米可以減肥且解決惱人濕疹問題，假設有數千人閱讀與是行書中的建議。可能上千讀者中，單純因為隨機因素，確實體重變輕且濕疹狀況改善。於是有些讀者會上網發表不吃玉米的成功見證文章，但其他遵循這種飲食法且減肥無成效的人，並沒有上網發表反對意見。
如上一章節提到的股票經紀人騙術，就像收到連續正確預測股價的廣告信而樂不可支，卻忽視有更多預測失敗的信件被丟進垃圾桶。

許多科學問題都歸結到「是或非」：某種現象是否會發生？某些新藥是否有效，或毫無作用？「毫無作用」的選項稱為「虛無假設」。換句話說，假設你研究的介入行為沒有任何效用，這種假設就是虛無假設 (null hypothesis)。若虛無假設成立，會讓研究人員徹夜難眠；若無法排除虛無假設，就無法確定是否踏上醫藥突破的路徑，還是摸錯了代謝路徑。研究者誠心希望虛無假設遭揚棄，新藥的效力才能得證。
所謂的顯著性 (significance) 檢定，並不是在量度重要性。當我們在檢驗一個新藥是否有效，虛無假設是用來斷言新藥沒效，因此排除虛無假設，就是判斷藥物效用不為 0；但是這個效用可能非常小，小到一般非數學相關的人，絕對不會說它具有任何重要性或意義。
p 值問題 (Ref: https://reurl.cc/mqmxLV )

p 值越小表示該研究的結果越好嗎？

p 值越小，虛無假設為真實的可能性越低，推翻虛無假設可能犯錯的機會越低，因此宣稱研究有統計顯著差異的肯定程度越高。
p 值跟研究所要探討的臨床效果是否重要之間不是絕對的關係。一個 p 值顯著的結果，臨床上的效果卻可能很微小，20%比 21%臨床上只是很微小的差別，但只要研究樣本數夠大，統計檢定就會達到顯著。

樣本數越大，研究的 p 值一定越小嗎？

p 值是根據母體真正效果沒有差異的「虛無假設」來計算，所以：

如果母群體真正效果「沒有差異」，研究結果的 p 值將隨機出現在 0 ~ 1 之間，跟樣本數大小沒有關係。
可是只要母群體的真正效果「有差異」，研究結果的 p 值就會隨著研究樣本數增加而越來越小。

結論

當幾個相同題目的類似研究，出現不一致的結果，且沒有特別的理由可以解釋彼此之間的差別時，那麼這些差異就有可能是抽樣誤差所造成。
統合分析 (meta analysis) 透過整合這些研究研究降低抽樣誤差。一個研究有可能因為偶然的機會，結果出現比較小的 p 值，因而造成我們對研究的誤判。可是當好幾個題目相同的類似研究都出現比較小的 p 值時，結果純粹只是因為抽樣隨機出現的可能性就降低了，因此我們對結果判讀的肯定程度就隨著升高。這也就是為什麼一系列結果一致的研究，所提供證據的強度較高的原因。
在母群體有差別的情況下，研究結果可以正確得到統計顯著的機會，稱為統計的“檢定力＂(power)。檢定力是正確推翻虛無假說的機率。研究設計的目的之一是希望在可行的範圍內，盡量提高檢力，具體的策略就是設計合理的樣本數來達成。

嚴格來說，虛無假設幾乎總是錯誤的。當你在病人血管注射強效藥劑時，很難說這種藥劑與病人罹患食道癌、血栓症或口臭的機率完全無關，因為身體是複雜的回饋影響與控制系統。你做的每件事，可能會促成癌症或避免癌症。原則上，只要你的實驗設計夠強，就能找出某種情形。但是通常那些效應都極端微小，可以安全地加以忽略。我們看到它們，並不代表真的有影響。
顯著性檢定只是工具，就像望遠鏡一樣，有些工具比其他工具更為強大。例如，用天文研究等級的望遠鏡看火星，可以看到它的衛星；但是，用一般看風景用的望遠鏡卻看不到。不過，火星的衛星一直在那兒。檢定方法的意義，只是用來告訴我們效應存在，而非斷定效應的大小或重要性。
統計研究如果不夠細緻，以致於無法偵測到預期的現象，就稱為「低鑑別率」(underpowered)。就像你用一般看風景用的望遠鏡來觀察行星，不管行星是否存在，你都看不到，不如不看。高鑑別度的研究，有可能因極不重要的微小效應而讓你嚇壞；低鑑別度研究，又會讓你忽略因為方法太弱而檢測不出的微小效應。
我們很容易相信好手感與差手感的說法，進行相信手感會影響成功機率。記住，即使在隨機的拋硬幣實驗中，也會出現僅僅來自巧合的、引人注目的連續成功和連續失敗現象。好手感與差手感很可能確實存在，但它的差異比我們想像要小的許多。每次投籃與之前沒有關係，只是出現巧合地連續現象。優秀的狀態無法確保連續成功，糟糕的狀態也不保證連續失敗；優秀或糟糕的狀態也許僅是運氣而已。
籃球選手在投中三分球後，下一球傾向在更遠的地方投球。換句話說，手感火燙可能「自我抵銷」，也就是當球員自我感覺良好時，自以為手感火燙，因過度自信而投出一些不該投的球。在證券市場也有類似現象，因一時投資獲利，誤以為自己是股神，因過度自信而去追求風險。
穩定得分的籃球球員，雖然沒有享受到手感火燙期，也沒有慘遭手感冰冷期，但偶爾也會連進五顆三分球。

albert's blog

Total Pageviews

2021/09/09

[閱讀筆記] HOW NOT TO BE WRONG - 第7章：死魚不會讀心 (Dead Fish Don’t Read Minds)

No comments: