Total Pageviews

2021/09/09

[閱讀筆記] HOW NOT TO BE WRONG - 第7章:死魚不會讀心 (Dead Fish Don’t Read Minds)

 

  1. 某人出書宣揚不吃玉米可以減肥且解決惱人濕疹問題,假設有數千人閱讀與是行書中的建議。可能上千讀者中,單純因為隨機因素,確實體重變輕且濕疹狀況改善。於是有些讀者會上網發表不吃玉米的成功見證文章,但其他遵循這種飲食法且減肥無成效的人,並沒有上網發表反對意見。

  2. 如上一章節提到的股票經紀人騙術,就像收到連續正確預測股價的廣告信而樂不可支,卻忽視有更多預測失敗的信件被丟進垃圾桶。

  1. 許多科學問題都歸結到「是或非」:某種現象是否會發生?某些新藥是否有效,或毫無作用?「毫無作用」的選項稱為「虛無假設」。換句話說,假設你研究的介入行為沒有任何效用,這種假設就是虛無假設 (null hypothesis)。若虛無假設成立,會讓研究人員徹夜難眠;若無法排除虛無假設,就無法確定是否踏上醫藥突破的路徑,還是摸錯了代謝路徑。研究者誠心希望虛無假設遭揚棄,新藥的效力才能得證。

  2. 所謂的顯著性 (significance) 檢定,並不是在量度重要性。當我們在檢驗一個新藥是否有效,虛無假設是用來斷言新藥沒效,因此排除虛無假設,就是判斷藥物效用不為 0;但是這個效用可能非常小,小到一般非數學相關的人,絕對不會說它具有任何重要性或意義。

  3. p 值問題 (Ref: https://reurl.cc/mqmxLV )

p 值越小表示該研究的結果越好嗎?

  • p 值越小,虛無假設為真實的可能性越低,推翻虛無假設可能犯錯的機會越低,因此宣稱研究有統計顯著差異的肯定程度越高

  •  p 值跟研究所要探討的臨床效果是否重要之間不是絕對的關係。一個 p 值顯著的結果,臨床上的效果卻可能很微小,20%比 21%臨床上只是很微小的差別,但只要研究樣本數夠大,統計檢定就會達到顯著。

樣本數越大,研究的 p 值一定越小嗎?

  • p 值是根據母體真正效果沒有差異的「虛無假設」來計算,所以:

    • 如果母群體真正效果「沒有差異」,研究結果的 p 值將隨機出現在 0 ~ 1 之間,跟樣本數大小沒有關係。

    • 可是只要母群體的真正效果「有差異」,研究結果的 p 值就會隨著研究樣本數增加而越來越小。

結論

  • 當幾個相同題目的類似研究,出現不一致的結果,且沒有特別的理由可以解釋彼此之間的差別時,那麼這些差異就有可能是抽樣誤差所造成。

  • 統合分析 (meta analysis) 透過整合這些研究研究降低抽樣誤差。一個研究有可能因為偶然的機會,結果出現比較小的 p 值,因而造成我們對研究的誤判。可是當好幾個題目相同的類似研究都出現比較小的 p 值時,結果純粹只是因為抽樣隨機出現的可能性就降低了,因此我們對結果判讀的肯定程度就隨著升高。這也就是為什麼一系列結果一致的研究,所提供證據的強度較高的原因。

  • 在母群體有差別的情況下,研究結果可以正確得到統計顯著的機會,稱為統計的“檢定力"(power)。檢定力是正確推翻虛無假說的機率。研究設計的目的之一是希望在可行的範圍內,盡量提高檢力,具體的策略就是設計合理的樣本數來達成


  1. 嚴格來說,虛無假設幾乎總是錯誤的。當你在病人血管注射強效藥劑時,很難說這種藥劑與病人罹患食道癌、血栓症或口臭的機率完全無關,因為身體是複雜的回饋影響與控制系統。你做的每件事,可能會促成癌症或避免癌症。原則上,只要你的實驗設計夠強,就能找出某種情形。但是通常那些效應都極端微小,可以安全地加以忽略。我們看到它們,並不代表真的有影響。

  2. 顯著性檢定只是工具,就像望遠鏡一樣,有些工具比其他工具更為強大。例如,用天文研究等級的望遠鏡看火星,可以看到它的衛星;但是,用一般看風景用的望遠鏡卻看不到。不過,火星的衛星一直在那兒。檢定方法的意義,只是用來告訴我們效應存在,而非斷定效應的大小或重要性

  3. 統計研究如果不夠細緻,以致於無法偵測到預期的現象,就稱為「低鑑別率」(underpowered)。就像你用一般看風景用的望遠鏡來觀察行星,不管行星是否存在,你都看不到,不如不看。高鑑別度的研究,有可能因極不重要的微小效應而讓你嚇壞;低鑑別度研究,又會讓你忽略因為方法太弱而檢測不出的微小效應。

  4. 我們很容易相信好手感與差手感的說法,進行相信手感會影響成功機率。記住,即使在隨機的拋硬幣實驗中,也會出現僅僅來自巧合的、引人注目的連續成功和連續失敗現象。好手感與差手感很可能確實存在,但它的差異比我們想像要小的許多每次投籃與之前沒有關係,只是出現巧合地連續現象優秀的狀態無法確保連續成功,糟糕的狀態也不保證連續失敗;優秀或糟糕的狀態也許僅是運氣而已

  5. 籃球選手在投中三分球後,下一球傾向在更遠的地方投球。換句話說,手感火燙可能「自我抵銷」,也就是當球員自我感覺良好時,自以為手感火燙,因過度自信而投出一些不該投的球。在證券市場也有類似現象,因一時投資獲利,誤以為自己是股神,因過度自信而去追求風險。

  6. 穩定得分的籃球球員,雖然沒有享受到手感火燙期,也沒有慘遭手感冰冷期,但偶爾也會連進五顆三分球。

No comments: