某人出書宣揚不吃玉米可以減肥且解決惱人濕疹問題,假設有數千人閱讀與是行書中的建議。可能上千讀者中,單純因為隨機因素,確實體重變輕且濕疹狀況改善。於是有些讀者會上網發表不吃玉米的成功見證文章,但其他遵循這種飲食法且減肥無成效的人,並沒有上網發表反對意見。
如上一章節提到的股票經紀人騙術,就像收到連續正確預測股價的廣告信而樂不可支,卻忽視有更多預測失敗的信件被丟進垃圾桶。
許多科學問題都歸結到「是或非」:某種現象是否會發生?某些新藥是否有效,或毫無作用?「毫無作用」的選項稱為「虛無假設」。換句話說,假設你研究的介入行為沒有任何效用,這種假設就是虛無假設 (null hypothesis)。若虛無假設成立,會讓研究人員徹夜難眠;若無法排除虛無假設,就無法確定是否踏上醫藥突破的路徑,還是摸錯了代謝路徑。研究者誠心希望虛無假設遭揚棄,新藥的效力才能得證。
所謂的顯著性 (significance) 檢定,並不是在量度重要性。當我們在檢驗一個新藥是否有效,虛無假設是用來斷言新藥沒效,因此排除虛無假設,就是判斷藥物效用不為 0;但是這個效用可能非常小,小到一般非數學相關的人,絕對不會說它具有任何重要性或意義。
p 值問題 (Ref: https://reurl.cc/mqmxLV )
嚴格來說,虛無假設幾乎總是錯誤的。當你在病人血管注射強效藥劑時,很難說這種藥劑與病人罹患食道癌、血栓症或口臭的機率完全無關,因為身體是複雜的回饋影響與控制系統。你做的每件事,可能會促成癌症或避免癌症。原則上,只要你的實驗設計夠強,就能找出某種情形。但是通常那些效應都極端微小,可以安全地加以忽略。我們看到它們,並不代表真的有影響。
顯著性檢定只是工具,就像望遠鏡一樣,有些工具比其他工具更為強大。例如,用天文研究等級的望遠鏡看火星,可以看到它的衛星;但是,用一般看風景用的望遠鏡卻看不到。不過,火星的衛星一直在那兒。檢定方法的意義,只是用來告訴我們效應存在,而非斷定效應的大小或重要性。
統計研究如果不夠細緻,以致於無法偵測到預期的現象,就稱為「低鑑別率」(underpowered)。就像你用一般看風景用的望遠鏡來觀察行星,不管行星是否存在,你都看不到,不如不看。高鑑別度的研究,有可能因極不重要的微小效應而讓你嚇壞;低鑑別度研究,又會讓你忽略因為方法太弱而檢測不出的微小效應。
我們很容易相信好手感與差手感的說法,進行相信手感會影響成功機率。記住,即使在隨機的拋硬幣實驗中,也會出現僅僅來自巧合的、引人注目的連續成功和連續失敗現象。好手感與差手感很可能確實存在,但它的差異比我們想像要小的許多。每次投籃與之前沒有關係,只是出現巧合地連續現象。優秀的狀態無法確保連續成功,糟糕的狀態也不保證連續失敗;優秀或糟糕的狀態也許僅是運氣而已。
籃球選手在投中三分球後,下一球傾向在更遠的地方投球。換句話說,手感火燙可能「自我抵銷」,也就是當球員自我感覺良好時,自以為手感火燙,因過度自信而投出一些不該投的球。在證券市場也有類似現象,因一時投資獲利,誤以為自己是股神,因過度自信而去追求風險。
穩定得分的籃球球員,雖然沒有享受到手感火燙期,也沒有慘遭手感冰冷期,但偶爾也會連進五顆三分球。
No comments:
Post a Comment