Francis Galton 的研究已證明,只要研究的的對象受機率的力量影響,平均值迴歸就會起作用。
散佈圖 (Scatter Diagram / Scatter Plot)
真實生活的數據畫出來的散佈圖,通常都會排出粗略的橢圓
《The Triumph of Mediocrity in Business》提出其研究發現,原本具領先優勢的企業,會隨著時間進展,喪失其原本優勢,雖然他們還是優於平均,但整體來說,已不再是特別傑出的一群企業。隨時間進展,企業表現趨於平庸也是平均值迴歸的一種現象,高超的管理與商業眼光固然扮演重要角色,但是運氣大概也有相等的分量。
代數的好處在於容易寫下式子,並打進計算機;幾何的好處在於能把我們的物理直覺與情境連結起來,特別是當你能畫出一幅圖像時。當你有能力用幾何語言講清楚一段數學,就會感覺自己真正搞懂了。
相關係數計算
計算喜歡起司與喜歡起司蛋糕間的「相關係數」
計算結果只能看出是否有相關性,「不是」因果關係。例如,血液濃度的 HDL 與心肌梗塞有關,但是經過研究,服用菸鹼酸來刻意提高 HDL 濃度的受試者,得到心肌梗塞與腦中風的比例與一般人一樣。從測試結果可發現,菸鹼酸可以提高HDL 濃度,高 HDL 濃度能降低心肌梗塞與腦中風的風險,但是,這不代表菸鹼酸能降低心肌梗塞與腦中風的風險。人的身體是極為複雜的系統,我們只能量度其中極少的特徵,更不要說想擺布它。以我們觀察到的相關因素為基礎,會有非常多藥物有可能達到治療效果,但當你將其拿來逐一實驗,大部分都以失敗收場。
以下是根據 2011/12/15 公共政策民意調查所繪製的圖,圖裡有 1000 個圓點,每一個點代表每個選民,回答的 23 個民調問題,可看出此選民是偏左或偏右,支持歐巴馬、肯定民主黨的選民會偏右邊;喜歡共和黨的選民會偏左。我們會發現,當選民獲得的訊息越多,只是讓原本左右兩邊的人走向更極端,居中人口稀疏地帶更加稀疏。大體來說,未決定的選民之所以未決定,並不是因為他們不受政治教條的偏見影響,客觀且小心提衡量各個候選人的優缺點,而是他們幾乎沒在注意這件事。
數學工具就跟其他科學工具一樣,能偵測到某類現象,卻不能偵測別類現象,正如你的相機沒有能力偵測到伽瑪射線 (或γ射線)。當你知道自然界或社會裡的兩種現象不相關,請把這件事放在心上:這並不意味著兩者毫無關係,只是不存在「相關」的原始設計中,所以無法偵測到那類關係。