albert's blog: [閱讀筆記] 如何衡量萬事萬物 (5/5)

相關性不表示「原因」。一項變數與另一項變數相關，不必然導致一項變數導致另一項變數。如果教會的捐款和酒類銷售有相關性在，並不是因為神職人員和酒類產業之間有勾結情形，而是兩者都受到經濟情況的影響。一般而言，在相關性本身之外，你還有其他堅強的理由懷疑有因果關係存在的，你才能做出一項事物導致另一項事物的結論。
異質標竿法 (heterogeneous benchmark) 是指，當人們對一個數量毫無概念，只要知道相關的度量結果，即使是不同的品項，也會有很大的幫助。例如你可能不確定一顆果凍豆的重量，因為你無法想笑一公克的糖果看起來的大小，但是當你知道一張瑱約 1g、10 美分硬幣的重量是 2.3g、大支的迴紋針是 1g，一定能影響你的估計。
有些人認為衡量中的誤差可能性，表示觀察無法降低不確定性。但是，事實上，如果一個觀察可能讓我們知道些什麼，它必然告訴了我們些什麼。
經理人普遍認為，像是「品質」、「形象」或「價值」等觀念是不可衡量的。在一些案例中，乃是因為他們無法發現這些數量的「客觀估計」(i.e. 客觀的物理特性)，但這都是錯誤的預期而已。所有的品質評估問題 (如公共形象、品牌價值等) 都是人類的偏好，就意義而言，人類的偏好式衡量的唯一來源，即「主觀估計」。一旦接受這類衡量只是在衡量人類的選擇 (i.e. 主觀評價, subjective valuation)，則我們唯一的問題，就是要如何觀察這些選擇。
大致而言，有兩個方法可以觀察人的偏好：人們說什麼以及人們做什麼。也就是陳述型偏好 (stated preferences)，是指個人說出的偏好；顯現型偏好 (revealed preferences)，是指個人已實際行為表現出來的偏好。無論是哪一種，都能大幅降低不確定性，但是顯現行偏好通常更明顯可見。
通常在詢問人們在想什麼、相信什麼、喜歡什麼，通常有幾個工具：

工具	說明
李克特量表 (Likert Scale)	要求答題者選擇對一件事物的感覺範圍，通常的形式是：非常不喜歡、不喜歡、非常喜歡、非常不同意、非常同意等。
選擇題	要求答題者從一組互斥的選項中做選擇，例如：共和黨、民主黨、其他
評等排序	要求答體者對一些品項做排序，例如：請評等以下八項活動，從最不喜歡 (1) 到最喜歡 (8)
論述題	要求答題者自由寫出他們的回答，例如：對於我們的服務，您是否有不滿意之處？

在調查個人偏好時，有五個避免發生回應偏誤 (response bias) 的簡單策略

策略	說明
問題要精確且簡短	長篇大論的問題容易造成混淆
避免使用多重意義的用語	多重意義的用語是指一個字有正面我負面的言外之意，例如：詢問人們是否支持某位政治人物的自由派政策 (如果沒有說出特定的政策，則這同時也是問題不精確的例子)
避免引導性問題	引導性問題在用詞用語上會告訴答題者哪個答案比較符合預期，例如：克里夫蘭薪水低，工時長的清潔隊員應該加新嗎? 最簡單的方式就是找第二或第三個人再檢視一次問題。
避免複合型問題	答題者不知道要回答哪個問題，你應該將這個問題拆成多個來問，例如：你比較喜歡 Benz 還是 BMW 的座椅、動力方向盤以及操控性?
利用反轉問題，來避免回應習慣偏誤	回應習慣偏誤是指答題者無視內容，以特定方向回答問題的傾向。如果你有一系列的量表，需要答題者從 1 ~ 5 進行評等排序，5 不要永遠是「正面」的回應，反之亦然

評價在本質上就是主觀的評估。股票或房地產的市場價值，只是一些市場參與者主觀判斷的結果。如果人們計算一家公司的淨值，已得到價值的「客觀」衡量，他們必須加總像是持有房屋的市場價值 (ex. 別人願意支付多少錢來買)、品牌價值 (ex. 消費者願意花多少錢來購買該品牌的產品)、用過的設備價值 (ex. 別人願意支付多少來購買) 等。這就是為什麼評價大多數事物的一個方法，就是問人們願意為它支付多少，或更好的方法是，從他們過去的行為看到他們支付了多少，這就是所謂的支付意願法 (WTP, Willing to Pay)。此種以隨機抽樣調查人們對特定事物願意付出多少錢，通常用於無法以其他方法評量的事物，過去被用於避免瀕臨絕種物種、增進公眾健康及環保議題的評價。
購買藝術品問題：你或許認為不可能對 "無價的" 藝術品做評價，但是如果我至少確定你知道該藝術品的真實價格，你就可以判定它對你價值。如果有人說畢卡索創造的某件事物是 "無價的"，但是沒有人可以被慫恿花 1,000 萬美元買下此藝術品，很顯然地此藝術品的價值就是 < 1,000 萬美元。
確定等值 (Certainty Equivalent)：例如參加超級大富翁益智問答節目，已經過了幾關，在考慮是否進入下一關時，一半的機會答對獲得獎金一百萬，一半的機會答錯獎金都泡湯，節目給予選擇機會放棄闖關，但提供三十萬元或是在繼續冒險。如果我們覺得領這確定的三十萬元與繼續闖關是「沒差」的，這三十萬元就可以被視為是現在對應於繼續闖關面對不確定結果的一個確定等值。
若能去除常見的人類認知偏誤，人類的心智是真正客觀衡量的偉大工具。人的心智是一套複雜系統，以大量的簡化法則，去理解並適應所處的環境。這些規則幾乎都比較偏好簡單化，勝過理性，而且許多規則甚至會彼此牴觸。那些不是很理性，但也許不是不好的簡單法則，稱為「經驗法則」(heuristics)；而那些完全不顧理性的，則稱為「謬誤」(fallacies)。
常見的認知偏誤 (cognitive biases)：

認知偏誤	說明
定錨 (anchoring)	若給予對方一個數字，就足以影響對方接下來的估計數值，即使是完全不相關的議題
月暈 / 尖角效應 (Halo / Horns effect)	如果先讓人看到有利於或不利於的一個選項的某種因素，他們比較能以支持他們印象的角度來解釋後來出現的額外資訊，無論資訊是什麼。例如你最初對一個人有正面印象，關於此人的額外資訊，你可能會以正面的角度解讀 (月暈效應)；同樣的，最初是負面的印象，就會有相反的效果 (尖角效應)。即使最初感受到的正面或負面因素，與後面的評價無關，也會出現這個效應。
從眾偏誤 (Bandwagon bias)	人會傾向做很多人做的事或相信很多人相信的事
浮現偏好 (Emerging preferences)	一旦人們開始偏好某個選項，他們對新增資訊的偏好會產生改變，會偏好支持先前決定的新增資訊。

專家常有過度自信地傾向，同時會隨著分析增加不斷提高他們的信心，即使其分析根本沒有到可衡量的進步。每個人都喜歡想像自己是不容易受影響的，而且比起這些研究中的受測者有較佳的「專家紀錄」。但我們發現最容易受騙的人，就是那些堅稱他們不會受這些效果影響的人。
對數的原文是"logarithm"，是由兩個希臘字"logos"及"arithmos"合組而成，前者意為比例，後者意為數目，合起來的意思就是「比例的數目」。對數東傳之初就譯成「比例數」，後來才改稱為對數。(原文網址：http://sa.ylib.com/MagArticle.aspx?Unit=columns&id=3654 )
自然對數e是「增長的極限」，簡單地說，有一堆東西，比如1萬個細胞，數量增長速度是每小時100%，如果每小時增長一個，那一小時後你將擁有2萬個細胞，如果半小時增長一次，那半小時後你將擁有1.5萬個細胞，一個小時後將擁有1.5*1.5=2.25萬細胞。如果四分之一個小時增長一次，那你在一小時以後將擁有1.25^4=2.4414萬個細胞。如果一分鐘增長一次一小時之後就是（61/60)^60=2.69597萬個細胞，如果一秒增長一次，如果一皮秒增長一次，直到極限情況就是（1+1/n）^n在n趨向無窮時的極限，也就是自然對數e。(原文網址：https://kknews.cc/zh-tw/news/zmqv5pq.html )
如果有些事物是很難觀察的，有許多方法可以在過程中嵌入標籤、探測器、顯影器等。例如之前提到過的調查魚的總倆例子中，將更簡單的標籤放入魚群中，就可以用捉放法來衡量總量。例如捉一些樣本上來，假設捉 1000 條，貼上標記，再放回湖裡。給一段時間，讓樣本有機會在母體裡分散，再捉一些樣本上來，假設捉 1000 條，如果其中 50 條是有標記的，表示湖裡約有 5% 的魚是有標記的，因此湖裡大約有 1000 / 5% = 20000 條魚。
通用的衡量方法：
通用的衡量方法說明：

階段	說明
第 0 階段：計劃準備	● 初期階段：對訪談、間接研究及以前的報告做研究，讓分析者能快速瞭解問題特性 ● 尋找專家：通常由四到五位專家來提供估計 ● 安排工作會議：安排專家進行 4 ~ 6 個半天的工作會議
第 1 階段：建立決策模型	● 定義決策問題：第一次工作會議，專家要找出分析的問題究竟是什麼？例如，他們是要決定是否進行某一項投資，或只是要如何對投資計畫做修正？ ● 決定模型的細節：第二次工作會議完成前，用 Excel 試算表，列出決策中所有重要因素，以及之間的相關性。例如，如果決策是要審核某項重大計畫，我們需要列出所有的效益與成本，將這些加總成現金流量，計算投報率 ● 初期校準估計：剩下的工作會議中，針對專家做校準訓練，然後將數值放入模型的變數中。所有的數量都是以 90% CI 或其他機率分配的方式表達。
第 2 階段：最適衡量	● 資訊價值分析 (VIA, Value of Information Analysis)：分析每一項不確定變數的資訊價值及門檻 ● 初步衡量方法設計：許多不確定變數中，通常只有一兩個變數具有很高的資訊價值，而且常常乎乎意料。衡量方法的重點在降低門檻的不確定性。 ● 衡量方法：分解法、隨機抽樣、主觀貝式分析、對照控制實驗、Lens 模型或上述方法的組合，都可能用來降低變數不確定性的衡量方法。 ● 更新決策模型：可以用從行量得到的發現來改變決策模型中的數值，分解的變數會在決策模型中明顯呈現出來，例如，一向不確定的成本部分，可以分解為較小的部分，而每個小部分以 90% CI 呈現 ● 最後的資訊價值分析：只要 VIA 顯示有明顯的價值且遠大於衡量成本，衡量就會繼續下去。然而，通常只需要一兩個回合，VIA 就會顯示進一步的衡量已經不具經濟正當性了。
第 3 階段：決策最適化及最後的建議	● 完成風險 / 報酬分析：最後的蒙地卡羅模擬縣市出可能結果的機率。如果決策是關於一些重大投資、計畫、承諾或其他提案 (通常為其中之一)，將組織的投資邊界和風險及報酬做比較 ● 找出指標程序：常常會有一些殘存的 VIA (變數還有一些資訊價值，但完整的衡量並不實際或不符合)，通常是關於計畫進度的變數，或關於商業或經濟環境的外在因素。這些需要被追蹤，因為它們可能會造成中途的修正，需要有適當的程序持續對它們做衡量。 ● 決策最適化：真正的決策很少是簡單的是非核准流程。現在已經開發出來一個風險及報酬的詳細模型，可以設計降低風險的測略，同時使用 what-if 分析，對決策做修正 ● 最終報告及呈現：最終報告包括決策模型、VIA 結果、所用的衡量、投資邊界的位置，以及建議的指標或對未來的分析、後續的決策等綜合陳述

總結

19.1. 如果某個因素真的那麼重要，它就是你可以定義的東西。如果它是你認為真正存在的，它就是你已經以某種方式觀察到的東西；

19.2. 如果它是重要又不確定的東西，錯了你會付出代價，而你是有機會犯錯的；

19.3. 你可以用校準估計，將目前的不確定性數量化；

19.4. 知道衡量的「門檻」，便可以計算額外資訊的價值。門檻是與目前不確定性比較，會開始造成改變的地方；

19.5. 一旦你知道對某事物做衡量的價值，就可以據此來做衡量，並決定努力的程度；

19.6. 只知道一些隨機抽樣、對照控制實驗，或甚至只是改善專家的判斷，都能大幅降低不確定性。

本書論述結構：

albert's blog

Total Pageviews

2019/09/09

[閱讀筆記] 如何衡量萬事萬物 (5/5)

No comments: