
機率思維
機率思維本質上是運用數學與邏輯工具,估算特定結果發生的可能性,是提升決策精確度的最佳工具之一。在每一刻都由無限複雜因素決定的世界中,機率思維幫助我們識別最可能出現的結果,據此做出更精準、有效的決策。
你今天會被閃電擊中嗎?
我們為何需要「機率」這個概念,值得深思。事物要麼存在,要麼不存在,不是嗎?我們今天要麼被閃電擊中,要麼不會——但問題在於,唯有走過這一天才能確知,這對清晨做決策毫無幫助。未來充滿不確定性,而理解可能影響我們的事件發生機率,能幫助我們更好地應對。
人類對世界的資訊掌握並非完美,這正是機率理論誕生及其具實用性的根源。如今我們已知,未來本質上難以預測:不僅無法掌握所有變數,即便數據中存在微乎其微的誤差,也會迅速扭曲預測結果。我們所能做的,是透過建立合理、實用的機率模型來估算未來。那麼具體該如何操作?
機率無處不在,滲透於世界的根本。心理學家丹尼爾·卡尼曼與阿莫斯·特沃斯基提出的直覺捷思法,是人類大腦中的「機率運算機制」——這一機制在電腦、工廠、交通、中階管理層與股票市場誕生前便已演化形成,曾助力人類生存,至今仍在這方面發揮作用。2
但在如今這個多數人不必憂慮生存的時代呢?我們渴望發展、競爭並取勝,更希望在複雜的社會系統中做出正確決策——而這類系統並非人類大腦演化出(相當理性的)捷思法時所面對的環境。
為此,我們需要有意識地建立一層「機率意識」。它究竟是什麼?如何運用它來獲得優勢?
要掌握機率思維、提高決策命中率,需理解其三個核心面向,並融入思考:
- 貝葉斯思維
- 厚尾曲線
- 不對稱性
托馬斯·貝葉斯與貝葉斯思維
貝葉斯是18世紀上半葉的英國牧師,其代表作《論機率理論中的一個問題》在他死後兩年(1763年),由友人理查·普萊斯呈交英國皇家學會,才得以問世。該文探討了遇見新數據時應如何調整機率,為數學家皮埃爾·西蒙·拉普拉斯發展出如今的「貝葉斯定理」奠定了基礎。
貝葉斯思維(亦稱「貝葉斯更新」)的核心在於:鑒於我們對世界的資訊有限但具參考價值,且不斷接觸新資訊,學習新知時應盡可能納入已知資訊。它讓我們在決策中運用所有相關的先驗資訊——統計學家稱之為「基準率」,即借鑒與當前情境相似的過往經驗。
以新聞標題「暴力持刀襲擊事件激增」為例:若缺乏貝葉斯思維,你可能會心生恐懼,認為遭受襲擊或謀殺的風險比幾個月前更高;但貝葉斯思維會引導你將這一資訊置於已知的暴力犯罪背景中分析。
你知道,暴力犯罪率已降至數十年來最低,你所在的城市比開始統計以來任何時候都更安全。假設去年你遭遇持刀襲擊的機率是萬分之一(0.01%),文章確實指出暴力犯罪率翻倍,即現為萬分之二(0.02%)——這值得極度擔憂嗎?此處的先驗資訊至關重要:納入考量後便會發現,實際安全並未受到嚴重影響。
相反,分析美國糖尿病數據時,運用先驗知識會得出不同結論——貝葉斯分析顯示我們應予以重視。1958年,美國糖尿病確診率為0.93%,2015年升至7.4%,其間呈穩步上升趨勢,非突發激增。因此,相關的先驗數據表明這一趨勢令人擔憂。
需注意的是,先驗資訊本身也是一種機率估算:對於每一個已知資訊,我們不應以「非真即假」的二元邏輯看待,而應賦予其「真實的機率」。因此,不應讓先驗認知阻礙接收新知——在貝葉斯理論中,這稱為「似然比」或「貝葉斯因子」。任何挑戰先驗的新資訊,僅意味著該先驗的真實機率可能降低,最終部分先驗會被徹底取代。這是一個不斷質疑、驗證既有認知的循環過程。在面對不確定的決策時,幾乎總是需要問自己:相關的先驗資訊有哪些?我已掌握哪些知識,可幫助更好地理解現實情境?
附錄:條件機率
條件機率在實踐中與貝葉斯思維相似,但切入角度不同。當運用歷史事件預測未來時,必須留意事件發生時的背景條件。
事件可分為獨立事件(如擲硬幣)與相依事件:後者的結果取決於先前發生的事件。假設過去三次和你出門吃冰淇淋,我都選了香草口味——你會認定香草是我的最愛,因此我永遠會選它嗎?首先需確認我的選擇是獨立事件還是相依事件:我是從100種口味中第一個挑選,還是排在後面,此時巧克力已售罄?
若每次群體挑選時所有口味都齊全,我的選擇便是獨立事件;若朋友先選導致部分口味缺貨,則為相依事件——此時我選擇香草的機率,取決於朋友挑選後剩餘的口味。
因此,運用條件機率意味著需仔細觀察待分析事件發生之前的各項條件。
接下來我們探討厚尾曲線:多數人對鐘形曲線並不陌生,這一對稱的曲線能用於描述身高、考試成績等眾多事物的相對頻率。鐘形曲線易於理解和運用,其學名為「常態分佈」——若確認情境符合常態分佈,便可快速確定參數,並針對最可能的結果制訂計畫。
厚尾曲線則與之不同。乍看之下兩者頗為相似:常見結果會聚集形成曲線波峰,但差異在於「尾部」——鐘形曲線的極端值可預測,偏離平均值的幅度有限;而厚尾曲線中,極端事件並無真正的上限。
可能發生的極端事件越多,曲線的尾部就越長。儘管單一極端事件發生的機率仍较低,但眾多可能的極端情形意味著,我們不能以常見結果代表整體平均。極端事件的可能性越多,其中某一個發生的機率就越高——不可思議的事情必然會發生,而我們無法預知其時機。
附錄:數量級
可這樣理解:在鐘形曲線情境中(如人類身高、體重分佈),確實存在極端值,但極端值的範圍相對明確——你永遠不會遇見身高是普通男性十倍的人。但在厚尾曲線情境中(如財富分佈),集中趨勢並不適用:你可能經常遇見財富是平均水平十倍、百倍甚至萬倍的人——這是一個截然不同的世界。
讓我們重新分析前文貝葉斯思維中提到的暴力風險案例。假設你聽說「從樓梯滑倒撞傷頭部致死的風險,高於死於恐怖攻擊的風險」,數據與先驗資訊似乎支持這一說法:去年你所在的國家有1000人因樓梯滑倒死亡,僅500人死於恐怖攻擊。你應更擔心樓梯還是恐怖事件?
永遠要格外留意「尾部」:它可能決定一切。
有人以此類例子證明恐怖風險低——既然近期死亡人數少,何必擔憂?3 問題在於厚尾效應:恐怖暴力風險類似財富分佈(厚尾),而樓梯滑倒死亡風險類似身高、體重分佈(常態分佈)。未來十年,可能發生多少恐怖事件?其尾部有多「厚」?
關鍵不在於費力設想尾部的所有可能情境(本質上這是不可能的),而在於以正確方式應對厚尾領域:透過調整自身處境,在難以預測的未來中生存甚至獲益——成為唯一能正確思考、並為未知世界規劃的人。
附錄:反脆弱性
如何從充滿不確定性的未知世界(由「厚尾」主導)中獲益?納西姆·塔勒布在其著作《反脆弱》中給出了答案。
其核心觀點是:事物可分為三類——易受波動與不確定性傷害的、對波動與不確定性無動於衷的,以及能從中獲益的。最後一類即為「反脆弱」——類似一個「渴望被粗暴對待」的包裹。在一定範圍內,某些事物會因波動而變得更強,這正是我們應追求的狀態。為何?因為世界本質上難以預測且充滿波動,而諸如恐慌、崩盤、戰爭、泡沫等重大事件,往往對結果產生與其發生頻率不成比例的巨大影響。
應對這類世界有兩種方式:嘗試預測,或努力準備。預測頗具誘惑力——人類歷史上,預言家向來能謀得安穩生計。但問題在於,無數研究證明,在股市、地緣政治、全球金融等複雜現實領域,專家對稀有且影響深遠的事件的預測幾乎全數失敗!與其預測,不如準備,效率更高。
如何準備?如何培養「反脆弱性」,從世界的波動中獲益?
第一種方式,華爾街交易員稱之為「上行選擇權」,即主動尋找有較大機會帶來機遇的情境。例如參加一個有許多你希望結識的人的雞尾酒會:儘管無法保證一定能遇見他們,或相處愉快,但你為自己創造了偶遇與隨機機會。最糟的結果不過是一無所獲——而你確定的是,待在家裡永遠不會有這些機會。透過參加酒會,你提升了遇見機遇的機率。
第二種方式是學會「正確失敗」。正確失敗包含兩個核心:首先,永遠不要承擔會讓你徹底出局的風險(永遠不要被完全淘汰出遊戲);其次,培養從失敗中學習、重新出發的個人韌性。遵循這兩條原則,你所經歷的僅是暫時的失敗。
沒有人喜歡失敗——它帶來痛苦,但失敗也蘊含著反脆弱的珍貴禮物:學習。那些敢於(正確地)失敗的人,相較他人擁有巨大優勢——從失敗中學到的經驗,會降低他們在世界波動中的脆弱性,讓他們以真正的反脆弱方式從中獲益。
假設你想創建一家成功的企業,但毫無商業經驗——你會選擇就讀商學院,還是創辦一家可能失敗的企業?商學院固然有其價值,但真實的商業環境(充滿坎坷與不確定性的體驗)透過成功與失敗的快速回饋循環傳授知識。換言之,嘗試與錯誤能帶來寶貴的資訊。
反脆弱思維是一種獨特的思維模式:只要有可能,就應創造讓隨機性與不確定性成為朋友而非敵人的情境。
塔勒布,納西姆。《反脆弱》。紐約:蘭登書屋,2012年。
不對稱性
最後,你需要思考一個可稱為「後設機率」的概念——即你對機率的估算本身是否可靠。
這一備受誤解的概念與「不對稱性」相關。觀察專業投資者精心準備的股票推介會不難發現,幾乎每次介紹投資理念時,投資者都會堅定地告訴受眾,他們預期年回報率可達20%至40%,甚至更高。然而,極少有人能達到這一目標——並非他們沒有成功案例,而是因為失敗的案例太多。他們一貫高估自己對機率估算的信心(參考:長期以來,扣除費用前,美國股市的年均回報率不超過7%至8%)。
數量級
納西姆·塔勒布準確點出了我們對機率的淺薄運用。他在《黑天鵝》中主張,若在衡量極端事件風險時存在輕微誤差,結果不僅會有偏差,還可能偏差數個數量級——換言之,不僅僅是10%的誤差,可能是十倍、百倍甚至千倍的誤差。我們認為千年一遇的事件,或許在任意一年都有可能發生!這是因為運用了錯誤的先驗資訊,導致低估了未來分佈發生變化的機率。
塔勒布,納西姆。《黑天鵝:如何應對不可知的未來》(第二版)。紐約:蘭登書屋,2010年。
另一種常見的不對稱性,體現在人們對交通狀況影響行程時間的估算上。你有多少次「準時出門」卻提前20%抵達?幾乎沒有?又有多少次「準時出門」卻延遲20%抵達?時常發生?確實如此——你的估算誤差具有不對稱性,偏向單一方向。這在機率決策中極為常見。
多數機率估算的誤差傾向於「過度樂觀」,而非「過度悲觀」。你幾乎不會看到哪個目標年回報率25%的投資者,長期來能達到40%的回報;但隨意在《華爾街日報》上點選,就能找到許多投資者,其每項投資的目標年回報率為25%,最終卻僅接近10%。
間諜世界
成功的間諜善於運用機率思維——高風險的生存環境迫使他們盡可能客觀地評估所處環境。
薇拉·阿特金斯在二戰期間擔任英國特別行動執行局(SOE)法國分部副指揮官(該機構直接向溫斯頓·丘吉爾負責)4,她必須依據本質上不可靠的資訊,估算其真實性機率,從而做出數百項決策。
阿特金斯負責招募英國特工,並將他們派遣至被占領的法國。她需要判斷誰能勝任任務、哪些是最優情報來源——這些均為生死攸關的決策,且全部基於機率思維。
首先,如何挑選間諜?並非所有人都能在高壓環境下潛伏,並建立必要的人脈以收集情報。二戰期間,在法國執行任務失敗的代價不是被解雇,而是死亡。哪些性格與經歷特質能表明一個人適合這份工作?即便如今心理學、審訊技術與測謊儀已有所發展,這仍需憑藉判斷力。
二戰期間,許多英國情報機構與法國抵抗組織合作,實現互利共贏:英國獲得當地的專業地理知識,抵抗組織則得到武器與資金支援。
對於1940年代的薇拉·阿特金斯而言,這是一個不斷加權各項因素、對特工成功機率進行估算的過程:誰會說法語?誰有足夠的自信?誰與家庭聯繫過於緊密?誰具備解決問題的能力?從招募到派遣,她對每位特工的培養,都是一系列不斷更新的、基於知識的估算。
培養好情報人員僅是成功的一半——該將他們派往何處?若情報足夠精確,明確知曉目標地點,或許就無需執行情報任務了。選擇任務目標同樣需要運用機率思維:需評估所掌握資訊的可靠性,以及已建立的情報網絡。情報不同於證據,它沒有明確的指揮鏈,也無法保證真實性。
來自德占法國的情報,多是模糊的照片、經多人傳遞才抵達總部的手寫筆記,以及操作员在極度緊張下快速發送、有時間斷且無法驗證的無線電資訊。在決定是否採用這些情報時,阿特金斯必須考量其相關性、質量與及時性。
她的決策不僅基於已發生的事實,還需考慮可能發生的情境。試圖應對所有可能性會導致特工永遠無法出發,但他們必須做好應對眾多未知狀況的準備——畢竟,他們的工作環境往往充滿波動與變化。阿特金斯派遣至法國的特工主要承擔三類職責:組織者負責招募當地人員、拓展網絡、識別破壞目標;信使負責在全國範圍內傳遞資訊,連接人員與網絡以協調行動;無線電操作员需架設重型通訊設備並偽裝,將情報傳送出境,且隨時準備轉移。所有這些工作都極其危險,威脅的全貌永遠無法完全識別——可能出錯的環節、可能被發現或出賣的情境太多,難以全部規劃。阿特金斯手下的無線電操作员在法國的平均壽命僅有六周。
最後,數據顯示,對每位特工成功機率的估算存在不對稱性:阿特金斯共派遣400名特工前往法國,其中100人被捕並遇害。這並非用來評判她的能力——機率思維僅能幫助我們接近正確方向,無法保證100%成功。
毫無疑問,在二戰期間試圖破壞德國在法國行動的艱鉅任務中,阿特金斯極大依賴機率思維指導決策。評估間諜生涯的成功與否並不容易,因為這份工作伴隨著眾多犧牲。阿特金斯的成功在於,她的情報網絡開展了具有價值的破壞行動,支援了盟軍的戰爭努力,但也付出了巨大的生命代價。
保險公司
世界上對機率最敏感的行業莫過於保險業——這是行業屬性使然。提及保險,我們可能會想到人壽保險(投保人在特定年齡死亡的機率)、汽車保險(發生車禍的機率)或房屋保險(樹木倒塌砸毀房屋的機率)。憑藉現有統計數據,這些事件在足夠大的人群中的機率易於定價與預測。
但保險的覆蓋範圍極為廣泛,保險公司幾乎會為任何事件提供保險——只要價格合適。曾有保單涵蓋維多利亞的秘密模特兒的雙腿、棒球運動員的手臂、百事挑戰賽與NCAA錦標賽,甚至某位著名鄉村歌手的胸部!
這何以實現?關鍵在於對機率的細緻把握。世界頂級保險公司善於識別重要影響因素(即便這些因素難以完全預測),並據此定價。
一位維多利亞的秘密模特兒雙腿受重傷以致結束生涯的機率有多大?萬分之一?十萬分之一?要得出準確答案,需評估她的生活方式、習慣、健康狀況、家族病史,進而制訂出足以確保平均盈利的價格與條款——這與賽馬場的賠率估算頗為相似。保險公司永遠可以同意承保,訣竅在於制訂合適的價格——而這離不開機率分析。
輔助觀點:因果關係與相關性
混淆這兩個概念,往往導致對世界運作方式的諸多錯誤假設。我們觀察到兩件事同時發生(相關性),便錯誤地認定兩者存在因果關係(因果性),進而依據這一錯誤結論行事——這類決策難以利用世界的真實運行規律,僅能靠運氣成功。若無法清晰理解兩者的含義,後果可能影響深遠。
無相關性
兩個指標的相關係數介於-1至1之間,用於衡量它們共同影響因素的相對重要性。例如,瓶裝水消費量與自殺率這兩個幾乎無共同影響因素的現象,其相關係數接近0——也就是說,若繪製全球所有國家某一年的自殺率與人均瓶裝水消費量對比圖,會發現毫無規律可言。
完全相關性
相反,有些指標完全取決於同一影響因素。溫度便是典型例子:支配溫度的唯一因素(分子運動速度)適用於所有溫度計量單位,因此每一個攝氏溫度都有唯一對應的華氏溫度。據此,攝氏溫度與華氏溫度的相關係數為1,對比圖會呈現一條直線。
弱至中度相關性
人文科學中,相關係數為1的現象極為罕見,但存在大量弱至中度相關的現象,兩者間具有一定的解釋力。以身高與體重的相關性為例,其相關係數介於0至1之間:幾乎所有三歲兒童都比成年男性輕且矮,但同身高的成年男性或三歲兒童,體重未必相同。
這種變異性與相對較低的相關係數表明,儘管身高總體而言是體重的良好預測指標,但顯然還有其他因素在發揮作用。
此外,相關性有時會呈現反向關係。假設你閱讀一項研究,比較父母的飲酒量與孩子的學業成績,結果顯示父母飲酒量高與孩子學業成績低存在關聯——這是因果關係還是相關性?你可能會輕易得出「父母飲酒越多,孩子成績越差」的因果結論,但這項研究僅證實了兩者的關係,並未證明因果性。父母飲酒量與孩子學業成績呈負相關,但有可能是父母飲酒導致孩子成績下降,也有可能是孩子成績差導致父母飲酒增多,甚至存在其他干擾因素。嘗試逆轉關係,有助於判斷所面對的是真正的因果關係,還是僅僅是相關性。
因果關係
只要相關性並非完美,極端值會隨時間逐漸趨於平均——最優秀的會看似變差,最差的會看似變好,無論是否採取額外行動。這一現象稱為「回歸平均」,意味著我們在判斷因果關係時需格外謹慎。這是大眾媒體乃至受過訓練的科學家有時也會忽視的點。
以丹尼爾·卡尼曼在《思考,快與慢》中給出的例子為證:5
抑鬱兒童接受能量飲料治療後,三個月內症狀顯著改善。這則新聞標題是我虛構的,但所報導的事實真實存在:若給一組抑鬱兒童持續一段時間服用能量飲料,他們的症狀會出現臨床上的顯著改善。同樣,抑鬱兒童若每天倒立一段時間,或擁抱貓20分鐘,症狀也會有所好轉。
看到此類標題時,我們很容易得出「能量飲料、倒立或擁抱貓是治療抑鬱的有效方法」的結論,但這些案例再次體現了回歸平均的原理:
抑鬱兒童屬於極端群體,比大多數其他兒童更抑鬱——而極端群體會隨時間趨於平均。連續兩次測試的抑鬱分數相關性並非完美,因此會出現回歸平均現象:即便不擁抱貓、不喝紅牛,抑鬱兒童的症狀也會隨時間有所好轉。
我們常常錯誤地將特定政策或治療方法歸因為某種效果的原因,而事實上,極端群體的變化本來就會發生。這帶來一個核心問題:如何判斷效果是真實存在的,還是僅僅源於變異性?
幸運的是,我們有方法區分真實改善與自然趨勢——引入「對照組」,即僅透過回歸平均預期會有所改善的群體。研究的目的在於判斷受試組的改善程度是否超過回歸平均所能解釋的範圍。
在評估特定個人或團隊的表現時,若唯一的基準是過去的表現,且無法引入對照組,則幾乎無法分離回歸平均的影響——儘管可以與行業平均水平、同輩群體或歷史改善率進行比較,但這些都不是完美的衡量標準。
一流智慧的檢驗標準,是能否在頭腦中同時容納兩個相反的想法,且仍能保持行動能力。例如,一個人應能意識到事情毫無希望,卻仍決心改變現狀。
——F·斯科特·菲茨傑拉德1
Quotation-David-Hume-All-knowledge-degenerates-into-probability-57-28-34.jpg
