版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
肥尾效應(yīng)前漸進論、認(rèn)識論和應(yīng)用目錄\h第一章序言,?\h第二章術(shù)語、符號和定義\h2.1一般符號和常用符號\h2.2一般&特殊概念目錄\h2.2.1冪律類分布□\h2.2.2大數(shù)定律(弱)\h2.2.3中心極限定理(CLT)\h2.2.4中數(shù)定律和漸進論\h2.2.5Kappa統(tǒng)計量\h2.2.6橢圓分布\h2.2.7統(tǒng)計獨立性\h2.2.8多變量(列維)穩(wěn)定分布\h2.2.9多變量穩(wěn)定分布\h2.2.10卡拉瑪塔點\h2.2.11亞指數(shù)\h2.2.12近似替代:學(xué)生T分布\h2.2.13引用環(huán)\h2.2.14學(xué)術(shù)尋租\h2.2.15偽經(jīng)驗主義或Pinker問題\h2.2.16前漸進性\h2.2.17隨機化\h2.2.18在險價值(VaR),條件在險價值(CVaR)\h2.2.19風(fēng)險共擔(dān)\h2.2.20MS圖\h2.2.21最大吸引域(MDA)\h2.2.22心理學(xué)文獻(xiàn)中的積分替換\h2.2.23概率的不可分拆性(另一個常見誤區(qū))\h2.2.24維特根斯坦的尺子\h2.2.25黑天鵝\h2.2.26經(jīng)驗分布會超出經(jīng)驗\h2.2.27隱藏的尾部\h2.2.28影子矩\h2.2.29尾部依賴\h2.2.30元概率\h2.2.31動態(tài)對沖\h第一部分肥尾及其效應(yīng)介紹\h第三章非數(shù)理視角概述——劍橋大學(xué)達(dá)爾文學(xué)院講義,?\h3.1薄尾和厚尾的差異\h3.2直觀理解:搖尾巴的狗\h3.3一種(更合理的)厚尾分類方式及其效應(yīng)\h3.4肥尾分布的主要效應(yīng)及其與本書的關(guān)聯(lián)\h3.4.1預(yù)測\h3.4.2大數(shù)定律\h3.5認(rèn)識論與非對稱推理\h3.6幼稚的經(jīng)驗主義:不應(yīng)該把埃博拉病毒和從梯子上跌落進行對比\h3.6.1風(fēng)險是如何倍增的\h3.7冪律入門(幾乎沒有數(shù)學(xué))\h3.8隱藏性質(zhì)在哪里?\h3.9貝葉斯圖譜\h3.10X和f(X):混淆我們理解的X和相應(yīng)風(fēng)險敞口\h3.11破產(chǎn)和路徑依賴\h3.12如何應(yīng)對\h第四章單變量肥尾,有限矩(第一層)?\h4.1構(gòu)造輕微肥尾的簡單方法\h4.1.1固定方差的增厚尾部方法\h4.1.2通過有偏方差增厚尾部\h4.2隨機波動率能否產(chǎn)生冪律?\h4.3分布的軀干、肩部和尾部\h4.3.1交叉和隧穿效應(yīng)\h4.4肥尾、平均差和上升范數(shù)\h4.4.1常見誤區(qū)\h4.4.2指標(biāo)分析\h4.4.3肥尾效應(yīng)對STDvsMAD“有效性”的影響\h4.4.4矩和冪均不等式\h4.4.5評述:為什么我們應(yīng)該立刻棄用標(biāo)準(zhǔn)差?\h4.5可視化p上升產(chǎn)生的等范數(shù)邊界效應(yīng)\h第五章亞指數(shù)和冪律(第二層)\h5.0.1重新排序\h5.0.2什么是邊界概率分布?\h5.0.3創(chuàng)建一個分布\h5.1尺度和冪律(第三層)\h5.1.1有尺度和無尺度,對肥尾更深層的理解\h5.1.2灰天鵝\h5.2冪律的性質(zhì)\h5.2.1變量求和\h5.2.2變換\h5.3鐘形vs非鐘形冪律\h5.4冪律分布尾部指數(shù)插值:一個例子\h5.5超級肥尾:對數(shù)帕累托分布\h5.6偽隨機波動率:一項研究\h第六章高維空間厚尾?\h6.1高維空間中的厚尾,有限矩\h6.2聯(lián)合肥尾分布及其橢圓特性\h6.3多元學(xué)生T分布\h6.3.1肥尾條件下的橢圓性和獨立性\h6.4肥尾和互信息\h6.5肥尾和隨機矩陣,一個小插曲\h6.6相關(guān)性和未定義方差\h6.7線性回歸模型的肥尾殘差\hA殊厚尾案例\hA.1多重模型與厚尾,戰(zhàn)爭-和平模型\hA.2轉(zhuǎn)移概率:有不可逆破碎可能的事物終將破碎\h第二部分中數(shù)定律\h第七章極限分布綜述,?\h7.1溫習(xí):弱大數(shù)定律和強大數(shù)定律\h7.2中心極限過程\h7.2.1穩(wěn)定分布\h7.2.2穩(wěn)定分布的大數(shù)定律\h7.3CLT的收斂速度:直觀探索\h7.3.1迅速收斂:均勻分布\h7.3.2中速收斂:指數(shù)分布\h7.3.3慢速收斂:帕累托分布\h7.3.4半立方帕累托分布及其收斂分布族\h7.4累積量和收斂性\h7.5數(shù)理基礎(chǔ):傳統(tǒng)版本的中心極限定理\h7.6高階矩的大數(shù)定律\h7.6.1高階矩\h7.7穩(wěn)定分布的平均差\h第八章需要多少數(shù)據(jù)?肥尾的定量衡量方法?\h8.1定義與介紹\h8.2統(tǒng)計量\h8.3收斂性基準(zhǔn),穩(wěn)定分布類\h8.3.1穩(wěn)定分布的等價表述\h8.3.2樣本充足率的實際置信度\h8.4數(shù)量化效應(yīng)\h8.4.1非對稱分布的一些奇異特性\h8.4.2學(xué)生T分布向高斯分布的收斂速率\h8.4.3對數(shù)正態(tài)分布既非薄尾,又非肥尾\h8.4.4κ可以為負(fù)嗎?\h8.5效應(yīng)總結(jié)\h8.5.1投資組合的偽穩(wěn)定性\h8.5.2其他領(lǐng)域的統(tǒng)計推斷\h8.5.3最終評述\h8.6附錄、推導(dǎo)和證明\h8.6.1立方學(xué)生T分布(高斯族)\h8.6.2對數(shù)正態(tài)分布\h8.6.3指數(shù)分布\h8.6.4負(fù)Kappa和負(fù)峰度\h第九章極值和隱藏尾部,?\h9.1極值理論簡介\h9.1.1各類冪律尾如何趨向弗雷歇分布\h9.1.2高斯分布的情形\h9.1.3皮克蘭茲-巴爾克馬-德哈恩定理\h9.2冪律分布看不見的尾\h9.2.1和正態(tài)分布對比\h9.3附錄:經(jīng)驗分布的經(jīng)驗有限\hB增速和結(jié)果并非同類分布\hB.1謎題\hB.2瘟疫的分布極度肥尾\hC大偏差理論簡介\hC.1簡單示例:切諾夫界\hD帕累托性質(zhì)擬合\hD.1樣本尾部指數(shù)的分布\h第十章“事實就是這樣”:標(biāo)準(zhǔn)普爾500指數(shù)分析?\h10.1帕累托性和矩\h10.2收斂性測試\h10.2.1測試1:累積樣本峰度\h10.2.2最大回撤\h10.2.3經(jīng)驗Kappa\h10.2.4測試2:超越某值的條件期望\h10.2.5測試3:四階矩的不穩(wěn)定性\h10.2.6測試4:MS圖\h10.2.7歷史記錄和極值\h10.2.8左右尾不對稱\h10.3總結(jié):事實就是這樣\hE計量經(jīng)濟學(xué)的問題\hE.1標(biāo)準(zhǔn)帶參風(fēng)險統(tǒng)計量的表現(xiàn)\hE.2標(biāo)準(zhǔn)非參風(fēng)險統(tǒng)計量的表現(xiàn)\hF有關(guān)機器學(xué)習(xí)\hF.1擬合有角函數(shù)\h第三部分預(yù)報、預(yù)測和不確定性\h第十一章肥尾條件下的概率校準(zhǔn)?\h11.1連續(xù)vs離散分布:定義和評述\h11.1.1與描述的差異\h11.1.2肥尾條件下不存在“崩潰”、“災(zāi)難”或“成功”\h11.2心理學(xué)中對尾部概率的偽高估\h11.2.1薄尾情況\h11.2.2肥尾情況\h11.2.3誤區(qū)\h11.2.4分布的不確定性\h11.3校準(zhǔn)和校準(zhǔn)失誤\h11.4表現(xiàn)統(tǒng)計量\h11.4.1分布推導(dǎo)\h11.5收益函數(shù)/機器學(xué)習(xí)\h11.6結(jié)論\h11.7附錄:證明和推導(dǎo)\h11.7.1二元計數(shù)分布p(n)\h11.7.2布里爾分?jǐn)?shù)的分布\h第十二章鞅過程大選預(yù)測:套利法?\h12.0.1主要結(jié)論\h12.0.2框架\h12.0.3有關(guān)風(fēng)險中性的討論\h12.1巴舍利耶風(fēng)格的估值\h12.2有界雙重鞅過程\h12.3與德菲內(nèi)蒂概率評估的關(guān)系\h12.4總結(jié)和評述\h第四部分肥尾條件下的不均估計\h第十三章無限方差下的基尼系數(shù)估計?\h13.1介紹\h13.2無限方差下非參估計的漸進性質(zhì)\h13.2.1α穩(wěn)定隨機變量回顧\h13.2.2基尼系數(shù)的α穩(wěn)定漸進極限\h13.3極大似然估計\h13.4帕累托數(shù)據(jù)\h13.5小樣本修正\h13.6總結(jié)\h第十四章分位數(shù)貢獻(xiàn)的估計誤差和超可加性?\h14.1介紹\h14.2帕累托尾分布\h14.2.1偏差和收斂性\h14.3累加不等性質(zhì)的不等性\h14.4尾部指數(shù)的混合分布\h14.5變量和越大,□越大\h14.6結(jié)論以及如何合理估計集中度\h14.6.1穩(wěn)健方法和完整數(shù)據(jù)的使用\h14.6.2我們應(yīng)該如何測量集中度?\h第五部分影子矩相關(guān)論文\h第十五章無限均值分布的影子矩?\h15.1介紹\h15.2雙重分布\h15.3回到y(tǒng):影子均值(或總體均值)\h15.4和其他方法的比較\h15.5應(yīng)用\h第十六章暴力事件的尾部風(fēng)險?\h16.1介紹\h16.2統(tǒng)計討論匯總\h16.2.1結(jié)果\h16.2.2總結(jié)\h16.3研究方法討論\h16.3.1重整化方法\h16.3.2條件期望(嚴(yán)謹(jǐn)性稍弱)\h16.3.3數(shù)據(jù)可靠性和對尾部估計的影響\h16.3.4“事件”的定義\h16.3.5事件遺漏\h16.3.6生存偏差\h16.4數(shù)據(jù)分析\h16.4.1閾值之上的峰值\h16.4.2事件間隔和自相關(guān)性\h16.4.3尾部分析\h16.4.4有關(guān)極大值的另類視角\h16.4.5全數(shù)據(jù)集分析\h16.5額外的魯棒性和可靠性測試\h16.5.1GPD自展法\h16.5.2估計邊界的擾動\h16.6結(jié)論:真實世界是否比看起來更不安全?\hG第三次世界大戰(zhàn)發(fā)生的概率有多高?,?\h第六部分元概率相關(guān)論文\h第十七章遞歸的認(rèn)知不確定性如何導(dǎo)致肥尾?\h17.1方法和推導(dǎo)\h17.1.1不確定性的層級累加\h17.1.2標(biāo)準(zhǔn)高斯分布的高階積分\h17.1.3小概率效應(yīng)\h17.2狀態(tài)2:a(n)為衰減參數(shù)\h17.2.1狀態(tài)2-a:“失血”高階誤差\h17.2.2狀態(tài)2-b:第二種方法,無倍增誤差率\h17.3極限分布\h第十八章不對稱冪律的隨機尾部指數(shù)?\h18.1背景\h18.2隨機α的單尾分布\h18.2.1一般情況\h18.2.2隨機α不等式\h18.2.3□分布類近似\h18.3冪律分布求和\h18.4不對稱穩(wěn)定分布\h18.5α為對數(shù)正態(tài)分布的帕累托分布\h18.6α為伽馬分布的帕累托分布\h18.7有界冪律,西里洛和塔勒布(2016)\h18.8其他評論\h第十九章p值的元分布和p值操控?\h19.1證明和推導(dǎo)\h19.2檢驗的逆功效\h19.3應(yīng)用和結(jié)論\hH行為經(jīng)濟學(xué)的謬誤\hH.1案例研究:短視損失厭惡的概念謬誤\h第七部分肥尾下的期權(quán)交易與定價\h第二十章金融理論在期權(quán)定價上的缺陷?\h20.1巴舍利耶而非布萊克—斯科爾斯\h20.1.1現(xiàn)實和理想的距離\h20.1.2實際動態(tài)復(fù)制過程\h20.1.3失效:對沖誤差問題\h第二十一章期權(quán)定價的唯一測度(無動態(tài)對沖和完備市場)?\h21.1背景\h21.2證明\h21.2.1案例1:使用遠(yuǎn)期作為風(fēng)險中性測度\h21.2.2推導(dǎo)\h21.3當(dāng)遠(yuǎn)期不滿足風(fēng)險中性時\h21.4評述\h第二十二章期權(quán)交易員從來不用BSM公式?\h22.1打破鏈條\h22.2介紹\h22.2.1布萊克—斯科爾斯只是理論\h22.3誤區(qū)1:交易員在BSM之前無法對期權(quán)定價\h22.4方法和推導(dǎo)\h22.4.1期權(quán)公式和Delta對沖\h22.5誤區(qū)2:今天的交易員使用布萊克-斯科爾斯定價\h22.5.1我們什么時候定價?\h22.6動態(tài)對沖的數(shù)學(xué)不可能性\h22.6.1高斯分布(令人困惑)的穩(wěn)健性\h22.6.2訂單流和期權(quán)\h22.6.3巴舍利耶-索普方程\h第二十三章冪律條件下的期權(quán)定價:穩(wěn)健的啟發(fā)式方法,?\h23.1介紹\h23.2卡拉瑪塔點之上的看漲期權(quán)定價\h23.2.1第一種方法,S屬于正規(guī)變化類\h23.2.2第二種方法,S的幾何收益率屬于正規(guī)變化類\h23.3看跌期權(quán)定價\h23.4套利邊界\h23.5評述\h第二十四章量化金融領(lǐng)域的四個錯誤,?\h24.1混淆二階矩和四階矩\h24.2分析期權(quán)收益時忽略詹森不等式\h24.3保險和被保資產(chǎn)之間的不可分割性\h24.4金融領(lǐng)域計價單位的必要性\h24.5附錄(押注分布尾部)\h第二十五章尾部風(fēng)險約束和最大熵?\h25.1投資組合的核心約束是左尾風(fēng)險\h25.1.1杰恩斯眼中的杠鈴策略\h25.2重新審視均值-方差組合\h25.2.1分析約束條件\h25.3再論高斯分布\h25.3.1兩個正態(tài)分布混合\h25.4最大熵\h25.4.1案例A:全局均值約束\h25.4.2案例B:均值絕對值約束\h25.4.3案例C:右尾服從冪律\h25.4.4擴展到多階段模型\h25.5總結(jié)評述\h25.6附錄/證明第一章序言*,?\h[1]對世界的了解越是粗淺,做決策越是輕易。圖1.1核心問題不是不知道“肥尾”,而是缺乏對其效應(yīng)的理解。說出“它是肥尾”意味的不僅是改變分布的名稱,而且是對統(tǒng)計工具和決策類型的全面革新。感謝斯特凡·加西奇。不確定性(Incerto)項目背后的主要思想在于,雖然我們所在的世界是如此不確定和不透明,信息和我們的理解也極不完整,但是沒有人研究在這種不確定性的基礎(chǔ)上我們應(yīng)該做什么。本書主要講述產(chǎn)生極端事件的統(tǒng)計分布類型,以及在這類分布下如何進行統(tǒng)計推斷和做出決策,內(nèi)容包括:(1)公開發(fā)表的論文;(2)未經(jīng)審查的公開評述?,F(xiàn)有的大多數(shù)“標(biāo)準(zhǔn)”統(tǒng)計理論均來自薄尾分布,它們在應(yīng)用于肥尾的過程中需要經(jīng)過漸進性調(diào)整,這往往不是小改動,原理論可能會被完全舍棄。圖1.2沒有洞察力的復(fù)雜性:許多使用統(tǒng)計學(xué)和數(shù)據(jù)科學(xué)的專業(yè)人士頭腦清晰,但不了解核心概念,即根本意義。感謝維基媒體。根據(jù)作者的經(jīng)驗,一些學(xué)界教授或業(yè)界人士會說,“我們當(dāng)然知道這一點”,或是更粗暴地給出結(jié)論,“肥尾沒有什么新東西”,同時在分析中使用“方差”、“GARCH”(自回歸條件異方差均值模型)、“峰度”、“夏普比率”或“在險價值”這樣的指標(biāo),或者開展一些所謂“統(tǒng)計意義顯著”實則完全不顯著的研究。此外,本書來自作者的不確定性[226]系列和相關(guān)的量化研究,主要關(guān)注我們該如何在一個不確定性結(jié)構(gòu)過于復(fù)雜的現(xiàn)實世界中生活。不確定性系列嘗試在五個不同領(lǐng)域統(tǒng)一尾部概率和極端事件,包括數(shù)學(xué)、哲學(xué)、社會科學(xué)、契約論、決策論和現(xiàn)實世界。至于為什么是契約論,答案是:期權(quán)理論是基于或有契約或概率契約的概念,旨在調(diào)整和轉(zhuǎn)移分布尾部的風(fēng)險敞口;從某種意義上說,期權(quán)理論也屬于數(shù)學(xué)契約論。決策論不是為了了解世界,而是為了擺脫困境并求得生存。這也是不確定性系列量化研究下一卷的主題,目前暫定書名為《凸性、風(fēng)險和脆弱性》。術(shù)語解釋“厚尾”常常被用于學(xué)術(shù)場合,用金融從業(yè)者的術(shù)語來說,厚尾表征的是“比高斯分布峰度更高的分布”。而對于“肥尾”,我們傾向于將其理解為極端厚尾或冪律尾類分布(第八章會論證兩者的一致性)。一般來說,我們的定義相對更窄一些,僅僅將肥尾限定于“冪律”或“正規(guī)變化”——但我們更喜歡將“冪律”直接稱為“冪律”(當(dāng)對該類過程非常確定時)。因此,我們所稱的“肥尾”從嚴(yán)格意義上說,對許多人而言更像是“極度厚尾”。為了避免歧義,我們在這里不使用諸如“重尾”或者“長尾”的說法。在接下來的兩章中,我們會進一步闡明上述概念。圖1.3關(guān)于肥尾的經(jīng)典回應(yīng):一個有效的“替代方案”是不妨礙學(xué)術(shù)尋租的方案。感謝斯特凡·加西奇。\h[1]討論章節(jié)。第二章術(shù)語、符號和定義本章是書中主要議題和數(shù)學(xué)符號的概要總結(jié)。一般來說,數(shù)學(xué)符號在各個章節(jié)中也會有注解,為了方便讀者,這里先做個匯總。從論文中提取的章節(jié)會有特殊符號標(biāo)注。我們會盡可能保持全書符號的一致性,但不同研究小組在使用上可能有一定的差異。2.1一般符號和常用符號是表示概率的符號,一般以表示,其中X是隨機變量,x是其取值。在第十一章和其他有必要的地方,我們會使用更正式(更法式)的理論定義。是期望操作符。是方差操作符。是平均絕對偏差,以均值為對稱(和中位數(shù)不同)。φ(.)和f(.)一般被用來表征給定分布的PDF(概率密度函數(shù))。在某些章節(jié)中,當(dāng)隨機變量X和Y滿足不同的分布時,我們會用fx(x)和fy(y)來區(qū)分。n一般表示求和的數(shù)目。p一般表示矩的階數(shù)。F(.)一般被用來表示CDF[累積分布函數(shù)或者S是的生存函數(shù)?!硎疽粋€隨機變量滿足某種法則下的分布。是分布的特征函數(shù),在某些討論中,參數(shù)也以ω表示,有時特征函數(shù)也以Ψ表示。表示收斂于某分布,假設(shè)有一系列隨機變量代表隨機變量Xn的累積分布函數(shù)Fn滿足(在F連續(xù)的條件下,對于所有實數(shù)x):表示收斂于某概率,對于任意ε>0,上述相同序列滿足:表示必然收斂,是更強的收斂條件,可表示為:Sn一般表示n個變量求和。α和αs,我們一般使用αs∈(0,2]來表征柏拉圖式穩(wěn)定分布的尾部指數(shù),而采用αp∈(0,∞)來表征帕累托(漸進于帕累托)分布的尾部指數(shù),有時兩個α?xí)煜?,直接出現(xiàn)的α可以通過上下文來理解。是均值為μ1,方差為σ21的高斯分布。或者是表示對數(shù)正態(tài)分布,概率密度函數(shù)f(L)(.)一般可以表示為,其中均值為X0,方差是尾部參數(shù)αs∈(0,2]的穩(wěn)定分布,對稱指數(shù)β∈(?1,1),中心參數(shù)和離散參數(shù)σ>0。是冪律類分布(見下節(jié))。是亞指數(shù)類分布(見下節(jié))。δ(.)是狄拉克δ函數(shù)。θ(.)是階躍θ函數(shù)。erf(.)是誤差函數(shù),是高斯分布的積分是誤差函數(shù)的補函數(shù)1?erf(.)。一般定義為實向量的向量范數(shù)注意這里加上了絕對值。是合流超幾何函數(shù):是正則化廣義超幾何函數(shù):,這里是Pochhammer表達(dá)式。是Q-Pochhammer表達(dá)式,定義為2.2一般&特殊概念目錄下面是一些核心要點的定義(可能和后面存在重復(fù))。2.2.1冪律類分布冪律類分布一般通過如下生存函數(shù)的性質(zhì)來定義。假設(shè)隨機變量X屬于右尾為“冪律”的分布類,也就是:這里是緩變函數(shù),對于所有k>0,定義如下[22]:變量X的生存函數(shù)屬于“正規(guī)變化”類RVα,具體來說,函數(shù)在無窮大處以指數(shù)ρ變化:更進一步看,會存在一個點,使得L(x)趨向于極限的時候為常數(shù)l,我們稱它為“卡拉瑪塔常數(shù)”(Karamata),該點也被稱為“卡拉瑪塔點”。在該值之外,冪律尾可以通過希爾估計這樣的標(biāo)準(zhǔn)方法來擬合。該區(qū)域內(nèi)的分布也被曼德博[162][75]稱為強帕累托法則。對于分布左尾,上述規(guī)律類似。2.2.2大數(shù)定律(弱)大數(shù)定律的標(biāo)準(zhǔn)形式如下,假設(shè)X1,X2…Xn是獨立同分布(i.i.d.)的無限序列(勒貝格可積),且(盡管有時可以放松獨立同分布條件)。樣本均值會收斂到期望值,對于這里方差有限并非必要條件(不過各高階矩的存在會加快收斂速度)。強大數(shù)定律有需要時再做討論。2.2.3中心極限定理(CLT)中心極限定理的標(biāo)準(zhǔn)形式(Lindeberg-Lévy)如下,假設(shè)有一系列獨立同分布的隨機變量,是n個樣本的均值,當(dāng)n趨于無窮時,隨機變量的和會收斂到高斯分布[20][21]。這里收斂到分布的意思是,對于每一個實數(shù)z,的CDF(累積分布函數(shù))會點對點收斂到標(biāo)準(zhǔn)高斯分布的CDF,N(0,σ):Φ(z)是z處標(biāo)準(zhǔn)高斯分布的CDF值。中心極限定理還有很多其他版本,下面有需要時會展開論述。2.2.4中數(shù)定律和漸進論這是全書的主旨,我們想要了解隨機變量數(shù)目n比較大但又不是極大時的漸進行為。對高斯分布來說,這不是什么大問題,因為收斂速度很快(大數(shù)定律和中心極限定理都是),但是對很多其他的隨機變量來說并非如此。見下面的Kappa統(tǒng)計量。2.2.5Kappa統(tǒng)計量這一統(tǒng)計量不應(yīng)該被視為數(shù)學(xué)上表征距離的函數(shù),我們應(yīng)該以偏向工程學(xué)的思維,將其視為一種量化比較的手段。Kappa是本書作者自己設(shè)計的統(tǒng)計量(發(fā)表于論文中[235]),取值范圍為[0,1],代表隨機變量的漸進行為。對高斯分布來說,取值為0(基準(zhǔn)值),而對柯西分布或其他均值不存在的分布取值為1。假設(shè)X1,X2…Xn是均值有限的獨立同分布隨機變量,也即。定義為部分序列和。那么可以定義為n個隨機變量求和的平均絕對偏差(參照之前我們不使用中位數(shù),而是以均值為中心)。接著定義n個額外變量和收斂的“速率”(從n0開始):在最為基礎(chǔ)的n=n0+1時,我們簡單地用來表示。2.2.6橢圓分布p×1維的隨機變量X為橢圓分布(橢圓等高分布)的定義是:假設(shè)位置參數(shù)為μ,存在非負(fù)矩陣Σ和標(biāo)量函數(shù)Ψ使得特征函數(shù)滿足exp(it′μ)Ψ(tΣt′)的形式。換句話說,對于聯(lián)合分布,我們必須有奇協(xié)方差矩陣才能滿足其橢圓特性。狀態(tài)轉(zhuǎn)換協(xié)方差和隨機協(xié)方差這樣的條件都會使聯(lián)合分布遠(yuǎn)離橢圓分布。我們會在第六章給出,只要違反橢圓特性,薄尾變量的線性組合就可以展現(xiàn)出極度肥尾的性質(zhì),除了肥尾性質(zhì)本身,這一條又額外證偽了很多現(xiàn)代金融學(xué)理論。2.2.7統(tǒng)計獨立性假設(shè)兩個獨立的隨機變量X和Y,如果其各自的概率密度函數(shù)(PDF)為f(x)和f(y),無論相關(guān)系數(shù)如何,聯(lián)合PDFf(x,y)都滿足:在橢圓分布類中,相關(guān)系數(shù)為0的雙變量高斯分布既獨立又不相關(guān)。但是對多變量學(xué)生T分布或柯西分布來說,上述條件就不成立了。2.2.8多變量(列維)穩(wěn)定分布這是中心極限定理的廣義版本。假設(shè)X1,X2…Xn是獨立同分布隨機變量,它們的和為Sn,那么我們有:這里的Xs服從穩(wěn)定分布S,an和bn是常量,代表收斂到分布(當(dāng)n→∞時X的分布)。下一章我們會對S的性質(zhì)進行更完備的定義。這里可以認(rèn)為Xs服從穩(wěn)定分布(或者α穩(wěn)定分布),寫作XsS(αs,β,μ,σ),特征函數(shù)的形式如下:分布參數(shù)的限制條件為2.2.9多變量穩(wěn)定分布隨機向量滿足多變量穩(wěn)定分布的條件是,所有成分的線性組合服從穩(wěn)定分布。也即對于任意常向量,隨機變量Y=aTX應(yīng)該是一個單變量穩(wěn)定分布。2.2.10卡拉瑪塔點見冪律類分布。2.2.11亞指數(shù)平均斯坦和極端斯坦的自然邊界為亞指數(shù)類分布,有如下性質(zhì):假設(shè)是實數(shù)域上的獨立同分布隨機變量,累積分布函數(shù)為F,亞指數(shù)類的分布可以定義為(見[248][196]):這里的的累積分布函數(shù)(兩個相同的獨立隨機變量X的和),上面的定義代表了X1+X2超過x的兩倍的概率是任意單個X超過x的概率的兩倍。因此,對足夠大的x來說,每當(dāng)和超過x的時候,往往是其中某個X超過了x——兩者中的較大值,另外一個X的貢獻(xiàn)則微乎其微。更一般地看,可以證明n個變量的和會由這些變量中的最大值主導(dǎo)。從嚴(yán)謹(jǐn)?shù)慕嵌戎v,下面兩條性質(zhì)等價于亞指數(shù)條件[43][84]。對于假設(shè)因此,求和項Sn和樣本中的最大值Mn有相同的量級,這也是尾部起主導(dǎo)作用的另一種表達(dá)。直觀來看,亞指數(shù)分布的尾部應(yīng)該比指數(shù)分布下降更慢,因為指數(shù)分布的尾部并非由超大尾部事件主導(dǎo)。實際上,我們可以證明,亞指數(shù)分布不存在指數(shù)矩:所有。然而,反過來不一定成立,如果一個分布的指數(shù)矩不存在,那么它不一定滿足亞指數(shù)分布的條件。2.2.12近似替代:學(xué)生T分布我們可以方便地使用自由度為α的學(xué)生T分布近似作為雙尾冪律分布,α=1對應(yīng)柯西分布,而α→∞對應(yīng)高斯分布。學(xué)生T分布屬于主流的鐘形冪律分布,也即PDF平滑連續(xù),對于極大的正值/負(fù)值x概率趨于0,且具備單一的尖峰最大值(另外,PDF是準(zhǔn)凹結(jié)構(gòu)而不是簡單的凹結(jié)構(gòu))。2.2.13引用環(huán)這是學(xué)術(shù)界的一種高度循環(huán)的引用機制,這種機制認(rèn)為,杰出論文的標(biāo)準(zhǔn)在于他人的引用,從而忽略來自外部的過濾條件。這樣會導(dǎo)致學(xué)術(shù)研究方向過于集中,很容易卡在某個“角落”,聚焦于沒有實際意義的領(lǐng)域。該機制與缺乏成熟監(jiān)督,且缺乏“風(fēng)險共擔(dān)”的學(xué)術(shù)體系運行模式有關(guān)。典型的此類領(lǐng)域有現(xiàn)代金融理論、計量經(jīng)濟學(xué)(特別是宏觀變量計量學(xué))、GARCH過程、心理計量學(xué)、隨機控制金融學(xué)、行為經(jīng)濟和金融學(xué)、不確定性決策學(xué)、宏觀經(jīng)濟學(xué)等。這里的很多學(xué)術(shù)成果根本無法應(yīng)用于現(xiàn)實,唯一的作用是貢獻(xiàn)額外的論文,并通過引用機制產(chǎn)生更多論文,如此循環(huán)下去。2.2.14學(xué)術(shù)尋租科研人員在研究方向的選擇上存在利益沖突,學(xué)術(shù)部門(和研究者個人)的目標(biāo)變成了盡可能獲得引用和榮譽,從而犧牲了研究方向的客觀性。比如,很多人卡在某個科研“角落”中,僅僅因為這對他們的職業(yè)生涯和學(xué)術(shù)組織更有利。2.2.15偽經(jīng)驗主義或Pinker問題很多人都在討論統(tǒng)計學(xué)意義并不顯著的“證據(jù)”,或者使用對隨機變量完全不適用且毫無信息量的統(tǒng)計指標(biāo),比如推斷肥尾變量的均值或者相關(guān)性。這一點源于:(i)統(tǒng)計學(xué)教學(xué)上對高斯分布和其他薄尾變量的強調(diào)。(ii)死記硬背統(tǒng)計術(shù)語的時候缺乏對統(tǒng)計知識的理解。(iii)對于維度性質(zhì)毫無概念。上述幾條在社會科學(xué)研究者中很常見。偽經(jīng)驗主義的例子有:比較恐怖襲擊或埃博拉病毒等流行病的致死率(肥尾)和從梯子上跌落的死亡率(薄尾)。這種看似實證的“實證主義”是現(xiàn)代科學(xué)研究中的一種頑疾,在多維和肥尾條件下完全失效。實際上,我們并不需要區(qū)分肥尾和高斯隨機變量就可以看出這種行為的不嚴(yán)謹(jǐn)性:沒有達(dá)到簡單的統(tǒng)計顯著性標(biāo)準(zhǔn)——這些操作者也不理解顯著性這個概念。2.2.16前漸進性數(shù)學(xué)上的統(tǒng)計研究一般聚焦于當(dāng)n=1(n為求和的數(shù)目)和n=∞的情況。而真實世界正是處于中間的那部分——這也是本書的核心。部分分布(方差有限)對于n=∞的漸進極限是高斯分布,但是對于n很大又不為無窮的情況并不成立。2.2.17隨機化將確定性變量隨機化的方式有兩種:(i)較為簡單的二元方法;(ii)通過更復(fù)雜的連續(xù)或離散分布實現(xiàn)。(i)假設(shè)s為確定性變量,我們以雙狀態(tài)伯努利分布來進行隨機化(入門級別),假定以概率p取s1,概率1-p取s2。該變換以ps1+(1-p)s2=s的形式保留了變量的均值s,當(dāng)然,我們也可以通過相同的方式保留變量的方差,等等。(ii)我們可以使用一個完整的統(tǒng)計分布,雙尾條件下一般是高斯分布,單尾條件下一般是對數(shù)正態(tài)分布或指數(shù)分布(很少會用冪律分布)。當(dāng)s為標(biāo)準(zhǔn)差的時候,我們可以隨機化s2,它變成了“隨機波動率”,該波動率的方差或標(biāo)準(zhǔn)差一般被稱為“Vvol”。2.2.18在險價值(VaR),條件在險價值(CVaR)對于某隨機變量x,分布函數(shù)為F,某參數(shù)λ,VaR的數(shù)學(xué)表達(dá)為:然后,相應(yīng)λ下的CVaR或預(yù)期損失ES為:或者反過來在正的定義域上,考慮X的正向尾部。一般來說,參數(shù)k的預(yù)期損失為2.2.19風(fēng)險共擔(dān)風(fēng)險共擔(dān)是一種過濾機制,強迫做菜的廚師品嘗自己做的食物,讓他們暴露在自身問題的風(fēng)險之中,這樣一來就可以將危險分子驅(qū)逐出去。能夠“風(fēng)險共擔(dān)”的領(lǐng)域包括:管道維修、牙齒診療、外科診療、工程建造,這些領(lǐng)域的從業(yè)者以有形的工作成果被外界評估,在職業(yè)生涯斷送或破產(chǎn)的風(fēng)險下從事職業(yè)活動。無法“風(fēng)險共擔(dān)”的領(lǐng)域包括:互相引用的學(xué)術(shù)界。學(xué)術(shù)領(lǐng)域的從業(yè)者只依賴同儕的相互評估而非從真實世界中獲得反饋。2.2.20MS圖MS圖(maximumtosum)表示最大單一觀測對某階矩的貢獻(xiàn)(隨著n不斷變大),我們可以觀察到大數(shù)定律的行為。對隨機變量X來說,在MS圖上觀察給定樣本的高階矩表現(xiàn)是一種判定的收斂性的簡易方法[或者看看是否存在]。其中一種做法如圖10.3所示。根據(jù)對變量極大值的統(tǒng)計,MS圖的原理正是大數(shù)定律[184]。對于獨立同分布的非負(fù)X1,X2…Xn,假設(shè)對于,那么隨著這里為求和函數(shù),然后為極大值函數(shù)(對于存在負(fù)值的隨機變量X,我們也可以采用取絕對值的形式來求奇數(shù)階矩)。2.2.21最大吸引域(MDA)極值分布考慮的是隨機變量的最大值,當(dāng)(分布的“右端點”)在最大吸引域上[116],也可以表示為:2.2.22心理學(xué)文獻(xiàn)中的積分替換心理學(xué)文獻(xiàn)中經(jīng)常有如下混淆:假設(shè)為某一閾值,f(.)是概率密度函數(shù),并且是超過K的概率,g(x)是影響函數(shù)。定義I1是超過K之上的期望收益:而I2是K處的影響乘以超過K的概率:這里很容易混淆的是I1和I2,g(.)在K以上是常數(shù)的時候[比如,階躍θ函數(shù)]兩者相等。對一階導(dǎo)為正的g(.)來說,I1和I2只有在薄尾分布下才比較接近,在肥尾條件下會相去甚遠(yuǎn)。2.2.23概率的不可分拆性(另一個常見誤區(qū))定義是導(dǎo)數(shù)為f的概率分布,以及是測量函數(shù)或“收益函數(shù)”,那么對于的子集在離散分布下,假設(shè)概率質(zhì)量函數(shù)π(.):這里的思想在于,概率只是積分等式中的核,而不是決策之外的最終結(jié)果。2.2.24維特根斯坦的尺子“維特根斯坦的尺子”是一個哲學(xué)比喻:我們是在用尺子量桌子還是在用桌子量尺子?這主要取決于結(jié)果。假設(shè)存在兩種分布:高斯分布和冪律分布,我們認(rèn)為,當(dāng)出現(xiàn)一個超大偏差的時候,比如“6個標(biāo)準(zhǔn)差”事件意味著原分布屬于冪律分布。2.2.25黑天鵝總的來說,有些事件在你的預(yù)期和建模能力之外,而且其效應(yīng)極為顯著。好的方法不是去預(yù)測它們,而是對它們產(chǎn)生的影響呈現(xiàn)出凸性(至少不是凹性):我們能了解自身對某類事件的脆弱性,甚至可以對其量化衡量(考量二階影響和結(jié)果的非對稱性),但是想對它們做可信的統(tǒng)計處理基本上是癡心妄想。這一點向來很難跟建模人員解釋清楚,我們需要和從未見過(甚至從未想過)的事物共處,但事實就是這樣。\h[1]注意認(rèn)知的維度。黑天鵝和觀察者相關(guān):火雞的黑天鵝對屠夫來說是白天鵝。9·11恐怖襲擊事件對受害者來說是黑天鵝,但對恐怖分子不是。這種觀察者依賴是一種中心化的性質(zhì)。一個所謂的“客觀”的黑天鵝概率模型不僅不存在,而且是對其自身意義的消解,因為它自身就在散播信息的不完備性。灰天鵝:統(tǒng)計性質(zhì)上穩(wěn)定、低頻且有重大影響的大偏差被稱為“灰天鵝”。當(dāng)然,“灰”的程度取決于觀察者:冪律分布使用者的灰天鵝對困在薄尾框架體系下的天真的統(tǒng)計學(xué)家來說就是黑天鵝。重申一下:黑天鵝不是肥尾,只是肥尾會讓它們變得更糟糕。肥尾和黑天鵝的聯(lián)系在于,肥尾區(qū)域的大偏差會放大黑天鵝的影響。\h[1]正如保羅·波爾泰西常說的(這里可能是正確或是誤用了他的話)那樣:“你從未見過分布的另一面?!?.2.26經(jīng)驗分布會超出經(jīng)驗經(jīng)驗分布的生存函數(shù)定義如下,假設(shè)X1,X2…Xn為獨立同分布實隨機變量,具有共同的累積分布函數(shù)F(t)。這里是指示函數(shù)。由格利文科-坎泰利定理可知,無論初始分布如何,最大范數(shù)都會收斂到單一分布,可以通過科爾莫戈羅夫-斯米爾諾夫檢驗來驗證:這種和分布無關(guān)的收斂性主要考慮的是概率,而不是矩——本書作者由此出發(fā),探究了最大值之上的“隱藏矩”。我們可以看到如下結(jié)果(因為知道極值為0和1,頓斯科將其進一步轉(zhuǎn)化為布朗橋):“經(jīng)驗分布會超出經(jīng)驗”的意思是,經(jīng)驗分布一定會出現(xiàn)在某區(qū)間[xmin,xmax],此時肥尾分布會帶來巨大的問題,因為我們不是在概率空間,而是在收益空間分析肥尾。更進一步的內(nèi)容見隱藏的尾部(下一小節(jié))。2.2.27隱藏的尾部假設(shè)Kn為n個獨立同分布隨機變量樣本的最大值,Kn=max(X1,X2…Xn),假設(shè)X分布的密度函數(shù)為,我們可以將矩分解為兩部分,在K0以上的部分為“隱藏矩”。這里μL是分布中可觀察的部分的矩,而μK是隱藏部分的矩(大于K)。格利文科-坎泰利定理告訴我們,μK,0應(yīng)該和X的分布無關(guān)。但是這一條對高階矩并不成立,所以科爾莫戈羅夫-斯米爾諾夫檢驗在這里存在問題。2.2.28影子矩影子矩在本書中被稱為通過“插入式”估計來求解的矩。它不是直接用可觀察的樣本求均值,而是通過對分布參數(shù)進行最大似然估計(如使用最大似然參數(shù)尾部指數(shù)α)得出影子均值。因為在肥尾條件下直接可觀察的樣本均值存在偏差。2.2.29尾部依賴假設(shè)X1和X2是兩個不一定為同分布類型的隨機變量,假設(shè)是概率為q的逆CDF,也即,上尾依賴可以定義為:下尾依賴的定義與此類似。2.2.30元概率通過將變量隨機化這樣的技巧來比較兩個不同的概率分布。或是隨機化某個參數(shù)以得到對應(yīng)的分布,如看漲期權(quán)價格,VaR、CVaR等風(fēng)險指標(biāo),并檢驗結(jié)果分布的魯棒性或凸性。2.2.31動態(tài)對沖標(biāo)的為S,到期時間為T的歐式看漲期權(quán)C的收益可以通過如下動態(tài)對沖的方法得到復(fù)制,在當(dāng)前時間t和T之間:我們將時間區(qū)間分成n個,這里的對沖比率是在時刻計算的,但是我們在股票上得到的是對沖時刻和之間的價格差。理論上,的時候會使上式收斂到確定性收益。在高斯世界中,上式為伊藤-麥肯積分。但在這里我們看到,在肥尾條件所伴隨的漸進性質(zhì)下,這樣的動態(tài)復(fù)制完全不可能實現(xiàn)。第一部分肥尾及其效應(yīng)介紹第三章非數(shù)理視角概述——劍橋大學(xué)達(dá)爾文學(xué)院講義*,?\h[1]本章濃縮了整個肥尾效應(yīng)項目的主要思想,對研究結(jié)果進行了非數(shù)理視角的全面展示,同時匯總了厚尾條件下的一系列統(tǒng)計推論。\h[1]研究討論章節(jié)。2017年1月27日,作者在英國劍橋大學(xué)達(dá)爾文學(xué)院講授了本章的簡化版本。在這里,作者誠摯地感謝李約瑟,朱利葉斯·魏茨德費爾,以及他們的助手耐心、準(zhǔn)確地把講座轉(zhuǎn)錄成文本。同時還感謝蘇珊·普凡嫩施密特和奧利·彼得斯對一些錯誤的修正。另外,在賈米勒·巴茲的建議下,本章添加了更多注釋,以方便經(jīng)濟學(xué)家和計量經(jīng)濟學(xué)家理解,說不定最終能獲得他們的認(rèn)可。3.1薄尾和厚尾的差異我們通過劃分平均斯坦(薄尾)和極端斯坦(厚尾)這兩個類別來介紹厚尾的概念,由此展開對厚尾和極端值的關(guān)系的研究?!ぴ谄骄固怪校S著樣本量逐漸擴大,沒有任何單一的觀測可以真正改變統(tǒng)計特性?!ぴ跇O端斯坦中,尾部(罕見事件)在決定統(tǒng)計特性方面發(fā)揮了極大的作用。另外一種視角:假設(shè)有一個很大的偏離X?!ぴ谄骄固怪校S機變量連續(xù)兩次大于X的概率大于單次大于2X的概率。·在極端斯坦中,隨機變量單次大于2X的概率大于連續(xù)兩次大于X的概率。接下來,我們在平均斯坦中隨機選擇兩個人,假設(shè)兩人身高之和為4.1米(一個極小概率的尾部事件)。根據(jù)高斯分布(或者類似特性的單尾分布),最可能的情況是,兩人的身高均為2.05米,而不是10厘米和4米。簡單來說,出現(xiàn)3個標(biāo)準(zhǔn)差之外事件的概率是0.00135,出現(xiàn)6個標(biāo)準(zhǔn)差(翻了一番)之外事件的概率為9.86×10?10,而連續(xù)兩次出現(xiàn)3個標(biāo)準(zhǔn)差之外事件的概率為1.8×10?6。因此,連續(xù)兩次出現(xiàn)3個標(biāo)準(zhǔn)差事件的概率遠(yuǎn)大于一次出現(xiàn)6個標(biāo)準(zhǔn)差事件的概率,這也是非厚尾分布帶來的結(jié)果。在圖3.1中,我們從出現(xiàn)兩個3倍標(biāo)準(zhǔn)差事件的概率除以6倍標(biāo)準(zhǔn)差事件的概率出發(fā),擴展到計算出現(xiàn)兩個4倍標(biāo)準(zhǔn)差事件的概率除以一個8倍標(biāo)準(zhǔn)差事件的概率,等等。越往尾部延展(圖3.1的右側(cè)),我們會看到大偏差更可能來自多個中等偏差的和。換句話說,如果發(fā)生了一個很糟糕的事件,那么它應(yīng)該來自一系列不太常見的事件,而不是來自單次極端事件,這正是平均斯坦遵循的邏輯。圖3.1在高斯分布*下,出現(xiàn)兩次K和一次2K標(biāo)準(zhǔn)差事件之間的比值。K越大,即越處于尾部,極端事件來自兩次獨立K事件的可能性越大,即P(K)2,而來自一次2K事件的可能性越小。*這是為教學(xué)而做的簡化。更嚴(yán)謹(jǐn)?shù)姆椒ㄊ潜容^出現(xiàn)兩次K和一次2K+1標(biāo)準(zhǔn)差事件的比值——但上圖的最終結(jié)果不變。接下來我們轉(zhuǎn)到極端斯坦,同樣隨機選取兩個人,且他們的財富之和為3600萬美元。這時最可能的情況不是兩人都有1800萬美元,而是一人擁有35999000美元,另一個人擁有1000美元。這個例子清晰地展示了兩個大類之間的差異,對于亞指數(shù)類分布來說,破產(chǎn)更可能來自某次極端事件,而不是一系列糟糕事件的累積。這一邏輯在20世紀(jì)早期由精算學(xué)家菲利普·倫德伯格提出[155],到20世紀(jì)30年代由哈拉爾德·克拉默整理完善[51],對傳統(tǒng)風(fēng)險管理理論形成了巨大挑戰(zhàn)。但如今,很多經(jīng)濟學(xué)家完全忽視了這一點。從保險的角度講,分散化有效的前提是,損失更可能來自一系列事件而不是單個事件。這一點也說明,保險只能在平均斯坦中起作用,在存在巨災(zāi)風(fēng)險的情況下,永遠(yuǎn)不要出售一種損失無上限的保險,這一點被稱為災(zāi)難原則。正如我們之前所見,偏離中心很遠(yuǎn)的極端事件扮演了非常重要的角色。黑天鵝的核心并非“頻繁出現(xiàn)”(這個詞經(jīng)常被這樣誤用),而在于出現(xiàn)時的影響更大。最肥的肥尾分布只會有一次非常大的極端偏離,而不是多次較大的偏離。下一章的圖4.4顯示,如果我們采用像高斯那樣的分布并開始逐漸增肥尾部,那么超過給定標(biāo)準(zhǔn)差的樣本數(shù)量就會下降。事件落在一個標(biāo)準(zhǔn)差范圍內(nèi)的概率是68%。隨著尾部增肥,以金融市場的回報為例,一個事件落在一個標(biāo)準(zhǔn)差內(nèi)的概率會上升到75%至95%。所以請注意,尾部增肥會讓峰度更高,肩部縮小,發(fā)生大偏差的概率會增加。這是因為,概率之和為1(哪怕在法國也是如此),概率密度在某一區(qū)域的升高會導(dǎo)致另一區(qū)域密度的降低。3.2直觀理解:搖尾巴的狗狗尾搖狗效應(yīng)總的來說,分布的尾部越厚,狗尾搖狗的作用越大。也就是說,信息主要集中在尾部,而較少存在于分布的“軀干”(中心部分)。實際上,對極度厚尾的現(xiàn)象來說,除了真正的尾部大偏差,所有普通偏差包含的信息量都很小。這樣一來,分布的中間部分完全變成了噪聲,雖然“基于實證”的科學(xué)研究可能無法理解這一點。但在此類情況下,中心部分并不包含“實證”的信息。該性質(zhì)也解釋了在存在尾部大偏差的領(lǐng)域中,由于單次樣本的信息含量很低,大數(shù)定律作用緩慢。該性質(zhì)還解釋了為什么觀察到100萬只白天鵝依然不能否認(rèn)黑天鵝的存在,或者為什么進行100萬次肯定性觀察還趕不上一次否定性觀察。在本章后面我們會將其與波普爾的非對稱性聯(lián)系起來。它也解釋了為什么人們永遠(yuǎn)不該比較由尾部驅(qū)動的隨機變量(如流行病)和由軀干驅(qū)動的隨機變量(如在游泳池中溺水的人數(shù))。可以參考論文中系統(tǒng)性風(fēng)險對政策制定的啟示(西里洛、塔勒布,2020)[48]。圖3.2兩個獨立高斯分布的密度等高線。直線為x+y=4.1,可以直觀地看到,最大概率出現(xiàn)在x=y=2.05處。圖3.3兩個獨立厚尾分布的密度等高線(冪律分布類),直線為x+y=36,可以直觀地看到,最大概率出現(xiàn)在x=36?ε或y=36?ε處,隨著x+y變大,ε會趨于0。圖3.4和圖3.3相同的密度等高線,但是輔助直線和冪律分布的外側(cè)等高線相切。我們可以看到,等高線越來越像一個十字,用術(shù)語表示為聯(lián)合分布失去了橢圓特性。3.3一種(更合理的)厚尾分類方式及其效應(yīng)下面我們先以一種簡單的分類來考量厚尾的程度(本書后面會逐步深入展開),不同分布按厚尾的嚴(yán)重程度排序如下:分布特征:厚尾分布?亞指數(shù)分布?冪律分布(帕累托分布)排在前面的是入門級厚尾分布,這一類包括了所有尾部厚度超過正態(tài)的分布,如在一個正負(fù)標(biāo)準(zhǔn)差之內(nèi)的概率大于﹝誤差函數(shù)erf是高斯分布的積分﹞且峰度高于3﹝隨機變量X的p階矩是X的p次方的期望,﹞的各類分布。排在第二的是滿足我們之前實驗的亞指數(shù)分布(災(zāi)難原則),在觸及冪律分布之前,這類分布并不算真正意義上的厚尾,因為其統(tǒng)計性質(zhì)并不由罕見事件主導(dǎo)。換句話說,這類分布的各階矩依然存在。排在第三的分布有很多種名稱,有的被稱為冪律分布,有的被稱為正規(guī)變化分布,或“帕累托尾”分布。這些才是真正的厚尾分布,且肥尾程度依賴于其尾部參數(shù)。這里暫時不展開討論尾部參數(shù),我們可以認(rèn)為這類分布的某階矩?zé)o窮大,并且高于該階的矩均為無窮大。下面我們對著圖3.6從下往上看,最左下角的是退化分布,只有一種可能的結(jié)果(不存在隨機性,沒有變化)。在這之上是伯努利分布,只有兩種可能的結(jié)果,沒有其他可能性。再往上是兩種高斯分布,分別為自然高斯分布(允許出現(xiàn)正負(fù)無窮)和從隨機游走中求和而來的高斯分布(緊支撐,除非我們用無窮多的變量來求和﹝緊支撐的意思是,實數(shù)隨機變量X在一個有界范圍內(nèi)取值,如[a,b]、(a,b]、[a,b)等等。由于高斯分布有偏差呈指數(shù)e?x2下降的趨勢,所以阿德里安·杜阿迪等人把高斯分布?xì)w為緊支撐。﹞)。這兩種高斯分布完全不同,一個允許到無窮,另一個不允許(極限趨近不算)。然后,在高斯分布之外是不屬于冪律類分布的亞指數(shù)分布,這類分布的各階矩都存在。亞指數(shù)分布包含對數(shù)正態(tài)分布,這里我們經(jīng)常搞混,這也是統(tǒng)計領(lǐng)域中最奇怪的事情之一,對數(shù)正態(tài)分布在方差較小的時候是薄尾分布,而在方差較大的時候是厚尾分布。有些人看到手上的數(shù)據(jù),發(fā)現(xiàn)不是冪律分布而是對數(shù)正態(tài)分布,以為是件好事,但事實并非如此。第八章我們會展開討論對數(shù)正態(tài)分布的奇怪特性。圖3.5當(dāng)觀測值數(shù)目n增大時,均值的分布會發(fā)生怎樣的變化?這是圖3.5在分布/概率空間的表達(dá)。肥尾分布并不像高斯分布那樣很快就壓縮到中心。你需要更大的樣本集來求解,事實就是這樣。圖3.6不同收斂性下的厚尾分類圖(大數(shù)定律的收斂性)以及經(jīng)驗外推問題的嚴(yán)重程度,冪律分布類用白色表示,其余用黃色表示,見恩布列切等[82]。亞指數(shù)類中的分布不滿足克拉默條件,從而使保險成為可能,可以回顧本章開始時的小實驗(如圖3.1所示)。更嚴(yán)謹(jǐn)?shù)刂v,克拉默條件意味著隨機變量的指數(shù)期望存在。﹝數(shù)學(xué)描述:假設(shè)有隨機變量X,克拉默條件意味著:對所有r>0,是求期望操作符。﹞一旦離開了黃色區(qū)域,也即大數(shù)定律(LLN)起作用的區(qū)域\h[1],中心極限定律將不再有效\h[2],然后將面臨收斂性問題。在這里,我們會遇到冪律分布,將根據(jù)尾部指數(shù)α來區(qū)分其厚尾程度,尾部指數(shù)越小,尾部越肥。當(dāng)時,我們稱其為超立方分布(α=3時是立方分布)。按照非正式的邊界劃分:分布只存在一階矩和二階矩,此時理論上大數(shù)定律和中心極限定理依然有效。然后是的分布類,我們簡單歸納為列維穩(wěn)定分布[雖然該類也包含α<2的冪律分布,但在理論上,當(dāng)我們對該類隨機變量求和時,由于廣義中心極限定理(GCLT)的存在,總和最終會落在和原來相同的分布類型中,而不是向高斯分布收斂]。從這里開始我們會遇到一些問題,因為方差不再存在。在的情況下,雖然方差不存在,但是平均絕對偏差依然存在(變量的平均絕對值差異)。再往上到最外層頂部,連均值都不存在了。我們將其稱為“別想了”。如果看到這一類分布,你就徑直回家,不用再談?wù)撍恕鹘y(tǒng)的統(tǒng)計學(xué)家來說,處理厚尾的方法向來是假設(shè)一個不同于正態(tài)的分布,然后一切照舊,使用相同的統(tǒng)計指標(biāo)、統(tǒng)計測試和置信度區(qū)間進行研究。而一旦離開上述黃色區(qū)域,再使用常規(guī)統(tǒng)計手段,事情就不像我們想的那樣了。下一節(jié)我們會介紹隨之而來的十幾個衍生問題,幾乎都是終極問題。后面我們會引入一些術(shù)語,并給出更數(shù)量化的表達(dá)。將統(tǒng)計過度標(biāo)準(zhǔn)化帶來的問題統(tǒng)計估計基于兩大基本元素:中心極限定理(假設(shè)對“大量”變量求和成立,從而很方便地將一切都?xì)w到正態(tài)分布上)和大數(shù)定律(當(dāng)樣本規(guī)模增加的時候預(yù)測方差降低)。但是事情并沒有那么簡單,我們需要考慮一些注意事項。在第八章中,我們將展示取樣是如何依賴于分布,并在同一分布類中展現(xiàn)出巨大差異的。布紹和波特[27]與索內(nèi)特[214]認(rèn)為,在隨機變量求和的過程中,某些方差有限但高階矩?zé)o限的分布可以在的范圍內(nèi)收斂到高斯分布,也即在這個中心范圍內(nèi)成為高斯分布,但是較遠(yuǎn)的尾部區(qū)域則不再如此——而恰恰是較遠(yuǎn)的尾部決定了主要的統(tǒng)計性質(zhì)。人生正是在漸進過程中展開的。遺憾的是,在經(jīng)典的《統(tǒng)計學(xué)百科全書》[147]關(guān)于統(tǒng)計估計的條目中,霍夫丁寫道:統(tǒng)計量的實際分布通常非常復(fù)雜,很難進行處理。因此,人們需要更簡單、性質(zhì)更清晰的分布來近似描述實際分布。而概率論中的極限定理為這種近似提供了重要工具。經(jīng)典的中心極限定理表明,一般情況下,大量獨立隨機變量的和近似于正態(tài)分布。實際上,在所有可能的分布中,正態(tài)分布占絕對主導(dǎo)地位。這里引用格涅堅科和科爾莫戈羅夫的論述([111],第5章):然而,對于限制獨立隨機變量的和分布收斂到正態(tài)分布這一規(guī)律,除了通過使變量無窮?。ɑ驖u近于常數(shù)),就只有對求和本身進行限制了。如果想要收斂到另一種極限分布,則求和函數(shù)本身需要一些非常特殊的性質(zhì)。此外,許多統(tǒng)計量的漸進行為類似于獨立隨機變量的和。上述這些都有助于解釋正態(tài)分布作為漸進分布的重要性。那么,在尚未達(dá)到高斯分布時應(yīng)該怎么辦?我們的人生對應(yīng)的是漸進階段,這也是本書要探討的內(nèi)容。\h[3]\h[1]讀者目前可以將大數(shù)定律(LLN)簡單理解如下:如果有一個分布存在有限的均值,并且不斷將獨立的該分布隨機變量相加求平均——也就是說,隨著樣本量逐漸變大——最終結(jié)果會收斂到均值。收斂速度有多快呢?這正是本書討論的關(guān)鍵問題。\h[2]我們之后將不斷討論中心極限定理(CLT),不過這里先給出直觀的解釋:在二階矩有限的情況下,n個獨立隨機變量的和最終會逼近高斯分布。這個事兒很神奇,但速度有多快呢?從理論上說,從冪律分布出發(fā)需要無窮多的隨機變量求和,也就是說幾乎永遠(yuǎn)不會達(dá)到高斯分布。第七章會討論極限分布并回答其核心問題:CLT和LLN的收斂速度“有多快”?速度有多快是一件非常重要的事情,因為在現(xiàn)實世界中,我們根本找不到n等于無窮大的東西。\h[3]這里邀請本書讀者查閱各類教科書或在線百科全書中的“統(tǒng)計估計”條目?;旧喜豢赡艹霈F(xiàn)“如果沒有達(dá)到漸進極限會發(fā)生什么”的相關(guān)討論——即使是9500頁的經(jīng)典《統(tǒng)計學(xué)百科全書》也沒有提及。此外,如果問一個經(jīng)常使用統(tǒng)計方法的人,不同分布下需要多少數(shù)據(jù)來估計統(tǒng)計量,你不要驚訝于其荒謬的回答。主要問題在于,人們的大腦中裝了太多統(tǒng)計工具,而他們從未進行過深入推理。用一句格言來總結(jié):“統(tǒng)計從來都不是標(biāo)準(zhǔn)的?!?.4肥尾分布的主要效應(yīng)及其與本書的關(guān)聯(lián)圖3.7衡量不公平的測度(比如基尼系數(shù))在厚尾條件下需要完全不同的估計方法,我們會在第三部分討論這個問題。追求科學(xué)并不容易。當(dāng)移到上述黃色區(qū)域(經(jīng)典統(tǒng)計的舒適區(qū))之外時,會出現(xiàn)如下效應(yīng):效應(yīng)1在現(xiàn)實世界中,大數(shù)定律即便有效,其奏效速度也會很慢。讀者可能無法想象,僅這一條就否定了絕大多數(shù)統(tǒng)計估計方法,如圖3.8所示。在第八章我們會進一步討論,區(qū)分統(tǒng)計估計不同類型的分布所需的樣本量。\h[1]效應(yīng)2樣本均值大概率不會貼近分布的實際均值,尤其是遇到偏態(tài)分布(或單尾分布)時,均值的估計量會持續(xù)被小樣本效應(yīng)主導(dǎo)(即被低估或高估)。這是樣本不足問題的另一種體現(xiàn),沒有一個極度厚尾-單尾分布可以用樣本均值來估計總體均值,想要直接估計的前提是擁有近乎無限的數(shù)據(jù)。\h[2]比如,一般的冪律分布(符合80/20法則的分布)會有92%的觀察值落在真實均值以下。為了讓樣本均值有意義,我們需要遠(yuǎn)遠(yuǎn)超出我們正常所能擁有的數(shù)據(jù)量(經(jīng)濟學(xué)專家從未真正理解這一點,但交易員對此有直觀感受)。針對這一問題,我們會在章節(jié)3.8繼續(xù)討論,并在第十五章“影子均值”中詳細(xì)論證。此外,在章節(jié)3.8中,我們還會進一步介紹隱藏統(tǒng)計量的概念,不僅是均值,用樣本來估計總體也會導(dǎo)致方差被低估。圖3.8大數(shù)定律體現(xiàn)了樣本均值收斂的速度,而在極端斯坦下收斂速度極慢。這里以高斯分布和尾部指數(shù)1.13的帕累托分布為例(帕累托80/20分布),保持上述分布的絕對平均偏差相同并觀察收斂效果。該結(jié)論適用于所有需要樣本統(tǒng)計的領(lǐng)域,比如投資組合理論。效應(yīng)3方差和標(biāo)準(zhǔn)差這樣的統(tǒng)計量是不可用的。即使分布背后的統(tǒng)計量存在,甚至各階統(tǒng)計量均存在,它們在樣本之外也一定會失效,這一點我們會在第四章展開討論。很多人喜歡用標(biāo)準(zhǔn)差(經(jīng)常被誤認(rèn)為是平均偏差)作為衡量離散程度的指標(biāo),這屬于一種看似科學(xué)的謬誤,因為只有在最理想的情況下,標(biāo)準(zhǔn)差才能勉強地正確估計離散程度。效應(yīng)4貝塔系數(shù)、夏普比率和其他慣用的金融統(tǒng)計量均無參考意義。這是上一條效應(yīng)的簡單推論。\h[3]如果依賴這些統(tǒng)計量,我們要么需要更多的數(shù)據(jù),要么需要某種尚未被發(fā)現(xiàn)的模型。圖3.9展示了夏普比率在樣本外的糟糕的預(yù)測能力——幾乎起到完全相反的效果。然而,很多人還是執(zhí)迷不悟,沉浸在看似科學(xué)的分析數(shù)字中。圖3.9橫軸代表各個對沖基金在2008年之前的夏普比率,縱軸代表它們在金融危機中損失的標(biāo)準(zhǔn)差。夏普比率不僅對樣本之外的表現(xiàn)完全沒有預(yù)測作用,甚至不能作為一個有效防止破產(chǎn)的指標(biāo)。感謝拉斐爾·杜阿迪。實際上,所有經(jīng)濟金融領(lǐng)域的變量和證券回報都是厚尾分布的。我們統(tǒng)計了超過4萬只證券的時間序列,沒有一只滿足薄尾分布,這也是經(jīng)濟金融研究中最大的誤區(qū)。理論金融學(xué)家有時會得出一些極其不嚴(yán)謹(jǐn)?shù)慕Y(jié)論,如“哪怕收益是厚尾分布的,只要分布的前兩階矩存在,均值方差投資組合理論就成立”(這實際上是加入了分布橢圓特性的條件,后面會進一步討論)。實際上,即使存在方差,我們也不知道其精確性如何。一個隨機變量二階矩的尾部會比該變量本身的尾部更厚,所以,統(tǒng)計量服從極其緩慢的大數(shù)定律。而且,隨機變量的相關(guān)性或協(xié)方差也會以厚尾的形式存在(失去橢圓特性),從而使統(tǒng)計估計失效。在經(jīng)濟學(xué)術(shù)領(lǐng)域,所有使用協(xié)方差矩陣的論文都很可疑。詳情見第四章(單變量分布)和第六章(多變量分布)。效應(yīng)5穩(wěn)健統(tǒng)計并不穩(wěn)健,經(jīng)驗估計會超出經(jīng)驗。以我個人的經(jīng)歷為例,穩(wěn)健統(tǒng)計的概念如同一個惡作劇,但是絕大多數(shù)專家并未意識到它有多么可笑。首先,穩(wěn)健統(tǒng)計尋求一種既不想對統(tǒng)計框架進行大改動,又想要處理尾部事件的方法論。這是一種完全錯誤的穩(wěn)健概念:如果統(tǒng)計量不隨尾部事件發(fā)生大幅變化,可能僅僅因為樣本包含的尾部信息不足。而且,這種方法對研究期望收益毫無幫助。其次,穩(wěn)健統(tǒng)計屬于“非參估計”,人們一般認(rèn)為,不引入?yún)?shù)可以讓整個分析變得不太依賴于底層分布,但實際上,這樣做只會讓事情變得更糟糕。移除樣本極值的縮尾法會扭曲期望值,并讓信息減少——不過檢查一下異常值也好,看看它到底是真實的異常還是“數(shù)據(jù)錯誤”(筆誤或計算機故障)造成的偽異常。所謂非參數(shù)的“經(jīng)驗分布”完全沒有經(jīng)驗性的借鑒意義(而且會在尾部的期望收益上造成誤導(dǎo)),至少在金融和風(fēng)險管理領(lǐng)域是這樣的,第十章會進一步討論。這里可以簡單解釋如下:如果沒有科學(xué)的外推方法,從過去的數(shù)據(jù)中簡單估計未來的極值,偏差會很大。這就像有人想通過修筑堤壩來防止洪水,簡單的“經(jīng)驗”分布會基于歷史最高水位,也就是說,更高水位的概率為0。但是反過來想,歷史最高水位在成為最高水位之前肯定要超越之前的最高水位,因此,經(jīng)驗分布已經(jīng)被突破。在厚尾分布下,過去極大值和未來期望極大值的差異會遠(yuǎn)遠(yuǎn)大于薄尾分布。效應(yīng)6最小二乘線性回歸失效(高斯-馬爾可夫定理不成立)。如圖3.10所示,最小二乘回歸背后的原理是高斯-馬爾可夫定理,要求變量滿足薄尾分布,這樣才能通過所有數(shù)據(jù)點擬合出唯一的直線。而在肥尾條件下,我們需要遠(yuǎn)遠(yuǎn)多于預(yù)期的數(shù)據(jù)來最小化偏差平方和(高斯-馬爾可夫定理依然成立,但是現(xiàn)實世界的數(shù)據(jù)是有限的,而不是無限的,所以其效果近似于不成立),或者因為變量二階矩不存在,我們可能無法求解。在二階矩不存在的情況下,如果僅僅最小化平均絕對偏差(MAD),一方面我們會面臨數(shù)據(jù)不足的問題,另一方面我們求得的斜率也可能不唯一。圖3.10在厚尾條件下,我們可以對同樣的樣本擬合出完全不同的直線(線性回歸所需的高斯-馬爾可夫定理不再成立)。左圖:常規(guī)回歸的結(jié)果。右圖:嘗試補償大偏差得出的回歸線——可以看作某種“對沖比率”,補償了大偏差但是對小偏差數(shù)據(jù)的誤差很大,如果忽視大偏差,結(jié)果就是災(zāi)難性的。這里的樣本并不包含大偏差值,但回歸時會通過“影子均值”的方法進行估計。我們在章節(jié)6.7中會進一步討論,由于厚尾的小樣本效應(yīng),回歸樣本內(nèi)的決定系數(shù)(R2)遠(yuǎn)遠(yuǎn)大于真實值。當(dāng)隨機變量方差無窮大的時候,R2應(yīng)該等于0。但是,因為回歸樣本量必然有限,R2會給出高于0的欺騙性結(jié)果。因此,在厚尾條件下,R2不僅完全沒有意義,還會因為高估時不時產(chǎn)生十足的欺騙作用(就像智商研究一樣)。效應(yīng)7極大似然估計對于部分分布參數(shù)的估計依然有效(好消息)。以冪律分布為例,我們可以估計其分布的形狀參數(shù)和尾部指數(shù)(本書用α表示\h[4]),以幫助我們更好地理解分布,然后從分布反向估計均值,其效果會遠(yuǎn)好于直接用樣本均值估計整體期望。示例:一個簡單帕累托分布(最小值L,尾部指數(shù)α,的期望是(一個和α相關(guān)的函數(shù))。因此,我們可以從這兩個參數(shù)出發(fā)(其中一個已知),通過插入式估計量獲得均值。我們可以直觀估計α(或者采用低方差的極大似然估計,這里α滿足倒伽馬分布),然后計算得到均值。這樣的均值估計比直接求樣本均值要準(zhǔn)確得多。讓我們再強調(diào)一下上述邏輯:通過擬合尾部指數(shù)α的方法,可以獲得數(shù)據(jù)中沒有出現(xiàn)的小概率尾部信息,而且該信息對分布均值有巨大的影響。這一方法可以推廣到基尼系數(shù)和其他的不平均估計量上。因此,在一些情況下,我們可以針對尾部指數(shù)構(gòu)建函數(shù),從而得到更可靠(或者至少沒有那么不可靠)的統(tǒng)計量,當(dāng)然,僅僅是在一些情況下。接下來,我們要面臨一個現(xiàn)實世界中的問題:如果沒有靠譜的統(tǒng)計量怎么辦?那最好還是在家里待著,我們不能把自己暴露在脆弱性的風(fēng)險之下。不過,如果可以鎖定最大損失,我們就可以做出承擔(dān)風(fēng)險的決策。效應(yīng)8經(jīng)驗可證實和可證偽之間的差距遠(yuǎn)比常規(guī)統(tǒng)計能覆蓋的范圍更大,即不能證明和證明不可行之間的差異變得更大了。(所謂“基于證據(jù)”的科學(xué)除非經(jīng)過嚴(yán)格的驗證,否則通常是經(jīng)驗外推的,其證據(jù)既不充分,也不算科學(xué)。)作者此前和認(rèn)知語言學(xué)家兼科普作家斯蒂芬·平克有過一次爭論:從最近的數(shù)據(jù)變化中得出結(jié)論(或歸納出理論)并不可行,除非滿足一定的置信度條件,這就需要在厚尾條件下有更多的數(shù)據(jù)(和緩慢大數(shù)定律的邏輯相同)。因此,根據(jù)最近一年或十年非自然死亡人數(shù)的下降,得出“暴力致死行為有所下降”這樣的結(jié)論并不科學(xué)。科學(xué)論斷之所以和奇聞逸事不同,是因為它對樣本外發(fā)生的事情有預(yù)測作用,統(tǒng)計意義顯著。這里我再次強調(diào),統(tǒng)計意義不顯著的結(jié)論并不算真正的科學(xué)。不過,說暴力行為在某次觀察中上升則可能是一個嚴(yán)謹(jǐn)?shù)目茖W(xué)論斷。在薄尾的情況下解讀描述性統(tǒng)計量的做法可能是可以接受的(因為顯著結(jié)論所需的樣本量不大),但在厚尾情況下肯定不行,除非包含尾部信息的超大偏差重復(fù)出現(xiàn)在樣本集中。效應(yīng)9主成分分析(PCA)和因子分析很可能會產(chǎn)生錯誤的結(jié)論。這一點比較專業(yè),通過主成分分析這樣的降維方法,樣本不足的問題可以轉(zhuǎn)換為大型隨機向量。這是大數(shù)定律問題的高維表達(dá)。圖3.26從PCA數(shù)據(jù)不足的角度很好地表述了魏格納效應(yīng)。用專業(yè)的語言表述,就是馬爾琴科-帕斯圖爾分布無法應(yīng)用于四階矩不存在的情況(或是尾部指數(shù)超過4的情況)。\h[5]圖3.11在厚尾條件下,一犯錯誤就完了;而在薄尾條件下,犯錯誤可以成為寶貴的學(xué)習(xí)機會。資料來源:《你曾有份工作》。(圖中文字為:我從犯錯中學(xué)到了太多東西,以至我想再犯點兒錯誤。)效應(yīng)10矩估計法(MoM)失效,高階矩意義不大,甚至可能不存在。當(dāng)年獲得諾貝爾獎的廣義矩估計法也不成立。里面的細(xì)節(jié)很多,可以先這么理解:如果高階矩?zé)o限大,通過矩來估計分布就行不通,因為每一組樣本都會得出一個不同的矩,正如后面所展示的標(biāo)準(zhǔn)普爾500指數(shù)四階矩。簡單來說,厚尾分布的高階矩會呈爆炸式上升,尤其是在經(jīng)濟領(lǐng)域。效應(yīng)11不存在所謂典型的大偏差。在考慮出現(xiàn)大偏差的情況下,厚尾變量的條件偏差并不收斂,尤其是在極度厚尾條件下(如冪律尾分布),這一點和我們之前看到的災(zāi)難原則類似。在高斯分布中,隨機變量變動大于4倍標(biāo)準(zhǔn)差的條件期望約等于4倍標(biāo)準(zhǔn)差。而對冪律分布來說,條件期望會數(shù)倍于該值,我們稱其為林迪效應(yīng),第五章和第十一章會進一步討論。效應(yīng)12基尼系數(shù)不可加。衡量基尼系數(shù)的方法是樣本外推法,因此還是無法擺脫上面的問題,也即樣本均值會高估或低估真實均值。這里有一個額外的復(fù)雜點,基尼系數(shù)在厚尾下具備超可加性。隨著樣本空間的增大,常規(guī)的基尼系數(shù)無法有效揭示真實的財富集中度。(換句話說,一個大陸,比如歐洲大陸,其收入的不平等程度可能超過其成員國收入不平等程度的加權(quán)值。)不僅是基尼系數(shù),這一結(jié)論同樣適用于集中度的其他衡量指標(biāo),如前1%的人擁有財富總量的x%等。第十三章和第十四章會有專門論述。效應(yīng)13大偏差理論無法應(yīng)用于厚尾。在厚尾條件下,大偏差理論完全失效。\h[6]大偏差定律在薄尾條件下非常有用(瓦拉丹[260],登博和澤圖尼[59],等),但是也僅限于此,我們會在附錄C和第七章討論極限理論時再提及。效應(yīng)14動態(tài)對沖永遠(yuǎn)不可能對沖掉期權(quán)的所有風(fēng)險。這一條也比較專業(yè),非金融領(lǐng)域的讀者可能不感興趣。金融領(lǐng)域布萊克-斯科爾斯期權(quán)定價模型的對沖基礎(chǔ)完全建立在動態(tài)對沖的可行性和必要性之上,而在第二十章和第二十一章中我們會證明兩者都存在問題。有效的動態(tài)對沖要求誤差呈指數(shù)下降,也即統(tǒng)計分布必須超出亞指數(shù)類分布。這里我們討論的實際上是克拉默條件——最終都可以歸結(jié)為指數(shù)矩問題。本書的作者是一位期權(quán)交易員,而對交易員來說,期權(quán)并不是由動態(tài)對沖的方式定價的——在整個期權(quán)交易的歷史上都是如此。效應(yīng)15預(yù)測頻率與預(yù)測期望收益有巨大差異。效應(yīng)16在心理學(xué)和決策論中,大多數(shù)有關(guān)“高估尾部概率”和“非理性行為”的結(jié)論都來自研究人員對尾部風(fēng)險的誤解。比如,混淆概率和期望收益,誤用統(tǒng)計分布,以及忽視極值理論(EVT)。上面兩點在下一章會展開討論:只考慮頻率不考慮期望的錯誤在薄尾條件下不算太嚴(yán)重,但是在厚尾條件下會有巨大影響,其結(jié)果見圖3.12和圖3.13。圖3.12心理學(xué)研究中的概率校準(zhǔn):x軸是預(yù)測者估計的概率,y軸是實際發(fā)生的概率。比如某人預(yù)測下雨的概率是30%,且實際上有30%的時間會下雨,那么這稱為“完美校準(zhǔn)”。只有在學(xué)術(shù)領(lǐng)域,我們才把這種校準(zhǔn)放在頻率空間,把現(xiàn)實生活中的錯誤預(yù)測作為一個二元事件來考量,這一點在厚尾條件下問題很大。第十一章將詳細(xì)討論這一點。圖3.13在冪律條件下,上圖對概率的估計誤差會轉(zhuǎn)變成下圖的收益誤差。這里使用的是帕累托分布(尾部指數(shù)α=1.15)。同樣,這一點第十一章將詳細(xì)討論。效應(yīng)17在厚尾條件下,破產(chǎn)問題的嚴(yán)重性更甚,同時需要考慮遍歷性。相關(guān)的討論比較專業(yè),本章末尾會有解釋。下面我們就一些要點展開討論。3.4.1預(yù)測在《隨機漫步的傻瓜》一書中,某人被問,到月底市場更有可能上漲還是下跌?他表示上漲的可能性更大,但后來發(fā)現(xiàn),他在押注市場下跌。對不懂概率的人來說,這似乎很矛盾,但是對交易員來說再正常不過了,尤其是在非標(biāo)準(zhǔn)分布的條件下(確實,市場更有可能上漲,但如果下跌會跌得更多)。這個例子表明,人們常?;煜A(yù)測和風(fēng)險敞口(預(yù)測的結(jié)果是二元的,而風(fēng)險敞口的結(jié)果更多元,取決于整個分布的狀態(tài))。在這個例子中,一個非常基本的錯誤是,將發(fā)生概率理解為單個數(shù)字而非分布結(jié)果,而在進一步研究之后,我們會發(fā)現(xiàn)很多并不明顯或不為人知的類似的悖論式問題。簡單來說,作者認(rèn)為,將“概率”作為最終標(biāo)的,甚至作為決策的“基礎(chǔ)”來討論并不嚴(yán)謹(jǐn)。在現(xiàn)實世界中,一個人所獲得的不是概率,而是直接的財富(或生存權(quán)利等)。這時,分布的尾部越肥,就越需要關(guān)心收益空間——俗話說得好:“收益遠(yuǎn)勝于概率?!比绻稿e的成本夠低,決策者可以經(jīng)常犯錯,只要收益是凸性的(也即當(dāng)他正確的時候會獲得很大的收益)。反過來說,決策者可以在預(yù)測的準(zhǔn)確率達(dá)到99.99%的情況下破產(chǎn)(實際上,破產(chǎn)的可能性說不定更大:在2008—2009年金融危機期間,破產(chǎn)的基金恰恰是那些之前業(yè)績無可挑剔的基金\h[7])。正如《動態(tài)對沖》[225]一書所討論的那樣(對非量化金融領(lǐng)域的讀者來說,可能專業(yè)性略強),這是相同行權(quán)價的香草期權(quán)和二元期權(quán)之間的區(qū)別。違背直覺的是,肥尾效應(yīng)降低了二元期權(quán)的價值,同時提高了香草期權(quán)的價值。正如作者的格言所說:“我從未見過有錢的預(yù)言家?!奔臃饰膊繒?dǎo)致高于1個標(biāo)準(zhǔn)差的事件的概率下降,但對應(yīng)的后果會加重(就對矩的貢獻(xiàn)而言,比如對平均值或其他指標(biāo)的影響),我們會在章節(jié)4.3.1中具體展開。圖3.12展示了這個問題的嚴(yán)重程度。評論1概率預(yù)測誤差(“校準(zhǔn)”)與真實世界中的損益變化(或真實收益)屬于完全不同的概率類別?!靶?zhǔn)”是一種衡量預(yù)測準(zhǔn)確程度的方法,聚焦于概率空間——介于0和1之間。無論所預(yù)測的隨機變量是否為厚尾分布,校準(zhǔn)對應(yīng)的所有標(biāo)準(zhǔn)測度都是薄尾的(而且因為有界,必然是超薄尾的)。另外,現(xiàn)實世界中的收益可能是厚尾的,因此這種“校準(zhǔn)”的分布將遵循隨機變量本身的特性。我們會在第十一章給出完整的推導(dǎo)和證明。\h[1]我們定義的漸進性是n很大但不為無窮大時的求和性質(zhì),這也是本書的焦點之一。\h[2]樣本均值是我們對總體取樣后的平均值。顯然,我們能接觸到的都是樣本均值。有時我們也可以拿到總體數(shù)據(jù),如財富或者戰(zhàn)爭傷亡的分布,但此時總體均值和樣本會有較大偏差。這里我們可以通過“影子均值”的概念,從產(chǎn)生數(shù)據(jù)的本質(zhì)過程或機理中求解期望。\h[3]簡單來說,貝塔系數(shù)是表征資產(chǎn)A在多大程度上會受到總體市場變動(或者某個給定的市場基準(zhǔn)或指數(shù)變動)影響的統(tǒng)計量。用公式表達(dá)為資產(chǎn)A與市場收益的協(xié)方差除以市場收益的方差。夏普比率表達(dá)的是某資產(chǎn)或策略的平均回報(或超額回報)除以自身的標(biāo)準(zhǔn)差。\h[4]厘清一下術(shù)語,在本書中,用α表示的尾部指數(shù)是指log大于K的生存函數(shù)除以logK的極限,對柯西分布來說等于1。有些研究者會用相應(yīng)概率密度函數(shù)中的α-1表示。\h[5]用更專業(yè)一點兒的話表述,一般當(dāng)相關(guān)性為0時,主成分相互獨立。但是對于肥尾分布來說,相關(guān)性為0并不能推導(dǎo)出相互獨立,我們會在章節(jié)6.3.1中展開講解。\h[6]不要弄混大偏差理論(LDT)和極值理論(EVT),EVT可以覆蓋所有主要的分布類型。\h[7]R.杜阿迪,來自風(fēng)險數(shù)據(jù)(RiskData)關(guān)于在2008年金融危機中清盤的基金的數(shù)據(jù),作者通過個人交流方式獲知。3.4.2大數(shù)定律下面我們來討論大數(shù)定律,作為統(tǒng)計學(xué)的基礎(chǔ),大數(shù)定律告訴我們,當(dāng)增加觀測值時,樣本均值會逐漸變得穩(wěn)定,收斂速率約為。圖3.8顯示,在肥尾分布下,均值要趨于穩(wěn)定需要更多的觀察值?!暗葍r”并不簡單。極端斯坦下收益遠(yuǎn)勝于概率為了考量平均斯坦和極端斯坦之間的差異,我們以飛機失事為例。假設(shè)100~400人在事件中喪生(令人痛心),也即一個獨立的負(fù)面事件,對預(yù)測和風(fēng)險管理來說,我們會盡可能最小化此類風(fēng)險,使其可以忽略不計。接下來,我們考慮一種特殊的飛機失事事件,該事件會殺死所有乘坐飛機的人,包括所有過去乘坐過飛機的人。那么這還是同一類型的事件嗎?后者屬于極端斯坦,而對于這樣的事件,我們不考慮概率,而是關(guān)注其影響。·對于第一種類型的事件,管理者主要考慮降低其發(fā)生概率——事件的發(fā)生頻率。這里我們會數(shù)發(fā)生的次數(shù),并嘗試減少?!τ诘诙N類型的事件,主要在于降低事件發(fā)生時造成的影響。這時我們不計算概率,而是衡量其影響。如果覺得上述實驗有些奇怪,你可以考慮一下1982年美國央行在危機中失去了之前歷史上賺到的所有錢,存貸行業(yè)(現(xiàn)在已經(jīng)不復(fù)存在)也出現(xiàn)過同樣的事情,銀行系統(tǒng)在2008—2009年賠掉了之前所有的利潤。我們會經(jīng)常看到,某人在單次市場事件中賠掉之前的所有積蓄。而同樣的事情會在很多行業(yè)發(fā)生,如汽車業(yè)和航空業(yè)。上面的銀行僅僅和錢有關(guān),對于戰(zhàn)爭,我們就無法只關(guān)注頻率而不考慮其量級了,正如科普作家斯蒂芬·平克所說[194],第十六章會討論這一點。這里還不考慮本節(jié)末尾提到的破產(chǎn)問題(和非遍歷性)。更嚴(yán)格地說,如果想讓原始的概率值有意義,我們就要讓一系列事件滿足非亞指數(shù)的克拉默條件。上述類比是本書作者和極富洞察力的拉斯·羅伯特在一次經(jīng)濟學(xué)討論的播客中提出的。在統(tǒng)計現(xiàn)象中,最知名的是帕累托分布(即80/20法則),如20%的意大利人擁有80%的土地。表3.1顯示,在高斯分布下需要取30個觀測值才能使均值達(dá)到穩(wěn)定的區(qū)間,而在帕累托分布下需要1011個觀測值才能使誤差達(dá)到同樣的水平(假設(shè)均值存在)。盡管
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年溫宿縣民族醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 七下數(shù)學(xué)活動
- 2024年度中小校黨支部黨風(fēng)廉政建設(shè)調(diào)研報告
- 同位語從句與定語從句的異同及區(qū)分方法(拓展)(說課稿)-2023-2024學(xué)年外研版英語九年級下冊
- 2024年江華瑤族自治縣民族中醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 寫字指導(dǎo)培訓(xùn)
- 2024年06月興業(yè)銀行龍巖分行科技人才社會招考筆試歷年參考題庫附帶答案詳解
- 2024樹木買賣簡單合同
- 2025年魯教五四新版選修1歷史下冊階段測試試卷
- 第21章 第5節(jié) 《鳥類的生殖與發(fā)育》說課稿-2024-2025學(xué)年初中生物八年級下冊同步教學(xué)(蘇教版)001
- 國家開放大學(xué)電大考試《心理學(xué)》課程形成性考核冊試題及答案(1-4)最全
- 四川省成都市泡桐樹小學(xué)小學(xué)數(shù)學(xué)五年級下冊期末試卷(培優(yōu)篇)
- 教練技術(shù)工具之:平衡輪課件
- 全國各省市縣統(tǒng)計表-
- 國家開放大學(xué)電大本科《管理案例分析》2023年期末試題及答案(試卷號:1304)
- 醋酸加尼瑞克注射液
- 中學(xué)查寢記錄
- 戰(zhàn)略目標(biāo)新設(shè)計-BLM
- 蘇科版八年級物理上冊《運動的相對性》教案及教學(xué)反思
- 供應(yīng)商不良行為管理辦法
- 君聯(lián)資本×DDI《成長期企業(yè)管理者領(lǐng)導(dǎo)力調(diào)研報告》
評論
0/150
提交評論