汽車保險(xiǎn)索賠次數(shù)雙泊松回歸模型運(yùn)用.doc_第1頁
汽車保險(xiǎn)索賠次數(shù)雙泊松回歸模型運(yùn)用.doc_第2頁
汽車保險(xiǎn)索賠次數(shù)雙泊松回歸模型運(yùn)用.doc_第3頁
汽車保險(xiǎn)索賠次數(shù)雙泊松回歸模型運(yùn)用.doc_第4頁
汽車保險(xiǎn)索賠次數(shù)雙泊松回歸模型運(yùn)用.doc_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、汽車保險(xiǎn)索賠次數(shù)雙泊松回歸模型運(yùn)用1引言在擬合汽車保險(xiǎn)索賠次數(shù)的模型中,泊松分布模型是擬合索賠次數(shù)的最簡單且常用的模型,具有均值與方差相等的特性。而索賠次數(shù)模型往往具有方差大于均值的性質(zhì),此時如果繼續(xù)使用泊松分布模型會低估參數(shù)的標(biāo)準(zhǔn)誤差,高估其顯著性水平,導(dǎo)致多余的解釋變量保留在預(yù)測模型中,最終導(dǎo)致不合理的保費(fèi)。對于此類問題,研究人員通常利用各種不同的混合泊松模型來預(yù)測索賠次數(shù)。ruohonen1提出結(jié)構(gòu)函數(shù)為三參數(shù)伽瑪函數(shù)的泊松分布,同時用實(shí)際損失數(shù)據(jù)與兩參數(shù)結(jié)構(gòu)函數(shù)泊松模型即負(fù)二項(xiàng)模型進(jìn)行了比較,得到了比較滿意的結(jié)果。panjer2運(yùn)用廣義poissonpascal分布(即hofmann分

2、布,含三個參數(shù))來建立汽車索賠次數(shù)模型,擬合效果也比較理想。norisonismail和azizjemain3討論了負(fù)二項(xiàng)回歸模型和廣義泊松回歸模型的參數(shù)估計(jì)及其在索賠頻率預(yù)測中的應(yīng)用,而denuitmichel4等人應(yīng)用負(fù)二項(xiàng)回歸、泊松逆高斯回歸和泊松對數(shù)正態(tài)回歸對汽車保險(xiǎn)的索賠頻率進(jìn)行了實(shí)證研究。國內(nèi)關(guān)于索賠頻率模型的研究主要有孟生旺和袁衛(wèi)5用混合poisson模型研究了非同質(zhì)風(fēng)險(xiǎn)的索賠分布。高洪忠、任燕燕6研究了一類更廣泛的分布,即gpsj類分布,這類分布描述了一次風(fēng)險(xiǎn)事件多種索賠結(jié)果的情況。毛澤春和劉錦蕚7分析了免賠額及ncd賠付條件對索賠次數(shù)分布的影響,通過比較風(fēng)險(xiǎn)事件與索賠事件的差

3、異引出了一類同質(zhì)集合保單索賠次數(shù)的分布(pois-songamma)。毛澤春和劉錦蕚8引出了一類指數(shù)類混合型索賠次數(shù)的分布并研究了其散度(disper-sion)的性質(zhì),同時給出了擬合類分布的矩估計(jì)方法。徐昕、袁衛(wèi)、孟生旺9將兩參數(shù)負(fù)二項(xiàng)回歸模型推廣到三參數(shù)情況,并利用新模型對yip和yau10中的汽車保險(xiǎn)損失數(shù)據(jù)進(jìn)行了擬合,得到了較好的效果,提出了解決過離散問題的一種新辦法。學(xué)者們的研究大多數(shù)集中在混合泊松分布模型上,而雙泊松分布模型也是一類離散型分布模型,具有方差大于均值的特性,但關(guān)于利用雙泊松回歸模型預(yù)測汽車保險(xiǎn)索賠次數(shù)的文獻(xiàn)并不多見。本文將在下面內(nèi)容中詳細(xì)介紹雙泊松回歸模型的性質(zhì)及參數(shù)

4、估計(jì),并且利用該模型來擬合一組實(shí)際的汽車保險(xiǎn)索賠數(shù)據(jù),并將其結(jié)果與泊松回歸模型的擬合進(jìn)行比較分析。2泊松回歸模型性質(zhì)及參數(shù)估計(jì)為便于討論,假設(shè)共有p個分類變量,將所有保單分為n個風(fēng)險(xiǎn)類別,其中第i個風(fēng)險(xiǎn)類別在p個分類變量上的取值用xi=(xi1,xip)t表示,t表示轉(zhuǎn)置。用wi表示第i個類別包含的風(fēng)險(xiǎn)單位數(shù)(如汽車保險(xiǎn)中的車年數(shù))。令yi表示第i個風(fēng)險(xiǎn)類別的索賠次數(shù)隨機(jī)變量,i=1,2,n。如果yi服從泊松分布,則其概率函數(shù)為:pr(yi=yi)=exp(i)yiiyi!,yi=0,1,泊松分布的均值與方差相等,即e(yi)=var(yi)=i。若令i=wiexp(xti),即可得到泊松回歸

5、模型,其中是p1階的參數(shù)向量。容易求得泊松回歸模型的對數(shù)似然函數(shù)為:l=ni=1(lnyi!+yilnii)回歸參數(shù)的極大似然估計(jì)可以通過下述似方程組求得:lj=ni=1(yii)xij=0,j=1,2,p為了求得參數(shù)估計(jì)的標(biāo)準(zhǔn)誤差,首先需要計(jì)算hessian矩陣,其中的元素是關(guān)于對數(shù)似然函數(shù)的二階偏導(dǎo)數(shù),即hjk=2ljk=ni=1i,xijxik,j,k=1,2,p因此信息矩陣的元素為ijk=e(hjk)=ni=1i,xijxik,j,k=1,2,p對信息矩陣對角線上的元素先求導(dǎo)數(shù),然后再開方,即可得到參數(shù)估計(jì)的標(biāo)準(zhǔn)誤差。3雙泊松回歸模型的性質(zhì)及參數(shù)估計(jì)雖然無法確定雙泊松分布是否也是一種混

6、合泊松分布,但由于其具有方差大于均值的特征,因此也可以用于過離散數(shù)據(jù)的處理。雙泊松分布的概率函數(shù)可以表示為:pr(yi=0)=1/2e2ipr(yi=yi)=(1/2ei)(eyiyyiiyi!)(eiyi)yi,yi=1,2均值和方差分別為:e(yixi)=i,var(yixi)=i(1/+i(1)2此處對雙泊松分布形式不同于yip和yau文獻(xiàn)中的雙泊松回歸模型。這樣做的目的是使其均值正好等于i,與其他分布保持一致。如果采用其他的參數(shù)形式,譬如,如果參數(shù)的形式使得雙泊松分布的均值正好為i/(參見yip和yau),則截距項(xiàng)的估計(jì)值將發(fā)生變化,但索賠頻率的預(yù)測值不會受到影響。從上述方差和均值的關(guān)

7、系可以看出,當(dāng)在區(qū)間(0,1)之間變化時,越小,雙泊松分布的過離散程度越嚴(yán)重,因此我們將g=q定義為雙泊松分布的離散參數(shù)。當(dāng)1時,雙泊松分布退化為泊松分布。容易求得雙泊松回歸的對數(shù)似然函數(shù)為:l=yi=012ln2i+yi012ln2iyi+yilnyilnyi!+yiln(exp(1)i/yi)對上式求偏導(dǎo),可以得到模型的似然方程組為:l=yi=01/(2)i+yi01/(2)2i+yiln(exp(1)i/yi)+yi=0lj=ni=1(yii)xij=0雙泊松回歸的hessian矩陣h的元素也很容易求得:2ljk=ni=1(2ixijxik),j,k=1,2,p因此雙泊松回歸的信息矩陣的

8、元素為ijk=e(hjk)=ni=1(2ixijxik),j,k=1,2,p。4模型檢驗(yàn)41過離散檢驗(yàn)對于索賠數(shù)據(jù)是否具有過離散的特征,通常利用兩種方法來判斷。一是在普通最小二乘回歸模型的基礎(chǔ)上建立的統(tǒng)計(jì)量(cameron和trivedi11),滿足下述條件(yii)2yii=i+ei其中的i=exp(xi),ei是隨機(jī)誤差項(xiàng)。如果系數(shù)的t統(tǒng)計(jì)量顯著,說明存在過離散特征。另外一種方法是拉格朗日乘法(lagrangemulti-plier)檢驗(yàn)(greene12提出的)。lm統(tǒng)計(jì)量可以簡單表示為lm=(ee_ny)22其中的=(1,n),i=exp(xi),e=y,y=(y1,yn)。在零假設(shè)為

9、泊松分布的條件下,lm統(tǒng)計(jì)量服從自由度為1的x2分布。42擬合優(yōu)度檢驗(yàn)對模型擬合優(yōu)度進(jìn)行評價(jià)可以使用akaikeinfor-mationcriteria(aic)統(tǒng)計(jì)量和bayesianschwartzcri-teria(bic)統(tǒng)計(jì)量。aic統(tǒng)計(jì)量定義為(akaike13):aic=2l+2p其中l(wèi)表示對數(shù)似然值,p為參數(shù)的個數(shù)。aic的值越小,表明模型的擬合越好。bic統(tǒng)計(jì)量定義為(schwartz14):bic=2l+plog(n)其中的l也表示對數(shù)似然值,p為模型的參數(shù)個數(shù),n為觀測值的個數(shù),bic的值越小,模型擬合越好。5實(shí)證分析51數(shù)據(jù)的描述本節(jié)選用一組來自sasenterpris

10、eminer數(shù)據(jù)庫中的汽車保險(xiǎn)數(shù)據(jù)。原始數(shù)據(jù)中有10303個觀測值,其中大約有6%的缺失,數(shù)據(jù)包含索賠概況、駕駛記錄、保單信息、被保險(xiǎn)人個人信息。索賠概況記錄了被保險(xiǎn)人的索賠頻數(shù)、索賠額、索賠時間等信息;駕駛記錄包括駕駛?cè)说姆謹(jǐn)?shù)、過去7年中是否被吊銷駕駛執(zhí)照;保單信息有被保險(xiǎn)車輛的行駛區(qū)域、行駛時間、汽車價(jià)格、顏色、用途等;被保險(xiǎn)人的個人信息有年齡、性別、教育程度、工作類型、婚姻狀況、年收入等。選取與yip和yau相同的費(fèi)率因子(見表1),其中收入為連續(xù)變量,其余為屬性變量,從10303個客戶中隨機(jī)抽取了4412個有效記錄。52過離散檢驗(yàn)首先依據(jù)第一種方法利用統(tǒng)計(jì)軟件sas的回歸模塊(即procreg)得到結(jié)果見下表2,很明顯預(yù)同樣,利用拉格朗日乘法(lagrangemultiplier),利用sas中iml模塊求得lm值為12847816,并且顯著。從兩種檢驗(yàn)方法可以判定,損失數(shù)據(jù)存在過離散問題。53擬合結(jié)果從下表3中的回歸模型擬合結(jié)果來看,雙泊松回歸模型和泊松回歸模型的參數(shù)估計(jì)值差別不大,顯著性水平因子也相同。但由前面判斷,此數(shù)據(jù)存在過離散特性,泊松回歸模型費(fèi)率因子參數(shù)估計(jì)標(biāo)準(zhǔn)誤差明顯小于雙泊松回歸

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論