因子分析+logistic回歸度量信用風(fēng)險違約概率_第1頁
因子分析+logistic回歸度量信用風(fēng)險違約概率_第2頁
因子分析+logistic回歸度量信用風(fēng)險違約概率_第3頁
因子分析+logistic回歸度量信用風(fēng)險違約概率_第4頁
因子分析+logistic回歸度量信用風(fēng)險違約概率_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、本文樣本數(shù)據(jù)獲取渠道為中國證券市場公開信息,選取6家在2005-2006年和2010年6家上市公司發(fā)生逾期的貸款類型均為短期流貸,全部歸屬于公司風(fēng)險暴露中一般公司是由基于因子分析的logistic違約概率模型的實證研究出了新的思考和方向。發(fā)生過銀行貸款違約的制造業(yè)上市公司(違約筆數(shù)8筆),和31家同行業(yè)同期貸款未發(fā)生違約且非ST類的上市公司,并且總資產(chǎn)與銷售規(guī)模與違約公司相似(考慮到建模樣本數(shù)量過少,加入此約定為提高模型精度),組成39個建模數(shù)據(jù),進(jìn)行模型構(gòu)造。其中,財務(wù)數(shù)據(jù)均取自違約/非違約公司對應(yīng)違約年份前一年末或前二年末的數(shù)據(jù),此是模型具有預(yù)測功能的必要條件。6家違約上市公司8條違約記錄

2、(其中3條違約記錄來自同一公司)如下:序號股票代碼最新公司全稱證監(jiān)會行業(yè)門類名稱證監(jiān)會行業(yè)次類名稱報表日期報表類型信息來源貸款類型1000413石家莊寶石電子玻璃股份有限公司制造業(yè)電子2005-12-31Q4定期報告短期流貸2000498丹東化學(xué)纖維股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料2006-12-31Q4定期報告短期流貸3000506中潤資源投資股份有限公司制造業(yè)造紙、印刷2005-06-30Q2定期報告短期流貸4000557廣夏(銀川)實業(yè)股份有限公司制造業(yè)醫(yī)藥、生物制品2006-12-31Q4定期報告短期流貸5600196上海復(fù)星醫(yī)藥(集團(tuán))股份有限公司制造業(yè)醫(yī)藥、生物制品2006

3、-12-31Q4定期報告短期流貸6600608上海寬頻科技股份有限公司制造業(yè)電子2005-12-31Q4定期報告短期流貸7600608上海寬頻科技股份有限公司制造業(yè)電子2006-12-31Q4定期報告短期流貸8600608上海寬頻科技股份有限公司制造業(yè)電子2010-06-30Q2定期報告短期流貸風(fēng)險暴露。另外,之所以將上海寬頻科技股份有限公司的三次逾期數(shù)據(jù)全部納入建模,于一方面可供建模的違約數(shù)據(jù)過少,將其加入不影響模型的建立和使用,另一方面數(shù)據(jù)量的增加增強了模型的預(yù)測能力。31家非違約上市公司信息如下(合并報表數(shù)據(jù))股票代碼最新公司全稱證監(jiān)會行業(yè)門類名稱證監(jiān)會行業(yè)次類名稱截止日期基本每股收益(

4、元/股)營業(yè)收入(元)資產(chǎn)總計(元)000590紫光古漢集團(tuán)股份有限公司制造業(yè)醫(yī)藥、生物制品2006-12-310.03287312308562057554000593四川大通燃?xì)忾_發(fā)股份有限公司批發(fā)和零售貿(mào)易批發(fā)和零售貿(mào)易2006-12-310.04262961854643441371作者:本文針對一般商業(yè)銀行等單位采用Logistic慮時間因素等問題,構(gòu)建和驗證了基于因子分析的回歸估計PD的模型中多重共線性、沒有考logistic行性,并對財務(wù)指標(biāo)進(jìn)行了時間加權(quán)化處理的模型改進(jìn)工作,違約概率測算模型的效果和可在最后對模型的進(jìn)一步優(yōu)化提000606青海明膠股份有限公司制造業(yè)醫(yī)藥、生物制品20

5、06-12-310.12180495301641844773000619蕪湖海螺型材科技股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料2006-12-310.393.97E+092.589E+09000755山西三維集團(tuán)股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料2006-12-310.452.11E+093.454E+09000788北大國際醫(yī)院集團(tuán)西南合成制藥股份有限公司制造業(yè)醫(yī)藥、生物制品2006-12-310.06501365634737943749直接按現(xiàn)有000790成都華神集團(tuán)股份有限公司制造業(yè)醫(yī)藥、生物制品2006-12-310.04225243387703082775000792青海鹽

6、湖工業(yè)股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料2006-12-311.062.596E+095.727E+09000812陜西金葉科教集團(tuán)股份有限公司制造業(yè)造紙、印刷2006-12-31-0.37313953982957758784000830魯西化工集團(tuán)股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料2006-12-310.164.009E+094.572E+09000909數(shù)源科技股份有限公司制造業(yè)電子2006-12-310.019631126391.778E+09000912四川瀘天化股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料2006-12-310.774.799E+095.101E+090009

7、36江蘇華西村股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料2006-12-310.152.896E+092.677E+09002004重慶華邦制藥股份有限公司制造業(yè)醫(yī)藥、生物制品2006-12-310.49287872529781297226002007華蘭生物工程股份有限公司制造業(yè)醫(yī)藥、生物制品2006-12-310.36354994023816570602002019浙江杭州鑫富藥業(yè)股份有限公司制造業(yè)醫(yī)藥、生物制品2006-12-310.05347989819592378458002022上海科華生物工程股份有限公司制造業(yè)醫(yī)藥、生物制品2006-12-310.53340326970485513

8、935002025貴州航天電器股份有限公司制造業(yè)電子2006-12-310.8322784915640281027002045國光電器股份有限公司制造業(yè)電子2006-12-310.268563370691.134E+09002079蘇州固锝電子股份有限公司制造業(yè)電子2006-12-310.31435408883530697505002117東港股份有限公司制造業(yè)造紙、印刷2006-12-310.64415751481499356585600206有研半導(dǎo)體材料股份有限公司制造業(yè)電子2006-12-310.114990345191.071E+09600237安徽銅峰電子股份有限公司制造業(yè)電子20

9、06-12-310.045099501091.49E+09600356牡丹江恒豐紙業(yè)股份有限公司制造業(yè)造紙、印刷2006-12-310.297580133271.571E+09600360吉林華微電子股份有限公司制造業(yè)電子2006-12-310.519067950551.909E+09600433廣東冠豪高新技術(shù)股份有限公司制造業(yè)造紙、印刷2006-12-310.08592813086862208294600589廣東榕泰實業(yè)股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料2006-12-310.37973090351.599E+09600666西南藥業(yè)股份有限公司制造業(yè)醫(yī)藥、生物制品2006-12-

10、310.08456151830846948311600793宜賓紙業(yè)股份有限公司制造業(yè)造紙、印刷2006-12-31-0.62535064636951950250600796浙江錢江生物化學(xué)股份有限公司制造業(yè)石油、化學(xué)、塑膠、塑料2006-12-310.11430045963926870562600836上海界龍實業(yè)集團(tuán)股份有限公司制造業(yè)造紙、印刷2006-12-310332E+09*其中四川大通燃?xì)忾_發(fā)股份有限公司在2006年由醫(yī)藥、生物制品類轉(zhuǎn)為批發(fā)和零售貿(mào)易類;浙江錢江生物化學(xué)股份有限公司在2006年由醫(yī)藥、生物制品轉(zhuǎn)為石油、化學(xué)、塑膠、塑料類。特此說明。以下對

11、從網(wǎng)絡(luò)公開信息獲取的數(shù)據(jù),進(jìn)行數(shù)據(jù)手機、業(yè)務(wù)定義、數(shù)據(jù)清洗、模型分組、模型分析、變量構(gòu)造、變量分析和變量選擇等步驟。選取如下14個財務(wù)指標(biāo),作為建模數(shù)據(jù)估計模型參數(shù)。選取數(shù)據(jù)的原則主要是從數(shù)據(jù)的易獲得性、完整性考慮的,同時為了免去單因素初步篩選等較為簡單的過程,資料綜合選取了顯著性較高的財務(wù)指標(biāo)。所選指標(biāo)全部是以百分比度量的財務(wù)比率,這樣的好處是將企業(yè)規(guī)模等因素在模型系統(tǒng)中的影響最小化,提高模型的預(yù)測精度。提取指標(biāo)列表:指標(biāo)類型標(biāo)號指標(biāo)含義與計算公式備注VAR9凈利潤/總資產(chǎn)總資產(chǎn)報酬率/總資產(chǎn)凈利率VAR17凈利潤/報告期末股本每股收益(攤?。┯芰AR10(主營收入-主營成本”主營收入

12、主營業(yè)務(wù)利潤率VAR16銷售收入總額/平均資產(chǎn)總額總資產(chǎn)周轉(zhuǎn)率營運能力VAR15銷售收入總額/平均流動資產(chǎn)流動資產(chǎn)周轉(zhuǎn)率流動性與償債能力VAR8負(fù)債總額/總資產(chǎn)資產(chǎn)負(fù)債率VAR12總資產(chǎn)現(xiàn)金回收率=經(jīng)營現(xiàn)金凈額/平均總資產(chǎn)總資產(chǎn)現(xiàn)金回收率VAR11經(jīng)營活動現(xiàn)金流量凈額/銷售收入銷售現(xiàn)金比率VAR5(流動資產(chǎn)-存貨”流動負(fù)債速動比VAR4流動資產(chǎn)/流動負(fù)債流動比VAR7利息保障倍數(shù)=EBIT/利息利息保障倍數(shù)VAR6營運資金/總資產(chǎn)經(jīng)營發(fā)展能力/ 成長能力VAR14本年總資產(chǎn)增長額/年初資產(chǎn)總額總資產(chǎn)增長率VAR13本年主營業(yè)務(wù)收入增長額/年初主營業(yè)務(wù)收入主營業(yè)務(wù)收入增長率計算的財務(wù)數(shù)據(jù),對于非

13、違約上市公司,由于違約公司違約發(fā)生年份大多集中于2005年和2006年,故對非違約公司財務(wù)數(shù)據(jù)以2005年和2006年為基礎(chǔ)做時間加權(quán)平均處理。采取此方法的目的主要是由于企業(yè)各種指標(biāo)會隨著時間變化而變化,如果僅僅考慮最近一年的指標(biāo),可能會由于經(jīng)濟(jì)周期或偶然因素造成財務(wù)指標(biāo)失真,最終影響違約概率測算的準(zhǔn)確性。為解決這一問題,我采取了基于2年時間加權(quán)的方法計算模型的輸入變量。公式為:其中,T取2,代表2年;X代表按時間加權(quán)平均后的結(jié)果;Xt表示指標(biāo)i第t年的數(shù)值。據(jù)此可知時間越晚的年份所占權(quán)重越大。將違約和非違約公司數(shù)據(jù)經(jīng)過時間加權(quán)方法進(jìn)行調(diào)整,得到8個違約和31個非違約共計39個樣本,用SPSS

14、軟件進(jìn)行因素分析(抽取共同因素時選用主成分分析法)。這里特別指出的是,諸多文獻(xiàn)指出在進(jìn)行此類問題的因素分析時,需先將數(shù)據(jù)按如下Z-score公式進(jìn)行標(biāo)準(zhǔn)化處理:其中,Xij為第i個樣本的第j個指標(biāo)值,Xj為樣本第j個指標(biāo)的平均值,Sj為樣本第j 個指標(biāo)標(biāo)準(zhǔn)差,Zij為第i個樣本第j個指標(biāo)值標(biāo)準(zhǔn)后化的得分。進(jìn)行該標(biāo)準(zhǔn)化的目的主要為了消除各項財務(wù)指標(biāo)由于量綱單位不同或正、逆性指標(biāo)不同帶來的不可比擬性,但經(jīng)現(xiàn)有數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化前后的因子分析結(jié)果來看,分析所得數(shù)據(jù)和結(jié)論在標(biāo)準(zhǔn)化前后無絲毫不同,故本文未采取先將數(shù)據(jù)標(biāo)準(zhǔn)化,再進(jìn)行分析,而是直接將數(shù)據(jù)進(jìn)行了因子分析,過程和結(jié)論 如下:KMO and Bart

15、letts TestKaiser-Meyer-Olkin Measure of Samp ling Adequacy.685Bartletts Test ofApp rox. Chi-Square584.771Sp hericitydf91Sig.000從上表看到,KMO直為0.685,當(dāng)其數(shù)值越大時,表示變量間的共同因素越多,越適合進(jìn)行因素分析。一般大于0.5時,均適合進(jìn)行因素分析。此外, 從Bartlett s球形檢驗達(dá)對于違約上市公司,做因子分析和Logistic回歸時采用違約當(dāng)年和前一年經(jīng)時間加權(quán)顯著,代表母群體間有共同因素存在,同樣表明適合進(jìn)行因素分析。選取特征值大于0.6的抽取共同

16、因素,共抽取6 了個共同因素,可以解釋的總變異量為91.701%。另外,可以看到采用最大方差法轉(zhuǎn)軸后每個因素的特征值和方差貢獻(xiàn)率都發(fā)生了變化,但累計方差貢獻(xiàn)率未發(fā)生變化,均為91.701%,而且轉(zhuǎn)軸縮小了各因素方差貢獻(xiàn)率之間的差距,使各因素解釋原變量的能力更加平衡。詳見下表:Total Variance Expl ainedInitial EigenvaluesExtraction Sumsof Squared LoadingsRotation Sums of Squared LoadingsCompo nentTotal%of VarianceCumulative %Total% of Va

17、rianceCumulative %Total%of VarianceCumulative %16.75048.21648.2166.75048.21648.2162.80320.01820.01822.07314.80763.0232.07314.80763.0232.40217.15537.17331.75412.52975.5521.75412.52975.5522.27616.25853.4314.9216.58182.132.9216.58182.1322.20015.71669.1475.7165.11387.245.7165.11387.2451.95513.96383.1106

18、.6244.45691.701.6244.45691.7011.2038.59291.7017.3562.54294.2438.2932.09296.3359.1961.40197.73610.1841.31199.04711.071.50599.55212.034.24699.79813.020.14399.94014.008.060100.000Extraction Method: Princ ipal Compo nent Analysis.以下是陡坡圖,可以看到從第6個點后坡度線比較平滑, 故可以側(cè)面告訴我們選取 6個因素是較為適宜的。ScreeScree PlotPlotCompon

19、entComponent NumberNumber以下是未轉(zhuǎn)軸的因素矩陣(因素負(fù)荷量小于0.1的未予顯示)。Component Matrix 123456VAR00009.931.167.157.113VAR00017.894.215.207VAR00004.773-.475.396VAR00014.765.141-.147.450VAR00010.755-.375.230-.237-.134VAR00012.754.293.280.131-.104-.373VAR00005.726-.532.397VAR00011.697.328.450-.252VAR00006.660-.378-.529

20、-.269-.138VAR00008-.645.321.508.264.333.121VAR00013.606.385.315-.398.274VAR00015.329.728-.492-.165VAR00016.433.437-.666.172.295VAR00007.490-.149.738-.311.228Compo nenta. 6 compo nents extracted.以下是經(jīng)過轉(zhuǎn)軸后的因素矩陣(因素負(fù)荷量小于0.1的未予顯示),轉(zhuǎn)軸方法為最大方我們正是想利用差法,屬正交轉(zhuǎn)軸方法之一,也叫直交轉(zhuǎn)軸法,其特點是因素間沒有相關(guān)。這一特性避免在后面的Logistic回歸中出現(xiàn)多重共線

21、性。另外,由下表可看出,轉(zhuǎn)軸前共同 因素1包含VAR12 VAR11 VAR10共同因素2包含VAR5 VAR4共同因素3包含VAR8 VAR6 共同因素4包含VAR13 VAR14 VAR17 VAR9共同因素5包含VAR16 VAR15共同因素6包含VAR7。Rotated Compo nent Matrix123456VAR00012.877.158.117.182.193.143VAR00011.854.144.322VAR00010.524.398.468.187-.269.280VAR00005.217.910.267.119.136VAR00004.205.894.298.188

22、.132VAR00008-.103-.175-.939-.136-.139-.107VAR00006.346.886.135.181VAR00013.413.807-.150VAR00014.132.196.325.728.252.299VAR00017.589.325.173.608.175.127VAR00009.549.409.175.594.214.199VAR00016.164.160.126.928VAR00015.252-.221.136.881VAR00007.167.181.119.936Compo nenta. Rotation converged in 7 iterati

23、ons.另外,從下面的因素得分協(xié)方差矩陣也可以看出6個公共因素是不相關(guān)的,從而達(dá)到了既簡化財務(wù)指標(biāo)數(shù)目,又防止出現(xiàn)多重共線性的目的。Compo nent Score Covariance MatrixCompo nent12345611.000.000.000.000.000.0002.0001.000.000.000.000.0003.000.0001.000.000.000.0004.000.000.0001.000.000.0005.000.000.000.0001.000.0006.000.000.000.000.0001.000F圖是最終的得到的因素得分系數(shù)矩陣。Compo nent

24、 Score Coefficient MatrixCompo nent123456VAR00004-.100.569-.144-.055.075-.116VAR00005-.056.587-.154-.119.049-.111VAR00006-.050-.046.502-.062.011-.145VAR00007-.069-.131-.093-.030-.026.971VAR00008-.033.251-.614.073.064.047VAR00009.019.104-.111.230.035.038VAR00010.255-.073.235-.131-.248.120VAR00011.480

25、-.067-.055-.153-.022-.096VAR00012.564-.093.032-.352.056-.030VAR00013-.089-.122-.039.609-.132-.206VAR00014-.358-.094.019.606-.022.253VAR00015.146-.131.023-.145.471-.054VAR00016-.126.210-.111-.084.565-.020VAR00017.072.033-.064.237-.003-.025由因素得分系數(shù)矩陣即可得到公共因素(FI-F6)被表示成14個財務(wù)指標(biāo)線性組合的形式,如Fi的線性組合如下:FI=-0.1V

26、AR4-0.056VAR5-0.05VAR6-0.069VAR7-0.033VAR8+0.019VAR)+0.255VARI0+0.48VARII+0.564VARI2-0.089VARI3-0.358VARI4+0.146VARI5-0.126VARI6+0.072VARI7所得到的用于下一步Logistic回歸的原始數(shù)據(jù)從SPS軟件中已給出,即:序號上市公司名是否違約FAC1_1FAC2_1FAC3_1FAC4_1FAC5_1FAC6_11石家莊寶石電子玻璃股份有限公司是-0.66452-0.709050.56415-1.55959-1.60857-0.482892丹東化學(xué)纖維股份有限公司

27、是-0.94443-0.09946-0.62272-1.65452-0.52938-0.205563中潤資源投資股份有限公司是-2.04581-0.039550.22161-1.45559-0.81240.485534廣夏(銀川)實業(yè)股份有限公司是0.050870.42221-5.566810.75994-1.051380.295075上海復(fù)星醫(yī)藥(集團(tuán))股份有限公司是-0.12827-0.394760.347320.36974-0.08577-0.024686上海寬頻科技股份有限公司是-2.693690.805250.22011-0.984910.56717-0.218397上海寬頻科技股份

28、有限公司是-1.37450.41847-0.11245-1.526870.40109-0.524068上海寬頻科技股份有限公司是-0.030570.18295-1.22899-1.442980.19967-0.156169紫光古漢集團(tuán)股份有限公司否0.102580.025280.50572-0.69404-0.73398-0.3491510四川大通燃?xì)忾_發(fā)股份有限公司否0.2259-1.022550.047940.31987-0.46823-0.051511青海明膠股份有限公司否0.46592-0.752110.542690.11132-0.97395-0.0573712蕪湖海螺型材科技股份有

29、限公司否0.156810.350180.05065-0.783123.46548-0.5007713山西三維集團(tuán)股份有限公司否0.82265-1.06892-0.13760.634010.76065-0.3322514北大國際醫(yī)院集團(tuán)西南合成制藥股份有限公司否-0.1181-0.40077-0.24694-0.14095O.37O4-0.1817115成都華神集團(tuán)股份有限公司否-0.028140.156510.63526-0.16241-1.02234-0.4537116青海鹽湖工業(yè)股份有限公司否2.171991.023310.356340.69238-0.9159-0.4828317陜西金葉

30、科教集團(tuán)股份有限公司否0.04618-0.148510.70708-1.10242-0.63596-0.5892118魯西化工集團(tuán)股份有限公司否0.75297-0.83322-0.05593-0.174392.30663-0.3511419數(shù)源科技股份有限公司否-1.99433-0.041170.255321.47592-0.326030.0288620四川瀘天化股份有限公司否0.58132-0.304990.146780.847850.92942-0.2350421江蘇華西村股份有限公司否-0.391250.04637-0.30457O.1O331.4932-0.343322重慶華邦制藥股份

31、有限公司否0.430430.442870.647660.17194-0.847973.5055223華蘭生物工程股份有限公司否1.313860.455460.64684-0.49012-0.495830.2435724浙江杭州鑫富藥業(yè)股份有限公司否-0.03396-0.690710.424130.646970.01705-0.0380625上??迫A生物工程股份有限公司否1.106481.463970.31303-0.85839-0.135943.3847726貴州航天電器股份有限公司否0.724484.745270.432980.65073-0.40519-2.3803827國光電器股份有限公

32、司否-1.33112-0.258430.21422.592340.0799-0.1105328蘇州固锝電子股份有限公司否-1.345691.645430.134560.954211.597082.0377929東港股份有限公司否0.94719-0.55599-0.137480.205971.413430.7473730有研半導(dǎo)體材料股份有限公司否-0.07878-0.562740.443050.53123-0.60788-0.6944131安徽銅峰電子股份有限公司否-0.32472-0.588370.40760.80139-0.54162-0.0298232牡丹江恒豐紙業(yè)股份有限公司否0.14

33、323-0.081070.276530.31155-0.14062-0.2057933吉林華微電子股份有限公司否-0.16065-0.402930.174421.55647-0.70281-0.259334廣東冠豪高新技術(shù)股份有限公司否1.12058-0.378150.14962-0.655180.24274-0.5317135廣東榕泰實業(yè)股份有限公司否-0.27415-0.598410.265631.41634-0.00893-0.1032136西南藥業(yè)股份有限公司否1.24093-0.621770.02606-0.74028-0.10089-0.1509537宜賓紙業(yè)股份有限公司否0.83

34、343-0.7902-0.81509-0.937450.33516-0.5296138浙江錢江生物化學(xué)股份有限公司否-0.10577-0.579370.258380.96302-0.57569-0.2386739上海界龍實業(yè)集團(tuán)股份有限公司否0.83063-0.26031-0.1871-0.75328-0.451840.08369*這里特別需要說明的是,此表中的FAC1_1與上面F1的計算公式略有不同,是由于SPSS將數(shù)據(jù)自動進(jìn)行了標(biāo)準(zhǔn)化操作,即FAC1_1 等于因素得分系數(shù)矩陣(aij )和原始變量的標(biāo)準(zhǔn)化值的乘積之和,公式為:FAC1_1=ai* (VAR-u ) / a +a21* (V

35、AR-u ) / a +.,其中u所有樣本的均值,a為所有樣本的標(biāo)準(zhǔn)差。*FAC1_1-FAC6_1可直接用于logistic回歸,作為其自變量估計參數(shù)使用。F面是所有數(shù)據(jù)準(zhǔn)備完畢后,使用SAS軟件的Logistic回歸函數(shù)進(jìn)行回歸分析。程序代碼如下:ods graphies on; /* 為繪制 RO(曲線做準(zhǔn)備 */proc logistic data =dr_logis.defaultrisk_logisticdesce ndingplots =roc (id =prob);/*調(diào)用Logistic ;指定繪制RO(曲線;descending用來指定按照選項 order指定順序的倒序排列

36、,目的是為得到針對違約概率P的模型參數(shù)*/model y=FAC1_1 fac2_1 fac3_1 fac4_1 fac5_1 fac6_1/select ion =ste pwiseslstay =0.15 slentry =0.15 details lackfit stb ;/*指定y為因變量,fac1_1到fac6_1為自變量;采用逐步篩選法,變量被選進(jìn)和剔除模型的顯著水平均為15% details為輸出選擇方法的詳細(xì)信息;lackfit為進(jìn)行對模型進(jìn)行擬合失真檢驗(Hosmer and Lemeshow Test) ; stb指定輸出標(biāo)準(zhǔn)化數(shù)據(jù)模型選項*/ods graphicsoff

37、 ;以下為SAS軟件執(zhí)行以上程序輸出的結(jié)果和相應(yīng)的解釋:The LOGISTIC P rocedureModel In formati onModel In formatio nData SetDR_LOGIS.DEFAULTRISK_LOGISTICResponse VariableY0,非違約;1,違約Number of Response Levels2Modelbinary logitOp timizati on Tech niqueFishers scori ngNumber of Observati ons Read39Number of Observati ons Used39Re

38、sponse ProfileOrderedValueYTotalFreque ncy11.00820.0031Probability modeled is Y=1.00.以上主要顯示的是要建模的數(shù)據(jù)集信息,數(shù)據(jù)集為DR_LOGIS.DEFAULTRISK_LOGIST;響應(yīng)變量為Y,0代表未違約,1代表違約;響應(yīng)水平數(shù)為2;連接函數(shù)為bi nary logit最優(yōu)化方法為費雪得分算法;讀入和使用的觀測數(shù)均為 39,其中違約觀測數(shù)為 8,未違約觀測數(shù)為31;最后一行代表計算用的分析響應(yīng)變量的概率模型值為1事件的發(fā)生概率以下是采用逐步篩選法對變量進(jìn)行篩選的過程:Step wise Select i

39、on Pro cedureStep 0. In terce pt en tered:Model Con verge nee StatusCon verge nee criterio n (GCONV=1E-8) satisfied.從上表可以看出此模型時是收斂的,和變量無關(guān),說明模型擬合達(dá)到收斂標(biāo)準(zhǔn)。39.580-2 Log LAn alysis of Maximum Likelihood EstimatesP arameterDFEstimateStan dardErrorWaldChi-SquarePr ChiSqStan dardizedEstimateIn teree pt1-1.35

40、450.396611.66740.0006Residual Chi-Square TestChi-SquareDFPr ChiSq26.665660.0002制定的顯著性水平達(dá) 15%的標(biāo)準(zhǔn)。An alysis of Effects Eligible forEn tryEffectDFScoreChi-SquarePr ChiSqFAC1_119.89740.0017FAC2_110.05540.8139FAC3_116.15970.0131FAC4_119.06590.0026FAC5_111.37570.2408FAC6_110.11150.7384第一個變量進(jìn)入模型。Ste P 1. E

41、ffect FAC1_1 en tered:Model Con verge nee StatusCon verge nee eriterio n (GCONV=1E-8) satisfied.F表說明的是下一步可能進(jìn)入模型篩選的變量信息。其中第2、5、6號變量不符合我們Model Fit StatisticsCriteri onIn terce ptOn lyIn terce pt and CovariatesAIC41.58033.581SC43.24336.908-2 Log L39.58029.581以上三個指標(biāo)值均為越小越好。以下三個指標(biāo)值的P值均小于0.01,說明有顯著統(tǒng)計意義,建模

42、效果比較顯著。Test ing Global Null Hy po thesis: BETA=0TestChi-SquareDFPr ChiSqLikelihood Ratio9.998310.0016Score9.897410.0017Wald7.004310.0081An alysis of Maximum Likelihood EstimatesP arameterDFEstimateStan dardErrorWaldChi-SquarePr ChiSqStan dardizedEstimateIn terce pt1-1.77810.530411.23980.0008FAC1_11-

43、1.41170.53347.00430.0081-0.7783從上表可以看出,fac1_1前的系數(shù)顯著。Standardized Estimate是在模型代碼中加入stb語句才出現(xiàn)的。Odds Ratio EstimatesEffectPoint Estimate95% WaldCon fide nee LimitsFAC1_10.2440.0860.693Associati on of P redicted Probabilities andObserved Respon sesP erce nt Con corda nt84.7Somers D0.694P erce nt Discorda

44、 nt15.3Gamma0.694P erce nt Tied0.0Tau-a0.232P airs248c0.847以上表格主要注意 c統(tǒng)計量,它反映了實際觀測值和模型預(yù)測的事件概率的關(guān)聯(lián)強度,越高越好。另外 Perce nt Co ncordant 代表ROC曲線所圍面積。Residual Chi-Square TestChi-SquareDFPr ChiSq18.547050.0023An alysis of Effects Eligible forRemovalEffectDFWaldChi-SquarePr ChiSqFAC1_117.00430.0081第一步篩選沒有變量被移除。N

45、ote: No effects for the model in Step 1 are removed.An alysis of Effects Eligible forEn tryEffectDFScoreChi-SquarePr ChiSqFAC2_110.00840.9268FAC3_119.66390.0019FAC4_118.22650.0041FAC5_111.97470.1599An alysis of Effects Eligible forEn tryEffectDFScoreChi-SquarePr ChiSqFAC6_110.41870.5176第三個變量加入到模型中。S

46、te P 2. Effect FAC3_1 en tered:Model Con verge nee StatusCon verge nee eriterio n (GCONV=1E-8) satisfied.Model Fit StatisticsCriteri onIn terce ptOn lyIn terce pt and CovariatesAIC41.58027.745SC43.24332.736-2 Log L39.58021.745Test ing Global Null Hy po thesis: BETA=0TestChi-SquareDFPr ChiSqLikelihoo

47、d Ratio17.834520.0001Score16.057020.0003Wald8.738320.0127An alysis of Maximum Likelihood EstimatesP arameterDFEstimateStan dardErrorWaldChi-SquarePr ChiSqStan dardizedEstimateIn terce pt1-2.10930.70588.93090.0028An alysis of Maximum Likelihood EstimatesP arameterDFEstimateStan dardErrorWaldChi-Squar

48、ePr ChiSqStan dardizedEstimateFAC1_11-1.71870.61937.70270.0055-0.9476FAC3_11-2.21971.24353.18650.0742-1.2238Odds Ratio EstimatesEffectPoint Estimate95% WaldCon fide nee LimitsFAC1_10.1790.0530.604FAC3_10.1090.0091.243Assoeiati on of Predicted Probabilities andObserved Respon sesP eree nt Con eorda n

49、t91.9Somers D0.839P eree nt Diseorda nt8.1Gamma0.839P eree nt Tied0.0Tau-a0.281P airs248e0.919Residual Chi-Square TestChi-SquareDFPr ChiSq9.741040.0450An alysis of Effeets Eligible for RemovalEffeetDFWaldChi-SquarePr ChiSqFAC1_117.70270.0055An alysis of Effects Eligible for RemovalEffectDFWaldChi-Sq

50、uarePr ChiSqFAC3_113.18650.0742Note: No effects for the model in Step 2 are removed.An alysis of Effects Eligible forEn tryEffectDFScoreChi-SquarePr ChiSqFAC2_110.54450.4606FAC4_118.39410.0038FAC5_113.04610.0809FAC6_110.94820.3302Ste p 3. Effect FAC4_1 en tered:Model Con verge nee StatusCon verge ne

51、e criterio n (GCONV=1E-8) satisfied.Model Fit StatisticsCriteri onIn terce ptOn lyIn terce pt and CovariatesAIC41.58019.625SC43.24326.279-2 Log L39.58011.625Test ing Global Null Hy po thesis: BETA=0TestChi-SquareDFPr ChiSqLikelihood Ratio27.95483 0001Score25.12303 ChiSqStan dardizedEstimateIn terce

52、pt1-2.89781.02837.94160.0048FAC1_11-2.46911.20634.18960.0407-1.3613FAC3_11-1.41360.82462.93870.0865-0.7794FAC4_11-2.19861.00694.76720.0290-1.2121Odds Ratio EstimatesEffectPoint Estimate95% WaldCon fide nee LimitsFAC1_10.0850.0080.900FAC3_10.2430.0481.225FAC4_10.1110.0150.799Associati on of P redicte

53、d Probabilities andObserved Respon sesP erce nt Con corda nt96.0Somers D0.919P erce nt Discorda nt4.0Gamma0.919P erce nt Tied0.0Tau-a0.308P airs248c0.960Residual Chi-Square TestChi-SquareDFPr ChiSq0.884830.8291以上為殘差的卡方檢驗,P值顯著說明殘差滿足正態(tài)分布。An alysis of Effects Eligible forRemovalEffectDFWaldChi-SquarePr

54、 ChiSqFAC1_114.18960.0407FAC3_112.93870.0865FAC4_114.76720.0290Note: No effects for the model in Step 3 are removed.An alysis of Effects Eligible forEn tryEffectDFScoreChi-SquarePr ChiSqFAC2_110.51020.4750FAC5_110.58960.4426FAC6_110.00890.9248第2、5、6號變量由于p值過大,沒有入選模型。以下表格是變量被入選時的 p值等信息。Note: No (addit

55、i on al) effects met the 0.15 sig ni fica nee level for entry into the model.Summary of Ste pwise SelectionEffectSte pEnteredRemovedDFNumberInScoreChi-SquareWaldChi-SquarePr ChiSqVariableLabelSummary of Ste pwise SelectionSte pEffectDFNumberInScoreChi-SquareWaldChi-SquarePr ChiSqVariableLabelEntered

56、Removed1FAC1_1119.89740.0017REGRactor score1 for analysis 12FAC3_1129.66390.0019REGRactor score3 for analysis 13FAC4_1138.39410.0038REGRfactor score4 for analysis 1ROCROC CurveCurve forfor SelectedSelected ModelModelAreaArea UndertheUnderthe CursCurs = = C.95S7C.95S7I.OIO0.750.500.500.250.00OOQJ J ,

57、02,02 zyzZQ.250 500.751.001 1 - - SpecificitySpecificityROC曲線對應(yīng)面積為0.9597,說明模型擬合效果令人滿意。ROCROC CurvesCurves forfor AllAll ModelModel BuildingBuilding StepsStepsROCROC CurveCurve (Area)(Area)Step0 0.5000) -Step 1 CQi.84-66Step?Step? .(0.9194).(0.9194) - ModelModel (I0L9S97)Partiti on for the Hosmer and

58、 Lemeshow TestY = 1.00Y = 0.00GroupTotalObservedExp ectedObservedExp ected1400.0044.002400.0143.993400.0243.984400.0443.965400.0543.956410.1133.897400.5043.50Partiti on for the Hosmer and Lemeshow TestY = 1.00Y = 0.00GroupTotalObservedExp ectedObservedExp ected8400.6543.359443.6300.3710332.9700.03Ho

59、smer and Lemeshow Good ness-of-FitTestChi-SquareDFPr ChiSq8.966080.3452以上Hosmer and Lemeshow Test的p值為0.3452,說明統(tǒng)計不顯著,所以接受原假設(shè)“模型不存在擬合失真”,即表示模型的擬合優(yōu)度已經(jīng)滿足要求。最后留在模型中的變量為第1、3、4號變量,所得到的Logistic 回歸模型為:Logit(p)=-2.8978-2.4691X1-1.4136X 3-2.1986X 4,其中對于Logistic 回歸的小結(jié)和說明:1) 采用逐步篩選法進(jìn)行回歸,可看到每加入一個新的變量到模型中后,AIC、SC -2 LogL三項指標(biāo)均有所改善,但經(jīng)反復(fù)試驗,當(dāng)?shù)?、3、4變量進(jìn)入模型后,其他變量再進(jìn)入后,對此三項指標(biāo)的改善作用已極其有限,也會使其他指標(biāo),如Wald指標(biāo)明顯惡化,并且第 2、5、6變量本身P值過大,不顯著,同時考慮到采用 變量后 AIC、SC -2 Log L、Likelihood Ratio、Score、ROC曲線、優(yōu)比指標(biāo)較優(yōu),1、3、4Wald也在0.1以下,權(quán)衡后篩選出這3個變量構(gòu)建模型。2)雖然最終的Logistic模型中沒有用到第2、5、6個變量,但并不能省略之前對VAR4-17所包含數(shù)據(jù)的提取和因子分析的工作,因為最終模型用到的第1、 3、 4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論