![Python金融數(shù)據(jù)分析與挖掘(微課版) 課件 7-7.國(guó)際股票指數(shù)關(guān)聯(lián)分析_第1頁(yè)](http://file4.renrendoc.com/view12/M07/3A/2F/wKhkGWdfvyaAKoU6AADrpBru5aM907.jpg)
![Python金融數(shù)據(jù)分析與挖掘(微課版) 課件 7-7.國(guó)際股票指數(shù)關(guān)聯(lián)分析_第2頁(yè)](http://file4.renrendoc.com/view12/M07/3A/2F/wKhkGWdfvyaAKoU6AADrpBru5aM9072.jpg)
![Python金融數(shù)據(jù)分析與挖掘(微課版) 課件 7-7.國(guó)際股票指數(shù)關(guān)聯(lián)分析_第3頁(yè)](http://file4.renrendoc.com/view12/M07/3A/2F/wKhkGWdfvyaAKoU6AADrpBru5aM9073.jpg)
![Python金融數(shù)據(jù)分析與挖掘(微課版) 課件 7-7.國(guó)際股票指數(shù)關(guān)聯(lián)分析_第4頁(yè)](http://file4.renrendoc.com/view12/M07/3A/2F/wKhkGWdfvyaAKoU6AADrpBru5aM9074.jpg)
![Python金融數(shù)據(jù)分析與挖掘(微課版) 課件 7-7.國(guó)際股票指數(shù)關(guān)聯(lián)分析_第5頁(yè)](http://file4.renrendoc.com/view12/M07/3A/2F/wKhkGWdfvyaAKoU6AADrpBru5aM9075.jpg)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第7章
基礎(chǔ)案例問(wèn)題描述數(shù)據(jù)預(yù)處理關(guān)聯(lián)規(guī)則挖掘問(wèn)題描述第7章
為了探討國(guó)際上主要股票價(jià)格指數(shù)之間的漲跌關(guān)聯(lián)情況,選取12個(gè)主要國(guó)家或者地區(qū)中具有代表性的股票價(jià)格指數(shù)交易數(shù)據(jù),數(shù)據(jù)表包括國(guó)際股票價(jià)格指數(shù)基本信息表和國(guó)際股票價(jià)格指數(shù)日交易數(shù)據(jù)表。IndexcdIdxnmeDJI美國(guó)道瓊斯工業(yè)指數(shù)FCHI法國(guó)CAC40指數(shù)FTSE英國(guó)富時(shí)100指數(shù)GDAXI德國(guó)DAX指數(shù)HSI中國(guó)香港恒生指數(shù)KS11韓國(guó)KOSPI指數(shù)MCIX俄羅斯Micex指數(shù)N225日本日經(jīng)225SENSEX印度孟買(mǎi)30指數(shù)STI富時(shí)新加坡海峽時(shí)報(bào)指數(shù)TWII中國(guó)臺(tái)灣加權(quán)指數(shù)000300中國(guó)滬深300指數(shù)IndexcdTrddtOpnidxHighidxLowidxClsidxDJI2010-01-0410430.6910604.9710430.6910583.96DJI2010-01-0510584.5610584.5610522.5210572.02DJI2010-01-0610564.7210594.9910546.5510573.68DJI2010-01-0710571.1110612.3710505.2110606.86DJI2010-01-0810606.410619.410554.3310618.19DJI2010-01-1110620.3110676.2310591.5910663.99DJI2010-01-1210662.8610663.0810568.8410627.26………………………………其中字段依次為指數(shù)代碼、交易日期、開(kāi)盤(pán)指數(shù)、最高指數(shù)、最低指數(shù)、收盤(pán)指數(shù)。數(shù)據(jù)區(qū)間從2010年1月至2019年8月。問(wèn)題:在一國(guó)或地區(qū)由于受某事件的影響造成其主要股票價(jià)格指數(shù)下跌幅度較大時(shí),另一國(guó)或地區(qū)的主要股票價(jià)格指數(shù)在同期是否也會(huì)有較大幅度的下跌?注意,這里下跌幅度較大定義為:跌幅大于等于0.5%。數(shù)據(jù)預(yù)處理第7章
(1)計(jì)算各指數(shù)的跌幅指標(biāo)數(shù)據(jù),其中跌幅計(jì)算公式為:
(當(dāng)日收盤(pán)指數(shù)?上日收盤(pán)指數(shù))/上日收盤(pán)指數(shù)為了便于關(guān)聯(lián)規(guī)則挖掘,我們將跌幅指標(biāo)數(shù)據(jù)轉(zhuǎn)化為0、1布爾值,即跌幅大于等于0.5%記為1,否則為0。圖中第一行代表了中國(guó)滬深300指數(shù)的跌幅數(shù)據(jù),其中2010年1月5日的值為0,表示跌幅沒(méi)有超過(guò)0.5%,而2010年1月6日的值為1,表示當(dāng)日跌幅超過(guò)了0.5%。數(shù)據(jù)預(yù)處理第7章
(2)各指數(shù)交易日期做一致化處理。事實(shí)上,不同國(guó)家或地區(qū)的交易日期并不完全相同,為了便于挖掘有意義的關(guān)聯(lián)規(guī)則,需要在所有指數(shù)交易日均相同的情況下進(jìn)行挖掘。這里以中國(guó)滬深300指數(shù)交易日為篩選基準(zhǔn)。顯示12個(gè)國(guó)際指數(shù),2010年1月至2019年8月的共同交易日一共1569個(gè),基于一致化的交易日期,就可以構(gòu)造關(guān)聯(lián)規(guī)則挖掘所需的布爾數(shù)據(jù)集了。數(shù)據(jù)預(yù)處理第7章
(3)構(gòu)造關(guān)聯(lián)規(guī)則挖掘所需的布爾值數(shù)據(jù)集,其結(jié)果如下。道瓊斯工業(yè)指數(shù)DJI在2010年1月15日的收盤(pán)指數(shù)跌幅在0.5%以上,中國(guó)滬深300指數(shù)當(dāng)日的收盤(pán)指數(shù)跌幅低于0.5%,而且12個(gè)國(guó)際指數(shù)交易日期也做了一致化處理,下面將基于該數(shù)據(jù)集挖掘關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘第7章
采用第5章介紹的一對(duì)一關(guān)聯(lián)規(guī)則挖掘算法,最小支持度設(shè)置為大于0.1,最小置信度為大于0.6。c=list(Data.columns)c0=0.6#最小置信度s0=0.1#最小支持度list1=[]#預(yù)定義定義列表list1,用于存放規(guī)則list2=[]#預(yù)定義定義列表list2,用于存放規(guī)則的支持度list3=[]#預(yù)定義定義列表list3,用于存放規(guī)則的置信度f(wàn)orkinrange(len(c)):forqinrange(len(c)):
#對(duì)第c[k]個(gè)項(xiàng)與第c[q]個(gè)項(xiàng)挖掘關(guān)聯(lián)規(guī)則
#規(guī)則的前件為c[k]
#規(guī)則的后件為c[q]
#要求前件和后件不相等ifc[k]!=c[q]:c1=Data[c[k]]c2=Data[c[q]]
I1=c1.values==1I2=c2.values==1
t12=np.zeros((len(c1)))t1=np.zeros((len(c1)))t12[I1&I2]=1t1[I1]=1sp=sum(t12)/len(c1)#支持度co=sum(t12)/sum(t1)#置信度
#取置信度大于等于c0的關(guān)聯(lián)規(guī)則ifco>=c0andsp>=s0:list1.append(c[k]+'--'+c[q])list2.append(sp)list3.append(co)#定義字典,用于存放關(guān)聯(lián)規(guī)則及其置信度、支持度
R={'rule':list1,'support':list2,'confidence':list3}#將字典轉(zhuǎn)化為數(shù)據(jù)框R=pd.DataFrame(R)#將結(jié)果導(dǎo)出到ExcelR.to_excel('rule1.xlsx')關(guān)聯(lián)規(guī)則挖掘第7章
IDrulesupportconfidence1DJI--FCHI0.13001910.682DJI--GDAXI0.12109620.6333333333FCHI--FTSE0.19184190.6644591614FCHI--GDAXI0.22498410.7792494485FTSE--FCHI0.19184190.7757731966FTSE--GDAXI0.18419380.7448453617GDAXI--FCHI0.22498410.8364928918GDAXI--FTSE0.18419380.6848341239KS11--HSI0.13957930.63662790710KS11--N2250.1389420.6337209311STI--HSI0.14404080.
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 蘇科版數(shù)學(xué)八年級(jí)上冊(cè)聽(tīng)評(píng)課記錄《4-3實(shí)數(shù)(2)》
- 中考人教版地理一輪復(fù)習(xí):八年級(jí)下冊(cè)第九章 青藏地區(qū) 聽(tīng)課評(píng)課記錄
- 小學(xué)二年級(jí)加減數(shù)學(xué)口算練習(xí)題
- 湘教版地理七年級(jí)下冊(cè)《 第八章 走進(jìn)國(guó)家 第四節(jié)法國(guó)導(dǎo)》聽(tīng)課評(píng)課記錄
- 五年級(jí)口算題50道
- 學(xué)生營(yíng)養(yǎng)餐供貨協(xié)議書(shū)范本
- 醫(yī)院和醫(yī)院合作協(xié)議書(shū)范本
- 機(jī)器購(gòu)銷(xiāo)合同范本
- 2025年度知識(shí)產(chǎn)權(quán)交易市場(chǎng)運(yùn)營(yíng)管理協(xié)議
- 北京市房屋租賃合同范本
- 交流伺服系統(tǒng)常見(jiàn)故障及處理分解課件
- 水土保持單元工程質(zhì)量評(píng)定表
- 圣三國(guó)蜀漢傳攻略
- 2021屆高考英語(yǔ)887核心詞(打印、詞頻、出處、例句、背誦)
- 天津市鄉(xiāng)鎮(zhèn)衛(wèi)生院街道社區(qū)衛(wèi)生服務(wù)中心地址醫(yī)療機(jī)構(gòu)名單
- 公司機(jī)關(guān)管理類(lèi)責(zé)任矩陣
- 山東省青島市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會(huì)明細(xì)及行政區(qū)劃代碼
- 《鉆井液用磺甲基酚醛樹(shù)脂技術(shù)要求》
- 數(shù)學(xué)-九宮數(shù)獨(dú)100題(附答案)
- 中國(guó)農(nóng)業(yè)發(fā)展銀行XX支行 關(guān)于綜合評(píng)價(jià)自評(píng)情況的報(bào)告
- 2010年宣武區(qū)第六屆中小學(xué)生地理知識(shí)競(jìng)賽題庫(kù)
評(píng)論
0/150
提交評(píng)論