Python金融數(shù)據(jù)分析與挖掘(微課版) 課件 6-4.股票交易數(shù)據(jù)與股票價格指數(shù)_第1頁
Python金融數(shù)據(jù)分析與挖掘(微課版) 課件 6-4.股票交易數(shù)據(jù)與股票價格指數(shù)_第2頁
Python金融數(shù)據(jù)分析與挖掘(微課版) 課件 6-4.股票交易數(shù)據(jù)與股票價格指數(shù)_第3頁
Python金融數(shù)據(jù)分析與挖掘(微課版) 課件 6-4.股票交易數(shù)據(jù)與股票價格指數(shù)_第4頁
Python金融數(shù)據(jù)分析與挖掘(微課版) 課件 6-4.股票交易數(shù)據(jù)與股票價格指數(shù)_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第6章

金融數(shù)據(jù)基礎(chǔ)股票交易數(shù)據(jù)基本知識股票交易數(shù)據(jù)生產(chǎn)場景高頻數(shù)據(jù)(10檔行情)股票交易日頻數(shù)據(jù)和股票價格指數(shù)股票交易數(shù)據(jù)基本知識第6章

股票交易數(shù)據(jù)最主要是兩個方面:一個是價,包括成交價、委托價;一個是量,包括成交量、委托量;一般地,以日為單位的交易數(shù)據(jù)(統(tǒng)計當(dāng)天的交易情況,比如開盤價、最高價、最低價、收盤價是多少,總成交量又是多少等),主要是成交價和成交量數(shù)據(jù),沒有委托價和量數(shù)據(jù)。以秒、分鐘為單位的交易數(shù)據(jù)(稱為高頻數(shù)據(jù)),則更為詳細,不僅包括成交價、成交量數(shù)據(jù),還包括委托量、委托價數(shù)據(jù)。股票交易數(shù)據(jù)基本知識第6章

我們以一個買賣白菜的市場為例,形象的解釋這些術(shù)語。為了公平起見,我們對日常的白菜市場制定一些規(guī)則。首先,有賣白菜的,我們稱為供應(yīng)方,或者是賣方;同樣的,也有買白菜的,我們稱為需求方,或者是買方其次,這個菜市場有一個開放時間,比如9:15-15:00,其中11:30-13:00休息。為了使買賣雙方都有一個公平的價格,它應(yīng)該由市場決定。9:15-9:25這10分鐘內(nèi),在場的買方都報出自己需要購買的數(shù)量和單價,賣方也報出自己能供應(yīng)的數(shù)量及單價。10分鐘結(jié)束后,不允許再報了,我們要找到這樣一個價格,使得成交量最大化,就是第一筆成交價格,稱為開盤價,這個過程稱為集合競價。開盤價是買賣雙方最早的集體博弈的結(jié)果,比較有意義,為了讓雙方都有一個短暫的消化時間,9:25-9:30這5分鐘內(nèi)不交易。9:30開始繼續(xù)交易,交易價格的產(chǎn)生不再是通過集合競價,而是進入連續(xù)競價階段。股票交易數(shù)據(jù)基本知識第6章

連續(xù)競價交易,即買賣雙方都可以隨時報出自己的數(shù)量和單價,但又是如何促成交易的呢?這里有一個原則,即價格越優(yōu)的報單就越排在前面,如果價格都一樣,則先報的排在前面,即價格優(yōu)先、時間優(yōu)先原則。何為優(yōu)的報價,對于買方,越高的報價就越優(yōu);對于賣方,越低的報價越優(yōu);這樣,只要符合買賣雙方的交易條件,就會連續(xù)成交,一直持續(xù)到結(jié)束。最后一筆交易的價格,即為收盤價。統(tǒng)計當(dāng)天所有的交易,價格最高的即為最高價、最低的即為最低價。當(dāng)然,交易也會產(chǎn)生交易量和交易金額等數(shù)據(jù)。最后,一天交易結(jié)束之后統(tǒng)計的數(shù)據(jù)稱為日頻數(shù)據(jù),一天只有一條記錄,主要指標(biāo)數(shù)據(jù)是當(dāng)天的開盤價、最高價、最低價、收盤價、總成交量、總成交金額。如果以秒或分鐘為頻率統(tǒng)計的數(shù)據(jù),稱為高頻數(shù)據(jù),他們主要是統(tǒng)計截止當(dāng)前時間和相鄰兩個時間點產(chǎn)生的數(shù)據(jù)。高頻數(shù)據(jù)除了成交價格、成交量和金額之外,還有一些未成交的買賣雙方委托價格和委托量數(shù)據(jù)。如果把白菜比喻成股票等證券,白菜市場看成是證券交易所,買方和賣方看成投資者,產(chǎn)生的數(shù)據(jù)就是股票交易數(shù)據(jù)。股票交易數(shù)據(jù)生產(chǎn)場景第6章

我們可以想象這樣一個場景,一個投資者在券商的行情軟件提交委托訂單,而券商的行情軟件是與交易所交易系統(tǒng)聯(lián)網(wǎng)的,從而投資者的委托訂單被送達交易系統(tǒng),進行撮合成交。目前市場上有數(shù)量眾多的投資者、券商和相關(guān)交易所,他們共同構(gòu)成了中國的證券期貨場內(nèi)交易市場這里有兩個微觀數(shù)據(jù):一個是投資者的委托訂單數(shù)據(jù),稱為逐筆委托數(shù)據(jù);一個是交易所系統(tǒng)的成交數(shù)據(jù),稱為逐筆成交數(shù)據(jù)。這兩個數(shù)據(jù)是時間序列數(shù)據(jù),時間精確到毫秒,詳細完整地記錄了每一位投資者每一筆委托訂單信息及交易系統(tǒng)每一筆交易的成交信息。高頻數(shù)據(jù)則是由這兩個微觀數(shù)據(jù)加工而成股票交易數(shù)據(jù)生產(chǎn)場景第6章

高頻數(shù)據(jù)分為兩種:一種是超高頻數(shù)據(jù),比如以上的逐筆委托數(shù)據(jù)和逐筆成交數(shù)據(jù),這是一類比較特殊的高頻數(shù)據(jù);一種是通常意義上的高頻數(shù)據(jù),屬于等間隔取樣(或者等間隔的整數(shù)倍取樣,主要是因為取樣的時候,沒有對應(yīng)的委托數(shù)據(jù)或成交數(shù)據(jù),則順延至下一次取樣,直到取樣成功為止)。這里的取樣,是指截止當(dāng)前時間,統(tǒng)計匯總逐筆委托數(shù)據(jù)和逐筆成交數(shù)據(jù)而形成的行情數(shù)據(jù)(或稱快照數(shù)據(jù))。匯總統(tǒng)計過程是由交易所完成的,我們只需接收交易所發(fā)送的行情數(shù)據(jù)即可。根據(jù)統(tǒng)計匯總的頻率高低和內(nèi)容的詳細程度不同,交易所分為基本行情(5檔)和深度行情(10檔和超高頻數(shù)據(jù))兩個品種。10檔高頻數(shù)據(jù)第6章

靜態(tài)字段:證券代碼、交易日期、昨收盤價時間字段:數(shù)據(jù)生成時間成交字段:(開、高、低、最新)價、截止當(dāng)前總成交筆數(shù)、分筆期間成交筆數(shù)、

截止當(dāng)前總成交量、分筆期間成交量、截止當(dāng)前總成交額、分筆期間成交額委托字段:賣委托總量、賣委托加權(quán)平均價、委賣10至委賣01價、申賣量10至申賣量01、

買委托總量、買委托加權(quán)平均價、委買01至委買10、委買量01至委買量10.說明:數(shù)據(jù)生成時間,其實就是統(tǒng)計截止時間,假設(shè)數(shù)據(jù)生成時間是0941.230,這個時間通常是某筆交易發(fā)生的時間,則統(tǒng)計[0925.000,0941.230]該時間段內(nèi)逐筆成交數(shù)據(jù)表的成交數(shù)據(jù),形成本條記錄的成交字段數(shù)據(jù),同時再統(tǒng)計[0915,0941.230]該時間段內(nèi)有效的逐筆委托數(shù)據(jù)(不包括撤單的記錄),形成本條記錄的委托字段數(shù)據(jù)。換言之,成交字段數(shù)據(jù),就是截止0941.230該時間點,已經(jīng)成交的事實,而委托字段數(shù)據(jù)則是可供選擇的有望在下一刻成交的總量和可能獲得的價格,為推斷未來成交情況提供基礎(chǔ)數(shù)據(jù)。10檔高頻數(shù)據(jù)第6章

10檔高頻數(shù)據(jù)第6章

10檔高頻數(shù)據(jù)第6章

10檔高頻數(shù)據(jù)第6章

以093013100這個數(shù)據(jù)生產(chǎn)時間的記錄為例,它表示的是平安銀行(代碼:000001)在20130301交易日(TRDDATE)內(nèi),截止093013100當(dāng)前時間(DATATIME)的最高成交價(HIGHPX)為22.930最低成交價(LOWPX)為22.820最近一次交易的價格(最新價,LASTPX)為22.880,累計發(fā)生的總成交量(TOTALVOLUME)為1889900分筆期間的成交量(與上一條記錄之間的時間間隔發(fā)生的交易量,CQ)為10400可供購買的總量(即賣方的總供應(yīng)量,TOTALOFFERQTY)為6470952其中賣方提供的最低價格(S01)為22.900賣方提供的最低價位上的供應(yīng)量(SV01)為372617……日頻數(shù)據(jù)第6章

日頻交易數(shù)據(jù),主要是統(tǒng)計當(dāng)天交易情況的數(shù)據(jù),上一節(jié)也提到,高頻交易10檔行情數(shù)據(jù)表最后一條記錄數(shù)據(jù)就是日頻交易數(shù)據(jù)的來源,字段包括股票代碼、交易日期、收盤價、成交量、成交金額、開盤價、最高價、最低價等。StkcdTrddtClsprcDnshrtrdDnvaltrdOpnprcHiprcLoprcAdjprcwdAdjprcnd3000152017-05-1532.883314184107995576.532.432.8832.35244.9883236.32463000152017-05-1633.8474677915804871132.833.8832.5251.8433242.93713000152017-05-1733.31373243012511258333.5733.933.26248.1923239.41523000152017-05-1822.235758990128095499.322.0622.4921.89249.7941239.66663000152017-05-1922.46449048145514093.822.2722.9522.02251.7044241.49943000152017-05-2222.574798200107396565.522.4622.8522253.6146243.3322……………………………………………………由于分紅送股轉(zhuǎn)增股等行為,正常的收盤價是不具可比性的,基于投資者權(quán)益不變的原則(假設(shè)投資者在除權(quán)之前購買了股票或者是一位長期投資者,公司的送股、轉(zhuǎn)增股和分紅等權(quán)益均享有,即個人的資產(chǎn)權(quán)益不發(fā)生變化),需要對這個收盤價做出調(diào)整,于是衍生出了常見的兩個指標(biāo):考慮現(xiàn)金紅利再投資的收盤價可比價和不考慮現(xiàn)金紅利再投資的收盤價可比價股票價格指數(shù)第6章

股票價格指數(shù),反映多只股票或股票投資組合整體趨勢的指標(biāo),比如:反映上海證券交易所A股整體趨勢的上證A股指數(shù);反映深圳證券交易所A股主板、中小板和創(chuàng)業(yè)板各板塊整體趨勢的深證主板指數(shù)、中小板指數(shù)和創(chuàng)業(yè)板指數(shù);反映中國大陸A股市場整體趨勢的滬深300指數(shù)(從上海、深圳兩個證券交易所選取具有代表性的300只股票作為樣本進行計算)。事實上,股票價格指數(shù)屬于衍生性指標(biāo),其基礎(chǔ)數(shù)據(jù)是個股交易數(shù)據(jù),其計算公式為:股票價格指數(shù)=指數(shù)所包含的股票總市值/指數(shù)所包含的股票基準(zhǔn)日總市值。這里的總市值一般為調(diào)整性總市值,即根據(jù)不同的規(guī)則約束和調(diào)整機制,選擇個股范圍,并對參與計算的個股賦予不同的權(quán)重。股票價格指數(shù)第6章

為了方便理解,我們基于深圳創(chuàng)業(yè)板的所有股票2017年個股交易數(shù)據(jù),自建一個指數(shù)。StkcdTrddtClsprcDnshrtrdDnvaltrdOpnprcHiprcLoprc3000012017-01-0317.428140604898570217.3617.5217.343000012017-01-0417.7548001088465166217.4117.8917.333000012017-01-0517.6533944986008666217.7517.8617.613000012017-01-0617.4130020605243240417.6417.6617.383000012017-01-0917.4424145834205844017.3717.5417.313000012017-01-1017.3520724093604314717.3917.4717.323000012017-01-1117.6877575881.37E+0817.3518.1617.123000012017-01-1218.05107386841.93E+0817.6918.1417.453000012017-01-1317.4158797771.05E+0817.9618.117.4…………………………………………字段依次表示股票代碼、交易日期、收盤價、交易量、交易金額、開盤價、最高價和最低價。股票價格指數(shù)第6章

以2017年第一個交易日(2017-01-03)為基準(zhǔn)日,基點設(shè)為1000點,其計算公式為:每日總市值/基準(zhǔn)日總市值*1000,進一步地,我們還將其指數(shù)趨勢圖繪制出來importpandasaspdimportmatplotlib.pyplotaspltimportnumpyasnpplt.rcParams['font.sans-serif']='SimHei'df=pd.read_excel('創(chuàng)業(yè)板2017年個股交易數(shù)據(jù).xlsx')df1=df.groupby(['Trddt'])['Dnvaltrd'].sum()#分組統(tǒng)計每日總市值index=df1.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論