![動態(tài)時間彎曲算法在K線相似度計算中的應(yīng)用_第1頁](http://file4.renrendoc.com/view/8d1f4e1f5bf55801312fc0260ffb7006/8d1f4e1f5bf55801312fc0260ffb70061.gif)
![動態(tài)時間彎曲算法在K線相似度計算中的應(yīng)用_第2頁](http://file4.renrendoc.com/view/8d1f4e1f5bf55801312fc0260ffb7006/8d1f4e1f5bf55801312fc0260ffb70062.gif)
![動態(tài)時間彎曲算法在K線相似度計算中的應(yīng)用_第3頁](http://file4.renrendoc.com/view/8d1f4e1f5bf55801312fc0260ffb7006/8d1f4e1f5bf55801312fc0260ffb70063.gif)
![動態(tài)時間彎曲算法在K線相似度計算中的應(yīng)用_第4頁](http://file4.renrendoc.com/view/8d1f4e1f5bf55801312fc0260ffb7006/8d1f4e1f5bf55801312fc0260ffb70064.gif)
![動態(tài)時間彎曲算法在K線相似度計算中的應(yīng)用_第5頁](http://file4.renrendoc.com/view/8d1f4e1f5bf55801312fc0260ffb7006/8d1f4e1f5bf55801312fc0260ffb70065.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
動態(tài)時間彎曲算法在K線相似度計算中的應(yīng)用序言在證券交易數(shù)據(jù)中,股票K線圖無疑是一種非常重要的數(shù)據(jù).它反映了股票在過去歷史中基于開盤價與收盤價的交易價格的變動.古有言,以史為鑒,歷史往往存在相似性,對一支股過去歷史波動的研究,往往可以對其自身,以及其他股票的未來價格變動作出一些合理預(yù)測.而股票價格究其根本是一種時間序列.對于時間序列,是一種以時間為軸,在一些特別規(guī)定的時間點上通過采樣得到的一系列按照時間順序排列的,從被觀測對象獲取到的觀測值.通過對時間序列的研究,找到兩條時間序列相似程度的的度量方法就被稱為時間序列相似性度量,這是時間序列聚類分析中一個不可缺少的步驟,同時也是分類、聚類、規(guī)律發(fā)現(xiàn)、模式識別等工作的子進(jìn)程.對于研究股票k線圖相似性,是為了對未來進(jìn)行合理預(yù)測,因此度量方法應(yīng)該考慮其性能對于后期時間序列數(shù)據(jù)挖掘的效果的的直接影響程度.時間序列的相似程度是由度量距離的大小所決定的.而相似性度量方式的特性又決定了相似性度量的效果.在時間序列相似性度量中,我們最常用的方法就是動態(tài)時間彎曲(DynamicTimeWarping,DTW)?這是由Berndt于1994年提出將其應(yīng)用在時間序列數(shù)據(jù)挖掘領(lǐng)域中,以此來發(fā)現(xiàn)時間序列中的模式.而這剛好適用于股票k線圖的相似程度的研究.這是由于動態(tài)時間彎曲不僅可以消除歐式距離“點對點”的匹配缺陷,通過彎曲時間來達(dá)到時間序列數(shù)據(jù)點“一對多”的匹配,從而實現(xiàn)不等長時間序列的度量,還對時間序列的偏移,振幅變化等情況具有較強(qiáng)的魯棒性(魯棒是Robust的音譯,也就是健壯和強(qiáng)壯的意思.魯棒性指的是遭遇外來干擾,性質(zhì)保持不變的能力?)?這對于不同股票的k線圖在不同的時間跨度而可能形成相同價格形態(tài)有著重要意義.一、DTW算法原理動態(tài)時間彎曲是一種在語音識別領(lǐng)域得到首次應(yīng)用的,準(zhǔn)確性高并且魯棒性強(qiáng)的時間序列相似性度量方法.它區(qū)別于傳統(tǒng)的歐幾里的距離,其不同在于動態(tài)時間彎曲可以通過彎曲時間序列的時間區(qū)域從而對時間序列的數(shù)據(jù)點進(jìn)行匹配,這樣我們不單單能夠得到更好的形態(tài)度量的效果,更重要的是我們能夠度量兩條不等長的時間序列.對于股票K線圖的相似性,我們尋求的是價格形態(tài)的相似性.例如威廉?歐奈爾提到的一種最普遍的價格形態(tài)“帶柄茶杯形態(tài)”,當(dāng)我們找到與此形態(tài)相似的股票時就要做出準(zhǔn)備,這可能是一支帶動市場發(fā)展的“超級牛股”一如當(dāng)年的微軟與蘋果.要想實現(xiàn)股票K線圖的這種相似度匹配,依靠歐式距離在度量中講時間序列進(jìn)行“一對一“的數(shù)據(jù)匹配是不夠的,盡管它具有高效性,但是它并未能準(zhǔn)確的使波峰、波谷匹配起來?而動態(tài)時間彎曲則能夠通過彎曲時間軸來實現(xiàn)“一對多”的數(shù)據(jù)匹配?通過這樣,動態(tài)時間彎曲就能成功將兩條不同的股票 K線圖的波峰和波谷匹配起來,從而有助于我們度量價格形態(tài)的相似程度,體現(xiàn)了動態(tài)時間彎曲在形態(tài)度量上的優(yōu)勢.1.1動態(tài)時間彎曲距離【1】
在介紹動態(tài)時間彎曲算法之前,先簡單的介紹一下動態(tài)時間彎曲距離的定義.定義1給定兩條時間序列x={x,x,…,x}和y={y,y,…,y},計算它們之間的累TOC\o"1-5"\h\z1 2 n "1"2 n積距離D(i-1,j)D(i,j)=d(x冷j)+min{D(i,j-1)1' D(i-1,j- 1)其中d(x.,y.)=IIx.-y.11 (1)ij i j CD為點x.到y(tǒng)j之間的距離,其中i=(12…,n),j=(1,2,…,m),當(dāng)=2時為歐式距離.得到的累積最小距離就是動態(tài)彎曲距離,我們記為 D()在這里我們需要特別注意一點,動態(tài)彎曲距離是不符合三角不等式的命題1D()不滿足三角不等式warp證明我們可以通過一個反例來證明這個論題,設(shè)x?=?0?y?=?1,2? 和?=?1,2,2?z,那我們有:Dwarp(x?,z?)=5>D(x?,y?)+D(y?,z?)warp warp=3+0=3如此命題得證.1.2動態(tài)時間彎曲距離的計算計算它的最終累積距離其實可以認(rèn)為是在距離矩陣 D中尋找一條最優(yōu)的彎曲路徑P,從而使得累積距離達(dá)到最小,其中距離矩陣可以表示為以任意兩點之間的距離來確立 的距離矩陣D??(???????)???(??????)D=(?? \ 八? ??\ 75D=(???)??(????,??)???(??????),通過尋找彎曲路徑P={p1,p2,…pK}(max(n,m)<K<n+m+1)來使得S和Q的累best 丄丄 丄 計距離的值達(dá)到最小■其中p表示的是彎曲路徑元素在距離矩陣中的位置,k即p=(i,j)表示s.與h之間的匹配關(guān)系.則由此可以知道d(p)=d(i,j)k k i ] k?通過觀察距離矩陣,我們可以看出一般存在著多條彎曲路徑,有效的彎曲路k徑P必須符合三個要求:(1)邊界性:p=(1,1),p=(n,m)■即路線必須從距離矩陣的第一行第1 K—列出發(fā)到達(dá)矩陣的第n行第n列(2)單調(diào)性:給定pk=(i,j)和pk+1=(x,y),則x>i,y>j.(3)連續(xù)性:給定pk=(i,j)和pk1=(x,y),x<i+1,y<j+1■單調(diào)
性和連續(xù)性的存在保證了彎曲路徑中某個點的下一個點在當(dāng)前點的上方、右上方、右方.1.3范例給定兩條時間序列x={2,5,5,4,6,7} ,y={2,4,6,5,7,7},如下圖,計算它們的動態(tài)時間彎曲距離:77我們令d(x.訂.)=lx-yl,由此來構(gòu)造一個距離矩陣,在這里為了方便起見把它)的值.在股票)的值.在股票做成了一個網(wǎng)格形態(tài),每一格中的數(shù)字代表距離矩陣相應(yīng)位置的 d(xi,y由此我們便可以根據(jù)動態(tài)規(guī)劃(AP)找到一條最優(yōu)路徑從而得到DOwarp的相似性52231052331丿03001125112/012/0*—023033245:、基于動態(tài)時間彎曲的股票k線圖相似性計算在股票K線圖的相似性計算中,我們通常是將股票進(jìn)行兩兩比較.在這里我們將選取其中一支具有特別價格形態(tài)的股票作為參考股票,另一支與它進(jìn)行比較的股票就叫測量股票.2.1將股票數(shù)據(jù)進(jìn)行向量化和標(biāo)準(zhǔn)化【6】為了便于后續(xù)計算,我們首先要將采集到股票數(shù)據(jù)進(jìn)行預(yù)先處理我們將參考股票具有研究意義的30天的價格變動以向量方式記錄,記為x?(Xi,X2,…,J)同樣的我們將測量股票要測量的30天價格變動也用向量方式記錄記為天價格變動也用向量方式記錄,記為y?=(y^y2,…y)其中n為選取的K線圖某時刻的時序標(biāo)號:n=1為起點時刻,在這里我們選取的是30天,所以n=30為終點時刻.x為第m時刻的K線圖的收盤價格.m由于股票價格差別巨大,統(tǒng)一的闕值不好判斷,所以要進(jìn)行規(guī)范處理,把所有股票的價格變動都轉(zhuǎn)化為0?1之間,具體方法如下:xi-mm(x?)Z= imax(x?)-min?(x?)2.2通過構(gòu)建股票價格的距離矩陣尋找最優(yōu)路徑采用動態(tài)時間彎曲算法我們首先要根據(jù)參考股票和測試股票的收盤價格來構(gòu)
建一個距離矩陣D 我們可以用如下辦法來快速構(gòu)建距離矩陣從而找到最優(yōu)路nxm徑.若把測試模板的各個時刻n=1~N在一個二維直角坐標(biāo)系中的橫軸上標(biāo)出,把參考股票的各時刻m=1~M在縱軸上標(biāo)出,通過這些表示時刻的整數(shù)坐標(biāo)畫出一些縱橫線即可形成一個網(wǎng)絡(luò),網(wǎng)絡(luò)中的每一個交叉點(n,m)表示測試股票與參考股票中某一時刻的交匯點.用動態(tài)規(guī)劃(DP)算法來計算并尋找一條通過此網(wǎng)絡(luò)中若干格點的路徑,路徑通過的格點即為測試和參考股票中進(jìn)行計算的時刻.具體如下圖:d(x30』1)d(x30』3。)??????d(x3,y1)嘰』1)d('y1)d(\y2)d(x1-y3)-'?…(1(x1,y3。)路徑不是隨意選擇的,首先任何一種股票的價格漲幅都有可能變化,但是其各時刻的先后次序不可能改變,因此所選的路徑必定是從左下角出發(fā),在右上角結(jié)束為了描述這條路徑,假設(shè)路徑通過的所有格點依次為(「,m】),……,(nimj), ,(nN,mM),其中(n],m])=(1,1),(nN,叫)=(N,M)■為了使路徑不至于過傾斜,可以約束斜率在0.5~2的范圍內(nèi),如果路徑已經(jīng)通過了格點(n,m),那么下一個通過的格點(n,m)只可能是下列三種情況之
@(n,m)=(n+1,m+1){D(n-l,m),D(n-l,m-l),D(n,m-1)}3(n,m)=(n,m+1)用r表示上述三個約束條件.求最佳路徑的問題可以歸結(jié)為滿足約束條件r時,求最佳路徑,使得沿路徑的積累距離達(dá)到最小值即D()warp2.3搜索該路徑的方法搜索從(N,M)點出發(fā),可以展開若干條滿足r的路徑,假設(shè)可計算每條路徑達(dá)到(n,m)點時的總的積累距離,具有最小累積距離者即為最佳路徑?易于證明,限定范圍的任一格點(n,m)只可能有一條搜索路徑通過?對于(n,m),其可達(dá)到該格點的前一個格點只可能是(n-1,m)、(n-1,m-1)和(n,m-1),那么(n,m)一定選擇這3個距離之路徑延伸而通過(n,m),這時此路徑的積累距離為:D(n- 1,m)D[(n,m)]=d[x,y]+min{???D(n-1,m-1)D(n,m-1)這樣可以從(n,m)=(30,30)出發(fā)搜索(n,m),對每一個(n,m)都存儲相應(yīng)的距離,這個距離是當(dāng)前格點的匹配距離與前一個累計距離最小的格點(按照設(shè)定的斜率在三個格點中進(jìn)行比較)?搜索到(1,1)時,只保留一條最佳路徑?如果有必要的話,通過逐點向前尋找就可以求得整條路徑.DTW算法可以直接按上面描述來實現(xiàn),即分配兩個NXM的矩陣,分別為積累距離矩陣D和時刻匹配距離矩陣d,其中時刻匹配距離矩陣d(i,j)的值為測試股票的第i時刻與參考股票的第j時刻間的距離.D(N,M)即為最佳匹配路徑所對應(yīng)的匹配距離.2?4范例例如我們選取兩支股票,一支是中成股份(000151)作為參考股份?x,另一支是翼凱股份(002691)作為測試股份?y,為了計算方便我們只取五天的數(shù)據(jù)第一步:提取數(shù)據(jù)X=(10.53,11.58,12.74,13.77,13.19)Y=(27.99,29.4,32.3,32.8,32.4)第二步:標(biāo)準(zhǔn)化經(jīng)過Z經(jīng)過Zi=xi-min(x?)后,max(x?)-min?(x?)0.820)0.917)X=(0,0.324,0.682,1,0.820)0.917)Y=(0,0.293,0.896,1,第三步:構(gòu)建距離矩陣并尋找最優(yōu)路徑在這里我們讓d(x,y)=|x-y|]j0.3240.8200.5270.0760.3240.8200.5270.0760.1800.097/10.7070.104痢-00.0830.6820.389T0.214/.0.3180.2350.593 打0.031 0.572 0.67600.2930.89610.917最終我們得到一個最優(yōu)累積距離Dwarp()=0.046三、DTW在K線圖相似度計算機(jī)的實際應(yīng)用【2】在中國A股總共有3470支甚至還有中小企業(yè)板,乃至創(chuàng)業(yè)板的股票,再涉及到各自的歷史數(shù)據(jù),這是一個非常龐大的數(shù)據(jù)庫.若要在這個數(shù)據(jù)可當(dāng)中找尋于某一支股票相似的其他股票,將是一個計算量非常大的工作.顯然不可能人工手算,而是要借助計算機(jī)的索引技術(shù).但是如此龐大的數(shù)據(jù)對索引技術(shù)的準(zhǔn)確性和高效性有著非常大的挑戰(zhàn).3.1索引技術(shù)索引技術(shù)是一種快速的文件訪問技術(shù),舉個例子,好比我們查字典,會根據(jù)偏旁部首在索引表中找到這個字在第幾頁一樣,索引技術(shù)就是根據(jù)事先記錄好的能夠代表屬性的取值將它與物理地址關(guān)聯(lián),進(jìn)而在數(shù)據(jù)庫中搜索.之前我們著重提到過一個命題一一D()不符合三角不等式?這個事實對于warp我們可以用于索引的方法有著重要的意義:任何隱含或明確地符合三角不等式的索引技術(shù)都不能避免產(chǎn)生錯誤的排除.這是一個非常嚴(yán)格的要求:所有的空間訪問方法,以及所有使用距離、度量、有利位置樹的方法都不能避免錯誤的排除.唯一保證不會被錯誤排除的方法是順序掃描,,對于像股票這種大量長序列集合來說這將是計算量巨大的.為了解決這個問題,人們提出了一種方法,用來避免一小部分的錯誤排除的同時能夠?qū)崿F(xiàn)的索引的加速.也就是說,人們的目標(biāo)是提供快速的索引技術(shù),同時盡可能地避免錯誤的排除.在這里人們引用了兩種方法.3.2基于FastMap的訪問方法我引用的第一種技術(shù)是基于一種名為FastMap的方法【4】它的工作原理如下:給定N個對象和一個距離函數(shù),它將對象映射到k維空間中的N個點,以便保持原始距離,參數(shù)k可以由用戶給出,或者人們可以在應(yīng)用中調(diào)整以獲得更好的系統(tǒng)性能?關(guān)鍵在于是假設(shè)對象確實能夠表示成n維空間中的點,并且能夠僅使用距離函數(shù)將這些點投影到相互正交k維空間中(k《n),從而實現(xiàn)降維的目的.如一個三維向量(x,y,z)可以經(jīng)過函數(shù)映射到二維空間(x,y)換用我們?nèi)缃裾谘芯康墓善眮碇v,就是我們要將我們包含 30天收盤價格的向量,通過一個距離函數(shù)映射到一個二維空間?從而減少數(shù)據(jù)的處理.在將對象映射到k個點之后,人們可以使用任何空間訪問方法來組織它們并搜索范圍查詢.FastMap在對象的數(shù)目N(即序列)上是線性的?而且,將查詢序列映射到第k個點需要O(k)時間,也就是說,相對于數(shù)據(jù)庫大小N,時間是恒定的.與其他方法一樣(參見命題1),如果不遵守三角不等式,F(xiàn)astMap可能會引入錯誤的排除?我們觀察到,如果我們使用原始距離的平方根即歐幾里得距離(很明顯它符合三角不等式),我們可以避免更多的錯誤排除?因此,我們在選擇一個距離函數(shù)時候使用的就是歐幾里得距離.
algorithnfrzm^s^sQarcb.W1w0i/*nasp^nse*//*filtering +/GIysa譏foreacbsecjuenGO玄LnEh七 、ifK巧〔門訕中日哥4《#).thzaddit&/?;/*pGSt^prOCa&filTL.gS-tep*/Forea^hiinR*if(PJ}>*)*TlisB ifr^tnfiiReporr/?;導(dǎo)midlj^xlthiii圖來自:【2】算法1描述了如何使用FastMap處理范圍查詢■如果將FastMap應(yīng)用于平方根距離,則搜索范圍也應(yīng)該平方根■注意F(s?)表示序列的坐標(biāo)■在過濾步驟中,根據(jù)歐幾里得距離而不是時間彎曲距離來比較兩個序列,這是由于歐幾里得計算的簡單性和快捷性,這相當(dāng)于一步粗篩選?在這一步中不相關(guān)的序列被排除在外■—些不符合條件的序列可能包含在內(nèi),但在后處理步驟中將刪除這些序列.由于兩個原因,算法1比單純的DTW方法更快■首先,它掃描較少的序列■其次,過濾步驟也更快,因為k比序列長度小得多(通常是一些固定常數(shù),比如6)■過濾可能會刪除一些合格的序列,導(dǎo)致錯誤排除,因為我們不能保證在k-d空間中的歐幾里得距離越低越好.即使我們使用時間彎曲距離的平方根,情況也是如此,但在實踐中錯誤排除的可能性非常低,我們將在后面看到.3.3下邊界技術(shù)對于兩個給定的序列?=xVX],…,x>和y?=vy],…,y>,讓max(?x)和max(y?)表示x?和y?中的最大值.min(x?)和min(y?)的定義相似,但是最小值■—對vmax(x?),min(x?)>定義了序列x?可以控制的范圍.warp不失一般性,我們假設(shè)max(x?)>max(y?)所提出的方法受以下觀察的啟發(fā):觀察1|max(x?)-max(y?)|<D(x?;?y).warp檢查其有效性相當(dāng)簡單■由于max(x?)應(yīng)該至少匹配y?的一個元素,比如y.,并且我們假設(shè)max(x?)>max(y?),|max(?x)-max(y?)|< |max(x?)-y|<D(x?;?y):i warp這個觀察的結(jié)果是最大值的絕對差值可以作為一個距離來限制時間彎曲距離■雖然這是真的,但是,它可能不是很有用,因為它可能低于時間彎曲距離太多■因此,我們的目標(biāo)是找到一個更緊密的下界.我們考慮兩個序列的范圍的可能排列進(jìn)行比較.觀察2給定兩個范圍觀察2給定兩個范圍Rx?=vmax(?x),min(?x)>和Ry?=vmax(y?),min(y?)>(范圍的可能排列(見下圖))1.overlap:Rx?1.overlap:Rx?和Ry?重疊 (min(x?)Wmax(y?);min(x?)$min(y?)).2.encloses:Rx?包含Ry? (min (?x)vmin(?y))?3.disjoint:Rx?和Ry?是不相交的(min (x?)>max(y?)【2】可以保證范圍查詢和最近相鄰D距離(維度k上Ry■RaKyRy(dIdbjoinc圖來自:我們有三種可能的排列iva1.鼻|t|——fimrlyjVi—m?B(f}|n/rJHji—■ 1|jT]— 1譏一 ■【心|ijfhFWKJ"1昭1I舟亠鮎卄7i|rij冊圖來自:【2】值得注意的是,當(dāng)通過掃描一次將序列輸入到數(shù)據(jù)庫中時,可以計算序列的最小值和最大值,并且可以將序列存儲以供將來使用?而且,通過簡單的比較,可以在恒定的時間內(nèi)確定兩個序列的范圍的排列?最后,D的定義只需要對每個序lb列進(jìn)行一次掃描,因此我們可以計算序列長度中線性時間內(nèi)兩個序列之間的D距l(xiāng)b離?這會令速效率有很大的改善,除非D太低估D?lb warp定理1對于任何兩個序列X?=VX],??,x m>和y?=<y n>,y nDib(x?,?y)WD(x?,?y)lb warp證明:見附錄A.作為定理1的直接結(jié)果,我們得到以下推論.>,如n推論1(沒有誤診率)對于任何兩個序列X?=<X],??,X >和>,如nTOC\o"1-5"\h\z& & y果D(x?;?y)W,貝UD(x?;?y)W?warp lb實際距離D與下邊界距離d是一種限制條件,2 lb查詢不會被錯誤排除[8]?在過濾步驟中,快速濾除不相關(guān)序列,因為可以快速計算lb的線性時間,通常為kW10)?一些不合格的序列可能包含在這個步驟的結(jié)果中,因為D小于我們的動態(tài)時間彎曲距離D?但是,這些不合格序列在后處理步驟lb warp中被刪除.具體算法如下:算法2蠱lgqrlthiq1命pe「一BquacH訥呂蔬a{};/?riltaringstep*/Civenry,/o-re^cbsequence>inthedatabase、fif(P?i J?thenaddito{?;/*posl^precessing3t?p*/F&reicLiinR,if(jP.“就譏打IA,)■th餌removeifrom商;fl*portH;endalgorithm圖來自:【2】3.3結(jié)合兩種技術(shù)【5】假設(shè)有一個股票數(shù)據(jù)庫包含許多任意長度的時間序列并且我們想要找出與某個查詢序列相似的所有序列,即時間彎曲距離單位內(nèi)的所有序列.這種類型的查詢是有效范圍查詢.處理這種查詢的直接方式是掃描所有序列并為每個掃描序列計算D (),以選warp擇符合條件的那些序列.雖然非常簡單,但速度可能很慢,因為它讀取數(shù)據(jù)庫中的每一個序列(因此速度很慢),并且它計算每個股票數(shù)據(jù)庫序列的時間彎曲距離.這個問題的獨特之處在于,不僅I/O成本(第一種情況)很高,而且還有計算成本(第二種情況).因此,我們所需要的技術(shù)應(yīng)該解決這兩個問題?為了解決這些問題,人們采用了之前提到的兩種技術(shù).1?使用FastMap構(gòu)建索引結(jié)構(gòu)以加快查詢處理速度.這種技術(shù)可能會導(dǎo)致一些錯誤的排除.2?使用低于時間彎曲距離的下邊界距離函數(shù). 這種方法保證不會有錯誤的排除.3?使用這兩種技術(shù)的組合.由于這兩種技術(shù)彼此獨立,因此可以采用流水線方式進(jìn)行組合.仔細(xì)考慮前面兩部分提出的兩種技術(shù)可以帶來更高效的算法.在算法1中,我們僅使用時間彎曲距離篩選過濾的序列.但是,我們可以在計算時間彎曲距離之前使用下邊界距離.如果序列確實是合格的序列,這就變成了額外的成本,但是如果不合格就可以節(jié)省大量的計算成本. 這樣我們就有了一個靈活的多階段查詢處理系統(tǒng),如圖3所示,其中FastMap和D分別作為主要和次要過濾器.lb圖來自:【2】它由三個階段組成,它們以流水線方式連接.第一階段僅使用FastMap索引排除不相關(guān)的序列.在此階段進(jìn)行過濾可降低I/O成本和CPU成本.那些通過第一過濾階段的序列在下一階段與D()的查詢序列進(jìn)行比較.最后,后處理階段lb只選擇那些真正符合條件的序列.四、計算機(jī)程序選取一支股票,例如新鋼股份作為參考模板,將其某三十天的收盤價格以向量方式輸入.然后另選取三十支股票作為股票池S,股票池中的每一支股票S作為測試模板i與參考模板進(jìn)行配對,以期待獲得兩條如下圖般相似的股票.將所有股票數(shù)據(jù)進(jìn)行單位化xi-min?(xi-min?(x)Z.= imax(x)-min?(x)例如4用D(歐幾里得距離)【3】進(jìn)行第一次篩選2) 2J( )D=x1-y1+?+(xn-yn)A25用D進(jìn)行第二次篩選lb般票池r >11取那試股孕別輸人藝再隕空W 1 戢擁處這T邀行口“"曾址/k進(jìn)行九皓選二-一一=—丿 輸出R中所有的序列s的D (X,s)i warp i6值輔巴5i和凡卄具體程序見附錄B5實驗我們?nèi)匀贿x取以中成股份(000151)為參考股票,以翼凱股份(002691)作為測試股份.第一步:讀取數(shù)據(jù)X=(7.71,7.73,7.76,7.81,7.85,7.61,7.36,7.43,7.48,7.59,7.46,7.56,7.62,7.66,7.69,7.7,7.73,7.66,7.71,7.77,7.67,7.79,7.91,8.7,9.57,10.53,11.58,12.74,13.1,12.45)Y=(23?23,23?26,23?26,23?29,23?38,23?56,23?22,23?12,23?05,23?06,23,22.95,22.96,22.93,24.12,24.45,23.3,23.27,23.2,23.28,23.14,22.87,23.89,25.4,26.46,27.99,29.4,32.3,32.8,32.4)第二步:標(biāo)準(zhǔn)化X=(0.061,0.064,0.070,0.078,0.085,0.044,0.000,0.012,0.021,0.0400.017,0.035,0.045,0.052,0.057 ,0.059,0.064,0.0520.061,0.071,0.054,0.0750.096,0.233,0.385,0.552,0.735,0.937,1.000,0.887)Y=(0.036,0.03
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)業(yè)生產(chǎn)項目管理與風(fēng)險控制作業(yè)指導(dǎo)書
- 營銷人的選書與讀書
- 2025年延邊貨運從業(yè)資格證考試題庫答案
- 小學(xué)三年級上冊數(shù)學(xué)口算題100題
- 小學(xué)二年級數(shù)學(xué)下學(xué)期口算練習(xí)
- 2025年湖北交通運輸從業(yè)資格證怎樣考試
- 2025年昆明貨運從業(yè)資格考試技巧
- 電力行業(yè)合作協(xié)議(2篇)
- 湘教版數(shù)學(xué)八年級上冊1.2《分式的乘方》聽評課記錄2
- 2024-2025學(xué)年新教材高中歷史第一單元從中華文明起源到秦漢統(tǒng)一多民族封建國家的建立與鞏固單元優(yōu)化提升鏈接學(xué)考含解析新人教版必修中外歷史綱要上
- 部編版語文小學(xué)二年級下冊第一單元集體備課(教材解讀)
- 房屋市政工程生產(chǎn)安全重大事故隱患判定標(biāo)準(zhǔn)(2024版)宣傳畫冊
- 八-十-天-環(huán)-游-地-球(讀書)專題培訓(xùn)課件
- DB11∕T 1653-2019 供暖系統(tǒng)能耗指標(biāo)體系
- 齒輪箱振動信號和故障診斷
- 小學(xué)生急救常識(課件)主題教育班會
- 信息光學(xué)試卷試題及答案
- PC-Ф800×800錘式破碎機(jī)結(jié)構(gòu)設(shè)計
- 雙溪課程評量表完整優(yōu)秀版
- 最新社工服務(wù)部組織架構(gòu)
- 小學(xué)語文中、高級職稱試題及答案.docx
評論
0/150
提交評論