




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)分析與篩選數(shù)據(jù)分析是指用適當(dāng)?shù)慕y(tǒng)計(jì)方法對(duì)收集來的大量第一手資料和第二手資料 進(jìn)行息和形成結(jié)論而對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過程。數(shù)據(jù)也稱觀測(cè)值, 是實(shí)驗(yàn)、測(cè)量、觀察、調(diào)查等的結(jié)果,常以數(shù)量的形式給出。一:分析方法歹0表法:將實(shí)驗(yàn)數(shù)據(jù)按一定規(guī)律用列表方式表達(dá)出來是記錄和處理實(shí)驗(yàn)數(shù)據(jù)最常用 的方法。表格的設(shè)計(jì)要求對(duì)應(yīng)關(guān)系活楚、簡(jiǎn)單明了、有利丁發(fā)現(xiàn)相關(guān)量之間的物 理關(guān)系;此外還要求在標(biāo)題欄中注明物理量名稱、符號(hào)、數(shù)量級(jí)和單位等;根據(jù) 需要還可以列出除原始數(shù)據(jù)以外的計(jì)算欄目和統(tǒng)計(jì)欄目等。最后還要求寫明表格名稱、主要測(cè)量?jī)x器的型號(hào)、量程和準(zhǔn)確度等級(jí)、有關(guān)環(huán)境條件參數(shù)如溫度、濕 度等。作圖法:作圖法
2、可以最醒目地表達(dá)物理量間的變化關(guān)系。從圖線上還可以簡(jiǎn)便求出實(shí) 驗(yàn)需要的某些結(jié)果(如直線的斜率和截距值等),讀出沒有進(jìn)行觀測(cè)的對(duì)應(yīng)點(diǎn)(內(nèi) 插法),或在一定條件下從圖線的延伸部分讀到測(cè)量范圍以外的對(duì)應(yīng)點(diǎn)(外推法)。此外,還可以把某些復(fù)雜的函數(shù)關(guān)系, 通過一定的變換用直線圖表示出來。 例如 半導(dǎo)體熱敏電阻的電阻與溫度關(guān)系為,取對(duì)數(shù)后得到,若用半對(duì)數(shù)坐標(biāo)紙,以lgR 為縱軸,以1/T為橫軸畫圖,則為一條直線。二:數(shù)學(xué)建模中的數(shù)據(jù)分析一2.1.基本概率分布在數(shù)學(xué)建模中對(duì)數(shù)據(jù)進(jìn)行分析時(shí)通常要考慮數(shù)據(jù)的概率分布情況, 這樣可以 更好的了解數(shù)據(jù)總體的分布情況,以及分布是否穩(wěn)定等一些數(shù)據(jù)的相關(guān)特征, 其 中常用
3、的概率分布有:正態(tài)分布N(P,。2):密度函數(shù):p(x)=1 eD22 2乂撰2dt分布函數(shù)為:_1F(x)=.,2二-,2分布,2n):若隨機(jī)變量 Xi,X2,X3,.Xn相互獨(dú)立,都服從標(biāo)準(zhǔn)正態(tài)分布N(0,1),則隨機(jī)變量222Y =丫 Y22 .Y2n是服從自由度n的分布,記Yt(n)。T工、Y/n服從自由度為n的t分布,記為Tt(n)。F 分布 F(n1,n2)若X &),丫 f),且相互獨(dú)立,則隨機(jī)變量X / Y幾 n2服從自由度為(n1,n2)的F分布,記為FF(n1,n2)。在對(duì)隨機(jī)現(xiàn)象的觀察和研究中,人們發(fā)現(xiàn)有許多隨機(jī)變量,它們是由大量的 相互獨(dú)立的隨機(jī)因素的綜合影響而
4、形成的, 而其中每個(gè)因素在總的影響中所起的 作用乂很小,且各因素的作用還是相對(duì)均勻的,則這種隨機(jī)變量往往服從或近似 服從正態(tài)分布。數(shù)據(jù)分析在生活中的運(yùn)用非常廣泛, 最住要的體現(xiàn)是在銷售利益、性能測(cè)試 等的方面。下面是數(shù)學(xué)建模中常用的數(shù)據(jù)分析類型。2.2.異常數(shù)據(jù)的挖掘和處理1 在預(yù)測(cè)與決策時(shí),經(jīng)常需要對(duì)所要研究的對(duì)象進(jìn)行分析和收集數(shù)據(jù),從大量的 統(tǒng)計(jì)數(shù)據(jù)中找規(guī)律,而這些數(shù)據(jù)真實(shí)與否直接影響分析結(jié)論的科學(xué)性。在多數(shù)情況 下會(huì)發(fā)現(xiàn),統(tǒng)計(jì)來的數(shù)據(jù)是按照某一規(guī)律且起伏并不是很大,但其中都可能混有“異辛華常數(shù)據(jù)”,這些異常數(shù)據(jù)是由異常因素 (例異常時(shí)間、干擾或誤差等)造成的與大多 數(shù)觀察值不一致。有些異
5、常值可能是在統(tǒng)計(jì)時(shí)度量或執(zhí)行錯(cuò)誤所得到的,在分析過 程中應(yīng)剔除的,但有些數(shù)據(jù)非任何統(tǒng)計(jì)錯(cuò)誤所致不能簡(jiǎn)單地剔除,否則可能導(dǎo)致重 要的隱藏信息丟失2,特別有些異常數(shù)據(jù)非常有價(jià)值,若剔除則可能影響到結(jié)論的科 學(xué)性。因此,對(duì)于異常數(shù)據(jù)的挖掘及處理 (利用)是值得研究的問題。異常數(shù)據(jù)的挖掘方法所謂數(shù)據(jù)挖掘就是按照既定的目標(biāo),對(duì)大量的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行探索,揭示隱藏 其中的規(guī)律并進(jìn)一步將之模型化的一種先進(jìn)有效的方法。 對(duì)異常數(shù)據(jù)的挖掘我們 認(rèn)為實(shí)際上就是識(shí)別統(tǒng)計(jì)數(shù)據(jù)是否為異常值,挖掘過程實(shí)際上是識(shí)別過程,可以 用以下幾種方法進(jìn)行挖掘:3 (T檢測(cè)法2 一般統(tǒng)計(jì)數(shù)據(jù)若沒有明顯的上升或下降趨勢(shì) (若是時(shí)間序列一般為
6、平穩(wěn)的時(shí) 問序歹0 ),都分布在其均值周圍,標(biāo)準(zhǔn)差CT能反映其離散程度。統(tǒng)計(jì)數(shù)據(jù)可以是 來自某一總體的樣本。如果是一般總體,可以由概率統(tǒng)計(jì)中的切貝謝夫不等式知 道,對(duì)丁任意的0e >,有:2P| X -E(X)|一21特別地有,P| X -E(X) |23。菱2=1即統(tǒng)計(jì)數(shù)據(jù)與其均值的偏差超過(3;2) 93(r比例不超過1/9則由不等式P| X - E(x)R3o=21-巾(3)=0.027,即在正態(tài) 分布下統(tǒng)計(jì)數(shù)據(jù)與平均值的離差大丁 3。的概率僅為0.27%,所以可將那3 b些 有均值之差的絕對(duì)值超過3 b的統(tǒng)計(jì)數(shù)據(jù)視為異常數(shù)據(jù)。根據(jù)概率論中的中心極限定理,因此3 b檢測(cè)法在實(shí)際中比
7、較常用。當(dāng)然它的局限性是只適用丁單維異常數(shù) 據(jù)的挖掘。2.3利用聚類分析法對(duì)數(shù)據(jù)處理聚類分析乂稱群分析,是研究分類問題的一種多元統(tǒng)計(jì)方法。 在聚類分析的 過程中,將樣品或變量按相互之間距離的大小或由相似系數(shù)反映出的相近性聚成 若干類,常用的距離有歐氏距離、馬氏距離、蘭氏距離等,馬氏距離可以排除指 標(biāo)之間相關(guān)性的干擾且不受量綱的影響,最為實(shí)用。根據(jù)聚類的結(jié)果,距離較小 或相似系數(shù)大的可以聚為一類,但最終聚成幾類,并沒有嚴(yán)格的限制。如果存在 幾個(gè)樣品,聚合成哪一類都不合適,或與其它樣品的距離都比較遠(yuǎn),那么就可斷 定這些樣品數(shù)據(jù)為異常數(shù)據(jù)。1、數(shù)據(jù)在聚類分析之前要進(jìn)行數(shù)據(jù)的變換,常用的方法有a中心化
8、變換:x* =Xn -x(i =1,2,3,.m)變換后的數(shù)據(jù)均值為0,而協(xié)方差不變。B.標(biāo)準(zhǔn)變換:xij - xjx* =(i =1,2,.n; j =1,2,.m)其中§是標(biāo)準(zhǔn)差;變換后的數(shù)據(jù)每個(gè)變量的樣本均值為0,而且標(biāo)準(zhǔn)變換后的數(shù)據(jù)與變量的量綱無(wú)關(guān);2、由聚類分析法的基本思想,即可得出 數(shù)據(jù)變換:常用的數(shù)據(jù)變換方法在上面已經(jīng)詳細(xì)舉出。數(shù)據(jù)變換的目的時(shí) 為了便于計(jì)算和比較,或改變數(shù)據(jù)的結(jié)構(gòu); 計(jì)算n各樣品兩兩間的距離,得到樣品間的距離(常用歐式距離)矩陣D(0); 初始(第一步:i = 1 ) n個(gè)樣品各自構(gòu)成一類,類的個(gè)數(shù)k=n,第i類 G =沖)。=1,2,.n),此時(shí)類的
9、間距就是樣品距離,然后對(duì)樣品 X(i)(i =1,2,.,n)執(zhí) 行并類過程和; 對(duì)步驟3得到的距離矩陣DiJL,合并類間距離最小的兩類為一新類,此時(shí)類 的總個(gè)數(shù)k減少一類,即k=n-i+1; 計(jì)算新類與其他類的距離,得到新的距離矩陣,若合并后的總個(gè)數(shù)k仍然大 于1,重復(fù)以上的過程, 畫譜系聚類圖; 覺定分類個(gè)數(shù)及各類的成員。2.4.典型例子市場(chǎng)占有率問題一個(gè)企業(yè)的銷售量(或銷售額)在市場(chǎng)同類產(chǎn)品中所占的比重。直接反映企 業(yè)所提供的商品和勞務(wù)對(duì)消費(fèi)者和用戶的滿足程度,表明企業(yè)的商品在市場(chǎng)上所 處的地位。市場(chǎng)份額越高,表明企業(yè)經(jīng)營(yíng)、競(jìng)爭(zhēng)能力越強(qiáng)。市場(chǎng)份額根據(jù)不同市 場(chǎng)范圍有4種測(cè)算方法:(1)
10、.總體市場(chǎng)份額。指一個(gè)企業(yè)的銷售量(額)在整個(gè)行業(yè)中所占的比重。(2) .1標(biāo)市場(chǎng)份額。指一個(gè)企業(yè)的銷售量(額)在其目標(biāo)市場(chǎng),即它所服務(wù)的市場(chǎng)中所占的比重。一個(gè)企業(yè)的目標(biāo)市場(chǎng)的范圍小丁或等丁整個(gè)行業(yè)的服務(wù)市 場(chǎng),因而它的目標(biāo)市場(chǎng)份額總是大丁它在總體市場(chǎng)中的份額。(3) .相對(duì)丁 3個(gè)最大競(jìng)爭(zhēng)者的市場(chǎng)份額。指一個(gè)企業(yè)的銷售量和市場(chǎng)上最大的3個(gè)競(jìng)爭(zhēng)者的銷售總量之比。如:一個(gè)企業(yè)的市場(chǎng)份額是30%,而它的3個(gè)最大競(jìng)爭(zhēng)者的市場(chǎng)份額分別為 20%, 10%, 10%,則該企業(yè)的相對(duì)市場(chǎng)份額就 是30% 士 40%= 75%,如4個(gè)企業(yè)各占25%,則該企業(yè)的相對(duì)市場(chǎng)份額為33%。 一般地,一個(gè)企業(yè)擁有 3
11、3%以上的相對(duì)市場(chǎng)份額,就表明它在這一市場(chǎng)中有一 定實(shí)力。4. 相對(duì)丁最大競(jìng)爭(zhēng)者的市場(chǎng)份額。指一個(gè)企業(yè)的銷售量與市場(chǎng)上最大競(jìng)爭(zhēng)者 的銷售量之比。若高丁 100%,表明該企業(yè)是這一市場(chǎng)的領(lǐng)袖。二、數(shù)據(jù)篩選數(shù)據(jù)的篩選在數(shù)學(xué)建模中占有很重要的地位,它是數(shù)學(xué)建模的第一步,我們只有得到好的數(shù)據(jù)才能保證得出的結(jié)果的真實(shí)性與準(zhǔn)確性。而在實(shí)際的問題中我 們遇到的數(shù)據(jù)量往往是巨大的。為了保證我們所用的方法能夠在原始數(shù)據(jù)的支持 下得以實(shí)現(xiàn),我們必須要對(duì)數(shù)據(jù)進(jìn)行篩選,使得解決方法簡(jiǎn)單化。但是我們乂要 保證篩選出來的數(shù)據(jù)具有代表性,使得到的結(jié)果更加準(zhǔn)確與真實(shí)。數(shù)據(jù)篩選有很多種不同的方法3.1:隨機(jī)抽樣從一個(gè)總體的樣本
12、X中隨機(jī)抽取出n個(gè)個(gè)體,這樣稱對(duì)總體 X進(jìn)行隨機(jī)抽 樣,其中n叫做樣本容量,這n個(gè)個(gè)體構(gòu)成了樣本。在隨機(jī)抽樣過程中滿足隨機(jī) 性和獨(dú)立性兩個(gè)特征,即對(duì)丁每一次的抽樣在總體中的每一個(gè)個(gè)體被抽到的概率 都相同,每次抽取的結(jié)果不會(huì)影響到下一次的抽取。這樣的隨機(jī)抽樣適用丁對(duì)總體的概率分析等統(tǒng)計(jì)方面的應(yīng)用,比如可以分析數(shù)據(jù)中的最大值、均值、眾數(shù)等數(shù)據(jù)特征不能夠?qū)?shù)據(jù)的3.2利用粗差法篩選數(shù)據(jù)1基本假設(shè)利用粗差法篩選數(shù)據(jù)的方法是一種基丁數(shù)理統(tǒng)計(jì)理論得出的一種篩選數(shù)據(jù) 的方法,其主要的運(yùn)用體現(xiàn)在礦井通風(fēng)阻力測(cè)定數(shù)據(jù)前處理的運(yùn)用中,以及其他相類似的數(shù)據(jù)處理。以下我們就以礦井的通風(fēng)阻力為例介紹粗差篩選數(shù)據(jù)的方 法
13、。在進(jìn)行通風(fēng)阻力測(cè)量時(shí),要求選擇合理的測(cè)量路線,在每條測(cè)量路線上選擇 合理的測(cè)量點(diǎn),每個(gè)測(cè)量點(diǎn)至少要求5個(gè)數(shù)據(jù)。在測(cè)量期間,如果巷道通風(fēng)狀況 等條件保持穩(wěn)定,則某點(diǎn)的數(shù)據(jù)樣本符合正態(tài)分布,且其平均值近似為真值。某測(cè)點(diǎn)測(cè)量數(shù)據(jù)的樣本x=(x1,x2,x3.xn),n>5,的方差為1 ns? =Z (x -x/(1)n -1 i 旦設(shè)允許的測(cè)量誤差為a(0<a<1,一股取0.05或0.1),那樣本均值近似代替真值, 則樣本值的最大允許范圍為:(1 a)x < x1 苴(1 +a)x, i =1,2,.n(2)柞本x的最大可能方差為: 2一21 一廣一、-、n(ax)s -Z
14、 (x(1±a)x)-n 1n 1測(cè)重?cái)?shù)據(jù)之間的兩兩誤差A(yù)* - x -毛,i, j T,2.n ,(3)則誤差矩陣可以表達(dá)為0Ax1,2Ax1,3.x1,nx2,10皈2,3.x2,nx=&3,1偵,20.Sn(4).|_Axn,1Axn,2 0 -矩陣Ax的無(wú)窮范數(shù)為:fmax =|Ax|=maxi5£ |山如 |(5)2分析方法某點(diǎn)的測(cè)量數(shù)據(jù)不存在粗差,則在給定的測(cè)量誤差范圍內(nèi)有: 22S : S max則認(rèn)為存在粗差。如果某此測(cè)量數(shù)據(jù)Xi粗差中偏移最大的值,則在公式(4)所表示的誤差矩陣中,當(dāng)i=k時(shí),Z |Ax,j|取最大值,也可以表示為公式(5),即取誤
15、差矩陣Ax j 4的無(wú)窮范數(shù)時(shí)的測(cè)量誤差Xj-k為偏差最大的數(shù)據(jù),亦稱最大粗差。如果某次測(cè)量數(shù)據(jù)較多,在保證計(jì)算可靠性的基礎(chǔ)上,為了減少計(jì)算量或統(tǒng) 一規(guī)范,也可以采用該方法進(jìn)行有效篩選。經(jīng)過逐次篩選,將測(cè)量數(shù)據(jù)按偏移量從小到大按順序依次排序,直到S2<S2max為止,這樣就可以得到測(cè)量數(shù)據(jù)的正常取值范圍。 同時(shí),為了保證測(cè)量 的可靠性,一般要求具有代表性的數(shù)據(jù)至少有 3個(gè)。以上就是利用粗差來曬選數(shù)據(jù)的基本步驟,在篩選數(shù)據(jù)時(shí)的重要依據(jù)就是樣 本數(shù)據(jù)與無(wú)窮范數(shù)的差值,而無(wú)窮范數(shù)是通過誤差矩陣經(jīng)過公式( 5)得到的。 通過這樣的方法就可以將數(shù)據(jù)篩選。3.3利用自組織方法進(jìn)行數(shù)據(jù)篩選自組織理論是
16、基丁神經(jīng)網(wǎng)絡(luò)和計(jì)算機(jī)科學(xué)的迅速發(fā)展而產(chǎn)生和發(fā)展起來的。 它將黑箱思想、生物神經(jīng)元方法、歸納法、概率論、數(shù)理邏輯等方法有機(jī)地組合 起來。其主要思想是通過簡(jiǎn)單的初始輸入 (局部變量)的交義組合產(chǎn)生第一代中 問候選模型,再?gòu)牡谝淮袉柡蜻x模型中選出最優(yōu)的若干項(xiàng)組合而產(chǎn)生第二代中 問候選模型,重復(fù)這樣一個(gè)產(chǎn)生、選擇和遺傳進(jìn)化過程,使模型復(fù)雜度不斷增加, 直到選出最優(yōu)復(fù)雜度模型為止。本文利用自組織方法進(jìn)行數(shù)據(jù)篩選和建立稅收預(yù) 測(cè)模型,并在數(shù)據(jù)篩選基礎(chǔ)上建立線性回歸預(yù)測(cè)模型和BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,然后結(jié)合時(shí)間序列的預(yù)測(cè)模型,利用自組織方法建立組合預(yù)測(cè)模型。 通過預(yù)測(cè)結(jié) 果比較得出了組合預(yù)測(cè)模型比其它單個(gè)模
17、型具有更高的預(yù)測(cè)精度。其重要的應(yīng)用體現(xiàn)在對(duì)稅收收入的的預(yù)測(cè)問題上。稅收收入預(yù)測(cè)可以使用統(tǒng)計(jì)技術(shù),其使用的模型一般分為時(shí)間序列模型和回 歸模型。時(shí)間序列模型的缺點(diǎn)在丁不能充分利用與稅收收入密切相關(guān)的經(jīng)濟(jì)因 素,導(dǎo)致預(yù)測(cè)的數(shù)據(jù)不準(zhǔn)確和不穩(wěn)定。 回歸模型雖然考慮了經(jīng)濟(jì)因素,但需要事 先知道其它經(jīng)濟(jì)因素與稅收收入問的函數(shù)關(guān)系, 而且為了獲得比較精確的預(yù)測(cè)結(jié) 果,需要大量的計(jì)算。許多實(shí)驗(yàn)表明 BP神經(jīng)網(wǎng)絡(luò)用丁稅收等經(jīng)濟(jì)指標(biāo)的預(yù)測(cè)也 是一種適合的方法。神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)在丁它具有模擬多變量而不需要對(duì)輸入變量 做復(fù)雜的相關(guān)假定的能力,只要利用以往的歷史數(shù)據(jù),就可以從訓(xùn)練過程中通過 學(xué)習(xí)來抽取和逼近隱含的輸入/輸
18、出非線性關(guān)系。但BP神經(jīng)網(wǎng)絡(luò)也有缺點(diǎn),特別 是在復(fù)雜系統(tǒng)建模時(shí)輸入變量確定主觀化等缺陷。為結(jié)合回歸模型、時(shí)間序列模 型和神經(jīng)網(wǎng)絡(luò)模型的優(yōu)點(diǎn),有人利用自組織方法將多種模型的預(yù)測(cè)結(jié)果進(jìn)行組 合,實(shí)現(xiàn)自組織方法的組合預(yù)測(cè)模型。 所謂組合預(yù)測(cè),就是將不同的預(yù)測(cè)方法進(jìn) 行適當(dāng)?shù)慕M合,綜合利用各種方法所提供的有用信息, 從而盡可能地提高預(yù)測(cè)精 度。為提高預(yù)測(cè)的精度,自組織理論在復(fù)雜系統(tǒng)的模擬、預(yù)測(cè)、模式識(shí)別、樣本 聚類等諸方面都有成功的應(yīng)用利用自組織方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理利用自組織方法,將稅收收入作為因變量,其余變量作為自變量,通過自組 織GMDH方法的實(shí)現(xiàn)工具KnowledgeMiner 5.0建立模型得
19、到稅收與相關(guān)變量的型的方程為:Y=-190.456894-0.033271X7+0105339X2+0.736523X9 其中,決 定系數(shù)R2=0.9934,預(yù)測(cè)誤差平方和:0.0079,平均絕對(duì)白分比誤差:4.53%,近似誤差: 0.0066。從模型的擬合效果看,除1985年左右的擬合稅收數(shù)據(jù)與實(shí)際稅收相差超過 5%之外,其余年份的數(shù)據(jù)擬合誤差大多小于 5%,說明回歸模型建立成功。根據(jù)該方程可知,該組變量中最能反映稅收變化的變量有財(cái)政支出總量、 城 鄉(xiāng)儲(chǔ)蓄存款年末余額、社會(huì)消費(fèi)品零售總額。自組織方法挖掘結(jié)果表明,由于相 關(guān)性等原因,盡管稅收收入與很多經(jīng)濟(jì)指標(biāo)相關(guān)聯(lián),如與 GDP之間就有非常密
20、 切的關(guān)系,但從擬合和預(yù)測(cè)的角度講,并不是經(jīng)濟(jì)指標(biāo)越多越好,也不一定是有 密切關(guān)聯(lián)的就一定選用,而應(yīng)該選擇最恰當(dāng)?shù)慕M合。4.組合預(yù)測(cè)模型的建立(1) 利用以上變量建立四個(gè)單項(xiàng)模型。 自組織方法建立模型Y1:Y1=-190.456894-0.033271X7+0.105339X2+0.736523X9 多元線性回歸模型 Y2:利用最小二乘法,根據(jù)實(shí)際稅收觀測(cè)值與回歸估計(jì)值的偏差平方和最小為原則,通過SPSS軟件計(jì)算得多元線性回歸方程:Y2=-432.738+0.158X2-0.077X7+0.7652X9通過擬合檢驗(yàn),除1985年左右的擬合稅收數(shù)據(jù)與實(shí)際稅收數(shù)據(jù)相差超過5%以外,其余年份的數(shù)據(jù)擬
21、合誤差大多小于3%,說明時(shí)間序歹U模型建立成功。 時(shí)間序列模型Y3:時(shí)間序列模型基本思想是將預(yù)測(cè)對(duì)象隨時(shí)間推移而形成的數(shù)據(jù)序列視為一個(gè)隨機(jī)序列,即除去個(gè)別的因偶然原因引起的觀測(cè)值外,認(rèn)為時(shí)間序歹0是一組依賴于時(shí)間的隨機(jī)變量。這組隨機(jī)變量所具有的依存關(guān)系或自相關(guān)性表征了預(yù)測(cè)對(duì)象發(fā)展的延續(xù)性,而這種自相關(guān)性一旦被相應(yīng)的數(shù)學(xué)模型描 述出來就可以從時(shí)間序列的過去值及現(xiàn)在值來預(yù)測(cè)其未來值。時(shí)間序列模型一般有:自回歸(AR)模型、自回歸滑動(dòng)平均)模型等。這里使用AR模型,時(shí)滯因子為1,通過KnowledgeMiner建立時(shí)間序歹U模型:Y3 (t) =-58.077019+1.182588Y3 (t-1)
22、,其中 t=2, 3, , 21, Y3 (1) =629.89 通過擬合檢驗(yàn)除1985年左右的擬合稅收數(shù)據(jù)與實(shí)際稅收數(shù)據(jù)相差超過5%之外,其余年份的數(shù)據(jù)擬合誤差大多小于3%,說明時(shí)間序歹U模型建立成功。(2) 自組織方法組合預(yù)測(cè)模型。組合預(yù)測(cè)理論“組合預(yù)測(cè)”思想是由J.M.Bates和C.W.J Granger 196W首次提出,其研究成果引起了預(yù)測(cè)學(xué)界的高度 重視,其應(yīng)用范圍也逐漸擴(kuò)大。組合預(yù)測(cè)理論的基本原理是:通過個(gè)體預(yù)測(cè)值的 加權(quán)算術(shù)平均而得到其組合預(yù)測(cè)值,在確定加權(quán)權(quán)重(也稱組合權(quán)重)時(shí),以組 合預(yù)測(cè)誤差方差最小為原則。其本質(zhì)就是將各種單項(xiàng)預(yù)測(cè)看作代表不同信息的片 段,通過信息的集成分散單個(gè)預(yù)測(cè)特有的不確定性和減少總體的不確定性,從而提高預(yù)測(cè)精度。組合預(yù)測(cè)模型為:Y= (fY1 , Y2 , Y3, Y4),利用以上四種
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- T-ZRCMA 001-2024 城市軌道交通智慧實(shí)訓(xùn)系統(tǒng)技術(shù)規(guī)范
- 二零二五年度餐飲店面租賃合同含節(jié)假日促銷活動(dòng)
- 二零二五年度個(gè)人擔(dān)保合同-個(gè)人理財(cái)產(chǎn)品擔(dān)保服務(wù)條款
- 二零二五年度農(nóng)村墓地選購(gòu)與祭祀活動(dòng)組織合同
- 二零二五年度茶飲品牌全國(guó)使用許可合同
- 二零二五年度互聯(lián)網(wǎng)保險(xiǎn)產(chǎn)品銷售委托理財(cái)服務(wù)協(xié)議
- 二零二五年度棋牌室合作伙伴關(guān)系管理與維護(hù)合同
- 2025年度順豐員工勞動(dòng)合同爭(zhēng)議解決機(jī)制合同
- 二零二五年度個(gè)人合同范本:智能家居控制系統(tǒng)研發(fā)合作合同
- 二零二五年度新型工業(yè)園區(qū)委托中介代理出租服務(wù)協(xié)議
- 車站信號(hào)自動(dòng)控制課件:進(jìn)站信號(hào)機(jī)點(diǎn)燈電路
- 民用無(wú)人機(jī)操控員執(zhí)照(CAAC)考試復(fù)習(xí)重點(diǎn)題庫(kù)500題(含答案)
- GB/T 6553-2024嚴(yán)酷環(huán)境條件下使用的電氣絕緣材料評(píng)定耐電痕化和蝕損的試驗(yàn)方法
- 瀝青基材料在石油化工設(shè)備熱絕緣中的開發(fā)
- 中職旅游專業(yè)《中國(guó)旅游地理》說課稿
- 煤層底板采動(dòng)破裂深度壓水
- 第15課 列強(qiáng)入侵與中國(guó)人民的反抗斗爭(zhēng)【課件】-中職高一上學(xué)期高教版
- 新人教小學(xué)數(shù)學(xué)六年級(jí)下冊(cè)《成數(shù)》示范課教學(xué)課件
- CAR-T細(xì)胞療法行業(yè)營(yíng)銷策略方案
- 中國(guó)海關(guān)科學(xué)技術(shù)研究中心招聘筆試真題2022
- 四年級(jí)美術(shù)測(cè)國(guó)測(cè)復(fù)習(xí)題答案
評(píng)論
0/150
提交評(píng)論