版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、一、多元回歸1、方法概述:在研究變量之間的相互影響關(guān)系模型時(shí)候,用到這類方法,具體地說(shuō):其可以定量地描述某一現(xiàn)象和某些因素之間的函數(shù)關(guān)系,將各變量的已知值帶入回歸方程可以求出因變量的估計(jì)值,從而可以進(jìn)行預(yù)測(cè)等相關(guān)研究。2、分類分為兩類:多元線性回歸和非線性線性回歸;其中非線性回歸可以通過(guò)一定的變化轉(zhuǎn)化為線性回歸,比如:y=lnx可以轉(zhuǎn)化為y=uu=lnx來(lái)解決;所以這里主要說(shuō)明多元線性回歸應(yīng)該注意的問(wèn)題。3、注意事項(xiàng)在做回歸的時(shí)候,一定要注意兩件事:(1)回歸方程的顯著性檢驗(yàn)(可以通過(guò)sas和spss來(lái)解決)(2)回歸系數(shù)的顯著性檢驗(yàn)(可以通過(guò)sas和spss來(lái)解決)檢驗(yàn)是很多學(xué)生在建模中不注
2、意的地方,好的檢驗(yàn)結(jié)果可以體現(xiàn)出你模型的優(yōu)劣,是完整論文的體現(xiàn),所以這點(diǎn)大家一定要注意。4、使用步驟:(1)根據(jù)已知條件的數(shù)據(jù),通過(guò)預(yù)處理得出圖像的大致趨勢(shì)或者數(shù)據(jù)之間的大致關(guān)系;(2)選取適當(dāng)?shù)幕貧w方程;(3)擬合回歸參數(shù);(4) 回歸方程顯著性檢驗(yàn)及回歸系數(shù)顯著性檢驗(yàn)(5) 進(jìn)行后繼研究(如:預(yù)測(cè)等)這種模型的的特點(diǎn)是直觀,容易理解。這體現(xiàn)在:動(dòng)態(tài)聚類圖可以很直觀地體現(xiàn)出來(lái)!當(dāng)然,這只是直觀的一個(gè)方面!二、聚類分析聚類有兩種類型:(1) Q型聚類:即對(duì)樣本聚類;(2)R型聚類:即對(duì)變量聚類;聚類方法:(1)最短距離法(2)最長(zhǎng)距離法(3)中間距離法(4)重心法(5)類平均法(6)可變類平均
3、法(7)可變法(8)利差平均和法在具體做題中,適當(dāng)選取方法;3、注意事項(xiàng)在樣本量比較大時(shí),要得到聚類結(jié)果就顯得不是很容易,這時(shí)需要根據(jù)背景知識(shí)和相關(guān)的其他方法輔助處理。還需要注意的是:如果總體樣本的顯著性差異不是特別大的時(shí)候,使用的時(shí)候也要注意!4、 方法步驟(1)首先把每個(gè)樣本自成一類;(2)選取適當(dāng)?shù)暮饬繕?biāo)準(zhǔn),得到衡量矩陣,比如說(shuō):距離矩陣或相似性矩陣,找到矩陣中最小的元素,將該元素對(duì)應(yīng)的兩個(gè)類歸為一類,(4)重復(fù)第2步,直到只剩下一個(gè)類;補(bǔ)充:聚類分析是一種無(wú)監(jiān)督的分類,下面將介紹有監(jiān)督的“分類”。我簡(jiǎn)單說(shuō)明下,無(wú)監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)是什么無(wú)監(jiān)督學(xué)習(xí):發(fā)現(xiàn)的知識(shí)是未知的而有監(jiān)督學(xué)習(xí):發(fā)現(xiàn)
4、的知識(shí)是已知的或者這么說(shuō)吧:有監(jiān)督學(xué)習(xí)是對(duì)一個(gè)已知模型做優(yōu)化,而無(wú)監(jiān)督學(xué)習(xí)是從數(shù)據(jù)中挖掘模型他們?cè)诜诸愔袘?yīng)用比較廣泛(非數(shù)值分類)如果是數(shù)值分類就是預(yù)測(cè)了,這點(diǎn)要注意三、數(shù)據(jù)分類1、方法概述數(shù)據(jù)分類是一種典型的有監(jiān)督的機(jī)器學(xué)習(xí)方法,其目的是從一組已知類別的數(shù)據(jù)中發(fā)現(xiàn)分類模型,以預(yù)測(cè)新數(shù)據(jù)的未知類別。這里需要說(shuō)明的是:預(yù)測(cè)和分類是有區(qū)別的,預(yù)測(cè)是對(duì)數(shù)據(jù)的預(yù)測(cè),而分類是類別的預(yù)測(cè)。2、 類別方法:(1)神經(jīng)網(wǎng)路(2)決策樹(shù)(這里不再闡述,有興趣的同學(xué),可以參考數(shù)據(jù)挖掘和數(shù)據(jù)倉(cāng)庫(kù)相關(guān)書(shū)籍)3、注意事項(xiàng)1神經(jīng)網(wǎng)路適用于下列情況的分類:(1)數(shù)據(jù)量比較小,缺少足夠的樣本建立數(shù)學(xué)模型;(2)數(shù)據(jù)的結(jié)構(gòu)難以
5、用傳統(tǒng)的統(tǒng)計(jì)方法來(lái)描述(3)分類模型難以表示為傳統(tǒng)的統(tǒng)計(jì)模型這里主要介紹以上三點(diǎn),其他的情況大家可以自己總結(jié)!2神經(jīng)網(wǎng)路的優(yōu)點(diǎn):分類準(zhǔn)確度高,并行分布處理能力強(qiáng),對(duì)噪聲數(shù)據(jù)有較強(qiáng)的魯棒性和容錯(cuò)能力能夠充分逼近復(fù)雜的非線性關(guān)系,具備聯(lián)想記憶的功能等。3神經(jīng)網(wǎng)路缺點(diǎn):需要大量的參數(shù),不能觀察中間學(xué)習(xí)過(guò)程,輸出結(jié)果較難解釋,會(huì)影響到結(jié)果的可信度,需要較長(zhǎng)的學(xué)習(xí)時(shí)間,當(dāng)數(shù)據(jù)量較大的時(shí)候,學(xué)習(xí)速度會(huì)制約其應(yīng)用。4、步驟這里只做簡(jiǎn)略說(shuō)明,具體步驟,大家可以查閱神經(jīng)網(wǎng)路數(shù)據(jù)挖掘等相關(guān)書(shū)籍(1)初始化全系數(shù)(2)輸入訓(xùn)練樣本(3)計(jì)算實(shí)際輸出值(4)計(jì)算實(shí)際輸出值和期望輸出值之間的誤差(5)用誤差去修改權(quán)系數(shù)
6、(6)判斷是否滿足終止條件,如果滿足終止,否則進(jìn)入第二步.四、判別分析1、 概述其是基于已知類別的訓(xùn)練樣本,對(duì)未知類別的樣本判別的一種統(tǒng)計(jì)方法,也是一種有監(jiān)督的學(xué)習(xí)方法,是分類的一個(gè)子方法!具體是:在研究已經(jīng)過(guò)分類的樣本基礎(chǔ)上,根據(jù)某些判別分析方法建立判別式,然后對(duì)未知分類的樣本進(jìn)行分類!2、分類根據(jù)判別分析方法的不同,可分為下面幾類:(1)距離判別法(2)Fisher判別法(3)Bayes判別法(4)逐步判別法關(guān)于這幾類的方法的介紹,大家可以參考多元統(tǒng)計(jì)學(xué),其中比較常用的是bayes判別法和逐步判別法3、注意事項(xiàng):判別分析主要針對(duì)的是有監(jiān)督學(xué)習(xí)的分類問(wèn)題。共有四種方法,這里重點(diǎn)注意其優(yōu)缺點(diǎn):
7、(1)距離判別方法簡(jiǎn)單容易理解,但是它將總體等概率看待,沒(méi)有差異性;(2)Bayes判別法有效地解決了距離判別法的不足,即:其考慮了先驗(yàn)概率所以通常這種方法在實(shí)際中應(yīng)用比較多?。?)在進(jìn)行判別分析之前,應(yīng)首先檢驗(yàn)各類均值是不是有差異(因?yàn)榕袆e分析要求給定的樣本數(shù)據(jù)必須有明顯的差異),如果檢驗(yàn)后某兩個(gè)總體的差異不明顯,應(yīng)將這兩個(gè)總體合為一個(gè)總體,再由剩下的互不相同的總體重現(xiàn)建立判別分析函數(shù)。(4)這里說(shuō)明下Fisher判別法和bayes判別法的使用要求:兩者對(duì)總體的數(shù)據(jù)的分布要求不同,具體的,F(xiàn)isher要求對(duì)數(shù)據(jù)分布沒(méi)有特殊要求,而bayes則要求數(shù)據(jù)分布是多元正態(tài)分布,但實(shí)際中卻沒(méi)有這么嚴(yán)格
8、?。?)這種方法可以利用spss,sas等軟件來(lái)輕松實(shí)現(xiàn)4、方法步驟這里以bayes判別法為例簡(jiǎn)要講述,具體的方法和軟件實(shí)現(xiàn),可以去數(shù)學(xué)中國(guó)網(wǎng)站下載或者參考多元統(tǒng)計(jì)學(xué)(1) 計(jì)算各類中變量的均值xj及均值向量xh,各變量的總均值xi及均值向量x(2)計(jì)算類內(nèi)協(xié)方差及其逆矩陣(3)計(jì)算bayes判別函數(shù)中,各個(gè)變量的系數(shù)及常數(shù)項(xiàng)并寫出判別函數(shù)(4)計(jì)算類內(nèi)協(xié)方差矩陣及各總協(xié)方差矩陣做多個(gè)變量的全體判別效果的檢驗(yàn)(5)做各個(gè)變量的判別能力檢驗(yàn)(6)判別樣本應(yīng)屬于的類別1.5主成分分析1、 概述主成分分析是一種降維數(shù)的數(shù)學(xué)方法,具體就是,通過(guò)降維技術(shù)獎(jiǎng)多個(gè)變量化為少數(shù)幾個(gè)主成分的統(tǒng)計(jì)分析方法。在建模
9、中,主要用于降維,系統(tǒng)評(píng)估,回歸分析,加權(quán)分析等等。2、 分類(無(wú))3、注意事項(xiàng)在應(yīng)用主成分分析時(shí)候,應(yīng)該注意:(1)綜合指標(biāo)彼此獨(dú)立或者不相互干涉(2)每個(gè)綜合指標(biāo)所反映的各個(gè)樣本的總信息量等于對(duì)應(yīng)特征向量的特征值。通常要選取的綜合指標(biāo)的特征值貢獻(xiàn)率之和應(yīng)為80%以上(3)其在應(yīng)用上側(cè)重于信息貢獻(xiàn)影響力的綜合評(píng)價(jià)(4)當(dāng)主成分因子負(fù)荷的符號(hào)有正也有負(fù)的時(shí)候,綜合評(píng)價(jià)的函數(shù)意義就不明確!4、方法步驟大家可以參考多元統(tǒng)計(jì)學(xué)這本書(shū)籍,在這里就不做闡述,也可以從數(shù)學(xué)中國(guó)網(wǎng)站的統(tǒng)計(jì)學(xué)板塊下載!六、因子分析1、概述其是也是將變量總和為數(shù)量較少的幾個(gè)因子,是降維的一種數(shù)學(xué)技術(shù)!它和主成分分析的最大區(qū)別是:
10、其是一種探索性分析方法,即:通過(guò)用最少個(gè)數(shù)的幾個(gè)不可觀察的變量來(lái)說(shuō)明出現(xiàn)在可觀察變量中的相關(guān)模型(有點(diǎn)類似于前面講述的分類和聚類的區(qū)別,大家好好體會(huì)下)它提供了一種有效的利用數(shù)學(xué)模型來(lái)解釋事物之間的關(guān)系,體現(xiàn)出數(shù)據(jù)挖掘的一點(diǎn)精神!2、 分類因子分析是R型,即對(duì)變量研究3、注意事項(xiàng)(1)其不是對(duì)研究總體的變量的降維,而是根據(jù)原始變量信息構(gòu)造新的變量,作為共同因子,這點(diǎn)區(qū)別于主成分分析(2)它通過(guò)旋轉(zhuǎn)可以使得因子變量具有可解釋性(這塊可能不容易理解,大家可以去找因子分析的相關(guān)書(shū)籍查閱,搞清楚這塊,對(duì)于你解釋模型會(huì)起到很大的作用)(3)這里說(shuō)明下,因子分析和主成分分析的區(qū)別和聯(lián)系兩者都是降維數(shù)學(xué)技術(shù)
11、,前者是后者的推廣和發(fā)展主成分分析只是一般的變量替換,其始終是基于原始變量研究數(shù)據(jù)的模型規(guī)律;而因子分析則是通過(guò)挖掘出新的少數(shù)變量,來(lái)研究的一種方法,有點(diǎn)像數(shù)據(jù)挖掘中的未知關(guān)聯(lián)關(guān)則發(fā)現(xiàn)!4、方法步驟(略)大家可以去論壇上下載相關(guān)電子資源,也可以參考多元統(tǒng)計(jì)學(xué)七、殘差分析1、概述在實(shí)際問(wèn)題中,由于觀察人員的粗心或偶然因素的干擾。常會(huì)使我們所得到的數(shù)據(jù)不完全可靠,即出現(xiàn)異常數(shù)據(jù)。有時(shí)即使通過(guò)相關(guān)系數(shù)或F檢驗(yàn)證實(shí)回歸方程可靠,也不能排除數(shù)據(jù)存在上述問(wèn)題。殘差分析的目的就在于解決這一問(wèn)題。所謂殘差是指實(shí)際觀察值與回歸估計(jì)值的差。2、分類無(wú)3、應(yīng)用(1)通過(guò)殘差分析來(lái)排除異常數(shù)據(jù)(2)通過(guò)殘差分析來(lái)檢驗(yàn)
12、模型的可靠性還有很多應(yīng)用,大家在使用過(guò)程中據(jù)情況選取,靈活應(yīng)用!八、典型相關(guān)分析1、概述前面介紹的方法主要是一個(gè)變量和多個(gè)變量之間的關(guān)系,而典型相關(guān)分析研究的是多個(gè)變量和多個(gè)變量之間的關(guān)系,或者是一組變量和一組變量之間關(guān)系!其可以揭示兩組變量之間的關(guān)系,從而供大家研究?jī)蓚€(gè)現(xiàn)象之間的關(guān)系。例如:蔬菜的產(chǎn)出水平和影響產(chǎn)出水平的變量之間的關(guān)系!2、分類多對(duì)多的變量關(guān)系研究!3、注意事項(xiàng)(1)其可以很好地解決組合相關(guān)性的問(wèn)題(2)其還局限于兩組變量的研究,而且要求這兩組變量都是連續(xù)變量且需服從多元正態(tài)分布九、時(shí)間序列1、概述時(shí)間序列預(yù)測(cè)法是一種定量分析方法,它是在時(shí)間序列變量分析的基礎(chǔ)上,運(yùn)用一定的數(shù)
13、學(xué)方法建立預(yù)測(cè)模型,使時(shí)間趨勢(shì)向外延伸,從而預(yù)測(cè)未來(lái)市場(chǎng)的發(fā)展變化趨勢(shì),確定變量預(yù)測(cè)值。其基本特點(diǎn)是:假定事物的過(guò)去趨勢(shì)會(huì)延伸到未來(lái);預(yù)測(cè)所依據(jù)的數(shù)據(jù)具有不規(guī)則性;撇開(kāi)市場(chǎng)發(fā)展之間的因果關(guān)系。2、分類時(shí)間序列的變動(dòng)形態(tài)一般分為四種:長(zhǎng)期趨勢(shì)變動(dòng),季節(jié)變動(dòng),循環(huán)變動(dòng),不規(guī)則變動(dòng)。方法分類:(1) 平均數(shù)預(yù)測(cè)(簡(jiǎn)單算術(shù)平均法,加權(quán)算術(shù)平均法,幾何平均數(shù)法)(2)移動(dòng)平均數(shù)預(yù)測(cè)(一次移動(dòng)平均法,二次移動(dòng)平均法)(3)指數(shù)平滑法預(yù)測(cè)(一次,二次,三次指數(shù)平滑法)(4)趨勢(shì)法預(yù)測(cè)(分割平均法,最小二乘法,三點(diǎn)法)(5)季節(jié)變動(dòng)法(簡(jiǎn)單平均法,季節(jié)比例法)3注意事項(xiàng)(1)季節(jié)變動(dòng)法預(yù)測(cè)需要籌集至少三年以上的資料(2)移動(dòng)平均法在短期預(yù)測(cè)中較準(zhǔn)確,長(zhǎng)期預(yù)測(cè)中效果較差;(3)移動(dòng)平均可以消除或減少時(shí)間序列數(shù)據(jù)受偶然性因素干擾而產(chǎn)生的隨機(jī)變動(dòng)影響。(4)一次移動(dòng)平均法適用于具有明顯線性趨勢(shì)的時(shí)間序列數(shù)據(jù)的預(yù)測(cè);一次移動(dòng)平均法只能用來(lái)對(duì)下一期進(jìn)行預(yù)測(cè),不能用
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年建筑工人勞動(dòng)合同樣本
- 2024年度互聯(lián)網(wǎng)金融服務(wù)平臺(tái)技術(shù)開(kāi)發(fā)與運(yùn)營(yíng)合同
- 2024年工程文件保密與轉(zhuǎn)讓協(xié)議
- 2024醫(yī)療器械銷售及市場(chǎng)推廣合同
- 2024年公共交通乘車意外傷害保險(xiǎn)合同
- 2024年度居民搬家服務(wù)定制合同
- 2024年工程建設(shè)的擔(dān)保協(xié)議
- 2024年勞動(dòng)力外包合作協(xié)議
- 2024年度股權(quán)轉(zhuǎn)讓合同模板
- 2024人工智能技術(shù)研發(fā)合同-科技創(chuàng)新合作
- 《七律長(zhǎng)征》教案
- 三年發(fā)展規(guī)劃表
- 公司會(huì)議簽到表模板
- 美術(shù)五年級(jí)上冊(cè)人美版 第15課 造型別致的椅子(課件)(11張PPT)
- 部編版語(yǔ)文三年級(jí)上冊(cè)單元知識(shí)點(diǎn)梳理歸納
- TS16949推行計(jì)劃
- 2009年勒流街道小學(xué)即席作文競(jìng)賽獲獎(jiǎng)結(jié)果(精)
- 三年級(jí)地方課程半島工程和溫州大橋教材
- 人民醫(yī)院便民惠民措施服務(wù)工作開(kāi)展情況總結(jié)
- 用友華表伙伴商務(wù)手冊(cè).
- 大學(xué)生健康人格與心理健康PPT課件
評(píng)論
0/150
提交評(píng)論