【大學(xué)】現(xiàn)代統(tǒng)計分析方法概述_第1頁
【大學(xué)】現(xiàn)代統(tǒng)計分析方法概述_第2頁
【大學(xué)】現(xiàn)代統(tǒng)計分析方法概述_第3頁
【大學(xué)】現(xiàn)代統(tǒng)計分析方法概述_第4頁
【大學(xué)】現(xiàn)代統(tǒng)計分析方法概述_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

現(xiàn)代統(tǒng)計分析方法概述

編輯ppt主要內(nèi)容現(xiàn)代統(tǒng)計分析方法介紹常用統(tǒng)計分析方法舉例編輯ppt現(xiàn)代統(tǒng)計分析方法介紹從高斯(C.F.Gauss)描述天文觀測的誤差而引進正態(tài)分布,并使用最小二乘法作為一種估計方法至今,現(xiàn)代統(tǒng)計的發(fā)展已有200多年的歷史。統(tǒng)計學(xué)在分析數(shù)據(jù)、探索數(shù)據(jù)規(guī)律性、研究現(xiàn)實問題中已形成許多各具特點的思想方法。從研究問題的角度,可將現(xiàn)代統(tǒng)計分析方法分為四大類:分類分析方法、結(jié)構(gòu)簡化方法、相關(guān)分析方法、預(yù)測決策方法。編輯ppt編輯ppt統(tǒng)計分析方法應(yīng)用的步驟及其流程對統(tǒng)計分析方法的應(yīng)用應(yīng)從實際問題出發(fā),明確具體問題和目標(biāo),然后確定理論以及相應(yīng)的指標(biāo),在收集和整理數(shù)據(jù)的基礎(chǔ)上構(gòu)造滿足需求的模型并進行統(tǒng)計計算,在對模型進行檢驗的基礎(chǔ)上,對模型加以推廣應(yīng)用。編輯ppt常用統(tǒng)計分析方法舉例正態(tài)分布區(qū)間估計和假設(shè)檢驗回歸分析方差分析編輯ppt正態(tài)分布正態(tài)分布(normaldistribution)又名高斯分布(Gaussiandistribution),是一個在數(shù)學(xué)、物理及工程等領(lǐng)域都非常重要的概率分布,在統(tǒng)計學(xué)的許多方面有著重大的影響力。因其曲線呈鐘形,因此人們又經(jīng)常稱之為鐘形曲線。其數(shù)學(xué)定義如下:若隨機變量X的密度函數(shù)為則稱X服從正態(tài)分布,稱X為正態(tài)變量,記作。正態(tài)分布的分布函數(shù)為編輯ppt正態(tài)分布的歷史正態(tài)分布最早是棣莫佛在1734年發(fā)表的一篇關(guān)于二項分布文章中提出的。拉普拉斯在1812年發(fā)表的《分析概率論》(TheorieAnalytiquedesProbabilites)中對棣莫佛的結(jié)論作了擴展?,F(xiàn)在這一結(jié)論通常被稱為棣莫佛-拉普拉斯定理。拉普拉斯在誤差分析試驗中使用了正態(tài)分布。勒讓德于1805年引入最小二乘法這一重要方法;而高斯則宣稱他早在1794年就使用了該方法,并通過假設(shè)誤差服從正態(tài)分布給出了嚴(yán)格的證明。編輯ppt正態(tài)分布的應(yīng)用正態(tài)分布是很多統(tǒng)計方法的理論基礎(chǔ),正態(tài)分布在現(xiàn)實中的應(yīng)用也是最為廣泛的,包含自動控制、質(zhì)量管理、醫(yī)學(xué)管理、經(jīng)濟分析及評價、風(fēng)險評估等多個方面。正態(tài)分布在自動控制、優(yōu)化設(shè)計、包裝或加工零件的精度等方面有著廣泛的應(yīng)用。正態(tài)分布的均值就是自動控制的設(shè)定值,方差就是自動控制的精度;方差越小,精度越高,系統(tǒng)的性能越好質(zhì)量控制方面,為了控制實驗中的測量(或?qū)嶒灒┱`差,常以3σ作為上、下警戒值,以3σ作為上、下控制值。這樣做可以保證正常情況下測量(或?qū)嶒灒┱`差服從正態(tài)分布醫(yī)學(xué)應(yīng)用方面,某些醫(yī)學(xué)現(xiàn)象,如同質(zhì)群體的身高、紅細(xì)胞數(shù)、血紅蛋白量,以及實驗中的隨機誤差,呈現(xiàn)為正態(tài)或近似正態(tài)分布;有些指標(biāo)(變量)雖服從偏態(tài)分布,但經(jīng)數(shù)據(jù)轉(zhuǎn)換后的新變量可服從正態(tài)或近似正態(tài)分布,可按正態(tài)分布規(guī)律處理經(jīng)濟分析及風(fēng)險評估方面,正態(tài)分布在投入產(chǎn)出、經(jīng)濟分析、風(fēng)險收益、風(fēng)險價值度量等諸多方面的應(yīng)用越來越廣泛,為經(jīng)濟分析、經(jīng)濟評價以及風(fēng)險評估提供了多樣的方法選擇,使評估結(jié)果更加科學(xué)編輯ppt區(qū)間估計和假設(shè)檢驗參數(shù)的區(qū)間估計和假設(shè)檢驗是兩種最重要的統(tǒng)計推斷形式,掌握這兩種方法對做出正確的統(tǒng)計推斷至關(guān)重要區(qū)間估計

設(shè)是總體的一個參數(shù),是樣本,所謂區(qū)間估計就是要找兩個統(tǒng)計量和,使得,在得到樣本觀測值之后,就把估計在區(qū)間內(nèi)假設(shè)檢驗假設(shè)檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計推斷方法。其基本原理是先對總體的特征做出某種假設(shè),然后通過抽樣研究的統(tǒng)計推理,對此假設(shè)應(yīng)該被拒絕還是接受做出推斷編輯ppt區(qū)間估計置信區(qū)間:

設(shè)是總體的一個參數(shù),其參數(shù)空間為,是來自該總體的樣本,,若有兩個統(tǒng)計量和若對任意的,有,則稱隨機區(qū)間為的置信水平的置信區(qū)間對給定的一個為置信水平的頻率解釋:在大量重復(fù)使用的置信區(qū)間時,每次得到的樣本觀測值是不同的,從而每次得到的區(qū)間估計值也是不一樣的,對一次具體的觀測值而言,可能在內(nèi),也可能不在。平均而言,在這大量的區(qū)間估計觀測值中,至少有包含編輯ppt假設(shè)檢驗假設(shè)檢驗的基本思想是小概率反證法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次試驗中基本上不會發(fā)生。反證法思想是先提出假設(shè)(檢驗假設(shè)H0),再用適當(dāng)?shù)慕y(tǒng)計方法確定假設(shè)成立的可能性大小,如可能性小,則認(rèn)為假設(shè)不成立,若可能性大,則還不能認(rèn)為假設(shè)不成立假設(shè)檢驗的一般步驟:應(yīng)注意的問題1、做假設(shè)檢驗之前,應(yīng)注意資料本身是否有可比性。2、當(dāng)差別有統(tǒng)計學(xué)意義時應(yīng)注意這樣的差別在實際應(yīng)用中有無意義。3、根據(jù)資料類型和特點選用正確的假設(shè)檢驗方法。4、根據(jù)專業(yè)及經(jīng)驗確定是選用單側(cè)檢驗還是雙側(cè)檢驗。5、當(dāng)檢驗結(jié)果為拒絕無效假設(shè)時,應(yīng)注意有發(fā)生I類錯誤的可能性,即錯誤地拒絕了本身成立的H0,發(fā)生這種錯誤的可能性預(yù)先是知道的,即檢驗水準(zhǔn)那么大;當(dāng)檢驗結(jié)果為不拒絕無效假設(shè)時,應(yīng)注意有發(fā)生II類錯誤的可能性,即仍有可能錯誤地接受了本身就不成立的H0,發(fā)生這種錯誤的可能性預(yù)先是不知道的,但與樣本含量和I類錯誤的大小有關(guān)系。6、判斷結(jié)論時不能絕對化,應(yīng)注意無論接受或拒絕檢驗假設(shè),都有判斷錯誤的可能性。7、報告結(jié)論時是應(yīng)注意說明所用的統(tǒng)計量,檢驗的單雙側(cè)及P值的確切范圍。編輯ppt參數(shù)的區(qū)間估計與假設(shè)檢驗的關(guān)系參數(shù)的區(qū)間估計與假設(shè)檢驗的關(guān)系參數(shù)的區(qū)間估計與參數(shù)的假設(shè)檢驗雖然提法不同,但解決問題的途徑是相通的,統(tǒng)計推斷的思想方法是一樣的,都是基于樣本信息來推斷總體的性質(zhì),即用部分來推斷總體。它們都是選取一個統(tǒng)計量,然后使這個統(tǒng)計量落在某個已知區(qū)間上的概率很小由此得到的結(jié)果1、參數(shù)估計解決的是多少(或范圍)問題,假設(shè)檢驗則判斷結(jié)論是否成立。前者解決的是定量問題,后者解決的是定性問題。2、兩者的要求各不相同。區(qū)間估計確定在一定概率保證程度下給出未知參數(shù)的范圍。而假設(shè)檢驗確定在一定的置信水平下,未知參數(shù)能否接受已給定的值。3、兩者對問題的了解程度各不相同。進行區(qū)間估計之前不了解未知參數(shù)的有關(guān)信息,而假設(shè)檢驗對未知參數(shù)的信息有所了解,但做出某種判斷無確切把握。因而在實際應(yīng)用中,究竟選擇哪種方法進行統(tǒng)計推斷,需要根據(jù)實際問題的情況確定相應(yīng)的處理方法二者之間的聯(lián)系二者之間的區(qū)別編輯ppt回歸分析回歸分析的概念及分類回歸分析(regressionanalysis)是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。運用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。如果在回歸分析中,只包括一個自變量和一個因變量,且二者的關(guān)系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個或兩個以上的自變量,且因變量和自變量之間是線性關(guān)系,則稱為多元線性回歸分析回歸分析提出的背景

早在19世紀(jì),英國生物學(xué)家兼統(tǒng)計學(xué)家高爾頓在研究父與子身高的遺傳問題時,觀察了1078對父與子,用x表示父親身高,y表示成年兒子的身高,發(fā)現(xiàn)將(x,y)點在直角坐標(biāo)系中,這1078個點基本在一條直線附近,并求出了該直線的方程,這便是子代的平均高度有向中心回歸的意思,使得一段時間內(nèi)人的身高相對穩(wěn)定。之后回歸分析的思想滲透到數(shù)理統(tǒng)計的其他分支中。隨著計算機的發(fā)展,各種統(tǒng)計軟件的出現(xiàn),回歸分析的應(yīng)用越來越廣泛編輯ppt回歸分析的主要內(nèi)容:①從一組數(shù)據(jù)出發(fā)確定某些變量之間的定量關(guān)系式,即建立數(shù)學(xué)模型并估計其中的未知參數(shù)。估計參數(shù)的常用方法是最小二乘法。②對這些關(guān)系式的可信程度進行檢驗。③在許多自變量共同影響著一個因變量的關(guān)系中,判斷哪個(或哪些)自變量的影響是顯著的,哪些自變量的影響是不顯著的,將影響顯著的自變量選入模型中,而剔除影響不顯著的變量,通常用逐步回歸、向前回歸和向后回歸等方法。④利用所求的關(guān)系式對某一生產(chǎn)過程進行預(yù)測或控制?;貧w分析的應(yīng)用是非常廣泛的,統(tǒng)計軟件包使各種回歸方法計算十分方便回歸分析的應(yīng)用:應(yīng)用回歸分析模型可以探求出兩個變量之間的影響關(guān)系,最初時在身高遺傳問題上應(yīng)用一元線性回歸分析模型,隨著社會的不斷發(fā)展,系統(tǒng)的復(fù)雜性不斷增加,應(yīng)用一元線性回歸分析已經(jīng)不能滿足需求,于是出現(xiàn)了多元線性回歸分析以及多元非線性回歸分析模型。這些分析模型在分析復(fù)雜系統(tǒng)下一種現(xiàn)象的影響因素方面有很好的應(yīng)用性,目前研究的方面包括臨床統(tǒng)計數(shù)據(jù)分析、多因素影響下的回歸分析、經(jīng)濟增長下的多因素影響分析等,涉及到經(jīng)濟社會發(fā)展的多個方面編輯ppt一元線性回歸分析模型所謂一元線性回歸分析,就是研究具有線性關(guān)系的兩個變量相關(guān)關(guān)系的方法。在實際預(yù)測時,選取與預(yù)測量(Y)關(guān)系最緊密的一個影響因素作為自變量(X),建立回歸方程擬合回歸曲線,對參數(shù)進行統(tǒng)計檢驗,對預(yù)測值進行精度檢驗和置信區(qū)間的估計。在預(yù)測量(Y)的眾多影響因素中選取一個關(guān)系最密切的因素作為自變量(X)。得到回歸方程常見回歸分析模型其中,和為待估參數(shù),稱為隨機誤差(指除X對Y的線性影響外的其他各因素對Y的影響)。如果隨機誤差總體服從正態(tài)分布我們可在X與Y的觀測樣本下以最小二乘法擬合回歸曲線。這樣的回歸曲線且相互獨立,滿足殘差平方和,編輯ppt方差分析方差分析(Analysisofvariance,簡稱ANOVA)是將總變異分裂為各個因素的相應(yīng)變異,做出其數(shù)量估計,從而發(fā)現(xiàn)各個因素在變異中所占的重要程度,而且除了可控制因素所引起的變異后,其剩余變異又可提供試驗誤差的準(zhǔn)確而無偏的估計,作為統(tǒng)計假設(shè)測驗的依據(jù)方差分析是判斷多組數(shù)據(jù)(K≥3)之間平均數(shù)差異是否顯著的一種假設(shè)測驗方法。2個樣本平均數(shù)可用t或U測驗的方法來評定其差數(shù)的顯著性。如果有K個平均數(shù),且K≥3,若仍然用兩兩比較的方法來測驗,則需要作K(K-1)/2次測驗,如果K=10,則需要45次測驗,不但測驗程序繁瑣,而且在理論上,其顯著水平已經(jīng)擴大了。因此,對于多樣本平均數(shù)的假設(shè)測驗,需采用一種更為合適的統(tǒng)計方法,即方差分析法(Fisher,1923)編輯ppt方差分析的分類方差分析主要有單因素方差分析、多因素方差分析以及協(xié)方差分析三種單因素方差分析是用來研究一個控制變量的不同水平是否對觀測變量產(chǎn)生了顯著影響。這里,由于僅研究單個因素對觀測變量的影響,因此稱為單因素方差分析單因素方差分析在觀測變量總離差平方和中,如果組間離差平方和所占比例較大,則說明觀測變量的變動主要是由控制變量引起的,可以主要由控制變量來解釋,控制變量給觀測變量帶來了顯著影響;反之,如果組間離差平方和所占比例小,則說明觀測變量的變動不是主要由控制變量引起的,不可以主要由控制變量來解釋,控制變量的不同水平?jīng)]有給觀測變量帶來顯著影響,觀測變量值的變動是由隨機變量因素引起的單因素方差分析原理:編輯ppt單因素方差分析基本步驟:1、提出原假設(shè):H0——無差異;H1——有顯著差異2、選擇檢驗統(tǒng)計量:方差分析采用的檢驗統(tǒng)計量是F統(tǒng)計量,即F值檢驗。3、計算檢驗統(tǒng)計量的觀測值和概率P值:該步驟的目的就是計算檢驗統(tǒng)計量的觀測值和相應(yīng)的概率P值。4、給定顯著性水平,并做出決策單因素方差分析的進一步分析:在完成上述單因素方差分析的基本分析后,可得到關(guān)于控制變量是否對觀測變量造成顯著影響的結(jié)論,接下來還應(yīng)做其他幾個重要分析,主要包括方差齊性檢驗、多重比較檢驗。方差齊性檢驗是對控制變量不同水平下各觀測變量總體方差是否相等進行檢驗。SPSS單因素方差分析中,方差齊性檢驗采用了方差同質(zhì)性(homogeneityofvariance)檢驗方法,其原假設(shè)是:各水平下觀測變量總體的方差無顯著差異。多重比較檢驗利用了全部觀測變量值,實現(xiàn)對各個水平下觀測變量總體均值的逐對比較。由于多重比較檢驗問題也是假設(shè)檢驗問題,因此也遵循假設(shè)檢驗的基本步驟。編輯ppt多因素方差分析基本思想:多因素方差分析用來研究兩個及兩個以上控制變量是否對觀測變量產(chǎn)生顯著影響。這里,由于研究多個因素對觀測變量的影響,因此稱為多因素方差分析。多因素方差分析不僅能夠分析多個因素對觀測變量的獨立影響,更能夠分析多個控制因素的交互作用能否對觀測變量的分布產(chǎn)生顯著影響,進而最終找到利于觀測變量的最優(yōu)組合分析不同品種、不同施肥量對農(nóng)作物產(chǎn)量的影響時,可將農(nóng)作物產(chǎn)量作為觀測變量,品種和施肥量作為控制變量。利用多因素方差分析方法,研究不同品種、不同施肥量是如何影響農(nóng)作物產(chǎn)量的,并進一步研究哪種品種與哪種水平的施肥量是提高農(nóng)作物產(chǎn)量的最優(yōu)組合。例子:在SPSS中,利用多因素方差分析功能還能夠?qū)Ω骺刂谱兞坎煌较掠^測變量的均值是否存在顯著差異進行比較,實現(xiàn)方式有兩種,即多重比較檢驗和對比檢驗。多重比較檢驗的方法與單因素方差分析類似。對比檢驗采用的是單樣本t檢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論