matlab數(shù)據(jù)的統(tǒng)計分析與描述.ppt_第1頁
matlab數(shù)據(jù)的統(tǒng)計分析與描述.ppt_第2頁
matlab數(shù)據(jù)的統(tǒng)計分析與描述.ppt_第3頁
matlab數(shù)據(jù)的統(tǒng)計分析與描述.ppt_第4頁
matlab數(shù)據(jù)的統(tǒng)計分析與描述.ppt_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn),數(shù)據(jù)的統(tǒng)計描述和分析,實(shí)驗(yàn)?zāi)康?實(shí)驗(yàn)內(nèi)容,2掌握用數(shù)學(xué)軟件包求解統(tǒng)計問題.,1直觀了解統(tǒng)計基本內(nèi)容.,1統(tǒng)計的基本理論.,3實(shí)驗(yàn)作業(yè).,2用數(shù)學(xué)軟件包求解統(tǒng)計問題.,統(tǒng)計的基本概念,參數(shù)估計,假設(shè)檢驗(yàn),數(shù)據(jù)的統(tǒng)計描述和分析,一、統(tǒng)計量,二、分布函數(shù)的近似求法,三、幾個在統(tǒng)計中常用的概率分布,1,正態(tài)分布,密度函數(shù):,分布函數(shù):,其中,m,為均值,,為方差,,.,標(biāo)準(zhǔn)正態(tài)分布:,N,(0,1),密度函數(shù),分布函數(shù),返回,F(10,50)分布的密度函數(shù)曲線,參數(shù)估計,一、點(diǎn)估計的求法,(一)矩估計法,(二)極大似然估計法,二、區(qū)間估計的求法,1已知DX,求EX的置信區(qū)間,2 未

2、知方差DX,求EX的置信區(qū)間,(一)數(shù)學(xué)期望的置信區(qū)間,(二)方差的區(qū)間估計,返回,1.參數(shù)檢驗(yàn):如果觀測的分布函數(shù)類型已知,這時構(gòu)造出的 統(tǒng)計量依賴于總體的分布函數(shù),這種檢驗(yàn)稱為參數(shù)檢驗(yàn). 參數(shù)檢驗(yàn)的目的往往是對總體的參數(shù)及其有關(guān)性質(zhì)作出明 確的判斷.,對總體X的分布律或分布參數(shù)作某種假設(shè),根據(jù)抽取的樣本觀察值,運(yùn)用數(shù)理統(tǒng)計的分析方法,檢驗(yàn)這種假設(shè)是否正確,從而決定接受假設(shè)或拒絕假設(shè).,假設(shè)檢驗(yàn),2.非參數(shù)檢驗(yàn):如果所檢驗(yàn)的假設(shè)并非是對某個參數(shù)作出明 確的判斷,因而必須要求構(gòu)造出的檢驗(yàn)統(tǒng)計量的分布函數(shù) 不依賴于觀測值的分布函數(shù)類型,這種檢驗(yàn)叫非參數(shù)檢驗(yàn). 如:要求判斷總體分布類型的檢驗(yàn)就是非

3、參數(shù)檢驗(yàn).,假設(shè)檢驗(yàn)的一般步驟,(一)單個正態(tài)總體均值的檢驗(yàn),一、參數(shù)檢驗(yàn),(二)單個正態(tài)總體方差的檢驗(yàn),(三)兩個正態(tài)總體均值的檢驗(yàn),(四)兩個正態(tài)總體方差的檢驗(yàn),二、非參數(shù)檢驗(yàn),(二)概率紙檢驗(yàn)法,概率紙是一種判斷總體分布的簡便工具.使用他們,可以很快地判斷總體分布的類型.概率紙的種類很多.,返回,統(tǒng)計工具箱中的基本統(tǒng)計命令,1. 數(shù)據(jù)的錄入、保存和調(diào)用,2. 基本統(tǒng)計量,3. 常見的概率分布函數(shù),4. 頻 數(shù) 直 方 圖 的 描 繪,5. 參數(shù)估計,6. 假設(shè)檢驗(yàn),7. 綜合實(shí)例,返回,一、數(shù)據(jù)的錄入、保存和調(diào)用,例1 上海市區(qū)社會商品零售總額和全民所有制職工工資總額的數(shù)據(jù)如下:,統(tǒng)計工

4、具箱中的基本統(tǒng)計命令,1年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入. 命令格式: x=a:h:b t=78:87,2分別以x和y代表變量職工工資總額和商品零售總額. x=23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4 y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0,3將變量t、x、y的數(shù)據(jù)保存在文件data中. save data t x y,4進(jìn)行統(tǒng)計分析時,調(diào)用數(shù)據(jù)文件data中的數(shù)據(jù). load data,To MATLAB(txy),方法1,1輸入矩陣: data=78,79

5、,80,81,82,83,84,85,86,87,88; 23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4; 41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0,2將矩陣data的數(shù)據(jù)保存在文件data1中:save data1 data,3進(jìn)行統(tǒng)計分析時,先用命令:load data1 調(diào)用數(shù)據(jù)文件data1中的數(shù)據(jù),再用以下命令分別將矩陣data的第一、二、三行的數(shù)據(jù)賦給變量t、x、y: t=data(1,:) x=data(2,:) y=data(3,:) 若要調(diào)用矩陣data的第j列

6、的數(shù)據(jù),可用命令: data(:,j),方法2,To MATLAB(data),返回,二、基本統(tǒng)計量,對隨機(jī)變量x,計算其基本統(tǒng)計量的命令如下: 均值:mean(x) 中位數(shù):median(x) 標(biāo)準(zhǔn)差:std(x) 方差:var(x) 偏度:skewness(x) 峰度:kurtosis(x),例 對例1中的職工工資總額x,可計算上述基本統(tǒng)計量.,To MATLAB(tjl),返回,三、常見概率分布的函數(shù),MATLAB工具箱對每一種分布都提供5類函數(shù),其命令字符為: 概率密度:pdf 概率分布:cdf 逆概率分布:inv 均值與方差:stat 隨機(jī)數(shù)生成:rnd,(當(dāng)需要一種分布的某一類函數(shù)

7、時,將以上所列的分布命令字符與函數(shù)命令字符接起來,并輸入自變量(可以是標(biāo)量、數(shù)組或矩陣)和參數(shù)即可.),在MATLAB中輸入以下命令: x=-6:0.01:6; y=normpdf(x); z=normpdf(x,0,2); plot(x,y,x,z),1密度函數(shù):p=normpdf(x,mu,sigma) (當(dāng)mu=0,sigma=1時可缺省),To MATLAB(liti2),如對均值為mu、標(biāo)準(zhǔn)差為sigma的正態(tài)分布,舉例如下:,To MATLAB(liti3),3逆概率分布:x=norminv(P,mu,sigma). 即求出x ,使得PXx=P.此命令可用來求分位數(shù).,2概率分布:

8、P=normcdf(x,mu,sigma),To MATLAB(liti4),To MATLAB(liti5),4均值與方差:m,v=normstat(mu,sigma),例5 求正態(tài)分布N(3,52)的均值與方差. 命令為:m,v=normstat(3,5) 結(jié)果為:m=3,v=25,5隨機(jī)數(shù)生成:normrnd(mu,sigma,m,n).產(chǎn)生mn階的正態(tài)分布隨機(jī)數(shù)矩陣.,例6 命令:M=normrnd(1 2 3;4 5 6,0.1,2,3) 結(jié)果為:M=0.9567 2.0125 2.8854 3.8334 5.0288 6.1191,To MATLAB(liti6),此命令產(chǎn)生了23

9、的正態(tài)分布隨機(jī)數(shù)矩陣,各數(shù)分別服從分布:N(1,0.12), N(2,22), N(3, 32), N(4,0.12), N(5, 22), N(6, 32).,返回,1給出數(shù)組data的頻數(shù)表的命令為: N,X=hist(data,k) 此命令將區(qū)間min(data),max(data)分為k個小區(qū)間(缺省為10),返回數(shù)組data落在每一個小區(qū)間的頻數(shù)N和每一個小區(qū)間的中點(diǎn)X.,2描繪數(shù)組data的頻數(shù)直方圖的命令為: hist(data,k),四、數(shù) 直 方 圖 的 描 繪,返回,五、參數(shù)估計,1正態(tài)總體的參數(shù)估計,設(shè)總體服從正態(tài)分布,則其點(diǎn)估計和區(qū)間估計可同時由以下命令獲得: muha

10、t,sigmahat,muci,sigmaci=normfit(X,alpha),此命令在顯著性水平alpha下估計數(shù)據(jù)X的參數(shù)(alpha缺省時設(shè)定為0.05),返回值muhat是X的均值的點(diǎn)估計值,sigmahat是標(biāo)準(zhǔn)差的點(diǎn)估計值, muci是均值的區(qū)間估計,sigmaci是標(biāo)準(zhǔn)差的區(qū)間估計.,2其它分布的參數(shù)估計,有兩種處理辦法: 一、取容量充分大的樣本(n50),按中心極限定理,它近似地 服從正態(tài)分布; 二、使用MATLAB工具箱中具有特定分布總體的估計命令.,(1)muhat, muci = expfit(X,alpha) 在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點(diǎn)估計

11、及其區(qū)間估計. (2)lambdahat, lambdaci = poissfit(X,alpha) 在顯著性水平alpha下,求泊松分布的數(shù)據(jù)X的參數(shù)的點(diǎn)估計及其區(qū)間估計. (3)phat, pci = weibfit(X,alpha) 在顯著性水平alpha下,求Weibull分布的數(shù)據(jù)X的參數(shù)的點(diǎn)估計及其區(qū)間估計.,返回,六、假設(shè)檢驗(yàn),在總體服從正態(tài)分布的情況下,可用以下命令進(jìn)行假設(shè)檢驗(yàn).,1總體方差 已知時,總體均值的檢驗(yàn)使用 z檢驗(yàn),h,sig,ci = ztest(x,m,sigma,alpha,tail) 檢驗(yàn)數(shù)據(jù) x 的關(guān)于均值的某一假設(shè)是否成立,其中sigma 為已知方差,

12、alpha 為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于 tail 的取值: tail = 0,檢驗(yàn)假設(shè)“x 的均值等于 m ” tail = 1,檢驗(yàn)假設(shè)“x 的均值大于 m ” tail =-1,檢驗(yàn)假設(shè)“x 的均值小于 m ” tail的缺省值為 0, alpha的缺省值為 0.05.,返回值 h 為一個布爾值,h=1 表示可以拒絕假設(shè),h=0 表示不可以拒絕假設(shè),sig 為假設(shè)成立的概率,ci 為均值的 1-alpha 置信區(qū)間.,例7 MATLAB統(tǒng)計工具箱中的數(shù)據(jù)文件gas.mat.中提供了美國1993年1月份和2月份的汽油平均價格(price1,price2分別是1、2月份的油價,單位為

13、美分),它是容量為20的雙樣本.假設(shè)1月份油價的標(biāo)準(zhǔn)偏差是每加侖4分幣(=4),試檢驗(yàn)1月份油價的均值是否等于115.,解 作假設(shè):m = 115. 首先取出數(shù)據(jù),用以下命令: load gas 然后用以下命令檢驗(yàn) h,sig,ci = ztest(price1,115,4),返回:h = 0,sig = 0.8668,ci = 113.3970 116.9030.,檢驗(yàn)結(jié)果: 1. 布爾變量h=0, 表示不拒絕零假設(shè). 說明提出的假設(shè)均值115 是合理的. 2. sig值為0.8668, 遠(yuǎn)超過0.5, 不能拒絕零假設(shè) 3. 95%的置信區(qū)間為113.4, 116.9, 它完全包括115,

14、且精度很 高. .,To MATLAB(liti7),2總體方差 未知時,總體均值的檢驗(yàn)使用t 檢驗(yàn),h,sig,ci = ttest(x,m,alpha,tail) 檢驗(yàn)數(shù)據(jù) x 的關(guān)于均值的某一假設(shè)是否成立,其中alpha 為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于 tail 的取值: tail = 0,檢驗(yàn)假設(shè)“x 的均值等于 m ” tail = 1,檢驗(yàn)假設(shè)“x 的均值大于 m ” tail =-1,檢驗(yàn)假設(shè)“x 的均值小于 m ” tail的缺省值為 0, alpha的缺省值為 0.05.,返回值 h 為一個布爾值,h=1 表示可以拒絕假設(shè),h=0 表示不可以拒絕假設(shè),sig 為假設(shè)成立

15、的概率,ci 為均值的 1-alpha 置信區(qū)間.,返回:h = 1,sig = 4.9517e-004,ci =116.8 120.2.,檢驗(yàn)結(jié)果: 1. 布爾變量h=1, 表示拒絕零假設(shè). 說明提出的假 設(shè)油價均值115是不合理的. 2. 95%的置信區(qū)間為116.8 120.2, 它不包括 115, 故不能接受假設(shè). 3. sig值為4.9517e-004, 遠(yuǎn)小于0.5, 不能接受零 假設(shè).,To MATLAB(liti8),例8 試檢驗(yàn)例8中2月份油價price2的均值是否等于115.,解 作假設(shè):m = 115, price2為2月份的油價,不知其方差,故用以下命令檢驗(yàn) h,sig

16、,ci = ttest( price2 ,115),3兩總體均值的假設(shè)檢驗(yàn)使用 t 檢驗(yàn),h,sig,ci = ttest2(x,y,alpha,tail) 檢驗(yàn)數(shù)據(jù) x ,y 的關(guān)于均值的某一假設(shè)是否成立,其中alpha 為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于 tail 的取值: tail = 0,檢驗(yàn)假設(shè)“x 的均值等于 y 的均值 ” tail = 1,檢驗(yàn)假設(shè)“x 的均值大于 y 的均值 ” tail =-1,檢驗(yàn)假設(shè)“x 的均值小于 y 的均值 ” tail的缺省值為 0, alpha的缺省值為 0.05.,返回值 h 為一個布爾值,h=1 表示可以拒絕假設(shè),h=0 表示不可以拒絕假設(shè)

17、,sig 為假設(shè)成立的概率,ci 為與x與y均值差的的 1-alpha 置信區(qū)間.,返回:h = 1,sig = 0.0083,ci =-5.8,-0.9.,檢驗(yàn)結(jié)果:1. 布爾變量h=1, 表示拒絕零假設(shè). 說明提出的 假設(shè)“油價均值相同”是不合理的. 2. 95%的置信區(qū)間為-5.8,-0.9,說明一月份油 價比二月份油價約低1至6分. 3. sig-值為0.0083, 遠(yuǎn)小于0.5, 不能接受“油價均 相同”假設(shè).,To MATLAB(liti9),例9 試檢驗(yàn)例8中1月份油價price1與2月份的油價price2均值是否相同.,解 用以下命令檢驗(yàn) h,sig,ci = ttest2(p

18、rice1,price2),4非參數(shù)檢驗(yàn):總體分布的檢驗(yàn),MATLAB工具箱提供了兩個對總體分布進(jìn)行檢驗(yàn)的命令:,(1)h = normplot(x),(2)h = weibplot(x),此命令顯示數(shù)據(jù)矩陣x的正態(tài)概率圖.如果數(shù)據(jù)來自于正態(tài)分布,則圖形顯示出直線性形態(tài).而其它概率分布函數(shù)顯示出曲線形態(tài).,此命令顯示數(shù)據(jù)矩陣x的Weibull概率圖.如果數(shù)據(jù)來自于Weibull分布,則圖形將顯示出直線性形態(tài).而其它概率分布函數(shù)將顯示出曲線形態(tài).,返回,例10 一道工序用自動化車床連續(xù)加工某種零件,由于刀具損壞等會出現(xiàn)故障.故障是完全隨機(jī)的,并假定生產(chǎn)任一零件時出現(xiàn)故障機(jī)會均相同.工作人員是通過

19、檢查零件來確定工序是否出現(xiàn)故障的.現(xiàn)積累有100次故障紀(jì)錄,故障出現(xiàn)時該刀具完成的零件數(shù)如下: 459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555

20、570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851 試觀察該刀具出現(xiàn)故障時完成的零件數(shù)屬于哪種分布.,解 1數(shù)據(jù)輸入,To MATLAB(liti101),2作頻數(shù)直方圖 hist(x,10),3分布的正態(tài)性檢驗(yàn) normplot(x),4參數(shù)估計: muhat,sigmahat,muci,sigmaci=normfit(x),(看起來刀具壽命服從正態(tài)分布),(刀具壽命近似服從正態(tài)分布),估計出該刀具的均值為594,方差204, 均值的0.95置信區(qū)間為 553.4962,634.5038, 方差的0.95置信區(qū)間為 179.2276,237.1329.,To MATLAB(liti104),To MATLAB(liti102),To MATLAB(liti103),5假設(shè)檢驗(yàn),To MATLAB(liti105),已知刀具的壽命服從正態(tài)分布,現(xiàn)在方差未知的情況下,檢驗(yàn)其均值 m 是否等于594.,結(jié)果:h = 0,sig = 1,ci =553.4962,634.503

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論