




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
關(guān)于簡單統(tǒng)計分析與過程第一頁,共四十三頁,編輯于2023年,星期三一、假設(shè)檢驗與SAS過程平均每戶消費支出5006007008009001000家庭數(shù)8153025139例題6.1:為了了解農(nóng)村居民家庭消費水平是否有所提高,2008年,某市對其農(nóng)村居民家庭進行了一次抽樣調(diào)查,其中100戶被抽樣家庭的調(diào)查結(jié)果如下表:表6.12008年某市農(nóng)村居民家庭月均消費水平若3年前該市農(nóng)村居民家庭月均消費支出服從N(720,17580),假定2008年月均消費支出服從正態(tài)分布,問該市農(nóng)村居民家庭月均消費支出是否有顯著提高?(顯著性水平0.05)即在方差未知的情況下檢驗第二頁,共四十三頁,編輯于2023年,星期三統(tǒng)計量的計算值、臨界值、顯著性水平及檢驗概率之間的關(guān)系假定檢驗統(tǒng)計量Z服從正態(tài)分布統(tǒng)計量的計算值:一次抽樣觀測值代入統(tǒng)計量Z后得到的數(shù)值Z0.臨界值:在給定的顯著性水平下,由第三頁,共四十三頁,編輯于2023年,星期三統(tǒng)計量的計算值、臨界值、顯著性水平及檢驗概率之間的關(guān)系檢驗概率:由臨界值和檢驗概率的計算公式,可知因此,判斷接受或拒絕H0只需看p大于還是小于第四頁,共四十三頁,編輯于2023年,星期三單樣本和兩樣本下的假設(shè)檢驗單樣本的假設(shè)檢驗(一)單樣本的參數(shù)假設(shè)檢驗(正態(tài)分布總體)
總體均值的假設(shè)檢驗檢驗統(tǒng)計量:拒絕域:第五頁,共四十三頁,編輯于2023年,星期三檢驗統(tǒng)計量:拒絕域:第六頁,共四十三頁,編輯于2023年,星期三對于總體均值的假設(shè)檢驗,可轉(zhuǎn)化為均值是否為零的檢驗,可通過PROCMEANS過程實現(xiàn),只需在選項中選擇t,prt,和clm,alpha。例6.1程序:dataconsume;inputexpendnumber@@;dif=expend-720;cards;50086001575030800259001310009;procmeansmeantprt;vardif;freqnumber;outputout=meantt=tv;run;第七頁,共四十三頁,編輯于2023年,星期三由于檢驗變量dif=expend-720的t值=3.17,概率pr>|t|的值為0.0020,小于顯著性水平0.05,故在0.05的顯著性水平下推斷出dif的均值顯著不為0,也即居民月均消費支出顯著不等于720.第八頁,共四十三頁,編輯于2023年,星期三dataa;setmeant;k=_freq_-1;p=1-probt(tv,k);t1=tinv(0.95,k);procprint;run;
p=1-probt(t,k)t1=tinv(0.95,k);計算t分布的0.95分位數(shù)顯然,tv的值>t1且p值也<0.05,故在0.05的顯著性水平下拒絕原假設(shè),也即接受居民月均消費支出顯著大于720.第九頁,共四十三頁,編輯于2023年,星期三
總體方差的假設(shè)檢驗檢驗統(tǒng)計量:拒絕域:第十頁,共四十三頁,編輯于2023年,星期三例6.2:檢驗例6.1中居民消費支出的方差是否有變化,即是否仍為17580。procmeansvar;varexpend;freqnumber;outputout=testvar=varex;run;dataA(drop=_type_);settest;k=_freq_-1;chisq=k*varex/17580;p=1-probchi(chisq,k);
ci1=cinv(0.025,k);ci2=cinv(0.975,k);procprintdata=anoobs;run;第十一頁,共四十三頁,編輯于2023年,星期三程序說明:ci1=cinv(0.025,k);ci2=cinv(0.975,k);chisq=k*varex/17580;p=1-probchi(chisq,k);
分別計算分布的0.025和0.975分位數(shù)。由于chisq統(tǒng)計量值滿足ci1<chisq<ci2,正好落在拒絕域外,故接受原假設(shè),認為方差沒有發(fā)生顯著變化。另一方面,p=0.48018>0.05也表明,在0.05的顯著性水平下,接受原假設(shè)。第十二頁,共四十三頁,編輯于2023年,星期三(二)單樣本的非參數(shù)假設(shè)檢驗K.Pearson提出以下統(tǒng)計量:
總體分布的擬合優(yōu)度檢驗擬合優(yōu)度檢驗是根據(jù)樣本的經(jīng)驗分布對總體分布作出的估計。拒絕域:第十三頁,共四十三頁,編輯于2023年,星期三表6.3訂單頻數(shù)分布表星期一星期二星期三星期四星期五合計71215111560問:該企業(yè)的訂單在每星期5天中是否服從均勻分布?(顯著性水平0.05)例6.3
某企業(yè)欲了解其產(chǎn)品訂單的分布情況,在隨機選擇的一周中發(fā)現(xiàn),其訂單頻數(shù)分布如下表:第十四頁,共四十三頁,編輯于2023年,星期三程序?qū)崿F(xiàn):datachisq;inputfoifei@@;dif=(foi-fei);div=dif*dif/fei;cards;7121212151211121512; procmeanssum;vardiv;outputout=testsum=chisq;run;dataA;settest;k=_freq_-1;p=1-probchi(chisq,k);ci1=cinv(0.025,k);ci2=cinv(0.975,k);procprintdata=anoobs;run;第十五頁,共四十三頁,編輯于2023年,星期三程序說明:ci1=cinv(0.025,k);ci2=cinv(0.975,k);div=dif*dif/fei;procmeanssum;vardiv;outputout=testsum=chisq;
p=1-probchi(chisq,k);
分別計算分布的0.025和0.975分位數(shù)。第十六頁,共四十三頁,編輯于2023年,星期三由于chisq統(tǒng)計量值滿足ci1<chisq<ci2,正好落在拒絕域外,故接受原假設(shè),認為訂單在每周的5天中服從均勻分布。另一方面,p=0.45299>0.05也表明,在0.05的顯著性水平下,接受原假設(shè)。第十七頁,共四十三頁,編輯于2023年,星期三
總體均值的非參數(shù)檢驗(總體不服從正態(tài)分布)利用UNIVARIATE過程中的符號檢驗與威爾克森秩和檢驗。dataconsume;inputexpendnumber@@;dif=expend-720;cards;50086001575030800259001310009;procunivariatealpha=0.1;vardif;freqnumber;run;第十八頁,共四十三頁,編輯于2023年,星期三總體不服從正態(tài)分布,利用符號檢驗與威爾克森秩和檢驗(符號秩檢驗)。由于Pr>=|M|的P值小于0.0001,Pr>=|S|的P值為0.002,都小于給定的顯著性水平,故拒絕原假設(shè),認為dif均值不為零,與即認為居民家庭月均消費支出顯著大于720.第十九頁,共四十三頁,編輯于2023年,星期三兩樣本的假設(shè)檢驗(一)兩獨立組的假設(shè)檢驗獨立組:兩樣本來自于兩個獨立總體樣本需滿足以下兩個條件:正態(tài)性,方差齊次性。檢驗統(tǒng)計量:拒絕域檢驗可通過Procttest實現(xiàn)第二十頁,共四十三頁,編輯于2023年,星期三
滿足正態(tài)性而不滿足方差齊次性時,采用參數(shù)的近似T檢驗或非參數(shù)的威爾克森秩和檢驗。
兩個條件都不滿足時,采用非參數(shù)的威爾克森秩和檢驗。(procnparlwaywilcoxon;)第二十一頁,共四十三頁,編輯于2023年,星期三滿足正態(tài)分布條件表6.4地區(qū)A和B家庭平均收入水平情況A地區(qū)2.52.93.25.33.84.24.03.93.33.14.54.74.25.75.13.04.92.73.84.6B地區(qū)3.74.14.33.63.93.84.74.45.35.13.83.76.05.52.93.45.23.84.84.6問:這兩個地區(qū)的家庭平均收入是否有顯著差異?(顯著性水平0.05)例6.4:某銀行考慮在兩個相鄰地區(qū)A和B之間開設(shè)一個新的營業(yè)網(wǎng)點。銀行所關(guān)心的時這兩個地區(qū)家庭平均收入是否相同。為此,在這兩個地區(qū)分別抽取了20戶居民家庭進行調(diào)查,調(diào)查結(jié)果如下表:第二十二頁,共四十三頁,編輯于2023年,星期三dataincome;inputarea$income@@;cards;A2.5B3.7A3.2B4.3A3.8B3.9A4.0B4.7A3.3B5.3A4.5B3.8A4.2B6.0A5.1B2.9A4.9B5.2A3.8B4.8A2.9B4.1A5.3B3.6A4.2B3.8A3.9B4.4A3.1B5.1A4.7B3.7A5.7B5.5A3.0B3.4A2.7B3.8A4.6B4.6;procsort;byarea;run;procunivariatenormal;varincome;byarea;run;procttest;classarea;varincome;run;第二十三頁,共四十三頁,編輯于2023年,星期三area=A的正態(tài)性檢驗結(jié)果area=B的正態(tài)性檢驗結(jié)果由于W檢驗的P值都大于給定的顯著性水平,故接受原假設(shè),認為都服從正態(tài)分布。第二十四頁,共四十三頁,編輯于2023年,星期三又由方差是否相等(EqualityofVariances)的F檢驗:F值=1.31,P值Pr>F=0.5658(>0.05),故認為兩組方差相等。因此可用T檢驗對兩組均值是否相等進行檢驗,對應(yīng)T檢驗的T值=-1.32,P值Pr>|T|=0.1938(>0.05),接受原假設(shè),即A,B兩地區(qū)家庭收入沒有顯著差異。第二十五頁,共四十三頁,編輯于2023年,星期三正態(tài)性不滿足datazichfz;inputtype$rate@@;cards;pt99.4pt94.8pt38.4pt52.7pt92.1pt87.9pt334.2pt86.9pt134.5pt74.9pt69.9pt48.0pt104.9pt67.8pt60.8pt59.5pt62.0pt75.4pt715.2pt15.3pt224.6pt90.6pt86.7pt65.4pt77.1pt354.2pt59.7nopt31.3nopt54.7nopt29.7nopt40.0nopt55.1nopt32.6nopt59.2nopt46.9nopt52.9nopt29.1nopt64.8nopt35.0nopt56.6nopt44.5nopt52.3nopt21.8nopt52.0nopt28.0nopt24.0nopt13.5nopt29.8nopt67.1nopt17.1nopt48.1nopt30.8nopt32.6nopt24.1;procsort;bytype;run;procunivariatenormal;varrate;bytype;run;procnpar1waywilcoxon;classtype;varrate;run;見課本例6.6第二十六頁,共四十三頁,編輯于2023年,星期三type=nopt的正態(tài)性檢驗結(jié)果type=pt的正態(tài)性檢驗結(jié)果由于W檢驗的P值0.2488>0.05,故接受原假設(shè),認為服從正態(tài)分布。由于W檢驗的P值<0.0001,故拒絕原假設(shè),認為不服從正態(tài)分布。第二十七頁,共四十三頁,編輯于2023年,星期三采用非參數(shù)檢驗WilcoxonTwo-SampleTest檢驗中的近似Z檢驗和近似T檢驗的雙側(cè)檢驗的P值都<0.001,故拒絕原假設(shè),即兩類公司的資產(chǎn)負債率有顯著差異。第二十八頁,共四十三頁,編輯于2023年,星期三又由于nopt類公司資產(chǎn)負債率rate的均值39.7629630顯然小于Pt類公司的均值,故Pt類公司的資產(chǎn)負債率顯著高于nopt類公司的資產(chǎn)負債率。第二十九頁,共四十三頁,編輯于2023年,星期三(二)成對組的假設(shè)檢驗成對組:兩樣本來自于同一總體在不同時間或不同處理下的數(shù)據(jù)。差值來自正態(tài)總體:用MEANS過程中T檢驗來自其它分布總體:用UNIVARIATE過程中的符號檢驗或符號秩檢驗。第三十頁,共四十三頁,編輯于2023年,星期三課本例6.7datapackage;inputsale1sale2@@;dif=sale2-sale1;cards;667270757568798765849073857082839795959092827378716969747786;procunivariatenormal;vardif;run;第三十一頁,共四十三頁,編輯于2023年,星期三課本例6.8datastock(keep=rate1rate2dif);inputprice1price2@@;rate1=(price1-lag(price1))/lag(price1)*100;rate2=(price2-lag(price2))/lag(price2)*100;dif=rate2-rate1;cards;25.7924.9024.3724.8823.2425.2022.1125.1022.0024.9922.1224.7820.2924.9019.7024.8020.4626.0519.9825.4120.6825.46;procunivariatenormal;varrate1rate2dif;run;第三十二頁,共四十三頁,編輯于2023年,星期三相關(guān)分析與CORR過程兩連續(xù)型變量:Pearson積矩相關(guān)系數(shù)兩有序變量:(1)Spearman等級相關(guān)系數(shù)(或秩序相關(guān)系數(shù))(2)Kendall’stau_b相關(guān)系數(shù)兩分類變量:列聯(lián)系數(shù)相關(guān)關(guān)系的度量第三十三頁,共四十三頁,編輯于2023年,星期三主要功能:計算變量間的相關(guān)系數(shù):包括Pearson相關(guān)系數(shù),Spearman等級相關(guān)系數(shù)、Kendall’stau_b相關(guān)系數(shù)、Hoeffding的相關(guān)性度量D.還可以計算偏相關(guān)和Cronbach系數(shù)及一些單變量的描述性統(tǒng)計量。CORR(相關(guān))過程第三十四頁,共四十三頁,編輯于2023年,星期三CORR(相關(guān))過程的一般格式PROCCORR<option-list>;VARvariable-list;WITHvariable-list;PARTIALvariable-list;WEIGHTvariable;FREQvariable;BYvariable-list;第三十五頁,共四十三頁,編輯于2023年,星期三CORR(相關(guān))過程中語句說明:(1)PROCCORR語句一般格式為:PROCCORR<option-list>;<option-list>有以下幾類:數(shù)據(jù)集選項:
DATA=SAS-data-set;OUTP=SAS-data-set;創(chuàng)建存放Pearson統(tǒng)計量的數(shù)據(jù)集,需同時使用PEARSON選項。
OUTS=SAS-data-set;創(chuàng)建存放Spearman統(tǒng)計量的數(shù)據(jù)集,需同時使用SPEARMAN選項。第三十六頁,共四十三頁,編輯于2023年,星期三OUTH=SAS-data-set;創(chuàng)建存放Hoeffding統(tǒng)計量的數(shù)據(jù)集,需同時使用HOEFFDING選項。
OUTK=SAS-data-set;創(chuàng)建存放Kendall的tau_b統(tǒng)計量的數(shù)據(jù)集,需同時使用KENDALL選項。相關(guān)類型選項:
Pearson相關(guān)系數(shù);沒有規(guī)定選項,即默認為Pearson相關(guān)系數(shù)。
Spearman秩序相關(guān)系數(shù);
Kendall等級相關(guān)系數(shù)tau_b;Hoeffding的相關(guān)性度量;第三十七頁,共四十三頁,編輯于2023年,星期三(2)VAR語句一般格式為:VARvariable-list;如:varabc;(3)WITH語句一般格式為:WITHvariable-list;該句與VAR語句一起使用,得到變量間特殊組合的相關(guān)系數(shù)。如:varabc;withxy;第三十八頁,共四十三頁,編輯于2023年,星期三(4)PARTIAL語句一般格式為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 自動駕駛技術(shù)測試合作協(xié)議
- 《創(chuàng)新課程設(shè)計:物理游戲化教學(xué)法教案》
- 八年級英語語法知識總結(jié)與提升教學(xué)教案
- 鋼筋綁扎承包合同
- 阿甘正傳節(jié)選與人生哲學(xué)的思考:英語文學(xué)賞析教學(xué)教案
- 網(wǎng)絡(luò)安全風(fēng)險評估及防御合作協(xié)議
- 裝修工程區(qū)域消防安全協(xié)議書
- 航空航天材料科技知識重點梳理
- 數(shù)據(jù)空間發(fā)展戰(zhàn)略藍皮書內(nèi)容
- 知識產(chǎn)權(quán)授權(quán)轉(zhuǎn)讓與使用協(xié)議
- 第8章-機器人傳感器-課件
- 安全生產(chǎn)法律法規(guī)培訓(xùn)課件
- DB11∕T 1772-2020 地源熱泵系統(tǒng)評價技術(shù)規(guī)范
- 財務(wù)審計服務(wù)方案投標(biāo)文件(技術(shù)方案)
- 專題二網(wǎng)絡(luò)消費者購買行為分析(課件)職教高考電子商務(wù)專業(yè)《網(wǎng)絡(luò)營銷實務(wù)》
- 中建有限空間作業(yè)施工方案
- 2024脈沖式布袋除塵器設(shè)備運行情況記錄表(模板)
- 管理批次管理辦法
- 機器人維護協(xié)議范文
- 助理值班員(中級)技能鑒定理論題庫(濃縮400題)
- 診所負責(zé)人變更申請書
評論
0/150
提交評論