版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1.擬合檢驗(yàn)法2.兩個(gè)定性變量的相關(guān)性3.兩個(gè)定量變量的相關(guān)性4.線性回歸分析5.定性自變量的回歸模型6.定量因變量、定性自變量模型--方差分析模型1.擬合檢驗(yàn)法檢驗(yàn):總體的分布函數(shù)為:總體的分布函數(shù)不是如總體為離散型:總體分布率如總體為連續(xù)型:總體的概率密度為應(yīng)用中,將的所有可能取值結(jié)果劃分為兩兩互不相交的子集,在零假設(shè)下的分布為以記樣本觀測值中落在的個(gè)數(shù),發(fā)生的頻數(shù)一般地,若為真且試驗(yàn)次數(shù)又甚多時(shí)不應(yīng)太大.在零假設(shè)下,當(dāng)充分大時(shí),統(tǒng)計(jì)量近似地服從.其中,是被估計(jì)參數(shù)的個(gè)數(shù).例1.自1965年1月1日至1971年2月9日共2231天中,全世界記錄到的里氏4級(jí)和4級(jí)以上地震162次統(tǒng)計(jì)如下(最長天數(shù)40434449586081109):驗(yàn)證相繼兩次地震間隔天數(shù)服從指數(shù)分布解:指數(shù)分布密度為從數(shù)據(jù)得到:服從指數(shù)分布,:不服從指數(shù)分布在零假設(shè)下,將的所有可能取值分為9個(gè)互不重疊的區(qū)間有數(shù)據(jù)和代入統(tǒng)計(jì)量得到而因此不能拒絕零假設(shè)例2.下面列出84個(gè)Etruscan人男子的頭顱的最大寬度,試驗(yàn)證這些數(shù)據(jù)來自正態(tài)分布()解:如果服從正態(tài)分布從數(shù)據(jù)得到參數(shù)極大似然估計(jì)為數(shù)據(jù)落在區(qū)間[126,158],將它分為7個(gè)區(qū)間得到可驗(yàn)證:Spearman和Kendall相關(guān)系數(shù)為1數(shù)據(jù)落在區(qū)間[126,158],將它分為7個(gè)區(qū)間Pearsonc2統(tǒng)計(jì)量點(diǎn)擊Data選weightcases點(diǎn)擊weightcasesby將var00001選入frequencyvariable點(diǎn)擊OK兩個(gè)定性變量的相關(guān)性:總體的分布函數(shù)不是sav數(shù)據(jù),b0,b1,a1,a2,a3的估計(jì)分別為28.如有k個(gè)(定量)自變量x1,x2…,xk,因變量y的線性回歸模型為中,全世界記錄到的里氏4級(jí)和4級(jí)以上地震162次對(duì)Yi=Xi2,Pearson相關(guān)系數(shù)不為1,但這里b0,b1,…,bk稱為回歸系數(shù)。它們的求法和性質(zhì)與一個(gè)自變量的情況類似。000,拒絕零假設(shè),兩個(gè)變量有關(guān)。不應(yīng)太大.將數(shù)據(jù)和代入公式得而在顯著水平0.1,不能拒絕零假設(shè).:服從正態(tài)分布,:不服從正態(tài)分布例3.一農(nóng)場10年前在一魚塘按比例20:15:40:25投放了四種魚的魚苗,現(xiàn)在魚塘中得到樣本如下解:
:的分布律為將數(shù)據(jù)和代入公式得而拒絕,即魚苗比例有顯著變化1.先計(jì)算npi即600×(0.20,0.15,0.40,0.25)=(120,90,240,150)2.打開SPSS,在變量名var00001下輸入數(shù)據(jù)1,2,3,4,在變量名var00002下輸入132,100,200,168,3.點(diǎn)擊Data選weightcases點(diǎn)擊weightcasesby將var00001選入frequencyvariable點(diǎn)擊OK4.選Analyze-nonparametrictests–chi-square,將var00001選入testvariablelist,在expectedvalues處,點(diǎn)擊values,敲入120點(diǎn)擊Add,敲入90點(diǎn)擊Add,敲入240點(diǎn)擊Add,敲入150點(diǎn)擊Add,點(diǎn)擊OK用SPSS進(jìn)行擬合優(yōu)度檢驗(yàn)
用魚塘例子說明SPSS結(jié)果2.兩個(gè)定性變量的相關(guān)性列聯(lián)表(contingencytable):各個(gè)變量不同水平的交匯處,是這種水平組合出現(xiàn)的頻數(shù)或計(jì)數(shù)(count)。二維的列聯(lián)表又稱為交叉表(crosstable)。列聯(lián)表可以有很多維。維數(shù)多的叫做高維列聯(lián)表。點(diǎn)擊Data選weightcases點(diǎn)擊weightcasesby將number選入frequencyvariable點(diǎn)擊OK選Analyze-DescriptiveStatistics-Crosstabs-將income放入columns將opinion放入rows.點(diǎn)擊statistics選chi-square點(diǎn)擊continue點(diǎn)擊cells,在counts中選expected點(diǎn)擊continue不同收入水平的人和觀點(diǎn)的確不同,即收入高低的確影響觀點(diǎn)。收入高的人不贊成偏多,收入低的人贊成偏多SPSS的相關(guān)分析-兩個(gè)定性變量贊成不贊成收入和觀點(diǎn)的相關(guān)性
假設(shè)檢驗(yàn)
H0:觀點(diǎn)和收入不相關(guān);H1:這兩個(gè)變量相關(guān)。Pearson
c2統(tǒng)計(jì)量和似然比(likelihoodratio)c2統(tǒng)計(jì)量;它們都漸近c(diǎn)2分布。例中數(shù)據(jù)兩個(gè)p-值小于0.001。收入和觀點(diǎn)的條形圖
性別和觀點(diǎn)的相關(guān)性
性別和觀點(diǎn)的條形圖
3.兩個(gè)定量變量的相關(guān)性研究兩個(gè)定量變量的關(guān)系,最簡單的直觀辦法就是畫出它們的散點(diǎn)圖。下面是四組數(shù)據(jù)的散點(diǎn)圖;每一組數(shù)據(jù)表示了兩個(gè)變量x和y的樣本。不相關(guān)
正線性相關(guān)負(fù)線性相關(guān)
相關(guān)但非線性相關(guān)A.Pearson相關(guān)系數(shù)它取值于-1和1之間。當(dāng)兩個(gè)變量Yi=aXi,相關(guān)系數(shù)為1;而Yi=-aXi,相關(guān)系數(shù)為-1,其中a為正數(shù).而當(dāng)兩個(gè)變量不那么線性相關(guān)時(shí),相關(guān)系數(shù)就接近0。對(duì)一列數(shù)Pearson相關(guān)系數(shù)如果為二元正態(tài)分布,如假設(shè)檢驗(yàn)為則統(tǒng)計(jì)量在零假設(shè)下,服從自由度為的分布.對(duì)一列數(shù)記為在觀測中的秩,而為在觀測中的秩.假設(shè)檢驗(yàn):不相關(guān);相關(guān)(正相關(guān);負(fù)相關(guān))B.Spearman秩相關(guān)系數(shù)Spearman檢驗(yàn)統(tǒng)計(jì)量:當(dāng)Si=Ri時(shí),=1;當(dāng)Si=n-Ri時(shí),=-1在零假設(shè)下,當(dāng)樣本量n很大時(shí),如果稱對(duì)子和為協(xié)同的(concordant);如果稱對(duì)子和為不協(xié)同的(disconcordant).令:C.Kendalltau相關(guān)系數(shù)假設(shè)沒有情況容易驗(yàn)證如所有對(duì)子都協(xié)同如所有對(duì)子都不協(xié)同且
假設(shè)檢驗(yàn):不相關(guān);相關(guān)在零假設(shè)下,當(dāng)樣本量很大時(shí),即:當(dāng)很大時(shí),應(yīng)拒絕零假設(shè).Pearson相關(guān)系數(shù)檢驗(yàn)兩變量的線性相關(guān)性Spearman秩相關(guān)系數(shù)和Kendall度量更加廣義的單調(diào)(不一定線性)的關(guān)系.對(duì)Yi=Xi,三種相關(guān)系數(shù)均為1對(duì)Yi=Xi2,Pearson相關(guān)系數(shù)不為1,但Spearman和Kendall相關(guān)系數(shù)為1
例1:初三和高一成績的Pearson相關(guān)系數(shù),Kendallt相關(guān)系數(shù)和Spearman秩相關(guān)系數(shù)分別為0.795,0.595和0.758。這三個(gè)統(tǒng)計(jì)量的p-值均為0.000-小數(shù)點(diǎn)后前三位是0.(三個(gè)零假設(shè):均為不相關(guān))正相關(guān):初三成績較高的學(xué)生,高一成績也較高。SPSS的相關(guān)分析-兩個(gè)定量變量打開hischool.sav,選Analyze-Correlate-Bivariate,再把兩個(gè)變量j3和s1選入variables,選擇Pearson,Spearman和Kendall,再點(diǎn)擊OK
4.線性回歸分析用直線擬合二維空間的點(diǎn),常用最小二乘回歸,即尋找一條直線,使所有點(diǎn)到該直線的豎直距離的平方和最小兩個(gè)定量變量是否無關(guān)等價(jià)于假設(shè)檢驗(yàn)用t檢驗(yàn)進(jìn)行檢驗(yàn)。例中,要找初三成績(因變量)和高一成績(自變量)的回歸直線。
檢驗(yàn)零假設(shè):x的系數(shù)為0:t檢驗(yàn)統(tǒng)計(jì)量為9.089,而p-值為0.000,拒絕零假設(shè),兩個(gè)變量有關(guān)。除了檢驗(yàn)之外,還有度量擬合好壞的量,即自變量解釋因變量變化百分比的度量,叫做決定系數(shù)(coefficientofdetermination,也叫測定系數(shù)或可決系數(shù)),用“R-square”表示。例中,R-square=
4307.206/6810=0.632-自變量大約解釋63%的因變量的變化。R2越接近1,回歸就越成功。由于R2隨變量數(shù)目增加而增大,人們對(duì)其進(jìn)行修改;有一修正的R2(adjustedRsquare)。用F分布,檢驗(yàn)回歸擬合好壞的(零假設(shè)是因變量和自變量沒有關(guān)系)-方差分析表SPSS的回歸分析自變量和因變量都是定量變量時(shí)的線性回歸分析(hischool.sav)利用SPSS選項(xiàng):Analyze-Regression-Linear再把有關(guān)的自變量選入Independent,把因變量選入Dependent,然后OK即可。如果自變量有多個(gè)(多元回歸模型),只要都選入就行。最小二乘估計(jì):求使達(dá)最小.解下面方程得的最小二乘估計(jì):附1稱為處的殘查.稱為殘查平方和.可驗(yàn)證:;即為的無偏估計(jì).附2線性假設(shè)的顯著性檢驗(yàn)可以驗(yàn)證:其中附3又因獨(dú)立性,有:即在零假設(shè)成立下附4檢驗(yàn):拒絕域:系數(shù)的置信水平為的置信區(qū)間附5Pearson相關(guān)系數(shù)檢驗(yàn)兩變量的線性相關(guān)性從數(shù)據(jù)得到參數(shù)極大似然估計(jì)為將數(shù)據(jù)和H0:觀點(diǎn)和收入不相關(guān);H1:這兩個(gè)變量相關(guān)。:服從指數(shù)分布,:不服從指數(shù)分布近似地服從.25)=(120,90,240,150)用F分布,檢驗(yàn)回歸擬合好壞的(零假設(shè)是因變量和自變量沒有關(guān)系)-方差分析表用F分布,檢驗(yàn)回歸擬合好壞的(零假設(shè)是因變量和自變量沒有關(guān)系)-方差分析表:總體的概率密度為打開hischool.擬合檢驗(yàn)法數(shù)據(jù)落在區(qū)間[126,158],將它分為7個(gè)區(qū)間如果稱對(duì)子和Spearman秩相關(guān)系數(shù)和Kendall度量更加廣義的單調(diào)(不一定線性)的關(guān)系.;的置信水平為的置信區(qū)間為附6的置信水平為的置信區(qū)間為附7多個(gè)定量自變量的線性回歸分析如有k個(gè)(定量)自變量x1,x2…,xk,因變量y的線性回歸模型為這里b0,b1,…,b
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)業(yè)物聯(lián)網(wǎng)(IoT)行業(yè)相關(guān)項(xiàng)目經(jīng)營管理報(bào)告
- 紗線成條和梳理機(jī)項(xiàng)目營銷計(jì)劃書
- 為第三方提供會(huì)計(jì)服務(wù)行業(yè)營銷策略方案
- 醫(yī)用蓖麻油產(chǎn)業(yè)鏈招商引資的調(diào)研報(bào)告
- 生物識(shí)別鎖項(xiàng)目運(yùn)營指導(dǎo)方案
- 農(nóng)業(yè)作物病害化學(xué)防治行業(yè)經(jīng)營分析報(bào)告
- 草料混合機(jī)產(chǎn)品供應(yīng)鏈分析
- 健康技術(shù)智能藥盒行業(yè)相關(guān)項(xiàng)目經(jīng)營管理報(bào)告
- 自行車曲軸項(xiàng)目運(yùn)營指導(dǎo)方案
- 電信業(yè)用收款機(jī)市場發(fā)展前景分析及供需格局研究預(yù)測報(bào)告
- 老年護(hù)理??荚囶}+答案
- 期中考試卷(試題)-2024-2025學(xué)年三年級(jí)上冊(cè)數(shù)學(xué)人教版
- 2024-2030年中國特色小吃行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報(bào)告
- 華師版九年級(jí)數(shù)學(xué) 25.2 隨機(jī)事件的概率(學(xué)習(xí)、上課課件)
- 人教版生物八年級(jí)下冊(cè) 8.1.1傳染病及其預(yù)防-教案
- GB/T 23576-2024拋噴丸設(shè)備通用技術(shù)規(guī)范
- 部編版(2024)道德與法治一年級(jí)上冊(cè)第14課《人人愛護(hù)公物》教學(xué)課件
- 全國一等獎(jiǎng)人音版六年級(jí)音樂上冊(cè)《七色光之歌》課件
- 新能源發(fā)電項(xiàng)目投資合同三篇
- 河南省商丘市2023-2024學(xué)年八年級(jí)上學(xué)期11月期中考試英語試題
- 人工蘆葦清理施工方案
評(píng)論
0/150
提交評(píng)論