對一個變數(shù)求出其平均數(shù)及標準差之后_第1頁
對一個變數(shù)求出其平均數(shù)及標準差之后_第2頁
對一個變數(shù)求出其平均數(shù)及標準差之后_第3頁
對一個變數(shù)求出其平均數(shù)及標準差之后_第4頁
對一個變數(shù)求出其平均數(shù)及標準差之后_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、.:.;對一個變數(shù)求出其平均數(shù)及標準差之後,我們知道它的平均數(shù)落在一定的區(qū)間以內(nèi),但是我們還想知道它能否有一些特別的假設(shè)可以驗證,例如這個變數(shù)的平均數(shù)能否有能夠等於某個值,例如0。透過統(tǒng)計方法,我們可以對等距尺度的變數(shù)做以上的檢定。但是對於類別資料,我們比較關(guān)心它能否呈現(xiàn)隨機分布。1. 先看看等距或等比資料的分布。我們選擇a9dn有幾個小孩做為變數(shù),然後看其能否為常態(tài)分布。記得先將99轉(zhuǎn)為遺漏值。統(tǒng)計圖直方圖,選顯示常態(tài)曲線很明顯的小孩子的數(shù)目集中在2個及4個,6個以上非常少。假設(shè)這個樣本來自於常態(tài)分配,而平均數(shù)為2.9,標準差為1.48的情況下,我們可以說95%的觀察值落在2.9-1.96*

2、0.039, 2.9+1.96*0.039之間,也是2.81, 2.976之間。而我們還可以進一步檢驗,能否2.9這個平均值,假設(shè)多做幾次抽樣之後,依然確實是等於0。此處用的是單一樣本T檢定。顧名思義,t檢定指的是用t分布來看我們所要檢定的值能否會落在一定的區(qū)域內(nèi)。假設(shè)是會的話,那麼我們不拒絕虛無假設(shè),即平均值等於0這個假設(shè)。假設(shè)不會的話,那麼我們可以拒絕這個虛無假設(shè),也就是平均值能夠不會等於0。常態(tài)分布跟t分布的不一樣地方是t分布適用於小樣本,假設(shè)觀察值小於60的時候。當觀察值大於60時,我們還是可以用t分布,但是得到的檢定事實上與常態(tài)分布無異。參考網(wǎng)頁上附的常態(tài)分布與t分布的對應(yīng)機率與值。

3、在單一樣本檢定時,求t值的公式為,k是我們要檢定的值。在95%自信心水準下,求平均值的上下區(qū)間公式為:(X-k)-tb , (X-k)+ tb 。tb是t值在/2而且自在度為n-1時候的值,也就是所謂的臨界點。是標準誤,也就是standard error of mean,簡寫為SE,也就是平均值的分布情形。而標準誤代表的就是平均值所在的範圍。以這個例子來說,k為0,平均值為2.89,而標準誤為1.477,個數(shù)為1419,因此自在度等於1418,代入公式及查表自在度大於120且信賴區(qū)間為95%時,t的臨界值為1.96後得2.81, 2.976。2.89落在這個區(qū)間之間,而且這個區(qū)間包含了95%的

4、信賴區(qū)間,也就是說抽無數(shù)次後,95%所得的平均值將落在這個區(qū)間內(nèi),因此等於0的機會是非常小,所以我們拒絕我們的虛無假設(shè)?;蛘呤钦f,求出t值為73.603,而這個值遠大於我們的t檢定值1.96,因此可以拒絕等於0這個虛無假設(shè)。分析比較平均數(shù)法單一樣本T檢定試著檢定平均值等於3或10的假設(shè),也可以發(fā)現(xiàn)會遭到拒絕。但是假設(shè)設(shè)定平均值等於2.85,則將無法拒絕,表示樣本平均值跟這個值相差不多,有能夠在這個區(qū)間內(nèi)。0對我們特別重要,因為假設(shè)平均值能夠等於0,那麼我們要考慮能否測到的其實是不存在的。這裡用t分布是因為t分布近似常態(tài)分布,而且適用於小樣本。t 分布的臨界值比z分布來得大,因為t分布比較扁平,

5、也因此檢定時比較不容易拒斥其假設(shè)。2. 接下來我們可以檢證能否兩組觀察值在某一個變數(shù)上能否有一樣的平均值,也就是檢驗?zāi)芊駜扇喝擞性谀骋蛔償?shù)上有一樣的特徵。這樣做的好處是觀察能否不同的人有不同的平均值;假設(shè)不同的話,那麼意味著各有各的特征,即兩群人並不一樣,違反了樣本彼此相互是獨立的假設(shè)。假設(shè)一樣的話,意味兩群人是來自一樣的母體。虛無假設(shè)是兩者是有著一樣的平均數(shù),也就是平均數(shù)的差異等於0,而拒斥的假設(shè)即是差異不等於0。我們用c4e配偶的工時來看受訪的a1性別能否獨立。虛無假設(shè)是兩者獨立,即平均數(shù)一樣。先把配偶工時高於90的轉(zhuǎn)換為遺漏值。分析比較平均數(shù)法獨立樣本T檢定。選性別填入分組變數(shù),並且按定

6、義組別,填入性別的類別1與2。從下表可以看到,顯著性均大於0.05,所以不拒絕虛無假設(shè),也就是說這兩個分組中的樣本應(yīng)該是一致的,或者是這兩組樣本的樣本沒有差異。以男女這兩個組來說,樣本數(shù)為915,而自在度為913。另外平均數(shù)的差距為46.14 - 47.21 = 1.07。由於我們假設(shè)男女來自不同的母體,而且假設(shè)兩組人的變異數(shù)相等,所以可以用集合變異數(shù)估計找出兩個母體的共同標準差。算法為 = = 200.197。而計算t值的公式為 = = -1.05。根據(jù)自在度及95%信賴水準,t分布給的檢定值至少在 -1.96,也就是說 -1.05並未通過檢定,因此我們必須接受假設(shè),即兩者兩平均數(shù)來自同一母

7、體。同時我們可以找出在信賴水準為95%的條件下,這兩個平均差差異的區(qū)間為-1.07 -1.96*1.014, -1.07 + 1.96*1.014,也就是-3.05, 0.91。假設(shè)我們假設(shè)兩個組的變異數(shù)不相等,我們計算平均值差異的標準差如下:。而t值則是: = -1.086。這裡的F檢定指的是應(yīng)用F分布所做的檢定,是用one-way ANOVA所得到的檢定值,比較不依賴樣本成常態(tài)分配的假設(shè)。表中的F檢定值為0.590,顯著性也就不到0.05。假設(shè)是要檢查能否變異數(shù)相等,可用簡單分布圖來看每組對應(yīng)的樣本。GRAPH /SCATTERPLOT(BIVAR)=a1 WITH c4e /MISSIN

8、G=LISTWISE .3. 有時候我們想比較同一群人前後兩個時間點的某個變數(shù)平均值,或是有時候我們給兩群人同一個刺激,想要知道這兩個刺激的結(jié)果能否一樣。這種類似實驗的研討,可以運用成對樣本T檢定來檢驗?zāi)芊駜蓚€平均值一樣。事實上這種檢驗類似上面的獨立樣本檢定,只是沒有分組變數(shù),而是兩個連續(xù)性資料的態(tài)度變數(shù)。分析比較平均數(shù)法成對樣本T檢定選g38a一星期花多少時間做家事及g38b配偶花多少時間做家事這裡是將兩個比對的變數(shù)值相減之後,求出標準差及標準誤,然後就可以得到t值了??梢钥吹絫值為 -0.906,顯著性達0.365,因此不拒絕虛無假設(shè),也就是平均數(shù)相等。以上的檢定也可應(yīng)用在百分比資料。比如

9、說在一組患者120名之中,男生佔了39.2%,女生佔了 60.8%。而在另一組患者中640名,男生佔了43.3%,女生則是56.7%。這兩組之間的差異會不會是偶爾發(fā)生的?或是說,這兩組的差異能否達到顯著水準?可以計算標準誤如下:SE = = = 4.87計算兩者差異的標準誤要先計算全部人之中某一群人的發(fā)生機率。以女性而言,在120人那一組的數(shù)目是73人,而640人那一組則是363人,合計是436人,佔了全部兩組人之57.4%。SE(diff%) = = = 4.92因為兩組的差距為4.1%,而SE為4.92,兩者相除得0.83。應(yīng)用Z分布,可得到p值約0.4,也就是不拒斥兩者相等的假設(shè),也就是

10、這個差距能夠是偶爾發(fā)生的,在95%的信賴水準下。取材自httpbmj.bmjjournals/collections/statsbk4. 接下來我們處理類別資料。類別資料主要是檢驗?zāi)芊駷殡S機分布。應(yīng)用上次上課所運用的求卡方值公式,或是無母數(shù)檢定,都可以得到檢定。分析無母數(shù)檢定卡方檢定,選全部類別相等。我們用A1性別來檢驗我們的受訪者的性別能否為隨機分布??ǚ綑z定幫我們檢驗虛無假設(shè):各個類別為隨機分布。在求出一個卡方值後,對比卡方表的檢定值,便可以決定能否接受或是拒斥這個虛無假設(shè)。計算出來的卡方值為0.424。在自在度為1的情況下,95%信賴水準的檢定值為3.841,所以我們必須接受這個虛無假設(shè)

11、,也就是受訪者性別是隨機的。殘差就是期望值減觀察值,而殘差除以期望值的平方和就是卡方值??ǚ椒峙渲校栽诙仁莐-1,k是格子數(shù)。在自在度為1,且顯著水準為0.05情況下,至少要有3.841才干否認假設(shè),因此在這裡我們接受性別成隨機分布的假設(shè)。5. 要檢驗類別資料能否為獨立或者是跟其他變數(shù)相關(guān),可以用交叉列表來表示。交叉列表分析將幫我們計算卡方值,然後比較卡方表的檢定值。假設(shè)卡方值小於檢定值,我們不可以拒絕虛無假設(shè),也就是兩個變數(shù)的分布是一樣的,也就是沒有相關(guān)。假設(shè)卡方值大於檢定值,我們可以拒絕虛無假設(shè),也就是兩者分布有相關(guān)。分析描畫統(tǒng)計交叉表。按統(tǒng)計量,選取卡方統(tǒng)計量按格式,並選取橫列及觀察值回到前面的畫面,選取性別為列,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論