實驗5抽樣估計的SPSS應用_第1頁
實驗5抽樣估計的SPSS應用_第2頁
實驗5抽樣估計的SPSS應用_第3頁
實驗5抽樣估計的SPSS應用_第4頁
實驗5抽樣估計的SPSS應用_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、實驗5 抽樣估計的SPSS應用5.1實驗目的 根據隨機抽樣資料,掌握對總體指標做出具有一定可靠性的估計或推斷的SPSS實驗,并對實驗結果做出解釋。5.2相關知識5.2.1. 抽樣方法:重復抽樣和不重復抽樣。SPSS軟件中所采用的抽樣方法為不重復抽樣,本實驗采用不重復抽樣方法。5.2.2. 抽樣組織:按照抽取樣本單位時是否遵循隨機原則,抽樣技術可以分為概率抽樣和非概率抽樣。其中,概率抽樣又稱為隨機抽樣,即按照隨機原則抽取樣本。隨機抽樣的組織形式有:簡單隨機抽樣、類型抽樣、等距抽樣、整群抽樣等,本實驗采用簡單隨機抽樣形式。抽樣估計方法:點估計和區(qū)間估計1. 點估計:用樣本統(tǒng)計量的值直接作為總體參數

2、的估計值。如用樣本均值直接作為總體均值的估計值,用樣本比率(或成數)直接作為總體比率(或成數)的估計值,用樣本方差直接作為總體方差的估計值等。常用的點估計方法包括:(1)矩估計法;(2)極大似然估計法(3)穩(wěn)健估計法,本文采用矩估計法。2. 區(qū)間估計:是在點估計的基礎上,給出總體參數估計的一個范圍,所以區(qū)間估計相對于點估計更加精確,要優(yōu)于點估計。5.3 實驗內容建立SPSS數據文件 利用SPSS軟件抽取隨機樣本,抽樣比率為30%。運用SPSS軟件,對總體均值進行點估計和區(qū)間估計。5.3.4運用SPSS軟件,對各個班級成績的均值進行點估計和區(qū)間估計 運用SPSS軟件,對總體比率(成數)進行點估計

3、和區(qū)間估計。 撰寫實驗報告。5.4 實驗要求5.4.1準備實驗數據2009級財管專業(yè)111名學生的概率論課程成績,見“表5-1 2009級財管學生概率課成績.xls” 。5.4.2 完成實驗任務,對實驗結果做出簡要分析。1依據樣本學生的概率論成績,采用點估計和區(qū)間估計的方法,推斷學生總體概率論課程的平均成績,置信水平為90%。2依據樣本信息,推斷該課程成績80分及以上的學生比率,置信水平為90%。3分析實驗結果,提交實驗報告。5.5實驗步驟 建立SPSS數據文件通過SPSS軟件打開Excel表,即表“5-1 2009級財管學生概率成績.xls”。第一步:選擇菜單“文件打開數據”,彈出如圖5-1

4、所示的“打開數據”對話框。 圖5-1 “打開數據”對話框在“文件類型(T):”中選擇“Excel”,在“查找范圍(L):”中找到要讀取的Excel文件“5-1 2009級財管學生概率成績.xls”單擊【打開】按鈕第二步:在打開的SPSS數據編輯窗口的變量視圖下定義變量的類型單擊工具欄的“保存”,在彈出的“將數據保存為”對話框(如圖5-2)中,在“查找范圍(L):”中找到要保存文件的位置,在“文件名(N):”中輸入要保存的文件名“5-1成績”,單擊【保存】按鈕,至此完成SPSS數據文件“表5-1,2009財管1-4班概率成績.sav ”的建立與保存。圖5-2 “將數據保存為”對話框抽取隨機樣本用

5、簡單隨機不重復抽樣方法抽樣,抽樣比例為30%。SPSS的隨機抽樣抽取的方式有兩種:其一,近似抽樣:即用戶給出一個百分比數值,SPSS將按照這個比例自動從數據編輯窗口中隨機抽取相應百分比數目的個案,抽取的個案數不一定精確地等于用戶指定的百分比,會有小的偏差,但這種偏差不會對數據分析產生重要影響。其二,精確抽樣:要求用戶給出兩個參數,第一個參數是希望選取的個案數,第二個參數是指定在前幾個個案中選取。本實驗在這里選擇“近似抽樣”的方式抽取隨機樣本。第一步:打開數據文件“表5-1,2009財管1-4班概率成績.sav ”,在菜單選擇“數據”“選擇個案”,得到“選擇個案”對話框選擇【隨機個案樣本】按鈕,

6、如圖5-3。圖5-3 “選擇個案”對話框第二步:在“選擇個案”對話框中,單擊【樣本(S)】按鈕,得到“選擇個案:隨機樣本”對話框選擇【大約(A)】選項,輸入數字“30”點擊繼續(xù)按鈕,如圖5-4。圖5-4 選擇個案:隨機樣本對話框第三步:在“選擇個案”對話框中,在“輸出”框中選擇【將選定個案復制到新數據集(O)】按鈕在“數據集名稱(S):”后面的框內輸入文件名字“樣本”點擊【確定】按鈕,如圖5-5。圖5-5 “選擇個案”對話框此時將得到新生成的樣本數據文件,將此文件進行保存到指定的位置,且命名為“樣本.sav”。綜上,通過采用近似隨機抽樣方法,從111名學生中抽樣30%的學生作為樣本,得到SPS

7、S樣本數據文件,即“2009級財管學生概率成績樣本數據文件.sav ”,樣本容量為42。對總體均值進行點估計和區(qū)間估計第一步:打開SPSS樣本數據文件“2009級財管學生概率成績樣本數據文件.sav”,依次選擇【分析】【描述統(tǒng)計】【探索】按鈕,得到“探索”對話框。將“成績”選入“因變量列表”框內,在“輸出”框內選擇“統(tǒng)計量”選項,如圖5-6。圖5-6 “探索”對話框第二步:單擊【統(tǒng)計量】按鈕,選擇“描述性”選項,在“均值的置信區(qū)間(C):”框內輸入“90”,單擊【繼續(xù)】按鈕,如圖5-7。(注意:如果只進行點估計,不需要給出置信度,因此就不需要此步驟了)圖5-7 探索:統(tǒng)計量對話框第三步:再返回

8、到“探索”對話框中,如圖5-8。圖5-8 “探索”對話框第四步:單擊【確定】按鈕,系統(tǒng)輸出結果如表5-1。表5-1 點估計及區(qū)間估計結果統(tǒng)計量標準誤成績均值85.78571.85776均值的 90% 置信區(qū)間下限82.6593上限88.91215% 修整均值86.4471中值88.0000方差144.953標準差12.03964極小值60.00極大值100.00范圍40.00四分位距18.75偏度-.766.365峰度-.603.717從表5-1可以看出,樣本均值為85.7857,根據統(tǒng)計學原理,在合理估計的假設前提下,點估計是把樣本均值或是成數直接作為總體的均值或是成數。因此,以上計算的樣本

9、均值85.7857分可以作為總體均值的估計值,即估計的111名學生的概率論課程成績?yōu)?5.7857分;在90%的置信度下,對2009級111名財管專業(yè)學生的概率論課程平均成績進行區(qū)間估計,其區(qū)間范圍在82.6593,88.9121之間。對各個班級成績的均值進行點估計和區(qū)間估計如果按某一標志分組(如以班級為標志分組)的各班進行參數估計,這為各個班級之間的比較提供了方便。平均成績的區(qū)間估計實現有“頻率”、“描述”、 “探索”、“均值”等過程,學生自行練習“描述”過程的操作方法(“描述”過程的操作路徑為:“分析”“描述統(tǒng)計”“描述”)。(注意:在“頻率”、“描述”實現方法中只能對總體進行估計,不能一

10、步實現對各班進行估計,“探索”則可以一步實現各班的估計。)這里主要介紹“均值”過程的實現方法。第一步:打開樣本數據文件“2009級財管學生概率成績樣本數據文件.sav”,”,依次選擇“分析”“比較均值”“均值”,得到“均值”對話框。圖5-9 “均值”對話框將“成績”選入“因變量列表(D):”框內將“班級”選入“自變量列表”框內,如圖5-10。圖5-10 “均值”對話框第二步:單擊【選項(O)】按鈕,得到“均值:選項”對話框,圖5-11 “均值:選項”對話框在“統(tǒng)計量(S):”框中,將“均值、方差、標準差”選入到“單元格統(tǒng)計量(C):”框中單擊【繼續(xù)】按鈕。圖5-12 “均值:選項”對話框第三步

11、:在“均值”對話框中,單擊【Bootstrap(B)】按鈕,得到“Bootstrap”對話框,圖5-13 “Bootstrap”對話框在“Bootstrap”對話框中,選擇“執(zhí)行bootstrap”在“樣本數(N):”框中輸入“42”在“置信區(qū)間”中的“水平(%)(D):”框中輸入“90”在“抽樣”框內選定“分層(T)”選項,在“變量(V):”中將變量“班級”移入到右邊的“分層變量(R):”框中單擊【繼續(xù)】按鈕(說明:本次樣本容量為42,置信水平為90%)圖5-14 “Bootstrap”對話框第四步:再返回到“均值:選項”對話框中,單擊【確定】按鈕,輸出結果見表5-2。表5-2 2009級財

12、管各班平均成績的區(qū)間估計班級StatisticBootstrapa偏差標準 誤差90% 置信區(qū)間下限上限財管1班均值93.7692.2418.927592.488095.7162方差12.859-2.2614.1713.76018.287標準差3.58594-.39354.645351.936574.27564財管2班均值90.1111-.49742.103585.375392.6667方差47.361-5.32316.64816.99971.936標準差6.88194-.534401.337794.122448.48145財管3班均值76.9091-.57362.503271.068781.

13、2197方差111.891-3.38441.14831.086181.759標準差10.57785-.367802.089555.5551013.48158財管4班均值80.7778.14295.032071.179689.5364方差275.194-19.96875.195101.606380.556標準差16.58899-.801432.4748710.0560619.50748總計均值85.7857-.15141.344683.284088.1233方差144.9532.89124.496100.810204.888標準差12.03964.078701.0070710.0399814.3

14、1331a. Unless otherwise noted, bootstrap results are based on 42 stratified bootstrap samples由表5-2可以看出:(1)選取容量為42的樣本,以90%的置信水平下,對2009級111名財管專業(yè)學生的概率論課程平均成績進行區(qū)間估計,其區(qū)間范圍為83.2840,88.1233;(2)還可以看出對各個班級的概率論課程平均成績的區(qū)間估計結果:財管1班平均成績的區(qū)間范圍為92.4880,95.7162,財管2班平均成績的區(qū)間范圍為85.3753,92.6667,財管3班平均成績的區(qū)間范圍為71.0687,81.2

15、197,財管4班平均成績的區(qū)間范圍為71.1796,89.5364??梢姡陨蠈嶒炦^程不僅給出了總體的參數估計結果,同時還給出了按某一變量分組(如以班級為變量分組)的各班參數估計值,這為各個班級之間成績的比較提供了方便。對總體比率(成數)進行點估計和區(qū)間估計(該估計由學生自己完成)估計總體比率(成數),需要對成績分組,其方法有兩種:“可視離散化” 和“重新編碼”過程進行組距式分組。在此以“可視離散化”方法為例,說明總體比率(成數)的估計過程。1. 用“可視離散化”方法對成績分組,說明總體比率(成數)的估計過程。Step:打開樣本數據文件“2009級財管學生概率成績的SPSS樣本數據文件.sav

16、”。 在SPSS界面的數據編輯菜單中,選擇【轉換(T)】【可視離散化(B)】,進入“可視化封裝”變量選擇(對話框略)。Step:選擇“成績”變量進入“要離散的變量(B)”框中 (對話框略)單擊【繼續(xù)】按鈕,進入到“可視化封裝”分割點設置對話框(對話框略)。Step:給分組后的變量命名。在“可視化封裝”分割點設置對話框中,在分割點設置對話框的“離散的變量(B):”兩個框后,分別輸入 “成績分組(或成績分段)”和“成績(離散化)”作為離散化變量的名稱和標簽。在右下方處“上端點”點擊“排除(E)( < )”(對話框略)。Step:設置分割點。直接點擊分割點設置對話框右下方的【生成分割點(M)】

17、按鈕,得到“生成分割點”對話框(窗口略)在“生成分割點”對話框中,在“等寬度間隔(E)”下的“第一個分割點的位置(F)”后的框中輸入80,在“分隔點數量(N)” 后的框中輸入1,在“寬度(W)” 后的框中輸入20,單擊【應】按鈕(對話框略)。Step:生成分組標簽。在分割點設置對話框的“網絡(G)”區(qū)域的“值(V)”第一列輸如分割點值80,在“標簽”第一列輸入值“0”;在“值(V)”第二列“HIGH”位置處輸如分割點值80,在“標簽”第二列輸入值“1”。單擊“可視化封裝”對話框中右下方的【生成標簽(A)】按鈕,系統(tǒng)自動生成分組標簽。(對話框略)。Step:單擊【確定】按鈕,彈出圖5-15 的對

18、話框,單擊【確定】按鈕,即可在數據文件中生成新變量“成績分組”。圖5-15 對話框Step:回到數據編輯界面,在數據編輯菜單中點擊菜單“分析(A)”描述統(tǒng)計頻率(F)(對話框略)將“成績(已離散化)【成績”選進“變量(V)”框中,見圖5-16所示。圖5-16 對話框點擊Bootstrap(B)” 彈出 Bootstarp對話框(對話框略)。 在“Bootstrap”對話框中,選擇“執(zhí)行bootstrap”在“樣本數(N):”框中輸入“42”在“置信區(qū)間”中的“水平(%)(D):”框中輸入“90”在“抽樣”框內選定“簡單(M)”選項,單擊【繼續(xù)】按鈕(說明:本次樣本容量為42,置信水平為90%)

19、。Step:再返回到數據編輯界面,在數據編輯菜單中點擊菜單“分析(A)”描述統(tǒng)計頻率(F)(窗口略)將“成績(已離散化)【成績”選進“變量(V)”框中(對話框略)單擊【確定】按鈕,系統(tǒng)輸出結果,見表5-3。表5-3 2009級財管專業(yè)學生概率成績80分及其以上人數比重頻率百分比有效百分比累積百分比百分比 Bootstrapa偏差標準 誤差90% 置信區(qū)間下限上限有效01126.226.226.2-.26.316.737.713173.873.8100.0.26.362.383.3合計42100.0100.0.0.0100.0100.0a. Unless otherwise noted, boo

20、tstrap results are based on 42 stratified bootstrap samples表5-3結果顯示:(1)選取容量為42的樣本,樣本比率0.74可以作為總體比率的估計值,即估計的111名學生概率論課程成績80分及以上的人數比率為0.738(73.8%);(2)選取容量為42的樣本,以90%的置信水平,對2009級111名財管專業(yè)學生的概率論課程成績80分及以上的人數比率進行區(qū)間估計,其區(qū)間范圍為0.623,0.833或62.3%,83.3%。2. 用“重新編碼為不同變量”方法對成績分組,說明總體比率(成數)的估計過程。對總體成績80分及以上的學生比率的區(qū)間估

21、計,其過程與平均成績區(qū)間估計一致。但在區(qū)間估計之前需要在數據文件“樣本.sav”中增加一個新變量“是否80分及以上”(做法:依次選擇菜單“轉換”“重新編碼為不同變量”,在此按照組距式分組的方法操作然后在數據編輯窗口的變量視圖下定義值標簽,“是”為“1”,“否”為“0”將此文件進行另存,并命名為“樣本比率.sav”即可)。這里不再詳細介紹操作步驟,估計的結果見表5-4。表5-4 2009級財管各班80分及以上成績比率區(qū)間估計班級StatisticBootstrapa偏差標準 誤差90% 置信區(qū)間下限上限財管1班均值1.00.00.001.001.00N13001313標準差.000.000.00

22、0.000.000財管2班均值.89.00.10.671.00N90099標準差.333-.076.191.000.500財管3班均值.45.02.16.18.80N11001111標準差.522-.027.038.405.522財管4班均值.56.06.15.33.87N90099標準差.527-.038.046.352.527總計均值.74.02.07.65.86N42004242標準差.445-.016.039.354.484a. Unless otherwise noted, bootstrap results are based on 42 stratified bootstrap samples表5-4結果顯示:(1)選取容量為42的樣本,樣本比率0.74

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論