利用SAS進(jìn)行分層隨機(jī)抽樣_第1頁(yè)
利用SAS進(jìn)行分層隨機(jī)抽樣_第2頁(yè)
利用SAS進(jìn)行分層隨機(jī)抽樣_第3頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、利用SAS進(jìn)行分層隨機(jī)抽樣抽樣方法(Sampling Method)是按照一定程序,從所研究對(duì)象的全體(母體)中抽取一部份 (樣本)進(jìn)行調(diào)查或觀查,并在一定的條件下,運(yùn)用數(shù)理統(tǒng)計(jì)的原理和方法,對(duì)母體的數(shù) 量特征進(jìn)行估計(jì)和推斷。抽樣方法可分為隨機(jī)抽樣(亦稱為機(jī)率抽樣Probability Sampling)和非隨機(jī)抽樣(亦稱為非 機(jī)率抽樣Non-Probability Sampling)兩大類,這兩類的抽樣方法都被經(jīng)常地使用。隨機(jī) 抽樣是指按照機(jī)率原則,從母體中抽取一定數(shù)目的單位元作為樣本進(jìn)行觀察,隨機(jī)抽 樣使母體中每個(gè)單位都有一定的機(jī)率被選入樣本,從而使根據(jù)樣本所做出的結(jié)論對(duì)母 體具有充分的代

2、表性。非隨機(jī)抽樣則是以方便為出發(fā)點(diǎn)或根據(jù)研究者主觀的判斷來(lái)抽 取樣本。非隨機(jī)抽樣主要依賴研究者個(gè)人的經(jīng)驗(yàn)和判斷,它無(wú)法估計(jì)和控制抽樣誤差 (sampling error),亦無(wú)法用樣本的量化數(shù)據(jù)來(lái)推斷母體。在所有抽樣方法中,屬分層抽樣(Stratified Sampling)法所應(yīng)用的范圍最廣與最多。它是 先將母體所有單位按某些重要因素進(jìn)行分類(層),然后在各類(層)中采用簡(jiǎn)單隨機(jī)抽樣 (simple random sampling)或系統(tǒng)抽樣(system sampling)方式抽取樣本單位。分層抽樣比 簡(jiǎn)單隨機(jī)抽樣和系統(tǒng)抽樣更為精確,能夠通過(guò)對(duì)較少的抽樣單位的調(diào)查,得到比較準(zhǔn) 確的推斷結(jié)果

3、,特別是當(dāng)母體較大、內(nèi)部結(jié)構(gòu)復(fù)雜時(shí),分層抽樣常能取得令人滿意的 效果。同時(shí),分層抽樣在對(duì)母體推斷的同時(shí),還能獲得對(duì)每層的推論。分層抽樣的方式,一般有等比例抽樣與非等比例抽樣。等比例抽樣,要求各類樣本單 位數(shù)的分配比例與母體單位在各類的分配比例一致。等比例抽樣簡(jiǎn)便易行且分配比較 合理,在實(shí)際工作中應(yīng)用較廣。非等比例抽樣,不受上述條件限制,即有的層可多抽 些樣本單位,有的層也可少抽些樣本單位。非等比例抽樣大多適用于各層的單位數(shù)相 差懸殊,或?qū)觾?nèi)變異數(shù)相差較大的情形。在這種情況下,如按等比例抽樣,可能在母 體單位數(shù)少的層中抽取樣本單位數(shù)過(guò)少,代表性不足,則可適當(dāng)放寬多抽;同樣,層內(nèi) 變異觸較大的,也

4、可多抽些樣本單位。但是在實(shí)際運(yùn)作前要準(zhǔn)確了解各層標(biāo)志變異程 度大小是比較困難的??蓪⒈疚闹心阁w視為一個(gè)龐大的數(shù)據(jù)庫(kù),而所做的抽樣工作即是在這數(shù)據(jù)庫(kù)中抽取具 有代表性的樣本點(diǎn)。在設(shè)計(jì)抽樣方法的過(guò)程中,最具有關(guān)鍵性的角色即是選擇何種抽樣方法。抽樣設(shè)計(jì)的 方法有很多種,一般較常用的就屬分層隨機(jī)抽樣法。另方面,在統(tǒng)計(jì)推論時(shí),即是由 樣本數(shù)據(jù)對(duì)母體進(jìn)行推估,如何找出抽樣比亦是一個(gè)相當(dāng)重要的課題。下面介紹如何運(yùn)用SAS宏指令及一些函數(shù)來(lái)建構(gòu)抽樣程序與決定系數(shù)的使用方法。SAS Macro 程序A.仿真產(chǎn)生1000筆數(shù)據(jù)DATA _NULL_;RETAIN SEED 83624;DO I=1 TO 1000

5、;SERIAL=I; /* SERIAL 一連續(xù)號(hào)(KEY)*/LAYER=CEIL(8*RANUNI(SEED); /* LAYER 一層別 */VOLUME=CEIL(100*RANUNI(SEED); /* VOLUME 一數(shù)量值 */ FILE INMAST;PUT 1 SERIAL Z4. 8 LAYER 1. 11 VOLUME 3.;END;讀入字段素描檔= 產(chǎn)生SAS字段格式檔DATA _NULL_;INFILE INFIELD;INPUT FIELD $7-12 F 4-5 S 13-17 TYPE $6;IF TYPE=9 THEN KK=FIELD|COMPRESS(F)

6、|”.”;ELSE KK=FIELD| contentquot;|COMPRESS(F)|.;FILE SASFORM;PUT KK 1-20;【字段素描檔(INFIELD)】【字段格式檔(SASFORM)】111-00104XSERIAL0001 SERIAL $4.00203XFILLER0005 FILLER $3.003019LAYER 0008 LAYER 1.00402XFILLER0009 FILLER $2.005039VOLUME0011 VOLUME 3.00607XFILLER0014 FILLER $7.利用字段格式文件=讀入仿真產(chǎn)生的資料DATA WKMAST(DRO

7、P=FILLER);INFILE INMAST;INPUT %INCLUDE SASFORM;利用%INCLUDE指令,可將資料依原先建好的SASFORM的格式讀入。各層抽出比率控制卡DATA SAMPLE;INPUT LAYER PERCENT ;CARDS;1 7 2 7 3 7 4 7 5 7 6 7 7 7 8 7;各層別抽出樣本的比率可由此卡加以控制,各變量項(xiàng)代表意義一LAYER(層別)、 PERCENT(百 分比;%)。分層比率隨機(jī)抽樣宏DATA SAMPS(KEEP=&LAYER SAMPS RAN);SET NOUT ; RETAIN NSAMP 1 ;ARRAY RA500

8、RAN1-RAN500 ; /*存放已抽出之隨機(jī)變量*/IF MARK=1 THEN /* 全查層抽樣 */DO J=1 TO SAMPS; RAN=J ; OUTPUT ; END ;ELSE DO ;/*抽查層抽樣(隨機(jī)抽樣)*/DO UNTIL(NSAMP=SAMPS+1 NSAMP=_FREQ_+1);RAN=CEIL(_FREQ_*RANUNI(1994);IF NSAMP1 THENDO J=1 TO NSAMP-1 ;IF RAN=RAJ THEN GOTO NEXT; /*判斷所抽隨機(jī)數(shù)是否重復(fù)*/END ;OUTPUT ; RANSAMP=RAN ; NSAMP=NSAMP+1 ;NEXT:END;NSAMP=1 ;END ;利用宏傳呼參數(shù)%TEST(WKMAST,LAY

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論