下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二章 統(tǒng)計(jì)2.1.12.1.1 簡(jiǎn)單隨機(jī)抽樣1 1總體和樣本總體:在統(tǒng)計(jì)學(xué)中,把研究對(duì)象的全體叫做總體.個(gè)體:把每個(gè)研究對(duì)象叫做個(gè)體.總體容量:把總體中個(gè)體的總數(shù)叫做總體容量.為了研究總體的有關(guān)性質(zhì),一般從總體中隨機(jī)抽取一部分:心,,入研究,我們稱它為樣本其中個(gè)體的個(gè)數(shù)稱為樣本容量。2 2簡(jiǎn)單隨機(jī)抽樣,也叫純隨機(jī)抽樣。就是從總體中不加任何分組、劃類、排隊(duì)等,完全隨機(jī)地抽取調(diào)查單位。特點(diǎn):每個(gè)樣本單位被抽中的可能性相同(概率相等),樣本的每個(gè)單位完全獨(dú)立,彼此間無(wú)一定的關(guān)聯(lián)性和排斥性。簡(jiǎn)單隨機(jī)抽樣是其它各種抽樣形式的基礎(chǔ)。 通常只是在總體單位之間 差異程度較小 和數(shù)目較少時(shí),才采用這種方法。3
2、 3簡(jiǎn)單隨機(jī)抽樣常用的方法:(1 1)抽簽法;隨機(jī)數(shù)表法;計(jì)算機(jī)模擬法;使用統(tǒng)計(jì)軟件直接抽取。在簡(jiǎn)單隨機(jī)抽樣的樣本容量設(shè)計(jì)中,主要考慮:總體變異情況; 允許誤差范圍;概率保證程度。4 4 .抽簽法:(1 1) 給調(diào)查對(duì)象群體中的每一個(gè)對(duì)象編號(hào);(2 2) 準(zhǔn)備抽簽的工具,實(shí)施抽簽(3 3) 對(duì)樣本中的每一個(gè)個(gè)體進(jìn)行測(cè)量或調(diào)查例:請(qǐng)調(diào)查你所在的學(xué)校的學(xué)生做喜歡的體育活動(dòng)情況。5 5.隨機(jī)數(shù)表法:例:利用隨機(jī)數(shù)表在所在的班級(jí)中抽取1010 位同學(xué)參加某項(xiàng)活動(dòng)。2.1.22.1.2 系統(tǒng)抽樣1 1 .系統(tǒng)抽樣(等距抽樣或機(jī)械抽樣):把總體的單位進(jìn)行排序,再計(jì)算出抽樣距離,然后按照這一固定的抽樣距離抽
3、取樣本。第一個(gè)樣本采用簡(jiǎn)單隨機(jī)抽樣的辦法抽取。K K (抽樣距離)=N=N (總體規(guī)模)/n/n (樣本規(guī)模)前提條件:總體中個(gè)體的排列對(duì)于研究的變量來(lái)說(shuō),應(yīng)是隨機(jī)的,即不存在某種與研究 變量相關(guān)的規(guī)則分布??梢栽谡{(diào)查允許的條件下,從不同的樣本開(kāi)始抽樣,對(duì)比幾次樣本的 特點(diǎn)。 如果有明顯差別, 說(shuō)明樣本在總體中的分布承某種循環(huán)性規(guī)律, 且這種循環(huán)和抽樣距 離重合。2 2系統(tǒng)抽樣, 即等距抽樣是實(shí)際中最為常用的抽樣方法之一。因?yàn)樗鼘?duì)抽樣框的要求較低,實(shí)施也比較簡(jiǎn)單。 更為重要的是, 如果有某種與調(diào)查指標(biāo)相關(guān)的輔助變量可供使用, 總體單 元按輔助變量的大小順序排隊(duì)的話,使用系統(tǒng)抽樣可以大大提高估計(jì)
4、精度。2.1.32.1.3 分層抽樣1 1分層抽樣(類型抽樣) :先將總體中的所有單位按照某種特征或標(biāo)志(性別、 年齡等) 劃分成若干類型或?qū)哟危缓笤僭诟鱾€(gè)類型或?qū)哟沃胁捎煤?jiǎn)單隨機(jī)抽樣或系用抽樣的辦法抽取一個(gè)子樣本, 最后, 將 這些子樣本合起來(lái)構(gòu)成總體的樣本。兩種方法:1 1先以分層變量將總體劃分為若干層,再按照各層在總體中的比例從各層中抽取。 2 2先以分層變量將總體劃分為若干層,再將各層中的元素按分層的順序整齊排列,最 后用系統(tǒng)抽樣的方法抽取樣本。2 2分層抽樣是把異質(zhì)性較強(qiáng)的總體分成一個(gè)個(gè)同質(zhì)性較強(qiáng)的子總體,再抽取不同的子總體 中的樣本分別代表該子總體,所有的樣本進(jìn)而代表總體。分層標(biāo)
5、準(zhǔn):(1 1)以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層的標(biāo)準(zhǔn)。(2 2)以保證各層內(nèi)部同質(zhì)性強(qiáng)、各層之間異質(zhì)性強(qiáng)、突出總體內(nèi)在結(jié)構(gòu)的變量作為分 層變量。(3 3)以那些有明顯分層區(qū)分的變量作為分層變量。3 3分層的比例問(wèn)題:( 1 1)按比例分層抽樣:根據(jù)各種類型或?qū)哟沃械膯挝粩?shù)目占總體單位數(shù)目的比重來(lái)抽取 子樣本的方法。( 2 2)不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會(huì)非常少,此時(shí)采 用該方法, 主要是便于對(duì)不同層次的子總體進(jìn)行專門研究或進(jìn)行相互比較。 如果要用樣本資 料推斷總體時(shí), 則需要先對(duì)各層的數(shù)據(jù)資料進(jìn)行加權(quán)處理, 調(diào)整樣本中各層的比例, 使數(shù)據(jù) 恢復(fù)到
6、總體中各層實(shí)際的比例結(jié)構(gòu)。三種抽樣方法的比較類另 U U共同點(diǎn)各自特點(diǎn)聯(lián)系適用范圍簡(jiǎn)單隨機(jī)抽樣(1 1)抽樣過(guò)程中每個(gè)個(gè)體被抽到的可 能性相等(2 2)每次抽出個(gè)體后不再將它放回,即 不放回抽樣從總體中逐個(gè)抽取總體個(gè)數(shù)較少將總體均分成幾部 分,按預(yù)先制定的規(guī)則 在各部分抽取在起始部分 樣時(shí)采用簡(jiǎn)隨機(jī)抽樣總體個(gè)數(shù)較多系統(tǒng)抽樣將總體分成幾層,分層進(jìn)行抽取分層抽樣時(shí)采用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣總體由 差異明 顯的幾 部分組成分層抽樣2.2.1 頻率分布直方圖與莖葉圖1、我們把樣本抽取后,要對(duì)樣本進(jìn)行分析來(lái)研究總體的分布情況,對(duì)樣本進(jìn)行分析常采取兩種方式:列頻率分布表;頻率分布直方圖.頻率分布 是指一個(gè)
7、樣本數(shù)據(jù)在各個(gè)小范圍內(nèi)所占比例的大小。一般用頻率分布直方圖反映樣本的頻率分布。畫(huà)頻率分布直方圖一般步驟為:求極差(即樣本中的最大值與最小值的差);極差決定組距與組數(shù)(組數(shù));組距將數(shù)據(jù)分組;列頻率分布表. .(5 5)畫(huà)頻率分布直方圖根據(jù)頻率分布表做頻率分布直方圖應(yīng)注意兩點(diǎn):縱軸的意義:頻率組距橫軸的意義:樣本內(nèi)容(每個(gè)矩形下面是組距).頻率分布折線圖:連接頻率分布直方圖中各小長(zhǎng)方形上端的中點(diǎn),就得到頻率分布折線圖2.2.莖葉圖:當(dāng)數(shù)據(jù)是兩位有效數(shù)字時(shí),用中間的數(shù)字表示十位數(shù),即第一個(gè)有效數(shù)字,兩邊的數(shù)字表示個(gè)位數(shù), 即第二個(gè)有效數(shù)字,它的中間部分像植物的莖,兩邊部分像植物莖上長(zhǎng)出來(lái)的葉子,
8、因此通常把這樣的圖叫做莖葉圖。(見(jiàn)課本 P P61例子)制作莖葉圖的方法是:先將數(shù)據(jù)按大小進(jìn)行排列,再將所有兩位數(shù)的十位數(shù)字作為“莖”,個(gè)位數(shù)字作為“葉”,莖相同者共用一個(gè)莖,莖按從小到大的順序從上向下列出, 共莖的葉一般按從大到小(或從小到大)的順序同行列出注意:在制作莖葉圖時(shí),重復(fù)出現(xiàn)的數(shù)據(jù)要重復(fù)記錄,不能遺漏,特別是“葉”部分;同一數(shù)據(jù)出現(xiàn)幾次,就要在圖中體現(xiàn)幾次莖葉圖的特征:(1)用莖葉圖表示數(shù)據(jù)有兩個(gè)優(yōu)點(diǎn):一是從統(tǒng)計(jì)圖上沒(méi)有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到; 二是莖葉圖中的數(shù)據(jù)可以隨時(shí)記錄,隨時(shí)添加,方便記錄與表示。(2)莖葉圖只便于表示兩位有效數(shù)字的數(shù)據(jù),而且莖
9、葉圖只方便記錄兩組的數(shù)據(jù),兩個(gè)以上的數(shù)據(jù)雖然能夠記錄,但是沒(méi)有表示兩個(gè)記錄那么直觀,清晰。總體分布指的是總體取值的頻率分布規(guī)律,由于總體分布不易知道,因此我們往往用樣本的頻率分布去估計(jì)總體的分布。4.4.總體的分布分兩種情況:當(dāng)總體中的個(gè)體取值很少時(shí),用莖葉圖估計(jì)總體的分布;當(dāng)總體 中的個(gè)體取值較多時(shí),將樣本數(shù)據(jù)恰當(dāng)分組, 用各組的頻率分布描述總體的分布,方法是用頻率分布表或頻率分布直方圖。制作頻率分布表時(shí),若容量是 n n,可按公式將數(shù)據(jù)分成大約K=1+lgK=1+lg n n 段。(這類的經(jīng)驗(yàn)公式只對(duì)分段起參考作用)二、典例精析例1:下表給出了某校500名12歲男孩中用隨機(jī)抽樣得出的120
10、人的身高(單位cm)區(qū)間界限122,126)126,130) 130,134) 134,138)138,142) 142,146)人數(shù)T5810P 223320 :區(qū)間界限146,150)150,154) 154,158)人數(shù)1165(1)列出樣本頻率分布表;(2)畫(huà)出頻率分布直方圖估計(jì)身高小于134cm的人數(shù)占總?cè)藬?shù)的百分比2.3.12.3.1 用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征 1 1、眾數(shù)、中位數(shù)、平均數(shù): 眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)最多的數(shù)據(jù)。中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在中間位置的一個(gè)數(shù)據(jù) (或中間兩個(gè)數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù)。平均數(shù):-為+x2+xnX二i 2
11、22_ (Xi- X) (X2- X)亠 亠(Xn- x)=v3.3.方差I(lǐng)222(Xi-X)(X2-X)川(Xn-X)n在刻畫(huà)樣本數(shù)據(jù)的分散程度上,方差和標(biāo)準(zhǔn)差是一樣的,但在解決實(shí)際問(wèn)題時(shí),一般多采用標(biāo)準(zhǔn)差。用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征分兩類:a)a)b)b)用樣本平均數(shù)估計(jì)總體平均數(shù)。c)c)用樣本標(biāo)準(zhǔn)差估計(jì)總體標(biāo)準(zhǔn)差。樣本容量越大,估計(jì)就越精確。特點(diǎn):(1 1)平均數(shù)對(duì)數(shù)據(jù)有“取齊”的作用,代表一組數(shù)據(jù)的平均水平。(2 2 )標(biāo)準(zhǔn)差描述一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)的大小,反映了一組數(shù)據(jù)變化的幅度。4.4.用樣本估計(jì)總體時(shí),如果抽樣的方法比較合理,那么樣本可以反映總體的信息,但從樣本得到的
12、信息會(huì)有偏差。在隨機(jī)抽樣中,這種偏差是不可避免的。雖然我們用樣本數(shù)據(jù)得到的分布、均值和標(biāo)準(zhǔn)差并不是總體的真正的分布、均值和標(biāo)準(zhǔn)差,2 2、.樣本標(biāo)準(zhǔn)差:s二s2而只是一個(gè)估計(jì),但這種估計(jì)是合理的,特別是當(dāng)樣本量很大時(shí),它們確實(shí)反映了總體的信息。4 4. ( 1 1)如果把一組數(shù)據(jù)中的每一個(gè)數(shù)據(jù)都加上或減去同一個(gè)共同的常數(shù),標(biāo)準(zhǔn)差不變(2)如果把一組數(shù)據(jù)中的每一個(gè)數(shù)據(jù)乘以一個(gè)共同的常數(shù)k k,標(biāo)準(zhǔn)差變?yōu)樵瓉?lái)的 k k 倍(3)一組數(shù)據(jù)中的最大值和最小值對(duì)標(biāo)準(zhǔn)差的影響,區(qū)間(X -3s,】3s)的應(yīng)用;“去掉一個(gè)最高分,去掉一個(gè)最低分”中的科學(xué)道理2.3.22.3.2 兩個(gè)變量的線性相關(guān)1 1、概
13、念:如果散點(diǎn)圖中點(diǎn)的分布從整體看大致分布在一條直線的附近,我們稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫回歸直線(1(1)回歸直線方程:7 = bx an-一|工(x -x)(yi- y)b =n_ z ( -x)i 4a = y-bx其中 b b 是回歸方程的斜率,a,a 是截距系數(shù)4.求線性回歸方程的步驟:(1) 計(jì)算平均數(shù)x,y;(2) 計(jì)算x與y的積,求xiyi;(5)(5) 用a = y -bx, ,求 a a;(6)(6) 寫(xiě)出回歸方程 +(3)利用回歸方程進(jìn)行統(tǒng)計(jì)控制規(guī)定制的目標(biāo)。如已經(jīng)得到了空氣中通過(guò)控制汽車流量來(lái)控制空氣中4.4.應(yīng)用直線回歸的注意事項(xiàng)(1) 做回歸分析要有實(shí)際意義;(2) 回歸分析前,最好先作出散點(diǎn)圖;(3) 回歸直線不要外延。Y Y 值的變化,通過(guò)控制 x x 的范圍來(lái)實(shí)現(xiàn)統(tǒng)計(jì)控NONO2的濃度和汽車流量間的回歸方程,即可NONO
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 交通賠償合同參考文本
- 個(gè)人代理人保險(xiǎn)代理服務(wù)合同書(shū)
- 專業(yè)培訓(xùn)服務(wù)合同示例
- 個(gè)人保險(xiǎn)代理合同范本
- 二手設(shè)備轉(zhuǎn)讓合同范本
- 中學(xué)生安全教育服務(wù)合同
- 個(gè)人借款合同書(shū)樣本
- 二手公寓買賣合同模板
- 二手房交易中介服務(wù)委托合同
- 個(gè)人連帶責(zé)任借款合同模板
- 醫(yī)院消防安全培訓(xùn)課件
- 質(zhì)保管理制度
- 《00541語(yǔ)言學(xué)概論》自考復(fù)習(xí)題庫(kù)(含答案)
- 2025年機(jī)關(guān)工會(huì)個(gè)人工作計(jì)劃
- 江蘇省南京市、鹽城市2023-2024學(xué)年高三上學(xué)期期末調(diào)研測(cè)試+英語(yǔ)+ 含答案
- 2024護(hù)理不良事件分析
- 光伏項(xiàng)目的投資估算設(shè)計(jì)概算以及財(cái)務(wù)評(píng)價(jià)介紹
- 2024新版《藥品管理法》培訓(xùn)課件
- 干燥綜合征診斷及治療指南
- 糧油廠食品安全培訓(xùn)
- 南京信息工程大學(xué)《教師領(lǐng)導(dǎo)力》2022-2023學(xué)年第一學(xué)期期末試卷
評(píng)論
0/150
提交評(píng)論