統(tǒng)計概念匯總_第1頁
統(tǒng)計概念匯總_第2頁
統(tǒng)計概念匯總_第3頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、統(tǒng)計概念匯總總體、個體: 在統(tǒng)計學中,將我們研究的問題所涉及的對象的全體稱為總體,而把總體中的每個 成員稱為個體。樣本、樣本容量: 樣本是總體中所抽取的一部分個體,而樣本容量是指樣本中個體的數(shù)目。 簡單隨機抽樣: 設一個總體的個數(shù)為 N .如果通過逐個抽取的方法從中抽取一個樣本,且每次抽取時各個個體被抽到的概率相等,就稱這樣的抽樣為簡單隨機抽樣.這樣抽取的樣本,叫做簡單隨機樣本 .系統(tǒng)抽樣: 當總體中的個體數(shù)目較多時, 可將總體分成均衡的幾個部分, 然后按事先定出的規(guī)則, 從每一部分抽取一個個體,得到所需要的樣本 .這種抽樣稱為系統(tǒng)抽樣 .分層抽樣: 當已知總體是由差異明顯的幾部分組成時,常將

2、總體分成幾部分,然后按照各部分所 占得比進行抽樣,這種抽樣叫分層抽樣。三種抽樣的基本步驟:1. 簡單隨機抽樣:抽簽法和隨機數(shù)表法抽簽法基本步驟:將總體中的個體編號;制簽;在箱子中攪勻簽條;抽取隨機數(shù)表法基本步驟:將總體中的個體編號;利用隨機數(shù)表按規(guī)則取數(shù);匯總2. 系統(tǒng)抽樣的步驟: 將總體中的個體隨機編號; 將編號分段; 在第1 段中用簡單隨機抽樣確定起始的個體編號;按照預先研究的規(guī)則抽樣注意:有時候先剔除一部分個體 (不整除)3. 分層抽樣的步驟分層;按照比例確定每層抽取的人數(shù);各層抽樣;(方法可以是簡單隨機 抽樣也可以是系統(tǒng)抽樣)匯合成樣本總體分布的估計:由于總體分布通常不易知道,往往用樣

3、本的頻率分布估計總體分布,樣本的容量越大,估計越精確。編制頻率分布表的方法步驟 :求極差;決定組距與組數(shù);決定分點,將數(shù)據(jù)分組;登記頻數(shù),計算頻率,列出頻率分布表 頻率分布條形圖當總體中個體取不同數(shù)值很少時步驟(列頻率分布表,畫條形圖)頻率分布直方圖 總體的個體取不同值較多甚至無限時 步驟:計算最大小值;決定組距和組數(shù) ,決定分點,列頻率分布表,畫直方圖頻率分布折線圖:把頻率分布直方圖各個長方形上邊的中點用線段連接起來,就得到頻率分布折線圖橫軸上的左右端點沒有實際意義;當樣本容量越大,所分組數(shù)越多,折線圖將越接近于總體密度曲線.總體密度曲線:在頻率分布直方圖中,樣本容量越大,所分組數(shù)越多,在各

4、組的頻率就越接近總體在相應各組中取值得概率設想樣本容量無限增大,分組的組距無限縮小,那么頻率與分布直方圖就會無限接近于一條光滑曲線,這條曲線就是總體密度曲線(x u)2正態(tài)分布:如果總體密度曲線是或近似的是函數(shù)f(x),x ()的圖像,其中實數(shù)u,實參數(shù),分別表示總體的平均數(shù)與標準差,這個總體是有無限容量的抽象總體,其分2布叫正態(tài)分布,記作 N(u,)標準正態(tài)分布:正態(tài)分布函數(shù)中,當u 0,1時,正態(tài)總體成為標準正態(tài)總體 .此時相應函數(shù)的表示式是f (x),此時記為N(0,1).正態(tài)曲線的性質(zhì):(1)曲線在x軸上方,與x軸不相交.(2)曲線關于直線x u對稱.(3)曲線越小,曲線越“瘦高”的形

5、狀由 確定. 越大,曲線越“矮胖”,表示總體的分布越分散;表示總體的分布越集中假設檢驗:進行假設檢驗可歸結(jié)為如下三步:(1 )提出統(tǒng)計假設;(2 )確定一次試驗中的取值 a是否落入范圍 (u 3 ,u 3 ) .( 3 )作出判斷.如果a (u 3 ,u 3 ),接受假設;如果 a (u 3 ,u 3 ),由于這是小概率事件,就拒絕統(tǒng)計假設(u ,u)取值概率68.3%(u 2 ,u 2 )取值概率95.4%(u 3 ,u 3 )取值概率99.7%莖葉圖:用中間的數(shù)字表示數(shù)據(jù)的十位數(shù),兩邊的數(shù)字表示數(shù)據(jù)的個位數(shù),莖按從小到大的順序 從上向下列出,共莖的葉一般按從大到小(或從小到大)的順序同行列

6、出,這樣的圖叫做莖葉圖 優(yōu)點:一是從統(tǒng)計圖上沒有原始信息的損失,所有的數(shù)據(jù)信息都可以從莖葉圖中得到;二是莖葉 圖便于記錄與表示 缺點:其分析只是粗略的,對差異不大的兩組數(shù)據(jù)不易分析;表示三位數(shù)以上的數(shù)據(jù)時不夠方便5032875421012381 24719936152中位數(shù):將數(shù)據(jù)按從小到大或從大到小,處在中間的數(shù)據(jù);但當數(shù)據(jù)為偶數(shù)個時,處于中間兩個 的數(shù)據(jù)的平均數(shù)為中位數(shù);眾數(shù):在數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)。但眾數(shù)不一定是唯一的。樣本方差、樣本標準差:設樣本元素為Xi,X2, Xn,樣本的平均數(shù)為X ,定義s2 (Xi X)2 (X2 X)2n(Xn X)2(Xi X)2 (X2 X)2(Xn

7、X)2其中s2表示樣本方差,s表示樣本標準差相關關系:自變量取值一定時,因變量的取值帶有一定隨機性的兩個變量之間的關系叫做相關關系與函數(shù)關系不同,相關關系是一種非確定性關系 散點圖:具有相關關系的兩個變量的數(shù)據(jù)所對應的圖形,不是一條確定的直線,而是一些散亂得點,這個圖形叫散點圖回歸直線方程:設X和y是具有相關關系的兩個變量且相應于n組觀測值的的n個點大致分布在一條直線附近,這條直線就是回歸直線.回歸直線的方程叫做回歸直線方程.該方程為Xi ynxyy? bx a,a、b叫回歸系數(shù).其中b? , a y bx .2-2Xi nxi 1最小二乘法:為了刻畫實際觀察值 yi與回歸直線上相應點縱坐標的

8、偏離程度,我們用離差的平方n2和,即Q (yi a bXi)作為總離差,并使之達到最小 這樣,回歸直線就是所有直線中Q取i 1最小值的那一條由于平方又叫二乘法,所以這種使“離差平方和為最小”的方法,又叫最小二乘樣本相關系數(shù):對于變量y與x的一組觀測值來說,我們把n(Xi x)(yi y)i 1nn(x x)2(yi y)2i 1i 1nXi yi nxyi 1叫做變量y與x之間的樣本相關 nn(X2 nx)2(yi2ny2)i 1i 1系數(shù)(簡稱相關系數(shù)),用它來衡量它們之間的線性相關程度.r具有以下性質(zhì):| r | 1,且|r |越接近1,線性相關程度越強;| r |越接近0 ,線性相關程度越弱若| r | 1則稱x、y完全線性相關 相關性檢驗的步驟:(1)作統(tǒng)計假設:x與y不具有相關性相關關系.(2)根據(jù)小概率0.05與n 2 附表中查出r的一個臨界值ro.05.( 3)根據(jù)樣本相關系數(shù)計算公式算出r的值.(4)作統(tǒng)計推斷如果|r | ro.05,表明有95%的把握認為x與y之間具有線性相關關系.獨立性檢驗:2n("

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論