統(tǒng)計(jì)成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析知識(shí)點(diǎn)易錯(cuò)點(diǎn)總結(jié)高考三輪復(fù)習(xí)沖刺_第1頁
統(tǒng)計(jì)成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析知識(shí)點(diǎn)易錯(cuò)點(diǎn)總結(jié)高考三輪復(fù)習(xí)沖刺_第2頁
統(tǒng)計(jì)成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析知識(shí)點(diǎn)易錯(cuò)點(diǎn)總結(jié)高考三輪復(fù)習(xí)沖刺_第3頁
統(tǒng)計(jì)成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析知識(shí)點(diǎn)易錯(cuò)點(diǎn)總結(jié)高考三輪復(fù)習(xí)沖刺_第4頁
統(tǒng)計(jì)成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析知識(shí)點(diǎn)易錯(cuò)點(diǎn)總結(jié)高考三輪復(fù)習(xí)沖刺_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)、成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析一、隨機(jī)抽樣1.簡單隨機(jī)抽樣(1)簡單隨機(jī)抽樣分為放回簡單隨機(jī)抽樣和不放回簡單隨機(jī)抽樣。(2)簡單隨機(jī)樣本:通過簡單隨機(jī)抽樣獲得的樣本稱為簡單隨機(jī)樣本。(3)簡單隨機(jī)抽樣的常用方法。實(shí)現(xiàn)簡單隨機(jī)抽樣的方法有很多,抽簽法和隨機(jī)數(shù)法是比較常用的兩種方法。注意:除非特殊聲明,本章簡單隨機(jī)抽樣指不放回簡單隨機(jī)抽樣。2.總體平均數(shù)與樣本平均數(shù)名稱定義總體均值(總體平均數(shù))一般地,總體中有N個(gè)個(gè)體,它們的變量值分別為Y1,Y2,…,YN,則稱Y=Y1+Y2+…+如果總體的N個(gè)變量值中,不同的值共有k(k≤N)個(gè),不妨記為Y1,Y2,…,Yk,其中Yi出現(xiàn)的頻數(shù)為fi(i=1,2,…,k),則總體均值還可以寫成加權(quán)平均數(shù)的形式Y(jié)=1Ni=1kf樣本均值(樣本平均數(shù))如果從總體中抽取一個(gè)容量為n的樣本,它們的變量值分別為y1,y2,…,yn,則稱y=y1+y2+…+注意:①在簡單隨機(jī)抽樣中,我們常用樣本平均數(shù)y去估計(jì)總體平均數(shù)Y;②總體平均數(shù)是一個(gè)確定的數(shù),樣本平均數(shù)具有隨機(jī)性(因?yàn)闃颖揪哂须S機(jī)性);③一般情況下,樣本量越大,估計(jì)越準(zhǔn)確。3.分層隨機(jī)抽樣(1)定義:一般地,按一個(gè)或多個(gè)變量把總體劃分成若干個(gè)子總體,每個(gè)個(gè)體屬于且僅屬于一個(gè)子總體,在每個(gè)子總體中獨(dú)立地進(jìn)行簡單隨機(jī)抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本,這樣的抽樣方法稱為分層隨機(jī)抽樣,每一個(gè)子總體稱為層。在分層隨機(jī)抽樣中,如果每層樣本量都與層的大小成比例,那么稱這種樣本量的分配方式為比例分配。(2)分層隨機(jī)抽樣的應(yīng)用范圍:當(dāng)總體是由差異明顯的幾個(gè)部分組成時(shí),往往選用分層隨機(jī)抽樣。(3)分層隨機(jī)抽樣的平均數(shù)計(jì)算在比例分配的分層隨機(jī)抽樣中,如果層數(shù)分為2層,第1層和第2層包含的個(gè)體數(shù)分別為M和N,抽取的樣本量分別為m和n,樣本平均數(shù)分別為x,y,總體的樣本平均數(shù)為w,則w=MM+Nx+NM注意:①隨機(jī)抽樣時(shí),總體中的每個(gè)個(gè)體入樣的概率相同。②比例分配的分層隨機(jī)抽樣,每一層入樣的個(gè)體數(shù)為該層的個(gè)體數(shù)乘以抽樣比?!局攸c(diǎn)難點(diǎn)易錯(cuò)點(diǎn)】1.簡單隨機(jī)抽樣的要點(diǎn):.簡單隨機(jī)抽樣需滿足:①被抽取的樣本和總體的個(gè)體數(shù)有限;②逐個(gè)抽取;③等可能抽取。2.在使用隨機(jī)數(shù)法時(shí),如遇到三位數(shù)(或四位數(shù)),可從選擇的隨機(jī)數(shù)表中的某行某列的數(shù)字計(jì)起,每三個(gè)(或四個(gè))作為一個(gè)單位,按某種順序依次選取,有超過總體號(hào)碼或出現(xiàn)重復(fù)號(hào)碼的數(shù)字舍去。3.簡單隨機(jī)抽樣常用抽簽法(適用于總體中個(gè)體數(shù)較少的情況)、隨機(jī)數(shù)法(適用于總體中個(gè)體數(shù)較多的情況)。2.比例分配的分層隨機(jī)抽樣的計(jì)算應(yīng)根據(jù)抽樣比構(gòu)造方程求解,其中,抽樣比=樣本容量總體容量=各層樣本數(shù)量3.樣本平均數(shù)可以依據(jù)定義求解。對(duì)于分兩層的分層隨機(jī)抽樣的平均數(shù)也可以依據(jù)公式求解:w=mm+nx+nm+ny(其中m,n分別為兩層的樣本量,x,

二、用樣本估計(jì)總體1.統(tǒng)計(jì)圖表(1)常見的統(tǒng)計(jì)圖表有條形圖、扇形圖、折線圖、頻率分布直方圖等。(2)作頻率分布直方圖的步驟:①求極差;②決定組距與組數(shù);③將數(shù)據(jù)分組;④列頻率分布表;⑤畫頻率分布直方圖。

2.百分位數(shù)(1)一般地,一組數(shù)據(jù)的第p百分位數(shù)是這樣一個(gè)值,它使得這組數(shù)據(jù)中至少有p%的數(shù)據(jù)小于或等于這個(gè)值,且至少有(100p)%的數(shù)據(jù)大于或等于這個(gè)值。(2)四分位數(shù)。常用的分位數(shù)有第25百分位數(shù),第50百分位數(shù)(即中位數(shù)),第75百分位數(shù)。這三個(gè)分位數(shù)把一組由小到大排列后的數(shù)據(jù)分成四等份,因此稱為四分位數(shù)。其中第25百分位數(shù)也稱為第一四分位數(shù)或下四分位數(shù)等,第75百分位數(shù)也稱為第三四分位數(shù)或上四分位數(shù)等。

3.總體集中趨勢(shì)的估計(jì)眾數(shù)、中位數(shù)、平均數(shù)數(shù)字特征樣本數(shù)據(jù)頻率分布直方圖眾數(shù)出現(xiàn)次數(shù)最多的數(shù)據(jù)取最高的小矩形底邊中點(diǎn)的橫坐標(biāo)中位數(shù)將數(shù)據(jù)按大小依次排列,處在最中間位置的一個(gè)數(shù)據(jù)(或最中間兩個(gè)數(shù)據(jù)的平均數(shù))把頻率分布直方圖劃分為左右兩個(gè)面積相等的部分,分界線與x軸交點(diǎn)的橫坐標(biāo)平均數(shù)樣本數(shù)據(jù)的算術(shù)平均數(shù)x=1n(x1+x2+…+xn每個(gè)小矩形的面積乘小矩形底邊中點(diǎn)的橫坐標(biāo)之和4.總體離散程度的估計(jì)—方差和標(biāo)準(zhǔn)差(1)假設(shè)一組數(shù)據(jù)是x1,x2,…,xn,用x表示這組數(shù)據(jù)的平均數(shù),則我們稱

1ni=1n(xix)2為這組數(shù)據(jù)的方差。有時(shí)為了計(jì)算方差的方便,我們還把方差寫成1ni(2)方差和標(biāo)準(zhǔn)差刻畫了數(shù)據(jù)的離散程度或波動(dòng)幅度。方差:s2=1n[(x1x)2+(x2x)2+…+(xnx)2]標(biāo)準(zhǔn)差:s=1n注意:方差和標(biāo)準(zhǔn)差描述了一組數(shù)據(jù)的離散程度,反映了一組數(shù)據(jù)相對(duì)于平均數(shù)的波動(dòng)情況,標(biāo)準(zhǔn)差和方差越大,說明這組數(shù)據(jù)的波動(dòng)性越大?!局攸c(diǎn)難點(diǎn)易錯(cuò)點(diǎn)】1.統(tǒng)計(jì)圖表的主要應(yīng)用:扇形圖:直觀描述各類數(shù)據(jù)占總數(shù)的比例。折線圖:描述數(shù)據(jù)隨時(shí)間的變化趨勢(shì)。條形圖和直方圖:直觀描述不同類別或分組數(shù)據(jù)的頻數(shù)和頻率。2.總體百分位數(shù)的估計(jì)需要注意的兩個(gè)問題:(1)總體百分位數(shù)的估計(jì)的基礎(chǔ)是樣本百分位數(shù)的計(jì)算,因此計(jì)算準(zhǔn)確是關(guān)鍵;(2)由于樣本量比較少,因此對(duì)總體的估計(jì)可能存在誤差,因此對(duì)總體百分位數(shù)的估計(jì)一般是估計(jì)值而非精確值。3.確定要求的p%分位數(shù)所在分組[A,B),由頻率分布表或頻率分布直方圖可知,樣本中小于A的頻率為a,小于B的頻率為b,所以p%分位數(shù)=A+組距×p%?ab?a4.頻率分布直方圖的數(shù)字特征:1.眾數(shù):最高矩形的底邊中點(diǎn)的橫坐標(biāo)。2.中位數(shù):中位數(shù)左邊和右邊的矩形的面積和應(yīng)該相等。3.平均數(shù):平均數(shù)在頻率分布直方圖中等于各組區(qū)間的中點(diǎn)值與對(duì)應(yīng)頻率之積的和。5.利用樣本的數(shù)字特征解決優(yōu)化決策問題的依據(jù):1.平均數(shù)反映了數(shù)據(jù)取值的平均水平;標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)的大小。標(biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度越大,越不穩(wěn)定;標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越小,越穩(wěn)定。2.用樣本估計(jì)總體就是利用樣本的數(shù)字特征來描述總體的數(shù)字特征。

三、成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析1.變量的相關(guān)關(guān)系(1)相關(guān)關(guān)系兩個(gè)變量有關(guān)系,但又沒有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,這種關(guān)系稱為相關(guān)關(guān)系。(2)相關(guān)關(guān)系的分類:正相關(guān)和負(fù)相關(guān)。(3)線性相關(guān)一般地,如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在一條直線附近,我們就稱這兩個(gè)變量線性相關(guān)。(4)非線性相關(guān)一般地,如果兩個(gè)變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個(gè)變量非線性相關(guān)或曲線相關(guān)。2.樣本相關(guān)系數(shù)(1)樣本相關(guān)系數(shù)r的計(jì)算變量x和變量y的樣本相關(guān)系數(shù)r的計(jì)算公式如下:r=i(2)樣本相關(guān)系數(shù)r的性質(zhì)①當(dāng)r>0時(shí),稱成對(duì)樣本數(shù)據(jù)正相關(guān);當(dāng)r<0時(shí),稱成對(duì)樣本數(shù)據(jù)負(fù)相關(guān);當(dāng)r=0時(shí),稱成對(duì)樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系。②樣本相關(guān)系數(shù)r的取值范圍為[1,1]。當(dāng)|r|越接近1時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);當(dāng)|r|越接近0時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越弱。3.一元線性回歸模型(1)經(jīng)驗(yàn)回歸方程與最小二乘法我們將y=bx+a稱為Y關(guān)于x的經(jīng)驗(yàn)回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為經(jīng)驗(yàn)回歸直線。這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的b,a叫做b,a的最小二乘估計(jì)。其中b(2)利用決定系數(shù)R2表示模型的擬合效果。R2=1i=1n(yi?yi)2i4.列聯(lián)表與獨(dú)立性檢驗(yàn)(1)2×2列聯(lián)表一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其2×2列聯(lián)表為XY合計(jì)Y=y1Y=y2X=x1aba+bX=x2cdc+d合計(jì)a+cb+dn=a+b+c+d(2)臨界值χ2=n(ad?bc)2(a+b)(c+d)(a+c)(b+d)。忽略χ2的實(shí)際分布與該近似分布的誤差后,對(duì)于任何小概率值(3)獨(dú)立性檢驗(yàn)基于小概率值α的檢驗(yàn)規(guī)則是:當(dāng)χ2≥xα?xí)r,我們就推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過α;當(dāng)χ2<xα?xí)r,我們沒有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨(dú)立。這種利用χ2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為χ2獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”,簡稱獨(dú)立性檢驗(yàn)。下表給出了χ2獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828【重點(diǎn)難點(diǎn)易錯(cuò)點(diǎn)】1.r的絕對(duì)值越接近0,表示兩個(gè)變量的線性相關(guān)性越弱。通常當(dāng)r的絕對(duì)值大于0.75時(shí),便認(rèn)為兩個(gè)變量具有很強(qiáng)的線性相關(guān)關(guān)系。2.利用公式求樣本相關(guān)系數(shù)r時(shí),注意i=1n(xix)2=i=1nxi2nx2,i=1n(yiy)2=i=1nyi2ny2,i=1n(xix3.現(xiàn)實(shí)意義:本題取材于我國的社會(huì)經(jīng)濟(jì)發(fā)展、生產(chǎn)生活實(shí)際和生態(tài)環(huán)境建設(shè),以樹木的根部橫截面積與材積量之間的關(guān)系設(shè)置問題,背景新穎,綜合考查學(xué)生應(yīng)用統(tǒng)計(jì)的基本知識(shí)和基礎(chǔ)方法解決實(shí)際問題的能力,對(duì)閱讀理解能力、數(shù)據(jù)處理能力、運(yùn)算求解能力要求比較高,特別是利用數(shù)據(jù)來求總材積量的估計(jì)值,體現(xiàn)了統(tǒng)計(jì)的意義。4.一元線性回歸模型分析問題的解題策略:1.利用最小二乘估計(jì)公式,求出回歸系數(shù)b。2.利用經(jīng)驗(yàn)回歸直線過樣本點(diǎn)的中心求系數(shù)a。3.寫出經(jīng)驗(yàn)回歸方程,并利用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測(cè)。5.有些非線性回歸模型分析問

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論