2022屆高三理科數(shù)學(xué)-概率與統(tǒng)計(jì)基本概念匯總_第1頁(yè)
2022屆高三理科數(shù)學(xué)-概率與統(tǒng)計(jì)基本概念匯總_第2頁(yè)
2022屆高三理科數(shù)學(xué)-概率與統(tǒng)計(jì)基本概念匯總_第3頁(yè)
2022屆高三理科數(shù)學(xué)-概率與統(tǒng)計(jì)基本概念匯總_第4頁(yè)
2022屆高三理科數(shù)學(xué)-概率與統(tǒng)計(jì)基本概念匯總_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

概率與統(tǒng)計(jì)基本概念匯總

隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣定義:一般地,設(shè)一個(gè)總體含有N個(gè)個(gè)體,從中逐個(gè)不放回地抽取n個(gè)個(gè)體作為樣本(nWN),如果每次抽取時(shí)總體內(nèi)的各個(gè)個(gè)體被抽到的機(jī)會(huì)都相等,就把這種抽樣方法叫做簡(jiǎn)單隨機(jī)抽樣.最常用的簡(jiǎn)單隨機(jī)抽樣方法有兩種——抽簽法和隨機(jī)數(shù)法.應(yīng)用范圍:總體個(gè)體數(shù)較少.系統(tǒng)抽樣的步驟一般地,假設(shè)要從容量為N的總體中抽取容量為n的樣本.先將總體的N個(gè)個(gè)體編號(hào);N確定分段間隔k對(duì)編號(hào)進(jìn)行分段.當(dāng)n(n是樣本容量)是整數(shù)時(shí),在第1段用簡(jiǎn)單隨機(jī)抽樣確定第一個(gè)個(gè)體編號(hào)l(lWk);⑷按照一定的規(guī)則抽取樣本.通常是將l加上間隔k得到第2個(gè)個(gè)體編號(hào)(l+k),再加k得到第3個(gè)個(gè)體編號(hào)(l+2k),依次進(jìn)行下去,直到獲取整個(gè)樣本.分層抽樣定義:一般地,在抽樣時(shí),將總體分成互不交叉的層,然后按照一定的比例,從各層獨(dú)立地抽取一定數(shù)量的個(gè)體,將各層取出的個(gè)體合在一起作為樣本,這種抽樣方法是一種分層抽樣.分層抽樣的應(yīng)用范圍:當(dāng)總體是由差異明顯的幾個(gè)部分組成時(shí),往往選用分層抽樣的方法.用樣本估計(jì)總體作頻率分布直方圖的步驟求極差(即一組數(shù)據(jù)中最大值與最小值的差).決定組距與組數(shù).將數(shù)據(jù)分組.列頻率分布表.畫頻率分布直方圖.頻率分布折線圖和總體密度曲線頻率分布折線圖:連接頻率分布直方圖中各小長(zhǎng)方形上端的中點(diǎn),就得到頻率分布折線圖.⑵總體密度曲線:隨著樣本容量的增加,作圖時(shí)所分的組數(shù)增加,組距減小,相應(yīng)的頻率折線圖會(huì)越來(lái)越接近于一條光滑曲線,統(tǒng)計(jì)中稱這條光滑曲線為總體密度曲線.

3.莖葉圖統(tǒng)計(jì)中還有一種被用來(lái)表示數(shù)據(jù)的圖叫做莖葉圖,莖是指中間的一列數(shù),葉就是從莖的旁邊生長(zhǎng)出來(lái)的數(shù).4.眾數(shù)、中位數(shù)、平均數(shù)數(shù)字特征概念優(yōu)點(diǎn)與缺點(diǎn)眾數(shù)一組數(shù)據(jù)中重復(fù)出現(xiàn)次數(shù)最多的數(shù)眾數(shù)通常用于描述變量的值出現(xiàn)次數(shù)最多的數(shù)?但顯然它對(duì)其他數(shù)據(jù)信息的忽視使它無(wú)法客觀地反映總體特征中位數(shù)把一組數(shù)據(jù)按從小到大順序排列,處在中間位置的一個(gè)數(shù)據(jù)(或兩個(gè)數(shù)據(jù)的平均數(shù))中位數(shù)等分樣本數(shù)據(jù)所占頻率,它不受少數(shù)兒個(gè)極端值的影響,這在某些情況下是優(yōu)點(diǎn),但它對(duì)極端值的不敏感有吋也會(huì)成為缺點(diǎn)平均數(shù)如果有n個(gè)數(shù)據(jù)x,X?,…,X/那么這n個(gè)數(shù)的平均數(shù)_x+xHx12nx-n平均數(shù)與每一個(gè)樣本數(shù)據(jù)有關(guān),可以反映出更多的關(guān)于樣本數(shù)據(jù)全體的信息,但平均數(shù)受數(shù)據(jù)中的極端值的影響較大,使平均數(shù)在估計(jì)總體吋可靠性降低注意:在頻率分布直方圖中:眾數(shù)等于最高的長(zhǎng)方形底邊中點(diǎn)的橫坐標(biāo);中位數(shù)左邊和右邊的直方圖的面積相等,由此可以估計(jì)中位數(shù)的值;③平均數(shù)的估計(jì)值等于頻率分布直方圖中每個(gè)小長(zhǎng)方形的面積乘以小長(zhǎng)方形底邊中點(diǎn)的橫坐標(biāo)之和.5.標(biāo)準(zhǔn)差和方差及其性質(zhì)標(biāo)準(zhǔn)差是樣本數(shù)據(jù)到平均數(shù)的一種平均距離.標(biāo)準(zhǔn)差:s=]丄心-X)2+(x-X)2++(x-X)2]TOC\o"1-5"\h\zni2n方差:s2=1[(x—X)2+(x—X)2++(x—X)2](X是樣本數(shù)據(jù),n是樣n12...nn本容量,X是樣本平均數(shù)).⑷若x,x,,x的平均數(shù)為X,那么mx+a,mx+a,,mx+a的平均數(shù)為12n12nmx+a(5)數(shù)據(jù)X,X,,X與數(shù)據(jù)X一x+a,x'=x+a,,x'=x+a的方差相等,[??2n1122n???n即數(shù)據(jù)經(jīng)過(guò)平移后方差不變.⑹右x,x,,x的方差為s2,那么ax+b,ax+b,,ax+b的方差為a2s212n12n注意:①現(xiàn)實(shí)中總體所包含的個(gè)體數(shù)往往較多,總體的平均數(shù)與標(biāo)準(zhǔn)差、方差是不知道(或不可求)的,所以我們通常用樣本的平均數(shù)與標(biāo)準(zhǔn)差、方差來(lái)估計(jì)總體的平均數(shù)與標(biāo)準(zhǔn)差、方差.②平均數(shù)反映了數(shù)據(jù)取值的平均水平,標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動(dòng)的大?。畼?biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度越大,越不穩(wěn)定.變量間的相關(guān)關(guān)系、統(tǒng)計(jì)案例兩個(gè)變量的線性相關(guān)正相關(guān)在散點(diǎn)圖中,點(diǎn)散布在從左下角到右上角的區(qū)域,對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān).負(fù)相關(guān)在散點(diǎn)圖中,點(diǎn)散布在從左上角到右下角的區(qū)域,兩個(gè)變量的這種相關(guān)關(guān)系稱為負(fù)相關(guān).線性相關(guān)關(guān)系、回歸直線如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在一條直線附近,就稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.回歸方程(1)最小二乘法求回歸直線,使得樣本數(shù)據(jù)的點(diǎn)到它的距離的平方和最小的方法叫做最小二乘法.回歸方程若變量X與y具有線性相關(guān)關(guān)系,有n個(gè)樣本數(shù)據(jù)(x,y)(i=1,2,,n)ii工(x-x)(y-y)y一nxy貝U回歸方程y=bx+a中b=i-i_—=i右',a=y—bx.乙(x-x)2乙x2-nx2iii=1i=1其中x=1iLx=xi+x2++xn,y=1Ky=yi+y2++ynninnin回歸分析定義:對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法.樣本點(diǎn)的中心對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x,y),(x,y),―,(x,y),1122nn其中(x,y)稱為樣本點(diǎn)的中心.相關(guān)系數(shù)統(tǒng)計(jì)中用相關(guān)系數(shù)r來(lái)衡量?jī)蓚€(gè)變量之間線性關(guān)系的強(qiáng)弱,若相應(yīng)于變量x的取值x,變量y的觀測(cè)值為y(1<i<n),則兩個(gè)變量的相關(guān)0i

(x-x)(y-y)系數(shù)的計(jì)算公式為r=孚:L{工(x-x)2(y-y)2當(dāng)r>0時(shí),表明變量x和;正相關(guān);當(dāng)r<0時(shí),表明變量x和y負(fù)相關(guān);當(dāng)rg[-1,-0.75]表明變量x和y負(fù)相關(guān)相關(guān)很強(qiáng);當(dāng)rg[0.75,1],表明變量x和y正相關(guān)相關(guān)很強(qiáng);當(dāng)rg[-0.75,-0.30]或rg[0.3,0.75],則相關(guān)性一般;rg[-0.25,0.25]時(shí),相關(guān)性較弱.(當(dāng)|r|Wl且|r|越接近于1,相關(guān)程度越強(qiáng),當(dāng)|r|Wl且|r|越接近于0,相關(guān)程度越弱)刻畫回歸效果的方式方式方法計(jì)算公式刻畫效果相關(guān)指數(shù)R2工(y-y)2iiR2二1—工(y-y)2ii-1R2越接近于1,表示回歸的效果越好殘差圖e稱為相應(yīng)于點(diǎn)(x,y)的殘差,e-iiiy—yii殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明選用的模型比較合適,其中這樣的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精確度越高.殘差平方和"(y-y)2iii-1殘差平方和越小,模型的擬合效果越好獨(dú)立性檢驗(yàn)分類變量:變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.列聯(lián)表:列出的兩個(gè)分類變量的頻數(shù)表,稱為列聯(lián)表.假設(shè)有兩個(gè)分類變量X和Y,它們的可能取值分別為{x,x}和{y,y},其樣1212本頻數(shù)列聯(lián)表(稱為2X2列聯(lián)表)為2X2列聯(lián)表y2X2列聯(lián)表y1y2總計(jì)x1aba+bx2cdc+d總計(jì)a+cb+da+b+c+d構(gòu)造一個(gè)隨機(jī)變量K2=(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d為樣本容量.獨(dú)立性檢驗(yàn)利用隨機(jī)變量竺來(lái)判斷“兩個(gè)分類變量有關(guān)系”的方法稱為獨(dú)立性檢驗(yàn).隨機(jī)事件的概率1.概率和頻率(1)在相同的條件S下重復(fù)n次試驗(yàn),觀察某一事件A是否出現(xiàn),稱

n次試驗(yàn)中事件A出現(xiàn)的次數(shù)n為事件A出現(xiàn)的頻數(shù),稱事件A出現(xiàn)An的比例f(A)=計(jì)為事件A出現(xiàn)的頻率.(2)對(duì)于給定的隨機(jī)事件A(2)對(duì)于給定的隨機(jī)事件A,由于事件A發(fā)生的頻率f(A)隨著試驗(yàn)次n數(shù)的增加穩(wěn)定于概率P(A),因此可以用頻率f(A)來(lái)估計(jì)概率P(A).n定義符號(hào)表示包含關(guān)系如果事件A發(fā)生,則事件B—定發(fā)生,這時(shí)稱事件B包含事件A(或稱事件A包含于事件"B廠BnA(或AcB)相等關(guān)系若BnA且AnBA=B并事件(和事件)若某事件發(fā)生當(dāng)且僅當(dāng)事件A發(fā)生或事件B發(fā)生,稱此事件為事件A與事件B的并事件(或和事件)AUB(或A+B)父事件(積事件)若某事件發(fā)生當(dāng)且僅當(dāng)事件A發(fā)生AnB(或AB)且事件B發(fā)生,則稱此事件為事件A與事件B的父事件(或積事件)互斥事件若AnB為不可能事件(AnB=0),則稱事件A與事件B互斥AnB=0對(duì)立事件若AnB為不可能事件,AUB為必然事件,那么稱事件A與事件B互為對(duì)立事件AnB=0,P(A)+P(B)=12?事件的關(guān)系與運(yùn)算概率的幾個(gè)基本性質(zhì)概率的取值范圍:0WP(A)W1.必然事件的概率P—⑶不可能事件的概率P(F)=0.概率的加法公式如果事件A與事件B互斥,則P(AUB)=P(A)+P(B).對(duì)立事件的概率若事件A與事件B互為對(duì)立事件,則P(A)=1—P(B).4?基本事件的特點(diǎn)任何兩個(gè)基本事件是互斥的;任何事件(除不可能事件)都可以表示成基本事件的和.5?古典概型具有以下兩個(gè)特點(diǎn)的概率模型稱為古典概率模型,簡(jiǎn)稱古典概型.試驗(yàn)中所有可能出現(xiàn)的基本事件只有有限個(gè);每個(gè)基本事件出現(xiàn)的可能性相等.如果一次試驗(yàn)中可能出現(xiàn)的結(jié)果有n個(gè),而且所有結(jié)果出現(xiàn)的可能性都相等,那么每一個(gè)基本事件的概率都是1如果某個(gè)事件A包m括的結(jié)果有m個(gè),那么事件A的概率P(A)=n7?古典概型的概率公式p(a)_A包含的基本事件的個(gè)數(shù)P(A)基本事件的總數(shù)—-8.幾何概型的概率公式p(a)_構(gòu)成事件A的區(qū)域長(zhǎng)度面積或體積(丿—試驗(yàn)的全部結(jié)果所構(gòu)成的區(qū)域長(zhǎng)度面積或體積°條件概率與獨(dú)立事件條件概率求已知B發(fā)生的條件下,A發(fā)生的概率,稱為B發(fā)生時(shí),A發(fā)生的條件概率,記為P(A|B),P(A|B)_p^B(其中,AnB也可寫成AB).A發(fā)生時(shí)B發(fā)生的條件概率為P(B|A)_P^A=1.獨(dú)立事件—一般地,對(duì)兩個(gè)事件A,B,如果P(AB)_P(A)P(B),則稱A,B相互獨(dú)立.可以證明,如果A,B相互獨(dú)立,則A與B,A與B,A與B也相互獨(dú)立.離散型隨機(jī)變量及其分布列、均值與方差一、離散型隨機(jī)變量的分布列1?隨機(jī)變量的有關(guān)概念隨機(jī)變量:隨著試驗(yàn)結(jié)果變化而變化的變量稱為隨機(jī)變量,常用字母X,Y,g,耳,…表示.離散型隨機(jī)變量:所有取值可以一一列出的隨機(jī)變量,稱為離散型

隨機(jī)變量.2.離散型隨機(jī)變量分布列的概念及性質(zhì)(1)離散型隨機(jī)變量的分布列的概念設(shè)離散型隨機(jī)變量X可能取的不同值為x,x,…,x,X取每一12nXx1x2???xi???xnPp1p2???p???pn11Xx1x2???xi???xnPp1p2???p???pn11—2I有時(shí)也用等式P(X」x)=p,i;1,2;,n表示X的分布列.(2)離散型隨機(jī)變量的分布列的性質(zhì)p>0(i=1,2,…,n);p+p+???+p=1?二、離散型隨機(jī)變量的均值與方差Xx1x2???xiXx1x2???xi???xnPp1p2???pi???pn般地,若離散型隨機(jī)變量X的分布列為:稱E(X)=xp+xp+???+xp為隨機(jī)變量X的均值或數(shù)學(xué)期望,它反映了離散型隨機(jī)變量取值的平均水平?稱D(X)=工(x-E(X))2p為隨機(jī)變量X的方差,它刻畫了隨機(jī)ii變量X與其均值E(X)的平均偏離程度,其算術(shù)平方根寸萬(wàn)而為隨機(jī)變量X的標(biāo)準(zhǔn)差.2?均值與方差的性質(zhì)若Y=aX+b,其中a,b為常數(shù),則Y也是隨機(jī)變量,且E(aX+b)=aE(X)+b;D(aX+b)=a2D(X).二項(xiàng)分布、超幾何分布與正態(tài)分布兩點(diǎn)分布如果隨機(jī)變量X的分布列為X01P1-pp其中O〈p〈1,則稱離散型隨機(jī)變量X服從兩點(diǎn)分布.其中p=P(X=1)稱為成功概率.超幾何分布在含有M件次品的N件產(chǎn)品中,任取n件,其中恰有X件次品數(shù),則事件{X=/發(fā)生的概率為P(Xk)專,k=o,1'…,,n,其中m=min{M,n},且nWN,MWN,n,M,NgN*,稱分布列X01???mPCoCn0—M~~NMCn_NC1Cn1MNMCnN???CmCnmMNMCnN為超兒何分布列,如果隨機(jī)變量X的分布列為超兒何分布列,則稱隨機(jī)變量X服從超兒何分布.獨(dú)立重復(fù)試驗(yàn)與二項(xiàng)分布獨(dú)立重復(fù)試驗(yàn)是指在相同條件下可重復(fù)進(jìn)行的,各次之間相互獨(dú)立的一種試驗(yàn),在這種試驗(yàn)中每一次試驗(yàn)只有兩種結(jié)果,即要么發(fā)生,要么不發(fā)生,且任何一次試驗(yàn)中發(fā)生的概率都是一樣的.在n次獨(dú)立重復(fù)試驗(yàn)中,用X表示事件A發(fā)生的次數(shù),設(shè)每次試驗(yàn)中事件A發(fā)生的概率為p,則P(X=k)=CkPk(1—p)n—k(k=0,1,2,…,n),此吋稱隨機(jī)變量X服從二項(xiàng)分布,記為X~B(n,p),并稱p為成功概率.兩點(diǎn)分布與二項(xiàng)分布的均值、方差若隨機(jī)變量X服從兩點(diǎn)分布,則E(X)=p,D(X)=p(1—p).若X?B(n,p),則E(X)=np,D(X)=np(1—p).正態(tài)分布—正態(tài)曲線:函數(shù)?(x)=1一十,xW(—8,+◎,其中實(shí)卩,o{—e2。<2n數(shù)卩和。為參數(shù)(。>0,UWR)?我們稱函數(shù)?(x)的圖象為正P,o態(tài)分布密度曲線,簡(jiǎn)稱正態(tài)曲線.正態(tài)曲線的特點(diǎn)曲線位于x軸上方,與x軸不相交;曲線是單峰的^它關(guān)于直線x=卩對(duì)稱;曲線在乂=卩處達(dá)到峰值oi:2n曲線與x軸之間的面積為

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論