版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)理統(tǒng)計(jì)的基本知識(shí)引言到了十九世紀(jì)末二十世紀(jì)初,隨著近代數(shù)學(xué)和概率論的發(fā)展,才真正誕生了數(shù)理統(tǒng)計(jì)學(xué)這門(mén)學(xué)科.從歷史的典籍中,人們不難發(fā)現(xiàn)許多關(guān)于錢(qián)糧、戶口、地震、水災(zāi)等等的記載,說(shuō)明人們很早就開(kāi)始了統(tǒng)計(jì)的工作.但是當(dāng)時(shí)的統(tǒng)計(jì),只是對(duì)有關(guān)事實(shí)的簡(jiǎn)單記錄和整理,而沒(méi)有在一定理論的指導(dǎo)下,作出超越這些數(shù)據(jù)范圍之外的推斷.數(shù)理統(tǒng)計(jì)學(xué)是一門(mén)應(yīng)用性很強(qiáng)的學(xué)科.它是研究怎樣以有效的方式收集、整理和分析帶有隨機(jī)性的數(shù)據(jù),以便對(duì)所考察的問(wèn)題作出推斷和預(yù)測(cè),直至為采取一定的決策和行動(dòng)提供依據(jù)和建議.引言數(shù)理統(tǒng)計(jì)不同于一般的資料統(tǒng)計(jì),它更側(cè)重于應(yīng)用隨機(jī)現(xiàn)象本身的規(guī)律性進(jìn)行資料的收集、整理和分析.
由于大量隨機(jī)現(xiàn)象必然呈現(xiàn)出它的規(guī)律性,因而從理論上講,只要對(duì)隨機(jī)現(xiàn)象進(jìn)行足夠多次觀察,被研究的隨機(jī)現(xiàn)象的規(guī)律性一定能清楚地呈現(xiàn)出來(lái).但在客觀上只允許我們對(duì)隨機(jī)現(xiàn)象進(jìn)行次數(shù)不多的觀察試驗(yàn),也就是說(shuō),我們獲得的只是局部觀察資料.引言數(shù)理統(tǒng)計(jì)方法具有“部分推斷整體”的特征.引言數(shù)理統(tǒng)計(jì)的基本思想:從所要研究對(duì)象的全體中,抽取一小部分進(jìn)行觀測(cè)或試驗(yàn)。以取得信息,從而對(duì)整體做出推斷。每個(gè)推斷必須伴隨一定的概率,以表明推斷的可靠性。(數(shù)理推斷)數(shù)理統(tǒng)計(jì)的基本任務(wù):以大數(shù)定律、中心極限定理為理論基礎(chǔ),根據(jù)實(shí)際掌握的部分信息對(duì)有關(guān)主體試驗(yàn)的分布、數(shù)字特征做出估計(jì)并加以檢驗(yàn)的數(shù)理推斷。
一個(gè)統(tǒng)計(jì)問(wèn)題總有它明確的研究對(duì)象.1.總體研究對(duì)象的全體稱為總體(母體),總體中所包含的個(gè)體的個(gè)數(shù)稱為總體的容量.總體中每個(gè)成員稱為個(gè)體,總體有限總體無(wú)限總體一、總體和樣本在數(shù)理統(tǒng)計(jì)研究中,人們往往研究有關(guān)對(duì)象的某一項(xiàng)(或幾項(xiàng))數(shù)量指標(biāo)和.為此,對(duì)這一指標(biāo)進(jìn)行隨機(jī)試驗(yàn),觀察試驗(yàn)結(jié)果全部觀察值,從而考察該數(shù)量指標(biāo)的分布情況.
這時(shí),每個(gè)具有的數(shù)量指標(biāo)的全體就是總體.每個(gè)數(shù)量指標(biāo)就是個(gè)體.某批燈泡的壽命該批燈泡壽命的全體就是總體國(guó)產(chǎn)轎車(chē)每公里的耗油量國(guó)產(chǎn)轎車(chē)每公里耗油量的全體就是總體一、總體和樣本因此在理論上可以把總體與概率分布等同起來(lái).由于每個(gè)個(gè)體的出現(xiàn)是隨機(jī)的,所以相應(yīng)的數(shù)量指標(biāo)的出現(xiàn)也帶有隨機(jī)性.從而可以把這種數(shù)量指標(biāo)看作一個(gè)隨機(jī)變量X
,因此隨機(jī)變量X的分布就是該數(shù)量指標(biāo)在總體中的分布.
總體就可以用一個(gè)隨機(jī)變量及其分布來(lái)描述.一、總體和樣本例如:研究某批燈泡的壽命時(shí),關(guān)心的數(shù)量指標(biāo)就是壽命,那么,此總體就可以用隨機(jī)變量X表示,或用其分布函數(shù)F(x)表示.某批燈泡的壽命總體
壽命X可用一概率(指數(shù))分布來(lái)刻劃一、總體和樣本F(x)
類(lèi)似地,在研究某地區(qū)中學(xué)生的營(yíng)養(yǎng)狀況時(shí),若關(guān)心的數(shù)量指標(biāo)是身高和體重,我們用X和Y分別表示身高和體重,那么此總體就可用二維隨機(jī)變量(X,Y)或其聯(lián)合分布函數(shù)F(x,y)來(lái)表示.
統(tǒng)計(jì)中,總體這個(gè)概念的要旨是:總體就是一個(gè)隨機(jī)變量或概率分布.一、總體和樣本總體分布一般是未知,或只知道是包含未知參數(shù)的分布,為推斷總體分布及各種特征,按一定規(guī)則從總體中抽取若干個(gè)體進(jìn)行觀察試驗(yàn),以獲得有關(guān)總體的信息,這一抽取過(guò)程稱為
“抽樣”,所抽取的部分個(gè)體稱為樣本.
樣本中所包含的個(gè)體數(shù)目稱為樣本容量.2.樣本從國(guó)產(chǎn)轎車(chē)中抽5輛進(jìn)行耗油量試驗(yàn)樣本容量為5抽到哪5輛是隨機(jī)的一、總體和樣本
一旦取定一組樣本X1,…,Xn,得到n個(gè)具體的數(shù)(x1,x2,…,xn),稱為樣本的一次觀察值,簡(jiǎn)稱樣本值
.n稱為這個(gè)樣本的容量.1.
代表性:
X1,X2,…,Xn中每一個(gè)與所考察的總體有相同的分布.2.
獨(dú)立性:
X1,X2,…,Xn是相互獨(dú)立的隨機(jī)變量.一、總體和樣本一、總體和樣本簡(jiǎn)單樣本是一種理想化的樣本.如何才能得到簡(jiǎn)單樣本呢?對(duì)于有限總體,若采用有放回抽取,則可得到簡(jiǎn)單樣本;若采用無(wú)放回抽取,則無(wú)法保證每次抽取的獨(dú)立性,但若有限總體容量較樣本容量很大時(shí),無(wú)放回抽取與有放回抽取區(qū)別很小,亦可采用無(wú)放回抽取得到簡(jiǎn)單樣本.對(duì)于無(wú)限總體,抽取部分個(gè)體后放回與否對(duì)總體成分影響不大,因此可采用不放回抽取獲得簡(jiǎn)單樣本.
簡(jiǎn)單隨機(jī)樣本是應(yīng)用中最常見(jiàn)的情形,今后,當(dāng)說(shuō)到“X1,X2,…,Xn是取自某總體的樣本”時(shí),若不特別說(shuō)明,就指簡(jiǎn)單隨機(jī)樣本.=F(x1)F(x2)…F(xn)
若總體的分布函數(shù)為F(x)、概率密度函數(shù)為f(x),則其簡(jiǎn)單隨機(jī)樣本的聯(lián)合分布函數(shù)為其簡(jiǎn)單隨機(jī)樣本的聯(lián)合概率密度函數(shù)為=f(x1)f(x2)…f(xn)
一、總體和樣本解:例1一、總體和樣本解:例2一、總體和樣本一、總體和樣本
事實(shí)上我們抽樣后得到的資料都是具體的、確定的值.如我們從某班大學(xué)生中抽取10人測(cè)量身高,得到10個(gè)數(shù),它們是樣本取到的值而不是樣本.我們只能觀察到隨機(jī)變量取的值而見(jiàn)不到隨機(jī)變量.3.總體、樣本、樣本值的關(guān)系一、總體和樣本總體(理論分布)?
樣本
樣本值統(tǒng)計(jì)是從手中已有的資料--樣本值,去推斷總體的情況---總體分布F(x)的性質(zhì).總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷總體.樣本是聯(lián)系二者的橋梁一、總體和樣本例3
為對(duì)某小麥雜交組合F2代的株高X進(jìn)行研究,抽取容量為100的樣本,測(cè)試的原始數(shù)據(jù)記錄如下(單位:厘米),試根據(jù)以上數(shù)據(jù),畫(huà)出它的頻率直方圖,求隨機(jī)變量X的分布狀況.
87 88 111 91 73 70 92 98 105 9499 91 98 110 98 97 90 83 92 8886 94 102 99 89 104 94 94 92 9687 94 92 86 102 88 75 90 90 8084 91 82 94 99 102 91 96 94 9485 88 80 83 81 69 95 80 97 9296 109 91 80 80 94 102 80 86 9190 83 84 91 87 95 76 90 91 77103 89 88 85 95 92 104 92 95 8386 81 86 91 89 83 96 86 75 92二、分布密度的近似求法1.找出數(shù)據(jù)中最小值m=69,最大值M=111,極差為
M-m=422.數(shù)據(jù)分組,根據(jù)樣本容量n的大小,決定分組數(shù)k。一般規(guī)律30≤n≤405≤k≤640≤n≤606≤k≤860≤n≤1008≤k≤10100≤n≤50010≤k≤20二、分布密度的近似求法方法:整理原始數(shù)據(jù),加工為分組資料,作出頻率分布表,畫(huà)直方圖,提取樣本分布特征的信息.步驟如下:一般采取等距分組(也可以不等距分組),本例取k=9.本例測(cè)量單位為1厘米,組距為二、分布密度的近似求法組距=極差/組數(shù)3.確定組限和組中點(diǎn)值。注意:組的上限與下限應(yīng)比數(shù)據(jù)多一位小數(shù)。當(dāng)取a=67.5,b=112.49(a略小于m,b略大于M,且a和b都比數(shù)據(jù)多一位小數(shù)),分組如下:一般根據(jù):各組中點(diǎn)值
組距=組的上限或下限[67.5,72.5)[72.5,77.5)[77.5,82.5)[82.5,87.5)[87.5,92.5)[92.5,97.5)[97.5,102.5)[102.5,107.5)[107.5,112.5)組中值分別為:707580859095100105110二、分布密度的近似求法組序區(qū)間范圍頻數(shù)fj頻率Wj=fj/n累計(jì)頻率Fj1[67.5,72.5)20.020.022[72.5,77.5)50.050.073[77.5,82.5)100.100.174[82.5,87.5)180.180.355[87.5,92.5)300.30.656[92.5,97.5)180.180.837[97.5,102.5)100.10.938[102.5,107.5)40.040.979[107.5,112.5)30.031.004.將數(shù)據(jù)分組,計(jì)算各組頻數(shù),作頻數(shù)、頻率分布表二、分布密度的近似求法5.作出頻率直方圖以樣本值為橫坐標(biāo),頻率/組距為縱坐標(biāo);以分組區(qū)間為底,以為高作小矩形.作頻率直方圖二、分布密度的近似求法從頻率直方圖可看到:靠近兩個(gè)極端的數(shù)據(jù)出現(xiàn)比較少,而中間附近的數(shù)據(jù)比較多,即中間大兩頭小的分布趨勢(shì),——隨機(jī)變量分布狀況的最粗略的信息.在頻率直方圖中,每個(gè)矩形面積恰好等于樣本值落在該矩形對(duì)應(yīng)的分組區(qū)間內(nèi)的頻率,即頻率直方圖中的小矩形的面積近似地反映了樣本數(shù)據(jù)落在某個(gè)區(qū)間內(nèi)的可能性大小,故它可近似描述X的分布狀況.二、分布密度的近似求法三、分布函數(shù)的近似求法即不大于x的觀察值的頻率.三、分布函數(shù)的近似求法三、分布函數(shù)的近似求法例4抽取了某企業(yè)10個(gè)月的盈利額(單位:萬(wàn)元)3.22.5-42.50322.542設(shè)X為月盈利額,求X的經(jīng)驗(yàn)分布函數(shù)并畫(huà)圖.解:將樣本值由小到大排列為-4<0<2=2<2.5=2.5=2.5<3<3.2<4則其經(jīng)驗(yàn)分布函數(shù)為三、分布函數(shù)的近似求法三、分布函數(shù)的近似求法對(duì)于任何實(shí)數(shù)x,等于在n次重復(fù)獨(dú)立試驗(yàn)中事件的頻率,由頻率與概率的關(guān)系知,可作為總體X的分布函數(shù)F(x)的近似,且當(dāng)樣本容量充分大時(shí),幾乎為F(x).若總體X是離散型,圖形呈跳躍上升的階梯曲線(累計(jì)頻率曲線),若觀察值不重復(fù),則每次跳躍高度是1/n,若觀察值有重復(fù),則按重復(fù)次數(shù)的1/n倍跳躍.若總體是連續(xù)型,只要大致連接各階梯中點(diǎn)即可.
由樣本值去推斷總體情況,需要對(duì)樣本值進(jìn)行“加工”,這就要構(gòu)造一些樣本的函數(shù),它把樣本中所含的(某一方面)的信息集中起來(lái).1.統(tǒng)計(jì)量
這種不含任何未知參數(shù)的樣本的函數(shù)稱為統(tǒng)計(jì)量.它是完全由樣本決定的量.四、統(tǒng)計(jì)量定義例四、統(tǒng)計(jì)量未知,為來(lái)自X的樣本,則是統(tǒng)計(jì)量,不是統(tǒng)計(jì)量.注意:四、統(tǒng)計(jì)量1.統(tǒng)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 業(yè)主租賃委托協(xié)議
- 投資管理協(xié)議書(shū)
- 2025年度個(gè)人二手房居住權(quán)買(mǎi)賣(mài)及售后服務(wù)保障合同
- 2025年全球及中國(guó)電子級(jí)二氧化硅微粉行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025-2030全球固態(tài)開(kāi)關(guān)繼電器行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025年全球及中國(guó)紫外波段高光譜成像(HSI)設(shè)備行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025-2030全球H級(jí)三相干式電力變壓器行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 尾款協(xié)議書(shū)工程尾款承諾協(xié)議書(shū)
- 2025版智慧社區(qū)項(xiàng)目投資合同范本3篇
- 二零二五年度銀行存款賬戶凍結(jié)與解凍服務(wù)合同3篇
- 2025年春新人教版物理八年級(jí)下冊(cè)課件 第十章 浮力 第4節(jié) 跨學(xué)科實(shí)踐:制作微型密度計(jì)
- 2024-2025學(xué)年人教版數(shù)學(xué)六年級(jí)上冊(cè) 期末綜合試卷(含答案)
- 收養(yǎng)能力評(píng)分表
- 山東省桓臺(tái)第一中學(xué)2024-2025學(xué)年高一上學(xué)期期中考試物理試卷(拓展部)(無(wú)答案)
- 2024年全國(guó)統(tǒng)一高考英語(yǔ)試卷(新課標(biāo)Ⅰ卷)含答案
- 幼兒園公開(kāi)課:大班健康《國(guó)王生病了》課件
- 小學(xué)六年級(jí)說(shuō)明文閱讀題與答案大全
- 人教pep小學(xué)六年級(jí)上冊(cè)英語(yǔ)閱讀理解練習(xí)題大全含答案
- 國(guó)壽增員長(zhǎng)廊講解學(xué)習(xí)及演練課件
- 同等學(xué)力申碩英語(yǔ)考試高頻詞匯速記匯總
- GB 11887-2012首飾貴金屬純度的規(guī)定及命名方法
評(píng)論
0/150
提交評(píng)論