版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、課件制作:應(yīng)用數(shù)學(xué)系概率統(tǒng)計課程組概率論與數(shù)理統(tǒng)計第六章 數(shù)理統(tǒng)計的基本概念在終極的分析中,一切知識都是歷史.在抽象的意義下,一切科學(xué)都是數(shù)學(xué).在理性的世界里,所有的判斷都是統(tǒng)計學(xué).-C.R.勞6.1 數(shù)理統(tǒng)計學(xué)的基本概念6.1.1 引例6.1.2 統(tǒng)計與數(shù)理統(tǒng)計概述6.1.3 總體與樣本6.1.4 統(tǒng)計量引例 :某工廠生產(chǎn)大批電子元件.在實際應(yīng)用中,我們可以提出許多感興趣的問題1.這批元件的平均壽命如何?2.這批元件的壽命服從什么分布?3.如果你是使用單位.要求平均壽命能達(dá)到某個指定的數(shù)l,例如小時問這批元件可否被接受?4.如何獲得所需要的數(shù)據(jù)?6.1.1 引例6.1.2 統(tǒng)計和數(shù)理統(tǒng)計學(xué)概
2、述統(tǒng)計學(xué):在日常生活中.”統(tǒng)計”相當(dāng)于”計數(shù)”.小至一個家庭,單位,大至國家,都有許多計數(shù)即統(tǒng)計的工作. 丹麥統(tǒng)計史學(xué)家哈爾德認(rèn)為,”統(tǒng)計學(xué)”和”統(tǒng)計學(xué)家”詞出于意大利語:統(tǒng)計學(xué)即國情學(xué),對象是國務(wù)活動家感興趣的事實,而統(tǒng)計學(xué)家則是”處理國務(wù)的人”一、統(tǒng)計淺談Example 1.全國人口抽樣調(diào)查Example .比較兩種小麥品種的優(yōu)良()是問題中所涉及的研究對象為數(shù)很大,我們不可能全部加以研究,而只能用“一定的方式”挑選其中一部分去考察。()數(shù)據(jù)隨機性的另一種來源是試驗的隨機誤差,這是指那種在試驗過程中未加控制,無法控制,甚至不了解的因素所引起的誤差。所謂有效的方法()是可以建立一個在數(shù)學(xué)上可
3、以處理并盡可能簡單方便的模型來描述所得的數(shù)據(jù);()數(shù)據(jù)中要包含盡可能多的,與研究的問題有關(guān)的信息有效收集數(shù)據(jù)的問題構(gòu)成數(shù)理統(tǒng)計的兩個分支:抽樣理論;,試驗設(shè)計Example 1.考察馬鞍山市人均消費水平Example 2:吸煙與肺癌的關(guān)系吸煙增加患肺癌,其他癌癥以及諸如心臟病等嚴(yán)重疾病的危險,英國學(xué)者多爾與希爾從倫敦家醫(yī)院中收集了名肺癌病人以及對照組另名患肺癌者的吸煙情況的資料,按吸煙斗還是紙煙,男或女,將煙吞進(jìn)肺里與否等指標(biāo)分類Example 1.設(shè)想有一枚價值高的鉆石,想用一架天平盡可能準(zhǔn)確地稱出它的重量有多少?統(tǒng)計結(jié)論:吸煙與患肺癌呈明顯的正相關(guān).如何理解這個統(tǒng)計規(guī)律的意義?首先,統(tǒng)計規(guī)
4、律是關(guān)于群體的規(guī)律。 對于群體中的個體情況復(fù)雜多樣,沒有一定.拿本例來說:有吸煙很多而終生保持健康者,也有不吸煙而很早罹患肺癌者,不能用這類個別例子來否定二和者有正相關(guān)性的結(jié)論,因為它講的是群體中一種趨勢。 可能會有疑問:群體是抽象的,每件事都必須落實到具體的個體,患不患肺癌是每個人的事,這樣關(guān)于群體中的趨勢的規(guī)律有何意義?統(tǒng)計應(yīng)用實例:1 孟德爾遺傳定律的發(fā)現(xiàn);中國患SARS的病人的死亡率是多少;太陽黑子的活動有周期性的規(guī)律嗎?這種規(guī)律反映了某種客觀存在的現(xiàn)實有科學(xué)和認(rèn)識意義。對個體有警戒作用。5.經(jīng)濟統(tǒng)計分析 6.科學(xué)研究統(tǒng)計分析 問題1實質(zhì):從10000人的收入出發(fā),估計全體馬鞍山市民收
5、入分布的某些數(shù)字特征(此處是期望和方差)。-在數(shù)理統(tǒng)計中,解決這類問題的方法稱為參數(shù)估計。問題2實質(zhì):根據(jù)抽查得到的數(shù)據(jù),去檢驗總體收入的某個數(shù)字特征(此處是期望)與給定值的差異。-在數(shù)理統(tǒng)計中,解決這類問題的方法稱為假設(shè)檢驗。問題3實質(zhì):分析數(shù)據(jù)誤差的原因(此處是行業(yè))。當(dāng)有多個因素起作用時,還要分析哪些因素起主要作用。-在數(shù)理統(tǒng)計中,解決這類問題的方法稱為方差分析。問題4實質(zhì):根據(jù)觀察數(shù)據(jù)研究變量間(此處是收入與年齡間)的關(guān)系。-在數(shù)理統(tǒng)計中,解決這類問題的方法稱為回歸分析。參數(shù)估計(Parametric Estimation) 假設(shè)檢驗(Hypothesis Testing) 回歸分析(
6、Regression) 方差分析(Analysis of variance) 推斷 統(tǒng)計學(xué)三、數(shù)理統(tǒng)計包含的內(nèi)容總體選擇個體樣本觀測樣本樣本觀察值(數(shù)據(jù))數(shù)據(jù)處理樣本有關(guān)結(jié)論推斷總體性質(zhì) 統(tǒng)計量 為了集中簡單隨機樣本所帶來的總體信息,考慮樣本的函數(shù),且不含任何未知參數(shù),這樣的“不含未知參數(shù)的樣本的函數(shù)”稱為統(tǒng)計量。統(tǒng)計量的分布稱為抽樣分布.四、統(tǒng)計的一般步驟總體 研究對象全體元素組成的集合 所研究的對象的某個(或某些)數(shù)量指標(biāo)的全體,它是一個隨機變量(或多維隨機變量),記為X . X 的分布函數(shù)和數(shù)字特征稱為總體的分布函數(shù)和數(shù)字特征.6.1.3 總體(population)和樣本(Sample
7、)樣本 從總體中抽取的部分個體.稱 為總體 X 的一個容量為n 的樣本觀測值,或稱樣本的一個實現(xiàn).用 表示樣本, n 為樣本容量.樣本空間 樣本所有可能取值的集合. 個體 組成總體的每一個元素 即總體的每個數(shù)量指標(biāo),可以看作隨機變量 X 的某個取值.用 表示.若總體 X 的樣本 滿足:一般,對有限總體,采用放回抽樣所得到的樣本為簡單隨機樣本,但使用不方便,常用不放回抽樣代替.而代替的條件是(1)要有代表性 與X 有相同的分布(2) 相互獨立則稱 為簡單隨機樣本.簡單隨機樣本(i.i.d)其中N為總體中個體的數(shù)目,n 為樣本容量.N / n 10.設(shè) 為總體X 的簡單隨機樣本, X 的分布函數(shù)為
8、F (x), 若總體X 的概率密度函數(shù)為f( x), 則 的聯(lián)合概率密度函數(shù)為則 的聯(lián)合分布函數(shù)為設(shè)有放回地抽取了一個容量為n 的樣本的聯(lián)合分布為其樣本值為樣本空間為若抽樣是無放回地,則前次抽取的結(jié)果會影響后面抽取的結(jié)果.例如所以, 當(dāng)樣本容量n 與總體中個體數(shù)目N 相比很小時, 可將無放回抽樣近似地看作放回抽樣.在實際如何獲得簡單隨機樣本?Example:一批燈泡有個,要從中抽個作壽命試驗,如何選這個燈泡?方案準(zhǔn)備個完全相同的球,球上依次寫上,放在盒中,并徹底攪亂,然后取個球方案利用“隨機數(shù)表,可以從表中任意位置開始讀數(shù)(每三個數(shù)為一組)如:,方案可利用計算機產(chǎn)生個間的不同的隨機整數(shù)樣本來自
9、總體,樣本的觀察值就含有總體各個方面的信息,但這些信息較為分散,為使這些分散在樣本中有關(guān)的信息集中起來反映總體的各種特征,需對樣本進(jìn)行加工,一種有效的辦法就是構(gòu)造樣本的函數(shù),不同的樣本函數(shù)反映總體的不同特征,這種函數(shù)便是統(tǒng)計量。6.1.4 統(tǒng)計量(Statistic)若是一個樣本值,稱的一個樣本值.為統(tǒng)計量設(shè) 是總體X 的一個樣本, 參數(shù),則稱隨機變量為統(tǒng)計量.定義為一實值連續(xù)函數(shù),且不含有未知Problem:用什么統(tǒng)計量來刻畫所考察的對象?Example:某大學(xué)新聘一位教授,給位研究生上課,期末考試成績?nèi)缦拢海煽兩蠄蠛蠼虒W(xué)院長認(rèn)為:試題太易,因為的的就有人系主任認(rèn)為:考題偏難,因為平均成績
10、才.分教授認(rèn)為:考題適宜,因為從總體看分是有代表性的,多于分和少于分的人數(shù)相等誰的話有道理?常用的統(tǒng)計量: 為樣本均值 為樣本方差為樣本標(biāo)準(zhǔn)差設(shè)是來自總體 X 的容量為 n 的樣本,稱統(tǒng)計量為樣本的k 階原點矩為樣本的k 階中心矩例如例1 是未知參數(shù), 但不是統(tǒng)計量.若 , 已知,則為統(tǒng)計量.是一樣本,是統(tǒng)計量, 其中則(5) 順序統(tǒng)計量(Order Statistic)與極差設(shè)為樣本的一個實現(xiàn),且當(dāng)取值為時,定義隨機變量則稱統(tǒng)計量為順序統(tǒng)計量.其中稱為極差(sample rang)注:樣本方差 與樣本二階中心矩 的不同故推導(dǎo)關(guān)系式1)推導(dǎo) 設(shè)則2)例2 從一批機器零件毛坯中隨機地抽取10件,
11、測得其重量為(單位: 公斤): 210, 243, 185, 240, 215, 228, 196, 235, 200, 199求這組樣本值的均值、方差、二階原點矩與二階中心矩.解令則例 設(shè)總體X 的概率密度函數(shù)為為總體的樣本,求(1)的數(shù)學(xué)期望與方差(2) (3) 解 (1)(近似),(3)由中心極限定理(2)內(nèi)容小結(jié):1.統(tǒng)計和數(shù)理統(tǒng)計基本概述2.總體和樣本3.常用統(tǒng)計量:樣本均值;樣本方差; 樣本的k 階中心矩。6.2 正態(tài)樣本統(tǒng)計量的抽樣分布6.2.1 正態(tài)分布6.2.3 t分布(學(xué)生分布)6.2.4 F分布6.2.2 (卡方)分布6.2.5 正態(tài)總體抽樣分布的某些結(jié)論6.2.6 Ex
12、cel實現(xiàn) 確定統(tǒng)計量的分布 抽樣分布, 是數(shù)理統(tǒng)計的基本問題之一. 采用求隨機向量的函數(shù)的分布的方法可得到抽樣分布.由于樣本容量一般不止 2 或 3 (甚至還可能是隨機的), 故計算往往很復(fù)雜, 有時還需要特殊技巧或特殊工具. 由于正態(tài)總體是最常見的總體, 故本節(jié)介紹的幾個抽樣分布均對正態(tài)總體而言.6.2.1 正態(tài)分布(Normal distribution)則特別地,則若i.i.d.若i.i.d.上(雙)側(cè) 分位數(shù)的概念 設(shè)X 為連續(xù)型隨機變量,其概率密度函數(shù)為f ( x ) , 為給定常數(shù), 0 1 若則稱 x 為X 所服從的分布的上 分位數(shù).如果 X 的概率密度函數(shù)為偶函數(shù),則對于滿足
13、 0 0 時收斂,稱為 函數(shù),具有性質(zhì)的密度函數(shù)為自由度為 n 的n=2n = 3n = 5n = 10n = 15 分布密度函數(shù)圖例如分布的性質(zhì)20.05(10)n = 10()05.0307.18)10(307.18)10(2205.0=ccP相互獨立,證 1設(shè)則6.2.3 t 分布 (Student 分布)定義則T 所服從的分布稱為自由度為 n 的t 分布其密度函數(shù)為X , Y 相互獨立,設(shè)t 分布的圖形(紅色的是標(biāo)準(zhǔn)正態(tài)分布)n = 1n=20t 分布的性質(zhì)1f n(t)是偶函數(shù),2t分布的上 分位數(shù) t 與雙測 分位數(shù) t/2 有表可查n = 10t-tt/2-t/2/2/2 6.2
14、.4 F 分布(F distribution with n and m degrees)則F 所服從的分布稱為第一自由度為n ,第二自由度為m 的F 分布,其密度函數(shù)為定義X , Y 相互獨立,設(shè)令m = 10, n = 4m = 10, n = 10m = 10, n = 15m = 4, n =10m = 10, n =10m = 15, n =10F 分布的性質(zhì)例如事實上,故但F(n,m)19.5)5,4(05.0=F?)4,5(95.0=F例1 證明證證例2 證明:設(shè)令6.2.5 正態(tài)總體抽樣分布的某些結(jié)論() 一個正態(tài)總體與相互獨立設(shè)總體的樣本為( ),則(1)(2)( II ) 兩
15、個正態(tài)總體設(shè)是來自正態(tài)總體的一個簡單隨機樣本是來自正態(tài)總體的一個簡單隨機樣本它們相互獨立. 令則若則(3)設(shè)是來自正態(tài)總體的一個簡單隨機樣本是來自正態(tài)總體的一個簡單隨機樣本 ,它們相互獨立. 則與相互獨立(4)例3 設(shè)總體大于70 的概率不小于 90% ,則樣本容量 ,為使樣本均值解 設(shè)樣本容量為 n , 則故令查表得即所以取 .42例4 從正態(tài)總體中,抽取了 n = 20 的樣本(1) 求(2) 求解 (1)即故(P.386)(2) 故例5 設(shè)X 與Y 相互獨立, X N(0,16), Y N(0,9) , X1, X2 , X9 與 Y1, Y2 , Y16 分別是取自 X 與 Y 的簡單
16、隨機樣本, 求統(tǒng) 計量所服從的分布.解從而例6 設(shè)總體的樣本,為總體 X試確定常數(shù)c 使cY 服從分布.解故因此例7 設(shè)是來自正態(tài)總體N ( , 2 )的簡單隨機樣本, 是樣本均值,則服從自由度為n - 1的t 分布的隨機變量為:故應(yīng)選(B)解例8 在總體XN(12,4)中抽取容量為5的樣本X1,X2,X5,求下列概率: (1)因為=2(1.118)-1=0.7364解解=0.2923例8 在總體XN(12,4)中抽取容量為5的樣本X1,X2,X5,求下列概率:解=0.4215例8 在總體XN(12,4)中抽取容量為5的樣本X1,X2,X5,求下列概率:Step1 在數(shù)據(jù)編輯窗口中,建立數(shù)據(jù)文件; Step2 計算樣本均值調(diào)用Average 函數(shù):Step3 計算樣本方差調(diào)用Var 函數(shù) ;Step4 計算樣本標(biāo)準(zhǔn)差調(diào)用Stdev 函數(shù). (1) 利用Excel計算樣本均值、樣本方差、樣本標(biāo)準(zhǔn)差 6.2.6 Excel實現(xiàn)Step1 計算標(biāo)準(zhǔn)正態(tài)分布的上側(cè)分位數(shù) Step2 計算 的上側(cè)分位數(shù) Step3 計算 的上側(cè)分位數(shù) Step4 計算 的上側(cè)分位數(shù) (2) 利用Excel計算四大分布的分位數(shù)內(nèi)容小結(jié):1. 正態(tài)分布3. t分布(學(xué)生分布)4. F
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度資產(chǎn)收購項目全程跟蹤與法律支持合同3篇
- 二零二五版勞動合同延期與員工離職福利協(xié)議3篇
- 2024版環(huán)保設(shè)備設(shè)計與制造合同
- 2024年高級廚師勞務(wù)合同樣本3篇
- 2024年股權(quán)交易與分配合同版B版
- 2024版整治水渠的施工合同
- 2024年老鼠capture技術(shù)服務(wù)合同
- 2025年度網(wǎng)紅餐飲店員工權(quán)益保障合同范本3篇
- 2024年生態(tài)城市人工頂管施工環(huán)保合同2篇
- 旅游產(chǎn)品銷售合同
- 常用靜脈藥物溶媒的選擇
- 當(dāng)代西方文學(xué)理論知到智慧樹章節(jié)測試課后答案2024年秋武漢科技大學(xué)
- 2024年預(yù)制混凝土制品購銷協(xié)議3篇
- 2024-2030年中國高端私人會所市場競爭格局及投資經(jīng)營管理分析報告
- GA/T 1003-2024銀行自助服務(wù)亭技術(shù)規(guī)范
- 《消防設(shè)備操作使用》培訓(xùn)
- 新交際英語(2024)一年級上冊Unit 1~6全冊教案
- 2024年度跨境電商平臺運營與孵化合同
- 2024年電動汽車充電消費者研究報告-2024-11-新能源
- 湖北省黃岡高級中學(xué)2025屆物理高一第一學(xué)期期末考試試題含解析
- 上海市徐匯中學(xué)2025屆物理高一第一學(xué)期期末學(xué)業(yè)水平測試試題含解析
評論
0/150
提交評論