概率統(tǒng)計(jì)學(xué)-數(shù)理統(tǒng)計(jì)的基本概念_第1頁
概率統(tǒng)計(jì)學(xué)-數(shù)理統(tǒng)計(jì)的基本概念_第2頁
概率統(tǒng)計(jì)學(xué)-數(shù)理統(tǒng)計(jì)的基本概念_第3頁
概率統(tǒng)計(jì)學(xué)-數(shù)理統(tǒng)計(jì)的基本概念_第4頁
概率統(tǒng)計(jì)學(xué)-數(shù)理統(tǒng)計(jì)的基本概念_第5頁
已閱讀5頁,還剩35頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第七章數(shù)理統(tǒng)計(jì)的基本概念1

在終極的分析中,

一切知識(shí)都是歷史.

在抽象的意義下,

一切科學(xué)都是數(shù)學(xué).

在理性的世界里,

所有的判斷都是統(tǒng)計(jì)學(xué).

----C.R.勞7.1

數(shù)理統(tǒng)計(jì)學(xué)的基本概念7.1.1引例7.1.2統(tǒng)計(jì)與數(shù)理統(tǒng)計(jì)概述7.1.3總體與樣本7.1.4統(tǒng)計(jì)量3引例:某工廠生產(chǎn)大批電子元件.在實(shí)際應(yīng)用中,我們可以提出許多感興趣的問題1.這批元件的平均壽命如何?2.這批元件的壽命服從什么分布?3.如果你是使用單位.要求平均壽命能達(dá)到某個(gè)指定的數(shù),例如5000小時(shí).問這批元件可否被接受?4.如何獲得所需要的數(shù)據(jù)?7.1.1引例47.1.2統(tǒng)計(jì)和數(shù)理統(tǒng)計(jì)學(xué)概述統(tǒng)計(jì)學(xué):在日常生活中.“統(tǒng)計(jì)”相當(dāng)于“計(jì)數(shù)”.小至一個(gè)家庭,單位,大至國家,都有許多計(jì)數(shù)即統(tǒng)計(jì)的工作.

丹麥統(tǒng)計(jì)史學(xué)家哈爾德認(rèn)為,“統(tǒng)計(jì)學(xué)”和“統(tǒng)計(jì)學(xué)家”詞出于意大利語:統(tǒng)計(jì)學(xué)即國情學(xué),對(duì)象是國務(wù)活動(dòng)家感興趣的事實(shí),而統(tǒng)計(jì)學(xué)家則是“處理國務(wù)的人”一、統(tǒng)計(jì)淺談5

數(shù)理統(tǒng)計(jì):它是使用概率論和數(shù)學(xué)的方法,研究怎樣用有效的方法收集(通過試驗(yàn)或觀察)帶有隨機(jī)誤差的數(shù)據(jù),并在設(shè)定的模型(統(tǒng)計(jì)模型)之下,對(duì)這種數(shù)據(jù)進(jìn)行分析(統(tǒng)計(jì)分析)以對(duì)所研究的問題作出推斷(統(tǒng)計(jì)推斷).1.數(shù)據(jù)必須帶有隨機(jī)性的影響,才能成為數(shù)理統(tǒng)計(jì)學(xué)的研究對(duì)象數(shù)據(jù)隨機(jī)性的來源:國家:State.統(tǒng)計(jì)學(xué)Statistics6Example1.全國人口抽樣調(diào)查Example2.比較兩種小麥品種的優(yōu)良(1)是問題中所涉及的研究對(duì)象為數(shù)很大,我們不可能全部加以研究,而只能用“一定的方式”挑選其中一部分去考察。(2)數(shù)據(jù)隨機(jī)性的另一種來源是試驗(yàn)的隨機(jī)誤差,這是指那種在試驗(yàn)過程中未加控制,無法控制,甚至不了解的因素所引起的誤差。72.所謂有效的方法(1)是可以建立一個(gè)在數(shù)學(xué)上可以處理并盡可能簡單方便的模型來描述所得的數(shù)據(jù);(2)數(shù)據(jù)中要包含盡可能多的,與研究的問題有關(guān)的信息.8

——從部分推斷整體的性質(zhì),是一種在對(duì)有關(guān)信息缺乏完全掌握的情況下進(jìn)行推斷的方法

——統(tǒng)計(jì)規(guī)律是關(guān)于群體的規(guī)律,“統(tǒng)計(jì)規(guī)律”這個(gè)提法的啟示是:教人看問題不可絕對(duì)化,因而有思想方法上的意義.統(tǒng)計(jì)規(guī)律未必蘊(yùn)涵因果關(guān)系.?dāng)?shù)理統(tǒng)計(jì)的特點(diǎn)歸納與演繹統(tǒng)計(jì)規(guī)律與因果關(guān)系二、數(shù)理統(tǒng)計(jì)的特點(diǎn):9Example2:吸煙與肺癌的關(guān)系吸煙增加患肺癌,其他癌癥以及諸如心臟病等嚴(yán)重疾病的危險(xiǎn).1948-1949,英國學(xué)者多爾與希爾從倫敦20家醫(yī)院中收集了709名肺癌病人以及對(duì)照組-另709名患肺癌者的吸煙情況的資料,按吸煙斗還是紙煙,男或女,將煙吞進(jìn)肺里與否等指標(biāo)分類.Example1.設(shè)想有一枚價(jià)值高的鉆石,想用一架天平盡可能準(zhǔn)確地稱出它的重量有多少?10統(tǒng)計(jì)結(jié)論:吸煙與患肺癌呈明顯的正相關(guān).如何理解這個(gè)統(tǒng)計(jì)規(guī)律的意義?首先,統(tǒng)計(jì)規(guī)律是關(guān)于群體的規(guī)律。

可能會(huì)有疑問:群體是抽象的,每件事都必須落實(shí)到具體的個(gè)體,患不患肺癌是每個(gè)人的事,這樣關(guān)于群體中的趨勢的規(guī)律有何意義?1.這種規(guī)律反映了某種客觀存在的現(xiàn)實(shí),有科學(xué)和認(rèn)識(shí)意義。2.對(duì)個(gè)體有警戒作用。11統(tǒng)計(jì)應(yīng)用實(shí)例:1.孟德爾遺傳定律的發(fā)現(xiàn);2.中國患SARS的病人的死亡率是多少;3.太陽黑子的活動(dòng)有周期性的規(guī)律嗎?124.股票分析系統(tǒng)

5.經(jīng)濟(jì)統(tǒng)計(jì)分析

總體選擇個(gè)體樣本觀測樣本樣本觀察值(數(shù)據(jù))數(shù)據(jù)處理樣本有關(guān)結(jié)論推斷總體性質(zhì)

統(tǒng)計(jì)量

為了集中簡單隨機(jī)樣本所帶來的總體信息,考慮樣本的函數(shù),且不含任何未知參數(shù),這樣的“不含未知參數(shù)的樣本的函數(shù)”稱為統(tǒng)計(jì)量。統(tǒng)計(jì)量的分布稱為抽樣分布.15

——

對(duì)隨機(jī)現(xiàn)象進(jìn)行觀測、試驗(yàn),以取得有代表性的觀測值

——

對(duì)已取得的觀測值進(jìn)行整理、分析,作出推斷、決策,從而找出所研究的對(duì)象的規(guī)律性數(shù)理統(tǒng)計(jì)的分類描述統(tǒng)計(jì)學(xué)推斷統(tǒng)計(jì)學(xué)16參數(shù)估計(jì)

假設(shè)檢驗(yàn)回歸分析方差分析推斷統(tǒng)計(jì)學(xué)推斷統(tǒng)計(jì)學(xué)17總體

——

研究對(duì)象全體元素組成的集合所研究的對(duì)象的某個(gè)(或某些)數(shù)量指標(biāo),是一個(gè)隨機(jī)變量或多維隨機(jī)變量.

隨機(jī)變量可記為X

.例如,某鋼鐵廠生產(chǎn)的鋼錠的強(qiáng)度.

X

的分布函數(shù)和數(shù)字特征稱為總體的分布函數(shù)和數(shù)字特征.總體和樣本§7.1.3基本概念18抽樣

——

做隨機(jī)試驗(yàn)并記錄其結(jié)果樣本

——

從總體中抽取的部分個(gè)體進(jìn)行觀測.稱為總體X

的一個(gè)容量為n

的樣本觀測值,或稱樣本的一個(gè)實(shí)現(xiàn).用表示樣本,n

為樣本容量.樣本空間

——

樣本所有可能取值的集合.

個(gè)體

——

組成總體的每一個(gè)元素個(gè)體的數(shù)量指標(biāo),可以看作隨機(jī)變量X的某個(gè)取值.用表示.

19

設(shè)是來自總體

X的一個(gè)樣本,它滿足:一般地,對(duì)有限總體,采用放回抽樣所得到的樣本為簡單隨機(jī)樣本,但使用不方便,常用不放回抽樣代替.當(dāng)總體中個(gè)體的數(shù)目N

與樣本容量n

之比N/n

10時(shí),可將不放回抽樣近似地看作放回抽樣.(1)與X

有相同的分布(2)獨(dú)立性:相互獨(dú)立則稱

為簡單隨機(jī)樣本.簡單隨機(jī)樣本20設(shè)總體X

的分布函數(shù)為F(x),為總體X

的簡單隨機(jī)樣本,若總體X

的概率密度函數(shù)為f(

x),則的聯(lián)合概率密度函數(shù)為則的聯(lián)合分布函數(shù)為21設(shè)是取自總體X的一個(gè)樣本,為一實(shí)值連續(xù)函數(shù),且不含有未知參數(shù),則稱隨機(jī)變量為統(tǒng)計(jì)量.若是一個(gè)樣本值,稱的一個(gè)樣本值為統(tǒng)計(jì)量定義統(tǒng)計(jì)量22例

是未知參數(shù),但不是統(tǒng)計(jì)量.是一樣本,是統(tǒng)計(jì)量,其中則若,

已知,則為統(tǒng)計(jì)量23常用的統(tǒng)計(jì)量為樣本均值為樣本方差為樣本標(biāo)準(zhǔn)差設(shè)是來自總體

X

的容量為n

的樣本,稱統(tǒng)計(jì)量24為樣本的k

階原點(diǎn)矩為樣本的k

階中心矩25例如(5)順序統(tǒng)計(jì)量設(shè)為樣本,為樣本值,且當(dāng)取值為時(shí),定義隨機(jī)變量則稱統(tǒng)計(jì)量為順序統(tǒng)計(jì)量.其中,26

樣本方差與樣本二階中心矩的關(guān)系故證明:1)27推導(dǎo)

設(shè)則2)28例1

從一批機(jī)器零件毛坯中隨機(jī)地抽取10件,

測得其重量為(單位:公斤):

210,243,185,240,215,228,196,235,200,199求這組樣本值的均值、方差、二階原點(diǎn)矩與二階中心矩.解令29則30例2

設(shè)總體X的概率密度函數(shù)為為總體的樣本,求(1)的數(shù)學(xué)期望與方差(2)(3)解(1)31(近似),(3)由中心極限定理(2)32§7.3統(tǒng)計(jì)量的分布

確定統(tǒng)計(jì)量的分布——抽樣分布,是數(shù)理統(tǒng)計(jì)的基本問題之一.

由于正態(tài)總體是最常見的總體,故本節(jié)介紹的幾個(gè)抽樣分布均對(duì)正態(tài)總體而言.問題:計(jì)算往往很復(fù)雜方法:求隨機(jī)向量的函數(shù)的分布可得到抽樣分布.33(1)

正態(tài)分布則特別地,則統(tǒng)計(jì)中常用分布若i.i.d.~若i.i.d.~34(2)分布(n為自由度)定義設(shè)相互獨(dú)立,且都服從標(biāo)準(zhǔn)正態(tài)分布N(0,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論