




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數(shù)理統(tǒng)計緒論1.1數(shù)理統(tǒng)計介紹1.2總體和總體分布1.3樣本和樣本分布
緒論1.4統(tǒng)計量1.5經驗分布函數(shù)1.1數(shù)理統(tǒng)計介紹1.1.1數(shù)理統(tǒng)計學的任務自然界現(xiàn)象分為兩大類確定性現(xiàn)象隨機現(xiàn)象用隨機變量(向量)描述但是,在許多實際問題中,描述隨機現(xiàn)象的隨機變量的概率分布完全未知或不完全知道.此時,如何研究隨機現(xiàn)象中的有關問題呢?隨機變量的概率分布不確定,
是數(shù)理統(tǒng)計研究的第一前提!統(tǒng)計學的任務是研究如何有效地收集、整理和分析帶有隨機性影響的數(shù)據,從而對所考慮的問題作出一定結論的方法和理論.研究統(tǒng)計學方法中理論基礎問題那部分構成數(shù)理統(tǒng)計的內容.統(tǒng)計學是數(shù)據科學,用數(shù)據(事實)說話:有理有據說理.解決實際問題的過程對隨機現(xiàn)象進行試驗或觀測,以有效的方式收集、整理和分析帶有隨機性影響的數(shù)據,以便對所考察的問題作出推斷和預測,直至為采取一定的決策和行動提供依據和建議.數(shù)據帶有隨機性是數(shù)理統(tǒng)計研究的第二前提!收集數(shù)據的方法全面調查抽樣調查安排試驗有效的收集數(shù)據1下面通過例子詳細說明例1.1.1人口普查和抽樣調查普查又稱全面調查,因普查費用高、時間長,不常使用,破壞性檢查(如燈泡壽命試驗)更不會使用.只有在少數(shù)重要場合才會使用普查.如我國規(guī)定每十年進行一次人口普查,期間九年中每年進行一次人口抽樣調查.抽樣調查在全面調查不可靠時的一種補充方法.如何安排抽樣調查,是有效收集數(shù)據的一個重要問題.——抽樣調查方法例1.1.2考察某地區(qū)10000戶農戶的經濟狀況若該地區(qū)分為平原和山區(qū)兩部分,平原較富,占該地區(qū)農戶的70%,而占30%的山區(qū)農戶較窮.抽樣方案規(guī)定在抽取的100戶中,從平原地區(qū)抽70戶,山區(qū)抽30戶,之后在各自范圍內用隨機化方法抽取.從中挑選100戶做抽樣調查.收集數(shù)據中,數(shù)據必須帶有隨機性例1.1.2中,隨機性:抽樣的100戶農戶是從10000戶農戶中按照一定的方式“隨機抽取”的;代表性:平原和山區(qū)按照比例抽取.假如只在該地區(qū)富裕的那部分農戶中挑選,得到的數(shù)據就不具有代表性,更談不上有效.例1.1.2中,有效收集數(shù)據是通過合理的設計抽樣方案實現(xiàn).例1.1.3.(提高某化工產品轉化率的試驗)某種化工產品的轉化率可能與反應溫度A、反應時間B、某兩種原料配比C、真空度D有關.為尋找最優(yōu)的生產條件,以提高該化工產品的轉化率,因此考慮對A、B、C、D這四個因素進行試驗,根據以往經驗,確定每個因素只需考慮三個水平,數(shù)據如下表所示.
水平因素123反應溫度A607080反應時間B2.53.03.5原料配比C
1.1:11.15:11.2:1真空度D500550600理想的做法:各種因素所有水平搭配下都做試驗,4個因素,每個因素3個水平,共需要做34=81次試驗.提出要求:如何通過盡可能少的試驗獲得盡可能多的信息.設計試驗:選81種搭配的一部分,每個因素的每個水平都出現(xiàn),且能反映出交互作用,以獲得最佳或較好的試驗條件.不現(xiàn)實:耗時、耗力、耗經費數(shù)理統(tǒng)計的另一個分支——試驗設計它主要利用現(xiàn)成的規(guī)范化的表——正交表來科學的安排試驗方案和分析試驗結果.優(yōu)點在很多試驗方案(試驗條件)中挑選出代表性很強的少數(shù)試驗方案,并通過對少數(shù)試驗方案試驗結果的分析,推斷出最優(yōu)方案.例1.1.3中,有效收集數(shù)據是通過科學安排試驗的方法實現(xiàn).例1.1.3中,數(shù)據的隨機性是由試驗誤差體現(xiàn).化工產品的轉化率除了受溫度、時間和原料配比影響外還受一些無法控制,甚至仍未被人們認識的因素影響.如:每次試驗中受試驗材料產地的影響、所使用儀器設備精度的影響和操作者水平的影響等.這些因素無法或者不便加以完全控制,從而對試驗結果產生隨機性的影響,因此帶來不確定性.有效的使用數(shù)據2獲取數(shù)據后,需要利用有效的方法去集中和提取數(shù)據中的有關信息,對所研究的問題作出一定的結論,統(tǒng)計上稱之為推斷.——統(tǒng)計推斷1用算術平均值計算該村農戶年均收入如下例1.1.4某農村有100戶農戶,要調查此村農戶是否脫貧.脫貧的標準是每戶年均收入超過1萬元.經調查此村90戶農民年收入5000元,10戶農民年收入10萬元,問此村農戶是否脫貧?結論:該村農民脫貧.但是90%的農戶年均收入只有5000元,事實未脫貧.2用樣本中位數(shù)計算該村農戶年收入將100戶農戶的年收入記為x1,x2,…,x100,將其按照大小排列為樣本中位數(shù)定義為排在最中間兩戶的平均值結論:該村農民未脫貧,與實際情況相符.例1.1.4說明為有效地使用數(shù)據進行推斷,就要涉及統(tǒng)計中的一些準則,以評價推斷的優(yōu)良性,因此采用合適的統(tǒng)計方法是有效使用數(shù)據的一個重要方面.隨機現(xiàn)象的統(tǒng)計規(guī)律性隨機變量及其概率分布全面描述分布函數(shù)F(x)密度函數(shù)f(x)分布律pi概率論:已知隨機變量的分布,可求得:
某個隨機事件發(fā)生的概率,隨機變量落在某個區(qū)間的
概率,隨機變量的數(shù)字特征如均值,方差,協(xié)方差,
相關系數(shù)等.推理的方向:知道原因,推出結果.概率論1.1.2數(shù)理統(tǒng)計與概率論的關系在許多實際問題中,描述隨機現(xiàn)象的隨機變量的概率分布可能完全不知道或者是不完全知道.我們通過對所研究的隨機變量進行重復獨立的觀察得到許多觀察值,對這些數(shù)據進行統(tǒng)計分析,從而對所研究的隨機變量的分布作出推斷.數(shù)理統(tǒng)計:已知隨機變量的取值(數(shù)據),去求隨機變量的分布,或一些數(shù)字特征如均值,方差,協(xié)方差,相關系數(shù)等.推理的方向:知道結果,推斷原因.數(shù)理統(tǒng)計
概率論是數(shù)理統(tǒng)計的基礎,而數(shù)理統(tǒng)計是概率論的重要應用.
但它們是兩個并列的數(shù)學分支學科,并無從屬關系.統(tǒng)計的結果不是必然的,會帶有誤差或犯錯誤.所以,統(tǒng)計推斷要盡可能地減少誤差,盡可能地減少犯錯誤的概率.統(tǒng)計思想,統(tǒng)計方法,統(tǒng)計理論.怎么辦?統(tǒng)計推斷屬于歸納推理方法.數(shù)理統(tǒng)計學的研究內容非常豐富,且形成了多個分支,如回歸分析、抽樣調查、試驗設計、可靠性統(tǒng)計、多元統(tǒng)計分析、非參數(shù)統(tǒng)計和貝葉斯(Bayes)統(tǒng)計等.由于隨機現(xiàn)象無處不在,因此其應用越來越廣泛深入,在國民經濟和科學技術中的地位越來越重要.目前,數(shù)理統(tǒng)計學已經涉及到金融、經濟、生物、工程技術、醫(yī)學、工農業(yè)生產、地質、質量控制、航天航空等諸多領域.無論是自然科學還是社會科學都離不開統(tǒng)計.1.1.3數(shù)理統(tǒng)計的應用領域只要一個實際問題有數(shù)據,我們就可以用數(shù)理統(tǒng)計的方法去分析并解決該實際問題.數(shù)理統(tǒng)計方法所處理的只是在各種專門學科中帶普遍性(共性)且受隨機性影響的數(shù)據收集、整理和推斷問題,而不涉及各種專門學科中的具體問題.這種帶共性的問題既然是從專門領域中提煉出來,就可以用數(shù)學的方法去研究,這就是數(shù)理統(tǒng)計的研究任務.數(shù)理統(tǒng)計方法有很廣泛的實用性,與很多專門學科有關.統(tǒng)計方法只是從事物外在數(shù)量上的表現(xiàn)去推斷事物可能的規(guī)律性.統(tǒng)計方法本身不能說明何以會有這個規(guī)律性.例如:用統(tǒng)計方法分析得到吸煙與某些呼吸系統(tǒng)的疾病有關.這純粹是從吸煙者和不吸煙者的發(fā)病率的對比分析得到結論.它不能解釋吸煙何以會增加患這類疾病的危險性,這是醫(yī)學這個專門學科的任務.2015年,首次提出“國家大數(shù)據戰(zhàn)略”,旨在全面推進我國大數(shù)據發(fā)展和應用,加快建設數(shù)據強國,推動數(shù)據資源開放共享,大數(shù)據戰(zhàn)略上升為國家戰(zhàn)略。2017年,國務院印刷《新一代人工智能發(fā)展規(guī)劃》,把人工智能發(fā)展放在國家戰(zhàn)略層面系統(tǒng)布局.我們已經進入大數(shù)據和人工智能時代,從大量數(shù)據中尋找客觀規(guī)律并加以利用,成為目前科技發(fā)展和社會進步的重要驅動力.數(shù)理統(tǒng)計正是研究和揭示隨機現(xiàn)象統(tǒng)計規(guī)律性的一門數(shù)學學科.目前算法與統(tǒng)計的結合促成了機器學習、人工智能的爆發(fā),機器學習和人工智能已經主導了這個時代科技應用的方向,由此足見統(tǒng)計應用的廣泛性和重要性.第1章緒論1.2總體和總體分布定義總體一個統(tǒng)計問題所研究對象的全體個體組成總體的每個元素例1.2.1假定一批產品有10000件,其中有合格品也有廢品.為估計廢品率,往往從中抽取一部分,如抽取100件進行檢查.10000件產品全體稱為總體,每件產品稱為個體,從總體中抽取的100件產品稱為樣本.若總體中個體數(shù)目為有限個,稱為有限總體若總體中個體數(shù)目為無限個,稱為無限總體總體中所包含個體的個數(shù)稱為總體容量用X表示數(shù)量指標(可以是一維也可以是多維)實際問題中,我們關心的并不是總體或這些個體本身,而是關心與個體性能相聯(lián)系的某一項或某幾項數(shù)量指標以及這些數(shù)量指標在總體中的分布情況.表征個體特征的量稱為數(shù)量指標.總體:數(shù)量指標X的全體組成的集合.例1.2.2研究100萬只燈泡的使用壽命X,100萬只燈泡的使用壽命組成總體,其中每只燈泡的壽命是個體.例1.2.3研究北京理工大學學生的身高X和體重Y,
北京理工大學全體學生的身高和體重組成總體,其中每個學生的身高和體重是個體.例1.2.2中,燈泡的使用壽命X是一個隨機變量.此時,把總體與一個隨機變量(如燈泡壽命)對應起來.由于每個個體的出現(xiàn)是隨機的,所以相應的個體的數(shù)量指標的出現(xiàn)也帶有隨機性.從而可以把這種數(shù)量指標看作一個隨機變量.例1.2.4假定10000件產品中廢品數(shù)為100件,其余為合格品,廢品率為0.01.定義隨機變量如下:這是一個參數(shù)為p的0-1分布的隨機變量,其中p=P{X=1}=0.01為廢品率.我們將它說成0-1分布總體,指總體中每個個體的觀察值是0-1分布隨機變量的值.總體中的每一個個體是隨機試驗的一個觀察值,即它是某一隨機變量X的值.對總體的研究轉化為對表示總體的隨機變量X的統(tǒng)計規(guī)律性的研究,隨機變量X的分布函數(shù)和數(shù)字特征稱為總體的分布函數(shù)和數(shù)字特征.總體特征函數(shù)總體均值總體方差總體矩如:總體:可以用一個隨機變量及其分布來描述.總體某批燈泡的壽命壽命X可用一概率分布來刻畫F(x)例如:研究某批燈泡的壽命時,關心的數(shù)量指標就是壽命X,那么,此總體就可以用隨機變量X表示,或用其分布函數(shù)F(x)表示.若F
有密度
f,則此總體也可以用密度函數(shù)f(x)來表示在研究某地區(qū)中學生的發(fā)育狀況時,若關心的數(shù)量指標是身高和體重,我們用X和Y分別表示身高和體重,那么此總體可用二維隨機變量(X,Y)或其聯(lián)合分布函數(shù)F(x,y)來表示.若F
有密度f,則該總體也可以用聯(lián)合密度函數(shù)f(x,y)來表示.例1.2.5燈泡使用壽命這一總體是指數(shù)分布總體,表示總體中的觀察值是指數(shù)分布隨機變量的值.有時也根據總體分布的類型稱總體的名稱.如:正態(tài)分布總體,指數(shù)分布總體,二項分布總體,0-1分布總體,幾何分布總體等等.第1章緒論1.3樣本和樣本分布1.3.1樣本1樣本空間為推斷總體分布及各種特征,按一定規(guī)則從總體中抽取一定數(shù)量的個體進行觀測,以獲得有關總體的信息,這一過程稱為“抽樣”.抽取的部分個體稱為樣本.定義1.3.1(樣本空間)設X1,X2,…,Xn是從總體中抽取的樣本,其樣本空間定義如下:樣本X1,X2,…,Xn可能取值的全體的集合,稱為樣本空間,記為χ
.例1.3.1(1)假定一批產品有10000件,其中有合格品也有廢品.為
估計廢品率,往往從中抽取一部分,抽取100件進行
檢查,該問題中樣本空間是什么?解:樣本空間
(2)打靶試驗,每次打三發(fā),考察中靶的環(huán)數(shù).
如樣本X=(5,1,9)表示三次打靶分別中5環(huán),1環(huán)和9環(huán),該問題中樣本空間是什么?解:樣本空間樣本的兩重性是指,樣本既可看成隨機變量,又可看成具體的數(shù).抽樣前抽樣后它被看成是隨機變量它是具體的數(shù)值2樣本的兩重性
(1)樣本是隨機變量抽到哪5輛是隨機的容量為n的樣本可以看作n維隨機向量(X1,X2,…,Xn).(2)一旦觀測到一組樣本得到的是n個具體的數(shù)(x1,x2,…,xn),稱為容量為n的樣本的觀察值.但若在相同條件下再打三發(fā),由于種種不可控制的隨機因素的影響,中靶的環(huán)數(shù)不大可能和上一次完全一樣,這就是樣本的隨機性.如果無窮打下去,每次打三發(fā),出現(xiàn)的結果可視為隨機向量(X1,X2,X3)的具體觀察值.例1.3.1(2)打靶問題中,樣本X=(X1,X2,X3),其中0≤Xi≤10(i=1,2,3)為整數(shù),它們是數(shù)字向量.
如我們從某班大學生中欲抽取10人測量身高,用X1,X2,…,X10表示10個人的身高.進行試驗后,得到10個數(shù),x1,x2,…,x10,它們是樣本取到的值.我們只能觀察到隨機變量取的值而見不到隨機變量.注:總體、樣本、樣本值的關系最常用的一種抽樣方法叫作“簡單隨機抽樣”,要求抽取的樣本滿足下面兩點要求總體中每個個體被抽到是等可能的,即:X1,X2,…,Xn中每個個體與所考察的總體X有相同的分布.代表性抽樣的目的是為了對總體分布中某些未知的量進行統(tǒng)計推斷,為了使抽取的樣本能很好地反映總體的信息,必須考慮抽樣方法.樣本中每個個體取什么值,不影響其他個體的取值,即:抽取的個體X1,X2,…,Xn是相互獨立的隨機變量.獨立性3簡單隨機樣本設有一總體X,具有分布F,X1,X2,…,Xn
是從總體X中抽取的容量為n的樣本.若(1)X1,X2,…,Xn相互獨立;(2)X1,X2,…,Xn與總體X有相同的分布,即同有分布F.則稱X1,X2,…,Xn是從總體X
中抽取的容量為n的簡單隨機樣本,簡稱樣本.定義1.3.2(簡單隨機樣本)若總體X的分布函數(shù)為F(x)(或密度函數(shù)f(x)),也稱X1,X2,…,Xn是來自總體分布函數(shù)F(x)(或密度函數(shù)f(x))的樣本,記為
X1,X2,…,Xni.i.d.
且
X1~F(x)或
X1~f(x)n稱為樣本容量.樣本X1,X2,…,Xn也可看作n維隨機向量(X1,X2,…,Xn).簡單隨機樣本是應用中最常見的情形,今后,當說到“X1,X2,…,Xn
是取自某總體的樣本”時,若不特別說明,就指簡單隨機樣本.X1,X2,…,Xn的觀察值x1,x2,…,xn,稱為樣本值,又稱為X的n個的獨立的觀察值.若x1,x2,…,xn與y1,y2,…,yn都是相應于樣本X1X1,X2,…,Xn的樣本值,一般來說,它們是不同的.總體(理論分布)樣本樣本值?統(tǒng)計是從手中已有的資料--樣本值,去推斷總體的情況---總體分布F(x)的性質.樣本是聯(lián)系二者的橋梁1.3.2樣本分布樣本是隨機變量,有概率分布,這個概率分布稱為樣本分布.樣本分布可由總體分布完全確定.樣本分布是樣本受隨機性影響最完整的描述.設總體X的分布函數(shù)為F(x)=P{X≤x},X1,X2,…,Xn是來自總體X的樣本,由于X1,X2,…,Xn相互獨立且與總體X有相同的分布則樣本X1,X2,…,Xn的聯(lián)合分布函數(shù)為設總體X是離散型隨機變量,其分布列為pi=P{X=xi}
,
i=1,2,…X1,X2,…,Xn是來自總體X的樣本,則樣本X1,X2,…,Xn的聯(lián)合分布列為設總體X是連續(xù)型隨機變量,其密度函數(shù)為f(x),X1,X2,…,Xn是來自總體X的樣本則樣本X1,X2,…,Xn的聯(lián)合密度函數(shù)為設二維總體(X,Y)的分布函數(shù)為是來自總體(X,Y)的樣本,設總體(X,Y)是二維連續(xù)型隨機變量,其密度函數(shù)為f(x,y),則樣本(X1,Y1)
,(X2,Y2)
,…,(Xn
,Yn)的聯(lián)合密度函數(shù)為則樣本(X1,Y1)
,(X2,Y2)
,…,(Xn
,Yn)
的聯(lián)合分布函數(shù)為解:由于總體其密度函數(shù)為例1.3.2設X1,X2,…,Xn是來自正態(tài)總體的樣本,求樣本X1,X2,…,Xn的聯(lián)合密度函數(shù).因此,樣本X1,X2,…,Xn的聯(lián)合密度函數(shù)為例1.3.3設X1,X2,…,Xn是來自兩點分布總體B(1,p),0<p
<
1,的樣本,求樣本X1,X2,…,Xn的聯(lián)合分布列.解:由于總體X~B(1,p),其分布列為其中x=0或x=1.解:樣本
X1,X2,…,Xn
的聯(lián)合分布列為其中k為觀察值x1,x2,…,xn
中1的個數(shù),k=0,1,…,n.例1.3.4為估計一物件的重量μ,用一架天平將該物體重復測量n次,結果記為X1,X2,…,Xn.求X1,X2,…,Xn的分布.針對該問題需要進行一些假定假定1各次測量相互獨立假定2各次測量在相同條件下進行:X1,X2,…,Xn同分布為確定X1,X2,…,Xn的分布,在以上假定下求出X1的分布即可.X1,X2,…,Xn是相互獨立的隨機變量考慮測量誤差的特性:這種誤差一般由大量的、彼此獨立起作用的隨機因素疊加而成,而每一個所起作用都很小.由概率論的中心極限定理可知這種誤差近似服從正態(tài)分布.再假定天平沒有系統(tǒng)誤差,則可進一步假定此誤差服從均值為0,方差為σ2的正態(tài)分布.從而X1
(可以視為X1
=μ+ε,物重與誤差之和)的概率分布為正態(tài)分布N(μ,
σ2).因此,樣本X1,X2,…,Xn的聯(lián)合密度函數(shù)為1.3.3分布族一參數(shù)和參數(shù)空間例1.3.2總體分布和樣本分布中的μ和σ2,例1.3.3總體分布和樣本分布中的p
都是確定分布的未知常數(shù),這些常數(shù)的不同取值對應不同的總體分布和樣本分布,只要確定了這些常數(shù)的值,相應的總體分布和樣本分布也都確定了.稱出現(xiàn)在總體分布或樣本分布中的未知常數(shù)為參數(shù).在一些問題中,參數(shù)雖然未知,但根據參數(shù)的性質可以給出參數(shù)的取值范圍.例1.3.2中,參數(shù)空間為定義1.3.3(參數(shù)空間)參數(shù)所有可能取值全體構成的集合稱為參數(shù)空間,記為Θ.例1.3.3中,參數(shù)空間為二總體分布族和樣本分布族由于不同的參數(shù)值一般對應于不同的總體分布,因此參數(shù)空間中所有可能的參數(shù)值對應于一族總體分布,稱該分布族為總體分布族.由于不同的參數(shù)值一般對應于不同的樣本分布,因此參數(shù)空間中所有可能的參數(shù)值對應于一族樣本分布,稱該分布族為樣本分布族.例1.3.2中,若μ和σ2都為未知參數(shù),則總體分布族為樣本分布族為參數(shù)μ和σ2的每個可能值對應于一個具體的分布..例1.3.3中,若p為未知參數(shù),則總體分布族為樣本分布族為參數(shù)p的每個可能值對應于一個具體的分布..設X1,X2,...,Xn是來自指數(shù)分布總體E(λ)的樣本,其中λ>0未知則樣本分布族為參數(shù)
的每個可能值對應于一個具體的分布..隨機現(xiàn)象用隨機變量刻畫,數(shù)理統(tǒng)計學的第一前提條件是:隨機變量的概率分布未知,因此樣本分布族至少包含兩個分布.設總體密度函數(shù)(或分布列)為f(x,
),其中
為未知參數(shù),參數(shù)空間為Θ,總體分布族可以表示為樣本分布族可以表示為兩點分布族二項分布族泊松分布族均勻分布族指數(shù)分布族正態(tài)分布族常見的總體分布族:三統(tǒng)計模型和統(tǒng)計推斷樣本分布族及參數(shù)空間給出了所考慮的統(tǒng)計問題的總的范圍.樣本分布族反映了對所研究統(tǒng)計問題的了解程度及對抽樣方式的規(guī)定,稱樣本分布族為統(tǒng)計模型.分布族越小,做出的結論可能更精確和更可靠.模型只取決于樣本的分布,常把分布的名稱稱為模型的名稱.例如,正態(tài)分布模型(正態(tài)模型),兩點分布模型
從總體中抽取一定大小的樣本去推斷總體概率分布的方法稱為統(tǒng)計推斷.數(shù)理統(tǒng)計是著手于樣本,著眼于總體,任務是利用樣本推斷總體.當總體分布形式已知,但是含有若干未知參數(shù)時,只需要對總體中的這些未知參數(shù)進行推斷,這類問題稱為參數(shù)統(tǒng)計推斷問題.若總體的分布形式完全未知,或者只有一些一般性的限制.例如,假定總體分布是離散型或連續(xù)型,對稱分布或偏態(tài)分布等,需要對總體分布形式進行推斷,這類問題稱為非參數(shù)統(tǒng)計推斷問題.例1.3.5某車間生產的鋼管直徑X服從正態(tài)分布N(100,0.52),現(xiàn)從一批鋼管中隨機抽取10根,測得其內直徑(單位:mm)的平均值為100.15,假定方差不變,問該批生產的鋼管是否符合要求?如何根據抽樣的結果判斷鋼管的平均直徑是否為參數(shù)統(tǒng)計推斷μ=100關心問題
如何根據抽樣提供的信息,判斷是否成立X~P(λ)非參數(shù)統(tǒng)計推斷關心問題統(tǒng)計模型的確定依賴于抽取樣本的方式,以及基于現(xiàn)有結論的假定(如例1.3.4).
很多性質不一樣的問題可以歸入到同一模型下.如:
兩點分布模型:可以概括產品中的次品率,傳染病的感
染率,學生成績的及格率、優(yōu)秀率等.
正態(tài)模型:可以概括稱重、測量誤差,干擾信號等.同一模型下可以提出很多不同的統(tǒng)計問題
(正態(tài)模型下的參數(shù)估計和假設檢驗問題).說明:提出種種統(tǒng)計推斷方法;計算有關推斷方法性能的數(shù)量指標;在一定條件和優(yōu)良性準則下尋找最優(yōu)的統(tǒng)計推斷方法,或者證明某種統(tǒng)計推斷方法是最優(yōu)的.統(tǒng)計推斷包括作業(yè):習題1:2,3,4,5,6,7緒論1.4
統(tǒng)計量樣本中包含總體的信息,是推斷總體的依據,但樣本所含總體信息較為分散,有時顯得雜亂無章,一般不宜直接用于統(tǒng)計推斷.數(shù)理統(tǒng)計的任務是通過樣本推斷總體的特性.因此,需要對樣本進行整理、加工、提煉,集中樣本中的有用信息,把與解決問題有關的信息集中起來,針對不同的研究問題構造樣本的一個適當?shù)暮瘮?shù),再利用這些樣本的函數(shù)進行統(tǒng)計推斷.定義1.4.1(統(tǒng)計量)設X1,X2,…,Xn是來自總體X的樣本,g(X1,X2,…,Xn)
是樣本X1,X2,…,Xn的函數(shù),且g除依賴于樣本外,不依賴于任何其它的未知量,稱g(X1,X2,…,Xn)是統(tǒng)計量.如果x1,x2,…,xn為樣本X1,X2,…,Xn的觀察值,稱g(x1,x2,…,xn
)為統(tǒng)計量g(X1,X2,…,Xn)的一個觀察值.統(tǒng)計量的定義說明1.統(tǒng)計量只與樣本有關,不依賴任何未知參數(shù)!例1.4.1設X1,X2,…,Xn是來自正態(tài)總體N(μ,σ2)的樣本,其中μ未知,σ2已知,下列隨機變量中哪些是統(tǒng)計量.答:
(1)(3)(5)是統(tǒng)計量,(2)(4)(6)不是統(tǒng)計量.2.統(tǒng)計量既然是依賴于樣本的,統(tǒng)計量既然是依賴于樣本的,由于樣本具有兩重性,因此統(tǒng)計量也具有兩重性.3.在什么問題中采用什么統(tǒng)計量進行統(tǒng)計推斷看問題
的性質來確定.總體樣本統(tǒng)計量隨機抽樣加工作出推斷幾個常用的統(tǒng)計量設X1,X2,...,Xn是來自總體X的樣本,x1,x2,...,xn是這一樣本的觀察值,定義:1樣本均值它反映了總體均值EX的信息根據辛欽大數(shù)定律2(1)樣本方差它反映了總體方差DX的信息(2)樣本標準差它反映了總體標準差的信息3(1)樣本k階原點矩它反映了總體k階矩的信息(2)樣本k階中心矩它反映了總體k階中心矩的信息特別它們的觀察值分別為分別稱為樣本均值,樣本方差,樣本標準差,樣本k階(原點)矩,樣本k階中心矩的觀察值.4二維隨機向量的樣本矩設(X1,Y1),(X2,Y2),…,(Xn,Yn)是來自二維總體(X,Y)的樣本,(x1,y1),(x2,y2),…,(xn,yn)是這一樣本的觀察值,則分別稱為X,Y的樣本均值、樣本方差及X和Y的樣本協(xié)方差、樣本相關系數(shù).5順序統(tǒng)計量及其有關統(tǒng)計量定義1.4.2(順序統(tǒng)計量)
稱X(r),1≤r≤n為第r個順序(次序)統(tǒng)計量.利用順序統(tǒng)計量可以定義下列統(tǒng)計量(1)樣本中位數(shù)反映了總體中位數(shù)的信息它把樣本分為兩部分,而樣本中位數(shù)恰好是分界線.(2)極值最小順序統(tǒng)計量:X(1)
=min(X1,X2,…,Xn)
最大順序統(tǒng)計量:X(n)=max(X1,X2,…,Xn)極值統(tǒng)計量在災害問題、材料試驗、物理學的統(tǒng)計分析中常用.(3)樣本極差R=X(n)-X(1)反映了樣本觀察值的最大波動程度.作業(yè):第1章習題1:8第1章緒論1.5
經驗分布函數(shù)
對任意實數(shù)x,則稱為樣本X1,X2,...,Xn的為經驗分布函數(shù).例1.5.1有一組數(shù)據19,22,13,11,16,17,
求相應的經驗分布函數(shù).解:把這些數(shù)據按照從小到大順序排列為11,13,16,17,19,22經驗分布函數(shù)為記示性函數(shù)則經驗分布函數(shù)Fn(x)可以表示為經驗分布函數(shù)是單調、不減、右連續(xù)的階梯函數(shù),其跳躍點是樣本的觀察值,當n個觀察值各不相同時,每個跳躍點的跳躍度均為1/n,且Fn(x)滿足對每一個樣本觀察值
x1,x2,…,xn,F(xiàn)n(x)作為x的函數(shù),具備分布函數(shù)的基本性質,F(xiàn)n(x)可視為一個分布函數(shù).對每一個固定的x,F(xiàn)n(x)是樣本
X1,X2,…,Xn的函數(shù),故Fn(x)是一個隨機變量.關于經驗分布函數(shù)Fn(x),有如下重要的結論定理1.5.1設F(x)為總體X的分布函數(shù),X1,X2,…,Xn
是來自總體X的樣本,Fn(x)為其經驗分布函數(shù),則對任意給定實數(shù)x,有證明:經驗分布函數(shù)Fn(x)是依賴于樣本X1,X2,…,Xn
的函數(shù),因此它是統(tǒng)計量,它的可能取值為0,1/n,2/n,…,(n-1)/n,1.記,則且Y1,Y2,…,Yn
獨立同分布,服從兩點分布B(1,F(x)),因此是獨立同分布隨機變量的和.根據辛欽大數(shù)定律,當n充分大時,有因此,結論(1)成立.根據強大數(shù)定律,當n充分大時,有因此,結論(2)成立.根據中心極限定理,當n充分大時,有因此,結論(3)成立.定理1.5.1的結論(2)說明:對給定的實數(shù)x,經驗分布函數(shù)Fn(x)以概率1收斂于總體分布函數(shù)F(x)
.因此只要n充分大,經驗分布函數(shù)Fn(x)與理論分布函數(shù)F(x)的差異就非常小.進一步,格里汶科于1933年證明了比定理1.5.1更深刻的結果.定理1.5.2設F(x)為總體X的分布函數(shù),X1,X2,…,Xn
是來自總體X的樣本,Fn(x)為其經驗
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 部門工作總結匯報
- 酒店怎樣管理好一個團隊
- 新學期升旗儀式的講話稿(28篇)
- 學校學生會主席就職演講稿范本5篇
- 造型基礎知識
- 營銷主管培訓課件
- 2025年江蘇省南京六合區(qū)程橋高中高三生物試題質量調研卷(文理合卷)含解析
- 大同煤炭職業(yè)技術學院《施工組織與項目管理》2023-2024學年第二學期期末試卷
- 透析病人護理操作流程
- 三峽大學科技學院《兒童文學與欣賞》2023-2024學年第二學期期末試卷
- 語文-河南省名校大聯(lián)考2024-2025學年高二下學期開學測試試題和答案
- 2025年甘肅省安全員B證考試題庫及答案
- 圖神經網絡前沿-深度研究
- 畜禽無害化處理項目可行性研究報告立項申請報告模板
- 2024年01月舟山普陀農村商業(yè)銀行2024年春季招考信息筆試歷年參考題庫附帶答案詳解
- 質量控制與制造工藝
- 2025-2030年中國真空凍干蔬菜市場發(fā)展走勢及投資策略分析報告
- 2024年全國職業(yè)院校技能大賽高職組(酒店服務賽項)備賽試題庫(含答案)
- 云南省昆明市2025年中考語文模擬試卷六套【附參考答案】
- 《AHA2023心肺復蘇與心血管急救指南》解讀課件
- 工藝工程師招聘筆試題及解答(某大型集團公司)2024年
評論
0/150
提交評論