




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、概率與數(shù)理統(tǒng)計基礎第1頁,共54頁,2022年,5月20日,6點3分,星期四 概率論與數(shù)理統(tǒng)計是研究和揭示隨機現(xiàn)象統(tǒng)計規(guī)律性的數(shù)學分支。主要包括:隨機事件和概率、隨機變量的分布和數(shù)字特征、中心極限定理和大數(shù)定理、抽樣分布、統(tǒng)計估計、假設檢驗、回歸分析等。第2頁,共54頁,2022年,5月20日,6點3分,星期四主要內容1.基本概念2.對總體的描述隨機變量的數(shù)字特征3.對樣本的描述樣本分布的數(shù)字特征4.隨機變量的分布5.通過樣本,估計總體估計量的特征6.通過樣本,估計總體估計方法7.通過樣本,估計總體假設檢驗第3頁,共54頁,2022年,5月20日,6點3分,星期四第一節(jié) 基本概念總體和個體樣本
2、和樣本容量隨機變量統(tǒng)計量第4頁,共54頁,2022年,5月20日,6點3分,星期四1.1總體、個體、樣本和樣本容量研究對象的全體稱為總體或母體,通常指研究對象的某項數(shù)量指標;組成總體的每個基本單位稱為個體。從總體X中抽出若干個個體稱為樣本,一般記為(X1,X2,Xn)。n稱為樣本容量。而對這n個個體的一次具體的觀察結果(x1,x2,xn)是完全確定的一組數(shù)值,但它又隨著每次抽樣觀察而改變。(x1,x2,xn)稱為樣本觀察值。 注意:抽樣是按隨機原則選取的,即總體中每個 個體有同樣的機會被選入樣本。第5頁,共54頁,2022年,5月20日,6點3分,星期四 當人們在一定條件下對某一現(xiàn)象加以觀察時
3、,觀察到的結果是多個可能結果中的某一個,且在每次觀察前都無法預知觀測結果到底是哪一個,即結果的出現(xiàn)呈現(xiàn)出偶然性,但是所有可能出現(xiàn)的結果是知道的。 隨機現(xiàn)象具有偶然性一面,也有必然性一面。偶然性一面表現(xiàn)在“對隨機現(xiàn)象做一次觀測時,觀測結果具有偶然性(不可預知性)” ;必然性一面表現(xiàn)在“對隨機現(xiàn)象進行大量重復觀測,觀測結果有一定的規(guī)律性,亦即統(tǒng)計規(guī)律性”。 具有不確定性(或隨機性、偶然性)的現(xiàn)象稱為隨機現(xiàn)象。特點:隨機現(xiàn)象定義:第6頁,共54頁,2022年,5月20日,6點3分,星期四隨機試驗舉例: E1: 擲一顆骰子,觀察所擲的點數(shù)是幾; E2: 觀察某城市某個月內交通事故發(fā)生的次數(shù); E3:
4、對某只燈泡做試驗,觀察其使用壽命; E4: 對某只燈泡做試驗,觀察其使用壽命是否小 于200小時。在實際問題中,隨機試驗的結果可以用數(shù)量來表示,由此就產生了隨機變量的概念第7頁,共54頁,2022年,5月20日,6點3分,星期四 有些試驗結果本身與數(shù)值有關(本身就是一個數(shù)). 例如,擲一顆骰子面上出現(xiàn)的點數(shù); 七月份濟南的最高溫度;每天從濟南下火車的人數(shù);昆蟲的產卵數(shù);它隨試驗結果的不同而取不同的值,因而在試驗之前只知道它可能取值的范圍,而不能預先肯定它將取哪個值。由于試驗結果的出現(xiàn)具有一定的概率,于是這種實值函數(shù)取每個值和每個確定范圍內的值也有一定的概率。第8頁,共54頁,2022年,5月2
5、0日,6點3分,星期四1.2 隨機變量根據概率不同而取不同數(shù)值的變量稱為隨機變量。一個隨機變量具有這樣的特性:可以取許多不同的數(shù)值,取每一個數(shù)值都有相應的概率p,0 p1。第9頁,共54頁,2022年,5月20日,6點3分,星期四總體、隨機變量、樣本間的聯(lián)系樣本就是一個隨機變量,所謂“樣本容量為n的樣本”就是n個相互獨立且與總體有相同分布的隨機變量X1,X2,Xn每一次具體抽樣所得的數(shù)據,就是n元隨機變量的一個觀察值,記為X1,X2,Xn樣本是總體的一部分??傮w一般是未知的。一般要通過樣本才能部分地推知總體的情況。第10頁,共54頁,2022年,5月20日,6點3分,星期四1.3 統(tǒng)計量由樣本
6、值去推斷總體情況,需要對樣本值進行“加工”,這就要構造一些樣本的函數(shù),它把樣本中所含的(某一方面)的信息集中起來。設(x1,x2,xn)為一組樣本觀察值,函數(shù)y=f (x1,x2,xn)若不含有未知參數(shù),這種不含任何未知參數(shù)的樣本的函數(shù)稱為統(tǒng)計量。它是完全由樣本決定的量。統(tǒng)計量既然是依賴于樣本的,而后者又是隨機變量,故統(tǒng)計量也是隨機變量。幾個常見統(tǒng)計量樣本均值:樣本方差:第11頁,共54頁,2022年,5月20日,6點3分,星期四第二節(jié) 對總體的描述隨機變量的數(shù)字特征2.1 數(shù)學期望2.2 方差2.3協(xié)方差第12頁,共54頁,2022年,5月20日,6點3分,星期四2.1.1 數(shù)學期望:實際上
7、就是一個加權平均值,描述隨機變量的集中程度。數(shù)學期望描述隨機變量(總體)的一般水平。定義1離散型隨機變量數(shù)學期望的定義 假定有一個離散型隨機變量X有n個不同的可能取值x1,x2,xn,而p1,p2,pn是X取這些值相應的概率,則這個隨機變量X的數(shù)學期望定義如下:第13頁,共54頁,2022年,5月20日,6點3分,星期四定義2連續(xù)型隨機變量數(shù)學期望的定義第14頁,共54頁,2022年,5月20日,6點3分,星期四2.1.2數(shù)學期望的性質:(1)如果a、b為常數(shù),則 E(aX+b)=aE(X)+b(2)如果X、Y為兩個隨機變量,則 E(X+Y)=E(X)+E(Y)(3)如果g(x)和f(x)分別
8、為X的兩個函數(shù),則 Eg(X)+f(X)=Eg(X)+Ef(X)(4)如果X、Y是兩個獨立的隨機變量,則 E(X.Y)=E(X).E(Y) 第15頁,共54頁,2022年,5月20日,6點3分,星期四2.2.1方差的定義離均差的定義若隨機變量X的數(shù)學期望E(X)存在,稱X- E(X)為隨機變量X的離均差。方差的定義 離均差的平方的數(shù)學期望。設X是隨機變量,若EX-EX2存在,則稱EX-EX2為隨機變量X的方差,記為D(X)或Var(X),即 D(X)=EX-EX2 方差的算術平方根稱為隨機變量X的均方差或標準差。第16頁,共54頁,2022年,5月20日,6點3分,星期四2.2.2方差的意義離
9、均差和方差都是用來描述隨機變量離散程度的,即描述x對于它的數(shù)學期望的偏離程度,這種偏差越大,表明變量的取值越分散。一般情況下,常用方差來描述離散程度。因為離均差的和為零,無法體現(xiàn)隨機變量的總離散程度。事實上正偏差大或負偏差大,同樣是離散程度大。方差中由于有了平方,從而消除了正負號的影響,并易于加總,也易于強調大的偏離程度的突出作用。第17頁,共54頁,2022年,5月20日,6點3分,星期四2.2.3方差的性質:(1)Var(c )=0(2)Var(c+x)=Var(x )(3)Var(cx)=c2Var(x)(4) Var(x-y)= Var(x )+Var(y )-2cov(x,y)Var
10、(x+y)= Var(x )+Var(y )+2cov(x,y)(5)Var(a+bx)=b2Var(x)(6)a,b為常數(shù),x,y為兩個相互獨立的隨機變量,則Var(ax+by)=a2Var(x)+b2Var(y)(7)Var(x)=E(x2)-(E(x)2第18頁,共54頁,2022年,5月20日,6點3分,星期四 2.3協(xié)方差Cov(X,Y)=E(X-EX)(Y-EY)Cov(X,Y)=E(XY)- E(X) E(Y)(積的期望減期望的積)第19頁,共54頁,2022年,5月20日,6點3分,星期四第三節(jié) 對樣本的描述樣本分布的數(shù)字特征樣本均值 反映樣本集中程度 樣本方差樣本標準差描述樣
11、本離散程度第20頁,共54頁,2022年,5月20日,6點3分,星期四第四節(jié) 隨機變量的分布4.1 正態(tài)分布4.2 t分布4.3 卡方分布4.4 F分布第21頁,共54頁,2022年,5月20日,6點3分,星期四4.1 正態(tài)分布第22頁,共54頁,2022年,5月20日,6點3分,星期四正態(tài)分布圖形第23頁,共54頁,2022年,5月20日,6點3分,星期四標準正態(tài)分布 根據以上定理,可以將任何一個正態(tài)分布化為標準正態(tài)分布,即將其標準化。第24頁,共54頁,2022年,5月20日,6點3分,星期四標準正態(tài)分布圖形第25頁,共54頁,2022年,5月20日,6點3分,星期四標準正態(tài)分布的分位數(shù)(
12、臨界值) 在實際問題中, 常取0.1、0.05、0.01.z0.05 =1.645 z0.01 =2.326 z0.01/2=2.575 z0.05/2=1.96第26頁,共54頁,2022年,5月20日,6點3分,星期四4.2t分布定理1:若XN(0, 1),Y2(n),X與Y獨立,則定理2:設(X1,X2,Xn)是正態(tài)總體N(,2)的簡單隨機樣本,則第27頁,共54頁,2022年,5月20日,6點3分,星期四性質: (1) f(x)關于x=0(縱軸)對稱。 (2) f(x)的極限為N(0,1)的密度函數(shù),即 當n較大時, t分布近似于標準正態(tài)分布.第28頁,共54頁,2022年,5月20日
13、,6點3分,星期四第29頁,共54頁,2022年,5月20日,6點3分,星期四來定義.其中伽瑪函數(shù) 通過積分若隨機變量X的概率密度為那么稱X服從自由度為n的 分布記作:4.3 分布第30頁,共54頁,2022年,5月20日,6點3分,星期四 2分布的密度函數(shù)的圖形如右圖.應用中心極限定理可得, ,則當n充分大時若的分布近似正態(tài)分布N(0,1).則可以求得, E(X)=n, Var(X)=2n若若X1,X2,Xn相互獨立,且XiN(0,1) ,則性質1:性質2:第31頁,共54頁,2022年,5月20日,6點3分,星期四第32頁,共54頁,2022年,5月20日,6點3分,星期四則稱X服從自由度
14、為n1和n2的F分布。n1稱第一自由度, n2稱第二自由度。定義:若隨機變量 X的密度函數(shù)為4.4 F分布第33頁,共54頁,2022年,5月20日,6點3分,星期四定理1 若X2(n1),Y2(n2) ,X,Y獨立,則第34頁,共54頁,2022年,5月20日,6點3分,星期四*定理2:設(X1,X2,Xn1)是N(1,12)的樣本,(Y1,Y2,Yn2)是N(2,22)的樣本,且相互獨立,S12,S22是樣本方差,則第35頁,共54頁,2022年,5月20日,6點3分,星期四分位數(shù)問題:第36頁,共54頁,2022年,5月20日,6點3分,星期四第37頁,共54頁,2022年,5月20日,
15、6點3分,星期四第五節(jié) 通過樣本,估計總體(一)估計量的特征5.1 無偏性5.2 有效性5.3 一致性所謂估計量的特性指的是衡量一個統(tǒng)計量用以估計總體參數(shù)的好壞標準。第38頁,共54頁,2022年,5月20日,6點3分,星期四5.1 無偏性估計量的觀察或試驗的結果,估計值可能較真實的參數(shù)值偏大或偏小,而一個好的估計量不應總是偏大或偏小,在多次試驗中所得的估計量的平均值應與真實參數(shù)吻合,這就是無偏性所要求的。 是一個隨機變量,對一次具體定義是的一個估計量,如果 則稱是的一個無偏估計。如果不是無偏的, ,就稱該估計是有偏的。 稱為的偏差。第39頁,共54頁,2022年,5月20日,6點3分,星期四
16、5.2 有效性(最小方差性、最優(yōu)性)總體某個參數(shù) 的無偏估計量往往不只 一個,而且無偏性僅僅表明 的所有可能的取值按概率平均(均值)等于,它的可能取值可能大部分與相差很大。為保證的取值能集中于附近,必須要求的方差越小越好。所以,提出有效性標準。第40頁,共54頁,2022年,5月20日,6點3分,星期四有效性(最小方差性、最優(yōu)性)定義對于參數(shù)的無偏估計量,其取值應在真值附近波動,我們希望它與真值之間的偏差越小越好。 定義 設均為未知參數(shù)的無偏估計量,若則稱比有效。在的所有無偏估計量中,若估計量,則稱是具有最小方差的無偏顯然也是最有效的無偏估計量,簡稱有效估計量。為最小方差無偏估計量。第41頁,
17、共54頁,2022年,5月20日,6點3分,星期四無偏有效估計量的意義一個無偏有效估計量的取值在可能范圍內最密集于真值附近。換言之,它以最大的概率保證估計量的取值在真值附近擺動。第42頁,共54頁,2022年,5月20日,6點3分,星期四第六節(jié) 通過樣本,估計總體(二)估計方法點估計普通最小二乘法 所謂點估計就是給出被估計參數(shù)的一個特定的估計值。區(qū)間估計第43頁,共54頁,2022年,5月20日,6點3分,星期四區(qū)間估計的概念所謂區(qū)間估計就是以一定的可靠性給出被估計參數(shù)的一個可能的取值范圍。具體做法是找出兩個統(tǒng)計量 與 ,使 稱為置信區(qū)間, 稱為置信系數(shù)(置信度), 稱為冒險率(測不準的概率)
18、,一般取5% 或1%。第44頁,共54頁,2022年,5月20日,6點3分,星期四對區(qū)間估計的形象比喻我們經常說某甲的成績“大概80分左右”,可以看成一個區(qū)間估計問題。(某甲的成績 為被估計的參數(shù))下限上限大概80分左右置信系數(shù)(大概準確的程度)冒險率(顯著性水平)()第45頁,共54頁,2022年,5月20日,6點3分,星期四區(qū)間估計的步驟找一個含有該參數(shù)的統(tǒng)計量;構造一個概率為的事件;通過該事件的概率解出該參數(shù)的區(qū)間估計第46頁,共54頁,2022年,5月20日,6點3分,星期四關于區(qū)間估計的說明在進行區(qū)間估計時,應針對不同的情況,采用不同的方法。例如分清分布的形式是已知還是未知;是大樣本
19、還是小樣本;小樣本又得分清是已知方差還是未知方差。充分利用分布信息可以得到較精確的估計。一般地,越大置信度越低,反之則反。第47頁,共54頁,2022年,5月20日,6點3分,星期四第六節(jié) 通過樣本,估計總體(三)假設檢驗第48頁,共54頁,2022年,5月20日,6點3分,星期四1.假設檢驗的定義設總體X的分布函數(shù)F(x, )的形式已知,但是其中的參數(shù) 未知?,F(xiàn)在對參數(shù)提出假設: ,然后利用樣本值對這個假設作出檢驗,判斷其真?zhèn)?,這就是參數(shù)的假設檢驗。設總體X的分布函數(shù)形式未知,現(xiàn)在假設它的分布函數(shù)為某個指定函數(shù) ,然后利用樣本信息進行檢驗,判斷其真?zhèn)危@就是非參數(shù)的假設檢驗。一般研究參數(shù)的假
20、設檢驗問題。第49頁,共54頁,2022年,5月20日,6點3分,星期四2.原假設與備擇假設原假設:是我們進行統(tǒng)計假設檢驗欲確定其是否成立的假設體現(xiàn)進行假設檢驗的目的,而且往往是希望否定這個假設,一般用H0表示。備擇假設:是原假設的對立面,統(tǒng)計假設檢驗是二擇一的判斷,當原假設不成立時,不得不接受它,一般用H1 表示。第50頁,共54頁,2022年,5月20日,6點3分,星期四3.顯著性水平:顯著性水平可以理解為事件顯著不可能發(fā)生的水平;可以理解為原假設的數(shù)值與真實值顯著差異大小的水平;是小概率事件;是指犯“第一類錯誤”(原假設)的可能性;一般取值很小,0.1,0.05,0.01,0.005.第51頁,共54頁,2022年,5月20日,6點3分,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年物流行業(yè)物流園區(qū)企業(yè)信用體系建設研究報告
- 合同改造補給協(xié)議書
- 醫(yī)療死亡補償協(xié)議書
- 變更合同價款協(xié)議書
- 協(xié)議分戶析產協(xié)議書
- 商鋪置換住宅協(xié)議書
- 勞務專項安全協(xié)議書
- 柳鐵一中試卷真題及答案
- 醫(yī)院租賃意向協(xié)議書
- 哥倆合作蓋房協(xié)議書
- 2025四川愛眾集團第一批次招聘10人筆試參考題庫附帶答案詳解
- 工業(yè)用地開發(fā)項目成本分析與資金籌措方案
- 2025年初中地理學業(yè)水平考試模擬試卷:地圖與地球知識綜合訓練試題卷及答案
- (人教2024版)英語七年級下冊Unit7.4 Section B 1a-2d課件(新教材)
- 2025年湖北荊州市監(jiān)利市暢惠交通投資有限公司招聘筆試參考題庫含答案解析
- 酒店入股合同協(xié)議書
- 銀行sql考試題及答案
- 隔離技術知識試題及答案
- 2025三方貿易協(xié)議合同范本 貿易合同范本
- 2025-2030中國聚苯醚行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略研究報告
- 山東省臨沂市2025年普通高等學校招生全國統(tǒng)一考試(模擬)歷史及答案(臨沂二模)
評論
0/150
提交評論