醫(yī)藥數(shù)理統(tǒng)計課件_第1頁
醫(yī)藥數(shù)理統(tǒng)計課件_第2頁
醫(yī)藥數(shù)理統(tǒng)計課件_第3頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、醫(yī)藥數(shù)理統(tǒng)計,教師:呂 靖 聯(lián)系方式: 電話郵箱: qq號:76756940 辦公室:公教樓123,第一章.事件與概率,第二章.隨機變量的概率與數(shù)字特征,第三章.實驗設計,第四章.抽樣分布,第五章.參數(shù)估計,第六章.假設檢驗,第八章.線性相關與回歸分析,第九章.正交設計,概率規(guī)律,統(tǒng)計方法,主要內(nèi)容,第七章.方差分析,第十章.均勻設計,實驗設計,一次拋擲硬幣試驗 (出現(xiàn)正面朝上),多次拋擲硬幣實驗 (出現(xiàn)正面朝上的次數(shù)),不確定,近半數(shù)(規(guī)律),這種在個別實驗中其結果呈現(xiàn)出不確定性,在大量重復試驗中其結果又具有統(tǒng)計規(guī)律性的現(xiàn)象,稱為隨機現(xiàn)象。,概率論與數(shù)理統(tǒng)計是研究和

2、揭示隨機現(xiàn)象規(guī)律性的一門數(shù)學學科。,事件與概率,第一節(jié) 隨機事件及其運算 一、隨機事件 隨機試驗:對隨機現(xiàn)象的觀察(試驗) 拋一枚硬幣,觀察 拋一顆骰子,觀察 記錄某城市120急救電話臺一晝夜接到的呼叫次數(shù) 觀察某一電子元件的壽命 將一枚硬幣連拋三次,考慮正(反)面出現(xiàn)的情況 具有以上三個特點的試驗成為隨機試驗,簡稱試驗(e)。,1、可以在相同條件下重復; 2、每次試驗的結果可能不止一個,并且能事先明確試驗的所有可能結果; 3、進行一次試驗之前不能確定哪一個結果會出現(xiàn)。,二、事件間的關系與運算,事件的包含:如果事件a發(fā)生必然導致b發(fā)生 則稱事件b包含事件a 或稱事件a包含于事件b 或稱a是b的

3、子事件 記作ba或ab,說明:ab屬于a的每一個樣本點一定也屬于b 對任意事件a 易知a,事件的相等:如果事件a包含事件b 事件b也包含事件a 則稱事件a與b相等(或等價) 記作ab,說明:相等的兩個事件總是同時發(fā)生或同時不發(fā)生,事件與概率,事件的并(或和) “事件a與b至少有一個發(fā)生”這一事件稱 作事件a與b的并(或和) 記作ab或ab 例.在投擲一枚骰子的試驗中 記a“點數(shù)為奇數(shù)” b“點數(shù)小于5” 則 ab?,事件的交(或積) “事件a和b都發(fā)生”這一事件稱為事件a與b的交(或積) 記作ab(或ab),說明:兩個事件的并與交可以推廣到有限個或可數(shù)個事件的并與交,例.在投擲一枚骰子的試驗中

4、 記a“點數(shù)為奇數(shù)” b“點數(shù)小于5” 則ab ?,事件與概率,完備事件組:設a1 a2 an是兩兩互不相容的事件 并且和為,稱a1 a2 an是一個完備事件組,例.考察某一位同學在一次數(shù)學考試中的成績 分別用a b c d p f表示下列各事件(括號中表示成績所處的范圍) a優(yōu)秀(90 100) d及格(60 70) b良好(80 90) p通過(60 100) c中等(70 80) f未通過(0 60) 則:a b c d f是兩兩不相容事件 p與f是互為對立的事件 即有pf a b c d均為p的子事件 且有pabcd,對立事件:“事件a不發(fā)生” 這一事件稱為事件a的對立事件 記作a 如

5、:在投擲一枚骰子的試驗中 “點數(shù)小于3”和“點數(shù)大于4”這兩個事件是互不相容事件 說明:在一次試驗中 如果a發(fā)生 則a一定不發(fā)生 如果a不發(fā)生 則a一定發(fā)生 因而有aa aa,問:對立事件與互不相容事件之間的關系?,事件與概率,三、隨機事件的運算律 1 關于求和運算 (1) abba (交換律) (2) (ab )ca(bc )abc (結合律) 2 關于求交運算 (1) abb a (交換律) (2) (ab )ca(b c )ab c (結合律) 3 關于求和與求交運算的混合 (1) a(bc )(ab )(ac ) (第一分配律) (2) a(bc )(ab )(ac ) (第二分配律)

6、 4 關于求對立事件的運算 5 德摩根律,事件與概率,頻 率 穩(wěn) 定 值 概率,概率的統(tǒng)計定義 頻率:在相同條件下進行n次試驗,事件發(fā)生的次數(shù)m稱為事件 發(fā)生的頻數(shù)。稱 為發(fā)生的頻率。記作 定義:當n足夠大時,頻率的穩(wěn)定值p(注意概率與頻率的區(qū)別),性質(zhì):,第二節(jié) 事件的概率,注:概率是一個隨機事件所固有的屬性,與試驗次數(shù)以及每一次試驗結果無關。,頻率的性質(zhì),事件發(fā)生的頻繁程度,事件發(fā)生的可能性的大小,概率的統(tǒng)計定義,事件與概率,一、概率的定義,概率的古典定義 前提:試驗樣本空間只包含有限個元素;每個基本事件發(fā)生等可能性。 定義:已知樣本空間 中基本事件總數(shù)為n,若事件a 包含 k 個基本事件

7、,則有 例:將一枚硬幣拋三次,求(1)事件a=恰有一次出現(xiàn)正面(2)事件b=至少有一次出現(xiàn)正面? 例:某學習小組有10名同學,其中7名男生,3名女生,從中任選3人去參加社會 活動,則3人全為男生的概率為?,補充:排列與組合 排列定義:從m個元素中,取出n(nm)個元素按一定順序排成一列。記為 組合定義:從n個元素中,任取k個為一組,得出的不同的組數(shù),稱為組合數(shù)。 記作,1.互斥事件加法定理(有限可加性) 若事件a、b互斥,則有p(a+b)=p(a)+p(b) 推廣:若 為兩兩互斥事件,則 例 .藥房有包裝相同的六味地黃丸100盒,其中5盒為去年產(chǎn)品,95盒為今年產(chǎn)品?,F(xiàn)隨機發(fā)出4盒,求:有1盒

8、或2盒陳藥的概率。 2. 一般加法定理 對任意兩事件a、b,有p(a+b)=p(a)+p(b)p(ab) 推廣:對任意三事件a、b、c,有p(a+b+c)=p(a)+p(b)+p(c)p(ab)p(ac) p(bc)+p(abc) 3.減法定理 對任意的a、b,有p(a-b)=p(a)p(ab),二、概率的運算,4.條件概率與乘法定理 條件概率:在事件b已經(jīng)發(fā)生的條件下,a發(fā)生的概率稱為a的條件概率,記 性質(zhì): 一般情況下, 例. 袋中有2個白球,8個黑球,現(xiàn)讓兩個人去抽球(無放回)。若已知第一個人抽到白球,則第二個人也抽到白球的概率是多少? 乘法定理: 推廣公式:,4.獨立事件及其乘法定理

9、獨立事件:若 或 或 則稱時間a、b相互獨立。 定理:若a與b,a與 , 與b, 與 中有一對相互獨立,則另外三對也相互獨立。 推廣:若任意三事件a、b、c兩兩獨立,且p(abc)=p(a)p(b)p(c),則稱a、b、c相互獨立。 多事件相互獨立 多事件兩兩獨立 例如:拋一枚硬幣兩次,記a=第一次為正面,b=第二次為反面,c=兩次都為同一面。分析知,a、b、c兩兩獨立,但不相互獨立。 獨立事件的乘法定理:若 相互獨立,則 注意:具有非零概率的兩事件,互斥就不獨立,獨立就不互斥。 例.若每人血清中有肝炎病毒的概率為0.4%,今混合100人的血清,求混合血清無肝炎病毒的概率。,1.全概率公式:若

10、 構成互斥完備群,則對任意事件b,有 全概率公式的意義:在較復雜情況下直接計算p(b)不易,借助于一個完備事件組,將復雜事件分解成若干個互不相容的簡單事件的和,再利用概率的加法公式求出復雜事件概率。 例12.設藥房的某種藥品由三個不同的廠家生產(chǎn)。其中第一家藥廠生產(chǎn)的藥品占1/2,第二、三家分別占1/4,已知第一、二家藥廠生產(chǎn)的藥品有2%的次品,第三家藥品有4%的次品。試求:現(xiàn)從藥房任取一份,問拿到次品的概率?,第四節(jié) 全概率公式和逆概率公式,實際工作中還會遇到與全概率問題相逆的問題。 如例12改成:設藥房的某種藥品由三個不同的廠家生產(chǎn)。其中第一家藥廠生產(chǎn)的 藥品占1/2,第二、三家分別占1/4

11、,已知第一、二家藥廠生產(chǎn)的藥品有2%的次品,第三家藥品有4%的次品。試求:拿到的藥品是次品時,該次品由各家藥廠生產(chǎn)的可能性為多大? 2.逆概率公式(貝葉斯公式):設 是互斥完備群,則對任意事件b, 有,隨機變量的概率分布與數(shù)字特征,第一節(jié) 隨機變量與離散型隨機變量的概率分布 引入隨機變量使得隨機事件可用隨機變量的關系式表示,從而使對隨機現(xiàn)象研究進一步深入、更數(shù)學化。 1.隨機變量 對于隨機試驗,若其試驗結果可用一個取值帶有隨機性的變量來表示,且變量取這些可能值的概率是確定的,則稱這種變量是隨機變量。 注意:隨機變量常用x,y,z表示,而表示隨機變量所取的值通常用x,y,z表示。 例如,從某一學

12、校隨機選一學生,測量他的身高。我們可把可能的身高看作隨機變量x,然后提出關于x的各種問題。如p(x1.7)=?p(x1.5)=? p(1.5x1.7)=?一旦我們實際選定了一個學生并量了他的身高之后,我們就得到x的一個具體的值,記作x。這時,要么x1.7米,要么x 1.7米,再去求p(x1.7米)就沒有什么意義。 性質(zhì)1:隨機變量取任何值的概率均為非負。 性質(zhì)2:隨機變量取所有可能值的概率之和為1。,2.離散型隨機變量 如果隨機變量只能取有限個或無限可列個數(shù)值,則稱它為離散型隨機變量。 例如:小白鼠存活的只數(shù),引體向上次數(shù)等。 3.連續(xù)型隨機變量 如果隨機變量的可能取值為某一區(qū)間的所有實數(shù),無

13、法一一列舉,則稱他為連續(xù)型隨機變量。 例如:身高、體重等。,4.離散型隨機變量的概率函數(shù) 設離散型隨機變量x的所有可能取值為xi (i=1,2,),相應的概率p(x=xi)=pi稱為離散型隨機變量x的概率函數(shù)或分布律。 通常x的分布律可用表格表示: 概率函數(shù)有如下性質(zhì)性質(zhì): 例.某籃球運動員投中籃圈概率是0.9,求他兩次獨立投籃投中次數(shù)x的概率分布。,5.離散型隨機變量的分布函數(shù) 設x是一個隨機變量(可以是離散型,也可以是連續(xù)型),x是任意實數(shù),則函數(shù) f(x)=p(xx)稱為隨機變量x的分布函數(shù)。 性質(zhì):(1) f(x)為非減函數(shù); (2)0f(x)1 (-x+); (3)f(-)=0, f

14、(+)=1; (4)f(x) 右連續(xù),即 例. 給青蛙按每單位體重注射一定數(shù)量的洋地黃,由以往的實驗知,致死的概率 為0.6,存活的概率為0.4,現(xiàn)給兩只青蛙注射,求死亡只數(shù)的概率函數(shù)和分布函 數(shù)。,第二節(jié) 常用的離散型隨機變量的概率分布 1.二項分布 伯努利試驗:許多試驗只有兩種互斥的結果,為了找到這些試驗結果的規(guī)律性, 需要在相同條件下做n次獨立重復試驗,稱為n重伯努利試驗,簡稱伯努利試驗。 二項分布 若在一次伯努利實驗中成功(事件a發(fā)生)的概率為p(0p1),獨立重復進行n次, 這n次中實驗成功的次數(shù)(事件a發(fā)生的次數(shù))x的分布列為: 稱x所服從的分布為二項分布.記為xb (n, p).

15、 例.某射手在相同條件下獨立地進行5次射擊,每次擊中目標的概率是0.6,求擊中 目標次數(shù)x的概率分布.,在二項分布中,x取不同值k(k=0, 1, 2, n)的概率是不同的, 是p(x=k)取最大值的k(記為k0)稱為二項分布的最可能值。當k在(n+1)p附近時,p (x=k)達到最大值。即: 若(n+1)p為整數(shù),則k0為(n+1)p和(n+1)p-1; 若(n+1)p為非整數(shù)時,則k0為int (n+1)p 例4. 設某種老鼠正常情況下,受某種病毒感染的概率為20%,試求正常情況下, 25只健康老鼠受感染的最可能只數(shù)是多少? 2.泊松分布(稀有事件模型) 如果隨機變量x的概率函數(shù)為 其中,

16、0,則稱x服從參數(shù)為的泊松分布,記為xp ()。 許多稀有事件都服從或近似服從泊松分布。 =np。,例5.已知某地區(qū)人群中患某種病的概率為0.001,試求在檢查的5000人中至少有2 人患此病的概率。 解:由于n=5000較大,p=0.001較小,取=np=5,設x=患此病人數(shù), 則xp(5) 若精確計算,則xb(5000,0.001),第3節(jié) 連續(xù)型隨機變量的概率分布 1.連續(xù)型隨機變量的概率密度 若對于隨機變量x的分布函數(shù)f(x),存在非負函數(shù)f (x), 使得對于任意實數(shù)x,有: 則稱x為連續(xù)型隨機變量,其中被積函數(shù)f(x)稱為x的概率密度函數(shù)(簡稱概率 密度) 性質(zhì): f (x) 0;

17、 對于任意實數(shù)a,b(ab) 若f(x)在點x處連續(xù),則 注意:連續(xù)型隨機變量x的分布函數(shù)f(x)是連續(xù)函數(shù). 連續(xù)型隨機變量 x 取任一常數(shù) a 的概率為0 ,2.正態(tài)分布 定義:若隨機變量x的概率密度函數(shù)為 其中 , ( 0)為常數(shù) ,則稱x服從參數(shù)為 ,2的正態(tài)分布(或高斯分布) ,記為xn(, 2). 特點:曲線f(x)呈鐘形,關于直線x=對稱,在(-,上遞增,在,+) 上遞減。 在x=處,f(x)取最大值 在x=處有拐點,且以x軸水平漸近線。,當固定時,改變,則f(x)圖形的形狀不變,只改變其位置,確定圖形的 中心位置,稱位置參數(shù),增大,曲線向右移。 當固定時,越小圖形越陡峭,確定圖

18、形峰的陡峭形狀,故稱形狀參數(shù)。,標準正態(tài)分布 參數(shù)=0,=1的正態(tài)分布為標準正態(tài)分布,記為xn(0,1)。 標準正態(tài)分布的重要性在于,任何一個正態(tài)分布都可以通過線性變換轉化為標準正態(tài)分布。它的依據(jù)是下面的定理: 根據(jù)定理,只要將標準正態(tài)分布的分布函數(shù)制成表,就可以解決一般正態(tài)分布的概 率計算問題。,正態(tài)分布是自然界及工程技術中最常見的分布之一,大量的隨機現(xiàn)象都是服從或 近似服從正態(tài)分布的正態(tài)分布是概率論中最重要的分布。 均勻分布、對數(shù)正態(tài)分布等分布不做要求。,第4節(jié) 隨機變量的數(shù)字特征 隨機變量數(shù)字特征,分兩類: 表示集中程度、平均水平 數(shù)學期望、分位數(shù)、中位數(shù)、眾數(shù)等; 表示離散程度、變異大

19、小 方差、標準差、變異系數(shù)等。 1.均數(shù)(數(shù)學期望) 定義1:設離散型隨機變量x的分布律為px=xi=pi, k=1,2,3. ,則規(guī)定x 的均數(shù) 定義2:設連續(xù)型隨機變量x的概率密度函數(shù)f(x),則規(guī)定x的均數(shù)為 性質(zhì):(1) e(c)=c, c為常數(shù) (2)e(cx)=c*e(x) (3)e(xy)=e(x)e(y) (4)e(xy)=ex*ey,x與y獨立,常見分布的數(shù)學期望 二項分布: 泊松分布: 正態(tài)分布:e(x)= 2.方差和標準差 方差:設x是一個隨機變量,則稱e(x-ex)2為x的方差,記作dx, 為標準差。 注:隨機變量的方差反映了它的取值與其數(shù)學期望的偏離程度,它是衡量取值

20、離 散程度的一個尺度。 對于離散型隨機變量: 對于連續(xù)型隨機變量: 性質(zhì):(1) d(c)=0,c為常數(shù) (2) d(cx)=c2*d(x) (3) d(xy)=dx+dy,x與y相互獨立,常見分布的方差 二項分布: 泊松分布: 正態(tài)分布: 例7:設xp(2),則下列結論中正確的是( ) a.ex=0.5,dx=0.5b.ex=0.5,dx=0.25 c.ex=2,dx=4 d.ex=2,dx=2 例8:相互獨立的隨機變量x和y的方差分別為4和2,則隨機變量3x-2y的方差是? 3.變異系數(shù) 比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異程度。,第5節(jié) 三種重要分布的漸進關系(略)

21、當n,二項分布b (k; n, p)以泊松分布p (k; )為極限分布; 當n,二項分布b (k; n, p)以正態(tài)分布n (np, npq )為極限分布; 當n,泊松分布p (k; ) 以正態(tài)分布n(; )為極限分布。 例:,第3講 隨機抽樣、抽樣分布和總體的參數(shù)估計 第1節(jié) 隨機抽樣 1.總體與樣本 總體:研究對象的全體,組成總體的每個單元稱為個體。 樣本:在一個總體x中抽取n個個體x1,x2xn,這n個個體組成的集合稱為總體 x的一個樣本。樣本中含有個體的數(shù)目稱為樣本容量,也稱樣本的大小。 簡單隨機抽樣 是指在抽取樣本單位時,總體的每一個可能的樣本被抽中的概率相同。 簡單隨機樣本 樣本x

22、1,x2xn相互獨立且與總體x有相同的分布函數(shù),這樣的樣本稱為簡單隨 機樣本。,第2節(jié) 樣本的數(shù)字特征 統(tǒng)計量:設x1, x2xn為總體x的一個樣本,g(x1,x2xn)為一個樣本函數(shù),如 果g中不含有任何未知參數(shù),則稱g為一個統(tǒng)計量。 特點:(1)統(tǒng)計量是樣本中n個隨機變量x1 ,x2 ,xn的函數(shù),它是完全由樣本決 定的量,仍是一個隨機變量。 (2)統(tǒng)計量不包含任何未知參數(shù)。 例如: 幾種常見統(tǒng)計量 樣本均數(shù),樣本方差、標準差、變異系數(shù)(相對標準差) 注意:分母為n-1。由于樣本方差中的均數(shù)是樣本的,是總體的一部分,其離差平 方和一定變小,所以若以n為分母,s2一般比總體方差?。ㄓ衅烙嫞?/p>

23、。而分母改 為n-1后,經(jīng)數(shù)學證明,s2總在總體方差周圍波動(無偏估計),另外,s2 的自 由度正好是n-1。 樣本的標準誤 sd與se的區(qū)別:sd是描述個體觀察值變異程度的大小,樣本標準差越小,樣本均 數(shù)對一組樣本觀察值的代表性就越好;se是描述樣本均數(shù)變異程 度和抽樣誤差的大小,樣本標準誤越小,用樣本均數(shù)估計總體均 數(shù)可靠性就越高。,在實際中,一般用樣本標準差與樣本均數(shù)結合,用于描述樣本觀察值的分布范 圍;樣本標準誤與樣本均數(shù)結合,用于估計總體均數(shù)可能出現(xiàn)的范圍。 第3節(jié) 抽樣分布 統(tǒng)計量是樣本隨機變量的函數(shù),也是一個隨機變量,因而也有自己的概率分布, 這種統(tǒng)計量的分布叫做抽樣分布。 以下

24、介紹幾種在已知總體為正態(tài)分布條件下,常見統(tǒng)計量的抽樣分布。 1.樣本均數(shù)的u分布 這說明樣本均數(shù)的期望與總體的期望相等,而方差為總體方差的1/n倍??梢?,用 樣本均值估計總體均值無系統(tǒng)偏差,且n越大越精確。,樣本均值分布的應用: 其標準化隨機變量u主要用于單正態(tài)總體、方差已知、小樣本條件下數(shù)學期望的u檢驗。,2.2分布(卡方分布) 設x1,x2,xn相互獨立,都服從n(0,1),則稱隨機變量: 所服從的分布為自由度為n的2分布,記為22(n)。 自由度:指統(tǒng)計量中獨立變量的個數(shù)。計算公式為df=n-k,n為樣本容量,k為約 束條件個數(shù)。如統(tǒng)計量 ,變量獨立無約束條件,所以自由 度為n。而樣本方

25、差 ,其中有n個變量 ,但 這說明變量間有一個約束條件,所以其自由度為n-1. 性質(zhì):(1)一種非對稱分布。當n較大時,曲線近似對稱,趨于正態(tài)分布。 (2)一個以自由度n為參數(shù)的分布族, 自由度n決定了分布的形狀,對于 不同的n有不同的分布。 (3)均值為n,方差為2n。,定理:若x1,x2xn為正態(tài)總體 的一個樣本,則有 3.t分布 設xn(0,1),y2(n),且x與y相互獨立,則稱隨機變量 所服從的分 布為自由度為n的t分布,記為tt(n)。 性質(zhì):(1) t分布是對稱分布,與標準正態(tài)分布相比,t分布的中心部分較低,2個尾部較高。 (2)均值為0, 方差為n/(n-2)。 (3)當樣本容

26、量n較小時,t分布的方差大于1;當n逐漸增大時,t分布的方差就接近1,t分布也就趨近于標準正態(tài)分布。,t分布是統(tǒng)計學中十分重要的分布,應用最為廣泛,其應用的依據(jù)是下面2個定理: (1) 設x1,x2xn為正態(tài)總體 的一個樣本,則 (2) 設x1,x2xn1和y1,y2yn2分別是從同方差的總體 和 中所抽取的樣本,它們是相互獨立,則 其中, s1和s2分別是這兩個樣本的標準差。,4.f分布 設x 2(n1), y2(n2), x與y相互獨立,則稱統(tǒng)計量 為服從自由度 n1和n2的f分布,記為ff(n1,n2)。 n1為分子隨機變量x的自由度,稱為分子自由度,n2為分母隨機變量y的自由度,稱為分

27、母自由度。 性質(zhì):(1) 非對稱偏左側的分布;當n較大時,曲線近似對稱,趨于正態(tài)分布。 (2)是以自由度n1和n2為參數(shù)的分布族,不同自由度決定了f 分布的形狀。 概率分布的擬合及其應用不做要求。,第4節(jié) 總體的參數(shù)估計 統(tǒng)計推斷:用樣本的信息去推斷總體的信息。 參數(shù)估計:用樣本統(tǒng)計量去估計總體參數(shù)的大小。 假設檢驗:用樣本統(tǒng)計量大小去推斷總體參數(shù)是否有差異。,1.參數(shù)點估計(略) 直接用樣本統(tǒng)計量大小代替總體參數(shù)。同一總體參數(shù)可用多個統(tǒng)計量來估計,衡 量其好壞的指標有三個:無偏性、有效性、一致性。(易出選擇題或填空題) 缺陷:(1)點估計值不一定是參數(shù)的真值,即使與真值相等也無法肯定這種相等

28、 (總體參數(shù)本身是未知的)。 (2)點估計值只是未知參數(shù)的一個近似值,沒有給出它與真值之間的誤差范 圍(可靠程度),把握不大。 實例:估計全省18歲女孩的平均身高。若根據(jù)實際樣本,通過點估計法可能得到 女孩的平均身高估計值為162cm。而實際上,女孩的平均身高可能大于或小 于162cm。若能給出一區(qū)間,能以較大概率相信這個區(qū)間包含身高的真值, 將會更有價值。,2、區(qū)間估計 在給定可靠程度1-下,用樣本值通過合適統(tǒng)計量,估計總體參數(shù)所在區(qū)間的 方法。 置信區(qū)間與置信度 設是總體的未知參數(shù),若由樣本x1,x2,xn 確定的兩個統(tǒng)計量: 對給定(01),滿足 則稱 是在置信度(置信水平、置信概率)1

29、-下的置信區(qū)間(ci)。 注意:置信區(qū)間的長度反映了估計的精度,長度越小,估計的精度越高。置信度 則反映了估計的可靠程度,置信度越大,估計的可靠性越大。 置信度與精確度是一對矛盾,如何處理? 兩者矛盾時,應在保證可靠度條件下盡 可能提高精度。,3.正態(tài)總體期望值的區(qū)間估計 已知 設x1, x2,xn是取自正態(tài)總體n(,2)的樣本,且2已知,求參數(shù)的置信 度為1-的置信區(qū)間。 解:(1)選的點估計 (2)取函數(shù) (3)對給定的置信度1-,查正態(tài)分布表得u/2, (4)變形 所以在置信度1-的置信區(qū)間為: 簡記為 常取值0.05,而,例1.設正態(tài)總體xn(,1),從中抽取樣本容量為16的樣本,且樣

30、本均數(shù)為5.20,求的置信度為95%和99%的置信區(qū)間。 解:由題意易得n=16,=1(總體方差已知) 當1-=0.95時,=0.05;查表得 u0.05/2=1.96 當1-=0.99時,=0.01, 查表得,u0.01/2=2.58 則置信度為95%的置信區(qū)間為 既為(4.71,5.69)。同樣計算方法可得 99%的置信區(qū)間為(4.56,5.85)。 可以看到,99%的置信區(qū)間要比95%的置信區(qū)間寬, 雖然可靠性更強,但是精確度更低。,未知 設x1,xn是取自n(,2) 的樣本,且2未知,求參數(shù)的置信度為1-的置信區(qū)間。 思考:應選擇何種分布函數(shù)? 解:(1)選的點估計 (2)取函數(shù) (3

31、)對給定的置信度1-, (4) 所以在置信度1-的置信區(qū)間為: 簡記為,例2.隨機抽取6只貓,靜脈注射麻醉后,收集支氣管內(nèi)分泌物,分泌量為4.8,7.92, 1.2, 12.72, 9.6, 13.68,若分泌量服從正態(tài)分布,求該批貓支氣管內(nèi)平均分泌 量的95%的置信區(qū)間。 解:n=6,df=5,總體方差未知。當1-=0.95時,=0.05,查表得t0.05/2(5)=2.571 95%的置信區(qū)間為 ,既為(3.33, 13.31)。 注意:在大樣本下,t/2(n-1)u/2,即t分布近似于標準正態(tài)分布,這時, 的置信水平1-的置信區(qū)間為 大樣本:50 正態(tài)總體總體均數(shù)之差的區(qū)間估計、正態(tài)總體

32、方差的區(qū)間估計(略)。 離散型總體參數(shù)的區(qū)間估計不作要求。,第4講 總體參數(shù)的假設檢驗,第1節(jié) 假設檢驗的基本思想 問題的提出 從吸煙人群和非吸煙人群中各抽取n=100的樣本,分別記為a樣本和b樣本。a樣本 收縮壓為150mmhg,b樣本為130mmhg。 原因有兩種可能:(1) 兩個總體均數(shù)不相同 (2) 抽樣誤差(兩個總體均數(shù)相同) 假設檢驗的基本思想 (1)反證法 (2)小概率原理:認為小概率事件在一次抽樣中是不可能發(fā)生的。 先假定一個假設h0:1=2成立,如果由此導出一個不合理現(xiàn)象的發(fā)生(即出現(xiàn) 一個小概率事件),就拒絕這個假設;如果沒有導出不合理的現(xiàn)象發(fā)生,就不能 拒絕這個假設。,假

33、設檢驗的基本步驟 (1)建立假設 h0:1= 2 (原假設) h1:12 (備擇假設) 注意:假設是針對總體,而不是樣本 (2)確定檢驗水準 顯著性水準,判定差別有無統(tǒng)計學意義的概率水準,確定了小概率事件的標準。 通常取=0.05。p - 小概率事件 (3)選定檢驗方法,計算檢驗統(tǒng)計量 根據(jù)研究目的、資料類型選用合適的檢驗方法; 統(tǒng)計量都是在h0成立的前提下算出來的! (4)確定p值 根據(jù)檢驗統(tǒng)計量確定p值。,p值:h0成立的概率 如果p0.05,即h0成立的概率小于0.05,可以認為h0成立是小概率事件,發(fā)生的 可能性很小,就有理由懷疑h0不成立! (5)做出推斷結論 推斷的結論統(tǒng)計學結論專

34、業(yè)結論 p0.05,按=0.05檢驗水準,不拒絕h0,差異無統(tǒng)計學意義,還不能認為 不同或不等。 p0.05 ,按=0.05檢驗水準,拒絕h0,接受h1,差異有統(tǒng)計學意義,可以認為 不同或不等。 下結論時,對h0只能說拒絕/不拒絕;對h1只能說接受! 不拒絕h0 接受h0,第2節(jié) 單個正態(tài)總體的參數(shù)檢驗 2已知時正態(tài)總體均值的u檢驗 設總體xn(,2),x1,x2,xn為抽自總體x的樣本,方差2已知,則 例1.某藥廠正常情況下生產(chǎn)的某藥膏含甘草酸量xn(4.45,0.1082).現(xiàn)隨機抽 查了5支藥膏,其含甘草酸量分別為:4.40 4.25 4.21 4.33 4.46,若方 差不變,問此時藥

35、膏的平均含甘草酸量是否有顯著變化?(=0.05) 解:h0:=0,h1:0;=0.05 根據(jù)顯著水平=0.05,查正態(tài)分布雙側 臨界值,得u0.05/2=1.96 |u|=2.485u0.05/2 ,所以拒絕h0,接受h1。 可以認為此藥膏的平均含甘草酸量有顯著性變化。,2未知時正態(tài)總體均值的u檢驗 設總體xn(,2),x1,x2,xn為抽自總體x的樣本,方差2未知,則 例2.正常人的脈搏平均為72(次/min),現(xiàn)測得20例慢性四乙基鉛中毒患者的脈 搏(次/min)的均值是63.50,標準差是5.60,若四乙基鉛中毒患者的脈搏服從正態(tài) 分布,問四乙基鉛中毒患者的脈搏是否與正常人不同?(=0.

36、05) 解: h0:=0,h1:0 =0.05 查t分布臨界值表得: |t|=6.7882.093,所以拒絕h0,接受h1 可認為四乙基鉛中毒者的脈搏與正常人不同。,第3節(jié) 兩個正態(tài)總體的參數(shù)檢驗 1.兩個正態(tài)總體的方差齊性檢驗(略) 2.配對比較兩個正態(tài)總體均數(shù)的檢驗(略) 3.成組比較兩個正態(tài)總體均數(shù)的檢驗(略) 第4節(jié) 方差分析 在多組總體均數(shù)比較時如采用t檢驗會增大犯第一類錯誤概率。如三組之間的兩兩 t檢驗,三組之間的兩兩t檢驗做完三次t檢驗,總的顯著性水平變?yōu)?-(1-0.05)3 =0.14,要大于設定的=0.05。而方差分析是將三組數(shù)據(jù)放在一起做一次比較,犯 一類錯誤的概率仍為=

37、0.05。 基本概念 試驗指標:衡量試驗結果好壞的標準。 因素:在試驗過程中,影響試驗結果的條件。 水平:因素在試驗中可能處的狀態(tài)。,總體1. n(1 ,12)- 樣本1( n1 , ,s1 ) 總體2. n(2 ,22)- 樣本2( n2 , ,s2 ) 總體3. n(3 ,32)- 樣本3( n3 , ,s3 ) 已知:12=22=32,問:1=2=3 ?,總離差平方和(ss),所有觀察值之間的差異,組內(nèi)離差平方和(sse),在因素的同一水平(同一個總體)內(nèi),樣本的各觀察值之間的差異,組間利差平方和(ssa),在因素的不同水平(不同總體)下,各水平的均值之間的差異,組間變異(不同藥物效應引

38、起 + 隨機誤差引起) 總變異 組內(nèi)變異(隨機誤差引起) 如不同藥物的作用相同(h0:均值相等),則:f=組間變異/ 組內(nèi)變異 =1 在h0條件下,f雖不會正好等于1 (抽樣誤差),但應當和1相差不大。 f越大,其概率越小,當f以致其對應的概率p0.05,則可認為不同藥物的作用 是不相同的。即樣本均數(shù)之間的差異有統(tǒng)計學意義。,方差分析的基本步驟 (1)提出假設 h0:三種藥物對小白鼠鎮(zhèn)咳作用相同 h1:三種藥物鎮(zhèn)咳作用不完全相同 (2)確定檢驗水準 =0.05 (3)計算統(tǒng)計量 sse的自由度為n-k,即40-3=37,組內(nèi)方差se2=sse/(n-k) ssa的自由度為k-1,即3-1=2,

39、組間方差sa2=ssa/(k-1) 統(tǒng)計量f=組間方差sa2 /組內(nèi)方差se2 ,將結果整理為方差分析表,(4)確定p值 (5)作出推斷結論 在=0.05水平上,拒絕h0,接受h1,認為三種藥物平均推遲咳嗽時間不全相同。 方差齊是方差分析的前提條件之一,因此先進行方差齊性檢驗(略)。 方差分析中如果拒絕ho,接受h1,僅能認為多個水平間均數(shù)不全相等,但是哪些 水平間差異顯著,哪些不顯著,方差分析不能作結論。因此需要進行兩兩間多重 比較的檢驗法(略)。 兩因素試驗的方差分析不作要求。 第5節(jié) 離散型變量總體參數(shù)的假設檢驗 單個總體率的假設檢驗(略) 兩個總體率的假設檢驗(略),第6節(jié) 列聯(lián)表中獨

40、立性檢驗 22列聯(lián)表(四格表)中的獨立性檢驗 原理及步驟 (1)建立假設 h0:兩種藥物治療消化道潰瘍的療效相同 h1:兩種藥物治療消化道潰瘍的療效不同 (2)確立檢驗水準 =0.05 (3)計算統(tǒng)計量 在h0成立的前提下, 假設1=2=pc(合計率),計算理論頻數(shù)t,兩種藥物治療消化道潰瘍4周后療效 處 理 愈合 未愈合 合計 愈合率(%) 洛賽克 64(e11) 21(e12) 85 75.29 雷尼替丁 51(e21) 33(e22) 84 60.71 合 計 115 54 169 68.05,合計愈合率=115/169,合計未愈合率=54/169,各個格子理論頻數(shù)應為: e11=85*

41、 115/169,e12=85* 54/169,e21=84 * 115/169,e22=84* 54/169 統(tǒng)計學家pearson提出對rc列聯(lián)表使用統(tǒng)計量 它服從自由度為f的2分布,其中f=(r-1)*(c-1)。 (4)確定p值。20.05,1=3.84,得p 0.05。 (5)做出推斷結論 按=0.05水準,拒絕h0,接受h1,差異有統(tǒng)計學意義。可以認為洛賽克的 愈合率高于雷尼替丁。,配對四格表的獨立性檢驗、四格表的確切概率法不做要求。 rc列聯(lián)表(四格表)中的獨立性檢驗(略) 參照單位法 ridit分析 注意:等級資料應采用ridit分析,不能采用2檢驗。 用置信區(qū)間作顯著性檢驗不

42、作要求。,第5講 相關與回歸 在某一現(xiàn)象(過程)中變量間的關系可能是確定性關系,也可能是非確定關系。 就兩個變量而言,如果對于一個變量的可能取值,另一個變量都有完全確定的值 與之對應,則稱這兩個變量之間存在著函數(shù)關系。然而,像人的年齡與血壓,身 高與體重之間,顯然不是函數(shù)關系。因為對于年齡相同的一個人群其血壓有高有 低乃是一個隨機變量。我們稱這類非確定性關系為相關關系。 相關與回歸分析的基本內(nèi)容就是運用數(shù)學手段,在大量統(tǒng)計資料中找出這種相關 性,并作定量分析。 第1節(jié) 相關 散點圖 簡單直觀研究兩變量間相關關系的方法,是將試驗或觀察得到的n對(x,y)的樣 本數(shù)據(jù):(x1,y1)、(x2,y2

43、)、(xn,yn),作為平面直角坐標系上點的 坐標,將它們在方格坐標紙上描出,得到散點圖,直觀地說明直線相關的性質(zhì)。,相關系數(shù) 總體相關系數(shù) 如果變量x,y的方差dx,dy存在且ex=x,ey=y,則定義 為總體相關系數(shù),分子稱為x和y的協(xié)方差。具有以下性質(zhì): (1)-1 1 (2)如果x和y存在著線性相關關系,則|=1 (3)如果x和y獨立,則=0。 注:性質(zhì)(3)不可逆,當=0時,應稱x和y是不線性相關的。,樣本相關系數(shù) 設(x1,y1), (x2,y2), ,(xn,yn)是成對出現(xiàn)的變量x和y的n對樣本值,則定義 為x和y的樣本相關系數(shù),簡稱相關系數(shù),其中 r與性質(zhì)相同,是的點估計。相

44、關系數(shù)沒有單位,取值范圍為1r1。r 的符號表示相關方向,r0稱為正相關,r0稱為負相關。r的絕對值表示兩個 變量間直線關系的密切程度,r的絕對值為1表示完全相關。相關系數(shù)的絕對值 接近1,表示兩個變量間的直線關系愈密切。相關系數(shù)愈接近0,直線關系愈不 密切。r0稱為零相關,是指非線性相關或無相關,并不一定表示兩個變量間 不存在其他關系。,相關系數(shù)的假設檢驗 判斷x和y是否線性相關,需要檢驗r是否來自0的總體,稱為相關系數(shù)的假設 檢驗。 總體相關系數(shù)0,表示總體中兩變量x和y無直線相關關系。因是一 個客觀存在的理論值,一般無法獲得,在實際問題中,常用r推斷變量x和y有無直 線相關關系。當r0時

45、,因為存在抽樣誤差,不能認為0,所以,判斷x和y是 否線性相關,需要檢驗r是否來自0的總體.,方法1:可直接用r作檢驗統(tǒng)計量,用自由度dfn2查相關系數(shù)r界值表,若 r臨界值r,則p,可按檢驗水準拒絕h0,認為x與y之間有直線相關 關系,0。反之,若rr,則p,不能按檢驗水準拒絕h0,從而 認為x、y之間無直線相關關系。 方法2:在h0:0假設下,可用t檢驗判斷樣本相關系數(shù)r是否來自0的總體 ,即t 服從自由度dfn2的t分布。 第2節(jié) 線性回歸方程 一元線性模型 對普通變量x的值x1,x2,xn,設隨機變量y相應的觀察值為y1,y2,yn且諸點 (x1,y1), (x2,y2), ,(xn,

46、yn)排布成 一條直線或接近一條直線,則可假定y與x 之間有如下關系:y=a+bx+,其中, a,b為不依賴于x的位置參數(shù), 為隨 機誤差且n(0, 2 )。,由正態(tài)分布的性質(zhì)有yn(a+bx, 2 )。在x取某固定值x的前提下,y的值并不 固定,而是形成一個分布,稱為x等于x時的條件分布。顯然,條件分布的均數(shù)y 為一確定值,并且隨著x的取值x不同而不同,所以我們可以把y看成是x的函數(shù) y =a+bx,這個方程就稱為y關于x的回歸方程,x叫回歸變量,b為回歸系數(shù)。 為方便起見,將y記為 ( 為y的預測值),于是 =a+bx。 線性回歸方程 回歸分析就是要確定變量a和b的大小,可采用最小二乘法。

47、 設給定n個點(x1,y1), (x2,y2), ,(xn,yn),那么,對于平面上任意一條直線l :y = a + bx;用數(shù)量yi-(a+bxi)2來刻劃散點到直線l的遠近程度。顯然,這個 量是a,b的二元函數(shù),記為q(a,b)= yi-(a+bxi)2 。問題歸結為求q(a,b)的極小 值。,根據(jù)多元微分學中的極值原理,有: 注:相關系數(shù)r與回歸系數(shù)b的聯(lián)系。 故回歸系數(shù)b乘以x和y變量的標準差之比結果為相關系數(shù)r。 即b*x/y=r 例1:在線性相關的條件下,自變量x的均方差(標準差)為2,因變量y的均方差 (標準差)為5,而相關系數(shù)為0.8時,其回歸系數(shù)為( ) a. 8 b.0.3

48、2 c.2 d.12.5 兩者的取值范圍不一樣。,回歸方程的顯著性檢驗 前面只說明了尋找回歸直線的方法,有該法可知任何一堆毫無相關的散點,都可 找到最“接近”的一條直線,顯然有些直線毫無實用價值。因此,必須引入一個數(shù) 量性指標來描述兩個變量線性關系的密切程度。 選取統(tǒng)計量 其中:u稱為回歸平方和,反映了總的變異中由于線性關系而引起的變化 q稱為殘差平方和,是由隨機誤差引起,q越小越好。 數(shù)學上可以證明,在假設h0:b=0下,統(tǒng)計量f服從自由度為1,n-2的f分布,當ffa 時,則拒絕h0,即認為x與y之間有顯著的線性關系。,第3節(jié) 預測與控制 建立了有統(tǒng)計學意義的回歸方程以后,x變量=x0時,

49、y變量為a+bx0,這個值是估 計值,為提高可靠性,可以在進行區(qū)間估計,包括預測和控制(由x0推算y0稱為預 測,由y0推算x0稱為控制)。(略) 多元線性回歸與非線性回歸不做要求。 第4節(jié) 半數(shù)有效量(ed50)和半數(shù)致死量(ld50)估計 概率單位法(略) 序貫法不做要求。,第6講 正交試驗設計,對于單因素或兩因素試驗,因其因素少,試驗的設計、實施與分析比較簡單。但 在實際工作中,常常需要同時考察 3個或3個以上的試驗因素,若進行全面試驗, 則試驗的規(guī)模將很大 ,往往因試驗條件的限制而難于實施 。正交試驗設計就是 安排多因素試驗 、尋求最優(yōu)水平組合的一種高效率試驗設計方法。 第1節(jié) 正交表

50、與交互作用 基本原理 正交試驗設計是利用正交表來安排與分析多因素試驗的一種設計方法。它是由試 驗因素的全部水平組合中,挑選部分有代表性的水平組合進行試驗的,通過對這 部分試驗結果的分析了解全面試驗的情況,找出最優(yōu)的水平組合。 例如,要考察乙醇濃度、溶劑用量和浸漬速度對姜黃素提取收率的影響。每個因 素設置3個水平進行試驗 。,a因素是乙醇濃度,設a1、a2、a3 3個水平;b是溶劑用量,設b1、b2、b3 3個水 平;c因素為浸漬速度,設c1、c2、c3 3個水平。這是一個3因素3水平的試驗,各 因素的水平之間全部可能組合有27種 。 全面試驗:可以分析各因素的效應,交互作用,也可選出最優(yōu)水平組

51、合。但全面 試驗包含的水平組合數(shù)較多,工作量大,在有些情況下無法完成 。 若試驗的主要目的是尋求最優(yōu)水平組合,則可利用正交表來設計安排試驗。 正交試驗設計的基本特點是:用部分試驗來代替全面試驗,通過對部分試驗結果 的分析,了解全面試驗的情況。 本例,3個因素的選優(yōu)區(qū)可以用一個立方體表示(圖1),3個因素各取3個水平, 把立方體劃分成27個格點,反映在圖上就是立方體內(nèi)的27個“.”。若27個網(wǎng)格點都 試驗,就是全面試驗,其試驗方案如表1所示。,正交設計就是從選優(yōu)區(qū)全面試驗點(水平組合)中挑選出有代表性的部分試驗點 (水平組合)來進行試驗。圖1中標有試驗號的九個“()”,就是利用正交表l9(34) 從27個試驗點中挑選出來的9個試驗點。即: (1)a1b1c1 (2)a2b1c2 (3)a3b1c3 (4)a1b2c2 (5)a2b2c3 (6)a3b2c1 (7)a1b3c3 (8)a2b3c1 (9)a3b3c2 上述選擇 ,保證了a因素的每個水平與b因素、c因素的各個水平在試驗中各搭配 一次 。從圖1中可以看到,9個試驗點在選優(yōu)區(qū)中分布是均衡的,在立方體的每個 平面上,都恰是3個試驗點;在立方體的每條線上也恰有一個試驗點。,9個試驗點均衡地分布于整個立方體內(nèi),有很強的代表性,能夠比較全面地反映

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論