版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
《醫(yī)藥數(shù)理統(tǒng)計(jì)》教師:呂靖聯(lián)系方式:電話:郵箱:QQ號(hào):76756940辦公室:公教樓123醫(yī)藥數(shù)理統(tǒng)計(jì)第一章.事件與概率第二章.隨機(jī)變量的概率與數(shù)字特征第三章.實(shí)驗(yàn)設(shè)計(jì)第四章.抽樣分布第五章.參數(shù)估計(jì)第六章.假設(shè)檢驗(yàn)第八章.線性相關(guān)與回歸分析第九章.正交設(shè)計(jì)概率規(guī)律統(tǒng)計(jì)方法主要內(nèi)容第七章.方差分析第十章.均勻設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì)醫(yī)藥數(shù)理統(tǒng)計(jì)確定性現(xiàn)象:結(jié)果確定不確定性現(xiàn)象:結(jié)果不確定自然界與社會(huì)生活中的兩類現(xiàn)象拋出的物體會(huì)掉落到地上明天天氣狀況買了彩票會(huì)中獎(jiǎng)拋硬幣出現(xiàn)正(反)面事件與概率醫(yī)藥數(shù)理統(tǒng)計(jì)一次拋擲硬幣試驗(yàn)(出現(xiàn)正面朝上)多次拋擲硬幣實(shí)驗(yàn)(出現(xiàn)正面朝上的次數(shù))不確定近半數(shù)(規(guī)律)這種在個(gè)別實(shí)驗(yàn)中其結(jié)果呈現(xiàn)出不確定性,在大量重復(fù)試驗(yàn)中其結(jié)果又具有統(tǒng)計(jì)規(guī)律性的現(xiàn)象,稱為隨機(jī)現(xiàn)象。概率論與數(shù)理統(tǒng)計(jì)是研究和揭示隨機(jī)現(xiàn)象規(guī)律性的一門數(shù)學(xué)學(xué)科。醫(yī)藥數(shù)理統(tǒng)計(jì)事件與概率第一節(jié)隨機(jī)事件及其運(yùn)算一、隨機(jī)事件隨機(jī)試驗(yàn):對(duì)隨機(jī)現(xiàn)象的觀察(試驗(yàn))拋一枚硬幣,觀察拋一顆骰子,觀察記錄某城市120急救電話臺(tái)一晝夜接到的呼叫次數(shù)觀察某一電子元件的壽命將一枚硬幣連拋三次,考慮正(反)面出現(xiàn)的情況具有以上三個(gè)特點(diǎn)的試驗(yàn)成為隨機(jī)試驗(yàn),簡(jiǎn)稱試驗(yàn)(E)。1、可以在相同條件下重復(fù);2、每次試驗(yàn)的結(jié)果可能不止一個(gè),并且能事先明確試驗(yàn)的所有可能結(jié)果;3、進(jìn)行一次試驗(yàn)之前不能確定哪一個(gè)結(jié)果會(huì)出現(xiàn)。醫(yī)藥數(shù)理統(tǒng)計(jì)事件與概率樣本空間:試驗(yàn)所有的結(jié)果的集合()拋硬幣:{正面,反面}拋一顆骰子:{1,2,3,4,5,6}記錄某城市120急救電話臺(tái)一晝夜接到的呼叫次數(shù):{1,2,3,4,……}觀察某一電子元件的壽命:R+將三枚硬幣:{正正正,正正反,正反反,反反反}隨機(jī)事件:隨機(jī)試驗(yàn)的結(jié)果(樣本空間的子集)(A,B…….)基本事件:不能分解成其它事件的最簡(jiǎn)單的隨機(jī)事件.必然事件:每次試驗(yàn)必然發(fā)生()不可能事件:每次試驗(yàn)都不會(huì)發(fā)生()醫(yī)藥數(shù)理統(tǒng)計(jì)二、事件間的關(guān)系與運(yùn)算
事件的包含:如果事件A發(fā)生必然導(dǎo)致B發(fā)生則稱事件B包含事件A
或稱事件A包含于事件B
或稱A是B的子事件記作BA或AB說明:AB屬于A的每一個(gè)樣本點(diǎn)一定也屬于B
對(duì)任意事件A
易知A
事件的相等:如果事件A包含事件B
事件B也包含事件A
則稱事件A與B相等(或等價(jià))
記作AB
說明:相等的兩個(gè)事件總是同時(shí)發(fā)生或同時(shí)不發(fā)生
事件與概率醫(yī)藥數(shù)理統(tǒng)計(jì)事件的并(或和)
“事件A與B至少有一個(gè)發(fā)生”這一事件稱作事件A與B的并(或和)
記作A∪B或AB
例.在投擲一枚骰子的試驗(yàn)中記A“點(diǎn)數(shù)為奇數(shù)”
B“點(diǎn)數(shù)小于5”
則A∪B?事件的交(或積)
“事件A和B都發(fā)生”這一事件稱為事件A與B的交(或積)
記作A∩B(或AB)說明:兩個(gè)事件的并與交可以推廣到有限個(gè)或可數(shù)個(gè)事件的并與交例.在投擲一枚骰子的試驗(yàn)中記A“點(diǎn)數(shù)為奇數(shù)”
B“點(diǎn)數(shù)小于5”
則A∩B{?}事件與概率醫(yī)藥數(shù)理統(tǒng)計(jì)事件的差
“事件A發(fā)生而B不發(fā)生”這一事件稱為事件A與B的差記作AB
例.在投擲一枚骰子的試驗(yàn)中記A“點(diǎn)數(shù)為奇數(shù)”
B“點(diǎn)數(shù)小于5”
則AB{?}
互不相容事件
若事件A與B不可能同時(shí)發(fā)生也就是說
AB是不可能事件即AB
則稱事件A與B是互不相容事件事件與概率醫(yī)藥數(shù)理統(tǒng)計(jì)完備事件組:設(shè)A1
A2
An是兩兩互不相容的事件并且和為,稱A1
A2
An是一個(gè)完備事件組
例.考察某一位同學(xué)在一次數(shù)學(xué)考試中的成績(jī)分別用A
B
C
D
P
F表示下列各事件(括號(hào)中表示成績(jī)所處的范圍)
A——優(yōu)秀([90100])
D——及格([6070))
B——良好([8090))
P——通過([60100])
C——中等([7080))
F——未通過([060))
則:A
B
C
D
F是兩兩不相容事件
P與F是互為對(duì)立的事件即有PF
A
B
C
D均為P的子事件且有PA∪B∪C∪D
對(duì)立事件:“事件A不發(fā)生”這一事件稱為事件A的對(duì)立事件記作A
如:在投擲一枚骰子的試驗(yàn)中
“點(diǎn)數(shù)小于3”和“點(diǎn)數(shù)大于4”這兩個(gè)事件是互不相容事件
說明:在一次試驗(yàn)中如果A發(fā)生則A一定不發(fā)生如果A不發(fā)生則A一定發(fā)生因而有AA
A∪A
問:對(duì)立事件與互不相容事件之間的關(guān)系?事件與概率醫(yī)藥數(shù)理統(tǒng)計(jì)三、隨機(jī)事件的運(yùn)算律1
關(guān)于求和運(yùn)算
(1)A∪BB∪A(交換律)(2)(A∪B)∪CA∪(B∪C)A∪B∪C(結(jié)合律)2
關(guān)于求交運(yùn)算
(1)A∩BB∩A(交換律)(2)(A∩B)∩CA∩(B∩C)A∩B∩C(結(jié)合律)3
關(guān)于求和與求交運(yùn)算的混合
(1)A∩(B∪C)(A∩B)∪(A∩C)(第一分配律)(2)A∪(B∩C)(A∪B)∩(A∪C)(第二分配律)4
關(guān)于求對(duì)立事件的運(yùn)算5
德摩根律事件與概率醫(yī)藥數(shù)理統(tǒng)計(jì)頻率穩(wěn)定值概率
概率的統(tǒng)計(jì)定義頻率:在相同條件下進(jìn)行n次試驗(yàn),事件A發(fā)生的次數(shù)m稱為事件A發(fā)生的頻數(shù)。稱為A發(fā)生的頻率。記作定義:當(dāng)n足夠大時(shí),頻率的穩(wěn)定值p(注意概率與頻率的區(qū)別)性質(zhì):第二節(jié)事件的概率注:概率是一個(gè)隨機(jī)事件所固有的屬性,與試驗(yàn)次數(shù)以及每一次試驗(yàn)結(jié)果無關(guān)。頻率的性質(zhì)事件發(fā)生的頻繁程度事件發(fā)生的可能性的大小概率的統(tǒng)計(jì)定義事件與概率一、概率的定義醫(yī)藥數(shù)理統(tǒng)計(jì)概率的古典定義前提:試驗(yàn)樣本空間只包含有限個(gè)元素;每個(gè)基本事件發(fā)生等可能性。定義:已知樣本空間中基本事件總數(shù)為n,若事件A包含k個(gè)基本事件,則有例:將一枚硬幣拋三次,求(1)事件A={恰有一次出現(xiàn)正面}(2)事件B={至少有一次出現(xiàn)正面}?例:某學(xué)習(xí)小組有10名同學(xué),其中7名男生,3名女生,從中任選3人去參加社會(huì)活動(dòng),則3人全為男生的概率為?醫(yī)藥數(shù)理統(tǒng)計(jì)補(bǔ)充:排列與組合排列定義:從m個(gè)元素中,取出n(n≤m)個(gè)元素按一定順序排成一列。記為組合定義:從n個(gè)元素中,任取k個(gè)為一組,得出的不同的組數(shù),稱為組合數(shù)。
記作醫(yī)藥數(shù)理統(tǒng)計(jì)1.互斥事件加法定理(有限可加性)若事件A、B互斥,則有P(A+B)=P(A)+P(B)推廣:若為兩兩互斥事件,則例.藥房有包裝相同的六味地黃丸100盒,其中5盒為去年產(chǎn)品,95盒為今年產(chǎn)品?,F(xiàn)隨機(jī)發(fā)出4盒,求:有1盒或2盒陳藥的概率。2.一般加法定理對(duì)任意兩事件A、B,有P(A+B)=P(A)+P(B)-P(AB)推廣:對(duì)任意三事件A、B、C,有P(A+B+C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)3.減法定理對(duì)任意的A、B,有P(A-B)=P(A)-P(AB)二、概率的運(yùn)算醫(yī)藥數(shù)理統(tǒng)計(jì)4.條件概率與乘法定理?xiàng)l件概率:在事件B已經(jīng)發(fā)生的條件下,A發(fā)生的概率稱為A的條件概率,記性質(zhì):一般情況下,例.
袋中有2個(gè)白球,8個(gè)黑球,現(xiàn)讓兩個(gè)人去抽球(無放回)。若已知第一個(gè)人抽到白球,則第二個(gè)人也抽到白球的概率是多少?乘法定理:推廣公式:醫(yī)藥數(shù)理統(tǒng)計(jì)4.獨(dú)立事件及其乘法定理獨(dú)立事件:若或或則稱時(shí)間A、B相互獨(dú)立。定理:若A與B,A與,與B,與中有一對(duì)相互獨(dú)立,則另外三對(duì)也相互獨(dú)立。推廣:若任意三事件A、B、C兩兩獨(dú)立,且P(ABC)=P(A)P(B)P(C),則稱A、B、C相互獨(dú)立。多事件相互獨(dú)立
多事件兩兩獨(dú)立例如:拋一枚硬幣兩次,記A={第一次為正面},B={第二次為反面},C={兩次都為同一面}。分析知,A、B、C兩兩獨(dú)立,但不相互獨(dú)立。獨(dú)立事件的乘法定理:若相互獨(dú)立,則注意:具有非零概率的兩事件,互斥就不獨(dú)立,獨(dú)立就不互斥。例.若每人血清中有肝炎病毒的概率為0.4%,今混合100人的血清,求混合血清無肝炎病毒的概率。醫(yī)藥數(shù)理統(tǒng)計(jì)1.全概率公式:若構(gòu)成互斥完備群,則對(duì)任意事件B,有全概率公式的意義:在較復(fù)雜情況下直接計(jì)算P(B)不易,借助于一個(gè)完備事件組,將復(fù)雜事件分解成若干個(gè)互不相容的簡(jiǎn)單事件的和,再利用概率的加法公式求出復(fù)雜事件概率。例12.設(shè)藥房的某種藥品由三個(gè)不同的廠家生產(chǎn)。其中第一家藥廠生產(chǎn)的藥品占1/2,第二、三家分別占1/4,已知第一、二家藥廠生產(chǎn)的藥品有2%的次品,第三家藥品有4%的次品。試求:現(xiàn)從藥房任取一份,問拿到次品的概率?第四節(jié)全概率公式和逆概率公式醫(yī)藥數(shù)理統(tǒng)計(jì)實(shí)際工作中還會(huì)遇到與全概率問題相逆的問題。如例12改成:設(shè)藥房的某種藥品由三個(gè)不同的廠家生產(chǎn)。其中第一家藥廠生產(chǎn)的藥品占1/2,第二、三家分別占1/4,已知第一、二家藥廠生產(chǎn)的藥品有2%的次品,第三家藥品有4%的次品。試求:拿到的藥品是次品時(shí),該次品由各家藥廠生產(chǎn)的可能性為多大?2.逆概率公式(貝葉斯公式):設(shè)是互斥完備群,則對(duì)任意事件B,有醫(yī)藥數(shù)理統(tǒng)計(jì)隨機(jī)變量的概率分布與數(shù)字特征第一節(jié)隨機(jī)變量與離散型隨機(jī)變量的概率分布引入隨機(jī)變量使得隨機(jī)事件可用隨機(jī)變量的關(guān)系式表示,從而使對(duì)隨機(jī)現(xiàn)象研究進(jìn)一步深入、更數(shù)學(xué)化。1.隨機(jī)變量對(duì)于隨機(jī)試驗(yàn),若其試驗(yàn)結(jié)果可用一個(gè)取值帶有隨機(jī)性的變量來表示,且變量取這些可能值的概率是確定的,則稱這種變量是隨機(jī)變量。
注意:隨機(jī)變量常用X,Y,Z表示,而表示隨機(jī)變量所取的值通常用x,y,z表示。
例如,從某一學(xué)校隨機(jī)選一學(xué)生,測(cè)量他的身高。我們可把可能的身高看作隨機(jī)變量X,然后提出關(guān)于X的各種問題。如P(X>1.7)=?P(X≤1.5)=?P(1.5<X<1.7)=?一旦我們實(shí)際選定了一個(gè)學(xué)生并量了他的身高之后,我們就得到X的一個(gè)具體的值,記作x。這時(shí),要么x≥1.7米,要么x<1.7米,再去求P(x≥1.7米)就沒有什么意義。性質(zhì)1:隨機(jī)變量取任何值的概率均為非負(fù)。性質(zhì)2:隨機(jī)變量取所有可能值的概率之和為1。醫(yī)藥數(shù)理統(tǒng)計(jì)2.離散型隨機(jī)變量如果隨機(jī)變量只能取有限個(gè)或無限可列個(gè)數(shù)值,則稱它為離散型隨機(jī)變量。例如:小白鼠存活的只數(shù),引體向上次數(shù)等。3.連續(xù)型隨機(jī)變量如果隨機(jī)變量的可能取值為某一區(qū)間的所有實(shí)數(shù),無法一一列舉,則稱他為連續(xù)型隨機(jī)變量。例如:身高、體重等。醫(yī)藥數(shù)理統(tǒng)計(jì)4.離散型隨機(jī)變量的概率函數(shù)設(shè)離散型隨機(jī)變量X的所有可能取值為xi(i=1,2,…),相應(yīng)的概率P(X=xi)=pi稱為離散型隨機(jī)變量X的概率函數(shù)或分布律。通常X的分布律可用表格表示:概率函數(shù)有如下性質(zhì)性質(zhì):例.某籃球運(yùn)動(dòng)員投中籃圈概率是0.9,求他兩次獨(dú)立投籃投中次數(shù)X的概率分布。Xx1x2
…xi…
Pp1p2…pi…
5.離散型隨機(jī)變量的分布函數(shù)設(shè)X是一個(gè)隨機(jī)變量(可以是離散型,也可以是連續(xù)型),x是任意實(shí)數(shù),則函數(shù)F(x)=P(X≤x)稱為隨機(jī)變量X的分布函數(shù)。性質(zhì):(1)F(x)為非減函數(shù);(2)0≤F(x)≤1(-∞<x<+∞);(3)F(-∞)=0,F(+∞)=1;(4)F(x)右連續(xù),即
例.給青蛙按每單位體重注射一定數(shù)量的洋地黃,由以往的實(shí)驗(yàn)知,致死的概率為0.6,存活的概率為0.4,現(xiàn)給兩只青蛙注射,求死亡只數(shù)的概率函數(shù)和分布函數(shù)。012xF(x)
第二節(jié)常用的離散型隨機(jī)變量的概率分布1.二項(xiàng)分布伯努利試驗(yàn):許多試驗(yàn)只有兩種互斥的結(jié)果,為了找到這些試驗(yàn)結(jié)果的規(guī)律性,需要在相同條件下做n次獨(dú)立重復(fù)試驗(yàn),稱為n重伯努利試驗(yàn),簡(jiǎn)稱伯努利試驗(yàn)。二項(xiàng)分布
若在一次伯努利實(shí)驗(yàn)中成功(事件A發(fā)生)的概率為p(0<p<1),獨(dú)立重復(fù)進(jìn)行n次,這n次中實(shí)驗(yàn)成功的次數(shù)(事件A發(fā)生的次數(shù))X的分布列為:稱X所服從的分布為二項(xiàng)分布.記為X~B(n,p).例.某射手在相同條件下獨(dú)立地進(jìn)行5次射擊,每次擊中目標(biāo)的概率是0.6,求擊中目標(biāo)次數(shù)X的概率分布.醫(yī)藥數(shù)理統(tǒng)計(jì)在二項(xiàng)分布中,X取不同值k(k=0,1,2…,n)的概率是不同的,是P(X=k)取最大值的k(記為k0)稱為二項(xiàng)分布的最可能值。當(dāng)k在(n+1)p附近時(shí),P(X=k)達(dá)到最大值。即:若(n+1)p為整數(shù),則k0為(n+1)p和(n+1)p-1;若(n+1)p為非整數(shù)時(shí),則k0為int[(n+1)p]例4.設(shè)某種老鼠正常情況下,受某種病毒感染的概率為20%,試求正常情況下,25只健康老鼠受感染的最可能只數(shù)是多少?2.泊松分布(稀有事件模型)如果隨機(jī)變量X的概率函數(shù)為其中,λ>0,則稱X服從參數(shù)為λ的泊松分布,記為X~P(λ)。許多稀有事件都服從或近似服從泊松分布。λ=np。醫(yī)藥數(shù)理統(tǒng)計(jì)例5.已知某地區(qū)人群中患某種病的概率為0.001,試求在檢查的5000人中至少有2人患此病的概率。解:由于n=5000較大,p=0.001較小,取λ=np=5,設(shè)X=患此病人數(shù),則X~P(5)若精確計(jì)算,則X~B(5000,0.001)
第3節(jié)連續(xù)型隨機(jī)變量的概率分布1.連續(xù)型隨機(jī)變量的概率密度若對(duì)于隨機(jī)變量X的分布函數(shù)F(x),存在非負(fù)函數(shù)f(x),使得對(duì)于任意實(shí)數(shù)x,有:則稱X為連續(xù)型隨機(jī)變量,其中被積函數(shù)f(x)稱為X的概率密度函數(shù)(簡(jiǎn)稱概率密度)性質(zhì):⑴f(x)≥0;⑵⑶對(duì)于任意實(shí)數(shù)a,b(a<b)
⑷若f(x)在點(diǎn)x處連續(xù),則注意:⑴連續(xù)型隨機(jī)變量X的分布函數(shù)F(x)是連續(xù)函數(shù).
⑵連續(xù)型隨機(jī)變量X取任一常數(shù)a的概率為0
⑶2.正態(tài)分布定義:若隨機(jī)變量X的概率密度函數(shù)為其中,(>0)為常數(shù),則稱X服從參數(shù)為,2的正態(tài)分布(或高斯分布),記為X~N(,2).特點(diǎn):⑴曲線f(x)呈鐘形,關(guān)于直線x=μ對(duì)稱,在(-∞,μ]上遞增,在[μ,+∞)上遞減。⑵在x=μ處,f(x)取最大值
在x=μ±σ處有拐點(diǎn),且以x軸水平漸近線。醫(yī)藥數(shù)理統(tǒng)計(jì)⑶當(dāng)σ固定時(shí),μ改變,則f(x)圖形的形狀不變,只改變其位置,μ確定圖形的中心位置,稱位置參數(shù),μ增大,曲線向右移。⑷當(dāng)μ固定時(shí),σ越小圖形越陡峭,σ確定圖形峰的陡峭形狀,故稱形狀參數(shù)。醫(yī)藥數(shù)理統(tǒng)計(jì)標(biāo)準(zhǔn)正態(tài)分布參數(shù)μ=0,σ=1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布,記為X~N(0,1)。標(biāo)準(zhǔn)正態(tài)分布的重要性在于,任何一個(gè)正態(tài)分布都可以通過線性變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布。它的依據(jù)是下面的定理:根據(jù)定理,只要將標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)制成表,就可以解決一般正態(tài)分布的概率計(jì)算問題。醫(yī)藥數(shù)理統(tǒng)計(jì)正態(tài)分布是自然界及工程技術(shù)中最常見的分布之一,大量的隨機(jī)現(xiàn)象都是服從或近似服從正態(tài)分布的.正態(tài)分布是概率論中最重要的分布。均勻分布、對(duì)數(shù)正態(tài)分布等分布不做要求。醫(yī)藥數(shù)理統(tǒng)計(jì)第4節(jié)隨機(jī)變量的數(shù)字特征隨機(jī)變量數(shù)字特征,分兩類:⑴表示集中程度、平均水平數(shù)學(xué)期望、分位數(shù)、中位數(shù)、眾數(shù)等;⑵表示離散程度、變異大小方差、標(biāo)準(zhǔn)差、變異系數(shù)等。1.均數(shù)(數(shù)學(xué)期望)定義1:設(shè)離散型隨機(jī)變量X的分布律為P{X=xi}=pi,k=1,2,3...,則規(guī)定X
的均數(shù)定義2:設(shè)連續(xù)型隨機(jī)變量X的概率密度函數(shù)f(x),則規(guī)定X的均數(shù)為性質(zhì):(1)E(c)=c,c為常數(shù)(2)E(cX)=c*E(x)(3)E(X±Y)=E(X)±E(Y)(4)E(XY)=EX*EY,X與Y獨(dú)立醫(yī)藥數(shù)理統(tǒng)計(jì)常見分布的數(shù)學(xué)期望二項(xiàng)分布:泊松分布:正態(tài)分布:E(X)=μ2.方差和標(biāo)準(zhǔn)差方差:設(shè)X是一個(gè)隨機(jī)變量,則稱E[(X-EX)2]為X的方差,記作DX,為標(biāo)準(zhǔn)差。注:隨機(jī)變量的方差反映了它的取值與其數(shù)學(xué)期望的偏離程度,它是衡量取值離散程度的一個(gè)尺度。對(duì)于離散型隨機(jī)變量:對(duì)于連續(xù)型隨機(jī)變量:性質(zhì):(1)D(c)=0,c為常數(shù)(2)D(cX)=c2*D(X)(3)D(X±Y)=DX+DY,X與Y相互獨(dú)立醫(yī)藥數(shù)理統(tǒng)計(jì)常見分布的方差二項(xiàng)分布:泊松分布:正態(tài)分布:例7:設(shè)X~P(2),則下列結(jié)論中正確的是()A.EX=0.5,DX=0.5 B.EX=0.5,DX=0.25C.EX=2,DX=4 D.EX=2,DX=2例8:相互獨(dú)立的隨機(jī)變量X和Y的方差分別為4和2,則隨機(jī)變量3X-2Y的方差是?3.變異系數(shù)比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異程度。醫(yī)藥數(shù)理統(tǒng)計(jì)第5節(jié)三種重要分布的漸進(jìn)關(guān)系(略)當(dāng)n→∞,二項(xiàng)分布B(k;n,p)以泊松分布P(k;λ)為極限分布;當(dāng)n→∞,二項(xiàng)分布B(k;n,p)以正態(tài)分布N(np,npq)為極限分布;當(dāng)n→∞,泊松分布P(k;λ)以正態(tài)分布N(λ;λ)為極限分布。例:醫(yī)藥數(shù)理統(tǒng)計(jì)第3講隨機(jī)抽樣、抽樣分布和總體的參數(shù)估計(jì)第1節(jié)隨機(jī)抽樣1.總體與樣本總體:研究對(duì)象的全體,組成總體的每個(gè)單元稱為個(gè)體。樣本:在一個(gè)總體X中抽取n個(gè)個(gè)體X1,X2…Xn,這n個(gè)個(gè)體組成的集合稱為總體X的一個(gè)樣本。樣本中含有個(gè)體的數(shù)目稱為樣本容量,也稱樣本的大小。簡(jiǎn)單隨機(jī)抽樣是指在抽取樣本單位時(shí),總體的每一個(gè)可能的樣本被抽中的概率相同。簡(jiǎn)單隨機(jī)樣本樣本X1,X2…Xn相互獨(dú)立且與總體X有相同的分布函數(shù),這樣的樣本稱為簡(jiǎn)單隨機(jī)樣本。醫(yī)藥數(shù)理統(tǒng)計(jì)第2節(jié)樣本的數(shù)字特征統(tǒng)計(jì)量:設(shè)X1,X2…Xn為總體X的一個(gè)樣本,g(X1,X2…Xn)為一個(gè)樣本函數(shù),如果g中不含有任何未知參數(shù),則稱g為一個(gè)統(tǒng)計(jì)量。特點(diǎn):(1)統(tǒng)計(jì)量是樣本中n個(gè)隨機(jī)變量X1,X2,…,Xn的函數(shù),它是完全由樣本決定的量,仍是一個(gè)隨機(jī)變量。(2)統(tǒng)計(jì)量不包含任何未知參數(shù)。例如:幾種常見統(tǒng)計(jì)量樣本均數(shù)醫(yī)藥數(shù)理統(tǒng)計(jì)樣本方差、標(biāo)準(zhǔn)差、變異系數(shù)(相對(duì)標(biāo)準(zhǔn)差)注意:分母為n-1。由于樣本方差中的均數(shù)是樣本的,是總體的一部分,其離差平方和一定變小,所以若以n為分母,S2一般比總體方差?。ㄓ衅烙?jì))。而分母改為n-1后,經(jīng)數(shù)學(xué)證明,S2總在總體方差周圍波動(dòng)(無偏估計(jì)),另外,S2的自由度正好是n-1。樣本的標(biāo)準(zhǔn)誤SD與SE的區(qū)別:SD是描述個(gè)體觀察值變異程度的大小,樣本標(biāo)準(zhǔn)差越小,樣本均數(shù)對(duì)一組樣本觀察值的代表性就越好;SE是描述樣本均數(shù)變異程度和抽樣誤差的大小,樣本標(biāo)準(zhǔn)誤越小,用樣本均數(shù)估計(jì)總體均數(shù)可靠性就越高。醫(yī)藥數(shù)理統(tǒng)計(jì)在實(shí)際中,一般用樣本標(biāo)準(zhǔn)差與樣本均數(shù)結(jié)合,用于描述樣本觀察值的分布范圍;樣本標(biāo)準(zhǔn)誤與樣本均數(shù)結(jié)合,用于估計(jì)總體均數(shù)可能出現(xiàn)的范圍。第3節(jié)抽樣分布統(tǒng)計(jì)量是樣本隨機(jī)變量的函數(shù),也是一個(gè)隨機(jī)變量,因而也有自己的概率分布,這種統(tǒng)計(jì)量的分布叫做抽樣分布。以下介紹幾種在已知總體為正態(tài)分布條件下,常見統(tǒng)計(jì)量的抽樣分布。1.樣本均數(shù)的u分布這說明樣本均數(shù)的期望與總體的期望相等,而方差為總體方差的1/n倍??梢?,用樣本均值估計(jì)總體均值無系統(tǒng)偏差,且n越大越精確。醫(yī)藥數(shù)理統(tǒng)計(jì)樣本均值分布的應(yīng)用:其標(biāo)準(zhǔn)化隨機(jī)變量u主要用于單正態(tài)總體、方差已知、小樣本條件下數(shù)學(xué)期望的u檢驗(yàn)。醫(yī)藥數(shù)理統(tǒng)計(jì)2.2分布(卡方分布)設(shè)X1,X2,…,Xn相互獨(dú)立,都服從N(0,1),則稱隨機(jī)變量:所服從的分布為自由度為n的2分布,記為2~2(n)。自由度:指統(tǒng)計(jì)量中獨(dú)立變量的個(gè)數(shù)。計(jì)算公式為df=n-k,n為樣本容量,k為約束條件個(gè)數(shù)。如統(tǒng)計(jì)量,變量獨(dú)立無約束條件,所以自由度為n。而樣本方差,其中有n個(gè)變量,但這說明變量間有一個(gè)約束條件,所以其自由度為n-1.性質(zhì):(1)一種非對(duì)稱分布。當(dāng)n較大時(shí),曲線近似對(duì)稱,趨于正態(tài)分布。(2)一個(gè)以自由度n為參數(shù)的分布族,自由度n決定了分布的形狀,對(duì)于不同的n有不同的分布。(3)均值為n,方差為2n。醫(yī)藥數(shù)理統(tǒng)計(jì)定理:若X1,X2…Xn為正態(tài)總體的一個(gè)樣本,則有3.t分布設(shè)X~N(0,1),Y~2(n),且X與Y相互獨(dú)立,則稱隨機(jī)變量所服從的分布為自由度為n的t分布,記為t~t(n)。性質(zhì):(1)t分布是對(duì)稱分布,與標(biāo)準(zhǔn)正態(tài)分布相比,t分布的中心部分較低,2個(gè)尾部較高。(2)均值為0,方差為n/(n-2)。(3)當(dāng)樣本容量n較小時(shí),t分布的方差大于1;當(dāng)n逐漸增大時(shí),t分布的方差就接近1,t分布也就趨近于標(biāo)準(zhǔn)正態(tài)分布。醫(yī)藥數(shù)理統(tǒng)計(jì)t分布是統(tǒng)計(jì)學(xué)中十分重要的分布,應(yīng)用最為廣泛,其應(yīng)用的依據(jù)是下面2個(gè)定理:(1)設(shè)X1,X2…Xn為正態(tài)總體的一個(gè)樣本,則(2)設(shè)X1,X2…Xn1和Y1,Y2…Yn2分別是從同方差的總體和中所抽取的樣本,它們是相互獨(dú)立,則
其中,
S1和S2分別是這兩個(gè)樣本的標(biāo)準(zhǔn)差。醫(yī)藥數(shù)理統(tǒng)計(jì)4.F分布設(shè)X~2(n1),Y~2(n2),X與Y相互獨(dú)立,則稱統(tǒng)計(jì)量為服從自由度n1和n2的F分布,記為F~F(n1,n2)。n1為分子隨機(jī)變量X的自由度,稱為分子自由度,n2為分母隨機(jī)變量Y的自由度,稱為分母自由度。性質(zhì):(1)非對(duì)稱偏左側(cè)的分布;當(dāng)n較大時(shí),曲線近似對(duì)稱,趨于正態(tài)分布。(2)是以自由度n1和n2為參數(shù)的分布族,不同自由度決定了F分布的形狀。概率分布的擬合及其應(yīng)用不做要求。醫(yī)藥數(shù)理統(tǒng)計(jì)第4節(jié)總體的參數(shù)估計(jì)統(tǒng)計(jì)推斷:用樣本的信息去推斷總體的信息。參數(shù)估計(jì):用樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)的大小。假設(shè)檢驗(yàn):用樣本統(tǒng)計(jì)量大小去推斷總體參數(shù)是否有差異。醫(yī)藥數(shù)理統(tǒng)計(jì)1.參數(shù)點(diǎn)估計(jì)(略)直接用樣本統(tǒng)計(jì)量大小代替總體參數(shù)。同一總體參數(shù)可用多個(gè)統(tǒng)計(jì)量來估計(jì),衡量其好壞的指標(biāo)有三個(gè):無偏性、有效性、一致性。(易出選擇題或填空題)缺陷:(1)點(diǎn)估計(jì)值不一定是參數(shù)的真值,即使與真值相等也無法肯定這種相等(總體參數(shù)本身是未知的)。(2)點(diǎn)估計(jì)值只是未知參數(shù)的一個(gè)近似值,沒有給出它與真值之間的誤差范圍(可靠程度),把握不大。實(shí)例:估計(jì)全省18歲女孩的平均身高。若根據(jù)實(shí)際樣本,通過點(diǎn)估計(jì)法可能得到女孩的平均身高估計(jì)值為162cm。而實(shí)際上,女孩的平均身高可能大于或小于162cm。若能給出一區(qū)間,能以較大概率相信這個(gè)區(qū)間包含身高的真值,將會(huì)更有價(jià)值。醫(yī)藥數(shù)理統(tǒng)計(jì)2、區(qū)間估計(jì)在給定可靠程度1-α下,用樣本值通過合適統(tǒng)計(jì)量,估計(jì)總體參數(shù)θ所在區(qū)間的方法。置信區(qū)間與置信度設(shè)θ是總體的未知參數(shù),若由樣本X1,X2,…Xn確定的兩個(gè)統(tǒng)計(jì)量:對(duì)給定α(0<α<1),滿足則稱是θ在置信度(置信水平、置信概率)1-α下的置信區(qū)間(CI)。注意:置信區(qū)間的長(zhǎng)度反映了估計(jì)的精度,長(zhǎng)度越小,估計(jì)的精度越高。置信度則反映了估計(jì)的可靠程度,置信度越大,估計(jì)的可靠性越大。置信度與精確度是一對(duì)矛盾,如何處理??jī)烧呙軙r(shí),應(yīng)在保證可靠度條件下盡可能提高精度。醫(yī)藥數(shù)理統(tǒng)計(jì)3.正態(tài)總體期望值的區(qū)間估計(jì)σ已知設(shè)X1,X2,…,Xn是取自正態(tài)總體N(μ,σ2)的樣本,且σ2已知,求參數(shù)μ的置信度為1-α的置信區(qū)間。解:(1)選μ的點(diǎn)估計(jì)
(2)取函數(shù)
(3)對(duì)給定的置信度1-α,查正態(tài)分布表得Uα/2,
(4)變形所以μ在置信度1-α的置信區(qū)間為:簡(jiǎn)記為α常取值0.05,而醫(yī)藥數(shù)理統(tǒng)計(jì)例1.設(shè)正態(tài)總體X~N(μ,1),從中抽取樣本容量為16的樣本,且樣本均數(shù)為5.20,求μ的置信度為95%和99%的置信區(qū)間。解:由題意易得n=16,σ=1(總體方差已知)當(dāng)1-α=0.95時(shí),α=0.05;查表得u0.05/2=1.96當(dāng)1-α=0.99時(shí),α=0.01,查表得,u0.01/2=2.58則置信度為95%的置信區(qū)間為既為(4.71,5.69)。同樣計(jì)算方法可得99%的置信區(qū)間為(4.56,5.85)??梢钥吹剑?9%的置信區(qū)間要比95%的置信區(qū)間寬,雖然可靠性更強(qiáng),但是精確度更低。醫(yī)藥數(shù)理統(tǒng)計(jì)σ未知設(shè)X1,…,Xn是取自N(μ,σ2)的樣本,且σ2未知,求參數(shù)μ的置信度為1-α的置信區(qū)間。思考:應(yīng)選擇何種分布函數(shù)?解:(1)選μ的點(diǎn)估計(jì)(2)取函數(shù)(3)對(duì)給定的置信度1-α,(4)所以μ在置信度1-α的置信區(qū)間為:簡(jiǎn)記為醫(yī)藥數(shù)理統(tǒng)計(jì)例2.隨機(jī)抽取6只貓,靜脈注射麻醉后,收集支氣管內(nèi)分泌物,分泌量為4.8,7.92,1.2,12.72,9.6,13.68,若分泌量服從正態(tài)分布,求該批貓支氣管內(nèi)平均分泌量的95%的置信區(qū)間。解:n=6,df=5,總體方差未知。當(dāng)1-α=0.95時(shí),α=0.05,查表得t0.05/2(5)=2.57195%的置信區(qū)間為,既為(3.33,13.31)。注意:在大樣本下,tα/2(n-1)≈uα/2,即t分布近似于標(biāo)準(zhǔn)正態(tài)分布,這時(shí),μ的置信水平1-α的置信區(qū)間為大樣本:>50正態(tài)總體總體均數(shù)之差的區(qū)間估計(jì)、正態(tài)總體方差的區(qū)間估計(jì)(略)。離散型總體參數(shù)的區(qū)間估計(jì)不作要求。醫(yī)藥數(shù)理統(tǒng)計(jì)第4講總體參數(shù)的假設(shè)檢驗(yàn)第1節(jié)假設(shè)檢驗(yàn)的基本思想問題的提出從吸煙人群和非吸煙人群中各抽取n=100的樣本,分別記為A樣本和B樣本。A樣本收縮壓為150mmHg,B樣本為130mmHg。原因有兩種可能:(1)兩個(gè)總體均數(shù)不相同(2)抽樣誤差(兩個(gè)總體均數(shù)相同)假設(shè)檢驗(yàn)的基本思想(1)反證法(2)小概率原理:認(rèn)為小概率事件在一次抽樣中是不可能發(fā)生的。先假定一個(gè)假設(shè)H0:μ1=μ2成立,如果由此導(dǎo)出一個(gè)不合理現(xiàn)象的發(fā)生(即出現(xiàn)一個(gè)小概率事件),就拒絕這個(gè)假設(shè);如果沒有導(dǎo)出不合理的現(xiàn)象發(fā)生,就不能拒絕這個(gè)假設(shè)。醫(yī)藥數(shù)理統(tǒng)計(jì)假設(shè)檢驗(yàn)的基本步驟(1)建立假設(shè)H0:μ1=μ2(原假設(shè))H1:μ1≠μ2(備擇假設(shè))注意:假設(shè)是針對(duì)總體,而不是樣本(2)確定檢驗(yàn)水準(zhǔn)顯著性水準(zhǔn),判定差別有無統(tǒng)計(jì)學(xué)意義的概率水準(zhǔn),確定了小概率事件的標(biāo)準(zhǔn)。通常取α=0.05。P≤α----小概率事件(3)選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量根據(jù)研究目的、資料類型選用合適的檢驗(yàn)方法;統(tǒng)計(jì)量都是在H0成立的前提下算出來的!(4)確定P值根據(jù)檢驗(yàn)統(tǒng)計(jì)量確定P值。醫(yī)藥數(shù)理統(tǒng)計(jì)P值:H0成立的概率如果P≤0.05,即H0成立的概率小于0.05,可以認(rèn)為H0成立是小概率事件,發(fā)生的可能性很小,就有理由懷疑H0不成立!(5)做出推斷結(jié)論推斷的結(jié)論=統(tǒng)計(jì)學(xué)結(jié)論+專業(yè)結(jié)論P(yáng)>0.05,按α=0.05檢驗(yàn)水準(zhǔn),不拒絕H0,差異無統(tǒng)計(jì)學(xué)意義,還不能認(rèn)為……不同或不等。P≤0.05,按α=0.05檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為……不同或不等。下結(jié)論時(shí),對(duì)H0只能說拒絕/不拒絕;對(duì)H1只能說接受!不拒絕H0≠接受H0
醫(yī)藥數(shù)理統(tǒng)計(jì)第2節(jié)單個(gè)正態(tài)總體的參數(shù)檢驗(yàn)σ2已知時(shí)正態(tài)總體均值的u檢驗(yàn)設(shè)總體X~N(μ,σ2),X1,X2,…,Xn為抽自總體X的樣本,方差σ2已知,則例1.某藥廠正常情況下生產(chǎn)的某藥膏含甘草酸量X~N(4.45,0.1082).現(xiàn)隨機(jī)抽查了5支藥膏,其含甘草酸量分別為:4.404.254.214.334.46,若方差不變,問此時(shí)藥膏的平均含甘草酸量μ是否有顯著變化?(=0.05)解:H0:μ=μ0,H1:μ≠μ0;α=0.05
根據(jù)顯著水平=0.05,查正態(tài)分布雙側(cè)臨界值,得u0.05/2=1.96|u|=2.485>u0.05/2,所以拒絕H0,接受H1??梢哉J(rèn)為此藥膏的平均含甘草酸量有顯著性變化。醫(yī)藥數(shù)理統(tǒng)計(jì)σ2未知時(shí)正態(tài)總體均值的u檢驗(yàn)設(shè)總體X~N(μ,σ2),X1,X2,…,Xn為抽自總體X的樣本,方差σ2未知,則例2.正常人的脈搏平均為72(次/min),現(xiàn)測(cè)得20例慢性四乙基鉛中毒患者的脈搏(次/min)的均值是63.50,標(biāo)準(zhǔn)差是5.60,若四乙基鉛中毒患者的脈搏服從正態(tài)分布,問四乙基鉛中毒患者的脈搏是否與正常人不同?(=0.05)解:H0:μ=μ0,H1:μ≠μ0α=0.05查t分布臨界值表得:|t|=6.788>2.093,所以拒絕H0,接受H1可認(rèn)為四乙基鉛中毒者的脈搏與正常人不同。醫(yī)藥數(shù)理統(tǒng)計(jì)第3節(jié)兩個(gè)正態(tài)總體的參數(shù)檢驗(yàn)1.兩個(gè)正態(tài)總體的方差齊性檢驗(yàn)(略)2.配對(duì)比較兩個(gè)正態(tài)總體均數(shù)的檢驗(yàn)(略)3.成組比較兩個(gè)正態(tài)總體均數(shù)的檢驗(yàn)(略)第4節(jié)方差分析在多組總體均數(shù)比較時(shí)如采用t檢驗(yàn)會(huì)增大犯第一類錯(cuò)誤概率。如三組之間的兩兩t檢驗(yàn),三組之間的兩兩t檢驗(yàn)做完三次t檢驗(yàn),總的顯著性水平變?yōu)?-(1-0.05)3=0.14,要大于設(shè)定的α=0.05。而方差分析是將三組數(shù)據(jù)放在一起做一次比較,犯一類錯(cuò)誤的概率仍為α=0.05?;靖拍钤囼?yàn)指標(biāo):衡量試驗(yàn)結(jié)果好壞的標(biāo)準(zhǔn)。因素:在試驗(yàn)過程中,影響試驗(yàn)結(jié)果的條件。水平:因素在試驗(yàn)中可能處的狀態(tài)。醫(yī)藥數(shù)理統(tǒng)計(jì)總體1.N(μ1,σ12)-----------樣本1(n1,,S1)
總體2.N(μ2,σ22)-----------樣本2(n2,,S2)
總體3.
N(μ3,σ32)-----------樣本3(n3,,S3)已知:σ12=σ22=σ32,問:μ1=μ2=μ3?
總離差平方和(SS),所有觀察值之間的差異組內(nèi)離差平方和(SSe),在因素的同一水平(同一個(gè)總體)內(nèi),樣本的各觀察值之間的差異組間利差平方和(SSA),在因素的不同水平(不同總體)下,各水平的均值之間的差異
組間變異(不同藥物效應(yīng)引起+隨機(jī)誤差引起)總變異
組內(nèi)變異(隨機(jī)誤差引起)如不同藥物的作用相同(H0:均值相等),則:F=組間變異/組內(nèi)變異→=1在H0條件下,F(xiàn)雖不會(huì)正好等于1(抽樣誤差),但應(yīng)當(dāng)和1相差不大。F越大,其概率越小,當(dāng)F↑以致其對(duì)應(yīng)的概率P<0.05,則可認(rèn)為不同藥物的作用是不相同的。即樣本均數(shù)之間的差異有統(tǒng)計(jì)學(xué)意義。醫(yī)藥數(shù)理統(tǒng)計(jì)方差分析的基本步驟(1)提出假設(shè)H0:三種藥物對(duì)小白鼠鎮(zhèn)咳作用相同H1:三種藥物鎮(zhèn)咳作用不完全相同(2)確定檢驗(yàn)水準(zhǔn)α=0.05(3)計(jì)算統(tǒng)計(jì)量SSe的自由度為N-k,即40-3=37,組內(nèi)方差Se2=SSe/(N-k)SSA的自由度為k-1,即3-1=2,組間方差SA2=SSA/(k-1)統(tǒng)計(jì)量F=組間方差SA2
/組內(nèi)方差Se2,將結(jié)果整理為方差分析表醫(yī)藥數(shù)理統(tǒng)計(jì)(4)確定P值(5)作出推斷結(jié)論在α=0.05水平上,拒絕H0,接受H1,認(rèn)為三種藥物平均推遲咳嗽時(shí)間不全相同。方差齊是方差分析的前提條件之一,因此先進(jìn)行方差齊性檢驗(yàn)(略)。方差分析中如果拒絕HO,接受H1,僅能認(rèn)為多個(gè)水平間均數(shù)不全相等,但是哪些水平間差異顯著,哪些不顯著,方差分析不能作結(jié)論。因此需要進(jìn)行兩兩間多重比較的檢驗(yàn)法(略)。兩因素試驗(yàn)的方差分析不作要求。第5節(jié)離散型變量總體參數(shù)的假設(shè)檢驗(yàn)單個(gè)總體率的假設(shè)檢驗(yàn)(略)兩個(gè)總體率的假設(shè)檢驗(yàn)(略)醫(yī)藥數(shù)理統(tǒng)計(jì)第6節(jié)列聯(lián)表中獨(dú)立性檢驗(yàn)2×2列聯(lián)表(四格表)中的獨(dú)立性檢驗(yàn)原理及步驟(1)建立假設(shè)H0:兩種藥物治療消化道潰瘍的療效相同H1:兩種藥物治療消化道潰瘍的療效不同(2)確立檢驗(yàn)水準(zhǔn)α=0.05(3)計(jì)算統(tǒng)計(jì)量
在H0成立的前提下,假設(shè)π1=π2=PC(合計(jì)率),計(jì)算理論頻數(shù)T兩種藥物治療消化道潰瘍4周后療效處理愈合未愈合合計(jì)愈合率(%)洛賽克64(E11)21(E12)8575.29雷尼替丁51(E21)33(E22)8460.71合計(jì)1155416968.05醫(yī)藥數(shù)理統(tǒng)計(jì)合計(jì)愈合率=115/169,合計(jì)未愈合率=54/169,各個(gè)格子理論頻數(shù)應(yīng)為:E11=85*115/169,E12=85*54/169,E21=84*115/169,E22=84*54/169統(tǒng)計(jì)學(xué)家Pearson提出對(duì)R×C列聯(lián)表使用統(tǒng)計(jì)量它服從自由度為f的2分布,其中f=(R-1)*(C-1)。(4)確定P值。20.05,1=3.84,得P<0.05。(5)做出推斷結(jié)論按=0.05水準(zhǔn),拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義。可以認(rèn)為洛賽克的愈合率高于雷尼替丁。配對(duì)四格表的獨(dú)立性檢驗(yàn)、四格表的確切概率法不做要求。R×C列聯(lián)表(四格表)中的獨(dú)立性檢驗(yàn)(略)參照單位法Ridit分析注意:等級(jí)資料應(yīng)采用Ridit分析,不能采用2檢驗(yàn)。用置信區(qū)間作顯著性檢驗(yàn)不作要求。醫(yī)藥數(shù)理統(tǒng)計(jì)第5講相關(guān)與回歸在某一現(xiàn)象(過程)中變量間的關(guān)系可能是確定性關(guān)系,也可能是非確定關(guān)系。就兩個(gè)變量而言,如果對(duì)于一個(gè)變量的可能取值,另一個(gè)變量都有完全確定的值與之對(duì)應(yīng),則稱這兩個(gè)變量之間存在著函數(shù)關(guān)系。然而,像人的年齡與血壓,身高與體重之間,顯然不是函數(shù)關(guān)系。因?yàn)閷?duì)于年齡相同的一個(gè)人群其血壓有高有低乃是一個(gè)隨機(jī)變量。我們稱這類非確定性關(guān)系為相關(guān)關(guān)系。相關(guān)與回歸分析的基本內(nèi)容就是運(yùn)用數(shù)學(xué)手段,在大量統(tǒng)計(jì)資料中找出這種相關(guān)性,并作定量分析。第1節(jié)相關(guān)散點(diǎn)圖簡(jiǎn)單直觀研究?jī)勺兞块g相關(guān)關(guān)系的方法,是將試驗(yàn)或觀察得到的n對(duì)(x,y)的樣本數(shù)據(jù):(x1,y1)、(x2,y2)、…、(xn,yn),作為平面直角坐標(biāo)系上點(diǎn)的坐標(biāo),將它們?cè)诜礁褡鴺?biāo)紙上描出,得到散點(diǎn)圖,直觀地說明直線相關(guān)的性質(zhì)。醫(yī)藥數(shù)理統(tǒng)計(jì)相關(guān)系數(shù)總體相關(guān)系數(shù)如果變量X,Y的方差DX,DY存在且EX=μx,EY=μy,則定義為總體相關(guān)系數(shù),分子稱為X和Y的協(xié)方差。ρ具有以下性質(zhì):(1)-1≤ρ≤1(2)如果X和Y存在著線性相關(guān)關(guān)系,則|ρ|=1(3)如果X和Y獨(dú)立,則ρ=0。注:性質(zhì)(3)不可逆,當(dāng)ρ=0時(shí),應(yīng)稱X和Y是不線性相關(guān)的。樣本相關(guān)系數(shù)設(shè)(x1,y1),(x2,y2),…,(xn,yn)是成對(duì)出現(xiàn)的變量X和Y的n對(duì)樣本值,則定義為X和Y的樣本相關(guān)系數(shù),簡(jiǎn)稱相關(guān)系數(shù),其中r與ρ性質(zhì)相同,是ρ的點(diǎn)估計(jì)。相關(guān)系數(shù)沒有單位,取值范圍為-1≤r≤1。r的符號(hào)表示相關(guān)方向,r>0稱為正相關(guān),r<0稱為負(fù)相關(guān)。r的絕對(duì)值表示兩個(gè)變量間直線關(guān)系的密切程度,r的絕對(duì)值為1表示完全相關(guān)。相關(guān)系數(shù)的絕對(duì)值接近1,表示兩個(gè)變量間的直線關(guān)系愈密切。相關(guān)系數(shù)愈接近0,直線關(guān)系愈不密切。r=0稱為零相關(guān),是指非線性相關(guān)或無相關(guān),并不一定表示兩個(gè)變量間不存在其他關(guān)系。相關(guān)系數(shù)的假設(shè)檢驗(yàn)判斷x和y是否線性相關(guān),需要檢驗(yàn)r是否來自ρ=0的總體,稱為相關(guān)系數(shù)的假設(shè)檢驗(yàn)??傮w相關(guān)系數(shù)ρ=0,表示總體中兩變量x和y無直線相關(guān)關(guān)系。因ρ是一個(gè)客觀存在的理論值,一般無法獲得,在實(shí)際問題中,常用r推斷變量x和y有無直線相關(guān)關(guān)系。當(dāng)r≠0時(shí),因?yàn)榇嬖诔闃诱`差,不能認(rèn)為ρ≠0,所以,判斷x和y是否線性相關(guān),需要檢驗(yàn)r是否來自ρ=0的總體.醫(yī)藥數(shù)理統(tǒng)計(jì)方法1:可直接用r作檢驗(yàn)統(tǒng)計(jì)量,用自由度df=n-2查相關(guān)系數(shù)r界值表,若│r│≥臨界值rα,則P≤α,可按α檢驗(yàn)水準(zhǔn)拒絕H0,認(rèn)為x與y之間有直線相關(guān)關(guān)系,ρ≠0。反之,若│r│<rα,則P>α,不能按α檢驗(yàn)水準(zhǔn)拒絕H0,從而認(rèn)為x、y之間無直線相關(guān)關(guān)系。方法2:在H0:ρ=0假設(shè)下,可用t檢驗(yàn)判斷樣本相關(guān)系數(shù)r是否來自ρ=0的總體,即t=服從自由度df=n-2的t分布。第2節(jié)線性回歸方程一元線性模型對(duì)普通變量X的值x1,x2,…,xn,設(shè)隨機(jī)變量Y相應(yīng)的觀察值為y1,y2,…,yn且諸點(diǎn)(x1,y1),(x2,y2),…,(xn,yn)排布成一條直線或接近一條直線,則可假定Y與X之間有如下關(guān)系:Y=a+bx+ε,其中,a,b為不依賴于X的位置參數(shù),ε為隨機(jī)誤差且ε~N(0,σ2
)。醫(yī)藥數(shù)理統(tǒng)計(jì)由正態(tài)分布的性質(zhì)有Y~N(a+bx,σ2
)。在X取某固定值x的前提下,Y的值并不固定,而是形成一個(gè)分布,稱為X等于x時(shí)的條件分布。顯然,條件分布的均數(shù)μy為一確定值,并且隨著X的取值x不同而不同,所以我們可以把μy看成是x的函數(shù)μy=a+bx,這個(gè)方程就稱為Y關(guān)于X的回歸方程,X叫回歸變量,b為回歸系數(shù)。為方便起見,將μy記為(為y的預(yù)測(cè)值),于是=a+bx。線性回歸方程回歸分析就是要確定變量a和b的大小,可采用最小二乘法。設(shè)給定n個(gè)點(diǎn)(x1,y1),(x2,y2),…,(xn,yn),那么,對(duì)于平面上任意一條直線L:y=a+bx;用數(shù)量[yi-(a+bxi)]2來刻劃散點(diǎn)到直線L的遠(yuǎn)近程度。顯然,這個(gè)量是a,b的二元函數(shù),記為Q(a,b)=[yi-(a+bxi)]2。問題歸結(jié)為求Q(a,b)的極小值。醫(yī)藥數(shù)理統(tǒng)計(jì)根據(jù)多元微分學(xué)中的極值原理,有:注:相關(guān)系數(shù)r與回歸系數(shù)b的聯(lián)系。故回歸系數(shù)b乘以X和Y變量的標(biāo)準(zhǔn)差之比結(jié)果為相關(guān)系數(shù)r。即b*σx/σy=r例1:在線性相關(guān)的條件下,自變量X的均方差(標(biāo)準(zhǔn)差)為2,因變量Y的均方差(標(biāo)準(zhǔn)差)為5,而相關(guān)系數(shù)為0.8時(shí),其回歸系數(shù)為()A.8B.0.32C.2D.12.5兩者的取值范圍不一樣。醫(yī)藥數(shù)理統(tǒng)計(jì)回歸方程的顯著性檢驗(yàn)前面只說明了尋找回歸直線的方法,有該法可知任何一堆毫無相關(guān)的散點(diǎn),都可找到最“接近”的一條直線,顯然有些直線毫無實(shí)用價(jià)值。因此,必須引入一個(gè)數(shù)量性指標(biāo)來描述兩個(gè)變量線性關(guān)系的密切程度。選取統(tǒng)計(jì)量其中:U稱為回歸平方和,反映了總的變異中由于線性關(guān)系而引起的變化Q稱為殘差平方和,是由隨機(jī)誤差引起,Q越小越好。數(shù)學(xué)上可以證明,在假設(shè)H0:b=0下,統(tǒng)計(jì)量F服從自由度為1,n-2的F分布,當(dāng)F>Fa時(shí),則拒絕H0,即認(rèn)為X與Y之間有顯著的線性關(guān)系。醫(yī)藥數(shù)理統(tǒng)計(jì)第3節(jié)預(yù)測(cè)與控制建立了有統(tǒng)計(jì)學(xué)意義的回歸方程以后,X變量=x0時(shí),Y變量為a+bx0,這個(gè)值是估計(jì)值,為提高可靠性,可以在進(jìn)行區(qū)間估計(jì),包括預(yù)測(cè)和控制(由x0推算y0稱為預(yù)測(cè),由y0推算x0稱為控制)。(略)多元線性回歸與非線性回歸不做要求。第4節(jié)半數(shù)有效量(ED50)和半數(shù)致死量(LD50)估計(jì)概率單位法(略)序貫法不做要求。醫(yī)藥數(shù)理統(tǒng)計(jì)第6講正交試驗(yàn)設(shè)計(jì)對(duì)于單因素或兩因素試驗(yàn),因其因素少,試驗(yàn)的設(shè)計(jì)、實(shí)施與分析比較簡(jiǎn)單。但在實(shí)際工作中,常常需要同時(shí)考察3個(gè)或3個(gè)以上的試驗(yàn)因素,若進(jìn)行全面試驗(yàn),則試驗(yàn)的規(guī)模將很大,往往因試驗(yàn)條件的限制而難于實(shí)施。正交試驗(yàn)設(shè)計(jì)就是安排多因素試驗(yàn)、尋求最優(yōu)水平組合的一種高效率試驗(yàn)設(shè)計(jì)方法。
第1節(jié)正交表與交互作用基本原理正交試驗(yàn)設(shè)計(jì)是利用正交表來安排與分析多因素試驗(yàn)的一種設(shè)計(jì)方法。它是由試驗(yàn)因素的全部水平組合中,挑選部分有代表性的水平組合進(jìn)行試驗(yàn)的,通過對(duì)這部分試驗(yàn)結(jié)果的分析了解全面試驗(yàn)的情況,找出最優(yōu)的水平組合。例如,要考察乙醇濃度、溶劑用量和浸漬速度對(duì)姜黃素提取收率的影響。每個(gè)因素設(shè)置3個(gè)水平進(jìn)行試驗(yàn)。醫(yī)藥數(shù)理統(tǒng)計(jì)A因素是乙醇濃度,設(shè)A1、A2、A33個(gè)水平;B是溶劑用量,設(shè)B1、B2、B33個(gè)水平;C因素為浸漬速度,設(shè)C1、C2、C33個(gè)水平。這是一個(gè)3因素3水平的試驗(yàn),各因素的水平之間全部可能組合有27種。全面試驗(yàn):可以分析各因素的效應(yīng),交互作用,也可選出最優(yōu)水平組合。但全面試驗(yàn)包含的水平組合數(shù)較多,工作量大,在有些情況下無法完成。若試驗(yàn)的主要目的是尋求最優(yōu)水平組合,則可利用正交表來設(shè)計(jì)安排試驗(yàn)。正交試驗(yàn)設(shè)計(jì)的基本特點(diǎn)是:用部分試驗(yàn)來代替全面試驗(yàn),通過對(duì)部分試驗(yàn)結(jié)果的分析,了解全面試驗(yàn)的情況。本例,3個(gè)因素的選優(yōu)區(qū)可以用一個(gè)立方體表示(圖1),3個(gè)因素各取3個(gè)水平,把立方體劃分成27個(gè)格點(diǎn),反映在圖上就是立方體內(nèi)的27個(gè)“.”。若27個(gè)網(wǎng)格點(diǎn)都試驗(yàn),就是全面試驗(yàn),其試驗(yàn)方案如表1所示。醫(yī)藥數(shù)理統(tǒng)計(jì)醫(yī)藥數(shù)理統(tǒng)計(jì)正交設(shè)計(jì)就是從選優(yōu)區(qū)全面試驗(yàn)點(diǎn)(水平組合)中挑選出有代表性的部分試驗(yàn)點(diǎn)(水平組合)來進(jìn)行試驗(yàn)。圖1中標(biāo)有試驗(yàn)號(hào)的九個(gè)“(·)”,就是利用正交表L9(34)從27個(gè)試驗(yàn)點(diǎn)中挑選出來的9個(gè)試驗(yàn)點(diǎn)。即:(1)A1B1C1(2)A2B1C2(3)A3B1C3(4)A1B2C2(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 節(jié)日主題教育活動(dòng)計(jì)劃
- 二零二五年度林業(yè)樹木清理與可持續(xù)利用合同3篇
- 2025版隧洞施工合同:隧道施工合同履約保證與履約擔(dān)保協(xié)議3篇
- 二零二五年度鋼材料國(guó)際采購(gòu)合同標(biāo)準(zhǔn)范本
- 二零二五年度個(gè)人購(gòu)房裝修分期付款合同樣本3篇
- 二零二五年度樓房居間買賣合同(含家具家電)4篇
- 二零二五年度個(gè)人對(duì)網(wǎng)絡(luò)安全企業(yè)借款合同4篇
- 防水套管后補(bǔ)做法施工方案
- 二零二五年度鋼廠廢鋼回收處理及環(huán)保設(shè)施建設(shè)合同
- 二零二五年度企業(yè)品牌形象托管授權(quán)合同3篇
- 軍人結(jié)婚函調(diào)報(bào)告表
- 民用無人駕駛航空器實(shí)名制登記管理規(guī)定
- 繪本分享《狐貍打獵人》
- 北京地鐵6號(hào)線
- 航空油料計(jì)量統(tǒng)計(jì)員(初級(jí))理論考試復(fù)習(xí)題庫(kù)大全-上(單選題匯總)
- (39)-總論第四節(jié)針灸處方
- 《民航服務(wù)溝通技巧》教案第10課兒童旅客服務(wù)溝通
- 諒解書(標(biāo)準(zhǔn)樣本)
- 西班牙語(yǔ)構(gòu)詞.前后綴
- 《工程測(cè)試技術(shù)》全套教學(xué)課件
評(píng)論
0/150
提交評(píng)論