




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷多元統(tǒng)計分析
蔣敏
衛(wèi)生統(tǒng)計學教研室
多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷多元分析常用統(tǒng)計量與均向量的統(tǒng)計推斷多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷
為什么要學多元分析?事物間的關系是錯綜復雜的,多元的;研究本身是多因素的;應用多元分析獲取更豐富的信息;提高論文的檔次。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷多元統(tǒng)計分析有哪些應用比較關系預測分類評價多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷比較比較比較不同地區(qū)兒童生長發(fā)育情況不同種族正常人頭發(fā)中微量元素的含量不同組別的IgG,IgM,IgA,IgE不同組別的CD2,CD3,CD4,CD8,CD4/CD8多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷關系
探索病因校正混雜因素調(diào)整基線探討巰基丁氨酸(homocysteine)與血壓、冠心病的關系,需調(diào)整年齡、性別、種族、已知的與冠心病有關的其他因素。探索與預后有關的因素影響黑色素瘤患者的生存時間的因素:年齡、性別、病灶部位、浸潤深度多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷預測疾病預后的預測是否會患某病的預測哪些人更容易患糖尿病?年齡、家族史、工作性質(zhì)、BMI、腰臀比等;乳腺癌患者手術(shù)后的生存時間?年齡、家族史、并發(fā)癥、復發(fā)、化療等;法醫(yī)鑒定中死亡時間的推算:根據(jù)尸體的直腸溫度、環(huán)境溫度、停尸物的質(zhì)地等。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷分類計算機輔助診斷系統(tǒng)臨床診斷病毒鑒別胸痛患者如何快速診斷(是否急性心肌缺血?)對體形進行分類,制作服裝對口腔牙列進行分類,預制牙列多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷評價綜合評價醫(yī)院效益評價衛(wèi)生投入產(chǎn)出評價健康狀況評價多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷各種應用對應的多元統(tǒng)計分析方法比較:多元方差分析關系:回歸模型預測:回歸模型分類:聚類分析與判別分析、回歸模型評價:主成分分析與因子分析回歸:多元線性回歸、logisitic回歸、Cox回歸、Poisson回歸多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷4多元分析的主要內(nèi)容均向量的統(tǒng)計量推斷HotellingT2multivariateanalysisofvariance(MANOVA)多元線性回歸(multivariatelinearregression)主成分分析(principalcomponentanalysis)因子分析(factoranalysis)聚類分析(clusteranalysis)判別分析(discriminantanalysis)多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷
本課程的要求上機做練習,分析實際資料學會看文獻,判斷統(tǒng)計分析的應用是否正確統(tǒng)計軟件SAS,或Stata考試:平時作業(yè)與考勤期末考試:閉卷多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷第一講內(nèi)容:多元分析常用統(tǒng)計量多元T檢驗多元方差分析多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷多元分析常用統(tǒng)計量均向量方差、協(xié)方差矩陣離均差平方和與離均差積和矩陣相關系數(shù)矩陣多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷例1.1調(diào)查某地16歲中學生12名,其身高、體重和胸圍資料見下表。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷單變量時,對每個變量分別計算和。多變量時,則計算每個變量的均數(shù)、方差以及變量間的協(xié)方差和相關系數(shù)。為了清晰表達多變量間的關系,常用矩陣(matrix)表示。構(gòu)成矩陣的每個數(shù)據(jù)稱為元素(element)。這里稱為均向量、方差協(xié)方差矩陣。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷1.1均向量(meansvector)
將各變量的均數(shù)用矩陣形式排列,稱為均向量。如本例均向量為三維列向量:
其轉(zhuǎn)置向量為三維行向量:多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷更一般地:樣本均向量為:總體均向量為:多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷1.2方差、協(xié)方差矩陣方差:變量自身的變異;協(xié)方差:變量與另一變量的協(xié)同變異(即:一個變量隨另一個變量變化的關系)。方差、協(xié)方差矩陣:將各指標的方差、協(xié)方差用矩陣的形式排列,得方差-協(xié)方差矩陣(variance-covariancematrix),簡稱協(xié)方差陣(covariancematrix),用字母V表示。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷本例:第1個變量方差為:本例共三個方差:
v22=69.6288v33=35.3239多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷第1個變量與第2個變量的協(xié)方差為:本例共三個協(xié)方差。v13=v31=32.2318v23=v32=45.4659多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷樣本協(xié)方差陣vij=vji,協(xié)方差陣是對角陣多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷
一般地,如n個觀察單位測量了m個變量,則樣本協(xié)差陣為維的對稱陣。記為:多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷對角線兩側(cè)為變量間的協(xié)方差:,可見,方差為協(xié)方差的特例,或協(xié)方差為更一般的形式。其中:對角線上為各變量的方差:,多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷總體協(xié)方差陣多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷1.3離均差平方和與離均差積和矩陣
將各變量的離均差平方和與離均差積和用矩陣排列,該矩陣稱為離差陣(SSCP)。用SS或L表示。與V的關系為:或多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷1.4相關系數(shù)陣X1與X2的相關系數(shù)為:
變量本身的相關系數(shù)為1,因此:將各變量間的相關系數(shù)用矩陣形式排列,稱相關陣。記為R(SeeP.3)。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷
一般地,n個觀察對象有m個變量,則有m×m維的樣本相關陣:其中:多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷correlationcoefficientsmatrix
如事先對每個變量做標準化變換,則變換后變量的協(xié)差陣等于原變量的相關陣。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷離差和-離差積和-相關系數(shù)矩陣502.9464553.9831354.54980.8926765.9168550.12490.80200.9168388.5629多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷3多元正態(tài)分布的性質(zhì)二元正態(tài)分布曲面(
11=1,
22=1,
12=0)
多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷二元正態(tài)分布曲面(
11=1,
22=1,
12=0)
多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷二元正態(tài)分布曲面(
11=2,
22=4,
12=0.75)多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷二元正態(tài)分布曲面(
11=2,
22=4,
12=-0.75)多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷二元正態(tài)分布曲面(
11=2,
22=4,
12=0.75)多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷二元正態(tài)分布曲面剖面(
11=1,
22=1/2,
12=-0.75)多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷m元正態(tài)分布的性質(zhì)每一個變量均服從正態(tài)分布。變量的線性組合服從正態(tài)分布。m元正態(tài)分布中的任意k(0<k<m)個變量服從k元正態(tài)分布。m元正態(tài)分布的條件分布仍服從正態(tài)分布。協(xié)方差為0的變量間相互獨立。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷二元正態(tài)相關變量的參考值范圍
身高(cm)體重(kg)多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷多元T檢驗多元配對設計均向量檢驗多元成組設計兩樣本的均向量檢驗多元方差分析多元成組設計資料的分析多元區(qū)組設計資料的分析多元方差分析的正確應用2.均向量的統(tǒng)計推斷多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷2.1多元T檢驗(Hotelling檢驗)(1)Student-t檢驗的簡單回顧①檢驗一樣本是否來自某已知總體
,檢驗水準為α
多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷②檢驗兩樣本是否來自同一總體多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷
在許多醫(yī)學問題中,做假設檢驗時(如檢驗兩樣本是否來自同一總體時)所依據(jù)的指標可能不只一個。例如:
兒童生長發(fā)育:身高、體重、頭圍、胸圍血壓:
收縮壓、舒張壓甲狀腺功能:血脂:總膽固醇、甘油三酯風濕或類風濕:血沉、抗“O”、WBC計數(shù)多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷若仍用t檢驗,有幾個問題:重復進行t檢驗,增加犯I型錯誤的概率。忽略了變量間的相互聯(lián)系。t檢驗結(jié)果不一致時,難以下一個綜合結(jié)論。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷
例如,本例只有出現(xiàn)下列情況之一,才可作出明確判斷:①兩組間的差別均有統(tǒng)計學意義,且大小趨勢一致(三項指標都是值越大,病情越差);②兩組間各指標的差別均無統(tǒng)計學意義。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷
反之,出現(xiàn)下列情況之一,則難以得出明確結(jié)論:①兩組間各指標的差別具有統(tǒng)計學意義,但趨勢不一致;②兩組間有些指標差別有統(tǒng)計學意義(趨勢一致或不一致),有些指標差別無統(tǒng)計學意義。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷(2)多元配對設計均向量檢驗
目的:檢驗一樣本是否來自均向量為的m元正態(tài)總體。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷
例2.1用胸腺素治療15例病毒性心肌炎細胞免疫功能低下癥,結(jié)果見表2.1(P10)。試問,胸腺素治療前后免疫球蛋白是否有改變?多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷例2.1胸腺素治療前后免疫球蛋白測定值IgGIgAIgM療前療后差值療前療后差值療前療后差值18101654-156246196-50292243-4917441568-176213208-5286272-1418061743-63226214-12297276-2117121584-128238168-70265274916421649722724215307289-1816851543-142260198-622462651917281624-10413821274312288-2416951500-19519620711266262-417601340-420233179-542432591616901454-236256196-60334296-3816671453-214297209-88285263-2217031564-13921222311296274-2217151644-7122823792492601116991543-156236205-31266262-417331684-49202197-5308288-20多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷例2.1資料的單因素分析(配對t檢驗)結(jié)果多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷多元配對T檢驗檢驗假設檢驗統(tǒng)計量多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷多元配對T
檢驗與配對t
檢驗的轉(zhuǎn)置矩陣
V的逆矩陣多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷AT
轉(zhuǎn)置矩陣在線性代數(shù)中,矩陣A的轉(zhuǎn)置是另一個矩陣AT(也寫做Atr
,tA或A′)A-1逆矩陣在矩陣的運算中,單位陣E相當于數(shù)的乘法運算中的1,那么,對于矩陣A,如果存在一個矩陣A-1,使得AA-1
=A-1A=E則矩陣A-1稱為A的可逆矩陣或逆陣。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷HotellingT2的分布多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷例2.1資料的分析結(jié)果T2=47.6559,F(xiàn)=13.6160,P=0.00036。
故可以認為治療后免疫球蛋白下降。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷(3)多元成組設計兩樣本的均向量檢驗
例2.2兩組貧血患者的血紅蛋白濃度(%,X1)及紅細胞計數(shù)(萬/mm3,X2)
如下表。問兩組患者的貧血程度是否有差異。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷例2.2兩組貧血患者的血紅蛋白濃度(%,X1)及紅細胞計數(shù)(萬/mm3,X2)
A組B組X1X2X1X23.92104.82704.21904.71803.72405.42304.01704.52454.42204.62705.22304.42202.71605.92902.42605.52203.62404.32905.51805.13102.92003.3300多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷檢驗假設或多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷檢驗統(tǒng)計量多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷多元T檢驗與t
檢驗多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷HotellingT2的分布多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷例2.2兩組貧血患者的血紅蛋白濃度(%,X1)及紅細胞計數(shù)(萬/mm3,X2)
A組B組X1X2X1X23.92104.82704.21904.71803.72405.42304.01704.52454.42204.62705.22304.42202.71605.92902.42605.52203.62404.32905.51805.13102.92003.3300多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷例2.2計算結(jié)果:
多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷P=0.0030。
多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷多元分析是單變量分析的擴展對單變量(一元)資料配對t
檢驗是配對HotellingT2
檢驗的特例;t
檢驗是HotellingT2
檢驗的特例。
多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷2.2多元方差分析Multivariateanalysisofvariance,MANOVA一元方差分析的基本思想:對方差(離均差平方和,SS)的分解多元方差分析的基本思想:對方差-協(xié)方差陣(離均差平方和-離均差積和,SSCP)的分解。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷例2.3三組貧血患者的血紅蛋白濃度(%,X1)及紅細胞計數(shù)(萬/mm3,X2)A組B組C組X1X2X1X2X1X23.92104.82704.42504.21904.71803.73053.72405.42302.92404.01704.52454.53304.42204.62703.32305.22304.42204.51952.71605.92903.82752.42605.52203.73103.62404.32905.51805.13102.92003.3300多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷例2.3計算結(jié)果三組的均向量和離差矩陣多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷例2.3計算結(jié)果(續(xù))三組的離差矩陣之和(組內(nèi)變異)總離差矩陣組間離差矩陣
多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷檢驗假設多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷多元方差分析表變異來源SSCP
組間
1=g-1組內(nèi)
2=n-g總n-1多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷Wilks統(tǒng)計量
組內(nèi)變異在總變異中的比例。多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷例2.3的計算m=2,g=3:v1=2×m=4,v2=2×(30-2-2)=52P=0.001161.多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷(3)多元區(qū)組設計資料的分析
例2.4為了解某溶栓藥對腦梗塞患者血壓的影響,觀察10名患者,分別與療前、溶后10分鐘、溶后20分鐘測定患者的收縮壓(X,mmHg)和舒張壓(Y,mmHg),結(jié)果如下表,問該溶栓藥對血壓有無影響?多元統(tǒng)計分析--常用統(tǒng)計量及均向量的統(tǒng)計推斷例
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國鹽業(yè)市場十三五規(guī)劃與投資戰(zhàn)略研究報告
- 呂梁師范高等??茖W?!盾浖椖垦邪l(fā)實踐》2023-2024學年第二學期期末試卷
- 浙大寧波理工學院《食品分析與檢驗》2023-2024學年第二學期期末試卷
- 中北大學《計算機網(wǎng)絡》2023-2024學年第二學期期末試卷
- 2025重慶市安全員-B證考試題庫及答案
- 江蘇農(nóng)牧科技職業(yè)學院《計量經(jīng)濟學B》2023-2024學年第二學期期末試卷
- 遼東學院《巖石力學》2023-2024學年第二學期期末試卷
- 2025年云南省建筑安全員知識題庫及答案
- 北京政法職業(yè)學院《健身一》2023-2024學年第二學期期末試卷
- 貴州盛華職業(yè)學院《三維影像設計Ⅰ》2023-2024學年第二學期期末試卷
- Illustrator設計教案(第一講)課件
- 我國的雙重國籍問題研究 邊防管理專業(yè)
- 廣東義務教育標準化學校
- 全電發(fā)票樣式
- (完整)藥劑學教案
- 提案改善課件全員版
- 2022年全國新高考Ⅰ卷:馮至《江上》
- 銅陵油庫重油罐區(qū)工藝設計
- 質(zhì)量手冊CCC認證完整
- DB51∕T 2767-2021 安全生產(chǎn)風險分級管控體系通則
- 反興奮劑考試試題與解析
評論
0/150
提交評論