多元統(tǒng)計分析方法練習(xí)題_第1頁
多元統(tǒng)計分析方法練習(xí)題_第2頁
多元統(tǒng)計分析方法練習(xí)題_第3頁
多元統(tǒng)計分析方法練習(xí)題_第4頁
多元統(tǒng)計分析方法練習(xí)題_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

附錄B習(xí)題第一章1設(shè)20~60歲的男子大腦瑩量與頭顱長度(Y,cm)服從二元正態(tài)分布.已知X與Y的相關(guān)系數(shù)為;X的均數(shù)和標(biāo)準(zhǔn)差分別為:和。試寫出X與Y的二元正態(tài)分布函數(shù)。并繪制二元正態(tài)分布的正態(tài)曲面。2已知成年女子的胸圍、腰圍和臀圍服從三元正態(tài)分布,均數(shù)分別為:,八協(xié)方差矩陣為:‘30.530 、25.53639.859J9.53220.70327.363,試寫出相應(yīng)的三元正態(tài)分布函數(shù)。3證明,若變量心花服從二元正態(tài)分布MN(從of;心b;;p),對州內(nèi)作線性變換:則Z],?亦服從二元正態(tài)分布。并分別求出乙]也2的均數(shù).方差及石與6的相關(guān)系數(shù)。1-4就例資料,圖示二元分布的90%參考值范囲。1-5設(shè)S和R分別是隨機(jī)向量X的方差-協(xié)方差矩陣和相關(guān)系數(shù)矩陣,證明:|S|二佝込2…%)岡.第二幸2-1對20名健康女性的汗水進(jìn)行測量和化臉,數(shù)據(jù)如下,其中.Xi為排汗董,X2為汗水中鉀的含量,X3為汗水中鈉的含量。試檢驗,樣本是否來自Uo‘=(4,50,10)的總體。試驗者X,X2X3試驗者Xi<2 X31?2.3.4.5.6.7.8?9.10.11.12.13.14.15.16.17.18.19.20.資料來濂:王學(xué)仁.王松桂.《實用多元統(tǒng)計分析》,上海科學(xué)技術(shù)出版社.1232以兩均向量比較為例,證明,隊數(shù)據(jù)陣作線性變換,不改變假設(shè)檢驗的結(jié)果。

2-3臉證:當(dāng)m=1時,HotelIingT?檢驗與t檢驗等價。狀況有無差別。男生女生編號編號身高 體重胸國身高 體瑩 胸國11223344556677889910101112為了解某溶栓藥對腦梗塞患者血壓的影響,觀察10名患者,分別與療前、溶后5分鐘、10分鐘.20分鐘測定患者的收縮壓(X,mmHg)和舒張壓(Y,mniHg),結(jié)果如下表,問該溶栓藥對血壓有無影響?療前ID溶后5分鐘溶后10分鐘溶后20分鐘X YX YX YX Y117511517511017011017090213693130901359513597314289138991389914210841801001801001801001809051709017080180701707061257011467111641126871401001409014090140908150701448116687151919150981509815098143831010575113751137511375許料來源:陳清棠,九五攻關(guān)項目。1999為尋找擠壓塑料膠卷的就優(yōu)工藝條件,在研究中考慮兩個因子:拉力和添加劑的濃廈。觀察3個指標(biāo),耐力(XJ,光澤(X2),不透明度(X3)。結(jié)呆如下。問拉力和添加劑的濃度對3個指標(biāo)有無影響添加劑譙(A1) 添加劑%(A2)XiX2 X3 Xi X2 Xj低拉速(B1)鬲拉速(B2)資料來源:王學(xué)仁、王松佳,《實用多元統(tǒng)計分析》,上??茖W(xué)技術(shù)出版社,1990,188頁。第三章1證明:在兩樣本均數(shù)的比較,如將分組變量視為自變量,將觀察指標(biāo)視為因變董,作回歸分析,則所得回歸系數(shù)的t檢臉與兩樣本均數(shù)的t檢驗結(jié)果是等價的。3-2下列資料是用三種飼料喂大白亂后得到的肝重比值。將分組變量視為自變量,并用啞變量表示,將觀察指標(biāo)視為因變量,作回歸分析。驗證,所得回歸方程的F檢驗與三紐均數(shù)比較的方差分析的F值是相同的,結(jié)論是等價的:三種飼料喂大白鼠后的肝重比值(%) fOJ甲 乙 丙y均數(shù) 3-3 ~~以上兩個練習(xí)題說明,通常的方差分析模型是線性回歸模型的特殊情況。找一個區(qū)組設(shè)計的例子,將其用線性模型表示,并比較均數(shù)的方差分析結(jié)果與模型檢驗的結(jié)果。3-4

為研究建立年齡(age)^體重(weight)、跑英里所用的時間(runtime)、休息時的脈搏數(shù)(runpluse)及跑步時的最大脈搏數(shù)(maxpluse)與肺活董間的關(guān)系,測量了31人的數(shù)據(jù)。結(jié)杲如下。試進(jìn)行回歸分析。ageweightruntimerstpulserunpulsemaxpulseoxy44621781824062185185444515616842401661723855178180475817617640701761804364162170446317417638481701864445168168455618619245511761764747162164545016617049441801855758174176546215616551591861885749148155495618618848521701765253170172資料來源:高冬琰編譯,《SAS系統(tǒng)SAS/STAT軟件使用手冊》,中國統(tǒng)計出版社,1997,148頁。3—5文中所述逐步回歸中的消去變換是從離差陣出發(fā),罠后可直接得到偏回歸系數(shù)b,和參差平方和Q。從離差陣出發(fā)進(jìn)行消去變換有一個缺點,當(dāng)樣本含董較大時,離差陣中元素可能很大,則其倒數(shù)將很小,此時需要保留足夠的小數(shù)位數(shù),有時保留8位或10位還不夠。此時,可以考慮從相關(guān)矩陣出發(fā)進(jìn)行消去變換等運算,常保留6位小數(shù)。所得變量的剔選過程是等價的。而最后得到的是相應(yīng)的標(biāo)準(zhǔn)僞回歸系數(shù)b,和標(biāo)準(zhǔn)殘差平方和Q=1-R2o試驗證之。3—6試證明,R是y與9的Pearson相關(guān)系數(shù)。3-7學(xué)校里孩子的體重看成是他們的身商和年齡的函數(shù)模型。從學(xué)校里調(diào)査了237個小學(xué)生的性別(f:女性,m:男性)、身鬲(英寸)、年齡(月)和體重(磅)。試建立體重與性別、身高、年齡的回歸模型。年身體性年身體性年身性別齡高重別齡高重別齡高體重f14385F155105f153108

f1615992F191113f171112f18559104F14269f16062f140F139104f178f157124F14993f143f14589F191107f150f147115F180114f14185f14081F16458f176112f185101F166104f175f18059112F210140f146f17090F1625884f149f13996F18695f197121f169F177143f185118f182105F173103f166f16895F16962f15094f184108F139f147f144F177112f178f197112F14660109f14559f14775F14584f155107f167F183110f14384f183103F18560106f14877f147112F15460114f15675f144F154f152105f191114F190140f1406077f148F189114f143f178118F16498f157112f147101F1485995f17781f17191F172142f190f183112F143117f17963f18657F182133f18262f14256F165107f16567f15461123F15074f15566f16384F14156f14764f21062116F1716384f16761f18264112F1446192f193115f14185F164108f186108f16985F17586f180m16598M157105m144m15084M150128m13987m18967128M183111m14779m14690M16084m156112m17393M151117m14184m15059M16495m1536084m206134M250172m176//H=130.17,l22=1016518 ,厶3=218849 '=48820.5,(5=29980.8,m17665119M 140m18566105m180104M14683m18366m14084M15186m1516181m14494M160m178m193133M162119m16495m18666112M14375m1756492m17568112M175m17369m170113M17466108m164108m14488M156106m1495792m14460118M1475784m188112m16962100M17265112m15084m193128M15758m16860m140M156m156m15865121M184112m156114m1445784M17681m168m14981M1425570m18871140m203117M14284m189112m188151M20071147m152105m174120M16684m14591m143101M163118m166121m18267133M17366112m155m16260105M17763111m177112m175114M1666291m1505998m150118M188116m16366112m171112M1626391m14185m17463112M14256m148118m140M16064116m1446089m206172M159112m14972m19372150M194135m15297m14655M13955m186112m16175M153128m19698m1645884M15999m178112m153M155m178m1425576M164112m18965114m164140M16762108m151873—8為研究正常少兒的心象面積(y,cm2),與性別(x—畀取1,女取0)、年齡(X2,月人身鬲(x3,cm)、體重(X4,kg)、胸國(xs,cm)之間的關(guān)系,菜單位調(diào)查了521名2歲半至15歲的少兒。得各?指標(biāo)均數(shù).離均差平方和如下:x{=0.48,x2=10.37,x3=124.47,x4=24.76,x5=60.23,y=61.75lyy=127402相關(guān)矩陣如下:1-0.039603-0.0410570.965799-0.0344470.9216310.9382340.0479920.9082980.9153320.966865lyy=127402相關(guān)矩陣如下:1-0.039603-0.0410570.965799-0.0344470.9216310.9382340.0479920.9082980.9153320.9668650.037969資料來源:史來綽,楊埼編著,試進(jìn)行逐步回歸分析。0.855474.08838570.8634410.850318;《醫(yī)用多元分析》,人民衛(wèi)生出版社,1990.第80頁。3—9為研究初生兒體瑩與胎兒的孕齡,頭徑,胸徑,腹徑,股骨長的關(guān)系,以預(yù)測初生兒童的體重,某醫(yī)院用超聲波測得18名胎兒的上述指標(biāo),結(jié)果如下。試建立回歸方程。孕齡(天)頭徑(mm)胸徑(mm)腹徑(mm) ■一生兒體重(g)YX1X2X3X412891011091077339002282868483692500327010210110066340042849896927432005275101100104683100628510194986932007270981039968310082599780816324009285109102104883800102681039510173320011280107991077635001226711290987135001327110010210471300014283101106103683700152871021061077139001627310310210261300017276102989988310018276106103103743650許料來源:郭祖超主編,《醫(yī)學(xué)統(tǒng)計學(xué)X1999,人民軍醫(yī)出版社,201頁。第四幸1對菜夠商中一年級男生38人進(jìn)行體力測試及運動能力測試,包括:X1一反復(fù)橫向跳(次人X2—縱跳(cm),X3—背力(Kg),X4—握力(Kg).X5—臺階試驗(指數(shù)),X6—立定體前驅(qū)(cm),X7—俯臥上體后仰(cm)。運動能力測試的指標(biāo)為:X8-50米跑(秒),X9—跳遠(yuǎn)(cm),X10—投球(m),X11—引體向上(次人X12—耐力跑(秒)。試進(jìn)行主成

分分析。序號X1x2x3x4x5x6x7x8x9;<10 x11 x121465512651752572489278360252559542811850464305348346691073898187443032938644950105489816603622663315425590466726845323113916486110643782558740529738974960100499115607420211037984863122525617684662823629455510548761561415246396104864120386020624132873981149521004253642404236400124762100346110624272574071341511015362560737225340914525512543865624963010350154552945051206539424339916495711047721945744630113371753651124790157544630123571847779547729644202544471948601204786126244728113812049551134184156073982743872148691284248206348530735022425712246541563400286388235464155517119615113312298245363120425785343029435325427113844651755748729937026466612045622268470287360274556912966185138026535828506012042578574603253482942511265050135739827238330485011541536394152863143142521404856156047027113483248671053969236045028103263349741514954205875003012330344755113407119644102973313549741205355225950033213423644521103755145740029242137526613047461445505281135538486810045542370522289352進(jìn)料來源:于秀林、任雪松、《多元統(tǒng)計分析》,中國統(tǒng)計出版社,1999,226頁。阿昌族28851京族39610222獨龍族176619裕固族360普來族29032怒族31225徳環(huán)族33219基諾族3763520他佬族92撒拉族143807毛南族81資料來源:錢建明等,《中國少數(shù)民族健康趨勞研究》,成都科學(xué)技術(shù)出版社,19994-4在我國制定服裝標(biāo)準(zhǔn)時,測量了3454名成年女子的14個部位的數(shù)據(jù),得協(xié)方差矩陣如下,是進(jìn)行主成分分析。x1x2x3x4x5x6x7x8x9x10 x11 x12 x13 x14上體長X1手臂長x2胸國x3頸圍x4總肩寬x5前胸寬x6后背寬x7前腰節(jié)高x8后腰節(jié)高x9總體高x10身高x11下體長x12腰國x13x14資料來源:張堯庭方開泰著《多元統(tǒng)計分析方法》,科學(xué)出版社,1982,P115第五章1比較因子分析與主成分分析模型的關(guān)系,說明它們的相似之處和不同點。5-2對練習(xí)4-1資料進(jìn)行因子分析。

5-3從協(xié)方差矩陣出發(fā),對例4-1資料進(jìn)行因子分析,比較兩者的結(jié)果。5-4HolzingerKJ(1934)告了355名小學(xué)生12項心理測試項目間的相關(guān)系數(shù)矩陣如下,試作因子分析。Perceptionofbrightnesscountdotsstraightandcurvedlettersspeedinsimplecode1111111TheUniversityofChicago頁。資料來?源:Harry(I960).ModernFactorAnalyses.第六幸1在例中,就下列兩種情況解釋logistic回歸模型中x的系數(shù)的涵義,并導(dǎo)出x的系數(shù),寫出相應(yīng)的logistic回歸方程。暴翳時X—,非暴露時X一1:點露時x一19非暴露時x~-1o6-2某研究調(diào)查了169名婦女吸煙和使用口服避孕藥對血栓形成的影響,資料如下,試進(jìn)行分析。病人類別用避孕藥吸煙不用避孕藥血栓14 7對照2 22病人類別用避孕藥吸煙不用避孕藥血栓14 7對照2 22不吸煙用避孕藥不用避孕藥12 258 84合計581116-3為研究血壓、膽固醇于心臟病的關(guān)系,調(diào)査了13396-3為研究血壓、膽固醇于心臟病的關(guān)系,調(diào)査了1339名冠心病和健康人的血壓和膽固醇,結(jié)果如下。試建立logistic回歸方程,并探討自變量的適宜尺度。冠心病膽固醇(mg/1000mI)收縮壓(mmHg)<127 127?146 147?166 >166<2002 3 3<2002 3 3200?200?219 3220?26081166>2607121111<2001171214722200?21985984320220?2601192096843>260679946336-4下表列出了100個參加研究的個體之年齡(AGE),有無冠心病(CHD)的明顯癥狀,表中ID為編號,AGEP為年齡分紐變量。結(jié)果變量是CHD.CHD=0表示個體無冠心病.CHD—1表示有冠心病。⑴作CHD與AGE的散點圖;對年齡分組變量AGRP分別統(tǒng)計冠心病人數(shù),計算各年齡組冠心病的患病率P;分別作P與AGRP,及l(fā)ogitP與AGRP的散點圖,并與⑴的結(jié)果比較:分別建立CHD與AGE,及CHD與AGRP的logistic回歸,并比較兩個回歸的結(jié)果:⑸建立P與AGRP的logistic曲線,并與(4)的結(jié)果比較。100個個體的年齡和冠心病(CHD)狀況IDCHDAGEAGRPIDCHDAGEAGRPIDCHDAGEAGRP102013503836805162023136039369052630241371393701526402513804047115365125139140472153660261400414731546702614104147405578028142042475155790281430424761557100292440424771567110302451424781567120302460434791567130302470434800577140302481434810577150302490444821577160302500444831577171322511444841577180322521444851577190332530455860587200332541455871587210342550465881587220342561465891597231342570475901597

24034258047591060825034359147592160826035360048593161827035361148594162828036362148595162829136363049596163830036364049597064831037365149598164832137366050699165833037367150610016983403836-5為了解睪丸癌與隱睪癥的關(guān)系.以及兩者是否具有同側(cè)性或異側(cè)性傾向,在某地進(jìn)行了病例一對照研究,結(jié)果如下:結(jié)果分組隱癌癥無左側(cè) 右側(cè)雙側(cè)對照組658372左側(cè)睪丸癌130812右側(cè)睪丸癌1564143根據(jù)上述結(jié)果擬合多類結(jié)果logistic回歸模型根據(jù)擬合模型,檢驗睪丸癌與隱睪癥是否有同側(cè)性;根據(jù)擬合模型,檢驗睪丸癌與隱睪癥是否有異側(cè)性:檢驗隱睪癥與同側(cè)睪丸癌的優(yōu)勢■比是否與異側(cè)隱睪癥的優(yōu)勢比相同。6-6某.醫(yī)科大學(xué)外科在腿潰瘍的治療臨床研究中,釆用兩種處理treat(TrentaI一1和Placebo―),兩種細(xì)帶(bandage4layer—1和Convatec-0),兩種包扎方法(Granuflex一1和Na=0),治療結(jié)果分為3各等級heal(無效一0,有效二仁痊愈一2)。根據(jù)上述結(jié)果擬合累積比數(shù)logistic回歸模型:擬合相鄰比數(shù)logistic回歸模型;對⑴和⑵的結(jié)果進(jìn)行比較;treatbandagedressingheaI0Freq19treatbandagedressingheaI0freq21000100000141001200022100240010211010100011310115001221012100100911005010181101100102611028011010111012

0 1 1 1 10 1 1 1 1 70 1 1 2 5 11 12 7(4)該資料是否符合建模的條件6-7hosmer,?給出了1:3配比的低出生體瑩危險因素研究,結(jié)果如下表。研究中按年齡配比,及年齡相同者配方,match是配比紐,obs是配比組中的患者編號,low表示低出生體重變董(Iow=1,體重出生低于2500g,否則low=0),Iwt表示母親靈后一次月經(jīng)的體重,smoke表示母親吸煙狀況(吸煙=1不吸煙=0),ptl表示早產(chǎn)史(有=1無=0),表示高血壓(有=無二0)ui表示子宮過敏危險情況(有二1無=0)時對該資料進(jìn)行分析。obsIOWageIwtsmokehtuiptlobsIowageIwtsmokehtuiptl111613000003022112100120161120000402216900003016135100011239700104016950000202313000001117130101130231190000201710300004023123000030171221000112311010014017113000020231280000111712000003023190000020171130000402311000003017119000011241320100401711900002024115000011181480000302411500002018100100040241100000301890101011241380000401822900002024901001111811010013024133000020181071010402411600003018100100011258500104018901010202511810001119911011302512500002019138100040251200000301918900001125921000401914710002025120001011191020000302514000002019150000040252410100301923511001125105000140191841100202515500001119112101030259510112019182001040251300000

30199500001126190100040191320000202611310001120150100030261681000202012000104026160000030201051000112812010114020141001120281400000112012010003028250100020201030000402813400003020127000011289510004020170100020281201000112012110113028120000020201690011402813000003020121100011291300010402012000002029150000011212000010302913500002021108101040291301000302112400001130142100140211851000203010700111121100000130301530000202116000004030137000030211101010113110210014021115000020311000010112213010113031150100020228510004031120000030221301000113210510004022125000020321210000112110000013032132000020211600000403213410013021110101011311021001402111500002031100001011221301000303115010002022120010040311200000第七章7-1驗證,四格表的pearson^與骯等價。7-2對例資料用極大似然法建立可加效應(yīng)的poisson模型(列出

詳細(xì)步驟)。7-3AlanMorrison作了一項乳腺癌患者3年生存情況調(diào)查?其中慢性炎癥反應(yīng)的程度分為輕炎癥和重炎癥,核的量級分為相對惡性和相對良性,并按診斷中心和年齡分層.結(jié)果如下.使就影響乳腺癌患者3年生存率的有關(guān)因素進(jìn)行分析.診斷中心年齡存活情況輕炎癥重炎癥惡性良性惡性良性東京50以下死9743活266825950~69死99112活204618570以上死2310活1651波士頓50以下死6760活11244050~69死82032活18581370以上死91830活152611格拉摩根50以下死16730活16208150~69死141230

活273910470以上死3730活1211417-4為探的討腫瘤壞死因子(TNF)與干擾素(IFN)的免疫活化能力,各選4個計量,共16個組合,見下表第2,3欄,每種組合下,觀察200個細(xì)胞中有多少個分化(y)?結(jié)果見下表第一欄?研究的目的是要檢驗?zāi)[瘤壞死因子仃NF)與干擾素(INF)對細(xì)胞的分化作用是獨立的,協(xié)同的還是拮抗的.試對該資料建立logistic回歸,Poisson回歸和負(fù)2項回歸,并對它們進(jìn)行評價.N0yTNF的劑量(U/ml)IFN的劑量(U/ml)1110021804320020439010052210638147521208691100931100106810411691020

12128101001210210001417110041518010020161931001005..Weinberg(1988)等報道了Colorado地區(qū)1978-1983年兒童糖尿病按性別、年齡分組的逐月發(fā)病情況,下表是按各組人口數(shù)校正后的發(fā)病人數(shù)。試用Poisson回歸模型分析糖尿病的發(fā)病和年齡、性別之間的關(guān)系,并探討是否有季節(jié)波動。Colorado地區(qū)1978-1983年兒童糖尿病病人數(shù)另女男女年月年月0-45-9 10-170-45-910-170-45-9 10-170-45-9 10-1778.10250452115016312112340211115033016\610202171200158013002920021010111013110410211201501179.10160052142012302311440121205332030600211270000228100024901304110010132111080141203912580.121614522130213212123400112251020126005111711101283121439106113100411221111210412003014變量編碼:年齡(age)(0性別(sex)(0時間(month):1一4;:女;1(月份)1:1—9::男);2:10—17),第八幸8T設(shè)一組病人的生存分布服從A=0?65的指數(shù)分布。請:畫出生存函數(shù)曲線;計算平均生存時間,中位生存時間;(3)計算生存大于2個單位時間的概率。2設(shè)一組病人的生存分布服從八一.m-3的WeibulI分布。請:畫出生存函數(shù)曲線和危險度函數(shù)曲線;估計平均生存時間;、 (3)計算生存大于1個單位時間的槪率。8-3為了比較藥品6-疏喋吟(6-MP)與一種安慰劑在緩解血癌患者的痛苦方面的療效■請定狡生存時間和死亡事件。如每組分別觀察了21名患者,緩解的時間(周)如下。其中帶星號為截尾。試進(jìn)行分析和比較。(資料來源:JFLawless(弗詩松等譯)壽命數(shù)據(jù)中的統(tǒng)計模型與方法,P5)6-MP組:6,6,6,6+,7,9“,10,10',1V,13,16,17*19*20',22,23,25*,32*,32',34*35*安慰劑:1,1,2,2,3,4,4,5,5,8,8,8,8,11,11,12,K2,15,117,22,238-4在深度的靜脈血栓形成的研究中,20名病人的血凝塊漸退時間(小日寸)如下(許料來源:ETLee(陳家鼎等渾)生存數(shù)據(jù)的統(tǒng)計方法,P268):2,3,4,5,5,9,13,,,,7,6,,6,14,25,49,,49,28擬合指數(shù)分布;擬合Weibull分布;何種分布模型較好8-5對例資料建立指數(shù)回歸和Weibull回歸,并與Cox回歸模型進(jìn)行比較。8-6對例資料用逐步回歸方法建立Cox模型。8-7有33位患腎上腺樣瘤的病人接手化學(xué)療法、免疫療法及激素療法的綜合治療。進(jìn)料如下。試對該資料進(jìn)行分析。其中,age表示年齡;gender表示性別,F(xiàn)表示女性,M女性男性;tiemO和timeI分布表示開始治療和終止治療的時間:response是對治療的反應(yīng),0表示無反應(yīng),1表示完全反應(yīng),2表示部分反應(yīng),3表示穩(wěn)定:其余5個指標(biāo)是皮膚試驗的反應(yīng)面積,ND表示沒有做agegendertimeOresponsetime1outcomeMoniliaMumpsPPDPHA53F03/31/77111/01/7707X723X230X025X61M06/18/76008/21/76110X1015X200X013X56F02/01/77310/01/7700X07X70X025X48M12/19/74201/15/7610X00X00X00X55M11/10/75001/15/76112X12ND10X108X62F10/07/74204/05/75110X105X50X07X57M10/28/74001/06/75115X1515X150X00X53M10/06/75206/18/7710X0ND0X012X45M04/11/77010/01/7706X44X40X00X58M08/04/76302/11/77113X1313X1322X2223X61F01/01/77310/01/7700X08X817X1711X61M07/25/76110/01/7703X912X120X020X77M05/08/75009/26/7510X00X00X00X

55M04/27/77210/01/7700X00X015X1510X50M04/20/77310/01/7700X014X145X532X42M08/24/76010/01/77011X117X70X012X50F01/08/75006/30/7510X00X00X00X66F09/08/76310/01/7709X910X106X615X58M02/18/75010/01/7700X00X00X00X62M05/12/76010/17/7612X2NDND3X71F10/22/76312/12/76110X106X60X012X44M06/06/77310/01/77010X1010X100X020X69M06/21/76010/13/7610X015X1525X2525X56M06/07/77210/01/7700X07X70X00X57M11/16/76012/10/76111X115X50X020X69M05/10/77007/25/7710X00X00X015X60M06/29/77007/07/7710X00X00X026X60M07/21/75310/01/77011X1120X2010X1018X72M07/19/75010/18/75110X100X07X710X42F03/03/75004/23/7510X0ND0X00X57M02/24/77210/01/7705X58X80X025X66M06/15/77310/01/7700X015X150X010X59M03/04/77004/02/7710X00X00X016X1選擇何種標(biāo)準(zhǔn)進(jìn)行聚類分析,要依具體數(shù)據(jù)的實際背景來決定.標(biāo)準(zhǔn)選擇是否得當(dāng),對于聚類分析效果有直接影響。已知一個二維正態(tài)分布總體有分布:現(xiàn)在有兩點A=(lj/和現(xiàn)在有兩點A=(lj/和B=(l,—lj。若按歐氏距離距離計算,點A與點B到均數(shù)的距離同為血。若按馬氏距離計算,是否也一樣9-2欲以能耗.糖耗將運動項目分類,以便針對不同能耗、糖耗的運動提供不同膳倉,使運動員既能得到能董的補充,又不造成多余的脂肪堆積。某單位對上海劃船隊6名運動員作了能量代謝測定,得13個項目的平均數(shù)如下,試進(jìn)行分析。運動項目變量名能耗(焦耳/分.M2)糖耗(%)負(fù)重下蹲X1高力翻X2提鈴X3引體向上X4腰腹轉(zhuǎn)X5手腳并舉X6仰臥蹬腿X7快挺X8趴拉X9臥推X10

X11X12X11X12X139-3練習(xí)4—1的資料進(jìn)行變量聚類答案:1.1X與Y的二元正態(tài)分布函數(shù):12^0.152*7.522*(1-0.52192)2(l-0.52192)Ll0.15x-1.47y-176.557.52--2xO.5219xx-1.470.15y_176.557.52-TITLE*繪制二元正態(tài)分布曲面';GOPTIONSRESET=GLOBALGUNIT=PCTNOBORDERFTEXT二SWISSBHTITLE=6HTEXT=3;DATAex1_1;S1=**2;s2=**2;r=;pi=3.;DOx=TOBY;DOy二-20TO20BY;z=1/(2*pi*SQRT(s1*s2*(1-r*r)))*EXP(-1/2/(1-r*r)*(x*x/s1+y*y/s2-2*r*x*y/SQRT(s1*s2)));OUTPUT;END;END;RUN;/*title'BivariableNormaISurface';*/PROCG3D;PLOTx*y=z/R0TATE=135XTICKNUM二9YTICKNUM二11ZMAX=ZTICKNUM二5;RUN;-1X-?83.39T|70.2627.363bp.5201.2三元正態(tài)分布的密度函數(shù):(r83.39lj;3().53O-1)x-70.26 25.53638.859fW= 30.530(2fW= 30.530(2龍)小x25.53619.53239.85920.70327.3631.3證明:Fl“二bl2、<cr21b22,令乂=設(shè)X=“+AY?”2(吃)(丫?(0,1))

1\、/<i\A\&)Y~N、厶z0,AIJAG)則Z=—~~—=—AY=0+bb心)民)z ?\則z~N20,心)民)z ?\則z~N20,肱=—AA

b得證。冷克)1.4思路:x與y的90%參考值范圍是下列方程的解:1 J(x—165?8338)?1-0.580624.91550^fOg(x_165?8338)(y_53?5694)+(y_53?5691 J(x—165?8338)?1-0.580624.91550^fOg(x_165?8338)(y_53?5694)+(y_53?569盯4.9155x4.89214.89212證明:記》%分別表示變量£的標(biāo)準(zhǔn)差和方差,因£的X」的相關(guān)系數(shù)◎及協(xié)方差%有如下關(guān)系:則:s〕rs〕r計2…環(huán)陽S2m■?=$22■■…S2SmS2m?????'mm??SmS2rm2??… ^nuns}0 …0Grn…r\ms、0 …00s2?…0r2X r22 …?0s2…00 0 …5,?_佝乙2…S0 0 …5;?_故得:同=(幾屜…%)外練習(xí)Title'樣本均向量與總體均向量的比較';DATAex2_1;INPUTx1x2x3昶;Y1=x1-4;y2=x2-50;y3=x3-10;Cards;Procanova;Modely1y2y3=/nouni;Manovah二intercept;Run;練習(xí)令A(yù)=(a1,a2,???,an-i,aj,B=diag(b1,b2,???bj對X作線性變換:Z二A+BX則Z=A+BX,V2=BVxB,V;1=(BVxB')J(B‘)“上匹(ZZAV「(ZZ2)=處L(BX,-BX2),(B,廠7?1+n2 nl+n2Vx^1(BX1-BX2)= "心(X1-X2)JBf(B?)?1VxQb(X1-X2)=721+712旦匕(乂廠乂2)'Vx"1(X,-X2)=Txnl+n2得證。3Title"hotellingT?檢驗與t檢驗’;Dataex2-3;Inputx@@;G=1;If_n_>14theng二2;Cards;Procttest;Varx;Classg;Run;Procglm;Classg;Modelx=g/nouni;Manovah=g;Run;4Title'多元方差分析:成組分析';DATAex2_4;Inputhwbsex$CARDS;PROCGLM;CLASSsex;MODELhwb=sex/MOUNI;MANOVAH=sex;RUN;練習(xí)TITLE'多元方差分析:區(qū)組設(shè)計':DATAex2_5;INPUTxyab魏;CARDS;175 155 1 1 175 110 2 1 170 110 3 1 170 90 4 1?????????105 75 1 10 113 75 2 10 113 75 3 10 113 75 4 10■PROCGLM;CLASSab;MODELxy=ab/NOUNI;MANOVAH=ab;RUN;練習(xí)TITLE'多元方差分析:析因設(shè)計';DATAex2_6;INPUTx1x2x3abCARDS;1121PROCGLM;CLASSab;MODELx1x2x3=aba*b;均數(shù)分別為丙.K2,均數(shù)分別為丙.K2,標(biāo)準(zhǔn)差分別為1答:設(shè)兩樣本Y2,樣本含量分別為nbn2,不妨設(shè)回歸方程為:Y=a+bg則當(dāng)g=1時,r1=a+bg=Y\:當(dāng)滬0時,Y2=a=Y2a故有b=y2-rio此 時憶(J/_[工厲一?)2+》(5一上2)2_何一1)才+(“2一礙V~n^2V V ~n^2'皿一外=如1一群+呱°一群十一扯5(o-繪),("1-1)/1+(心-1)打/j戸〃2/:-2 *戸i+n2得證。均數(shù)2答:TITLE,回歸方程F檢驗與均數(shù)之方差分析':DATAex3_2;INPUTygg1g2CARDS;10021 0 30110021 0 30110021 0 30110021 0 301PROCREG;MODELy=g1g2;RUN;PROCANOVA;CLASSg;MODELy=g;RUN;3-3答:TITLE'方差分析模型與線性回歸模型'DATAex3_3;DOb=1to5;DOa=1to4;INPUTx00;OUTPUT;END;END;CARDS;PROCANOVA;CLASSab;MODELx=ab;RUN;PROCGLM;CLASSab;MODELx=ab;RUN;3-4答:TITLE”弼選自變量的最優(yōu)子集":DATAex3_4;INPUTageweightruntimerstpulsemaxpulseoxy;CARDS;44 6217818252 53170172PROCREGRSQUAREMSECPAICADJRSQSELECT二2;MODELoxy=ageweightruntimerstpulserunpulsemaxpulse;run;練習(xí)X1X2 X3X4YX1X2X3X4以(2,2)為主元作消去變換,結(jié)果如下:X1X2X3X4X1X2X3X4Y以(4,4)為主元作消去變換,結(jié)果如下:X1X2X3X4 Y

X1X2X3X4X2 X3X4以(1,1)為主元作消去變換,結(jié)果如下:X2 X3X4X1X2X3X4以(2,2)為主元作消去變換,結(jié)果如下:X4X1 X2 X3X4X1X2X3X4練習(xí)因% -也山一方2£ bm心,U=工加珥,故:TOC\o"1-5"\h\zft -a_ n - -幾 工(兒一刃0廠刃工(兀一刃(4+%心+…+5%-y)_yy_z-i f.in質(zhì)/r.-py-y) "ri 一rr? — 一 —工[?-刃工-?)]工◎[工(x-刃(?-?)]/-I /-1 _;-1j-imm得證。練習(xí)TITLE”小學(xué)生的身高、年齡和體重的數(shù)據(jù)”;DATAex3_7;INPUTsex$ageheightweight

CARDS;f143f155f153m164m167m151■9PROCREG0UTEST=est1OUTSSCP二sscpl;BYsex;EQ1:MODELweight=height;EQ2:MODELweight=heightage;PROCPRINTDATA=sscp1;TITLE2”sscp類型的數(shù)據(jù)集”;PROCPRINTDATA=est1;TITLE2”est類型的數(shù)據(jù)集”;RUN;練習(xí)TITLE*逐步回歸';OPTIONLINESIZE=12O;DATAex3_8(TYPE二CORR);_TYPE_=”CORR”;INPUT_name_$x1x2x3x4x5y;CARDS;x1 11?11x31?11x3x4yRUN;PROCSTEPWISE;MODELY=x1x2x3x4x5/SLENTRY=SLSTAY=DETAILS;RUN;練習(xí)TITLE'所有子集的回歸';DATAex3_9;INPUTx1x2x3x4x5魏;CARDS;28910110910773390026810395101733200285109102104883800276106193103743650

PROCREG;MODELy二x1-x5/SELECTI0N二RSQUAREADJRSQCPMSEAICBEST=1O;RUN;練習(xí)TITLE'主成分分析';DATAex4T;INPUTx1-x12;CARDS;465512651 2572 48927836048 68100452370 522289352PROCPRINCOMP;RUN;練習(xí)2-1令|Z/3-A|=-p-p-p2-1-p-p-p=0,解得:2-1人=1+2/7兄2二1一。右=1一/?對于人二1+2。<[(l+2p)]/-A]z、ox2=00求得其特征向量為求得其特征向量為求得其特征向量為K“+K<h(K「K?不同時為0)(xx對于Z>=l-p<[(l-p)]/-A]x22練習(xí)4-3TITLE'主成分分析'OPTIONLINESIZE=120;DATAex4-3;INPUTmz$x1-x8;CARDS滿族毛南族PROCPRINCOMPN=4OUT二COMP;RUNPROCSORTDATA二COMP;BYPRIN1RUNPROCPRINTIDmzVARPRIN1PRIN2X1-X8TITLE'用第一主成分對42個少數(shù)民族進(jìn)行排序':■RUN;練習(xí)TITLE'從方差協(xié)方差矩陣出發(fā)進(jìn)行主成分分析和因子分析;DATAex4-4(TYPE=COV)OUTPUTa(TYPE二CORR);-TYPE—COV\INPUT-name-$x1~x14;CARDS;PROCPRINCOMP;RUN;5T答:主成分分析與因子分析都是研究多個變量間的互依性,但出發(fā)點不同。主成分分析是尋找出能反映原變量信息的綜合指標(biāo),是對變量共性的一種提取,主成分的個數(shù)與原變量數(shù)相同,貢獻(xiàn)大的主成分常用于評價,或進(jìn)一步分析,貢獻(xiàn)小的主成分常用于判斷變董間的關(guān)系。因子分析是尋找出能解釋原變量的公共因子,這些公共因子互相獨立代表某一方面的特性,

它們不能被測董,但對可測量的變量產(chǎn)生影響,或者說通過這些變量體現(xiàn)出來。因子分析的任務(wù)是通過原變量提供的錯綜復(fù)雜的關(guān)系,尋找潛在的公共因子,當(dāng)初始因子不好解釋時,常對其作旋轉(zhuǎn)變換。提取公共因子的方法很多,主成分是就常用的提取公共因子的方法之一。因此,很多應(yīng)用者將主成分和因子分析看成一回爭,這芋片面的。5-2TITLE'因子分析';OPTIONLINESIZE=12O;DATAex5_2;INPUTx1-x12;CARDS;465512651 25724892783604868100452370522289352■/*從原始數(shù)據(jù)出發(fā),進(jìn)行因子分析*/PROCFACTORMETHODSN二3ROTATE=VARIMAX;RUN;/*從協(xié)方差矩陣出發(fā),進(jìn)行因子分析*/PROCFACTORCOVMETHODSN=3ROTATE=VARIMAX;RUN;練習(xí)TITLE'因子分析與因子旋轉(zhuǎn)';DATAex5_4(TYPE二CORR);_TYPE_=”CORR”;INPUT_name_$x1—x12;CARDS;x1x2x3x41111111111x6x7x8x9x10x11x12/*方差最大正交旋轉(zhuǎn)*/

PROCFACTORMETHOD=PN=4ROTATE=VARIMAXRES;RUN;/*斜交旋轉(zhuǎn)*/PROCFACTORMETHOD=PN=3ROTATE=PROMAXRES;RUN;6-1解:不妨假設(shè)回歸方程為:logitP=a+ 。(1)ln(O/?)=In幾1幾=log〃£)_log〃人=a_(a+0)=_05/I-門丿0=In丄可解釋為優(yōu)妙比導(dǎo)數(shù)的對數(shù)值。OR對例,當(dāng)x=0時,log/r/J=In-^―=In—= =1.06291-幾19當(dāng)x=1時,Iog〃〃=ln-^=ln£=a+0,0=—1.3107l-/?i 164所以相應(yīng)的 logistic 回歸方程為logitP=ln(O/?)=lnPJ'—P' =(a+0)—(a—0)=200=lnV^可解1宀/1-j丿釋為優(yōu)步比平方根的對數(shù)值。當(dāng)x=1時,logitp.=In卩'=\n—=a+13TOC\o"1-5"\h\z5 1 1-門 19) ]28當(dāng)x=-1時,logitp.=ln卩-\ =ln^-=&_0I-”.】 164聯(lián)列上面兩式,解得:a=0.4075,0=0.6554所以相應(yīng)的logistic回歸方程為IogitP=+6-2解:Title*logistic回歸Dataex6-2;Inputfyx1x2@@;x12=x1*x2;Iablex仁”吸煙否”;Iablex2二"用藥否”;cards;1 7 1 1 0 1214 1 1

1 7 1 1 0 12■2■2019Proclogisticdescending;Weightf;ModeIy=x1x2x12;Run;Procsort;byx2;Proclogisticdescending;122010Weightf;ModeIy=x1;Byx2;Run;6-3解:Dataex6~3;Doy=0to1;Docho1to4;Dosbp1to4;InputfOutput;End;End;End;Cards;23343203811667121111117121472285984320119209684367994633Datatemp;Setex6-3;Y=y-1run;s1=0;Ifsbp=2thens1=1s2=0;Ifsbp=3thens2=1s3=0;Ifsbp=4thens2=1c1=0;Ifcho=2thenc1=1c2=0;Ifcho=3thenc2=1c3=0;Ifcho=4thenc2=1s1=0;Ifsbp=2thens1=1s2=0;Ifsbp=3thens2=1s3=0;Ifsbp=4thens2=1c1=0;Ifcho=2thenc1=1c2=0;Ifcho=3thenc2=1c3=0;Ifcho=4thenc2=1Proclogisticdescending;Weightf;ModeIy=sbpcho;;Run;

Proclogisticdescending;Weightf;Modely=s1-s3c1-c3;Testi:tests2-s1=s1;Test2:tests3-s2=s2-s1;Test3:testc2-c1=c1;Test4:Testi:tests2-s1=s1;Test2:tests3-s2=s2-s1;Test3:testc2-c1=c1;Test4:testc3-c2=c2-c1;Run;Run;Dataex6-4;InputidchdageCards;1agrp@@;0Dataex6-4;InputidchdageCards;1agrp@@;0201??? ???34???0???3836-4解:350 383 68Run;ProcgpIot;Plotchd*age;Run;/*計算條件均數(shù)p*/Procsortout=temp;Byagrp;Procunivariatedata二tempnoprint;Byagrp;Varchd;Outputout二temp2N=nsum=n1mean=p;Run;Procprintdataemp2;Run;data二temp3;settemp2;logitp=log(p/(1-p));run;ProcgpIotdata二temp3;Plotchd*agelogitp*agrp;Run;Proclogisticdescendingdataex6-4;ModeIchd=age;Run;Proclogisticdescendingdataex6-4;Modelchd=agrp;Run;Procregdata二temp3graphics;Modellogitp二agrp;Run;Outputout=temp4predicted=lp;Plotlogitp*agrp;Run;Datatemp5;Settemp4;Pp=exp(lp)/(1+exp(Ip));ProcgpIotdata二temp5;Plotpp*agrp;Run;6-5解:TITLE'多類結(jié)果的logistic回歸,;DATAex6_5;INPUTyx1x2f;y1=2-y;CARDS;0006580103001701121001301108101111122001562104201142113PROCCATMOD;WEIGHTf;DIRECTx1x2;MODELy1=x1x2/FREQONEWAYCOVBCORRB;RUN;檢驗睪丸癌與隱睪癥的同側(cè)性和異側(cè)性,需比較不同變量之間的系數(shù),SAS無法解決,建議使用stata6-6解:Titleex6-6;InputtreatbangagedressingheaIfreqCards;0000190001400014001021001130012201009010180102601101001111001125RUN;Proclogistiicdescending;101110110110111012012012012Freqfreq;Modelheal=treatbangagedressing/clodds=waId;Run;Proccatmod;Weightfreq;Directtreatbandagedressing;Responsealogits;Modelheal=_response_treatbandagedressing;Run;6-7解:TITLE'1:3配對資料條件logistic回歸':DATAex6_7;INPUTmatchobsIowageI毗smokehtuiptI:time=2Tow;CARDS;111161300000120161120000130161351000140169500002911321051000292032121000029303213200002940321341001PROCPHREG;MODELtime*low(0)=lwtsmokehtuiptI/TIES二DISCRETE;

7-2DATAexp7_2;INPUTyx;CARDS;2-1TOC\o"1-5"\h\z3 -10000112115 1■PROCGENMOD;INTERCEPT二MODELy=x/DIST=POISSONLINK二id INITIALINTERCEPT二ITPRINT;Run;T7_3解答DATAex7_3;INPUTyquaIityyanzhengagecenterf;IFquaIity=1Jyanzhneg=1THENbingsi=1;IFquaIity=2IFquaIity二1IFquaIity=2CARDS;3yanzhneg二1Jyanzhneg=2Jyanzhneg=2THENbingsi二2;THENbingsi=3;THENbingsi=4;21140213311022PROCGENMOD;FREQf;MODELy=bingsiagecenter/L

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論