統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)(完整)_第1頁
統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)(完整)_第2頁
統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)(完整)_第3頁
統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)(完整)_第4頁
統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)(完整)_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

本文格式為Word版,下載可任意編輯——統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)(完整)根本統(tǒng)計(jì)方法第一章

概論1、總體(Population):根據(jù)研究目確實(shí)定的同質(zhì)對(duì)象的全體(集合);樣本(Sample):從總體中隨機(jī)抽取的片面具有代表性的研究對(duì)象。

2、參數(shù)(Parameter):反映總體特征的統(tǒng)計(jì)指標(biāo),如總體均數(shù)、標(biāo)準(zhǔn)差等,用希臘字母表示,就是固定的常數(shù);統(tǒng)計(jì)量(Statistic):反映樣本特征的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、標(biāo)準(zhǔn)差等,采用拉丁字字母表示,就是在參數(shù)鄰近波動(dòng)的隨機(jī)變量。

3、統(tǒng)計(jì)資料分類:定量(計(jì)量)資料、定性(計(jì)數(shù))資料、等級(jí)資料。

其次章

計(jì)量資料統(tǒng)計(jì)描述1、集中趨勢(shì):均數(shù)(算術(shù)、幾何)、中位數(shù)、眾數(shù)2、離散趨勢(shì):極差、四分位間距(QR=P75-P25)、標(biāo)準(zhǔn)差(或方差)、變異系數(shù)(CV)3、正態(tài)分布特征:①X軸上方關(guān)于X=對(duì)稱的鐘形曲線;②X=時(shí),f(X)取得最大值;③有兩個(gè)參數(shù),位置參數(shù)與形態(tài)參數(shù);④曲線下面積為1,區(qū)間的面積為68、27%,區(qū)間1、96的面積為95、00%,區(qū)間2、58的面積為99、00%。

4、醫(yī)學(xué)參考值范圍的制定方法:正態(tài)近似法:/2XuS;百分位數(shù)法:P2、5-P97、5。

第三章章

總體均數(shù)估計(jì)與假設(shè)檢驗(yàn)1、抽樣誤差(SamplingError):由個(gè)體變異產(chǎn)生、隨機(jī)抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差異。抽樣誤差不成制止,產(chǎn)生的根本理由就是生物個(gè)體的變異性。

2、均數(shù)的標(biāo)準(zhǔn)誤(StandarderrorofMean,SEM):樣本均數(shù)的標(biāo)準(zhǔn)差,計(jì)算公式:/Xn。反映樣本均數(shù)間的離散程度,說明抽樣誤差的大小。

3、降低抽樣誤差的途徑有:①通過增加樣本含量n;②通過設(shè)計(jì)裁減S。

4、t分布特征:①單峰分布,以0為中心,左右對(duì)稱;②形態(tài)取決于自由度,越小,t值越分散,t分布的峰部越矮而尾部翹得越高;③當(dāng)迫近,XS迫近X,t分布迫近u分布,故標(biāo)準(zhǔn)正態(tài)分布就是t分布的特例。

5、置信區(qū)間(ConfidenceInterval,CI):按預(yù)先給定的概率(1-)確定的包含總體參數(shù)的一個(gè)范圍,計(jì)算公式:/2,XXtS或/2,XXuS。95%CI含義:從固定樣本含量的已知總體中舉行重復(fù)抽樣試驗(yàn),根據(jù)每個(gè)樣本可得到一個(gè)置信區(qū)間,那么平均有95%的置信區(qū)間包含了總體參數(shù)。

6、假設(shè)檢驗(yàn)的根本原理:小概率反證法的思想。

①反證法:從問題的對(duì)立面(H0)啟程間接判斷要解決的問題(H1)就是否成立。

②小概率事情:在H0成立的條件下計(jì)算檢驗(yàn)統(tǒng)計(jì)量,根據(jù)概率分布確定檢驗(yàn)水準(zhǔn)下P值

大小,判斷就是否為小概率事情(通常P視為小概率事情,通常取),就是那么拒絕H0,采納H1;否那么尚不能拒絕H0。

7、假設(shè)檢驗(yàn)一般步驟:①建立假設(shè)(反證法,H0與H1),確定檢驗(yàn)水準(zhǔn)();②計(jì)算統(tǒng)計(jì)量:u,t,F;③確定概率值P,做出推斷結(jié)論。

8、t檢驗(yàn)需得志的條件:對(duì)比的兩個(gè)樣本相互獨(dú)立、均按照正態(tài)分布。

9、、P的含義:就是指從H0規(guī)定的總體隨機(jī)抽樣,抽得等于及大于(或/與等于及小于)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量(如t、u等)值的概率。

10、ⅠⅠ型錯(cuò)誤(TypeⅠerror):拒絕了實(shí)際上成立的H0,這類"棄真'的錯(cuò)誤稱為Ⅰ型錯(cuò)誤,Ⅰ型錯(cuò)誤的大小為檢驗(yàn)水準(zhǔn)。

Ⅱ型錯(cuò)誤(TypeⅡerror):采納了實(shí)際上不成立的H0,這類"存?zhèn)?的錯(cuò)誤稱為Ⅱ型錯(cuò)誤,Ⅱ型錯(cuò)誤的大小用表示,1-表示檢驗(yàn)效能。

越小,越大,增大樣本量可以同時(shí)降低與。

11、、置信區(qū)間與假設(shè)檢驗(yàn)的識(shí)別與聯(lián)系:①可以通過判斷置信區(qū)間就是否包含零假設(shè),判斷單樣本均數(shù)就是否來自已知的總體;②置信區(qū)間不但能回復(fù)區(qū)別有無統(tǒng)計(jì)學(xué)意義,還可提示區(qū)別有無實(shí)際意義。③假設(shè)檢驗(yàn)可供給置信區(qū)間不能供給的信息,如P值與檢驗(yàn)效能等。

第四章章

方差分析1、方差分析的根本思想:根據(jù)研究目的與設(shè)計(jì)類型,把全體測(cè)量值的總變異按照處理因素與水對(duì)等分解成兩片面(組內(nèi)變異與組間變異)或更多片面,同時(shí)把對(duì)自由度相應(yīng)舉行分解,再舉行對(duì)比,評(píng)價(jià)由處理因素引起的變異就是否具有統(tǒng)計(jì)學(xué)意義。

2、、方差分析的應(yīng)用條件:各樣本就是相互獨(dú)立的隨機(jī)樣本,均來自正態(tài)分布的總體,各樣本的總體方差相等(具有方差齊性)。

3、方差分析表:變異來源SSMSFP組間變異ag-1a/(g-1)MS組間/MS組內(nèi)

組內(nèi)變異bN-gb/(N-g)

總變異a+bN-1

4、g=2時(shí),隨機(jī)區(qū)組設(shè)計(jì)的方差分析與配對(duì)設(shè)計(jì)資料t檢驗(yàn)等價(jià),tF。

5、多個(gè)樣本均數(shù)間的多重對(duì)比:①LSD-t檢驗(yàn),即最小顯著差異t檢驗(yàn),適用于一對(duì)或幾對(duì)在專業(yè)上有特殊意義的樣本均數(shù)間的對(duì)比;②Dunnett-t檢驗(yàn):適用于g-1個(gè)測(cè)驗(yàn)組與一個(gè)對(duì)照組均數(shù)區(qū)別的多重對(duì)比;③SNK-q檢驗(yàn):適用于多個(gè)樣本均數(shù)兩兩之間的全面對(duì)比。

第五章章

計(jì)數(shù)資料的統(tǒng)計(jì)描述1、相對(duì)數(shù)的類型:強(qiáng)度相對(duì)數(shù)(率,如死亡率、發(fā)病率等);布局相對(duì)數(shù)(構(gòu)成比);相比較(如性別比等)2、應(yīng)用相對(duì)數(shù)的留神事項(xiàng):①布局相對(duì)數(shù)不能代替強(qiáng)度相對(duì)數(shù);②計(jì)算相對(duì)數(shù)應(yīng)有足夠的數(shù)量;③正確計(jì)算合計(jì)率;④留神資料的可比性;⑤比較不同時(shí)期資料應(yīng)留神客觀條件就是否一致;⑥樣本率(或構(gòu)成比)的抽樣誤差。

3、標(biāo)準(zhǔn)化率(Standardizationrate):采用標(biāo)準(zhǔn)化法舉行計(jì)算,消釋數(shù)據(jù)內(nèi)部構(gòu)成的差異,使標(biāo)化后的合計(jì)率具有可比性,這種經(jīng)過標(biāo)化后的合計(jì)率稱為標(biāo)準(zhǔn)化率。

4、、標(biāo)準(zhǔn)化率的留神事項(xiàng):①只適用于內(nèi)部構(gòu)成不同,影響總率的可比性的問題;②選擇的標(biāo)準(zhǔn)不同,計(jì)算得到的標(biāo)準(zhǔn)化率也不同,多個(gè)標(biāo)準(zhǔn)化率對(duì)比時(shí),應(yīng)選同一標(biāo)準(zhǔn);③標(biāo)準(zhǔn)化率已經(jīng)不再

反映當(dāng)?shù)氐膶?shí)際水平;④樣本標(biāo)準(zhǔn)化率就是樣本值,存在抽樣誤差。對(duì)比兩樣本標(biāo)準(zhǔn)化率,當(dāng)樣本量較小時(shí),需做假設(shè)檢驗(yàn)。

第六章章

幾種離散型變量的分布及應(yīng)用1、二項(xiàng)分布X~B(n,)的適用條件:①每次試驗(yàn)只發(fā)生兩種對(duì)立的可能結(jié)果之一;②每次試驗(yàn)產(chǎn)生某結(jié)果的概率固定不變;③重復(fù)試驗(yàn)就是相互獨(dú)立的。

2、二項(xiàng)分布的性質(zhì):①陽性次數(shù)X的總體均數(shù)(n)、標(biāo)準(zhǔn)差((1)n);②樣本率p的均數(shù)(p)、標(biāo)準(zhǔn)差((1)pppSn,即率的標(biāo)準(zhǔn)誤)。③二項(xiàng)分布的正態(tài)近似條件:np與與n(1-p)均大于5。

3、泊松分布X~P()的性質(zhì):①總體均數(shù)與總體方差2相等;②當(dāng)n很大,很小,且np=為常數(shù)時(shí),二項(xiàng)分布近似泊松分布;③20時(shí),泊松分布近似正態(tài)分布;④泊松分布具備可加性。

第七章章

2檢驗(yàn)1、2檢驗(yàn)的根本思想根據(jù)2分布特征通過對(duì)比實(shí)際頻數(shù)與理論頻數(shù)的差異確定在成立的條件下該差異由抽樣誤差造成就是否為小概率事情進(jìn)而判斷差異就是否具有統(tǒng)計(jì)學(xué)意義。

2值反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合程度。2、、RC列聯(lián)表中的各格子T1,并且1T<5的格子數(shù)不宜超過1/5格子總數(shù),否那么可能產(chǎn)生偏差。處理方法有三種:①增加樣本量,使理論頻數(shù)增大;②根據(jù)專業(yè)學(xué)識(shí),刪除或合并行列;③采用Fisher切當(dāng)概率法分析。

3、有序分組資料表線性趨勢(shì)檢驗(yàn):①雙向無序的的RC列聯(lián)表:多個(gè)樣本率的對(duì)比采用RC列聯(lián)表的2檢驗(yàn);兩個(gè)分類變量的關(guān)聯(lián)性分析那么采用RC列聯(lián)表的2檢驗(yàn)與Pearson列聯(lián)系數(shù)舉行分析。

②單向有序的的RC列聯(lián)表:行有序而列無序:RC列聯(lián)表的2檢驗(yàn);行無序而列有序,采用Wilcoxon秩與檢驗(yàn)。

③的雙向有序?qū)傩砸恢碌腞C列聯(lián)表:配對(duì)四格表的擴(kuò)展,采用一致性檢驗(yàn)(Kappa檢驗(yàn))。

④雙向有序?qū)傩圆坏耐腞C列聯(lián)表:樣本率的對(duì)比采用Wilcoxon秩與檢驗(yàn);相關(guān)性分析采用Spearman相關(guān)分析;線性變化趨勢(shì)分析采用有序分組資料的線性趨勢(shì)檢驗(yàn)或CMH2檢驗(yàn)等。

第八章章

非參數(shù)檢驗(yàn)1、秩與檢驗(yàn)的適用范圍:①總體分布偏態(tài)的計(jì)量資料;②數(shù)據(jù)兩端有不確定值;③等級(jí)資料;④各組離散程度相差懸殊,總體方差不齊的資料。

2、非參數(shù)檢驗(yàn)對(duì)總體分布的外形區(qū)別不敏感,只對(duì)總體分布位置區(qū)別敏感;非參數(shù)檢驗(yàn)沒有充分利用資料信息,較參數(shù)檢驗(yàn)的檢驗(yàn)效低。故能用參數(shù)檢驗(yàn)盡量采用參數(shù)檢驗(yàn),不得志參數(shù)檢驗(yàn)條件才使用非參數(shù)檢驗(yàn)。

3、不同數(shù)據(jù)類型的統(tǒng)計(jì)分析路徑:(1)樣本均數(shù)與總體均數(shù)的對(duì)比:正態(tài),樣本均數(shù)與總體均數(shù)的t檢驗(yàn);非正態(tài),Wilcoxon符號(hào)秩檢驗(yàn)。

(2)兩樣本均數(shù)對(duì)比:①獨(dú)立正態(tài):兩獨(dú)立樣本t檢驗(yàn);②獨(dú)立非正態(tài):兩獨(dú)立樣本的Wilcoxon秩

與檢驗(yàn);③配對(duì)設(shè)計(jì)差值正態(tài),配對(duì)t檢驗(yàn);④配對(duì)設(shè)計(jì)差值非正態(tài),Wilcoxon符號(hào)秩檢驗(yàn)。

(3)多樣本均數(shù)對(duì)比:①獨(dú)立正態(tài)(方差齊),方差分析;②獨(dú)立非正態(tài)Kruskal-WailsH檢驗(yàn);③非獨(dú)立正態(tài),重復(fù)測(cè)量資料的方差分析;④非獨(dú)立非正態(tài),FriedmanM檢驗(yàn)第九章章

雙變量回歸與相關(guān)1、直線回歸應(yīng)得志的條件:自變量與因變量呈線性關(guān)系、查看值之間相互獨(dú)立、因變量Y隨機(jī)正態(tài)、對(duì)任何X因變量Y的標(biāo)準(zhǔn)差相等。直線回歸方程的一般形式為:YabX,a為截距,b為回歸系數(shù),回歸系數(shù)的估計(jì)采用最小二乘法原那么(LeastSquaresMethod,使殘差平方與最小)舉行估計(jì)。

2、抉擇系數(shù)(coefficientofdetermination):回歸平方與與總平方與的比值,R2=SS回/SS總。R2取值0~1之間無單位,其數(shù)值大小反映回歸付出的相對(duì)程度,即總變異中回歸模型能夠解釋的百分比。

3、秩相關(guān)的應(yīng)用適用范圍:(1)不按照雙變量正態(tài)分布而不宜作Pearson相關(guān)分析;(2)總體分布型未知;(3)等級(jí)資料的相關(guān)分析。

4、相關(guān)與回歸的識(shí)別與聯(lián)系識(shí)別(1)識(shí)別:①資料:回歸分析資料要求Y為正態(tài)隨機(jī)變量,X為選定變量;相關(guān)分析資料X、Y按照雙變量正態(tài)分布。

②應(yīng)用:回歸分析就是由一個(gè)變量值推算另一個(gè)變量值(依存關(guān)系);相關(guān)分析只反映兩個(gè)變量間的相互關(guān)系。

③回歸系數(shù)b與原度量單位有關(guān),而相關(guān)系數(shù)r無關(guān)。b的十足值越大,回歸直線越陡,即X變化1個(gè)單位時(shí)Y的平均變化越大;r的十足值越大,全體點(diǎn)越趨近于一條直線,兩變量的關(guān)系越緊密,相關(guān)度越高。

(2)聯(lián)系:①r與b值可相互換算,YYXXllbr;②r與b正負(fù)號(hào)一致;③r與b的假設(shè)檢驗(yàn)等價(jià):對(duì)于同一資料brtt,檢驗(yàn)完全等價(jià);④回歸可解釋相關(guān)。相關(guān)系數(shù)的平方r2(抉擇系數(shù))就是回歸平方與與總的離均差平方與之比(SS回/SS總)。

5、應(yīng)用直線回歸時(shí)的留神事項(xiàng)(1)作回歸分析要有實(shí)際意義,不能把毫無關(guān)聯(lián)的兩種現(xiàn)象作回歸分析,務(wù)必對(duì)兩種現(xiàn)象間的內(nèi)在聯(lián)系有所熟悉。

(2)在舉行直線回歸分析之前,應(yīng)繪制散點(diǎn)圖,當(dāng)查看點(diǎn)的分布有直線趨勢(shì)時(shí),才適合作直線回歸分析,散點(diǎn)圖還能提示資料有無奇怪點(diǎn)。奇怪點(diǎn)的存在往往對(duì)方程中的系數(shù)(a、b)的估計(jì)產(chǎn)生較大影響。因此,需對(duì)奇怪點(diǎn)舉行復(fù)查。

(3)建立直線回歸方程后,要對(duì)系數(shù)舉行假設(shè)檢驗(yàn),以確定回歸方程有無意義。

(4)直線回歸方程的適用范圍一般以自變量的取值范圍為限,制止外延。獲得自變量值的手段也應(yīng)與建立方程時(shí)一致。否那么會(huì)產(chǎn)生較大偏差。

第十章章

統(tǒng)計(jì)表與統(tǒng)計(jì)圖

1、統(tǒng)計(jì)表的根本要求求(1)標(biāo)題:概括表的主要內(nèi)容(時(shí)間、地點(diǎn)、研究?jī)?nèi)容等),放在表的上方。表編號(hào)與標(biāo)題間間隔一個(gè)漢字距離;如整個(gè)表指標(biāo)統(tǒng)一,還應(yīng)將指標(biāo)的單位標(biāo)在標(biāo)題后面。

(2)標(biāo)目:分別用橫標(biāo)目與縱標(biāo)目說明每行與每列內(nèi)容或數(shù)字的意義,標(biāo)明指標(biāo)的單位。通常描述的對(duì)象為橫標(biāo)目,內(nèi)容(指標(biāo))為縱標(biāo)目,從左向右讀可以構(gòu)成完整的一句話。

(3)線條:至少用3條線:頂線、底線與縱標(biāo)目線。頂線與底線將表格與文章其她片面分隔開,縱標(biāo)目線將標(biāo)目的文字區(qū)與表格的數(shù)字區(qū)隔開,還可用橫線將合計(jì)與兩重縱標(biāo)目隔開,其她豎線與斜線一概省去。頂線與底線線條粗細(xì)一般為1、5磅,其她線條一般為0、5磅。

(4)數(shù)字:用阿拉伯?dāng)?shù)字表示。多數(shù)字用"'表示,缺失數(shù)字用"'表示,數(shù)值為0者記為"0',不留空項(xiàng)。數(shù)字按小數(shù)點(diǎn)位數(shù)對(duì)齊,同一指標(biāo)最好留存一致位數(shù)的小數(shù)位數(shù)。

(5)備注:表中數(shù)字區(qū)不要插入文字。務(wù)必說明者表"*',在表下方以備注的形式說明。

高級(jí)統(tǒng)計(jì)方法第十二章章

重復(fù)測(cè)量資料的方差分析1、重復(fù)測(cè)量設(shè)計(jì)與隨機(jī)區(qū)組設(shè)計(jì)的識(shí)別:(1)重復(fù)測(cè)量設(shè)計(jì)中"處理'就是在區(qū)組(受試者)間隨機(jī)調(diào)配,區(qū)組內(nèi)的各時(shí)間點(diǎn)就是固定的,不能隨機(jī)調(diào)配;(2)重復(fù)測(cè)量設(shè)計(jì)區(qū)組內(nèi)測(cè)驗(yàn)單位彼此不獨(dú)立;2、球?qū)ΨQ(sphericity):全體兩兩時(shí)間點(diǎn)變量間差值對(duì)應(yīng)的方差相等,即重復(fù)測(cè)量的誤差的協(xié)方差經(jīng)正交比較變換后與單位矩陣成比例。

3、重復(fù)測(cè)量資料方差分析的資料條件:(1)正態(tài)性:處理因素的各水平樣本個(gè)體間就是相互獨(dú)立的隨機(jī)樣本,其總體均數(shù)按照正態(tài)分布(個(gè)體間獨(dú)立,個(gè)體內(nèi)不獨(dú)立);(2)方差齊性:相互對(duì)比的各處理水平的總體方差相等,即具有方差齊同;(3)各時(shí)間點(diǎn)組成的協(xié)方差陣具有球形性特征。

第十五章章

多元線性回歸分析1、偏回歸系數(shù)(partialregressioncoefficient):多元線性回歸模型中自變量Xj的系數(shù)j,表示在其她自變量保持不變時(shí),Xj增加或裁減一個(gè)單位就是Y的平均變化量。

2、、復(fù)相關(guān)系數(shù)(multiplecorrelationcoefficient):2RR,表示因變量Y與多個(gè)自變量的線性相關(guān)程度,也就是查看值Y與估計(jì)值Y之間的相關(guān)程度。若只有一個(gè)自變量,Rr。

3、標(biāo)準(zhǔn)化回歸系數(shù):對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化后得到的標(biāo)準(zhǔn)化回歸方程的回歸系數(shù)即為標(biāo)準(zhǔn)化回歸系數(shù),jjjYSbbS,用來對(duì)比各個(gè)自變量jX對(duì)Y的影響強(qiáng)度,在有統(tǒng)計(jì)學(xué)意義的前提下,標(biāo)準(zhǔn)化回歸系數(shù)的十足值越大說明相應(yīng)自變量對(duì)Y的作用越大。

4、多元線性回歸模型(01122mmYXXXe)應(yīng)得志的條件:①Y與X1,X2,,Xm之間具有線性關(guān)系;②各例查看值Yi相互獨(dú)立;③殘差e按照正態(tài)分布。

5、啞變量(dummyvariable):在多元線性回歸模型中,當(dāng)自變量為多分類變量(g個(gè)水平)時(shí),

需要將原來的多分類變量轉(zhuǎn)化為(g-1)個(gè)啞變量并舉行編碼,每個(gè)啞變量只代表兩個(gè)級(jí)別或多個(gè)級(jí)別間的差異。

應(yīng)用啞變量時(shí)要留神:①啞變量同時(shí)存在,其統(tǒng)計(jì)學(xué)意義就是相對(duì)而言的,不能采用常規(guī)的逐步回歸舉行變量選擇;②可采用加與不參與啞變量的偏回歸平方與F檢驗(yàn)確定啞變量有無意義。

6、、多重共線性(collinearity):某些自變量間存在較強(qiáng)的線性關(guān)系,使得一個(gè)或幾個(gè)自變量可以由另外的自變量的線性關(guān)系表示,那么該變量與另外的自變量間存在多重共線性。多重共線性可能導(dǎo)致回歸方程不穩(wěn)定、參數(shù)估計(jì)值標(biāo)準(zhǔn)誤變得很大、t檢驗(yàn)不切實(shí)、估計(jì)值的正負(fù)符號(hào)與實(shí)際不符等。

7、交互作用:當(dāng)某一自變量對(duì)因變量的作用大小與另一自變量的取值有關(guān),那么這兩個(gè)自變量有交互作用。就是否考慮交互作用主要靠專業(yè)學(xué)識(shí)判斷。為了檢驗(yàn)兩個(gè)自變量就是否具有交互作用,普遍的做法就是在模型中參與它們的乘積項(xiàng)(作為交互項(xiàng))。

8、線性回歸分析的SAS結(jié)果解釋:

(1)線性回歸方程:2.994220.99733Yx;(2)該線性回歸模型的統(tǒng)計(jì)學(xué)檢驗(yàn)結(jié)果:模型的方差分析統(tǒng)計(jì)量F=6、91,P=0、0303<0、05,說明該線性回歸模型具有統(tǒng)計(jì)學(xué)意義。

(3)R-Square=0、46353的意義:該線性回歸模型可以解釋因變量Y的總變異的46、353%;(4)回歸系數(shù)估計(jì)值b=0、99733的意義:表示X對(duì)Y影響的大小,X每變更一個(gè)單位,Y變更0、99733個(gè)單位;其假設(shè)檢驗(yàn)結(jié)果合方差分析結(jié)果的聯(lián)系:方差分析結(jié)果說明X與Y之間存在的線性關(guān)系,t檢驗(yàn)結(jié)果說明計(jì)算得到的回歸系數(shù)b有統(tǒng)計(jì)學(xué)意義,在此問題中,二者就是等價(jià)的,均說明該回歸模型具有統(tǒng)計(jì)學(xué)意義。

(5)相關(guān)系數(shù)及其檢驗(yàn)結(jié)果并解釋該結(jié)果:r=0、68073,對(duì)r舉行t檢驗(yàn)得到P=0、0303<0、05,那么該相關(guān)系數(shù)具有統(tǒng)計(jì)學(xué)意義,說明X與Y之間具有中等強(qiáng)度的正相關(guān)關(guān)系。

第十六章章

Logistic回歸分析

1、logistic回歸模型一般形式:011lnlogit()exp()1mmPPXXP。將某事情的陽性與陰性結(jié)果概率之比去自然對(duì)數(shù)稱為logit變換,記為logit(P)。

2、回歸系數(shù)j采用最大似然估計(jì)(maximumlikelihoodestimate,MLE,使在一次抽樣中獲得現(xiàn)有樣本的概率最大)得到表示自變量Xj變更一個(gè)單位時(shí)logitP的變更量。多變量調(diào)整后的優(yōu)勢(shì)比exp()jjOR,表示扣除了其她自變量的影響后危害因素的作用。ORj=1,說明Xj對(duì)疾病發(fā)生不起作用ORj>1,說明Xj就是一個(gè)危害因素;ORj<1,說明Xj就是一個(gè)養(yǎng)護(hù)因素,ORj的1可信區(qū)間為:/2exp()jjbbuS。

3、logistic回歸模型假設(shè)檢驗(yàn)的方法:似然比法(102(lnln)GLL,適合單個(gè)與多個(gè)自變量的假設(shè)檢驗(yàn))、Wald檢驗(yàn)(jjbbuS或22jjbbS,適合單個(gè)自變量的假設(shè)檢驗(yàn))與計(jì)分檢驗(yàn)(適合樣本量較小的處境)。變量篩選的方法:前進(jìn)法、后退法、逐步法。

4、條件logistic回歸:適用于1:M配對(duì)設(shè)計(jì)資料,條件似然函數(shù)估計(jì)的就是在M+1個(gè)查看對(duì)象中恰好第一個(gè)查看對(duì)象屬于病例組的條件概率,它只估計(jì)了表示危害因素作用的j,表示匹配組效應(yīng)的常數(shù)項(xiàng)0被消去。

5、有序logistic回歸基于累積概率構(gòu)建回歸模型,g個(gè)類別的因變量Y的有序logistic回歸包括g-1個(gè)方程,這些方程的回歸系數(shù)均一致,區(qū)別主要表達(dá)在各方程的常數(shù)項(xiàng)0不同。在對(duì)因變量Y賦值時(shí),應(yīng)將專業(yè)上最不利的等級(jí)賦最小值,最有利的等級(jí)賦最大值。

6、多分類logistic回歸就是二分類logistic回歸的擴(kuò)展,即選擇一個(gè)參照類別,擬合剩余各類別相對(duì)于參照類別的logistic回歸模型。

第十七章章

生存分析1、生存分析的數(shù)據(jù)特點(diǎn):(1)同時(shí)考慮生存時(shí)間與生存結(jié)局;(2)通常含有刪失數(shù)據(jù)(censoring,可能的理由:①研究截止但終點(diǎn)事情仍未展現(xiàn);②失去聯(lián)系或其她理由導(dǎo)致失訪;③死于其她"事情');(3)生存時(shí)間的分布通常不按照正態(tài)分布。

2、、統(tǒng)計(jì)學(xué)分析方法:由于生存時(shí)間一般不呈正態(tài)分布,且需考慮就是否為刪失值,所以生存分析有其獨(dú)特的統(tǒng)計(jì)方法。

(1)非參數(shù)法:①生存率的估計(jì)采用Kaplan-Meier法、壽命表法(頻數(shù)表資料);②兩組或多組生存率的對(duì)比,常用log-rank檢驗(yàn)(時(shí)序法,權(quán)重1i,對(duì)查看后期區(qū)別敏感感)與Breslow檢驗(yàn)(權(quán)重iin,in為期初人數(shù),隨生存時(shí)間增大而逐步減小,Breslow檢驗(yàn)給查看早期區(qū)別更大權(quán)重,故對(duì)查看早期區(qū)別敏感)。

(2)半?yún)?shù)法:多因素生存分析常采用Cox比例風(fēng)險(xiǎn)模型(前提條件:假定風(fēng)險(xiǎn)比值h(t)/h0(t)為為固定值,即協(xié)變量對(duì)生存率的影響不隨時(shí)間的變更而變更。檢驗(yàn)此前提的方法:①分類協(xié)變量每組的K-M生存曲線無交錯(cuò);②協(xié)變量與生存時(shí)間的交互項(xiàng)無統(tǒng)計(jì)學(xué)意義等。其參數(shù)估計(jì)方法為最大似然法)。

(3)參數(shù)法:指數(shù)分布法、Weibull分布法等回歸模型。

3、多元線性回歸、logistic回歸與Cox回歸的一致點(diǎn)與不同點(diǎn)(1)一致點(diǎn):①自變量可為連續(xù)變量與多分類變量,多分類變量需啞變量化,啞變量在模型中就是一個(gè)整體,務(wù)必同時(shí)"進(jìn)'同時(shí)"出';②自變量間存在較強(qiáng)相關(guān)關(guān)系時(shí)可能導(dǎo)致多重共線性問題;③自變量間可能存在交互作用,模型中通常采用自變量的乘積作為交互項(xiàng);④均可采用逐步回歸篩選變量;⑤均可舉行影響因素分析、混雜因素校正、預(yù)料分析等。

(2)不同點(diǎn):

第十八、十九章章

判別分析與聚類分析1、判別分析(discriminantanalysis):根據(jù)一批分類明確的樣本在若干指標(biāo)上的查看值,建立一個(gè)關(guān)于指標(biāo)的判別函數(shù)與判別準(zhǔn)那么,然后根據(jù)這個(gè)判別函數(shù)與判別準(zhǔn)那么對(duì)新的樣本舉行分類,并且根據(jù)回代判別的切實(shí)率評(píng)估它的實(shí)用性。

2、Fisher判別準(zhǔn)那么:它使得類間點(diǎn)的距離最大,而類內(nèi)點(diǎn)的距離最小,適合于兩類的判別分析;Bayes判別準(zhǔn)那么:它使得每一類中的每個(gè)樣本都以最大的概率進(jìn)入該類,適合于多類的判別分析。

3、評(píng)估判別函數(shù)的判別效能:原始數(shù)據(jù)的分類要穩(wěn)當(dāng)切實(shí);指標(biāo)變量對(duì)判別函數(shù)的作用要顯著;判別函數(shù)的回代錯(cuò)判率與事后概率錯(cuò)誤率要小。

4、聚類分析(ClusterAnalysis):對(duì)于總體分類未知的一群事物依照"物以類聚'思想,把性質(zhì)相近的事物歸入同一類,而把性質(zhì)相差較大的事物歸入不同類的一種統(tǒng)計(jì)分析方法。

5、聚類分析與判別分析的識(shí)別與聯(lián)系(1)識(shí)別:①聚類分析可以對(duì)樣本舉行分類,也可以對(duì)指標(biāo)舉行分類;而判別分析只能對(duì)樣本舉行分類;②聚類分析事先不知道事物的類別,也不知道應(yīng)分幾類;而判別分析務(wù)必事先知道事物的類別,也知道應(yīng)分幾類;③聚類分析不需要分類的歷史資料,能直接對(duì)樣本舉行分類;而判別分析需要分類歷史資料去建立判別函數(shù),然后才能對(duì)樣本舉行分類。

(2)聯(lián)系:先采用聚類分析獲得各個(gè)個(gè)體的類別(classification);然后采用判別分析建立判別函數(shù),對(duì)新個(gè)體舉行類型識(shí)別((identification)第二十章章

主成分分析與因子分析1、主成分的性質(zhì)(1)主成分互不相關(guān);(2)主成分的付出率與累積付出率:付出率越大,說明主成分綜合原始指標(biāo)信息的才能越強(qiáng);累積付出率越高,說明前k個(gè)主成分綜合原始資料信息的比例越高;(3)主成分個(gè)數(shù)的選取:①以累計(jì)付出率確定:累積付出率70%為宜;②以特征根值大小確定:特征根值1。

(4)因子荷載:因子荷載反映主成分與原始指標(biāo)間緊密程度與作用方向;(5)樣品的主成分得分:根據(jù)主成分表達(dá)式計(jì)算樣品的主成分值,推斷與評(píng)價(jià)樣品的特性。

2、因子模型的性質(zhì):(1)公共度:共性方差反映全體原始指標(biāo)Xi對(duì)全體公因子的憑借程度;(2)因子付出及因子付出率:的值越大,那么Fj對(duì)原始指標(biāo)的影響越大;(3)因子荷載及因子荷載矩陣:因子荷載反映公因子與原始指標(biāo)間緊密程度與作用方向;2、主成分分析與因子分析的識(shí)別與聯(lián)系(1)聯(lián)系:①都就是根據(jù)變量之間內(nèi)部相關(guān)性來提取主要信息,獲得新的變量(公因子變量與主成分變量),達(dá)成裁減變量個(gè)數(shù)(降維)的目的;②主成分分析模型兩端同時(shí)乘以A,那么有X

AF,即為無特殊因子的公因子模型;③因子分析的結(jié)果(主成分解)即為主成分分析的結(jié)果,因子分析的主因子解也往往由主成分分析的結(jié)果作為的初始值計(jì)算。

(2)識(shí)別:主成分分析就是將m個(gè)原變量提取I(Im)個(gè)互不相關(guān)的主成分,切實(shí)計(jì)算各主成分的得分,其分析重點(diǎn)在于通過主成分綜合原始變量的信息;因子分析就是取提取I(Im)個(gè)支配原變量的共性因子與1個(gè)特殊因子,各因子之間可以互不相關(guān)或相關(guān),根據(jù)共性因子得分系數(shù)估計(jì)因子得分,其分析重點(diǎn)就是通過探索共性因子解釋原始變量之間的關(guān)系。

第二十一章章

典型相關(guān)分析1、典

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論