醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)梳理_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)梳理_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)梳理_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)梳理_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)梳理_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)梳理醫(yī)學(xué)統(tǒng)計(jì)學(xué):是用統(tǒng)計(jì)學(xué)原理和方法研究生物醫(yī)學(xué)問(wèn)題的一門學(xué)科。他包括了研究設(shè)計(jì)、數(shù)據(jù)收集、整理、分析以及分析結(jié)果的正確解釋和表達(dá)。統(tǒng)計(jì)描述:用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖表對(duì)資料的數(shù)量特征及分布規(guī)律進(jìn)行客觀的描述和 表達(dá)。統(tǒng)計(jì)推斷:在一定的置信度和概率保證下,用樣本信息推斷總體特征:參數(shù)估計(jì):用樣本的指標(biāo)去推斷總體相應(yīng)的指標(biāo)假設(shè)檢驗(yàn):由樣本的差異推斷總體之間是否可能存在的差異同質(zhì):一個(gè)總體中有許多個(gè)體,他們之所以共同成為人們研究的對(duì)象,必定存在共性,我們說(shuō)一些個(gè)體處于同一總體,就是指他們大同小異,具有同質(zhì)性。總體(population )是根據(jù)研究目的確定的同質(zhì)的觀察單位的全體,更確切的

2、說(shuō), 是同質(zhì)的所有觀察單位某種觀察值(變量值)的集合??傮w可分為有限總體和無(wú)限總體??傮w中的所有單位都能夠標(biāo)識(shí)者為有限總體,反之為無(wú)限總體。樣本:從總體中隨機(jī)抽取部分觀察單位,其測(cè)量結(jié)果的集合稱為樣本( sample ) 樣本應(yīng)具有代表性。所謂有代表性的樣本,是指用隨機(jī)抽樣方法獲得的樣本。隨機(jī)抽樣:隨機(jī)抽樣(random sampling )是指按照隨機(jī)化的原則(總體中每一個(gè) 觀察單位都有同等的機(jī)會(huì)被選入到樣本中),從總體中抽取部分觀察單位的過(guò)程。隨機(jī)抽樣是樣本具有代表性的保證。變異:在自然狀態(tài)下,個(gè)體間測(cè)量結(jié)果的差異稱為變異( variation )。變異是生物醫(yī)學(xué)研究領(lǐng)域普遍存在的現(xiàn)象。嚴(yán)

3、格的說(shuō),在自然狀態(tài)下,任何兩個(gè)患者或研究群體間都存在差異,其表現(xiàn)為各種生理測(cè)量值的參差不齊。(1)計(jì)量資料:對(duì)每個(gè)觀察單位用定量的方法測(cè)定某項(xiàng)指標(biāo)量的大小,所得的資 料稱為計(jì)量資料(measurement data )。計(jì)量資料亦稱定量資料、測(cè)量資料。 .其 變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。(2)計(jì)數(shù)資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數(shù)稱為計(jì)數(shù) 資料(count data )。計(jì)數(shù)資料亦稱定性資料或分類資料。其觀察值是定性的,表 現(xiàn)為互不相容的類別或?qū)傩浴?3)等級(jí)資料:將觀察單位按測(cè)量結(jié)果的某種屬性的不同程度分組,所得各組的 觀察單位數(shù),稱為等級(jí)資料(or

4、dinal data )。概率:概率(probability)又稱幾率,是度量某一隨機(jī)事件 A發(fā)生可能性大小的一個(gè)數(shù)值,記為P (A) , P (A)越大,說(shuō)明A事件發(fā)生的可能性越大。0<P (A) <1。頻率:在相同的條件下,獨(dú)立重復(fù)做n次試驗(yàn),事件A出現(xiàn)了 m次,則比值m/n稱 為隨機(jī)事件A在n次試驗(yàn)中出現(xiàn)的頻率(freqency)。當(dāng)試驗(yàn)重復(fù)很多次時(shí) P (A)= m/n。隨機(jī)誤差(random error )又稱偶然誤差,是指排除了系統(tǒng)誤差后尚存的誤差。它 受多種因素的影響,使觀察值不按方向性和系統(tǒng)性而隨機(jī)的變化。誤差變量一般服 從正態(tài)分布。隨機(jī)誤差可以通過(guò)統(tǒng)計(jì)處理來(lái)估計(jì)。

5、抽樣誤差(sampling error )是指樣本統(tǒng)計(jì)量與總體參數(shù)的差別。在總體確定的 情況下,總體參數(shù)是固定的常數(shù),統(tǒng)計(jì)量是在總體參數(shù)附近波動(dòng)的隨機(jī)變量。系統(tǒng)誤差:系統(tǒng)誤差(systematic error)是指由于儀器未校正、測(cè)量者感官的某種偏差、醫(yī)生掌握療效標(biāo)準(zhǔn)偏高或偏低等原因,使觀察值不是分散在真值的兩側(cè),而 是有方向性、系統(tǒng)性或周期性地偏離真值。系統(tǒng)誤差可以通過(guò)實(shí)驗(yàn)設(shè)計(jì)和完善技術(shù) 措施來(lái)消除或使之減少。隨機(jī)變量:隨機(jī)變量(random variable )是指取指不能事先確定的觀察結(jié)果。隨 機(jī)變量的具體內(nèi)容雖然是各式各樣的,但共同的特點(diǎn)是不能用一個(gè)常數(shù)來(lái)表示,而 且,理論上講,每個(gè)變

6、量的取值服從特定的概率分布。參數(shù):參數(shù)(paramater )是指總體的統(tǒng)計(jì)指標(biāo),如總體均數(shù)、總體率等。總體參 數(shù)是固定的常數(shù)。多數(shù)情況下,總體參數(shù)是不易知道的,但可通過(guò)隨機(jī)抽樣抽取有 代表性的樣本,用算得的樣本統(tǒng)計(jì)量估計(jì)未知的總體參數(shù)。統(tǒng)計(jì)量:統(tǒng)計(jì)量(statistic )是指樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、樣本率等。樣 本統(tǒng)計(jì)量可用來(lái)估計(jì)總體參數(shù)。總體參數(shù)是固定的常數(shù),統(tǒng)計(jì)量是在總體參數(shù)附近 波動(dòng)的隨機(jī)變量。頻數(shù)表(frequency table )用來(lái)表示一批數(shù)據(jù)各觀察值或在不同取值區(qū)間的出現(xiàn) 的頻繁程度(頻數(shù))。算術(shù)均數(shù)(arithmetic mean )描述一組數(shù)據(jù)在數(shù)量上的平均水平???/p>

7、體均數(shù)用 表示,樣本均數(shù)用 X表示。幾何均數(shù)(geometric mea。用以描述對(duì)數(shù)正態(tài)分布或數(shù)據(jù)呈倍數(shù)變化資料的水平。記為G。中位數(shù)(median) Md將一組觀察值由小到大排列,n為奇數(shù)時(shí)取位次居中的變量值; 為偶數(shù)時(shí),取位次居中的兩個(gè)變量的平均值。 反映一批觀察值在位次上的平均水平。極差(range)亦稱全距,即最大值與最小值之差,用于資料的粗略分析,其計(jì)算 簡(jiǎn)便但穩(wěn)定性較差。百分位數(shù)(percentile )是將n個(gè)觀察值從小到大依次排列,再把它們的位次依次轉(zhuǎn)化為百分位。百分位數(shù)的另一個(gè)重要用途是確定醫(yī)學(xué)參考值范圍。四分位數(shù)間距(inter-quartile range )是由第3四

8、分位數(shù)和第1四分位數(shù)相減計(jì)算而得,常與中位數(shù)一起使用,描述偏態(tài)分布資料的分布特征,較極差穩(wěn)定。方差(variance ):方差表示一組數(shù)據(jù)的平均離散情況,由離均差的平方和除以樣 本個(gè)數(shù)得到。標(biāo)準(zhǔn)差(standard deviation )是方差的正平方根,使用的量綱與原量綱相同,適 用于近似正態(tài)分布的資料,大樣本、小樣本均可,最為常用。變異系數(shù)(coefficient of variation)用于觀察指標(biāo)單位不同或均數(shù)相差較大時(shí)兩組資料變異程度的比較。用 CV表示。計(jì)算:標(biāo)準(zhǔn)差/均數(shù)*100%統(tǒng)計(jì)推斷:通過(guò)樣本指標(biāo)來(lái)說(shuō)明總體特征,這種從樣本獲取有關(guān)總體信息的過(guò)程稱為統(tǒng)計(jì)推斷(statisti

9、cal inference )。抽樣誤差:由個(gè)體變異產(chǎn)生的,抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差異,稱為抽樣誤差(sampling error )。標(biāo)準(zhǔn)誤及X s :通常將樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤(standard error of mean,SEM),它反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)的差異, 說(shuō)明均數(shù)抽樣誤差的大小??尚艆^(qū)間:按預(yù)先給定的概率確定的包含未知總體參數(shù)的可能范圍。該范圍稱為總 體參數(shù)的可信區(qū)間(confidence interval , CI)。參數(shù)估計(jì):指用樣本指標(biāo)值(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)值(參數(shù))。假設(shè)檢驗(yàn)中P的含義:指從H0規(guī)定的總體隨機(jī)抽得等于及

10、大于(或等于及小于) 現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量值的概率。I型錯(cuò)誤(type I error ),指拒絕了實(shí)際上成立的H0,這類“棄真”的錯(cuò)誤稱為I型錯(cuò)誤,其概率大小用a表示。II型錯(cuò)誤(type II error ),指接受了實(shí)際上不成立的H0,這類“存?zhèn)巍钡恼`稱為II型錯(cuò)誤,其概率大小用B表示。檢驗(yàn)效能:1- B稱為檢驗(yàn)效能(power of test ),它是指當(dāng)兩總體確有差別,按 規(guī)定的檢驗(yàn)水準(zhǔn)a所能發(fā)現(xiàn)該差異的能力。率(rate )又稱頻率指標(biāo),說(shuō)明一定時(shí)期內(nèi)某現(xiàn)象發(fā)生的頻率或強(qiáng)度。計(jì)算公式為:發(fā)生某現(xiàn)象的觀察單位數(shù)/可能發(fā)生某現(xiàn)象的觀察單位總數(shù) *100%,表示方式有:百分率(。%、

11、千分率(%。)等。構(gòu)成比(proportion )又稱構(gòu)成指標(biāo),說(shuō)明某一事物內(nèi)部各組成部分所占的比重或 分布。計(jì)算公式為:某一組成部分的觀察單位數(shù) /同一事物各組成部分的觀察單位總數(shù)*100%,表示方式有:百分?jǐn)?shù)等。比(ratio )又稱相對(duì)比,是 A、B兩個(gè)有關(guān)指標(biāo)之比,說(shuō)明 A是B的若干倍或百 分之幾。計(jì)算公式為:A/B ,表示方式有:倍數(shù)或分?jǐn)?shù)等。非參數(shù)統(tǒng)計(jì):針對(duì)某些資料的總體分布難以用某種函數(shù)式來(lái)表達(dá),或者資料的總體 分布的函數(shù)式是未知的,只知道總體分布是連續(xù)型的或離散型的,用于解決這類問(wèn) 題的一種不依賴總體分布的具體形式的統(tǒng)計(jì)分析方法。參數(shù)統(tǒng)計(jì):通常要求樣本來(lái)自總體分布型是已知的(如

12、正態(tài)分布),在這種假設(shè)的基礎(chǔ)上,對(duì)總體參數(shù)(如總體均數(shù))進(jìn)行估計(jì)和檢驗(yàn),稱為參數(shù)統(tǒng)計(jì)(parametricstatistics)秩次:變量值按照從小到大順序所編的秩序號(hào)稱為秩次( rank)。秩和:各組秩次的合計(jì)稱為秩和(rank sum ),是非參數(shù)檢驗(yàn)的基本統(tǒng)計(jì)量。直線回歸(linear regression)建立一個(gè)描述應(yīng)變量依自變量變化而變化的直線方程,并要求各點(diǎn)與該直線縱向距離的平方和為最小。直線回歸是回歸分析中最基 本、最簡(jiǎn)單的一種,故又稱簡(jiǎn)單回歸( simple regression )?;貧w系數(shù)(regression coefficient)即直線的斜率(slope),在直線回

13、歸方程中用b表示,b的統(tǒng)計(jì)意義為X每增(減)一個(gè)單位時(shí),Y平均改變b個(gè)單位。相關(guān)系數(shù)r:用以描述兩個(gè)隨機(jī)變量之間線性相關(guān)關(guān)系的密切程度與相關(guān)方向的統(tǒng) 計(jì)指標(biāo)二相關(guān)概念醫(yī)學(xué)科研數(shù)據(jù)統(tǒng)計(jì)分析大致分以下4個(gè)步驟。數(shù)據(jù)整理統(tǒng)計(jì)描述統(tǒng)計(jì)推斷結(jié)果表達(dá)頻數(shù)表的制作求全距R找到資料中的最大值 A和最小值B計(jì)算全距R,劃分組段確定組數(shù)確定組距確定各組段的上下限下限 (lower limit ) 上限 (upper limit )第一組段,其下限可取小于最小觀察值得數(shù)半開(kāi)半閉區(qū)間-,-)畫(huà)表頻數(shù)分布表和頻數(shù)分布圖的用途揭示頻數(shù)分布的特征集中趨勢(shì)集中趨勢(shì)是指一組數(shù)據(jù)向某一個(gè)位置聚集或集中的傾向。離散趨勢(shì)離散趨勢(shì)反映

14、的是一組數(shù)據(jù)的分散性和變異度,即各個(gè)數(shù)據(jù)離開(kāi)集中位置的程度便于觀察數(shù)據(jù)的分布類型正態(tài)分布集中趨勢(shì)的指標(biāo):均數(shù)離散趨勢(shì)的指標(biāo):標(biāo)準(zhǔn)差偏態(tài)分布集中趨勢(shì)的指標(biāo):中位數(shù)離散趨勢(shì)的指標(biāo):四分位間距算術(shù)平均數(shù)幾何平均數(shù)中位數(shù)M號(hào)XGM含義各觀察值相加除以觀N各觀察值的一組觀察值按順序排察值的個(gè)數(shù)所得之商。乘積開(kāi)n次方所得之根列,居中者。應(yīng)用條件正態(tài)或近似正態(tài)分布對(duì)數(shù)止態(tài)分布極偏態(tài)或分布小清的資料計(jì)算公式說(shuō)明加權(quán)法計(jì)算中X值的含義中位數(shù)為百分位數(shù)的特例標(biāo)準(zhǔn)差的意義和用途0.說(shuō)明資料的離散趨勢(shì)(或變異程度),標(biāo)準(zhǔn)差的值越大,說(shuō)明變異程度越大,均 數(shù)的代表性越差.標(biāo)準(zhǔn)差與原始數(shù)據(jù)的單位一致,在科技論文報(bào)告中,均

15、數(shù)與標(biāo)準(zhǔn)差經(jīng)常被同時(shí)用 來(lái)描述資料的集中趨勢(shì)與離散趨勢(shì)。0.用于計(jì)算變異系數(shù)1 .用于計(jì)算標(biāo)準(zhǔn)誤2 .結(jié)合均值與正態(tài)分布的規(guī)律,估計(jì)參考值的范圍。變異系數(shù) (coefficient of variation )適用范圍1觀察指標(biāo)單位不同,如身高、體重一一不同單位資料2均數(shù)相差懸殊變異系數(shù)的特點(diǎn)及相應(yīng)的用途沒(méi)有單位n反映標(biāo)準(zhǔn)差占均數(shù)的百分比或標(biāo)準(zhǔn)差是均數(shù)的幾倍n可用來(lái)比較度量衡單位不同的資料的變異度不受平均水平的影響n反映的是以均數(shù)為基數(shù)的相對(duì)變異的大小n比較均數(shù)相差懸殊的資料的變異度變異指標(biāo)小結(jié)1 .極差較粗,適合于任何分布2 .標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3 .變異系數(shù)

16、主要用于單位不同或均數(shù)相差懸殊資料4 .平均指標(biāo)和變異指標(biāo)分別反映資料的不同特征,常配套使用如一一正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;偏態(tài)分布:中位數(shù)、四分位間距相對(duì)數(shù)使用應(yīng)注意的問(wèn)題1 .根據(jù)需要正確選擇相對(duì)數(shù),常見(jiàn)錯(cuò)誤是以構(gòu)成比代率。2 .分母應(yīng)當(dāng)夠大。分母小于 20時(shí)可靠性較差。如果分母太小,宜用絕對(duì)數(shù)表示3 .計(jì)算觀察單位數(shù)不等的幾個(gè)率的平均率時(shí),不能將幾個(gè)率直接相加求平均率。4 .要注意其內(nèi)部構(gòu)成是否相同。若內(nèi)部構(gòu)成不同的資料,應(yīng)先進(jìn)行率的標(biāo)準(zhǔn)化后再 比。5 .根據(jù)樣本數(shù)據(jù)計(jì)算的強(qiáng)度相對(duì)數(shù),要考慮抽樣誤差的影響。中心極限定理 central limit theorem即使從非正態(tài)總體中抽取樣本,

17、所得均數(shù)分布仍近似呈正態(tài)。隨著樣本量的增大,樣本均數(shù)的變異范圍也逐漸變窄。標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤越大,樣本均數(shù)的分布越分散,樣本均數(shù)與總體均數(shù)的差別越大,抽樣誤差 越大,由樣本均數(shù)估計(jì)總體均數(shù)的可靠性越小。反之亦然。標(biāo)準(zhǔn)誤反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)的差異。標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比,當(dāng)總體中各觀測(cè)值變異很小時(shí),樣本均數(shù)與總體均數(shù)的差 異小,抽樣誤差小。標(biāo)準(zhǔn)誤 與樣本含量的平方根成反比,樣本含量越大,抽樣誤差越小t分布同一概率下,自由度越大,|t|越小;同一自由度下,|t|越大,概率P值越??;同一自由度下,雙側(cè)概率為單側(cè)概率的2倍時(shí),所對(duì)應(yīng)的t界值相等;當(dāng)自由度趨向于3時(shí)的t界值即為

18、相應(yīng)概率下的Z值。統(tǒng)計(jì)推斷的任務(wù)就是用樣本信息推論總體特征。1、點(diǎn)(值)估計(jì)一一( 近似值)一一用相應(yīng)的樣本統(tǒng)計(jì)量直接作為其總體參數(shù)的估計(jì)值。2、區(qū)間估計(jì)一一(近似范圍)一一按預(yù)先給定的概率(1- a)所確定的包含未知總體參數(shù)的一個(gè)范圍區(qū)別點(diǎn)總體均數(shù)可信區(qū)間參考值范圍含義按預(yù)先給定的概率,確定未知參數(shù)m的可 能范圍。實(shí)際上,一次抽樣算得的可信區(qū) 可要么包含了總體均數(shù), 要么不包含。但 可以說(shuō):當(dāng)a=時(shí),95%CI估計(jì)止確的概率 為,估計(jì)錯(cuò)誤的概率小于或等于,即有 95%勺可能性包含了總體均數(shù)?!罢H恕钡慕馄剩?理,生化某項(xiàng)指標(biāo)的波動(dòng) 范圍??傮w均數(shù)的波動(dòng)范圍個(gè)體值的波動(dòng)范圍“算 卜式s未知

19、n較小:s已知,或s未知但n>60:_一 八,,*止態(tài)分布:偏態(tài)分布:PXPi00-x用途總體均數(shù)的區(qū)間估計(jì)絕大多數(shù)(如95%)觀察對(duì)象某項(xiàng)指標(biāo)的分布范圍假設(shè)檢驗(yàn)有三個(gè)基本步驟: 建立假設(shè)和確定檢驗(yàn)水準(zhǔn),通常選計(jì)算檢驗(yàn)統(tǒng)計(jì)量確定P值和做出統(tǒng)計(jì)推斷結(jié)論所有的假設(shè)檢驗(yàn)都按照這三個(gè)步驟進(jìn)行,各種檢驗(yàn)方法的差別在于第步計(jì)算的 檢驗(yàn)統(tǒng)計(jì)量不同。H)和H的涵義及注意事項(xiàng)1.檢驗(yàn)假設(shè)是針對(duì)總體,而非樣本;和Hi是互相對(duì)立,不是可有可無(wú),而是缺一,不可;3 . H0無(wú)效假設(shè),通常是某兩個(gè)或多個(gè)總體參數(shù)相相同,或總體參數(shù)之差為0,或某資料服從某一分布等等;4 .假設(shè)檢驗(yàn)主要是圍繞 H0進(jìn)行的,當(dāng)H0被拒絕

20、時(shí),則接受 H5 .備選假設(shè)應(yīng)該按照實(shí)際世界所代表的方向來(lái)確定,即它通常是被認(rèn)為可能比零假設(shè)更符合數(shù)據(jù)所代表的現(xiàn)實(shí)。H的內(nèi)容反映出單側(cè)還是雙側(cè)即Hi成立,觀實(shí)際假設(shè)檢驗(yàn)的結(jié)果拒絕H0不拒絕H00成立I型錯(cuò)誤(a)推斷止確(1- a)0不成立推斷止確(1- b)II型錯(cuò)誤(b)減少I型錯(cuò)誤的主要方法:假設(shè)檢驗(yàn)時(shí)設(shè)定a值。減少II型錯(cuò)誤的主要方法:提高檢驗(yàn)效能。方差分析應(yīng)用條件:總體一一正態(tài)且方差相等樣本一一獨(dú)立、隨機(jī)方差分析的結(jié)果拒絕 H,接受H,不能說(shuō)明各組總體均數(shù)間兩兩都有差別。如果要分析哪些兩組間有差別,可進(jìn)行多個(gè)均數(shù)間的多重比較卡方檢驗(yàn)?zāi)康模和茢鄡蓚€(gè)總體率或構(gòu)成比之間有無(wú)差別多個(gè)總體率或

21、構(gòu)成比之間有無(wú)差別多個(gè)樣本率的多重比較兩個(gè)分類變量之間有無(wú)關(guān)聯(lián)性頻數(shù)分布擬合優(yōu)度的檢驗(yàn)。應(yīng)用:計(jì)數(shù)資料檢驗(yàn)統(tǒng)計(jì)量2值反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合程度。自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量 n0四格表資料只有兩行兩列,v=1,即在周邊合計(jì)數(shù)固定的t1況下,4個(gè)基本數(shù)據(jù)當(dāng)中只有一個(gè)可以自由取值參數(shù)統(tǒng)計(jì)(parametric statistics)總體分布型已知,對(duì)總體參數(shù)進(jìn)行估計(jì)或檢驗(yàn)正態(tài)分布、二項(xiàng)分布、泊松分布等的檢驗(yàn)不可用參數(shù)檢驗(yàn)的情形:不符合正態(tài)分布要求或方差齊性要求變量變換后方差仍不齊或非正態(tài)分布總體分布未知需找到不依賴于總體分布的方法應(yīng)用非參數(shù)檢驗(yàn)的情況:1 .不滿足正態(tài)

22、和方差齊性條件的小樣本資料2 .總體分布類型不明的小樣本資料3 .一端或二端是不確定數(shù)值(如V、>65等)的資料(必選)4 .單向(雙向)有序列聯(lián)表資料5 .各種資料的初步分析雙變量計(jì)量資料:每個(gè)個(gè)體有兩個(gè)變量值總體:無(wú)限或有限對(duì)變量值樣本:從總體隨機(jī)抽取的 n對(duì)變量值(X,Yl) ,(XY2),,(X,Yn)目的:研究X和Y的數(shù)量關(guān)系方法:相關(guān)與回歸一一簡(jiǎn)單、基本:直線相關(guān)、直線回歸相關(guān)系數(shù)又稱Pearson積矩相關(guān)系數(shù),說(shuō)明具有直線關(guān)系的兩變量間相關(guān)的密切程 度與相關(guān)方向相關(guān)系數(shù)沒(méi)有測(cè)量單位,其值為-1<r<1r>0表示正相關(guān),rv0表示負(fù)相關(guān),r=1或r=-1為完全相關(guān),r=0為零相關(guān)即無(wú) 直線關(guān)系線性相關(guān)分析的注意事項(xiàng)1.線性相關(guān)表示兩個(gè)變量之間的關(guān)系是雙向的,分析變量之間的關(guān)系,須首先繪制散點(diǎn)圖,散點(diǎn)圖呈直線趨勢(shì)時(shí),再做分析只表示兩個(gè)服從正態(tài)分布的隨機(jī)變量之間線性關(guān)系的密切程度和相關(guān)方向,r=0只能說(shuō)X與Y之間無(wú)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論