生物統(tǒng)計(jì)學(xué)第一章_第1頁
生物統(tǒng)計(jì)學(xué)第一章_第2頁
生物統(tǒng)計(jì)學(xué)第一章_第3頁
生物統(tǒng)計(jì)學(xué)第一章_第4頁
生物統(tǒng)計(jì)學(xué)第一章_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

生物統(tǒng)計(jì)學(xué)第一章為什么要學(xué)統(tǒng)計(jì)學(xué)?1.采用統(tǒng)計(jì)學(xué)方法,發(fā)現(xiàn)不確定現(xiàn)象背后隱藏的規(guī)律。變異(variation)是社會(huì)和生物醫(yī)學(xué)中的普遍現(xiàn)象。許多個(gè)體之所以能匯集成一個(gè)總體,必定存在共同的特征,共同的特征是他們的同質(zhì)性,但個(gè)體之間又不是完全相同的,這種個(gè)體之間的差異就是變異。變異使得實(shí)驗(yàn)或觀察的結(jié)果具有不確定性,如每個(gè)人的身高、體重、血壓等各有不同。

最大值=6.18,最小值=3.29,極差=2.89

算術(shù)均數(shù)=4.72,標(biāo)準(zhǔn)差=0.57。2.

用統(tǒng)計(jì)學(xué)思維方式考慮有關(guān)生物學(xué)研究中的問題

“陽性”結(jié)果是否是虛假聯(lián)系?某感冒藥治療1周后,治愈率為90%,能否說該感冒藥十分有效?

“陰性”結(jié)果是否是樣本含量不足?

有人曾對(duì)發(fā)表在Lancet,NEnglJMed,JAMA等著名醫(yī)學(xué)雜志上的71篇陰性結(jié)果的論文作過分析,發(fā)現(xiàn)其中有62篇(93%)可能是由于樣本含量不足造成的假陰性。什么是生物統(tǒng)計(jì)學(xué)?生物統(tǒng)計(jì)學(xué)是應(yīng)用數(shù)理統(tǒng)計(jì)的原理和方法來分析和解釋生物界數(shù)量現(xiàn)象的科學(xué),也可以說是數(shù)理統(tǒng)計(jì)在生物學(xué)研究中的應(yīng)用。它是現(xiàn)代生物學(xué)研究不可缺少的工具,不論是傳統(tǒng)學(xué)科還是現(xiàn)代分子生物學(xué),時(shí)時(shí)刻到都會(huì)與數(shù)字打交道。為了揭示生物體內(nèi)在規(guī)律或生物與環(huán)境之間的關(guān)系,都離不開因素分 析、待別是多元分析。設(shè)計(jì)統(tǒng)計(jì)原理,闡述統(tǒng)計(jì)理論和有關(guān)公式,以滿足統(tǒng)計(jì)方法的需要統(tǒng)計(jì)方法的應(yīng)用,旨在對(duì)客觀事物得出本質(zhì)的和規(guī)律性的認(rèn)識(shí)。人們?cè)趶氖驴茖W(xué)研究時(shí),總是通過事物一部分(樣本)來估計(jì)事物全體(總體)的性質(zhì)特征,即從樣本推斷總體,從特殊推導(dǎo)一般,從而對(duì)所研究的總體得出正確的結(jié)論。在生物科學(xué)研究中,我們期望知道總體不是樣本??墒窃趯?shí)際問題調(diào)查和試驗(yàn)中,我們所得到的卻只是樣本資料。生物統(tǒng)計(jì)學(xué)從本質(zhì)來看,實(shí)際上是研究如何從樣本推斷總體的一門科學(xué)。課程特點(diǎn)與學(xué)習(xí)方法(一)課程特點(diǎn)與要求本課程重點(diǎn)介紹基本概念、基本方法,主要從應(yīng)用角度理解,簡(jiǎn)化推證過程。掌握生物統(tǒng)計(jì)的基本方法,熟悉常用實(shí)驗(yàn)設(shè)計(jì)方法。二)建議學(xué)習(xí)方法1.掌握生物統(tǒng)計(jì)學(xué)的基本原理和公式,理解公式的含義和應(yīng)用條件,不深究推導(dǎo)過程;2.培養(yǎng)科學(xué)的統(tǒng)計(jì)思維方法。結(jié)合專業(yè),了解統(tǒng)計(jì)方法的實(shí)際應(yīng)用。3.學(xué)會(huì)使用常用的統(tǒng)計(jì)軟件。教學(xué)內(nèi)容第1章統(tǒng)計(jì)數(shù)據(jù)的收集與整理第2章概率分布與抽樣分布第3章統(tǒng)計(jì)推斷與參數(shù)估計(jì)第4章擬合優(yōu)度檢驗(yàn)第5章方差分析第6章一元回歸及簡(jiǎn)單相關(guān)分析第7章實(shí)驗(yàn)設(shè)計(jì)第一章統(tǒng)計(jì)數(shù)據(jù)的收集與整理§1.1總體與樣本總體、樣本、樣本含量、抽樣(方法)§1.2數(shù)據(jù)類型與頻數(shù)(率)分布數(shù)據(jù)的類型、頻數(shù)表與頻數(shù)圖的編繪§1.3樣本的幾個(gè)特征數(shù)平均數(shù)、標(biāo)準(zhǔn)差、方差、變異系數(shù)幾個(gè)常用術(shù)語變量與常數(shù)誤差與錯(cuò)誤準(zhǔn)確與精確測(cè)量與測(cè)量尺度

對(duì)隨機(jī)變量的取值過程為測(cè)量。取值所采用的標(biāo)準(zhǔn)為測(cè)量尺度。測(cè)量和測(cè)量尺度

采用統(tǒng)一的標(biāo)準(zhǔn)化的尺度進(jìn)行測(cè)量,其測(cè)量結(jié)果一般是穩(wěn)定的和一致的,例如身高、胸圍等形態(tài)指標(biāo)的測(cè)量均采用統(tǒng)一的測(cè)量尺度(全國(guó)統(tǒng)一研制的身高計(jì)、胸圍尺均以厘米為記錄單位,體重以公斤為記錄單位,肺活量以毫升為單位等)變量——可以測(cè)量的任何特征或?qū)傩訟nycharacteristicorattributethatcanbemeasured。(不同個(gè)體結(jié)果可能不同)隨機(jī)變量——在概率論中稱變量為隨機(jī)變量觀測(cè)值(observedvalue)、變量值(valueofvariable)、資料(data)——變量的測(cè)得值。變量可是定量的,也可以是定性的。定量變量(quantitativevariable):亦稱為數(shù)值變量,變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。e.g.身高、體重。定性變量(qualitativevariable):亦稱為分類變量,其變量值是定性的,表現(xiàn)某個(gè)體屬于幾種互不相容的類型中的一種。e.g.血型,豌豆花的顏色。常數(shù)(constant):是不能給予不同數(shù)值的變量,代表事物特征和性質(zhì)的數(shù)值。e.g.樣本平均數(shù),標(biāo)準(zhǔn)差。誤差(Error)測(cè)量值=真實(shí)值+隨機(jī)誤差+非隨機(jī)誤差1.隨機(jī)誤差(隨機(jī)抽樣誤差):

由于試驗(yàn)中許多無法控制的偶然因素所造成的試驗(yàn)結(jié)果與真實(shí)結(jié)果之間產(chǎn)生的誤差,是不可避免的,不能消除的。2.系統(tǒng)誤差受確定因素影響,大小變化有方向性。某種程度上可以控制。3.非系統(tǒng)誤差(錯(cuò)誤)研究者偶然失誤而造成的誤差。準(zhǔn)確度與可靠度準(zhǔn)確度(accuracy)或真實(shí)性(validity):觀察值與真值的接近程度,受系統(tǒng)誤差的影響??煽慷龋╮eliabiliy)——也稱精確度(precision)或重復(fù)性(repeatability):重復(fù)觀察時(shí)觀察值與其均值的接近程度,受隨機(jī)誤差的影響?!?.1總體與樣本

一、總體總體(population)是我們研究的全部對(duì)象??傮w又分為無限總體(infinitepopulation)和有限總體(finitepopulation)。例如,研究在某種條件下生長(zhǎng)小麥的株高,因?yàn)闊o法估計(jì)出在這種條件下生長(zhǎng)的小麥數(shù)量,可以設(shè)想這一總體是無限的。如果研究每個(gè)地塊小麥的株高,這一總體就是有限總體。構(gòu)成總體的每個(gè)成員稱為個(gè)體(individual)。二、樣本從總體中抽取的一部分個(gè)體則構(gòu)成樣本(sample)。樣本內(nèi)包含的個(gè)體數(shù)目稱為樣本容量(samplesize),常以n表示。由于樣本容量不同,一般又分大樣本(n≥30)和小樣本(n<30)。統(tǒng)計(jì)分析的核心在于由樣本的信息推斷總體的信息。因此,獲得樣本僅是一種手段,而推斷總體才是真正的目的。參數(shù):總體的統(tǒng)計(jì)指標(biāo),如總體均數(shù)、標(biāo)準(zhǔn)差,采用希臘字母分別記為μ、σ。固定的常數(shù)

樣本抽取部分觀察單位統(tǒng)計(jì)量

參數(shù)

推斷inference樣本統(tǒng)計(jì)量:樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、標(biāo)準(zhǔn)差,采用英文字母分別記為。參數(shù)附近波動(dòng)的隨機(jī)變量??傮w三、抽樣從總體中獲得樣本的過程稱為抽樣(samlping)。抽樣的目的是希望通過對(duì)樣本的研究,推斷其總體。例如,希望由100株“三尺三”高梁的株高推斷在這種條件下生長(zhǎng)的該品種的株高,這就要求樣本應(yīng)能在最大程度上代表總體的情況。為此,在從總體中抽取樣本時(shí),總體中的每一個(gè)個(gè)體被抽中的機(jī)會(huì)必須都一樣,不能帶有偏見。又如,在小麥育種工作中,我們常常希望得到矮稈品種。為了滿足個(gè)人愿望,在抽樣時(shí)便多抽矮稈的,這樣得到的樣本沒有代表性,屬于偏性抽樣,不能代表總體的情況。樣本應(yīng)該是一個(gè)總體的縮影。為達(dá)到這個(gè)目的,需要用隨機(jī)抽樣(randomsampling)方法獲得樣本。(一)隨機(jī)抽樣的方法1抽簽--筷子;2抓鬮--紙條;3隨機(jī)數(shù)字表--P322(附表1)例如:需要從包含4728個(gè)個(gè)體的總體中,抽出一個(gè)含量為20的樣本。因?yàn)閭€(gè)體總數(shù)4728是一個(gè)四位數(shù),所以總體中每一個(gè)個(gè)體的編號(hào)都應(yīng)是四位數(shù),即從0001號(hào)到4728號(hào)。第一步,閉上眼睛用鉛筆在隨機(jī)數(shù)字表上任意點(diǎn)上一點(diǎn),假若點(diǎn)到奇數(shù)上,就用第一頁表;點(diǎn)到偶數(shù)上,就用第二頁表。第二步,在選定的那一頁上再點(diǎn)一次,決定從哪個(gè)字開始。決定了起點(diǎn)以后,開始以四位數(shù)字為一節(jié)連續(xù)讀下去,不用考慮數(shù)字間的間隙??梢哉x、倒讀、橫向讀、縱向讀,也可以沿對(duì)角線方向讀。選出小于等于4728的數(shù)字,大于4728的則舍棄,直到取滿20個(gè)數(shù)為止。這20個(gè)數(shù)所對(duì)應(yīng)的個(gè)體,即為我們選中的樣本。(二)隨機(jī)抽樣的方式1放回式抽樣從總體中抽出一個(gè)個(gè)體,記下它的特征后放回總體中,再做第二次抽樣。這種抽樣方式可能會(huì)重復(fù)抽中某一個(gè)體。2非放回式抽樣從總體中抽出個(gè)體后不再放回。在上述的例子中,若保留重復(fù)的隨機(jī)數(shù)字,則為放回式抽樣;若舍棄重復(fù)的數(shù)字,則為非放回式抽樣。對(duì)于無限總體來說,放回式抽樣和非放回式抽樣,實(shí)際上沒有區(qū)別。樣本的含量越大越有代表性。但是,太大的樣本研究起來是很困難的。因此,樣本的含量必須合適?!?.2數(shù)據(jù)類型與頻數(shù)(率)分布§1.2.1連續(xù)型數(shù)據(jù)和離散型數(shù)據(jù)生物統(tǒng)計(jì)學(xué)中經(jīng)常遇到的數(shù)據(jù)有兩種類型:即連續(xù)型數(shù)據(jù)和離散型數(shù)據(jù)。用量測(cè)方式所得到的數(shù)據(jù)稱為連續(xù)型數(shù)據(jù)(continuousdata),又稱為度量數(shù)據(jù)(measurementdata)。例如,長(zhǎng)度、時(shí)間、質(zhì)量、OD值、血壓值等。這類數(shù)據(jù)通常是非整數(shù)。雖然有時(shí)記載的是整數(shù),如身高的厘米數(shù),但是當(dāng)提高精確度后,總會(huì)出現(xiàn)小數(shù)。對(duì)連續(xù)型數(shù)據(jù)進(jìn)行分析的方法通常稱為變量的方法(methodofvariable)。用計(jì)數(shù)方式所得到的數(shù)據(jù)稱為離散型數(shù)據(jù)(discretedata),又稱為計(jì)數(shù)數(shù)據(jù)(countdata)。例如,某一類別動(dòng)物的頭數(shù),具有某一特征的種子粒數(shù),血液中不同類型的細(xì)胞數(shù)目等。所有這些數(shù)據(jù)全都是整數(shù),而且不能再細(xì)分,也不能進(jìn)一步提高它們的精確度。對(duì)離散型數(shù)據(jù)進(jìn)行分析的方法通常稱為屬性的方法(methodofattribute)。描述數(shù)據(jù)變化規(guī)律的最簡(jiǎn)單方法是將這些數(shù)據(jù)列成頻數(shù)表(frequencytable)或繪成頻數(shù)圖(frequencygraph),根據(jù)頻數(shù)分布進(jìn)行研究?!?.2.2頻數(shù)(率)表與頻數(shù)(率)圖的編繪一、離散型數(shù)據(jù)頻數(shù)(率)表與頻數(shù)(率)圖的編繪例1.1調(diào)查每天出生的10名新生兒中,體重超過3千克的人數(shù),共調(diào)查120天。每天的10名新生兒中體重超過3千克的人數(shù),可能有11種情況:1名也沒有,有1名,有2名,…,10名都是,如表1-1的第一列所示,這一列稱為組值(classvalue)。表1-1的第2列所記載的是調(diào)查結(jié)果。全部調(diào)查完畢,累加各行結(jié)果填入頻數(shù)一欄(第3列),或者將各行的結(jié)果除以總數(shù)而得出頻率(第4列)。所謂頻率,即將某一類別的數(shù)目除以總數(shù)所得到的分?jǐn)?shù)。把頻數(shù)或頻率按超過3千克的人數(shù)的順序排列起來,便得到了頻數(shù)分布(frequencydistribution)或百分率分布percentagedistribution)。

編制連續(xù)型數(shù)據(jù)的頻數(shù)(率)表的方法步驟從原始數(shù)據(jù)表中找出最大值和最小值,并求出極差。決定劃分的組數(shù),分組數(shù)是由數(shù)據(jù)的多少?zèng)Q定的,在數(shù)據(jù)較少時(shí),如50~100個(gè)數(shù),可以分為7~10組。數(shù)據(jù)較多時(shí),可分為15~20組。根據(jù)極差與決定劃分的組數(shù),確定組限。在頻數(shù)表中列出全部組限、組界及中值。將原始數(shù)據(jù)表中數(shù)據(jù),用唱票的方式填入頻數(shù)表中,計(jì)算出各組的頻數(shù)和頻率。極差(range):數(shù)據(jù)中最大值和最小值之差,又稱全距。組限(classlimit):各組的最大值與最小值稱為組限,最小值稱為下限,最大值稱為上限。中值(midvalue):每一組的中點(diǎn)值,一般是每一組的兩個(gè)組限的平均值。在橫軸上標(biāo)明各組的組界,縱軸標(biāo)明頻數(shù),然后以每 一組的組界為一個(gè)邊,相應(yīng)的頻數(shù)為另一個(gè)邊作矩形,構(gòu)成直方圖(histogram)(圖1-2)。若縱軸改為頻率則得到頻率直方圖。直方圖又稱組織圖。2多邊形圖在橫軸上標(biāo)出各組的中值,縱軸上標(biāo)出頻數(shù)(率),在坐標(biāo)平面內(nèi)標(biāo)出相應(yīng)的每個(gè)點(diǎn)(以中值為橫坐標(biāo),以該中值對(duì)應(yīng)的頻數(shù)(率)為縱坐標(biāo)),用線段連接各點(diǎn)。最低一組非零頻數(shù)的點(diǎn),應(yīng)該直接與相鄰的零頻數(shù)中值相連;最高一組非零頻數(shù)點(diǎn),亦應(yīng)該與相鄰的零頻數(shù)中值點(diǎn)相連。最后得到一個(gè)多邊形圖(polygon)(圖1-3)。累計(jì)頻數(shù)圖的意義?橫坐標(biāo)與多邊形圖有何差異?3累積頻數(shù)圖 經(jīng)常使用的第三種頻數(shù)圖稱為累積頻數(shù)圖cumulativefrequencygraph)。作圖法為:首先根據(jù)表1-3制成累積頻數(shù)表(表1-4)、在橫軸上標(biāo)出各級(jí)的中值,縱軸上標(biāo)出累積頻數(shù)(率)。在坐標(biāo)平面內(nèi)標(biāo)出相應(yīng)的點(diǎn)(以中值為橫坐標(biāo),以該中值對(duì)應(yīng)的累積頻數(shù)(率)為縱坐標(biāo)),連接各點(diǎn),從而得到累積頻數(shù)(率)圖研究頻數(shù)(率)分布的意義1.根據(jù)頻數(shù)(率)分布,可以看出數(shù)據(jù)的集中情況(重心)。平均值(averagevalue,mean)算術(shù)平均數(shù)(arithmeticmean)、中位數(shù)(median)和眾數(shù)(mode)。2.從頻數(shù)(率)表或頻數(shù)(率)圖中,可以直觀地看出數(shù)據(jù)的變異情況。3.可以直觀看出頻數(shù)(率)圖的變化形狀。還可顯示一些不規(guī)則的情況。頻數(shù)(率)分布的不恒定性當(dāng)用隨機(jī)抽樣方法獲得樣本時(shí),由于偶然性,有時(shí)在一個(gè)樣本中抽到的數(shù)值偏高,而另一個(gè)樣本中數(shù)值偏低,使兩個(gè)樣本的頻數(shù)分布出現(xiàn)不同。由于樣本分布的不恒定性,當(dāng)用樣本去推斷總體時(shí),推斷的結(jié)果也會(huì)有所不同。這就需要考察當(dāng)用某一樣本去推斷總體時(shí)所得結(jié)果與真正總體之間有多大誤差,結(jié)果的可信度有多高。1.3樣本的幾個(gè)特征數(shù)100877910099587799100677510080477480898834897567837521896821835682852486726491647396某班某次考試的成績(jī)頻數(shù)表和頻數(shù)圖只能定性地描述一組數(shù)據(jù)。對(duì)于生物統(tǒng)計(jì)學(xué)來說,這種描述遠(yuǎn)遠(yuǎn)不夠。為了更客觀地描述這些數(shù)據(jù),需要借助于以下分析工具的幫助。它們是數(shù)據(jù)集中點(diǎn)的度量——平均數(shù),數(shù)據(jù)變異程度的度量——極差、方差、標(biāo)準(zhǔn)差和變異系數(shù)。這些數(shù)字是描述樣本頻率分布特征的,稱為樣本數(shù)字特征或簡(jiǎn)稱為樣本特征數(shù)(samp1echaracteristics)(總體稱參數(shù))。平均數(shù)(mean)

平均數(shù)是統(tǒng)計(jì)學(xué)中最常用的統(tǒng)計(jì)量,用來表明資料中各觀測(cè)值相對(duì)集中較多的中心位置。主要包括:算術(shù)平均數(shù)(arithmeticmean)中數(shù)(中位數(shù))(median)眾數(shù)(mode)幾何平均數(shù)(geometricmean)調(diào)和平均數(shù)(harmonicmean)

算術(shù)平均數(shù)(一)算術(shù)平均數(shù)定義算術(shù)平均數(shù)是指資料中各觀測(cè)值的總和除以觀測(cè)值個(gè)數(shù)所得的商,簡(jiǎn)稱平均數(shù)或均數(shù)。(二)算術(shù)平均數(shù)計(jì)算1直接法主要用于樣本含量n<30以下、未經(jīng)分組資料平均數(shù)的計(jì)算。生物統(tǒng)計(jì)學(xué)中,使用最多的是算術(shù)平均數(shù)2加權(quán)法對(duì)于樣本含量n≥30以上,且已分組的資料,可以在次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計(jì)算平均數(shù):算數(shù)平均數(shù)的基本特征算術(shù)平均數(shù)的計(jì)算與樣本內(nèi)的每個(gè)值都有關(guān),它的大小受每個(gè)值的影響。若每個(gè)xi都乘以相同的數(shù)k,則平均數(shù)亦應(yīng)乘以k。若每個(gè)xi都加上相同的數(shù)A,則平均數(shù)亦應(yīng)加上A。如果是n1個(gè)數(shù)的平均數(shù),是n2個(gè)數(shù)的平均數(shù),那么全部n1

+n2個(gè)數(shù)的算術(shù)平均數(shù)是加權(quán)平均數(shù)(weightedmean):平均數(shù)的計(jì)算方法離散型數(shù)據(jù)頻數(shù)資料:注意記住所有字母符號(hào)的含義例1.1新生兒體重作表計(jì)算是個(gè)好習(xí)慣連續(xù)型數(shù)據(jù)頻數(shù)資料:例1.2“三尺三”株高二、中(位)數(shù)將資料內(nèi)所有觀測(cè)值從小到大依次排列,位于中間的那個(gè)觀測(cè)值稱為中位數(shù)。當(dāng)觀測(cè)值的個(gè)數(shù)是偶數(shù)時(shí),則以中間兩個(gè)觀測(cè)值的平均數(shù)作為中位數(shù)。當(dāng)所獲得的數(shù)據(jù)資料呈偏態(tài)分布時(shí),中位數(shù)的代表性優(yōu)于算術(shù)平均數(shù)。三、眾數(shù)具有最高頻數(shù)的組值或中值稱為眾數(shù)。具有兩個(gè)分開的高頻率分布稱雙眾數(shù)(bimodal)。表1-5100聽罐頭凈重的次數(shù)分布表變異程度的度量

對(duì)于數(shù)據(jù)的變異程度,經(jīng)常使用的度量方法有三種,它們是:范圍(range)或稱為極差,平均離差(meandeviation,MD)和標(biāo)準(zhǔn)差(Standarddeviation,sorSD)或稱為標(biāo)準(zhǔn)離差。其中最重要的是標(biāo)準(zhǔn)差。平均離差(meandeviation,MD)表1-6中數(shù)據(jù)的MD:除得的商稱為樣本方差(samplevariance),用符號(hào)s2表示。離差平方和(sumofsquareofdeviations)標(biāo)準(zhǔn)差(s,SD)方差的缺點(diǎn):方差s2是離均差平方的平均數(shù)。雖然方差在實(shí)際應(yīng)用中用得最廣泛,但它還不能直接地指出某個(gè)數(shù)x與平均數(shù)之間的偏離究竟達(dá)到什么程度。s要比MD要大一些。如果數(shù)據(jù)分布曲線是平滑且對(duì)稱的,那么大約57%的數(shù)據(jù)落在平均數(shù)±MD內(nèi);如果數(shù)據(jù)分布曲線是平滑且對(duì)稱的,那么大約68%的數(shù)據(jù)落在平均數(shù)±s內(nèi)。

總之,衡量數(shù)據(jù)離散程度時(shí),三種方法都可以使用。用抽樣理論可以證明:用標(biāo)準(zhǔn)差估計(jì)總體離散程度最可靠,平均離差次之。標(biāo)準(zhǔn)差的計(jì)算方法1.非頻數(shù)資料的計(jì)算方法不要求公式推導(dǎo)。例1.3從兩個(gè)小區(qū)分別隨機(jī)抽取20株小麥,測(cè)其單穗粒數(shù),結(jié)果如下表,計(jì)算其標(biāo)準(zhǔn)差。列出下表計(jì)算但是若將上述數(shù)據(jù)進(jìn)行編碼,則可明顯看出用(1.12)式計(jì)算極為便利。具體做法是任選一個(gè)數(shù)C,求每一個(gè)數(shù)與C的差,利用差值計(jì)算離差平方和。結(jié)果與未編碼所得的值是一樣的。C最好選接近平均數(shù)的一個(gè)數(shù),這樣編出的數(shù)碼最容易計(jì)算?,F(xiàn)僅對(duì)例1.3中的第一個(gè)小區(qū)進(jìn)行計(jì)算,取C=25,于是x=x-25。根據(jù)(1.12)式編碼和列表都是好習(xí)慣。1.頻數(shù)資料的計(jì)算方法

對(duì)于連續(xù)型數(shù)據(jù),可以用中值代替離散型數(shù)據(jù)中的組值做近似的計(jì)算,但是連續(xù)型數(shù)據(jù)中的中值一般都較大,必須編碼后再計(jì)算??捎孟率剑浩倍群颓投榷攘繑?shù)據(jù)圍繞眾數(shù)呈不對(duì)稱的程度,即通常所稱的偏斜度(skewness)。雖然有幾種不同的度量偏

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論