版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
生物統(tǒng)計學(xué)授課人:陳建中E-mail:《生物統(tǒng)計學(xué)》理解生物統(tǒng)計學(xué)基本原理和統(tǒng)計分析方法,學(xué)會如何進(jìn)行科學(xué)的試驗設(shè)計,掌握常用的統(tǒng)計學(xué)軟件的使用教材:李春喜等編著,2008,生物統(tǒng)計學(xué)(第四版),科學(xué)出版社。第一次統(tǒng)計數(shù)據(jù)的收集和整理第二次概率與概率分布以及常見的概率分布第三次抽樣分布和統(tǒng)計推斷第四次參數(shù)估計和擬合度檢驗第五次單因素方差分析第六次多因素方差分析
第七次直線回歸與相關(guān)分析第八次試驗設(shè)計與統(tǒng)計分析Spss軟件在生物統(tǒng)計學(xué)中的應(yīng)用(8學(xué)時)教學(xué)計劃(學(xué)時安排)第一章統(tǒng)計數(shù)據(jù)的收集和整理主要內(nèi)容生物統(tǒng)計學(xué)的概述定義、作用、發(fā)展簡史統(tǒng)計學(xué)中幾個基本概念總體、樣本、個體、抽樣數(shù)據(jù)類型及頻率分布連續(xù)和離散數(shù)據(jù)頻數(shù)頻率分布圖樣本的典型參數(shù)平均數(shù)標(biāo)準(zhǔn)差偏斜度和崤度變異系數(shù)一、生物統(tǒng)計學(xué)的概述生物統(tǒng)計學(xué)定義生物統(tǒng)計學(xué)的主要內(nèi)容生物統(tǒng)計學(xué)的作用生物統(tǒng)計學(xué)的發(fā)展簡史
統(tǒng)計學(xué)(Statistics)是把數(shù)學(xué)的語言引入具體的科學(xué)領(lǐng)域,將所研究的問題抽象為數(shù)學(xué)問題的過程,是收集、分析、列示和解釋數(shù)據(jù)的一門科學(xué)。統(tǒng)計學(xué)被廣泛地應(yīng)用于解決自然科學(xué)和社會科學(xué)各個領(lǐng)域中具體的隨機(jī)現(xiàn)象的規(guī)律性,形成了應(yīng)用于各個學(xué)科領(lǐng)域的統(tǒng)計學(xué),即應(yīng)用統(tǒng)計學(xué)。生物統(tǒng)計學(xué)概念
生物統(tǒng)計學(xué)(Biostatistics)是數(shù)理統(tǒng)計在生物學(xué)研究中的應(yīng)用,它是應(yīng)用數(shù)理統(tǒng)計的原理和方法來分析和解釋生物界各種現(xiàn)象和試驗調(diào)查資料的一門學(xué)科。屬于應(yīng)用統(tǒng)計學(xué)的一個分支。在對事物的研究過程中,人們往往是通過某事物的一部分(樣本),來估計事物全部(總體)的特征,目的是為了以樣本的特征對未知總體進(jìn)行推斷,從特殊推導(dǎo)一般,對所研究的總體作出合乎邏輯的推論,得到對客觀事物的本質(zhì)和規(guī)律性的認(rèn)識。在生物學(xué)研究中,我們所期望的是總體,而不是樣本。但是在具體的試驗過程中,我們所得到的卻是樣本而不是總體。因此,從某種意義上講,生物統(tǒng)計學(xué)是研究生命過程中以樣本來推斷總體的一門學(xué)科。生物統(tǒng)計學(xué)是研究生命過程中以樣本推斷總體的一門學(xué)科。生的物基統(tǒng)本計內(nèi)學(xué)容試驗設(shè)計Experimentdesign統(tǒng)計分析Statisticalanalysis基本原則方案制定常用試驗設(shè)計資料的搜集和整理數(shù)據(jù)特征數(shù)的計算統(tǒng)計推斷方差分析回歸和相關(guān)分析協(xié)方差分析主成分分析聚類分析對比設(shè)計隨機(jī)區(qū)組設(shè)計平衡不完全區(qū)組設(shè)計裂區(qū)設(shè)計拉丁方設(shè)計正交設(shè)計生物統(tǒng)計學(xué)的內(nèi)容與作用如何合理地進(jìn)行調(diào)查或試驗設(shè)計如何科學(xué)地整理、分析所收集來的具有變異的資料,揭示出隱藏其內(nèi)部的規(guī)律性。生物統(tǒng)計學(xué)的基本作用:提供整理和描述數(shù)據(jù)資料的科學(xué)方法,確定某些性狀和特性的數(shù)量特征。運用顯著檢驗,判斷試驗結(jié)果的可靠性或可行性。提供由樣本推斷總體的方法。提供試驗設(shè)計的的一些重要原則。生物統(tǒng)計學(xué)的基本作用:提供整理和描述數(shù)據(jù)資料的科學(xué)方法,確定某些性狀和特性的數(shù)量特征。原始的數(shù)據(jù)和資料,雜亂無章,生物統(tǒng)計學(xué)提供一套完整科學(xué)系統(tǒng)的分析分析方法,能夠在眾多數(shù)據(jù)中提煉出有價值的東西生物統(tǒng)計學(xué)的基本作用:運用顯著檢驗,判斷試驗結(jié)果的可靠性或可行性。無論實驗條件如何嚴(yán)格控制,總是無法避免隨機(jī)誤差。所以當(dāng)拿到實驗結(jié)果后,首先要判定數(shù)據(jù)的可靠性!換句話說就是要分離誤差產(chǎn)生的原因:是處理導(dǎo)致還是環(huán)境導(dǎo)致,還是系統(tǒng)誤差等等生物統(tǒng)計學(xué)的基本作用:提供由樣本推斷總體的方法。由樣本推斷總體這是生物統(tǒng)計學(xué)的總體思路,具體落實需要一套完整的推斷方案。生物統(tǒng)計學(xué)的基本作用:提供試驗設(shè)計的的一些重要原則。實驗設(shè)計有三個原則:隨機(jī),重復(fù)和局部控制我們力求以較少的人力財力獲得較多的數(shù)據(jù)同時我們也能看到由于實驗設(shè)計不但,導(dǎo)致實驗喪失大量的數(shù)據(jù),或者實驗設(shè)計就不科學(xué)!沒有代表性生物統(tǒng)計學(xué)的任務(wù)新藥物舊藥物不同劑量性能試驗不同劑量對照試驗結(jié)果是…?問題:最適使用劑量分別是多少?新藥物比舊藥物治愈率高嗎?1.試驗如何設(shè)計?2.數(shù)據(jù)如何整理、分析呢?3.結(jié)果是什么?可靠性有多高?4.結(jié)論如何?新藥是否可生產(chǎn)?課外活動:生物統(tǒng)計方法在生物學(xué)學(xué)術(shù)刊物中的應(yīng)用情況學(xué)習(xí)生物統(tǒng)計的方法和要求掌握統(tǒng)計的基本原理、基本公式和應(yīng)用條件。2.做好習(xí)題作業(yè)。3.培養(yǎng)科學(xué)的統(tǒng)計思維方法。4.結(jié)合所學(xué)專業(yè),聯(lián)系實際。J.Bernoulli(貝努里,瑞士,1654~1705)
系統(tǒng)論證了“大數(shù)定律”,即樣本容量越大,樣本統(tǒng)計數(shù)與總體參數(shù)之差越小。P.S.Laplace(拉普拉斯,法國,1749~1827)
最早系統(tǒng)的把概率論方法運用到統(tǒng)計學(xué)研究中去,建立了嚴(yán)密的概率數(shù)學(xué)理論,提出“拉普拉斯定理”,并應(yīng)用到人口統(tǒng)計、天文學(xué)等方面的研究上。初步建立了大樣本推斷的理論基礎(chǔ),為后人開創(chuàng)了抽樣調(diào)查的方法。一、古典記錄統(tǒng)計學(xué)(17世紀(jì)中葉至19世紀(jì)中葉)生物統(tǒng)計學(xué)發(fā)展概況Gauss(高斯,德國,1777~1855)
正態(tài)分布理論最早由DeMoiver于1733年發(fā)現(xiàn),后來Gauss在進(jìn)行天文觀察和研究土地測量誤差理論時又一次獨立發(fā)現(xiàn)了正態(tài)分布(又稱常態(tài)分布)的理論方程,提出“誤差分布曲線”,后人為了紀(jì)念他,將正態(tài)分布也稱為Gauss分布。另外,他還完成了最小二乘法的研究,正式發(fā)表于1809年。F.Galton(高爾登,英國,1822~1911)
19世紀(jì)末統(tǒng)計學(xué)開始用于生物學(xué)的研究。1882年Galton開設(shè)“人體測量實驗室”,測量9337人的資料,探索能把大量數(shù)據(jù)加以描述與比較的方法和途徑,引入了中位數(shù)以及分布、相關(guān)、回歸等重要的統(tǒng)計學(xué)概念與方法。1889年發(fā)表第一篇生物統(tǒng)計論文《自然界的遺傳》。1901年Galton和他的學(xué)生Pearson創(chuàng)辦了“Biometrika(生物統(tǒng)計學(xué)報)”雜志,首次明確“Biometry(生物統(tǒng)計)”一詞。所以后人推崇Galton為生物統(tǒng)計學(xué)的創(chuàng)始人。二、近代描述統(tǒng)計學(xué)(19世紀(jì)中葉至20世紀(jì)上半葉)K.Pearson(卡.皮爾遜,英國,1857~1936)
Pearson的一生是統(tǒng)計研究的一生。他首創(chuàng)頻數(shù)分布表與頻數(shù)分布圖,如今已成為最基本的統(tǒng)計方法之一;觀察到許多生物的度量并不呈現(xiàn)正態(tài)分布,利用相對斜率得到矩形分布、J型分布、U型分布或鈴型分布等;1900年獨立發(fā)現(xiàn)了X2分布,提出了有名的卡方檢驗法,后經(jīng)Fisher補(bǔ)充,成為小樣本推斷統(tǒng)計的早期方法之一;Pearson對“回歸與相關(guān)”進(jìn)一步作了發(fā)展,在1897~1905年,Pearson還提出復(fù)相關(guān)、總相關(guān)、相關(guān)比等概念,不僅發(fā)展了Galton的相關(guān)理論,還為之建立了數(shù)學(xué)基礎(chǔ)。(歌賽特,英國,1876~1937)
在生產(chǎn)實踐中對樣本標(biāo)準(zhǔn)差進(jìn)行了大量研究。于1908年以“Student(學(xué)生)”為筆名在該年的Biometrika上發(fā)表了論文《平均數(shù)的概率誤差》,創(chuàng)立了小樣本檢驗代替大樣本檢驗的理論,即t分布和t檢驗法,也稱為學(xué)生式分布。t檢驗已成為當(dāng)代生物統(tǒng)計工作的基本工具之一,為多元分析理論的形成和應(yīng)用奠定了基礎(chǔ),為此,許多統(tǒng)計學(xué)家把1908年看作是統(tǒng)計推斷理論發(fā)展史上的里程碑。三、現(xiàn)代推斷統(tǒng)計學(xué)(始于20世紀(jì)初)(費歇爾,英國,1890~1962)
Fisher一生論著頗多,共寫了329篇。他跨進(jìn)統(tǒng)計學(xué)界是從研究概率分布開始的,1923年發(fā)展了顯著性檢驗及估計理論,提出了F分布和F檢驗,1918年在《孟德爾遺傳試驗設(shè)計間的相對關(guān)系》一文中首創(chuàng)“方差”和“方差分析”兩個概念,1925年提出隨機(jī)區(qū)組和拉丁方試驗設(shè)計,并在盧桑姆斯坦德農(nóng)業(yè)試驗站得到檢驗與應(yīng)用,他還在試驗設(shè)計中提出“隨機(jī)化”原則,1938年和Yates合編了FisherYates隨機(jī)數(shù)字表。另外,
Neyman(1894~1981)和E.Pearson進(jìn)行了統(tǒng)計理論研究,分別與1936和1938年提出一種統(tǒng)計假說檢驗學(xué)說。對作物抽樣調(diào)查、A.Waecl對序貫抽樣、Finney對毒理統(tǒng)計、K.Mather對生統(tǒng)遺傳學(xué)、F.Yates對田間試驗設(shè)計等都作出了杰出貢獻(xiàn)。統(tǒng)計學(xué)在中國的傳播
我國在解放前,社會經(jīng)濟(jì)發(fā)展緩慢,統(tǒng)計的應(yīng)用和發(fā)展受到了很大的限制。1913年,顧澄教授(1882~?)翻譯了英國統(tǒng)計學(xué)家尤爾的著作《統(tǒng)計學(xué)之理論》(1911),即為英美數(shù)理統(tǒng)計學(xué)傳入中國之始。之后又有一些英美統(tǒng)計著作被翻譯成中文,F(xiàn)isher的理論和方法也很快傳入中國。在20世紀(jì)30年代,《生物統(tǒng)計與田間試驗》就作為農(nóng)學(xué)系的必修課,1935年王綬(1876~1972)編著出版的《實用生物統(tǒng)計法》是我國出版最早的生物統(tǒng)計專著之一。隨后1942年范福仁出版了《田間試驗技術(shù)》等,這些對推動我國農(nóng)業(yè)生物統(tǒng)計和田間試驗方法的應(yīng)用都產(chǎn)生了很大影響。
新中國成立后,許多學(xué)者翻譯、編著了統(tǒng)計學(xué)論著,有力的推動了數(shù)理統(tǒng)計方法在中國的普及和應(yīng)用。1978年12月國家統(tǒng)計局在四川峨眉召開了統(tǒng)計教學(xué)、科研規(guī)劃座談會,全面引進(jìn)了前蘇聯(lián)的社會經(jīng)濟(jì)統(tǒng)計理論和統(tǒng)計制度,對我國社會經(jīng)濟(jì)統(tǒng)計學(xué)的發(fā)展起到了一定的積極作用。1984年1月1日頒布實施《中華人民共和國統(tǒng)計法》,1987年2月國家統(tǒng)計局又發(fā)布《中華人民共和國統(tǒng)計法實施細(xì)則》,1996年5月八屆人大十九次會議通過了《關(guān)于修改<中華人民共和國統(tǒng)計法>的決定》。統(tǒng)計電算程序SAS(StatisticalAnalysisSystem)、SPSS(StatisticalPackageforSocialScience)、Excel、DPS(試驗設(shè)計designofexperiment數(shù)據(jù)處理processingofdata模型建立simulationanalysis)等的引進(jìn),統(tǒng)計學(xué)在中國的應(yīng)用與研究出現(xiàn)了嶄新的局面。二、統(tǒng)計學(xué)中幾個基本概念總體、個體和樣本以及抽樣變量與常量參數(shù)與統(tǒng)計數(shù)效應(yīng)與互作誤差與錯誤準(zhǔn)確性和精確性一、總體與樣本具有相同性質(zhì)的個體所組成的集合稱為總體(population),它是指研究對象的全體;組成總體的基本單元稱為個體(individual);(總體中的一個研究單位)從總體中抽出若干個體所構(gòu)成的集合稱為樣本(sample);(總體中的一部分)總體又分為有限總體和無限總體:含有有限個個體的總體稱為有限總體(finitudepopulation);包含有極多或無限多個體的總體稱為無限總體(infinitudepopulation).統(tǒng)計推斷總體樣本隨機(jī)抽樣總體研究的目的是要了解總體,觀測到的是樣本,通過樣本來推斷總體是統(tǒng)計分析的基本特點。
構(gòu)成樣本的每個個體稱為樣本單位;樣本中所包含的個體數(shù)目叫樣本容量或樣本大小(samplesize),樣本容量常記為n。一般在生物學(xué)研究中,通常把n<30的樣本叫小樣本,n≥30的樣本叫大樣本。對于小樣本和大樣本,在一些統(tǒng)計數(shù)的計算和分析檢驗上是不一樣的。研究的目的是要了解總體,然而能觀測到的卻是樣本,通過樣本來推斷總體是統(tǒng)計分析的基本特點。抽樣從總體中獲得樣本的過程叫抽樣(sampling)抽樣的目的:通過抽取的樣本來研究總體隨機(jī)抽樣放回式抽樣非放回式抽樣二、變量與常數(shù)
變量,或變數(shù),指相同性質(zhì)的事物間表現(xiàn)差異性或差異特征的數(shù)據(jù)。常數(shù),表示能代表事物特征和性質(zhì)的數(shù)值,通常由變量計算而來,在一定過程中是不變的。變量定性變量定量變量連續(xù)變量非連續(xù)變量也叫離散變量,只能取固定的值,通常是整數(shù)。如小白鼠的每胎產(chǎn)仔數(shù)在一定范圍內(nèi)可以取任意值,取值是無限的連續(xù)的。如小麥的株高在80~90間
為了表示總體和樣本的數(shù)量特征,需要計算出幾個特征數(shù),包括平均數(shù)和變異數(shù)(極差、方差、標(biāo)準(zhǔn)差等)。描述總體特征的數(shù)量稱為參數(shù)(parameter),也稱參量。常用希臘字母表示參數(shù),例如用μ表示總體平均數(shù),用σ表示總體標(biāo)準(zhǔn)差;描述樣本特征的數(shù)量稱為統(tǒng)計數(shù)(staistic),也稱統(tǒng)計量。常用英文字母表示統(tǒng)計數(shù),例如用表示樣本平均數(shù),用S表示樣本標(biāo)準(zhǔn)差。三、參數(shù)與統(tǒng)計數(shù)
由于總體一般都很大,或者不能得到,所以總體參數(shù)常常無法計算,但可以通過從總體中隨機(jī)抽樣,取得樣本,用容易計算得到的樣本的統(tǒng)計數(shù)來估計總體參數(shù)。用樣本平均數(shù)估計總體平均數(shù)μ,用樣本標(biāo)準(zhǔn)差S估計總體標(biāo)準(zhǔn)差σ等?!皹颖镜淖饔迷谟诠烙嬁傮w”四、效應(yīng)與互作
通過施加試驗處理,引起試驗差異的作用稱為效應(yīng)(effect)。效應(yīng)是一個相對量,而非絕對量,表現(xiàn)為施加處理前后的差異。效應(yīng)有正效應(yīng)與負(fù)效應(yīng)之分。小麥畝產(chǎn)原來400kg
新品種畝產(chǎn)450kg效應(yīng)值為50kg/畝;高血壓病人原來180吃降壓藥后為130效應(yīng)值為-50mm汞柱;某人體重原來60kg經(jīng)減肥后為55kg
效應(yīng)值為-5kg…...例:
互作(interaction),又叫連應(yīng),是指兩個或兩個以上處理因素間相互作用產(chǎn)生的效應(yīng)。互作也有正效應(yīng)(協(xié)同作用)與負(fù)效應(yīng)(拮抗作用)之分。例:田間施肥,畝施1kg氮肥糧食增產(chǎn)3kg;畝施1kg磷肥糧食增產(chǎn)2kg
;畝施1kg氮肥+1kg磷肥糧食增產(chǎn)6kg;3+26多出來1kg,?氮肥和磷肥相互作用引起的正效應(yīng):
氮肥(3)+磷肥(2)+氮肥×磷肥(1)=6(kg)五、誤差與錯誤變異效應(yīng)誤差隨機(jī)誤差/抽樣誤差/偶然誤差(Randomerror)系統(tǒng)誤差/片面誤差(Systematicerror)
隨機(jī)誤差,也叫抽樣誤差(samplingerror),是由于試驗中無法控制的內(nèi)在和外在的偶然因素所造成的試驗結(jié)果與真實結(jié)果之間的差異。如試驗動物的初始條件、飼養(yǎng)條件、管理措施等盡管在試驗中力求一致,但也不可能達(dá)到絕對一致,所以隨機(jī)誤差帶有偶然性質(zhì),在試驗中,即使十分小心也是不可避免的。如果通過良好的試驗設(shè)計、正確的試驗操作,增加抽樣或試驗次數(shù),隨機(jī)誤差可能減小,但不可能完全消滅。統(tǒng)計上的試驗誤差一般都指隨機(jī)誤差。隨機(jī)誤差越小,試驗精確性越高。
系統(tǒng)誤差,也叫片面誤差(lopsidederror),是由于試驗處理以外的其他條件控制不一致所產(chǎn)生的帶有傾向性的或定向性的偏差。系統(tǒng)誤差主要由一些相對固定的因素引起的,如儀器調(diào)校的差異、各批藥品間的差異、不同操作者操作習(xí)慣的差異等。系統(tǒng)誤差影響試驗的準(zhǔn)確性。只要試驗工作做得精細(xì),系統(tǒng)誤差是可以克服的。
錯誤(mistake),是指在試驗過程中,由于人為作用引起的差錯。如測量儀器不準(zhǔn)、試劑配制不當(dāng)、試驗人員粗心大意使稱量、觀測、記載、抄錄、計算中出現(xiàn)錯誤等人為因素而引起的,只要以認(rèn)真負(fù)責(zé)的態(tài)度和細(xì)心的工作作風(fēng),在試驗中是完全可以避免的。原則上,試驗中是不允許出現(xiàn)錯誤的。20年前,德國化學(xué)家勞爾赫在研究化肥對蔬菜的危害時,無意中發(fā)現(xiàn),菠菜的實際含鐵量并不像所宣傳的那樣高,只有食品營養(yǎng)化學(xué)和各種有關(guān)手冊所載數(shù)據(jù)的十分之一,勞爾赫很是詫異,懷疑試驗是否有偶然性。于是,他找來各種各樣的菠菜葉子,一一加以分析化驗,但從未發(fā)現(xiàn)哪一種菠菜葉子的含鐵量比別的蔬菜特別高的情況。他進(jìn)而探索所謂菠菜含鐵量高的“神話”,是從哪里來的。追蹤結(jié)果發(fā)現(xiàn),原來是100年前,印刷廠在排版時,不小心把菠菜含鐵量的小數(shù)點向右錯移了一位,從而使它的含鐵量擴(kuò)大了十倍,繆誤相傳,以至今日。(3.5mg/100g)菠菜中僅有1%的鐵在腸道中吸收,90%與草酸結(jié)合,不僅難以吸收,而且也會影響人體對鐵的吸收利用。
六、準(zhǔn)確性與精確性
準(zhǔn)確性(accuracy),也叫準(zhǔn)確度,指在調(diào)查或試驗中某一試驗指標(biāo)或性狀的觀測值與其真值接近的程度。設(shè)某一試驗指標(biāo)或性狀的真值為μ,觀測值為
x,若x與μ相差的絕對值|x-μ|越小,則觀測值x的準(zhǔn)確性越高;反之則低。精確性(precision),也叫精確度,指調(diào)查或試驗中同一試驗指標(biāo)或性狀的重復(fù)觀測值彼此接近的程度。若觀測值彼此接近,即任意二個觀測值xi、xj
相差的絕對值|xi-xj|越小,則觀測值精確性越高;反之則低。μ圖1μ圖2μ圖3μ圖4準(zhǔn)確性不等于精確性。準(zhǔn)確性是說明測定值對真值符合的程度大小,而精確性是說明多次測定值的變異程度大小。調(diào)查或試驗的準(zhǔn)確性、精確性合稱為正確性。統(tǒng)計推斷總體樣本隨機(jī)抽樣現(xiàn)象本質(zhì)平均數(shù)變異數(shù)暢所欲言
為什么要學(xué)習(xí)生物統(tǒng)計學(xué)?如何學(xué)好生物統(tǒng)計學(xué)?指出下列術(shù)語間的差別:總體與樣本變數(shù)與常數(shù)參數(shù)與統(tǒng)計數(shù)機(jī)誤和錯誤效應(yīng)與互作準(zhǔn)確性與精確性試驗資料的整理特征數(shù)的計算與在生物學(xué)試驗及調(diào)查中,通過對某種具體事物或現(xiàn)象觀察獲得的結(jié)果稱為資料。原始數(shù)據(jù)無序有序統(tǒng)計分析資料整理揭示事物本質(zhì)第一節(jié):試驗資料的搜集與整理一、試驗資料的類型二、試驗資料的搜集三、試驗資料的整理對試驗資料進(jìn)行分類是統(tǒng)計歸納的基礎(chǔ)。數(shù)量性狀資料質(zhì)量性狀資料(屬性性狀資料)計數(shù)資料(非連續(xù)變量資料)計量資料(連續(xù)變量資料)變量定量變量定性變量連續(xù)變量非連續(xù)變量資料
數(shù)量性狀(quantitativecharacter)是指能夠以計數(shù)和測量或度量的方式表示其特征的性狀。觀察測定數(shù)量性狀而獲得的數(shù)據(jù)就是數(shù)量性狀資料(dataofquantitativecharacteristics)。數(shù)量性狀資料的獲得有計數(shù)和測量兩種方式,因而數(shù)量性狀資料又分為計數(shù)資料和計量資料兩種。一、數(shù)量性狀資料
1、計數(shù)資料指用計數(shù)方式獲得的數(shù)量性狀資料。各個觀察值只能以整數(shù)表示,在兩個相鄰整數(shù)間不得有任何帶小數(shù)的數(shù)值出現(xiàn),各觀察值是不連續(xù)的.
該類資料也稱為非連續(xù)變量資料或間斷變量資料或離散變量資料。2、計量資料指用測量或度量法獲得的數(shù)量性狀資料,即用度、量、衡等計量工具直接測定獲得的數(shù)據(jù)資料。其數(shù)據(jù)是用長度、重量、容積、溫度、濃度等來表示,要帶單位。兩個相鄰的整數(shù)間可以有帶小數(shù)的任何數(shù)值出現(xiàn),其小數(shù)位數(shù)的多少由度量工具的精確度而定,計量資料也稱為連續(xù)變量資料。
二、質(zhì)量性狀資料質(zhì)量性狀(qualitativecharacter)是指能觀察到而不能直接測量的性狀。觀察質(zhì)量性狀而獲得的數(shù)據(jù)就是質(zhì)量性狀資料(dataofqualitativecharacteristics),也稱為屬性性狀資料。這類性狀本身不能直接用數(shù)值表示,要獲得這類性狀的數(shù)據(jù)資料,須對其觀察結(jié)果作數(shù)量化處理,其方法有以下兩種:1、統(tǒng)計次數(shù)法
在一定的總體或樣本中,根據(jù)某一質(zhì)量性狀的類別統(tǒng)計其次數(shù),以次數(shù)作為質(zhì)量性狀的數(shù)據(jù)。例如,在研究豌豆的花色遺傳時,紅花與白花雜交,子二代中紅花、紫花和白花的株數(shù)分類統(tǒng)計如下表。株數(shù)頻率紅花26626.6%紫花49449.4%白花24024.0%總計1000100.0%這種由質(zhì)量性狀數(shù)量化得來的資料又叫次數(shù)資料。2、評分法對某一質(zhì)量性狀分成不同級別,對不同級別進(jìn)行評分來表示其性狀差異的方法。從而將質(zhì)量性狀進(jìn)行數(shù)量化,以便統(tǒng)計分析。例如,試劑pH值由酸到堿分成14個等級,取待測試劑滴在pH試紙上,與pH標(biāo)準(zhǔn)色版對比,由紅到紫分別定義為1-14
的數(shù)值。
兩種不同類型的資料相互間是有區(qū)別的,但有時可根據(jù)研究的目的和統(tǒng)計方法的要求將一種類型資料轉(zhuǎn)化成另一種類型的資料。例如,獸醫(yī)臨床化驗動物的白細(xì)胞總數(shù)得到的資料屬于計數(shù)資料,根據(jù)化驗的目的,可按白細(xì)胞總數(shù)過高、正?;蜻^低分為三組,清點各組的次數(shù),計數(shù)資料就轉(zhuǎn)化為質(zhì)量性狀次數(shù)資料。第一節(jié):試驗資料的搜集與整理一、試驗資料的類型二、試驗資料的搜集三、試驗資料的整理調(diào)查試驗資料搜集的方法一、調(diào)查
調(diào)查是對已經(jīng)存在的事情的資料按某種方案進(jìn)行收集的方法。如地質(zhì)調(diào)查、水樣調(diào)查、河南省內(nèi)的昆蟲調(diào)查等等。資料的調(diào)查又可以分為兩種:普查和抽樣調(diào)查。1、普查
是對研究對象的全部個體逐一進(jìn)行調(diào)查的方法。2、抽樣調(diào)查是根據(jù)一定的原則從研究對象中抽取一部分具有代表性的個體進(jìn)行調(diào)查的方法。二、試驗
試驗是對已有的或沒有的事物加以處理的方法。采用合理的試驗設(shè)計能夠以較少的投入獲得較大的收獲,起到“事半功倍”的效果。常見的試驗設(shè)計方法有:對比設(shè)計、隨機(jī)區(qū)組設(shè)計、平衡不完全區(qū)組設(shè)計、裂區(qū)設(shè)計、拉丁方設(shè)計、正交設(shè)計、正交旋轉(zhuǎn)設(shè)計等等。試驗設(shè)計須遵循的三大原則是:隨機(jī)、重復(fù)和局部控制。第一節(jié):試驗資料的搜集與整理一、試驗資料的類型二、試驗資料的搜集三、試驗資料的整理三、試驗資料的整理(一)原始資料的檢查與核對調(diào)查試驗原始數(shù)據(jù)核對:數(shù)據(jù)本身是否有錯誤檢查:取樣是否有差錯訂正:不合理數(shù)據(jù)的訂正檢查和核對原始資料的目的:確保原始資料的完整性和正確性。完整性:是指原始資料無遺缺或重復(fù)。正確性:是指原始資料的測量和記載無差錯或未進(jìn)行不合理的歸并。檢查中要特別注意特大、特小和異常數(shù)據(jù)(可結(jié)合專業(yè)知識作出判斷)。對于有重復(fù)、異?;蜻z漏的資料,應(yīng)予以刪除或補(bǔ)齊;對有錯誤、相互矛盾的資料應(yīng)進(jìn)行更正,必要時進(jìn)行復(fù)查或重新試驗。不必分組,直接進(jìn)行統(tǒng)計分析小樣本n<30將數(shù)據(jù)分成若干組以便統(tǒng)計分析大樣本n≥30次數(shù)分布表次數(shù)分布圖統(tǒng)計分析樣本大小三、試驗資料的整理(二)次數(shù)分布表統(tǒng)計表的結(jié)構(gòu)和要求:結(jié)構(gòu)簡單,層次分明,安排合理,重點突出,數(shù)據(jù)準(zhǔn)確。總橫標(biāo)目(或空白)縱標(biāo)目1縱標(biāo)目2……橫標(biāo)目1橫標(biāo)目2數(shù)字資料……表號標(biāo)題1、標(biāo)題簡明扼要、準(zhǔn)確地說明表的內(nèi)容,有時須注明時間、地點。2、標(biāo)目標(biāo)目分橫標(biāo)目和縱標(biāo)目兩項。橫標(biāo)目列在表的左側(cè),縱標(biāo)目列在表的上端,標(biāo)目需注明計算單位,如%、kg、cm等等。3、數(shù)字一律用阿拉伯?dāng)?shù)字,數(shù)字以小數(shù)點對齊,小數(shù)位數(shù)一致,無數(shù)字的用“─”表示,數(shù)字是“0”的,則填寫“0”。4、線條多用三線表,上下兩條邊線略粗。三、試驗資料的整理1計數(shù)資料的整理計數(shù)資料基本上采用單項式分組法進(jìn)行整理。特點:用樣本變量自然值進(jìn)行分組,每組用一個或幾個變量值來表示。1712141314121114131614141317151414161414151514141411131214131413151413151413141516161413141513151315151514141614151713161416151314141414161213121412151615161413151714131412171415表2-1
100只來亨雞每月的產(chǎn)蛋數(shù)11~17來亨雞每月產(chǎn)蛋數(shù)變動范圍:分為7組統(tǒng)計各組次數(shù)計算頻率和累積頻率制表每月產(chǎn)蛋數(shù)次數(shù)頻率累積頻率
FrequencyPercentCumulativePercent1120.020.021270.070.0913190.190.2814350.350.6315210.210.8416110.110.951750.051.00表2-2
100只來亨雞每月產(chǎn)蛋數(shù)次數(shù)分布表1自然值進(jìn)行分組,最大值17,最小值11。2數(shù)據(jù)主要集中在14,向兩側(cè)分布逐漸減少。表2-3小麥品種300個麥穗穗粒數(shù)的次數(shù)分布表每穗粒數(shù)次數(shù)頻率累積頻率
FrequencyPercentCumulativePercent
18-2230.01000.010023-27180.06000.0700
28-32
380.12670.1967
33-37510.17000.3667
38-42680.22670.5934
43-47530.17660.7700
48-52410.13670.906753-57220.07330.980058-6260.02001.000045組?9組三、試驗資料的整理2計量資料的整理計量資料一般采用組距式(組限式)分組法。全距組數(shù)組距組限歸組制表表2-4
150尾鰱魚體長(cm)564962784147654558555965696273525260516278664558586057525148564658707276775666585855535065635765855958546248634661625738585254556652485675725737467656637565485255546271486258465738545365428366485358464626367655605458495256826365547565864677706940565861545352435264585854785256615954596468515968635263(1)求全距,又稱極差
(range):R=Xmax-Xmin
=85-37=48(cm)(2)確定組數(shù)和組距(classboundary)組數(shù)是根據(jù)樣本觀測數(shù)的多少及組距的大小來確定的,同時考慮到對資料要求的精確度以及進(jìn)一步計算是否方便。組數(shù)組距多小統(tǒng)計數(shù)精確,計算不方便少大統(tǒng)計數(shù)不精確,計算方便組數(shù)的確定樣本容量分組數(shù)
30~60
5~860~100
7~10100~200
9~12200~500
10~18>500
15~30表2-5樣本容量與分組數(shù)的關(guān)系組距的確定即每組內(nèi)的上下限范圍。組距=全距/組數(shù)=48/10=4.810組5cm(3)確定組限(classlimit)和組中值(classmidvalue)組限是指每個組變量值的起止界限。上限下限組中值是兩個組限的中間值。組中值=下限+上限2=組距2下限+=組距2上限-第一組的組中值最好接近于資料的最小值表2-4
150尾鰱魚體長(cm)564962784147654558555965696273525260516278664558586057525148564658707276775666585855535065635765855958546248634661625738585254556652485675725737467656637565485255546271486258465738545365428366485358464626367655605458495256826365547565864677706940565861545352435264585854785256615954596468515968635263最小一組的下限必須小于資料中的最小值,最大一組的上限必須大于資料中的最大值;組限可取到10分位或5分位上;臨界值就高不就低。35~,40~,45~,…,85~。(4)分組確定好組數(shù)和各組上下限后,可按原始資料中各觀測值的次序,將各個數(shù)值歸于各組,計算各組的觀測數(shù)次數(shù)、頻率、累積頻率,制成一個次數(shù)分布表。計數(shù)的方法卡片法唱票法畫“正”字畫“”
組限組中值次數(shù)頻率累積頻率
FrequencyPercentCumulativePercent35~37.530.02000.020040~42.540.02670.046745~47.5170.11330.160050~52.5280.18670.3467
55~57.540
0.26660.613360~62.5250.16670.780065~67.5170.11330.897370~72.560.04000.933375~77.570.04670.980080~82.520.01330.993385~87.510.00671.0000表2-6
150尾鰱魚體長的次數(shù)分布表三、試驗資料的整理(三)次數(shù)分布圖和頻率分布圖定義:把次數(shù)(頻率)分布資料畫成統(tǒng)計圖形。特點:直觀、形象包括:條形圖、餅圖、直方圖、多邊形圖和散點圖三、試驗資料的整理統(tǒng)計圖繪制的基本要求:(1)標(biāo)題簡明扼要,列于圖的下方;(2)縱、橫兩軸應(yīng)有刻度,注明單位;(3)橫軸由左至右,縱軸由下而上,數(shù)值由小到大;圖形長寬比例約5:4或6:5;(4)圖中需用不同顏色或線條代表不同事物時,應(yīng)有圖例說明。圖2.1月產(chǎn)蛋數(shù)次數(shù)分布柱形圖圖2.2月產(chǎn)蛋數(shù)頻率分布柱形圖條形圖(barchart),又稱柱形圖計數(shù)資料特點:柱形之間要間隔一定的距離屬性資料2餅圖(piechart)圖1來亨雞月產(chǎn)蛋次數(shù)分布圖計數(shù)資料屬性資料圖2.3鰱魚體長次數(shù)分布圖3直方圖(histogram),又稱矩形圖計量資料354045505560657075808590特點:各組之間沒有距離三、試驗資料的整理圖2.3鰱魚體長次數(shù)分布圖354045505560657075808590組中值4多邊形圖(polygon),又稱折線圖(broken-linechart)計量資料圖2.3鰱魚體長次數(shù)分布圖5散點圖(scatter)123456432112345643211234564321a.正向直線關(guān)系b.負(fù)向直線關(guān)系c.曲線關(guān)系表幾種動物性食品的營養(yǎng)成分例:牛奶牛肉雞蛋咸帶魚搜集、歸納原始數(shù)據(jù)用表格、圖形來表達(dá)數(shù)據(jù)用量化的統(tǒng)計學(xué)指標(biāo)來描述一組定量數(shù)據(jù)的分布特征第二節(jié)試驗資料特征數(shù)的計算集中性是變量在趨勢上有著向某一中心聚集,或者說以某一數(shù)值為中心而分布的性質(zhì)。離散性是變量有著離中分散變異的性質(zhì)。變量的分布具有兩種明顯的基本特征:集中性和離散性。集中性離散性平均數(shù)變異數(shù)算術(shù)平均數(shù)中位數(shù)眾數(shù)幾何平均數(shù)極差方差標(biāo)準(zhǔn)差變異系數(shù)調(diào)和平均數(shù)特征數(shù)一、平均數(shù)平均數(shù)是統(tǒng)計學(xué)中最常用的統(tǒng)計量,是計量資料的代表值,表示資料中觀測數(shù)的中心位置,并且可作為資料的代表與另一組相比較,以確定二者的差異情況。一、平均數(shù)(一)平均數(shù)的種類算術(shù)平均數(shù)中位數(shù)眾數(shù)幾何平均數(shù)調(diào)和平均數(shù)一、平均數(shù)1.算術(shù)平均數(shù)(arithmeticmean)定義:總體或樣本資料中所有觀測數(shù)的總和除以觀測數(shù)的個數(shù)所得的商,簡稱平均數(shù)、均數(shù)或均值??傮w:樣本:一、平均數(shù)2.中位數(shù)(median)
資料中所有觀測數(shù)依大小順序排列,居于中間位置的觀測數(shù)稱為中位數(shù)或中數(shù)。Md
中位數(shù)將該組數(shù)值分為兩半,理論上有50%的變量小于md,,有50%的變量值大于
md,故又稱百分之五十位數(shù),記為P50。1、當(dāng)觀測值個數(shù)n為奇數(shù)時,(n+1)/2位置的觀測值,即x(n+1)/2為中位數(shù):
Md=
2、當(dāng)觀測值個數(shù)為偶數(shù)時,n/2和(n/2+1)位置的兩個觀測值之和的1/2為中位數(shù),即:
一、平均數(shù)3.眾數(shù)(mode)
資料中出現(xiàn)次數(shù)最多的那個觀測值或次數(shù)最多一組的組中值或中點值。M0注意:(1)對于某些數(shù)據(jù)而言,如均勻分布,并不存在眾數(shù);(2)對于某些數(shù)據(jù)存在兩個或兩個以上的眾數(shù);(3)主要用來描述頻率分布。一、平均數(shù)(二)算術(shù)平均數(shù)的計算方法直接計算法減去常數(shù)法加權(quán)平均法一、平均數(shù)(三)算術(shù)平均數(shù)的重要性質(zhì)算術(shù)平均數(shù)與樣本內(nèi)的每個值都相關(guān),它的大小受每個值的影響;若每個Xi都乘以相同的數(shù)k,則原平均數(shù)亦應(yīng)乘以k;若每個Xi都加上相同的數(shù)a,則原平均數(shù)亦可直接加上a。離均差之和等于零。離均差平方和最小。一、平均數(shù)(四)算術(shù)平均數(shù)的作用(1)指出一組數(shù)據(jù)資料內(nèi)變量的中心位置,標(biāo)志著資料所代表性狀的數(shù)量水平和質(zhì)量水平。(2)作為樣本或資料的代表數(shù)與其他資料進(jìn)行比較。
集中趨勢是數(shù)據(jù)分布的一個重要特征,但單有集中趨勢還不能很好地描述數(shù)據(jù)的分布規(guī)律。
僅用平均數(shù)對一個資料的特征作統(tǒng)計描述是不全面的,還需要引入一個表示資料中觀測值變異程度大小的統(tǒng)計量。變異性指標(biāo)二、變異數(shù)變異數(shù)的種類極差方差標(biāo)準(zhǔn)差變異系數(shù)二、變異數(shù)(一)極差(全距,range)
極差是數(shù)據(jù)分布的兩端變異的最大范圍,即樣本變量值最大值和最小值之差,用R表示。它是資料中各觀測值變異程度大小的最簡便的統(tǒng)計量。例:150尾鰱魚體長R=85-37=48(cm)R=max{x1,x2,……,xn}-min{x1,x2,……,xn}={x1,x2,……,xn}max-{x1,x2,……,xn}min二、變異數(shù)三組同年齡、同性別兒童體重(kg)的數(shù)據(jù):
I組:26283032348
II組:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 六年級第一學(xué)期教學(xué)計劃范文合集三篇
- 九年級化學(xué)教學(xué)計劃范文錦集7篇
- 銷售部年度工作計劃
- 師德師風(fēng)的教師演講稿模板5篇
- 人壽保險公司實習(xí)報告合集六篇
- 關(guān)于年會策劃方案范文合集6篇
- 大學(xué)生頂崗實習(xí)周記錦集六篇
- 政府績效評估 課件 蔡立輝 第6-10章 政府績效評估的結(jié)果應(yīng)用與改進(jìn) -政府績效評估在當(dāng)代中國的推進(jìn)
- 2010年高考一輪復(fù)習(xí)教案:必修1 第四章 非金屬及其化合物 全程教學(xué)案
- 2025年農(nóng)林牧漁專用儀器儀表項目發(fā)展計劃
- 美甲顧客檔案表Excel模板
- 公安警察工作總結(jié)匯報PPT模板
- 精美小升初簡歷小學(xué)生自我介紹歐式word模板[可編輯]
- 外國文學(xué)專題作業(yè)答案
- 采礦學(xué)課程設(shè)計陳四樓煤礦1.8mta新井設(shè)計(全套圖紙)
- 201X最新離婚協(xié)議書(簡潔版)
- 標(biāo)簽打印流程
- UI界面設(shè)計規(guī)范參考模板
- 行列式練習(xí)題目及答案
- 小區(qū)組建首次業(yè)主大會籌備組(會)的籌備、建議方案
- 《無字書圖書館》導(dǎo)讀課
評論
0/150
提交評論