版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、任課教師:陳彥云講課時(shí)數(shù):51課時(shí)學(xué)分:3分生物統(tǒng)計(jì)學(xué)第1頁(yè)內(nèi) 容: 介紹科學(xué)研究中慣用、基本 生物統(tǒng)計(jì)方法與試驗(yàn)設(shè)計(jì)方法 : 資料整理; 平均數(shù)、 標(biāo)準(zhǔn)差與變異系數(shù); 慣用概率分布;平均數(shù)統(tǒng)計(jì)推斷;方差分析; 2 檢驗(yàn);直線回歸與相關(guān);可直線化非線性回歸分析;協(xié)方差分析;試驗(yàn)設(shè)計(jì)基本原理和方法及對(duì)比設(shè)計(jì)、隨機(jī)區(qū)組設(shè)計(jì),裂區(qū)設(shè)計(jì),正交設(shè)計(jì)等。 第2頁(yè) 方 法: 用CAI課件教學(xué),以課堂講授為主 要 求: 了 解 基本原理; 熟練掌握 所介紹幾個(gè)試驗(yàn)設(shè)計(jì)方法,能 獨(dú)立進(jìn)行試驗(yàn)設(shè)計(jì); 熟練掌握 所介紹幾個(gè)生物統(tǒng)計(jì)方法,能 獨(dú)立進(jìn)行試驗(yàn)結(jié)果統(tǒng)計(jì)分析; 熟練掌握 電子計(jì)算器使用。下一張 主 頁(yè) 退 出
2、 上一張 第3頁(yè) 培 養(yǎng) 嚴(yán)謹(jǐn)治學(xué)態(tài)度 精細(xì)治學(xué)作風(fēng) 獨(dú)立自學(xué)能力下一張 主 頁(yè) 退 出 上一張 第4頁(yè)成績(jī)?cè)u(píng)定: 平時(shí)作業(yè),30% 期末考試,70%作業(yè)要求: 獨(dú)立思索 演算正確 作圖清楚 書(shū)寫(xiě)整齊下一張 主 頁(yè) 退 出 上一張 第5頁(yè) 主 要 教 學(xué) 參 考 文 獻(xiàn) 1明道緒主編. 生物統(tǒng)計(jì). 中國(guó)農(nóng)業(yè)科技出版社,1998。 2明道緒主編. 獸醫(yī)統(tǒng)計(jì)方法. 成都科技大學(xué)出版社,1991。 3南京農(nóng)業(yè)大學(xué)主編. 田間試驗(yàn)與統(tǒng)計(jì)方法 (第二版). 農(nóng)業(yè)出版社,1988。 4莫惠棟 . 農(nóng)業(yè)試驗(yàn)設(shè)計(jì). 上??茖W(xué)技術(shù)出版社,1984。 5(美)G.W.斯奈迪格著,楊紀(jì)珂等譯. 應(yīng)用與農(nóng)學(xué)和生物學(xué)試
3、驗(yàn)數(shù)理統(tǒng)計(jì)方法. 科學(xué)出版社,1964。 6(美)RGD斯蒂爾, JH托里著, 楊紀(jì)珂等譯. 數(shù)理統(tǒng)計(jì)原理與方法. 科學(xué)出版社,1976。 7 李春喜等編著。生物統(tǒng)計(jì)學(xué)學(xué)習(xí)指導(dǎo)??茖W(xué)出版社,下一張 主 頁(yè) 退 出 上一張 第6頁(yè) 天天 都是向既定目標(biāo) 前進(jìn)一步贈(zèng) 言下一張 主 頁(yè) 退 出 上一張 zlcc第7頁(yè)E-mail: 陳彥云寧夏大學(xué)生命科學(xué)學(xué)8頁(yè)第一章 概 論第9頁(yè) 第一節(jié) 生物統(tǒng)計(jì)學(xué)概念及主要內(nèi)容第10頁(yè)一、概念 生物統(tǒng)計(jì)學(xué)(Biostatistics)是數(shù)理統(tǒng)計(jì)在生物學(xué)研究中應(yīng)用,它是用數(shù)理統(tǒng)計(jì)原理和方法來(lái)認(rèn)識(shí)、分析、推斷和解釋生命過(guò)程中各種現(xiàn)象和試驗(yàn)調(diào)查
4、資料科學(xué)。屬于生物數(shù)學(xué)范圍。第11頁(yè)二、主要內(nèi)容生 物 基統(tǒng) 本計(jì) 內(nèi)學(xué) 容試 驗(yàn) 設(shè) 計(jì)統(tǒng) 計(jì) 分 析基本標(biāo)準(zhǔn)方案制訂慣用試驗(yàn)設(shè)計(jì)方法資料搜集和整理數(shù)據(jù)特征數(shù)計(jì)算統(tǒng)計(jì)推斷方差分析回歸和相關(guān)分析協(xié)方差分析主成份分析聚類(lèi)分析對(duì)比設(shè)計(jì)隨機(jī)區(qū)組設(shè)計(jì)裂區(qū)設(shè)計(jì)拉丁方設(shè)計(jì)正交設(shè)計(jì)第12頁(yè)三 生物統(tǒng)計(jì)學(xué)基本作用:提供整理和描述數(shù)據(jù)資料科學(xué)方法,確定一些性狀和特征數(shù)量特征。利用顯著檢驗(yàn),判斷試驗(yàn)結(jié)果可靠性或可行性。提供由樣本推斷總體方法。提供試驗(yàn)設(shè)計(jì)一些主要標(biāo)準(zhǔn)。第13頁(yè)第二節(jié) 生物統(tǒng)計(jì)學(xué)發(fā)展概況 統(tǒng)計(jì)發(fā)展史能夠追溯到遠(yuǎn)古原始社會(huì),不過(guò),能使人類(lèi)統(tǒng)計(jì)實(shí)踐上升到理論上給予概括總結(jié)程度,即開(kāi)始成為一門(mén)系統(tǒng)學(xué)科統(tǒng)計(jì)
5、學(xué),卻是近代事情,距今只有三百余年短暫歷史。 當(dāng)代統(tǒng)計(jì)學(xué)起源于17世紀(jì),主要有兩個(gè)起源:1政治科學(xué)需要,2當(dāng)初貴族階層對(duì)機(jī)率數(shù)學(xué)理論很感興趣而發(fā)展起來(lái)。另外,研究天文學(xué)需要也促進(jìn)了統(tǒng)計(jì)學(xué)發(fā)展。統(tǒng)計(jì)學(xué)發(fā)展概貌,大致可劃分為古典統(tǒng)計(jì)統(tǒng)計(jì)學(xué)、近代描述統(tǒng)計(jì)學(xué)和當(dāng)代推斷統(tǒng)計(jì)學(xué)三種形態(tài)。第14頁(yè)一、發(fā)展概況原始社會(huì)奴隸社會(huì)封建社會(huì)資本主義社會(huì)快速發(fā)展形成份支生物統(tǒng)計(jì)學(xué)第15頁(yè)形成不一樣學(xué)派:1、政治算術(shù)學(xué)派起源于17世紀(jì)60年代英國(guó)代表人物:威廉.配第(William Petty,16231687) 約翰.格朗托(John Graunt,16201674)代表作:政治算術(shù)但未采取“統(tǒng)計(jì)學(xué)”這個(gè)詞第16頁(yè)2
6、、國(guó)勢(shì)學(xué)派,又叫記述學(xué)派創(chuàng)建于17世紀(jì)德國(guó)代表人物:海爾曼.康令(Herman Conring,16061681) 阿痕瓦爾(Gottfried Achenwall,17911772)代表作:近代歐洲各國(guó)國(guó)勢(shì)論首次采取“stastistik” 德國(guó)經(jīng)濟(jì)學(xué)家和統(tǒng)計(jì)學(xué)家克尼斯(K . G . A Knies,18211898)在1850年發(fā)表論文獨(dú)立科學(xué)統(tǒng)計(jì)學(xué)中主張把“國(guó)家論”作為“國(guó)勢(shì)學(xué)”科學(xué)命名,“統(tǒng)計(jì)學(xué)”作為“政治算術(shù)”科學(xué)命名。第17頁(yè)3、數(shù)理統(tǒng)計(jì)學(xué)派產(chǎn)生于19世紀(jì)中葉代表人物:阿道夫.凱特勒(L.A.J Quetelet,17961874) 高爾登(F.Galtonl,18221911)
7、 皮爾遜(K.Pearson,18571936 )逐步形成一門(mén)獨(dú)立應(yīng)用數(shù)學(xué)。 1867年韋特斯坦(T.Wittstein)把既是數(shù)學(xué),又是統(tǒng)計(jì)學(xué)新生科學(xué)命名為數(shù)理統(tǒng)計(jì)學(xué)。第18頁(yè)4、社會(huì)統(tǒng)計(jì)學(xué)派以德國(guó)為中心,創(chuàng)建于19世紀(jì)后期代表人物:恩格爾(C.I.E. Engel,18211896) 梅爾( C.G.V. Mager ,18411925)認(rèn)為統(tǒng)計(jì)學(xué)研究對(duì)象是社會(huì)科學(xué),而數(shù)理統(tǒng)計(jì)學(xué)是一門(mén)應(yīng)用數(shù)學(xué)。19世紀(jì)中葉誕生了馬克思主義統(tǒng)計(jì)理論,以后,列寧對(duì)其進(jìn)行了豐富和發(fā)展。第19頁(yè)二、統(tǒng)計(jì)學(xué)發(fā)展史中重大事件與主要代表人物J.Bernoulli(貝努里,瑞士,16541705) 系統(tǒng)論證了“大數(shù)定律”
8、,即樣本容量越大,樣本統(tǒng)計(jì)數(shù)與總體參數(shù)之差越小。P.S. Laplace(拉普拉斯,法國(guó),17491827) 最早系統(tǒng)把概率論方法利用到統(tǒng)計(jì)學(xué)研究中去,建立了嚴(yán)密概率數(shù)學(xué)理論,并應(yīng)用到人口統(tǒng)計(jì)、天文學(xué)等方面研究上。第20頁(yè)Gauss(高斯,德國(guó),17771855) 正態(tài)分布理論最早由De Moiver于1733年發(fā)覺(jué),以后Gauss在進(jìn)行天文觀察和研究土地測(cè)量誤差理論時(shí)又一次獨(dú)立發(fā)覺(jué)了正態(tài)分布(又稱(chēng)常態(tài)分布)理論方程,提出“誤差分布曲線”,后人為了紀(jì)念他,將正態(tài)分布也稱(chēng)為Gauss分布。第21頁(yè)F. Galton(高爾登,英國(guó),18221911) 19世紀(jì)末統(tǒng)計(jì)學(xué)開(kāi)始用于生物學(xué)研究。1882年
9、Galton開(kāi)設(shè)“人體測(cè)量試驗(yàn)室”,測(cè)量9337人資料,探索能把大量數(shù)據(jù)加以描述與比較方法和路徑,引入了中位數(shù)、百分位數(shù)、四分位數(shù)、四分位差以及分布、相關(guān)、回歸等主要統(tǒng)計(jì)學(xué)概念與方法。1889年發(fā)表第一篇生物統(tǒng)計(jì)論文自然界遺傳。19Galton和他學(xué)生Pearson創(chuàng)辦了“Biometrika(生物統(tǒng)計(jì)學(xué)報(bào))”雜志,首次明確“Biometry(生物統(tǒng)計(jì))”一詞。所以后人推崇Galton為生物統(tǒng)計(jì)學(xué)創(chuàng)始人。第22頁(yè)K. Pearson(卡.皮爾遜,英國(guó),18571936) Pearson一生是統(tǒng)計(jì)研究一生。他首創(chuàng)頻數(shù)分布表與頻數(shù)分布圖,如今已成為最基本統(tǒng)計(jì)方法之一;觀察到許多生物度量并不展現(xiàn)正態(tài)
10、分布,利用相對(duì)斜率得到矩形分布、J型分布、U型分布或鈴型分布等;19獨(dú)立發(fā)覺(jué)了X2分布,提出了有名卡方檢驗(yàn)法,后經(jīng)Fisher補(bǔ)充,成為小樣本推斷統(tǒng)計(jì)早期方法之一; Pearson對(duì)“回歸與相關(guān)”深入作了發(fā)展,在189719,Pearson還提出復(fù)相關(guān)、總相關(guān)、相關(guān)比等概念,不但發(fā)展了Galton相關(guān)理論,還為之建立了數(shù)學(xué)基礎(chǔ)。第23頁(yè)W.S.Gosset(歌賽特,英國(guó),17771855) 在生產(chǎn)實(shí)踐中對(duì)樣本標(biāo)準(zhǔn)差進(jìn)行了大量研究。于19以“Student(學(xué)生)”為筆名在該年Biometrika上發(fā)表了論文平均數(shù)概率誤差,創(chuàng)建了小樣本檢驗(yàn)代替大樣本檢驗(yàn)理論,即t分布和t檢驗(yàn)法,也稱(chēng)為學(xué)生式分布
11、。t檢驗(yàn)已成為當(dāng)代生物統(tǒng)計(jì)工作基本工具之一,為多元分析理論形成和應(yīng)用奠定了基礎(chǔ),為此,許多統(tǒng)計(jì)學(xué)家把19看作是統(tǒng)計(jì)推斷理論發(fā)展史上里程碑。第24頁(yè)R.A.Fisher(費(fèi)歇爾,英國(guó),18901962) Fisher一生論著頗多,共寫(xiě)了329篇。他跨進(jìn)統(tǒng)計(jì)學(xué)界是從研究概率分布開(kāi)始,19在Biometrika上發(fā)表論文無(wú)限總體樣本相關(guān)系數(shù)值頻率分布,被稱(chēng)為當(dāng)代推斷統(tǒng)計(jì)學(xué)第一篇論文。1923年發(fā)展了顯著性檢驗(yàn)及預(yù)計(jì)理論,提出了F分布和F檢驗(yàn),19在孟德?tīng)栠z傳試驗(yàn)設(shè)計(jì)間相對(duì)關(guān)系一文中首創(chuàng)“方差”和“方差分析”兩個(gè)概念,1925年提出隨機(jī)區(qū)組和正交拉丁方試驗(yàn)設(shè)計(jì),并在盧桑姆斯坦德農(nóng)業(yè)試驗(yàn)站得到檢驗(yàn)與應(yīng)用
12、,他還在試驗(yàn)設(shè)計(jì)中提出“隨機(jī)化”標(biāo)準(zhǔn),1938年和Yates合編了Fisher Yates隨機(jī)數(shù)字表。第25頁(yè)另外 Neyman(18941981)和S.Pearson進(jìn)行了統(tǒng)計(jì)理論研究,分別與1936和1938年提出一個(gè)統(tǒng)計(jì)假說(shuō)檢驗(yàn)學(xué)說(shuō)。P.C.Mabeilinrobis對(duì)作物抽樣調(diào)查、A.Waecl對(duì)序貫抽樣、Finney對(duì)毒理統(tǒng)計(jì)、K.Mather對(duì)生統(tǒng)遺傳學(xué)、F.Yates對(duì)田間試驗(yàn)設(shè)計(jì)等都作出了出色貢獻(xiàn)。第26頁(yè)三、統(tǒng)計(jì)學(xué)在中國(guó)傳輸 我國(guó)在解放前,社會(huì)經(jīng)濟(jì)發(fā)展遲緩,統(tǒng)計(jì)應(yīng)用和發(fā)展受到了很大限制。19,顧澄教授(1882?)翻譯了英國(guó)統(tǒng)計(jì)學(xué)家尤爾著作統(tǒng)計(jì)學(xué)之理論(1911),即為英美數(shù)
13、理統(tǒng)計(jì)學(xué)傳入中國(guó)之始。之后又有一些英美統(tǒng)計(jì)著作被翻譯成漢字,F(xiàn)isher理論和方法也很快傳入中國(guó)。 在20世紀(jì)30年代,生物統(tǒng)計(jì)與田間試驗(yàn)就作為農(nóng)學(xué)系必修課,1935年王綬(18761972)編著出版實(shí)用生物統(tǒng)計(jì)法是我國(guó)出版最早生物統(tǒng)計(jì)專(zhuān)著之一。隨即1942年范福仁出版了田間試驗(yàn)技術(shù)等,這些對(duì)推進(jìn)我國(guó)農(nóng)業(yè)生物統(tǒng)計(jì)和田間試驗(yàn)方法應(yīng)用都產(chǎn)生了很大影響。第27頁(yè) 新中國(guó)成立后,許多學(xué)者翻譯、編著了統(tǒng)計(jì)學(xué)論著,有力推進(jìn)了數(shù)理統(tǒng)計(jì)方法在中國(guó)普及和應(yīng)用。1978年12月國(guó)家統(tǒng)計(jì)局在四川峨眉召開(kāi)了統(tǒng)計(jì)教學(xué)、科研規(guī)劃座談會(huì),全方面引進(jìn)了前蘇聯(lián)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)理論和統(tǒng)計(jì)制度,對(duì)我國(guó)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)發(fā)展起到了一定主動(dòng)作
14、用。這以后相關(guān)統(tǒng)計(jì)學(xué)教材與論著如雨后春筍般涌現(xiàn),統(tǒng)計(jì)工作和統(tǒng)計(jì)科研快速發(fā)展。1984年1月1日頒布實(shí)施中華人民共和國(guó)統(tǒng)計(jì)法,1987年2月國(guó)家統(tǒng)計(jì)局又公布中華人民共和國(guó)統(tǒng)計(jì)法實(shí)施細(xì)則,1996年5月八屆人大十九次會(huì)議經(jīng)過(guò)了關(guān)于修改決定。 伴隨計(jì)算機(jī)快速普及,統(tǒng)計(jì)電算程序SAS(Statistical Analysis System)、SPSS(Statistical Package for Social Science) 、 Excel等引進(jìn),統(tǒng)計(jì)學(xué)在中國(guó)應(yīng)用與研究出現(xiàn)了嶄新局面。第28頁(yè)第三節(jié) 慣用統(tǒng)計(jì)學(xué)術(shù)語(yǔ)一、總體與樣本含有相同性質(zhì)或?qū)傩詡€(gè)體所組成集合稱(chēng)為總體 (population),它
15、是指研究對(duì)象全體;組成總體基本單元稱(chēng)為個(gè)體(individual);從總體中抽出若干個(gè)體所組成集合稱(chēng)為樣本(sample);總體又分為有限總體和無(wú)限總體:含有有限個(gè)個(gè)體總體稱(chēng)為有限總體(finitude popuoation);包含有極多或無(wú)限多個(gè)體總體稱(chēng)為無(wú)限總體(infinitude popuoation).第29頁(yè) 組成樣本每個(gè)個(gè)體稱(chēng)為樣本單位;樣本中所包含個(gè)體數(shù)目叫樣本容量或樣本大小(sample size),樣本容量常記為n。 普通在生物學(xué)研究中,通常把n30樣本叫小樣本,n 30樣本叫大樣本。對(duì)于小樣本和大樣本,在一些統(tǒng)計(jì)數(shù)計(jì)算和分析檢驗(yàn)上是不一樣。 研究目標(biāo)是要了解總體,然而能觀
16、察到卻是樣本,經(jīng)過(guò)樣原來(lái)推斷總體是統(tǒng)計(jì)分析基本特點(diǎn)。第30頁(yè)二、變量與常量 變量,或變數(shù),指相同性質(zhì)事物間表現(xiàn)差異性或差異特征數(shù)據(jù)。 常數(shù),表示能代表事物特征和性質(zhì)數(shù)值,通常由變量計(jì)算而來(lái),在一定過(guò)程中是不變。第31頁(yè)變量定性變量定量變量連續(xù)變量非連續(xù)變量只有整數(shù)出現(xiàn)能夠有任何小數(shù)出現(xiàn)第32頁(yè) 為了表示總體和樣本數(shù)量特征,需要計(jì)算出幾個(gè)特征數(shù),包含平均數(shù)和變異數(shù)(極差、方差、標(biāo)準(zhǔn)差等)。 描述總體特征數(shù)量稱(chēng)為參數(shù)(parameter),也稱(chēng)參量。慣用希臘字母表示參數(shù),比如用表示總體平均數(shù),用表示總體標(biāo)準(zhǔn)差; 描述樣本特征數(shù)量稱(chēng)為統(tǒng)計(jì)數(shù)(staistic),也稱(chēng)統(tǒng)計(jì)量。慣用拉丁字母表示統(tǒng)計(jì)數(shù),比
17、如用 表 示樣本平均數(shù),用S表示樣本標(biāo)準(zhǔn)差。三、參數(shù)與統(tǒng)計(jì)數(shù)第33頁(yè)四、效應(yīng)與互作 經(jīng)過(guò)施加試驗(yàn)處理,引發(fā)試驗(yàn)差異作用稱(chēng)為效應(yīng)。效應(yīng)是一個(gè)相對(duì)量,而非絕對(duì)量,表現(xiàn)為施加處理前后差異。效應(yīng)有正效應(yīng)與負(fù)效應(yīng)之分。 互作,又叫連應(yīng),是指兩個(gè)或兩個(gè)以上處理原因間相互作用產(chǎn)生效應(yīng)。互作也有正效應(yīng)(協(xié)同作用)與負(fù)效應(yīng)(拮抗作用)之分。第34頁(yè)五、機(jī)誤與錯(cuò)誤變異效應(yīng)誤差隨機(jī)誤差機(jī)誤(Random error)系統(tǒng)誤差錯(cuò)誤(Systematic error)第35頁(yè) 隨機(jī)誤差,也叫 抽樣誤差(sampling error) 。這是因?yàn)樵囼?yàn)中無(wú)法控制內(nèi)在和外在偶然原因所造成。如試驗(yàn)動(dòng)物初始條件、喂養(yǎng)條件、管理辦
18、法等盡管在試驗(yàn)中力爭(zhēng)一致,但也不可能到達(dá)絕對(duì)一致,所以隨機(jī)誤差帶有偶然性質(zhì),在試驗(yàn)中,即使十分小心也是不可防止。假如經(jīng)過(guò)良好試驗(yàn)設(shè)計(jì)、正確試驗(yàn)操作,增加抽樣或試驗(yàn)次數(shù),隨機(jī)誤差可能減小,但不可能完全毀滅。統(tǒng)計(jì)上試驗(yàn)誤差普通都指隨機(jī)誤差。隨機(jī)誤差越小,試驗(yàn)準(zhǔn)確性越高。第36頁(yè) 系統(tǒng)誤差,也叫片面誤差 (lopsided error)。 這是因?yàn)樵囼?yàn)條件控制不一致、測(cè)量?jī)x器不準(zhǔn)、試劑配制不妥、試驗(yàn)人員粗心大意使稱(chēng)量、觀察、記載、抄錄、計(jì)算中出現(xiàn)錯(cuò)誤等人為原因而引發(fā)。系統(tǒng)誤差影響試驗(yàn)準(zhǔn)確性。只要以認(rèn)真負(fù)責(zé)態(tài)度和細(xì)心工作作風(fēng)是完全能夠防止。第37頁(yè)六、準(zhǔn)確性與準(zhǔn)確性 準(zhǔn)確性(accuracy),也叫準(zhǔn)
19、確度,指在調(diào)查或試驗(yàn)中某一試驗(yàn)指標(biāo)或性狀觀察值與其真值靠近程度。設(shè)某一試驗(yàn)指標(biāo)或性狀真值為,觀察值為 x,若 x與相差絕對(duì)值|x|越小, 則觀察值x準(zhǔn)確性越高; 反之則低。 準(zhǔn)確性(precision),也叫準(zhǔn)確度,指調(diào)查或試驗(yàn)中同一試驗(yàn)指標(biāo)或性狀重復(fù)觀察值彼此靠近程度。若觀察值彼此靠近,即任意二個(gè)觀察值xi 、xj 相差絕對(duì)值|xi xj |越小,則觀察值準(zhǔn)確性越高;反之則低。第38頁(yè)第39頁(yè)試驗(yàn)資料整理特征數(shù)計(jì)算與第二章第40頁(yè)第一節(jié):試驗(yàn)資料搜集與整理一、試驗(yàn)資料類(lèi)型二、試驗(yàn)資料搜集三、試驗(yàn)資料整理第41頁(yè)對(duì)試驗(yàn)資料進(jìn)行分類(lèi)是統(tǒng)計(jì)歸納基礎(chǔ)。試驗(yàn)資料類(lèi)型數(shù)量性狀資料質(zhì)量性狀資料屬性性狀資料
20、計(jì)數(shù)資料非連續(xù)變量資料計(jì)量資料連續(xù)變量資料第42頁(yè) 數(shù)量性狀(quantitative character)是指能夠以計(jì)數(shù)和測(cè)量或度量方式表示其特征性狀。觀察測(cè)定數(shù)量性狀而取得數(shù)據(jù)就是數(shù)量性狀資料 (data of quantitative characteristics)。數(shù)量性狀資料取得有計(jì)數(shù)和測(cè)量?jī)煞N方式,因而數(shù)量性狀資料又分為計(jì)數(shù)資料和計(jì)量資料兩種。一、數(shù)量性狀資料第43頁(yè) 1、計(jì)數(shù)資料 指用計(jì)數(shù)方式取得數(shù)量性狀資料。在這類(lèi)資料中,它各個(gè)觀察值只能以整數(shù)表示,在兩個(gè)相鄰整數(shù)間不得有任何帶小數(shù)數(shù)值出現(xiàn),所以各觀察值是不連續(xù),所以該類(lèi)資料也稱(chēng)為非連續(xù)變量資料或間斷變量資料或離散變量資料。第
21、44頁(yè) 2、計(jì)量資料 指用測(cè)量或度量法取得數(shù)量性狀資料,即用度、量、衡等計(jì)量工具直接測(cè)定取得數(shù)據(jù)資料。其數(shù)據(jù)是用長(zhǎng)度、重量、容積、溫度、濃度等來(lái)表示,要帶單位。這種資料各個(gè)觀察值不一定是整數(shù),兩個(gè)相鄰整數(shù)間能夠有帶小數(shù)任何數(shù)值出現(xiàn),其小數(shù)位數(shù)多少由度量工具準(zhǔn)確度而定, 它們之間變異是連續(xù)性,所以計(jì)量資料也稱(chēng)為連續(xù)變量資料。第45頁(yè) 二、質(zhì)量性狀資料 質(zhì)量性狀(qualitative character)是指能觀察到而不能直接測(cè)量性狀。觀察質(zhì)量性狀而取得數(shù)據(jù)就是質(zhì)量性狀資料(data of qualitative characteristics),也稱(chēng)為屬性性狀資料。這類(lèi)性狀本身不能直接用數(shù)值表
22、示,要取得這類(lèi)性狀數(shù)據(jù)資料,須對(duì)其觀察結(jié)果作數(shù)量化處理,其方法有以下兩種:第46頁(yè) 1、統(tǒng)計(jì)次數(shù)法 在一定總體或樣本中,依據(jù)某一質(zhì)量性狀類(lèi)別統(tǒng)計(jì)其次數(shù),以次數(shù)作為質(zhì)量性狀數(shù)據(jù)。比如,在研究豌豆花色遺傳時(shí),紅花與白花雜交,子二代中紅花、紫花和白花株數(shù)分類(lèi)統(tǒng)計(jì)以下表。株數(shù)頻率紅花26626.6%紫花49449.4%白花24024.0%總計(jì)1000100.0%這種由質(zhì)量性狀數(shù)量化得來(lái)資料又叫次數(shù)資料。第47頁(yè) 2、評(píng)分法 對(duì)某一質(zhì)量性狀分成不一樣級(jí)別,對(duì)不一樣級(jí)別進(jìn)行評(píng)分來(lái)表示其性狀差異方法。從而將質(zhì)量性狀進(jìn)行數(shù)量化,方便統(tǒng)計(jì)分析。第48頁(yè)第一節(jié):試驗(yàn)資料搜集與整理一、試驗(yàn)資料類(lèi)型二、試驗(yàn)資料搜集三
23、、試驗(yàn)資料整理第49頁(yè)調(diào) 查試 驗(yàn)資料搜集方法第50頁(yè)一、調(diào)查 調(diào)查是對(duì)已經(jīng)存在事情資料按某種方案進(jìn)行搜集方法。資料調(diào)查又能夠分為兩種:普查和抽樣調(diào)查。1、普查 是對(duì)研究對(duì)象全部個(gè)體逐一進(jìn)行調(diào)查方法。普查普通要求在一定時(shí)間或范圍進(jìn)行,要求準(zhǔn)確和全方面。第51頁(yè)2、抽樣調(diào)查 是依據(jù)一定標(biāo)準(zhǔn)從研究對(duì)象中抽取一部分含有代表性個(gè)體進(jìn)行調(diào)查方法。經(jīng)過(guò)抽樣將取得樣本資料進(jìn)行統(tǒng)計(jì)處理,然后利用樣本特征數(shù)對(duì)總體進(jìn)行推斷。生物學(xué)研究中,進(jìn)行普查情況較少,多數(shù)情況下還是進(jìn)行抽樣調(diào)查。 隨機(jī)抽樣必須滿足2個(gè)條件:一是總體中每個(gè)個(gè)體被抽中機(jī)會(huì)是均等;二是總體中任意一個(gè)個(gè)體是相互獨(dú)立,是否被抽中不受其它個(gè)體影響。第52
24、頁(yè)二、試驗(yàn) 試驗(yàn)是對(duì)已經(jīng)有或沒(méi)有事物加以處理方法。 常見(jiàn)試驗(yàn)設(shè)計(jì)方法有:對(duì)比設(shè)計(jì)、隨機(jī)區(qū)組設(shè)計(jì)、平衡不完全區(qū)組設(shè)計(jì)、裂區(qū)設(shè)計(jì)、拉丁方設(shè)計(jì)、正交設(shè)計(jì)、正交旋轉(zhuǎn)設(shè)計(jì)等等。 試驗(yàn)設(shè)計(jì)須遵照三大標(biāo)準(zhǔn)是:隨機(jī)、重復(fù)和局部控制。第53頁(yè)第一節(jié):試驗(yàn)資料搜集與整理一、試驗(yàn)資料類(lèi)型二、試驗(yàn)資料搜集三、試驗(yàn)資料整理第54頁(yè)三、試驗(yàn)資料整理(一)原始資料檢驗(yàn)與查對(duì)調(diào)查試驗(yàn)原始數(shù)據(jù)查對(duì)檢驗(yàn)訂正 檢驗(yàn)和查對(duì)原始資料目標(biāo):確保原始資料完整性和正確性。第55頁(yè)三、試驗(yàn)資料整理(二)次數(shù)分布表統(tǒng)計(jì)表結(jié)構(gòu)和要求: 結(jié)構(gòu)簡(jiǎn)單,層次分明,安排合理,重點(diǎn)突出,數(shù)據(jù)準(zhǔn)確??倷M標(biāo)目(或空白)縱標(biāo)目1縱標(biāo)目2橫標(biāo)目1橫標(biāo)目2數(shù)字資料表號(hào)
25、 標(biāo)題1、標(biāo)題 簡(jiǎn)明扼要、準(zhǔn)確地說(shuō)明表內(nèi)容,有時(shí)須注明時(shí)間、地點(diǎn)。2、標(biāo)目 標(biāo)目分橫標(biāo)目和縱標(biāo)目?jī)身?xiàng)。橫標(biāo)目列在表左側(cè) ,縱標(biāo)目列在表上端,標(biāo)目需 注 明計(jì)算單位,如、kg、cm等等。 3、數(shù)字 一律用阿拉伯?dāng)?shù)字,數(shù)字以小數(shù)點(diǎn)對(duì)齊,小數(shù)位數(shù)一致, 無(wú)數(shù)字用“”表示,數(shù)字是“0”,則填寫(xiě)“0”。4、線條 多用三線表,上下兩條邊線略粗。第56頁(yè)三、試驗(yàn)資料整理1 計(jì)數(shù)資料整理計(jì)數(shù)資料基本上采取單項(xiàng)式分組法進(jìn)行整理。特點(diǎn):用樣本變量自然值進(jìn)行分組,每組用一個(gè)或幾個(gè)變量值來(lái)表示。第57頁(yè)17 12 14 13 14 12 11 14 13 16 14 14 13 17 15 14 14 16 1414
26、 15 15 14 14 14 11 13 12 1413 14 13 15 14 13 15 14 13 1415 16 16 14 13 14 15 13 15 1315 15 15 14 14 16 14 15 17 1316 14 16 15 13 14 14 14 14 1612 13 12 14 12 15 16 15 16 1413 15 17 14 13 14 12 17 14 15表2-1 100只來(lái)亨雞每個(gè)月產(chǎn)蛋數(shù)1117來(lái)亨雞每個(gè)月產(chǎn)蛋數(shù)變動(dòng)范圍:分為7組統(tǒng)計(jì)各組次數(shù)計(jì)算頻率和累積頻率制表第58頁(yè)每個(gè)月產(chǎn)蛋數(shù) 次數(shù) 頻率 累積頻率 Frequency Percent Cu
27、mulative Percent 11 2 0.02 0.02 12 7 0.07 0.09 13 19 0.19 0.28 14 35 0.35 0.63 15 21 0.21 0.84 16 11 0.11 0.95 17 5 0.05 1.00表2-2 100只來(lái)亨雞每個(gè)月產(chǎn)蛋數(shù)次數(shù)分布表第59頁(yè)每個(gè)月產(chǎn)蛋數(shù) 次數(shù) 頻率 累積頻率 Frequency Percent Cumulative Percent 11 2 0.02 0.02 12 7 0.07 0.09 13 19 0.19 0.28 14 35 0.35 0.63 15 21 0.21 0.84 16 11 0.11 0.95
28、 17 5 0.05 1.00表2-2 100只來(lái)亨雞每個(gè)月產(chǎn)蛋數(shù)次數(shù)分布表1 自然值進(jìn)行分組,最大值17,最小值11。2 數(shù)據(jù)主要集中在14,向兩側(cè)分布逐步降低。第60頁(yè)表2-3 小麥品種300個(gè)麥穗穗粒數(shù)次數(shù)分布表每穗粒數(shù) 次數(shù) 頻率 累積頻率 Frequency Percent Cumulative Percent 18-22 3 0.0100 0.0100 23-27 18 0.0600 0.0700 28-32 38 0.1267 0.1967 33-37 51 0.1700 0.3667 38-42 68 0.2267 0.5934 43-47 53 0.1766 0.7700 4
29、8-52 41 0.1367 0.9067 53-57 22 0.0733 0.9800 58-62 6 0.0200 1.0000 45組?9 組第61頁(yè)三、試驗(yàn)資料整理2 計(jì)量資料整理計(jì)量資料普通采取組距式分組法。全距組數(shù)組距組限歸組制表第62頁(yè)表2-4150尾鰱魚(yú)體長(zhǎng)(cm)56 49 62 78 41 47 65 45 58 55 59 65 69 62 7352 52 60 51 62 78 66 45 58 58 60 57 52 51 4856 46 58 70 72 76 77 56 66 58 58 55 53 50 6563 57 65 85 59 58 54 62 48
30、63 46 61 62 57 3858 52 54 55 66 52 48 56 75 72 57 37 46 76 5663 75 65 48 52 55 54 62 71 48 62 58 46 57 3854 53 65 42 83 66 48 53 58 46 46 26 36 76 5560 54 58 49 52 56 82 63 65 54 75 65 86 46 7770 69 40 56 58 61 54 53 52 43 52 64 58 58 5478 52 56 61 59 54 59 64 68 51 59 68 63 52 63(1) 求全距, 又稱(chēng)極差 (rang
31、e):R=Xmax- Xmin =85-37 =48(cm)第63頁(yè)(2) 確定組數(shù)和組距(class boundary) 組數(shù)是依據(jù)樣本觀察數(shù)多少及組距大小來(lái)確定,同時(shí)考慮到對(duì)資料要求準(zhǔn)確度以及深入計(jì)算是否方便。組數(shù)組距多小統(tǒng)計(jì)數(shù)準(zhǔn)確,計(jì)算不方便少大統(tǒng)計(jì)數(shù)不準(zhǔn)確,計(jì)算方便第64頁(yè)組數(shù)確定樣本容量 分組數(shù) 3060 5 8 60 100 7 10100 200 9 12200 500 10 18 500 15 30表2-5樣本容量與分組數(shù)關(guān)系組距確定即每組內(nèi)上下限范圍。組距全距/組數(shù)48104.810組5cm第65頁(yè)(3)確定組限(class limit)和組中值(class midvalue
32、)組限 是指每個(gè)組變量值起止界限。上限下限組中值 是兩個(gè)組限中間值。組中值下限上限 2組距2下限組距2上限第66頁(yè)表2-4150尾鰱魚(yú)體長(zhǎng)(cm)56 49 62 78 41 47 65 45 58 55 59 65 69 62 7352 52 60 51 62 78 66 45 58 58 60 57 52 51 4856 46 58 70 72 76 77 56 66 58 58 55 53 50 6563 57 65 85 59 58 54 62 48 63 46 61 62 57 3858 52 54 55 66 52 48 56 75 72 57 37 46 76 5663 75 6
33、5 48 52 55 54 62 71 48 62 58 46 57 3854 53 65 42 83 66 48 53 58 46 46 26 36 76 5560 54 58 49 52 56 82 63 65 54 75 65 86 46 7770 69 40 56 58 61 54 53 52 43 52 64 58 58 5478 52 56 61 59 54 59 64 68 51 59 68 63 52 63最小一組下限必須小于資料中最小值,最大一組上限必須大于資料中最大值;臨界值就高不就低。35,40,45,85。第67頁(yè)(4) 分組 確定好組數(shù)和各組上下限后,可按原始資料中各
34、觀察值次序,將各個(gè)數(shù)值歸于各組,計(jì)算各組觀察數(shù)次數(shù)、頻率、累積頻率,制成一個(gè)次數(shù)分布表。計(jì)數(shù)方法卡片法唱票法畫(huà)“正”字畫(huà)“ ”第68頁(yè) 組限 組中值 次數(shù) 頻率 累積頻率 Frequency Percent Cumulative Percent 35 37.5 3 0.0200 0.0200 40 42.5 4 0.0267 0.0467 45 47.5 17 0.1133 0.1600 50 52.5 28 0.1867 0.3467 55 57.5 40 0.2666 0.6133 60 62.5 25 0.1667 0.7800 65 67.5 17 0.1133 0.8973 70 7
35、2.5 6 0.0400 0.9333 75 77.5 7 0.0467 0.9800 80 82.5 2 0.0133 0.9933 85 87.5 1 0.0067 1.0000表2-6 150尾鰱魚(yú)體長(zhǎng)次數(shù)分布表第69頁(yè)三、試驗(yàn)資料整理(三)次數(shù)分布圖和頻率分布圖定義:把次數(shù)(頻率)分布資料畫(huà)成統(tǒng)計(jì)圖形。特點(diǎn):直觀、形象包含:條形圖、直方圖、多邊形圖、餅圖和散點(diǎn)圖第70頁(yè)三、試驗(yàn)資料整理統(tǒng)計(jì)圖繪制基本要求:(1)標(biāo)題簡(jiǎn)明扼要,列于圖下方;(2)縱、橫兩軸應(yīng)有刻度,注明單位;(3)橫軸由左至右,縱軸由下而上,數(shù)值由小到大;圖 形長(zhǎng)寬百分比約5:4或6:5;(4)圖中需用不一樣顏色或線條代表
36、不一樣事物時(shí),應(yīng)有圖 例說(shuō)明。第71頁(yè)圖2.1 月產(chǎn)蛋數(shù)次數(shù)分布柱形圖圖2.2 月產(chǎn)蛋數(shù)頻率分布柱形圖條形圖(bar chart), 又稱(chēng)柱形圖計(jì)數(shù)資料特點(diǎn):柱形之間要間隔一定距離 屬性資料 第72頁(yè)2 餅圖(pie chart)圖1 來(lái)亨雞月產(chǎn)蛋次數(shù)分布圖計(jì)數(shù)資料質(zhì)量性狀資料35%19%21%11%5%7%2%第73頁(yè)圖2.3 鰱魚(yú)體長(zhǎng)次數(shù)分布圖3 直方圖 (histogram),又稱(chēng)矩形圖計(jì)量資料35 40 45 50 55 60 65 70 75 80 85 90特點(diǎn):各組之間沒(méi)有距離 第74頁(yè)三、試驗(yàn)資料整理圖2.3 鰱魚(yú)體長(zhǎng)次數(shù)分布圖35 40 45 50 55 60 65 70 7
37、5 80 85 90第75頁(yè)4 多邊形圖(polygon),又稱(chēng)折線圖(broken-line chart)計(jì)量資料圖2.3 鰱魚(yú)體長(zhǎng)次數(shù)分布圖第76頁(yè)5 散點(diǎn)圖(scatter) 1 2 3 4 5 64321 1 2 3 4 5 64321 1 2 3 4 5 64321a. 正向直線關(guān)系b. 負(fù)向直線關(guān)系c. 曲線關(guān)系第77頁(yè)試驗(yàn)資料整理特征數(shù)計(jì)算與第二章第78頁(yè)第二節(jié) 試驗(yàn)資料特征數(shù)計(jì)算集中性 是變量在趨勢(shì)上有著向某一中心聚集,或者說(shuō) 以某一數(shù)值為中心而分布性質(zhì)。離散性 是變量有著離中分散變異性質(zhì)。變量分布含有兩種顯著基本特征:集中性和離散性。第79頁(yè)集中性離散性平均數(shù)變異數(shù)算術(shù)平均數(shù)
38、中位數(shù)眾數(shù)幾何平均數(shù)極差方差標(biāo)準(zhǔn)差變異系數(shù)調(diào)和平均數(shù)特征數(shù)第80頁(yè)一、平均數(shù) 平均數(shù) 平均數(shù)是統(tǒng)計(jì)學(xué)中最慣用統(tǒng)計(jì)量,是計(jì)量資料代表值,表示資料中觀察數(shù)中心位置,而且可作為資料代表與另一組相比較,以確定二者差異情況。第81頁(yè)一、平均數(shù)(一)平均數(shù)種類(lèi)算術(shù)平均數(shù)中位數(shù)眾數(shù)幾何平均數(shù)調(diào)和平均數(shù)第82頁(yè)一、平均數(shù)1. 算術(shù)平均數(shù) (arithmetic mean)定義:總體或樣本資料中全部觀察數(shù)總和除以觀察數(shù) 個(gè)數(shù)所得商,簡(jiǎn)稱(chēng)平均數(shù)、均數(shù)或均值??傮w:x1+x2+x3+xNNN1樣本:x1+ x x2+x3+xnnx xn1第83頁(yè)一、平均數(shù)2. 中位數(shù)(median) 資料中全部觀察數(shù)依大小次序排列
39、,居于中間位置觀察數(shù)稱(chēng)為中位數(shù)或中數(shù)。Md第84頁(yè) 1、當(dāng)觀察值個(gè)數(shù)n為奇數(shù)時(shí),(n+1)/2位置觀察值,即x(n+1)/2為中位數(shù): Md = 2、當(dāng)觀察值個(gè)數(shù)為偶 數(shù) 時(shí),n/2和(n/2+1)位置兩個(gè)觀察值之和1/2為中位數(shù),即: 第85頁(yè)一、平均數(shù)3. 眾數(shù)(mode) 資料中出現(xiàn)次數(shù)最多那個(gè)觀察值或次數(shù)最多一組組中值或中點(diǎn)值。M0注意:(1)對(duì)于一些數(shù)據(jù)而言,如均勻分布,并不存在眾數(shù);(2)對(duì)于一些數(shù)據(jù)存在兩個(gè)或兩個(gè)以上眾數(shù);(3)主要用來(lái)描述頻率分布。第86頁(yè)一、平均數(shù)4. 幾何平均數(shù) (geometric mean)資料中有n個(gè)觀察數(shù),其乘積開(kāi)n次方所得數(shù)值。G適用范圍:幾何均數(shù)
40、適合用于變量X為對(duì)數(shù)正態(tài)分布, 經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈正態(tài)分布資料。G=第87頁(yè)一、平均數(shù)5. 調(diào)和平均數(shù) (harmonic mean)資料中各觀察值倒數(shù)算術(shù)平均數(shù)倒數(shù)。H適用范圍:主要用于反應(yīng)生物不一樣階段平均增加 率或不一樣規(guī)模平均規(guī)模。H =1第88頁(yè)一、平均數(shù)(二)算術(shù)平均數(shù)計(jì)算方法直接計(jì)算法減去常數(shù)法加權(quán)平均法第89頁(yè)1、直接計(jì)算法 主要用于樣本含量n30以下、未經(jīng)分組資料平均數(shù)計(jì)算。例:隨機(jī)抽取20株小麥測(cè)量它們株高(cm)分別為: 79 85 84 86 84 83 82 83 8384 81 80 81 82 81 82 82 82 80 求小麥平均株高。 xn20(82+79+80
41、)82.3(cm)第90頁(yè)2、減去(加上)常數(shù)法 若變量 值都比較大(或都比較?。?,且靠近某一常數(shù)a時(shí),可將它們值都減去(或加上)常數(shù)a,得到一組新數(shù)據(jù),在計(jì)算其平均數(shù)。例:設(shè)a為80(cm)則有: 79 85 84 86 84 83 82 83 83 2 1 5 4 6 4 3 2 3 3 81 80 81 82 81 82 82 82 80 4 1 0 1 2 1 2 2 2 020(21+5+ +0)82.3(cm)+ 80“80”第91頁(yè)3、加權(quán)平均法 對(duì)于樣本含量 n30 以上且已分組資料,能夠在次數(shù)分布表基礎(chǔ)上采取加權(quán)法計(jì)算平均數(shù),計(jì)算公式為: 若為計(jì)數(shù)資料,不分組,且fn,此時(shí)直
42、接用自然值乘以次數(shù)來(lái)計(jì)算,即fx/n。 第i組次數(shù)fi是權(quán)衡第i個(gè)自然值xi在資料中所占比重大小數(shù)量,所以將fi 稱(chēng)為是xi“權(quán)數(shù)”,加權(quán)法也由此而得名。第92頁(yè)例:20182.3(cm)(79 1 + 802 + +86 1)株高x次數(shù)ffx791798021608132438264928332498432528518586186第93頁(yè)式中: 第i組組中值; 第i組次數(shù); 分組數(shù) 若為分組資料,則用每組組中值乘以該組次數(shù)之和再除以總次數(shù)來(lái)計(jì)算:第94頁(yè)例: 將100頭長(zhǎng)白母豬仔豬一月窩重(單位:kg)資料整理成次數(shù)分布表以下,求其加權(quán)數(shù)平均數(shù)。 表 100頭長(zhǎng)白母豬仔豬一月窩重次數(shù)分布表組
43、別組中值(x)次數(shù)(f)fx101534520256150303526910404530135050552413206065852070753225累計(jì)1004520即這100頭長(zhǎng)白母豬仔豬一月齡平均窩重為45.2kg第95頁(yè) 計(jì)算若干個(gè)來(lái)自同一總體樣本平均數(shù)平均數(shù)時(shí),假如樣本含量不等,也應(yīng)采取加權(quán)法計(jì)算。 例:某牛群有黑白花奶牛 1500頭,其平均體重為750 kg ,而另一牛群有黑白花奶牛1200頭,平均體重為725 kg,假如將這兩個(gè)牛群混合在一起,其混合后平均體重為多少? 此例兩個(gè)牛群所包含牛頭數(shù)不等,要計(jì)算兩個(gè)牛群混合后平均體重,應(yīng)以兩個(gè)牛群牛頭數(shù)為權(quán),求兩個(gè)牛群平均體重加權(quán)平均數(shù),
44、即: 第96頁(yè)離均差之和等于零。離均差平方和最小。(x-x) = 0(x-x) 2 (x-a) 2 (三)算術(shù)平均數(shù)主要性質(zhì)第97頁(yè)(x-x-) = x1+ x2 +.+ xn n. x- =x-nx/n=x-x=0(x-a) 2= (x-x-)+ (x-a)2 = (x-x-)2+2 (x-x-) (x-a)+ (x-a)2= (x-x-)2+ (x-a)2= (x-x-)2+n(x-a)2 第98頁(yè)一、平均數(shù)(四)算術(shù)平均數(shù)作用(1)指出一組數(shù)據(jù)資料內(nèi)變量中心位置,標(biāo)志著資 料所代表性狀數(shù)量水平和質(zhì)量水平。(2)作為樣本或資料代表數(shù)與其它資料進(jìn)行比較。(3)經(jīng)過(guò)平均數(shù)提供計(jì)算樣本變異數(shù)基本
45、數(shù)據(jù)。(4)用樣本平均數(shù)預(yù)計(jì)總體平均數(shù)。第99頁(yè)二、變異數(shù)變異數(shù)種類(lèi)極差方差標(biāo)準(zhǔn)差變異系數(shù)第100頁(yè)二、變異數(shù)(一)極差(全距,range) 極差是數(shù)據(jù)分布兩端變異最大范圍,即樣本變量值最大值和最小值之差,用R表示。它是資料中各觀察值變異程度大小最簡(jiǎn)便統(tǒng)計(jì)量。例:150尾鰱魚(yú)體長(zhǎng) R=85-37=48(cm)R = maxx1,x2, xn - minx1,x2, xn =x1,x2, xnmax - x1,x2, xnmin第101頁(yè)二、變異數(shù)簡(jiǎn)單明了當(dāng)資料很多而又要快速對(duì)資料變異程度作出判斷時(shí),能夠利用極差。(1) 除了最大、最小值,不能反應(yīng)組內(nèi)其它數(shù)據(jù)變異。優(yōu)點(diǎn)缺點(diǎn)用途(2)樣本較大時(shí)抽
46、到較大值與較小值可能性也較大,因而樣本極差也較大,故樣本含量相差較大時(shí),不宜用極差來(lái)比較分布離散度。極差第102頁(yè)二、變異數(shù)怎樣準(zhǔn)確地表示樣本內(nèi)各個(gè)觀察值變異程度平均數(shù)能夠求出各個(gè)觀察值與平均數(shù)離差,即離均差。離均差能夠反應(yīng)出一個(gè)觀察值偏離平均數(shù)性質(zhì)和程度。離均差之和為零。(x-x ) = 0? 方差第103頁(yè)二、變異數(shù)平方和(SS)平方和平均數(shù)(x-x ) 2 (x-x ) 2 n第104頁(yè)二、變異數(shù)(x-x ) 2 n(x-x ) 2 n-1自由度(degree of freedom)第105頁(yè)二、變異數(shù)(x-x ) 2 n-1均方(mean square,MS)方差(variance)第
47、106頁(yè)二、變異數(shù)(二)方差(Variance)(x-x ) 2 n-1S2 =2=(x-) 2 N樣本總體第107頁(yè)二、變異數(shù) 樣本方差帶有原觀察單位平方單位,在僅表示一個(gè)資料中各觀察值變異程度而不作其它分析時(shí),常需要與平均數(shù)配合使用,這時(shí)應(yīng)將平方單位還原,即求出樣本方差平方根。標(biāo)準(zhǔn)差第108頁(yè)二、變異數(shù)(三)標(biāo)準(zhǔn)差(standard deviation, Sd)S =(x-x ) 2 n-1=(x-) 2 N樣本總體第109頁(yè)二、變異數(shù)(三)標(biāo)準(zhǔn)差(standard deviation, Sd)(x-x ) 2 n-1S =S =x 2 x )2 (nn-1第110頁(yè)二、變異數(shù)x=411x
48、2=18841X=6X2=76 表2-8 9名男子前臂長(zhǎng)(cm)標(biāo)準(zhǔn)差計(jì)算 前臂長(zhǎng) x2 x=x-45 x2 45 2025 0 0 42 1764 -3 9 44 1936 -1 1 41 1681 -4 16 47 2209 2 4 50 2500 5 25 47 2209 2 4 46 2116 1 1 49 2401 4 16第111頁(yè)二、變異數(shù)18841 -411*41199-1S =3.0(cm)76 - 6*699-1S =3.0(cm)第112頁(yè)二、變異數(shù)(三)標(biāo)準(zhǔn)差(standard deviation, Sd) f x2 f x)2(n-n-1S =第113頁(yè)例:20182
49、.3(cm)(79 1 + 802 + +86 1)株高x次數(shù)ffxfx27917962418021601280081324319683826492403448332492066784325221168851857225861867396第114頁(yè)二、變異數(shù)(三)標(biāo)準(zhǔn)差(standard deviation, Sd)特征標(biāo)準(zhǔn)差大小,受多個(gè)觀察數(shù)影響,假如觀察數(shù)與觀察數(shù)間差異較大,則離均差也大,因而標(biāo)準(zhǔn)差也大,反之則小。1各觀察數(shù)加上或減去一個(gè)常數(shù),其標(biāo)準(zhǔn)差不變;2各觀察數(shù)乘以或除以一個(gè)常數(shù)a,其標(biāo)準(zhǔn)差擴(kuò)大或縮小a倍。第115頁(yè)二、變異數(shù)(三)標(biāo)準(zhǔn)差(standard deviation, Sd
50、)3正態(tài)分布2s3s68.27%95.46%99.73%第116頁(yè)二、變異數(shù)(三)標(biāo)準(zhǔn)差(standard deviation, Sd)作用1表示變量分布離散程度。4預(yù)計(jì)平均數(shù)標(biāo)準(zhǔn)誤。3進(jìn)行平均數(shù)區(qū)間預(yù)計(jì)和變異系數(shù)計(jì)算。2能夠概括預(yù)計(jì)出變量次數(shù)分布及各類(lèi)觀察數(shù)在總體中所占百分比。第117頁(yè)二、變異數(shù)(四)變異系數(shù)(coefficient of variability, CV )定義:樣本標(biāo)準(zhǔn)差除以樣本平均數(shù),所得到比值就是變異系數(shù)。CV=s / x 100%特點(diǎn):是樣本變量相對(duì)變異量,不帶單位。 可以比較不一樣樣本相對(duì)變異程度大小。第118頁(yè)二、變異數(shù)(四)變異系數(shù)(coefficient o
51、f variability, CV )中粳“農(nóng)墾57”大田,穗粒數(shù)44.6,標(biāo)準(zhǔn)差18.9豐產(chǎn)田,穗粒數(shù)65.0,標(biāo)準(zhǔn)差18.3大田,CV=42.38%豐產(chǎn)田,CV=28.15%豐產(chǎn)田中粳穗粒數(shù)整齊度優(yōu)于大田第119頁(yè)二、變異數(shù)(四)變異系數(shù)(coefficient of variability, CV )用途1比較度量衡單位不一樣多組資料變異度。例:某地20歲男子100人,其身高均數(shù)為166.06cm,標(biāo)準(zhǔn)差為4.95cm;其體重均數(shù)為53.72kg,標(biāo)準(zhǔn)差為4.96kg。比較身高與體重變異情況。身高:CV2.98%體重:CV9.23%該地20歲男子體重變異大于身高變異。第120頁(yè)二、變異數(shù)
52、(四)變異系數(shù)(coefficient of variability, CV )用途2比較均數(shù)相差懸殊多組資料變異度 表 某地不一樣年紀(jì)組男子身高(CM)變異程度年紀(jì)組 人數(shù) 均數(shù) 標(biāo)準(zhǔn)差 變異系數(shù)3-3.5歲 100 96.1 3.1 0.03230-35歲 100 170.2 5.0 0.03第121頁(yè)第122頁(yè)概 率概率分布與第三章第123頁(yè)第一節(jié):概率基礎(chǔ)知識(shí)一、概率概念二、概率計(jì)算三、概率分布四、大數(shù)定律第124頁(yè)一、概率基本概念(一)事件定義:在一定條件下,某種事物出現(xiàn)是否就稱(chēng)為是事件。 自然界和社會(huì)生活上發(fā)生現(xiàn)象是各種各樣,常見(jiàn)有兩類(lèi)。第125頁(yè)1、在一定條件下必定出現(xiàn)某種結(jié)果或
53、必定不出現(xiàn)某種結(jié)果。確定性事件必定事件(U)(certain event)不可能事件(V)(impossible event)一、概率基本概念第126頁(yè)2、在一定條件下可能發(fā)生也可能不發(fā)生。隨機(jī)事件(random event)不確定事件(indefinite event)一、概率基本概念為了研究隨機(jī)現(xiàn)象,需要進(jìn)行大量重復(fù)調(diào)查、試驗(yàn)、測(cè)試等,這些統(tǒng)稱(chēng)為試驗(yàn)。第127頁(yè)一、概率基本概念(二)頻率(frequency)若在相同條件下,進(jìn)行了n次試驗(yàn),在這n次試驗(yàn)中,事件A出現(xiàn)次數(shù)m稱(chēng)為事件A出現(xiàn)頻數(shù),比值m/n稱(chēng)為事件A出現(xiàn)頻率(frequency),記為W(A)=m/n。0W(A) 1第128頁(yè)一
54、、概率基本概念 表3-1 玉米種子發(fā)芽試驗(yàn)結(jié)果種子總數(shù)(n) 10 20 50 100 200 500 1000發(fā)芽種子數(shù)(m) 9 19 47 91 186 458 920種子發(fā)芽率(m/n) 0.900 0.950 0.940 0.910 0.930 0.918 0.920種子發(fā)芽是否是不能事先確定,但從表中能夠看出,試驗(yàn)伴隨n值不一樣,種子發(fā)芽率也不相同,當(dāng)n充分大時(shí),發(fā)芽率在0.92附近擺動(dòng)。例:第129頁(yè)一、概率基本概念 頻率表明了事件頻繁出現(xiàn)程度,因而其穩(wěn)定性說(shuō)明了隨機(jī)事件發(fā)生可能性大小,是其本身固有客觀屬性,提醒了隱藏在隨機(jī)現(xiàn)象中規(guī)律性。概 率第130頁(yè)一、概率基本概念(三)概率
55、(probability,P)概率統(tǒng)計(jì)定義:設(shè)在相同條件下,進(jìn)行大量重復(fù)試驗(yàn),若事件A頻率穩(wěn)定地在某一確定值p附近擺動(dòng),則稱(chēng)p為事件A出現(xiàn)概率。 P(A) = p統(tǒng)計(jì)概率(statistics probability)后驗(yàn)概率(posterior probability)第131頁(yè)統(tǒng)計(jì)概率一、概率基本概念 拋擲一枚硬幣發(fā)生正面朝上試驗(yàn)統(tǒng)計(jì)試驗(yàn)者 投擲次數(shù) 發(fā)生正面朝上次數(shù) 頻率(m/n) 蒲豐 4040 2048 0.5069K 皮爾遜 1 6019 0.5016K 皮爾遜 24000 1 0.5005伴隨試驗(yàn)次數(shù)增多,正面朝上這個(gè)事件發(fā)生頻率穩(wěn)定靠近0.5,我們稱(chēng)0.5作為這個(gè)事件概率。第1
56、32頁(yè)一、概率基本概念(三)概率(probability,P) P(A) = p=lim 在普通情況下,隨機(jī)事件概率P是不可能準(zhǔn)確得到。通常以試驗(yàn)次數(shù)n充分大時(shí),隨機(jī)事件A頻率作為該隨機(jī)事件概率近似值。mnmn第133頁(yè)概率古典定義一、概率基本概念對(duì)于一些隨機(jī)事件,不用進(jìn)行屢次重復(fù)試驗(yàn)來(lái)確定其概率,而是依據(jù)隨機(jī)事件本身特征直接計(jì)算其概率。隨機(jī)事件(1)試驗(yàn)全部可能結(jié)果只有有限個(gè),即樣本空間中基本事件只有有限個(gè);(2)各個(gè)試驗(yàn)可能結(jié)果出現(xiàn)可能性相等,即全部基本事件發(fā)生是等可能;(3)試驗(yàn)全部可能結(jié)果兩兩互不相容。第134頁(yè)概率古典定義一、概率基本概念含有上述特征隨機(jī)試驗(yàn),稱(chēng)為古典概型(class
57、ical model).設(shè)樣本空間有n個(gè)等可能基本事件所組成,其中事件A包含有m個(gè)基本事件,則事件A概率為m/n,即P(A)=m/n。古典概率(classical probability)先驗(yàn)概率(prior probability)第135頁(yè)一、概率基本概念12345678910隨機(jī)抽取一個(gè)球,求以下事件概率;(1)事件A抽得一個(gè)編號(hào) 4 (2)事件B =抽得一個(gè)編號(hào)是2倍數(shù) 該試驗(yàn)樣本空間由10個(gè)等可能基本事件組成,即n=10,而事件A所包含基本事件有3個(gè),即抽得編號(hào)為1、2、3中任何一個(gè),事件A便發(fā)生。P(A)=3/10=0.3P(B)=5/10=0.5第136頁(yè)一、概率基本概念1234
58、5678910A“一次取一個(gè)球,取得紅球概率”10個(gè)球中取一個(gè)球,其可能結(jié)果有10個(gè)基本事件(即每個(gè)球被取到可能性是相等),即n=10事件A:取得紅球,則A事件包含3個(gè)基本事件,即m=3P(A)=3/10=0.3第137頁(yè)一、概率基本概念12345678910B “一次取5個(gè)球,其中有2個(gè)紅球概率”10個(gè)球中任意取5個(gè),其可能結(jié)果有C105個(gè)基本事件,即n= C105事件B =5個(gè)球中有2個(gè)紅球,則B包含基本事件數(shù)m= C32 C73P(B) = C32 C73 / C105 = 0.417第138頁(yè)一、概率基本概念0P(A)1 任何事件P(U)=1 必定事件P(V)0 不可能事件0P(A)1
59、 隨機(jī)事件概率基本性質(zhì)第139頁(yè)概率計(jì)算第二部分第140頁(yè)二、概率計(jì)算(一)事件相互關(guān)系和事件積事件互斥事件對(duì)立事件獨(dú)立事件完全事件系第141頁(yè)二、概率計(jì)算1和事件 事件A和事件B中最少有一個(gè)發(fā)生而組成新事件稱(chēng)為事件A和事件B和事件,記作A+B。n個(gè)事件和,可表示為A1+A2+An第142頁(yè)二、概率計(jì)算2積事件 事件A和事件B中同時(shí)發(fā)生而組成新事件稱(chēng)為事件A和事件B積事件,記作AB。n個(gè)事件積,可表示為A1 A2 An第143頁(yè)二、概率計(jì)算3互斥事件(互不相容事件) 事件A和事件B不能同時(shí)發(fā)生,則稱(chēng)這兩個(gè)事件A和B互不相容或互斥。 AB=Vn個(gè)事件兩兩互不相容,則稱(chēng)這n個(gè)事件互斥。如血型:AB
60、OAB第144頁(yè)二、概率計(jì)算4對(duì)立事件事件A和事件B必有一個(gè)發(fā)生,但二者不能同時(shí)發(fā)生,且A和B和事件組成整個(gè)樣本空間。即A+B=U,AB=V。我們稱(chēng)事件B為事件A對(duì)立事件。如:新生兒男或女。B= A第145頁(yè)二、概率計(jì)算5獨(dú)立事件事件A和事件B發(fā)生無(wú)關(guān),事件B發(fā)生與事件A發(fā)生無(wú)關(guān),則事件A和事件B為獨(dú)立事件。如:種子發(fā)芽。假如多個(gè)事件A1、A2、A3、An 彼此獨(dú)立,則稱(chēng)之為獨(dú)立事件群。第146頁(yè)二、概率計(jì)算6完全事件系假如多個(gè)事件A1、A2、A3、An兩兩互斥,且每次試驗(yàn)結(jié)果必定發(fā)生其一,則稱(chēng)事件A1、A2、A3、An為完全事件系。完全事件系和事件概率為,任何一個(gè)事件發(fā)生概率為1/n。即:P
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年廣東省建筑安全員-C證考試(專(zhuān)職安全員)題庫(kù)及答案
- 2025貴州省建筑安全員-C證考試(專(zhuān)職安全員)題庫(kù)附答案
- 2025山東省安全員知識(shí)題庫(kù)及答案
- 2025河南省安全員-C證(專(zhuān)職安全員)考試題庫(kù)
- 食品加工的原料和材料-課件
- 中醫(yī)內(nèi)科學(xué)-感冒
- 《教師節(jié)綜合實(shí)踐》課件
- 有機(jī)藥化實(shí)驗(yàn)課件
- 《急腹癥寶力道》課件
- 《運(yùn)籌學(xué)》整數(shù)規(guī)劃
- ZZ007 現(xiàn)代加工技術(shù)賽項(xiàng)正式賽題及評(píng)分標(biāo)準(zhǔn)完整版包括所有附件-2023年全國(guó)職業(yè)院校技能大賽賽項(xiàng)正式賽卷
- 鍋爐維保服務(wù)投標(biāo)方案(技術(shù)標(biāo) )
- 房屋買(mǎi)賣(mài)合同律師見(jiàn)證書(shū)
- 術(shù)中獲得性壓力性損傷預(yù)防
- 新形勢(shì)下物資采購(gòu)面臨的機(jī)遇、挑戰(zhàn)及對(duì)策思考
- 電氣接線工藝培訓(xùn)
- 中央空調(diào)安全規(guī)范
- 胸腔積液-課件
- cn.7a一種醬香型大曲酒固態(tài)發(fā)酵的生態(tài)控制方法
- GB/T 8491-2009高硅耐蝕鑄鐵件
- 供水安全與搶修
評(píng)論
0/150
提交評(píng)論