統(tǒng)計(jì)學(xué)的應(yīng)用與發(fā)展_第1頁
統(tǒng)計(jì)學(xué)的應(yīng)用與發(fā)展_第2頁
統(tǒng)計(jì)學(xué)的應(yīng)用與發(fā)展_第3頁
統(tǒng)計(jì)學(xué)的應(yīng)用與發(fā)展_第4頁
統(tǒng)計(jì)學(xué)的應(yīng)用與發(fā)展_第5頁
已閱讀5頁,還剩12頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)學(xué)的應(yīng)用與發(fā)展

2.5例如,統(tǒng)計(jì)數(shù)據(jù)在第二次世界大戰(zhàn)中的應(yīng)用在第二次世界大戰(zhàn)時(shí)期,由于戰(zhàn)爭的需要和刺激,出現(xiàn)了許多實(shí)用的統(tǒng)計(jì)新方法,如下所示。2.5.1穩(wěn)定時(shí)間序列的研究維納(NorbertWiener,1894-1964)是著名的數(shù)學(xué)天才,18歲就獲得哲學(xué)博士學(xué)位,控制論的創(chuàng)始人。在第二次世界大戰(zhàn)期間,他接受了一項(xiàng)與火力控制(如大炮射擊等)有關(guān)的研究工作。為了解決防空火力控制和雷達(dá)噪聲濾波問題,維納綜合運(yùn)用了他以前幾方面的研究成果,對(duì)于平穩(wěn)時(shí)間序列的統(tǒng)計(jì)性質(zhì)進(jìn)行了深入的研究,于1942年2月發(fā)表經(jīng)典論文《平穩(wěn)時(shí)間序列的外推、內(nèi)插和光滑化》,首次給出了從時(shí)間序列的過去數(shù)據(jù)推知未來情況的維納濾波公式,建立了著名的維納濾波理論,開創(chuàng)了處理平穩(wěn)時(shí)間序的新篇章(該論文的原本曾經(jīng)是軍方的一篇秘密文件,并且被同事善意地戲稱為“黃禍”,因?yàn)樵撐募幸粡堻S色封面,且內(nèi)容又不易為工程師所讀懂)。維納的這項(xiàng)工作為設(shè)計(jì)自動(dòng)防空炮火控制系統(tǒng)等方面的預(yù)測問題提供了理論依據(jù)。并為評(píng)價(jià)一個(gè)通訊和控制系統(tǒng)加工信息的效率和質(zhì)量從理論上開辟了一條途徑,同時(shí)也對(duì)自動(dòng)化科學(xué)和技術(shù)有重要的影響。這些工作后來總結(jié)在他的專著《平穩(wěn)時(shí)間序列的外推、內(nèi)插和光滑化及其在工程中的應(yīng)用》(1949)之中。這一著作不但對(duì)炮兵,而且對(duì)整個(gè)工程界都有重要意義。維納濾波模型在50年代被推廣到平穩(wěn)隨機(jī)過程以及某些特殊的廣義平穩(wěn)過程,其應(yīng)用范圍也擴(kuò)充到更多的領(lǐng)域。至今它仍然是處理各種動(dòng)態(tài)數(shù)據(jù)(如氣象、水文、地震勘探等)及預(yù)測未來的有力工具之一(當(dāng)然,維納濾波也需要改進(jìn),1960年出現(xiàn)的卡爾曼濾波比維納濾波更加實(shí)用方便)。2.5.2邊緣抽驗(yàn)時(shí)間和經(jīng)費(fèi)在驗(yàn)收階段需要注意的問題瓦爾德(AbrahamWald;1902-1950)是上世紀(jì)40-50年代前后最杰出的統(tǒng)計(jì)學(xué)家之一,他在1943-1945年間開創(chuàng)了“序貫分析”這一統(tǒng)計(jì)學(xué)新分支,并于1947年出版了名著《序貫分析》。這些成果與當(dāng)時(shí)的戰(zhàn)爭環(huán)境有密切關(guān)系。事實(shí)上,瓦爾德的序貫概率比檢驗(yàn)就是為了適應(yīng)戰(zhàn)爭時(shí)期大量驗(yàn)收軍需品的要求,需要更有效的抽樣技術(shù)而提出來的。因?yàn)樵S多軍需品的驗(yàn)收檢驗(yàn)是破壞性的,為了節(jié)省時(shí)間與經(jīng)費(fèi),應(yīng)盡量減少抽樣檢驗(yàn)的次數(shù)。以下是一個(gè)簡單而不甚典型的例子。若某批軍需品(如炮彈)抽驗(yàn)50件,廢品不超過2件則該批產(chǎn)品合格,否則就不合格。為了節(jié)省時(shí)間與經(jīng)費(fèi),可采取分階段抽樣的辦法:例如可先抽驗(yàn)25件,若有3件以上廢品,則剩余的25件不必再檢驗(yàn)即可斷定該批產(chǎn)品不合格;若抽驗(yàn)的25件中沒有廢品(或只有1件),則可認(rèn)為該批產(chǎn)品合格(具體分階段抽樣的規(guī)則應(yīng)通過理論推導(dǎo)與計(jì)算決定)。這樣,不少情況下抽樣的次數(shù)就可能小于50件。為了節(jié)省軍需品驗(yàn)收的時(shí)間與經(jīng)費(fèi),瓦爾德就逐步發(fā)展了一套應(yīng)用分階段抽樣(即序貫抽樣)代替一次性抽樣的理論與方法,從而建立了“序貫分析”這一統(tǒng)計(jì)學(xué)新分支。雖然“序貫分析”源于當(dāng)時(shí)軍火生產(chǎn)中的抽樣檢驗(yàn)工作,但是瓦爾德在此基礎(chǔ)上建立了一套完整的統(tǒng)計(jì)模型和數(shù)學(xué)方法,并且有比較廣泛的應(yīng)用價(jià)值,至今仍然是統(tǒng)計(jì)學(xué)的一個(gè)重要方向。2.5.3道克氏原螯蝦的全車估計(jì)另一個(gè)有趣的實(shí)例是應(yīng)用“序列號(hào)方法”估計(jì)德國坦克的年產(chǎn)量。二次大戰(zhàn)時(shí)期,德國每輛坦克都有出廠序列號(hào)。設(shè)某型號(hào)的坦克某年共生產(chǎn)N輛,每輛都有一個(gè)編號(hào),從1到N。盟軍要想知道這一年德國共生產(chǎn)了多少輛這種型號(hào)的坦克,即要估計(jì)N。為此,他們收集了若干該型號(hào)坦克的序列號(hào)(被盟軍俘獲、擊斃或其他渠道),設(shè)為N1<N2<…<Nk。則可應(yīng)用統(tǒng)計(jì)學(xué)方法,根據(jù)這些序列號(hào)估計(jì)出該型號(hào)坦克的總量N(估計(jì)方法詳見)。戰(zhàn)后查閱德國官方記錄證明,序列號(hào)方法得到的估計(jì)遠(yuǎn)比使用其他信息來源得到的估計(jì)精確。例如,應(yīng)用序列號(hào)方法估計(jì)德國1942年生產(chǎn)的坦克,應(yīng)為3400輛,這與官方記錄很接近;而其它情報(bào)部門的估計(jì)為18000輛,過分夸大了德方的實(shí)力。這說明,基于統(tǒng)計(jì)學(xué)的“序列號(hào)估計(jì)方法”是比較客觀的。2.5.4“鐘擺襲擊計(jì)劃”二戰(zhàn)后期,美國空軍主要部署在英國,而需要打擊的德軍目標(biāo)幾乎遍布整個(gè)歐洲。同時(shí)德軍又有強(qiáng)大的防空體系,因此轟炸機(jī)損失比較大。當(dāng)時(shí)盟軍智囊團(tuán)中的統(tǒng)計(jì)學(xué)家對(duì)于被德軍擊傷、擊落飛機(jī)的數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)分析,發(fā)現(xiàn)一個(gè)重要事實(shí):盟軍在實(shí)施轟炸前和轟炸時(shí)被擊中的損失,要低于返航途中的損失。經(jīng)他們研究,其原因是德軍在盟軍飛機(jī)的返航路線上控制有利位置,伺機(jī)展開攻擊,致使盟軍轟炸機(jī)損失不少。統(tǒng)計(jì)學(xué)家因此提出了一個(gè)“鐘擺轟炸計(jì)劃”。盟軍飛機(jī)從英國機(jī)場起飛,完成轟炸后并不向西返回英國基地,而是繼續(xù)向東飛至當(dāng)時(shí)的盟友蘇聯(lián)境內(nèi),在蘇軍飛行基地休整一段時(shí)間,補(bǔ)充燃料彈藥后再進(jìn)行反向轟炸,爾后返回英國,就好像鐘擺從一端擺向另一端,然后擺回來,周而復(fù)始,形成“鐘擺轟炸計(jì)劃”。這樣就導(dǎo)致德軍防空系統(tǒng)判斷失誤,使之不知在何處設(shè)伏為好,無法作出有利的回?fù)?。這招果然靈驗(yàn),盟軍飛機(jī)的損失開始大大減少。而歷時(shí)一年多的“鐘擺轟炸計(jì)劃”,盟軍飛機(jī)穿梭于東西方各個(gè)機(jī)場,向德國投下了近10萬噸炸藥,給德軍造成重大損失。2.6缺少優(yōu)秀的統(tǒng)計(jì)學(xué)家團(tuán)隊(duì),fdr方法在天氣研究中得到了充分的發(fā)展天文學(xué)一直是統(tǒng)計(jì)學(xué)應(yīng)用的傳統(tǒng)領(lǐng)域。早年高斯就是在他的名著《繞日天體運(yùn)動(dòng)的理論》中提出了最小二乘法和正態(tài)分布。在相當(dāng)大的程度上,這兩種方法至今仍然占據(jù)了應(yīng)用統(tǒng)計(jì)方法的主導(dǎo)地位。由于天文學(xué)中觀測數(shù)據(jù)數(shù)量龐大,數(shù)據(jù)性質(zhì)也有一定的特殊性,天文學(xué)家與統(tǒng)計(jì)學(xué)家的互動(dòng)一直是促進(jìn)這兩個(gè)學(xué)科發(fā)展的動(dòng)力,以下是一個(gè)近代的例子。根據(jù)文獻(xiàn)的報(bào)道:2003年,美國3位天體物理學(xué)家在國際權(quán)威雜志《科學(xué)》(Science)上發(fā)了表一篇論文,從理論上證實(shí)了“宇宙起源的大爆炸理論”。這篇重要論文的核心部分就是應(yīng)用了統(tǒng)計(jì)學(xué)的新方法FDR(FDR:即假發(fā)現(xiàn)率FalseDiscoveryRate的縮寫)來探測聲音振蕩而得到的。而他們的前期工作也是與兩位統(tǒng)計(jì)學(xué)家合作完成的,并且刊登在《天文學(xué)雜志》上。與此同時(shí),其它的競爭團(tuán)隊(duì)卻由于數(shù)據(jù)過多而難以前進(jìn),未能取得突破。因此,有優(yōu)秀統(tǒng)計(jì)學(xué)家的團(tuán)隊(duì)在競爭中得以勝出。這一成果被譽(yù)為:“天文學(xué)與統(tǒng)計(jì)學(xué)的一個(gè)完美結(jié)合”?,F(xiàn)在已經(jīng)很清楚:存在兩個(gè)領(lǐng)域的研究者都感興趣的公共核心問題(卡內(nèi)基梅隆大學(xué)兩個(gè)領(lǐng)域的學(xué)者一直在緊密合作),如把FDR方法進(jìn)一步用于天體物理問題。同時(shí)大家都認(rèn)為:“這種合作不僅促進(jìn)了新的聯(lián)合研究,也促進(jìn)了各自領(lǐng)域中新方向的研究”(注:FDR是多重假設(shè)檢驗(yàn)中用來度量一個(gè)檢驗(yàn)犯第一類錯(cuò)誤的水平的測度,最早由兩位以色列統(tǒng)計(jì)學(xué)家于1995年提出,刊登在英國皇家統(tǒng)計(jì)學(xué)會(huì)雜志B輯,p.289-300)。另外,統(tǒng)計(jì)學(xué)的重要分支“生存分析”在天文學(xué)中的應(yīng)用也是一個(gè)有趣的事例。在生物醫(yī)學(xué)和材料可靠性試驗(yàn)等方面,存在許多“刪失數(shù)據(jù)”(即觀測不完全的數(shù)據(jù)),從而催生了“生存分析”這一統(tǒng)計(jì)學(xué)的重要分支,并在上世紀(jì)60-70年代得到迅速發(fā)展。事實(shí)上,在天文學(xué)中也存在許多“刪失數(shù)據(jù)”,例如,由于地球轉(zhuǎn)動(dòng)而無法觀測到太暗或者太遙遠(yuǎn)的事件,由此也得到觀測不完全的“刪失數(shù)據(jù)”。天文學(xué)家也獨(dú)立提出了許多處理“刪失數(shù)據(jù)”的方法,例如,天文學(xué)中的Lynden-Bell方法與統(tǒng)計(jì)學(xué)中著名的Kaplan-Meier估計(jì)本質(zhì)上是一致的。但是大家并未意識(shí)到這些一致性,直到80年代,天文學(xué)家與統(tǒng)計(jì)學(xué)家才逐漸發(fā)現(xiàn)了他們研究的共同之處,并組織了一系列重要的“天文—統(tǒng)計(jì)”聯(lián)合會(huì)議,從而導(dǎo)致了對(duì)天文數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的合作與進(jìn)步。例如,銀河系外伽馬射線爆發(fā)的起因在使用特殊物理儀器識(shí)別之前就由生存分析方法預(yù)測到了其存在性。2.7質(zhì)量管理與統(tǒng)計(jì)學(xué)質(zhì)量管理就是通過各種措施與方法提高產(chǎn)品或服務(wù)(如郵件快遞等)的質(zhì)量水平,它是現(xiàn)代生產(chǎn)與服務(wù)業(yè)管理工作的重要組成部分。質(zhì)量管理的許多措施與方法都與統(tǒng)計(jì)學(xué)有密不可分的關(guān)系。早期的產(chǎn)品質(zhì)量控制圖就是基于正態(tài)分布的假設(shè)檢驗(yàn)理論;上世紀(jì)60年代興起的全面質(zhì)量管理(TQC)和“田口方法”則廣泛應(yīng)用了試驗(yàn)設(shè)計(jì)、方差分析等多種統(tǒng)計(jì)學(xué)方法;80年代興起的6西格瑪管理是全面質(zhì)量管理的繼承性新發(fā)展,更是廣泛應(yīng)用了各種統(tǒng)計(jì)學(xué)方法,這在馬逢時(shí)等人的著作《6西格瑪管理統(tǒng)計(jì)指南》中有詳細(xì)介紹。2.7.1管理20世紀(jì)80年代中期6西格瑪管理是以數(shù)據(jù)為基礎(chǔ),追求幾乎完美(零缺陷)的質(zhì)量管理方法,其合格率要求達(dá)到99.99966%,即缺陷率小于百萬分之3.4。六西格瑪?shù)拿衷从诮y(tǒng)計(jì)學(xué),西格瑪即σ,用來衡量質(zhì)量指標(biāo)值的波動(dòng)情況。在質(zhì)量控制圖的正態(tài)分布N(μ,σ2)中,μ表示質(zhì)量指標(biāo)的中心值,σ表示波動(dòng)。在傳統(tǒng)的質(zhì)量控制圖中,上控線UCL及下控線LCL與中心線CL的距離最多為3σ,這時(shí)產(chǎn)品合格率可達(dá)到99.73%,即缺陷率小于千分之2.7。而6σ管理則要求UCL及LCL與CL的距離為4.5σ,這時(shí)合格率可達(dá)到99.99932%,即缺陷率小于百萬分之6.8(單側(cè)則為百萬分之3.4)。同時(shí),考慮到中心線CL可能會(huì)有±1.5σ的漂移,因此為了達(dá)到以上目標(biāo),應(yīng)當(dāng)要求上控線及下控線與中心線的距離為6σ。這一思想最早由摩托羅拉公司的工程師比爾·史密斯(BillSmith)首先提出的,其實(shí)質(zhì)就是把缺陷率從千分之幾大幅度地降低到百萬分之幾,即追求“零缺陷”。這也是近代工業(yè)重點(diǎn)從機(jī)械加工工業(yè)轉(zhuǎn)向微電子工業(yè)以及IT行業(yè)(包括軟件產(chǎn)業(yè),見下一節(jié))的必然趨勢。6西格瑪管理(以下簡稱為6σ管理)方法上世紀(jì)80年代發(fā)源于美國摩托羅拉公司,也是該公司競爭中求生存的產(chǎn)物。上世紀(jì)70-80年代,摩托羅拉公司在與日本公司的競爭中累戰(zhàn)累敗,先是失掉了收音機(jī)和電視機(jī)市場,后來又失掉了BP機(jī)和半導(dǎo)體市場;公司面臨倒閉。而一家日本企業(yè)在70年代并購的摩托羅拉的電視機(jī)生產(chǎn)公司,經(jīng)過日本人的改造后,他們使用同樣的人員、同樣的技術(shù)和設(shè)計(jì),其產(chǎn)品缺陷率只有摩托羅拉管理時(shí)期的1/20。說明日本公司推行的全面質(zhì)量管理和“田口方法”非常有效,而摩托羅拉公司的質(zhì)量管理則存在嚴(yán)重問題。在市場競爭中,嚴(yán)酷的生存現(xiàn)實(shí)使摩托羅拉的高層接受了這一結(jié)論。因此,在摩托羅拉首席執(zhí)行官高爾文(BobGalvin)領(lǐng)導(dǎo)下,1980年成立了特別工作組,接受了工程師比爾·史密斯的思想,開始了他們的6σ之路。在80年代,摩托羅拉在全公司開展了以“零缺陷”為奮斗目標(biāo)的質(zhì)量改進(jìn)運(yùn)動(dòng),經(jīng)過長時(shí)間、多方面的探索與努力,公司逐步形成了一套基于統(tǒng)計(jì)學(xué)方法,大幅度提高產(chǎn)品質(zhì)量的系統(tǒng)化方案,即6σ管理方法。使摩托羅拉從一個(gè)瀕臨倒閉的公司發(fā)展成為世界知名的,質(zhì)量與利潤都領(lǐng)先的公司!摩托羅拉的6σ之路是一個(gè)公司浴火重生的典范!在80年代中后期,該公司由于全面推行6σ管理方法,其產(chǎn)品和服務(wù)的質(zhì)量都得到大幅度提高,并于1988年獲得首屆美國國家質(zhì)量獎(jiǎng)(鮑德里奇獎(jiǎng)),1992年就達(dá)到了6σ質(zhì)量水平。在1987-1997年的十年間,該公司通過實(shí)施6σ管理,銷售額增長了5倍;利潤每年增長20%;股票價(jià)格平均每年增長21.3%,帶來的收益高達(dá)140億美元,打了一個(gè)漂亮的翻身仗!摩托羅拉的復(fù)興之路也是許多美國公司的縮影。在上世紀(jì)80年代初,在激烈的競爭中逐漸處于不利地位的美國公司重新認(rèn)識(shí)到質(zhì)量管理的重要性,并進(jìn)行了認(rèn)真的質(zhì)量改進(jìn)。經(jīng)過約15年的努力,到上世紀(jì)90年代中期,美國的主要產(chǎn)品,如鋼鐵、汽車、電子等,其質(zhì)量水平都已經(jīng)趕上或超過日本。對(duì)于美國公司的進(jìn)步,基于統(tǒng)計(jì)學(xué)的質(zhì)量管理同樣發(fā)揮了非常重要的作用。2.7.2管理在通用電氣公司的應(yīng)用由于摩托羅拉的成功,聯(lián)合信號(hào)、通用電氣等國際知名公司于90年代中期開始推進(jìn)6σ管理,并取得了顯著的經(jīng)濟(jì)效益。特別,美國通用電氣公司(GE)及其首席執(zhí)行官韋爾奇(JackWelch)對(duì)于6σ管理的發(fā)揚(yáng)光大發(fā)揮了極其重要的作用。通用電氣從1995年開始,投入巨資在全公司范圍內(nèi)推廣6σ管理,并將其作為促進(jìn)公司提升經(jīng)營績效的四大發(fā)展戰(zhàn)略之一。1995年底,他們實(shí)施了400個(gè)6σ管理項(xiàng)目;1997年已超過6千個(gè)。他們還創(chuàng)建了特定的6σ管理團(tuán)隊(duì),通過系統(tǒng)培訓(xùn)和資格考試授于“倡導(dǎo)者”、“黑帶大師”、“黑帶”、“綠帶”的職稱(類似于精算師、會(huì)計(jì)師的資格認(rèn)證),進(jìn)一步完善、推廣與發(fā)展了摩托羅拉的6σ管理方法,把它演變成為一個(gè)強(qiáng)有力的管理系統(tǒng),從而大幅度地提高了經(jīng)營績效(現(xiàn)在,這一組織形式已經(jīng)得到普遍推廣,成為6σ管理體系的重要組成部分)。1997年,6σ管理給通用電氣公司帶來的收益已超過投入的成本;1999年達(dá)到15億美元,占公司利潤的15%;2000年更是高達(dá)50億美元。這時(shí),公司員工獲得“綠帶”認(rèn)證的達(dá)到90%;中層以上經(jīng)理獲得“黑帶”認(rèn)證的達(dá)到了15%。由于通用電氣這家“百年老店”的巨大成功,6σ管理很快被全世界認(rèn)識(shí)和接受。很多企業(yè)發(fā)現(xiàn),6σ管理同樣可以對(duì)他們的企業(yè)產(chǎn)生深遠(yuǎn)而重大的影響,它們也應(yīng)該大力推行6σ管理方法。因而在通用電氣的帶動(dòng)下,6σ管理從電子工業(yè)逐漸推廣到普通制造業(yè)、航空業(yè),甚至銀行、保險(xiǎn)等服務(wù)業(yè),并且絕大多數(shù)公司均取得了明顯的收益,由此掀起了6σ管理的熱潮。在世界500強(qiáng)企業(yè)中,目前至少有25%實(shí)施了6σ管理,諸如:英特爾、微軟、杜邦、花旗銀行、索尼、西門子、三星等等?,F(xiàn)在,6σ管理已經(jīng)成為提升企業(yè)核心競爭力的重要戰(zhàn)略措施。2.7.3管理的統(tǒng)計(jì)方法在6σ管理體系中,統(tǒng)計(jì)學(xué)發(fā)揮了極為重要的作用。首先,由于6σ管理是全面質(zhì)量管理的繼承性新發(fā)展,它必然離不開許多傳統(tǒng)的統(tǒng)計(jì)學(xué)方法(諸如試驗(yàn)設(shè)計(jì)、方差分析等)。同時(shí),它也需要更先進(jìn)的統(tǒng)計(jì)學(xué)新方法。文獻(xiàn)列舉了6σ質(zhì)量改進(jìn)模式的5大階段(即界定、測量、分析、改善和控制)及其所需的統(tǒng)計(jì)學(xué)方法。正如文獻(xiàn)所述:“6σ管理主要不是統(tǒng)計(jì)技術(shù),其本質(zhì)是一種全新的管理方式。但是6σ管理離不開統(tǒng)計(jì)技術(shù),在其管理流程中,測量、分析、改進(jìn)和控制的各階段都涉及到統(tǒng)計(jì)工具的使用”。因?yàn)?σ管理的基本原則之一就是“以事實(shí)和數(shù)據(jù)驅(qū)動(dòng)管理”,而數(shù)據(jù)的獲取與分析都離不開統(tǒng)計(jì)學(xué),它是把數(shù)據(jù)轉(zhuǎn)化為信息的關(guān)鍵技術(shù),因而6σ管理與統(tǒng)計(jì)學(xué)是本質(zhì)上相通的。事實(shí)上,在“6σ黑帶注冊(cè)考試”的“知識(shí)大綱”中,包含了統(tǒng)計(jì)學(xué)教科書中的大部分內(nèi)容,諸如:中心極限定理、常見分布、點(diǎn)估計(jì)與區(qū)間估計(jì)、假設(shè)檢驗(yàn)、線性回歸、方差分析、列聯(lián)表、非參數(shù)檢驗(yàn)、各種試驗(yàn)設(shè)計(jì)方法、統(tǒng)計(jì)質(zhì)量控制;等等。所以,黑帶管理者就是以這些統(tǒng)計(jì)知識(shí)為基礎(chǔ)進(jìn)行管理的。正如杜邦公司總經(jīng)理理查德所述:“現(xiàn)代公司在許多方面都是根據(jù)統(tǒng)計(jì)學(xué)來行事的”。2.8統(tǒng)計(jì)學(xué)方法:“凈室應(yīng)用軟件”是產(chǎn)品檢驗(yàn)的重要組成部分,其符合一般產(chǎn)品服務(wù)上一節(jié)介紹的6σ管理是企業(yè)追求幾乎完美的(零缺陷)質(zhì)量管理方法,追求零缺陷是信息時(shí)代的必然趨勢。軟件作為一種產(chǎn)品,用戶在計(jì)算機(jī)上使用該軟件時(shí)應(yīng)該是幾乎完美的(零缺陷)?!皟羰臆浖こ獭本褪且环N“零缺陷程序設(shè)計(jì)”方法,它是IBM的數(shù)學(xué)家HMills基于函數(shù)理論和統(tǒng)計(jì)學(xué)理論首先提出來的??梢哉f,統(tǒng)計(jì)學(xué)是“凈室軟件工程”這一新方法的兩大理論支柱之一。顯然,軟件產(chǎn)品的零缺陷與一般企業(yè)的產(chǎn)品或服務(wù)的零缺陷應(yīng)該是相通的,因此如§2.7所述,統(tǒng)計(jì)學(xué)方法也將在其中發(fā)揮重要作用。以下首先介紹軟件工程,然后再進(jìn)一步介紹凈室軟件工程,以及統(tǒng)計(jì)學(xué)在其中的意義與作用。文獻(xiàn)對(duì)凈室軟件工程有詳盡的介紹,并附有豐富的參考文獻(xiàn)。2.8.1第一次提出和修改了軟件危機(jī)正如文獻(xiàn)所述,統(tǒng)計(jì)學(xué)家在軟件工程中具有重要作用,因?yàn)閿?shù)據(jù)是軟件開發(fā)過程的中心。試驗(yàn)設(shè)計(jì)、統(tǒng)計(jì)質(zhì)量管理等統(tǒng)計(jì)方法在軟件的建設(shè)和使用中是非常關(guān)鍵的。與工程學(xué)的傳統(tǒng)分支相比,軟件工程是一個(gè)相對(duì)較新的領(lǐng)域。軟件工程(SoftwareEngineering)是應(yīng)用工程化的原則和方法,結(jié)合計(jì)算機(jī)科學(xué)、數(shù)學(xué)及管理科學(xué)等原理,開發(fā)軟件的學(xué)科。它與“軟件危機(jī)”(SoftwareCrisis)一詞一起,首次出現(xiàn)于1968年。那一年,北大西洋公約組織(NATO)的計(jì)算機(jī)科學(xué)家在德國召開了一次重要的國際軟件會(huì)議,會(huì)上第一次討論了“軟件危機(jī)”問題,并且第一次正式提出了“軟件工程”概念,希望用工程化的原則和方法來克服軟件危機(jī),從此一門新興的工程學(xué)科—軟件工程學(xué)—應(yīng)運(yùn)而生。所謂軟件危機(jī)是泛指在計(jì)算機(jī)軟件的開發(fā)和維護(hù)過程中,所遇到的一系列嚴(yán)重問題,主要表現(xiàn)在:軟件開發(fā)的費(fèi)用和進(jìn)度失控;軟件可靠性差;生產(chǎn)出來的軟件難以維護(hù)等方面。最典型的失敗例子是IBM公司開發(fā)的OS/360(1964)操作系統(tǒng)。該系統(tǒng)共有4000多個(gè)模塊,約100萬條指令,投入5000人年,耗資數(shù)億美元,結(jié)果還是延期交付,在交付使用后的系統(tǒng)中仍發(fā)現(xiàn)大量錯(cuò)誤(2000個(gè)以上),最終由于離預(yù)定目標(biāo)相差甚遠(yuǎn)而不得不宣布失敗(網(wǎng)上流傳“史上十大失敗軟件”,IBM的OS/360(1964)總是名列榜首;微軟的WindowsVista(2006)亦在其中)。1968年NATO的國際軟件會(huì)議第一次認(rèn)真研究了軟件危機(jī)問題。會(huì)上首次提出了“軟件工程”這一新概念,就是強(qiáng)調(diào)軟件是一種“產(chǎn)品”,開發(fā)軟件是一項(xiàng)“工程”,軟件工程應(yīng)該從硬件工程以及其他人類工程中吸收其成功的經(jīng)驗(yàn),從而克服“軟件危機(jī)”(軟件開發(fā)究竟是“科學(xué)”還是“工程”?這一問題一直有爭論,這次會(huì)議實(shí)際上是傾向于后者)。因此在軟件開發(fā)中,就應(yīng)該全面考慮其項(xiàng)目管理、分析設(shè)計(jì)、生產(chǎn)流程、質(zhì)量控制、產(chǎn)品檢測等問題;而較少地依賴于個(gè)人的作用。這時(shí),如§2.7所述,產(chǎn)品質(zhì)量管理及統(tǒng)計(jì)學(xué)方法在軟件工程中就大有用武之地(見§2.7以及)。自從“軟件工程”概念提出以來,經(jīng)過30多年的研究與實(shí)踐,雖然“軟件危機(jī)”沒有得到徹底解決,但在軟件開發(fā)方法和技術(shù)方面已經(jīng)有了很大的進(jìn)步。特別是“凈室軟件工程”方法在上世紀(jì)80年代出現(xiàn)以后,軟件產(chǎn)品向“零缺陷”邁進(jìn)了一大步。2.8.2凈室應(yīng)用軟件的關(guān)鍵技術(shù)凈室(Cleanroom)軟件工程是一種應(yīng)用數(shù)學(xué)和統(tǒng)計(jì)學(xué)方法以經(jīng)濟(jì)有效的方式開發(fā)高質(zhì)量軟件的工程技術(shù)。其核心思想就是在軟件生產(chǎn)過程中制造出幾乎沒有缺陷的程序,即“零缺陷程序設(shè)計(jì)”?!皟羰摇币辉~借用于半導(dǎo)體工業(yè)生產(chǎn)硬件的凈室,強(qiáng)調(diào)“防患勝于除患”的思想,即“防缺陷于未然”,而不是事后去排除故障。“凈室軟件工程”這一概念是IBM資深數(shù)學(xué)家HarlanMills首先提出來的,并且由他在IBM的許多同事一起付諸實(shí)現(xiàn)。Mills與他的同事于1987年在《IEEE,Software》發(fā)表著名論文《凈室軟件工程》,介紹了他們的基本思想。實(shí)際上,Mills等人從上世紀(jì)70年代末到80年代就發(fā)表了一系列論文,逐步形成了“凈室”的思想和方法。Mills“凈室”思想的數(shù)學(xué)基礎(chǔ)還是比較抽象的,主要基于函數(shù)理論和統(tǒng)計(jì)學(xué)理論,它們是“凈室軟件工程”的兩大理論支柱。一個(gè)函數(shù)就是從定義域到值域的一個(gè)映射。一個(gè)特定的程序可以看成一個(gè)映射:其定義域就是所有可能的輸入序列的集合(例如,點(diǎn)一下鼠標(biāo)就是一個(gè)輸入);值域就是所有對(duì)應(yīng)于輸入的輸出集合(例如,點(diǎn)鼠標(biāo)以后的執(zhí)行情況就是一個(gè)輸出),因此一個(gè)程序就是一個(gè)函數(shù);一個(gè)程序的規(guī)范就是一個(gè)函數(shù)的規(guī)范。這一觀點(diǎn)使所有函數(shù)理論向軟件開發(fā)敞開大門,導(dǎo)致軟件開發(fā)中盒式結(jié)構(gòu)規(guī)范及設(shè)計(jì)、函數(shù)理論正確性檢驗(yàn)以及增量開發(fā)等技術(shù)的產(chǎn)生(這里盒子用來形象地表達(dá)函數(shù):輸入通過盒子后經(jīng)過變換得到輸出,不同的盒式結(jié)構(gòu)就表示不同的函數(shù),詳見)。主要用于軟件測試。軟件的運(yùn)行情況是無限的,把軟件的所有可能的使用情況的集合看作總體,該集合的每個(gè)元素代表系統(tǒng)的一種運(yùn)行結(jié)果。對(duì)軟件的一次測試就是一次運(yùn)行,因此就是該集合的一個(gè)元素。由于測試次數(shù)總是有限的,因此,對(duì)軟件進(jìn)行n次測試,就相當(dāng)于從上述總體進(jìn)行n次抽樣,從而得到n個(gè)樣本。這一觀點(diǎn)把統(tǒng)計(jì)學(xué)引入軟件測試技術(shù),使所有統(tǒng)計(jì)理論向軟件測試敞開大門,導(dǎo)致基于統(tǒng)計(jì)學(xué)方法的軟件測試和質(zhì)量認(rèn)證技術(shù)的廣泛應(yīng)用。軟件測試是軟件開發(fā)的重要組成部分,對(duì)于不斷調(diào)整規(guī)范及設(shè)計(jì),進(jìn)行軟件質(zhì)量控制等都是至關(guān)重要的。從上世紀(jì)80年代中期以來,“凈室軟件工程”技術(shù)取得一系列令人信服的驕人業(yè)績。1990年,IBM創(chuàng)建了凈室軟件技術(shù)中心,開發(fā)了很多凈室軟件。他們90年代初運(yùn)用凈室方法開發(fā)的海量存儲(chǔ)控制單元適配器,售出了數(shù)千單元,直至1997年產(chǎn)品超過使用壽命后,仍未收到任何反映凈室微碼的故障報(bào)告。特別,從20世紀(jì)80年代末到90年代初,在美國國家宇航局(NASA)飛行控制中心的軟件工程實(shí)驗(yàn)室,他們進(jìn)行了一系列凈室試驗(yàn),開發(fā)了4個(gè)規(guī)模依次擴(kuò)大的地面控制軟件系統(tǒng),取得令人信服的成功,質(zhì)量和生產(chǎn)力比當(dāng)初預(yù)想的還有一致的提高。同時(shí),美國陸軍執(zhí)行了一個(gè)凈室項(xiàng)目,其回報(bào)超過了投資的20倍??傊?凈室方法明顯改進(jìn)了IBM、NASA、美國國防部(DoD)、愛立信等許多機(jī)構(gòu)的軟件產(chǎn)品的質(zhì)量。凈室方法表明且繼續(xù)表明,凈室科學(xué)有可能使軟件的成組性能得到極大的改善,使軟件產(chǎn)品向“零缺陷”邁進(jìn)了一大步。凈室軟件工程可歸納為以下3個(gè)關(guān)鍵技術(shù):基于統(tǒng)計(jì)過程控制之下的增量開發(fā)(即把凈室項(xiàng)目分成若干有序的開發(fā)序列);基于函數(shù)理論的規(guī)范、設(shè)計(jì)和驗(yàn)證;以及基于統(tǒng)計(jì)學(xué)理論的測試和軟件認(rèn)證。因此,統(tǒng)計(jì)學(xué)是“凈室軟件工程”的重要支柱之一。2.9新方法、新產(chǎn)品與“等價(jià)性檢驗(yàn)”的應(yīng)用統(tǒng)計(jì)學(xué)與生物學(xué)之間有非常獨(dú)特的關(guān)系,這兩個(gè)學(xué)科之間的相互影響和相互促進(jìn)堪稱典范。統(tǒng)計(jì)學(xué)的第一本學(xué)術(shù)刊物(1901年出版)就稱為《生物計(jì)量學(xué)》(Biometrika,主要刊登統(tǒng)計(jì)學(xué)方法論方面的創(chuàng)新成果),它是由現(xiàn)代統(tǒng)計(jì)學(xué)的奠基人皮爾遜(KPearson;1857-1936)所創(chuàng)立;現(xiàn)代統(tǒng)計(jì)學(xué)的第一本名著就名為《數(shù)學(xué)用于進(jìn)化論》(1896年出版,作者也是皮爾遜,其中“數(shù)學(xué)”主要就是指“統(tǒng)計(jì)學(xué)”,詳見第4章)??梢娊y(tǒng)計(jì)學(xué)與生物學(xué)關(guān)系之密切。從本節(jié)開始到2.12節(jié)的四節(jié)都是介紹生物統(tǒng)計(jì)方面的案例,其中2.10節(jié)用到一點(diǎn)微分方程;2.11節(jié)用到較多的統(tǒng)計(jì)與數(shù)學(xué)方法;2.12節(jié)是一個(gè)遺傳學(xué)方面的經(jīng)典案例;本節(jié)則介紹生物醫(yī)學(xué)中的等價(jià)性檢驗(yàn)。在§2.1.3節(jié),我們?cè)?jīng)應(yīng)用“等價(jià)性檢驗(yàn)”方法來分析《紅樓夢》前80回與后40回在情景描寫上的差異。事實(shí)上,“等價(jià)性檢驗(yàn)”在生物醫(yī)學(xué)等領(lǐng)域有非常廣泛的應(yīng)用,所涉及的統(tǒng)計(jì)模型也較多。下面是一些常見的例子。·疾病化驗(yàn)方法的比較。在疾病化驗(yàn)中(如肝炎;愛滋病等),通常都有標(biāo)準(zhǔn)的化驗(yàn)方法(如驗(yàn)血)。但為了減少副作用(如可能引起交叉感染等),也要探索新的化驗(yàn)方法(如驗(yàn)?zāi)?驗(yàn)淚等)。因此,就必須研究:“新的化驗(yàn)方法是否能正確地檢驗(yàn)出疾病?”,或者說“新的化驗(yàn)方法是否等價(jià)于標(biāo)準(zhǔn)的化驗(yàn)方法?”。這就要通過收集有關(guān)新、老方法化驗(yàn)結(jié)果的數(shù)據(jù),應(yīng)用統(tǒng)計(jì)方法進(jìn)行檢驗(yàn),這也是一種“等價(jià)性檢驗(yàn)”?!に幤矾熜У谋容^。通常,治療某種疾病(如高血壓,心臟病等)會(huì)不斷出現(xiàn)新藥。因?yàn)樾滤幙赡軙?huì)有療效更好,或副作用小,或成本低等優(yōu)點(diǎn)。為此,就必須研究:“新藥的療效是否與某成品藥的療效相同(或不遜于)?”,或者說“新藥的療效是否等價(jià)于(或不遜于)某成品藥?”。這就要通過收集有關(guān)的數(shù)據(jù),應(yīng)用統(tǒng)計(jì)方法進(jìn)行檢驗(yàn),即“等價(jià)性檢驗(yàn)”或“非劣性檢驗(yàn)”(即不遜于原來的藥品)?!ぶ委煼桨傅谋容^:治療某種疾病可能會(huì)有幾種方案。可對(duì)某種新方案(如化療)與原有方案(如放療)進(jìn)行療效的比較,看看其效果是否等價(jià)(或更好)。這也是一種“等價(jià)性檢驗(yàn)”。·醫(yī)療器械的比較:在理療中可能會(huì)有幾種醫(yī)療器械,可對(duì)某種新設(shè)備(如激光)與原有設(shè)備(如紅外)的治療(或檢測)效果進(jìn)行比較。這也須要通過收集有關(guān)的數(shù)據(jù),應(yīng)用統(tǒng)計(jì)方法進(jìn)行“等價(jià)性檢驗(yàn)”。一般來說,對(duì)于某種新方法或新產(chǎn)品,我們經(jīng)常須要把它們與標(biāo)準(zhǔn)方法或原有產(chǎn)品進(jìn)行比較。新方法或新產(chǎn)品可能具有諸如效果好,低成本,副作用小,毒性小,使用方便等優(yōu)點(diǎn)。但是,我們面臨的一個(gè)基本問題是:“新方法或新產(chǎn)品的功能與標(biāo)準(zhǔn)方法或原有產(chǎn)品的功能是否等價(jià)?”,或者不比標(biāo)準(zhǔn)方法差。則我們就要通過收集有關(guān)新、老方法的數(shù)據(jù),應(yīng)用統(tǒng)計(jì)方法進(jìn)行“等價(jià)性檢驗(yàn)”或“非劣性檢驗(yàn)”?!?.1.3介紹的“等價(jià)性檢驗(yàn)”是基于兩個(gè)相互獨(dú)立的二項(xiàng)分布,下面介紹的四格列聯(lián)表是另一種很常見的統(tǒng)計(jì)模型。今以疾病化驗(yàn)的比較為例。假設(shè)對(duì)n=300名病人志愿者進(jìn)行化驗(yàn),經(jīng)測試得到以下表3所示的數(shù)據(jù)。其中n11=211表示用新方法(如驗(yàn)淚)和標(biāo)準(zhǔn)方法(如驗(yàn)血)化驗(yàn)都呈陽性的人數(shù)(p11表示該事件的概率);n12=19表示用新方法化驗(yàn)呈陽性,標(biāo)準(zhǔn)方法化驗(yàn)呈陰性的人數(shù)(p12表示該事件的概率);n21=7表示用新方法化驗(yàn)呈陰性,標(biāo)準(zhǔn)方法化驗(yàn)呈陽性的人數(shù),n22=63表示用新方法和標(biāo)準(zhǔn)方法化驗(yàn)都呈陰性的人數(shù)(p21,p22表示相應(yīng)事件的概率)。這時(shí),數(shù)據(jù)集為(n11,n12,n21,n22),其具體觀測值為(211,19,7,63),由此即可推斷新的化驗(yàn)方法和標(biāo)準(zhǔn)化驗(yàn)方法是否等價(jià)。為此可檢驗(yàn):“新方法化驗(yàn)為陽性的概率”是否等于“標(biāo)準(zhǔn)方法化驗(yàn)為陽性的概率”。由表3可知,前者為p11+p12;后者為p11+p21。因此相應(yīng)的等價(jià)性檢驗(yàn)問題為這可化簡為這個(gè)檢驗(yàn)問題的檢驗(yàn)統(tǒng)計(jì)量為著名的McNemar統(tǒng)計(jì)量或Z-統(tǒng)計(jì)量(詳細(xì)推導(dǎo)可參見)其中χ2(1)表示自由度為1的卡方分布。對(duì)于以上數(shù)據(jù)(211,19,7,63),代入Z-統(tǒng)計(jì)量公式可得Z=5.23,其值大于臨界值χ2(1,0.95)=3.841,因此應(yīng)否定原假設(shè),即兩種化驗(yàn)方法不等價(jià)。以上4格列聯(lián)表是很常見的。例如,為了評(píng)估某年級(jí)學(xué)生期末考試成績與期中考試成績是否有進(jìn)步,收集了如表4所示的4格列聯(lián)表數(shù)據(jù)。其中329表示該年級(jí)期末考試及格,期中考試也及格的人數(shù);38表示該年級(jí)期末考試及格,而期中考試不及格的人數(shù);52表示該年級(jí)期末考試不及格,而期中考試及格的人數(shù);22表示該年級(jí)期末期中考試都不及格的人數(shù);這個(gè)表與表3在實(shí)質(zhì)上完全類似(其中“及格”對(duì)應(yīng)于“陽性”;“不及格”對(duì)應(yīng)“陰性”)。為了檢驗(yàn)學(xué)生兩次考試的及格率是否相同,該數(shù)據(jù)代入以上Z-統(tǒng)計(jì)量公式進(jìn)行計(jì)算可得Z=2.718,其值小于臨界值χ2(1,0.95)=3.841,所以不能否定原假設(shè)。因此,該年級(jí)期末考試與期中考試的水平(及格率)無顯著性差異。2.10線性微分方程組的應(yīng)用本節(jié)的例子要求讀者對(duì)微分方程有一點(diǎn)了解。在藥物運(yùn)行的動(dòng)力學(xué)和化學(xué)反應(yīng)的動(dòng)力學(xué)中,觀測變量常常滿足一列線性微分方程組,這就導(dǎo)出一類重要的非線性回歸模型。今考慮一種常見的藥物運(yùn)行系統(tǒng)。設(shè)某病人因發(fā)炎(如咽喉炎)要注射消炎藥(如在手臂處注射青霉素)。藥物從手臂出發(fā),經(jīng)血液循環(huán)流入咽喉才能發(fā)揮作用。我們希望了解:若對(duì)病人注射藥物量為R,注射t*分鐘以后,咽喉處的含藥量是多少?藥物運(yùn)行情況如圖2所示。其中x(t),y(t),z(t)分別表示病人注射t分鐘以后在注射處、血液中以及病灶處的含藥量。這些含藥量的特點(diǎn)是:它們既有隨機(jī)性又有規(guī)律性。由于這些含藥量與人體的自身狀況(如體溫,血壓等)有關(guān),同時(shí)也受到外界環(huán)境(如溫度,濕度等)的影響,因此會(huì)有波動(dòng),即它們都是隨機(jī)變量。另一方面,藥物在血液循環(huán)中也應(yīng)遵循一定的規(guī)律。如圖2所示,藥物在注射處按一定比例β0(為常數(shù),但未知,其他類似)流入血液中;而血液中的藥物按一定比例β1流入病灶處,并按一定比例β2從病灶處返流一部分回到血液中;同時(shí),血液中的藥物也會(huì)并按一定比例β3流失一部分到排泄系統(tǒng)。由此即可建立x(t),y(t),z(t)的微分方程。今考慮dt時(shí)間內(nèi)x(t),y(t),z(t)的改變量。我們來看y(t)的改變量,其他類似。在dt時(shí)間內(nèi),從注射處流入到血液中的藥量與x(t)成正比,因此可表示為β0xdt。從血液中流出到病灶處的藥量與y(t)成正比,因此可表示為-β1ydt。同理,從血液中流失到排泄系統(tǒng)的藥量為-β3ydt;從病灶處返流回血液中的藥量為β2zdt。由此可得到以下(1)的第二式。dx和dz的情況類似,因此可以得到以下微分方程組易見,初始條件為x(0)=R,y(0)=0,z(0)=0。這是一個(gè)常系數(shù)線性微分方程組,解方程可得其中θ1,θ2,θ3,θ4,θ5由β0,β1,β2,β3表示。注意,這個(gè)解與普通常系數(shù)線性微分方程組的解有原則性的區(qū)別。首先,如前所述,x(t),y(t),z(t)為隨機(jī)變量,因此我們?cè)诿總€(gè)解后面要加上一個(gè)隨機(jī)誤差。其次,β0,β1,β2,β3表示血液循環(huán)中的流動(dòng)速度,是未知的;因而θ1,θ2,θ3,θ4,θ5也是未知的,稱為未知參數(shù)。它們只能應(yīng)用統(tǒng)計(jì)學(xué)方法進(jìn)行估計(jì)。為了估計(jì)參數(shù),必須對(duì)x(t),y(t),z(t)進(jìn)行多次觀測,得到數(shù)據(jù)集,設(shè)為(ti,xi,yi,zi),i=1,…,n。由此即可得到如下非線性回歸模型:這是一類很常見的,由線性微分方程組導(dǎo)出的(多元)非線性回歸模型。對(duì)上述模型,通??捎米钚《朔ü烙?jì)這些參數(shù),得到?,F(xiàn)在回到本節(jié)開始提出的問題。要想知道病人注射t*分鐘以后病灶處的含藥量z(t*),通??汕蟪銎漕A(yù)測值。把參數(shù)的估計(jì)代入以上微分方程組的解(見(2)式),可得t=t*代入上式得到,此即t*時(shí)刻病灶處含藥量的預(yù)測值。我們亦可求出z*的預(yù)測區(qū)間[z1,z2],該區(qū)間滿足P(z*∈[z1,z2])>95%。在實(shí)際問題中,由動(dòng)力學(xué)系統(tǒng)和線性微分方程組導(dǎo)出的非線性回歸模型十分常見。以下是一個(gè)與藥物運(yùn)行系統(tǒng)截然不同的問題,但導(dǎo)致完全類似的線性微分方程組和完全類似的非線性回歸模型,這也充分體現(xiàn)了其應(yīng)用的廣泛性。圖3為石油裂變分解的示意圖。原油經(jīng)加熱及催化等作用,轉(zhuǎn)變?yōu)槭秃蜑r青;而瀝青也轉(zhuǎn)變一部分為石油和雜質(zhì)。設(shè)t時(shí)刻原油、石油和瀝青的含量分別為x(t)、y(t)和z(t)。則由于各種內(nèi)在和外在因素的影響,它們有一定的隨機(jī)性;同時(shí)也有一定的規(guī)律性。如圖3所示,原油按一定比例β0(為常數(shù),但未知,其他類似)轉(zhuǎn)變?yōu)槭?按一定比例β1轉(zhuǎn)變?yōu)r青;瀝青按一定比例β2轉(zhuǎn)變?yōu)槭?并按一定比例β3轉(zhuǎn)變?yōu)殡s質(zhì)。由此即可建立x(t),y(t),z(t)的微分方程。今考慮dt時(shí)間內(nèi)x(t),y(t),z(t)的改變量.我們來看y(t)的改變量,其他類似。如圖3所示,在dt時(shí)間內(nèi),原油轉(zhuǎn)變?yōu)闉r青的數(shù)量與x(t)成正比,因此可表示為β1xdt;同理,瀝青轉(zhuǎn)變?yōu)槭秃碗s質(zhì)的數(shù)量分別為-β2ydt和-β3ydt,由此即可得到以下第二式。dx和dz的情況類似,因此即可得到以下微分方程組該方程的初始條件為:x(0)=x0,y(0)=0,z(0)=0,其中x0為初始的原油數(shù)量。易見,這個(gè)微分方程組與方程組(1)完全類似。我們可以根據(jù)類似的討論得到類似于(2)的解和類似于(3)的非線性回歸模型。也可以根據(jù)非線性回歸模型來預(yù)測t*時(shí)刻石油的數(shù)量z*=z(t*)。2.11頂設(shè)圖形軟件—統(tǒng)計(jì)參數(shù)圖(SPM)軟件與腦功能成像數(shù)據(jù)的統(tǒng)計(jì)分析統(tǒng)計(jì)參數(shù)圖(StatisticalParametricMapping)是一套于1994年就推出的軟件。顧名思義,它似為統(tǒng)計(jì)學(xué)中的圖形軟件。但是,事實(shí)上它是在腦科學(xué)中流行多年的腦功能成像專用軟件。該軟件取名為“統(tǒng)計(jì)參數(shù)圖”,充分說明統(tǒng)計(jì)學(xué)方法在其中起到了非常重要的作用。2.11.bold信號(hào)的編碼及數(shù)據(jù)處理腦功能成像,通俗地講就是給大腦照相,這是21世紀(jì)的熱門課題,它對(duì)了解人類大腦的工作機(jī)制、認(rèn)知過程、情緒過程等問題都有重要意義。特別是近期,腦功能成像對(duì)于診斷精神類疾病有重要作用,一定程度上類似于拍X光片診斷所拍器官的疾病。但是,腦功能成像比拍X光片復(fù)雜得多,它是多學(xué)科交叉合作的產(chǎn)物。對(duì)于腦功能成像,首先要提出成像原理,這涉及:腦神經(jīng)科學(xué)、物理學(xué)、生物化學(xué)等學(xué)科;其次要制造出儀器設(shè)備,這涉及:儀器儀表、電子工程、物理學(xué)等學(xué)科;最后要分析儀器測量的結(jié)果并形成圖象,這主要涉及計(jì)算機(jī)科學(xué)和數(shù)學(xué),特別是統(tǒng)計(jì)學(xué)。目前應(yīng)用最廣泛、成就最顯著的腦功能成像技術(shù)稱之為基于血氧水平(Bloodoxygenationleveldependent,即BOLD)的功能磁共振成像(functionalmagneticresonanceimaging,即fMRI),簡記為BOLD-fMRI。其原理基于“BOLD效應(yīng)”,大意為:磁共振掃描儀可以直接或間接得到人腦血氧水平變化的信號(hào)。人腦活動(dòng)不同,血氧代謝水平就不同。當(dāng)特定腦區(qū)(如語言中樞)被激活時(shí)(如講話),相應(yīng)的局部腦組織血流和代謝增加,BOLD信號(hào)相對(duì)增強(qiáng)。這些信號(hào)就反映了相應(yīng)腦神經(jīng)細(xì)胞活動(dòng)的變化,由此可測量出興奮區(qū)域,這個(gè)興奮區(qū)域就與特定的腦功能(如講話)相關(guān),再通過BOLD信號(hào)的空間編碼形成圖象。在fMRI信號(hào)的數(shù)據(jù)處理中,統(tǒng)計(jì)學(xué)是最基本的,它涉及到時(shí)空數(shù)據(jù)的許多統(tǒng)計(jì)推斷問題。人腦是3維的,設(shè)要研究的某個(gè)局部腦區(qū)為D,把D劃分為N個(gè)單元,稱為體素(voxel),記為d∈D(例如可取體素大小為2×2×2mm3,然后按此把D分劃為N個(gè)體素,N一般為數(shù)千甚至幾十萬)。在磁共振儀器的掃描過程中,記體素d在t1,…,tn時(shí)間的信號(hào)值為Yi(d)(i=1,…,n,至少取數(shù)百個(gè))。對(duì)于固定的d,Yi(d)為一時(shí)間序列,而d∈D可以是任一設(shè)定的體素。因此數(shù)據(jù)集{Yi(d),i=1,…,n;d∈D}與時(shí)間空間都有關(guān),是一種特定的高維時(shí)空數(shù)據(jù),而且噪聲來源比較多,如心眺、呼吸、血管收縮、周圍環(huán)境等等。文獻(xiàn)中有許許多多關(guān)于這類“成像數(shù)據(jù)”的處理方法,其中有代表性的一本著作就是《統(tǒng)計(jì)參數(shù)圖:腦功能成像分析》,這本600多頁的大書詳細(xì)闡述了腦信號(hào)分析的概念和過程,全面系統(tǒng)地介紹了各種腦成像數(shù)據(jù)的分析和處理方法。該書第一作者弗理斯頓(KJFriston)也就是腦功能成像軟件SPM研發(fā)團(tuán)隊(duì)的學(xué)科帶頭人,英國倫敦大學(xué)神經(jīng)影像實(shí)驗(yàn)室主任。這本書所介紹的數(shù)據(jù)處理方法就是SPM軟件的主要依據(jù)。SPM軟件主要基于兩種方法:第一,應(yīng)用一般線性模型(Generallinearmodels)擬合數(shù)據(jù),并通過假設(shè)檢驗(yàn)及檢驗(yàn)的p-值測定腦激活區(qū)域;第二,應(yīng)用隨機(jī)場理論處理各體素之間的多重比較問題,整合掃描過程中得到的各個(gè)激活區(qū)域(在實(shí)際使用SPM軟件時(shí),還需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,以使預(yù)處理后的數(shù)據(jù)能夠符合應(yīng)用一般線性模型和隨機(jī)場理論的條件,細(xì)節(jié)從略)。“統(tǒng)計(jì)參數(shù)圖”的理論和思想最初由弗理斯頓于1991年提出,并于1994年推出第一個(gè)軟件SPM94,直到后來的SPM99、SPM5等等,都是在SPM94的基礎(chǔ)上加入新的算法和理論開發(fā)出來的,是當(dāng)今國際上比較權(quán)威和成熟的腦成像軟件。弗理斯頓曾獲得多種獎(jiǎng)項(xiàng),并于2006年當(dāng)選為英國皇家科學(xué)院院士(但他只有碩士學(xué)位)。如上所述,“腦成像數(shù)據(jù)”是一種特定的高維時(shí)空數(shù)據(jù),其數(shù)據(jù)處理方法必然是多種多樣的。瓦斯理(KJWorsley)是另一位重要的代表人物(文獻(xiàn)曾介紹了他的部分工作),他是加拿大麥克奎爾(McGill)大學(xué)和美國芝加哥大學(xué)統(tǒng)計(jì)系教授。他與弗理斯頓也有合作,SPM軟件中的隨機(jī)場方法主要就是他提出來的。他多年來一直致力于腦成像數(shù)據(jù)的研究,曾經(jīng)發(fā)表許多重要論文,并開發(fā)出軟件FMRISTAT,專門用于fMRI數(shù)據(jù)的腦功能成像。特別,正如文獻(xiàn)所介紹,他還運(yùn)用更高深的微分和積分幾何的數(shù)學(xué)思想(與光滑隨機(jī)場理論相結(jié)合)研究腦部激活區(qū)域的統(tǒng)計(jì)特性(文附有一幅根據(jù)他的軟件制作的腦成像圖)。瓦斯理的新方法還可用于天體物理學(xué)的數(shù)據(jù)處理。令人惋惜的是,瓦斯理于2009年因患癌癥去世,年僅57歲。在訃告中對(duì)他的評(píng)價(jià)非常高:“他是在全世界領(lǐng)先的統(tǒng)計(jì)學(xué)家之一”;“他是隨機(jī)成像幾何及其在腦成像和天體物理應(yīng)用領(lǐng)域的領(lǐng)導(dǎo)者”;“他把概率論,統(tǒng)計(jì)學(xué)和幾何學(xué)優(yōu)美地結(jié)合起來,并用于研究人腦被激活區(qū)域的統(tǒng)計(jì)推斷問題”。2.11.階對(duì)稱定額矩陣由于腦成像數(shù)據(jù)比較復(fù)雜,因此很自然需要更多數(shù)學(xué)方法的支持。以下是另一個(gè)例證,也是用到微分幾何的數(shù)學(xué)思想。擴(kuò)散張量成像(Diffusiontensorimaging,DTI)是磁共振成像的一種新方法,在臨床醫(yī)學(xué)中很有用。它把輸出數(shù)據(jù)在每個(gè)體素中構(gòu)造成一個(gè)3階對(duì)稱張量,并且其特征值都大于零,這相當(dāng)于一個(gè)3階對(duì)稱正定矩陣。因此類似于前面的分析,其數(shù)據(jù)集可表示如下:若在局部腦區(qū)D中設(shè)定了N個(gè)體素,擴(kuò)散張量成像儀在掃描過程中,體素d在t1,…,tn時(shí)間的信號(hào)形成3階對(duì)稱正定矩陣,記為Si(d)(i=1,…,n)。則數(shù)據(jù)集為{Si(d),i=1,…,n;d∈D}。這是一個(gè)以對(duì)稱正定矩陣為“觀察值”的高維時(shí)空數(shù)據(jù)。近年來已有不少學(xué)者研究這類數(shù)據(jù)的統(tǒng)計(jì)推斷問題及其對(duì)腦成像分析的應(yīng)用,美國北卡羅那大學(xué)生物統(tǒng)計(jì)與影像分析實(shí)驗(yàn)室(BIAS)的學(xué)者在這方面做了很多工作,例如可參見Zhuet,al.,及其參考文獻(xiàn)。設(shè)xi(i=1,…,n)為某些自變量,為了考慮Si(d)(i=1,…,n)的回歸,我們不能把它簡單地看成其各個(gè)分量(即6維向量)的多變量回歸,因?yàn)镾i(d)受到很強(qiáng)的約束,它是正定矩陣。事實(shí)上,3階對(duì)稱矩陣對(duì)應(yīng)于一個(gè)6維向量,反之亦然,因此全體3階對(duì)稱矩陣的集合構(gòu)成一個(gè)6維歐氏空間,記為Sym(3),而全體3階對(duì)稱正定矩陣的集合則是Sym(3)的一個(gè)子集,記為Sym+(3),它實(shí)際上是Sym(3)中的一個(gè)曲面,即流形。由于一切Si(d)∈Sym+(3)(i=1,…,n),因此關(guān)于Si(d)的統(tǒng)計(jì)分析都是在流形Sym+(3)上進(jìn)行的。Si(d)(i=1,…,n)稱為流形上的數(shù)據(jù)(Maniforddata)。對(duì)于流形上的數(shù)據(jù),為了進(jìn)行回歸等統(tǒng)計(jì)分析,首先必須在流形Sym+(3)上定義度量(metric),即內(nèi)積,有了內(nèi)積即可定義與計(jì)算長度和距離,并可進(jìn)一步定義最小二乘估計(jì)及其他各種估計(jì),詳見Zhuet,al。該文研究了數(shù)據(jù){Si(d),i=1,…,n;d∈D}的半?yún)?shù)估計(jì),并通過假設(shè)檢驗(yàn)研究局部人腦被激活的區(qū)域。他們最近又研究了擴(kuò)散張量成像數(shù)據(jù)的局部多項(xiàng)式估計(jì)及其漸近性質(zhì)。2.12基因理論的產(chǎn)生、發(fā)展和統(tǒng)計(jì)學(xué)2.12.孟德爾的遺傳學(xué)說遺傳學(xué)與統(tǒng)計(jì)學(xué)有非常密切的關(guān)系,詳見§4.2和§4.3節(jié)。關(guān)于孟德爾遺傳學(xué)與統(tǒng)計(jì)學(xué)的關(guān)系,需要一些篇幅介紹其背景情況。孟德爾(GregorJohannMendel,1822-1884)的本職工作是奧地利一所修道院的牧師,代課教師;但是他也是一位業(yè)余的生物學(xué)家。在1856-1863年間,孟德爾進(jìn)行了長達(dá)8年的植物雜交試驗(yàn),特別是豌豆雜交實(shí)驗(yàn),記錄下了21000棵個(gè)體植物的實(shí)驗(yàn)結(jié)果。根據(jù)這些試驗(yàn),在小小的豌豆粒中,他發(fā)現(xiàn)了一個(gè)關(guān)系到整個(gè)人類生命的大秘密,孟德爾事實(shí)上提出了基因?qū)W說,開辟了遺傳學(xué)的新紀(jì)元。因此他被后人尊稱為“遺傳學(xué)之父”、“科學(xué)遺傳學(xué)的奠基人”,這些尊稱一點(diǎn)也不為過。2.12.孟德爾的遺傳“3.1”遺傳理論孟德爾做了大量的豌豆雜交實(shí)驗(yàn),今簡要介紹其中一種典型的實(shí)驗(yàn),即關(guān)于豌豆種子顏色的雜交實(shí)驗(yàn)。豌豆種子通常有黃色與綠色兩種顏色。孟德爾用純種黃色豌豆與純種綠色豌豆作親本,在它們的不同植株間進(jìn)行異花授粉(雜交)。結(jié)果發(fā)現(xiàn),無論是以黃色作母本,綠色作父本,還是以黃色作父本,綠色作母本,它們雜交得到的第一代植株(簡稱“子一代”,以F1表示)都表現(xiàn)為黃色。也就是說,對(duì)此顏色性狀而言,F1植株的性狀只能表現(xiàn)出雙親中的一個(gè)親本的性狀—黃色,而另一親本的性狀—綠色,則在F1中完全沒有得到表現(xiàn)。因而黃色稱為顯性性狀,綠色稱為隱性性狀。那么,隱性性狀是不是就此消失了呢?帶著這樣的疑問,孟德爾繼續(xù)進(jìn)行雜交試驗(yàn)。他讓上述F1的黃色豌豆自花授粉,得到“子二代”雜種F2的豌豆,結(jié)果同時(shí)出現(xiàn)了黃色與綠色豌豆,但數(shù)量不同。在孟德爾的試驗(yàn)中,其中一組數(shù)據(jù)為(見表5第三列):“子二代”雜種F2的8023株豌豆中,黃色有6022株,而綠色僅有2001株,兩者數(shù)目之比近似于3:1。孟德爾以同樣的方法對(duì)多種生物性狀指標(biāo)進(jìn)行了大量的雜交試驗(yàn),并觀測其“子二代”的分布規(guī)律,表5為其中的部分?jǐn)?shù)據(jù)。這個(gè)表列出了孟德爾所觀察到的豌豆的7種遺傳性狀(第一行),以及他所發(fā)現(xiàn)的顯性因子(第二行)與隱性因子(第三行)。由表5可知,其顯性性狀株數(shù)與隱性性狀株數(shù)之比全都近似于3:1。以下分別從孟德爾遺傳學(xué)和統(tǒng)計(jì)學(xué)來解釋這一劃時(shí)代的發(fā)現(xiàn)。表5的結(jié)果絕對(duì)不可能是偶然的巧合,而應(yīng)該是一種遺傳上的普遍規(guī)律。孟德爾根據(jù)上述雜交試驗(yàn)的結(jié)果(以及其他試驗(yàn)結(jié)果),提出了劃時(shí)代的遺傳學(xué)新理論(在那時(shí)實(shí)際上還只是一種“假說”)。其基本點(diǎn)如下:生物性狀(如豌豆種子的顏色)的遺傳由遺傳因子(后來被稱為基因)的傳遞所決定,并分為顯性因子和隱性因子(如黃色和綠色),生物性狀由顯性因子決定(顯性原則);遺傳因子在體細(xì)胞內(nèi)成對(duì)存在,雜種體細(xì)胞中的兩個(gè)遺傳因子各自獨(dú)立地一個(gè)來自父本,一個(gè)來自母本,形成新的一對(duì)(分離定律)。根據(jù)這一“假說”,即可解釋上述“3:1”定律。不妨設(shè)A表示黃色遺傳因子,a表示綠色遺傳因子(大寫表示顯性遺傳因子,小寫表示隱性遺傳因子,其他性狀指標(biāo)亦然)。當(dāng)純種黃色豌豆與純種綠色豌豆進(jìn)行雜交時(shí),它們?cè)瓉淼倪z傳因子分別為AA和aa,雜交時(shí),遺傳因子一個(gè)來自父本,一個(gè)來自母本;它們各種可能的新配對(duì)都是Aa(第一個(gè)A配對(duì)得Aa和Aa;第二個(gè)A配對(duì)也得Aa和Aa)。由于黃色A為顯性,所以“子一代”F1全都是黃色。但是“子二代”雜種F2的情況就不同了。它們是由“子一代”F1的植株雜交得來。這時(shí)兩個(gè)“子一代”成員的遺傳因子為Aa和Aa,它們?cè)陔s交遺傳時(shí),來自父本和母本的各種可能的配對(duì)為AA,Aa,aA,aa。其中前三個(gè)表現(xiàn)為黃色,因?yàn)辄S色A為顯性因子;但第四個(gè)aa表現(xiàn)為綠色。因此根據(jù)孟德爾遺傳學(xué)說,在“子二代”F2中,黃色豌豆應(yīng)占3/4;綠色豌豆應(yīng)占1/4,所以兩者之比為3:1。表5其他各列也可作類似的解釋。現(xiàn)在我們從統(tǒng)計(jì)學(xué)觀點(diǎn)來分析孟德爾的遺傳學(xué)說以及如表5所示的數(shù)據(jù)集。當(dāng)我們對(duì)兩個(gè)具體的“子一代”的植株進(jìn)行雜交時(shí),并不能確切知道其“子二代”種子的顏色,但是根據(jù)孟德爾遺傳學(xué)說的“3:1”定律,出現(xiàn)黃色的概率為3/4;出現(xiàn)綠色的概率為1/4;而表5所示的數(shù)據(jù)即為試驗(yàn)的觀察值。其結(jié)果的確非常接近于黃色3/4,綠色1/4的比例。但是,從統(tǒng)計(jì)學(xué)理論來說,為了從統(tǒng)計(jì)學(xué)觀點(diǎn)來驗(yàn)證孟德爾關(guān)于“3:1”的規(guī)律,還必須從表5所示的數(shù)據(jù)集出發(fā)進(jìn)行如下假設(shè)檢驗(yàn)原假設(shè)H0:“子二代”種子為黃色的概率為3/4,為綠色的概率為1/4;對(duì)立假設(shè)H1:“子二代”種子不服從以上規(guī)律。這一假設(shè)檢驗(yàn)可化為一個(gè)擬合優(yōu)度檢驗(yàn)問題,這時(shí)X~b(n,p)表示一個(gè)二項(xiàng)分布。其中X表示雜交試驗(yàn)中黃色豌豆的個(gè)數(shù),其實(shí)測值為x=6022;n=8023為總的雜交試驗(yàn)株數(shù),8023-x=2001為綠色豌豆的個(gè)數(shù);p=3/4表示“子二代”種子出現(xiàn)黃色的概率,1-p=1/4表示“子二代”種子出現(xiàn)綠色的概率。因此相應(yīng)的擬合優(yōu)度檢驗(yàn)問題為:H0:X服從二項(xiàng)分布b(8023,3/4)?H1:X不服從b(8023,3/4)。把以上數(shù)據(jù)代入擬合優(yōu)度檢驗(yàn)公式,經(jīng)具體計(jì)算可知,K=0.0150,其值遠(yuǎn)遠(yuǎn)小于臨界值χ2(1,0.95)=3.84。因此,原假設(shè)H0以非常大的可信概率成立。所以孟德爾的“3:1”定律成立。同理,亦可對(duì)表5中的其他六組數(shù)據(jù)進(jìn)行類似的假設(shè)檢驗(yàn)與類似的數(shù)值計(jì)算,我們把計(jì)算結(jié)果的檢驗(yàn)值K加在表5的最后一行,以供參考。這些結(jié)果都說明,它們的K值都遠(yuǎn)遠(yuǎn)小于臨界值χ2(1,0.95)=3.84,所以孟德爾關(guān)于“子二代”的“3:1”遺傳規(guī)律是正確的。因此我們從統(tǒng)計(jì)學(xué)觀點(diǎn)證明:表5的七組數(shù)據(jù)全部都服從孟德爾的“3:1”定律。孟德爾的上述遺傳學(xué)新理論只是一種“假說”,他本人也十分清楚這一點(diǎn)。因此他從多方面進(jìn)行雜交試驗(yàn)來驗(yàn)證他的理論。孟德爾用得最多的是“側(cè)交法”,就是讓“子一代”的植株與純種隱性類型植株雜交。例如,孟德爾首先用純種高莖豌豆(見表5最后一列,為顯性,其遺傳因子記為DD)與純種矮莖豌豆(為隱性,其遺傳因子記為dd)雜交,得到“子一代”F1的遺傳因子為Dd。然后,再用其與純種矮莖豌豆dd進(jìn)行雜交,這時(shí)它們“子二代”的各種可能的配對(duì)應(yīng)為:Dd,Dd,dd,dd,即高莖(顯性)與矮莖(隱性)各占一半,即二者之比為1:1。在孟德爾的雜交試驗(yàn)中,其中一組數(shù)據(jù)為:“子二代”64株豌豆中,其中高莖的有30株,矮莖的有34株。二者之比很接近于1:1,這一結(jié)果與孟德爾假說是吻合的。對(duì)于這一數(shù)據(jù)我們也應(yīng)該從統(tǒng)計(jì)上進(jìn)行擬合優(yōu)度檢驗(yàn)原假設(shè)H0:“子二代”為高莖豌豆的概率為1/2,為矮莖豌豆的概率為1/2;對(duì)立假設(shè)H1:“子二代”種子不服從以上規(guī)律。把以上數(shù)據(jù)代入擬合優(yōu)度檢驗(yàn)公式,經(jīng)具體計(jì)算可知,K=0.25,其值遠(yuǎn)遠(yuǎn)小于臨界值χ2(1,0.95)=3.84。因此,原假設(shè)H0以非常大的可信概率成立.所以“側(cè)交法”試驗(yàn)的“1:1”定律成立,再一次從統(tǒng)計(jì)上證實(shí)了孟德爾的理論。2.12.“子二代”的生長、分布與“側(cè)交法”更進(jìn)一步,孟德爾還同時(shí)研究了多種生物性狀指標(biāo)在雜交試驗(yàn)中的遺傳規(guī)律。以下是一個(gè)相對(duì)來講較為簡單的,但是非常著名的例子。在雜交試驗(yàn)中,可以同時(shí)觀察豌豆種子的顏色和形狀。如表5所示,種子形狀有圓形光滑和皺皮之分,前者為顯性因子,記為B;后者為隱性因子,記為b。根據(jù)前面的分析,顏色遺傳因子經(jīng)第一代雜交后由AA和aa變?yōu)锳a。同理,形狀遺傳因子經(jīng)第一代雜交后由BB和bb變?yōu)锽b。如果同時(shí)考慮顏色和形狀,則“子一代”的遺傳因子為(Aa,Bb),它們代表(黃綠,圓皺)。當(dāng)把兩個(gè)“子一代”F1的植株(Aa,Bb)和(Aa,Bb)進(jìn)行雜交時(shí),其“子二代”F2遺傳因子中,按顏色Aa和形狀Bb,各自獨(dú)立地一個(gè)因子來自父本,一個(gè)因子來自母本,并且各自形成新的一對(duì)遺傳因子(自由組合定律)。同時(shí)考慮顏色和形狀各種可能的配對(duì),具體情況如表6所示。其中第2行表示顏色配對(duì)為AA時(shí),形狀因子各種可能的配對(duì);第3行表示顏色配對(duì)為Aa時(shí),形狀因子各種可能的配對(duì);其他兩行類似。根據(jù)表6可以得出“子二代”種子所呈現(xiàn)的顏色和形狀的比例。由于A(黃色)和B(圓形)為顯性遺傳因子,所以只要出現(xiàn)A或B,則呈現(xiàn)為黃色或圓形,例如(Aa,bB)呈現(xiàn)為黃色,圓形,簡記為(黃,圓)。因此由表6可知,最后一行前3個(gè)為(綠,圓),第4個(gè)為(綠,皺);最后一列前3個(gè)為(黃,皺);而其余9個(gè)都是(黃,圓),因此,(黃,圓)、(綠,圓)、(黃,皺)、(綠,皺)的比例為9、3、3、1,這就是著名的孟德爾“9:3:3:1”定律。表7是孟德爾提供的一組著名的數(shù)據(jù)。他對(duì)556株上述“子一代”的植株進(jìn)行雜交試驗(yàn),其“子二代”的分布情況如下表所示。由表7可知,表中四個(gè)狀態(tài)的比例的確接近于9、3、3、1。但是,由此就斷言“9:3:3:1”定律成立顯然是不夠的。這時(shí),統(tǒng)計(jì)學(xué)將發(fā)揮更大的作用。我們可以做一個(gè)關(guān)于多項(xiàng)分布的假設(shè)檢驗(yàn)。現(xiàn)有四個(gè)狀態(tài):(黃,圓)、(黃,皺)、(綠,圓)、(綠,皺);做了556次試驗(yàn),要檢驗(yàn)各個(gè)狀態(tài)出現(xiàn)的概率是否為9/16、3/16、3/16、1/16;而各個(gè)狀態(tài)出現(xiàn)的次數(shù)為N=(N1,N2,N3,N4)=(315,108,101,32)。也就是要檢驗(yàn)原假設(shè)H0:N服從多項(xiàng)分布MN(556;9/16,3/16,3/16,1/1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論