女士品茶后感_第1頁
女士品茶后感_第2頁
女士品茶后感_第3頁
女士品茶后感_第4頁
女士品茶后感_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、讀女士品茶有感女士品茶一書之所以取名為女士品茶源于20 世紀(jì)20年代后期,在英國(guó)劍橋一個(gè)夏日的午后,一群大學(xué)的紳士和他們的夫人們,還有來訪者,正圍坐在戶外的桌旁,享用著下午茶。在品茶過程中,一位女士堅(jiān)稱:把茶加進(jìn)奶里,或把奶加進(jìn)茶里,不同的做法,會(huì)使茶的味道品起來不同。在場(chǎng)的一幫科學(xué)精英們,對(duì)這位女士的“胡言亂語”表示懷疑,在座的一個(gè)的先生提議用實(shí)驗(yàn)來檢驗(yàn)這個(gè)命題吧,這之后引發(fā)了一系列的統(tǒng)計(jì)學(xué)知識(shí)的討論。從女士品茶看統(tǒng)計(jì)科學(xué)發(fā)展的歷史,是一個(gè)個(gè)科學(xué)家不斷出現(xiàn)、不斷崛起、不斷失敗、不斷成功的歷史,作者把他們?nèi)珙w顆珍珠連綴成美麗的項(xiàng)鏈,讓統(tǒng)計(jì)科學(xué)的桂冠閃爍著他們生命和靈感的光芒。進(jìn)入19

2、世紀(jì)時(shí),科學(xué)界奉行著一種固化的哲學(xué)觀,即機(jī)械式宇宙觀。這種哲學(xué)觀認(rèn)為,為數(shù)不多的幾個(gè)數(shù)學(xué)公式,像牛頓的運(yùn)動(dòng)定律和玻意耳的氣體定律,可以用來描述現(xiàn)實(shí)世界的一切,并能預(yù)測(cè)未來即將發(fā)生的事件。而對(duì)這種預(yù)測(cè),所需要的不過是一套完整的公式,以及一組具有足夠精確度的相關(guān)數(shù)據(jù)。然而,對(duì)于一般大眾來說,整整花了40年時(shí)間,他們的思想才跟上這種科學(xué)觀念。這種思想上的落差,典型地體現(xiàn)在19世紀(jì)早年拿破侖皇帝與皮埃爾·西蒙·拉普拉斯的一次對(duì)話中。拉普拉斯寫了一本歷史性的權(quán)威著作,論述如何根據(jù)地球上少數(shù)觀察數(shù)據(jù)來計(jì)算行星和彗星的未來位置。據(jù)說拿破侖問道:“拉普拉斯先生,我發(fā)現(xiàn)你的論述中沒有提到上帝

3、??!”拉普拉斯的回答則是:“我不需要這個(gè)假設(shè)條件?!睓C(jī)械式宇宙觀認(rèn)為,宇宙如同一個(gè)龐大的時(shí)鐘機(jī)器,所有的物體都按照一定的規(guī)律運(yùn)動(dòng),宇宙永續(xù)運(yùn)轉(zhuǎn)而不需要神的介入;所有將來發(fā)生的事件都決定于過去的事件。許多人對(duì)這種無神論的思想感到恐慌,從某種意義上說,19世紀(jì)浪漫主義運(yùn)動(dòng)的興起,正是對(duì)這種精確應(yīng)用推理的冷冰冰的哲學(xué)觀的回應(yīng)。然而,19世紀(jì)40年代出現(xiàn)了對(duì)新科學(xué)的證明,這叫一般人難以想象:牛頓的數(shù)學(xué)定律被用來預(yù)測(cè)另一顆行星的存在,而海王星正是在這些定律所預(yù)測(cè)的位置被發(fā)現(xiàn)的。于是,幾乎所有對(duì)機(jī)械宇宙觀的反抗都被粉碎了,這一哲學(xué)立場(chǎng)很快成為大眾文化的基本部分。不過,就算拉普拉斯在他的公式中不需要上帝,他

4、還是需要一種被他稱為誤差函數(shù)的東西。從地球上對(duì)行星和彗星的觀察,與用公式所預(yù)測(cè)的位置并不絕對(duì)吻合,拉普拉斯和他的科學(xué)家同伴將這歸結(jié)于觀察中的誤差,有時(shí)是由于地球大氣層中的擾動(dòng),有時(shí)則是人為的。拉普拉斯把所有這些誤差都放在一個(gè)附加項(xiàng)(誤差函數(shù))里,從而將之納入他的數(shù)據(jù)描述。這個(gè)誤差函數(shù)吸收了所有的誤差,剩下的只是用來預(yù)測(cè)宇宙星體實(shí)際位置的絕對(duì)運(yùn)動(dòng)定律。當(dāng)時(shí)科學(xué)家相信,隨著越來越精確的測(cè)試,對(duì)誤差函數(shù)的需求將逐漸消失。由于有誤差函數(shù)來表示預(yù)測(cè)值與觀察值之間的微小差異,19世紀(jì)早期的科學(xué)可以說是受到了哲學(xué)上決定論的掌控,即相信所發(fā)生的任何事情都預(yù)先地決定于兩點(diǎn):(1)宇宙的初始條件;(2)描繪其運(yùn)動(dòng)

5、的數(shù)學(xué)公式。到了19世紀(jì)末,誤差并沒有消失,反倒是增加了。當(dāng)測(cè)試越來越精確,誤差也越來越多。機(jī)械宇宙觀處于動(dòng)搖之中,試圖發(fā)現(xiàn)生物學(xué)定律和社會(huì)學(xué)定律的努力也失敗了。在物理和化學(xué)等傳統(tǒng)科學(xué)中,牛頓和拉普拉斯所用的那些定律,逐漸地被證明只是粗略的逼近。這樣,科學(xué)便漸漸開始在新的范式下運(yùn)作,這新范式就是現(xiàn)實(shí)世界的統(tǒng)計(jì)模型。到20世紀(jì)末期,幾乎所有科學(xué)都轉(zhuǎn)而運(yùn)用統(tǒng)計(jì)模型了。大眾文化還是沒有跟上這種科學(xué)革命,盡管一些含混的觀念和表述,像相關(guān)、勝率和風(fēng)險(xiǎn)等等,已經(jīng)滲入了大眾的詞匯,并且多數(shù)人意識(shí)到了不確定性問題,這是與諸如醫(yī)學(xué)和經(jīng)濟(jì)學(xué)等學(xué)科領(lǐng)域相聯(lián)系的。但就已經(jīng)發(fā)生的哲學(xué)觀的深層轉(zhuǎn)變而言,學(xué)界之外沒有人能夠

6、對(duì)此有什么理解。這些統(tǒng)計(jì)模型是什么?它們是怎么來的?在現(xiàn)實(shí)生活中它們意味著什么?它們是現(xiàn)實(shí)的真實(shí)描述嗎?本書正是試圖來回答這些問題,其中我們也想介紹一些先生和女士的生平故事,這些人曾涉身于這場(chǎng)革命之中。在處理這些問題時(shí),必須把三個(gè)數(shù)學(xué)概念區(qū)分開:隨機(jī)、概率和統(tǒng)計(jì)。對(duì)大多數(shù)人而言,隨機(jī)只是不可預(yù)測(cè)性的另一個(gè)說法。猶太教法典中的一則格言,傳達(dá)了這種通常的看法:“不應(yīng)該去探尋寶藏,因?yàn)閷毑氐陌l(fā)現(xiàn)是隨機(jī)的;按照定義,沒有人能夠?qū)ふ抑粫?huì)被隨機(jī)發(fā)現(xiàn)的東西。”但是,對(duì)現(xiàn)代科學(xué)家來說,隨機(jī)性有許多不同的類型。概率分布的概念允許我們對(duì)隨機(jī)性加以限制,并賦予我們有限的能力去預(yù)測(cè)未來的隨機(jī)事件。因此,對(duì)現(xiàn)代科學(xué)家而

7、言,隨機(jī)事件并不是雜亂的、不可預(yù)期的和不可預(yù)測(cè)的,它們有一個(gè)可以用數(shù)學(xué)來描述的結(jié)構(gòu)。概率是一個(gè)非常古老概念的現(xiàn)代用語,它曾出現(xiàn)在亞里士多德的著作中。這位先哲聲稱:“不可能事件將會(huì)發(fā)生,這正是概率的特性。”起初,概率只是涉及到個(gè)人對(duì)什么事件即將發(fā)生的預(yù)測(cè),在17和18世紀(jì),一批數(shù)學(xué)家,其中包括貝努里父子、費(fèi)爾馬、棣莫弗、帕斯卡都在以機(jī)會(huì)博弈為起點(diǎn)去研究概率的數(shù)學(xué)理論。他們發(fā)明一些非常高級(jí)的方法,用來計(jì)算等可能事件,棣莫弗設(shè)法在這些技術(shù)中加進(jìn)微積分的方法,貝努里則可以領(lǐng)悟出非?;A(chǔ)的定理,叫大數(shù)定律。到了19世紀(jì)末期,數(shù)理概率主要由一些非常高級(jí)的技巧構(gòu)成,但還缺少堅(jiān)實(shí)的理論基礎(chǔ)。盡管不夠完善,還是

8、可以證明概率理論對(duì)發(fā)展統(tǒng)計(jì)分布觀念的作用。當(dāng)我們考慮一個(gè)特殊的科學(xué)問題時(shí),就會(huì)產(chǎn)生一個(gè)統(tǒng)計(jì)分布。例如,在1971年,哈佛公共衛(wèi)生學(xué)院所做的一項(xiàng)研究發(fā)表在英國(guó)的醫(yī)學(xué)期刊柳葉刀上,這項(xiàng)研究旨在檢驗(yàn)喝咖啡是否與下泌尿道癌有關(guān)。研究的報(bào)告以一級(jí)病人為對(duì)象。其中一些人患有下泌尿道癌,另一些人則患有其它疾病。報(bào)告的作者還搜集了這組病人的其它資料,如年齡、性別和家族的癌癥病史等。結(jié)果證明,并不是每個(gè)喝咖啡的人都會(huì)得泌尿道癌,也不是每個(gè)得泌尿道癌的人都圓角咖啡,所以存在著與他們的假設(shè)相矛盾的事件。然而,25%的此類癌癥患者習(xí)慣每天喝4杯以上咖啡,只有10%的非癌癥患者是這種咖啡嗜好者,因而,似乎有一些證據(jù)支持

9、這種假設(shè)。這種資料的搜集給研究者提供了一個(gè)統(tǒng)計(jì)的分布。運(yùn)用數(shù)理概率的工具,他們?yōu)檫@個(gè)分布建造了一個(gè)理論公式,稱之為概率分布函數(shù),或簡(jiǎn)稱分布函數(shù),以此來檢驗(yàn)所研究的問題。它與拉普拉斯的誤差函數(shù)相似,但卻復(fù)雜許多。運(yùn)用概率論來建造理論分布函數(shù),而這個(gè)函數(shù)用來描述從未來數(shù)據(jù)中所能得到的預(yù)期結(jié)果,這些數(shù)據(jù)是以隨機(jī)方式從同一總體的人群中提取的。這本書作為一本講統(tǒng)計(jì)學(xué)的書,平均數(shù)、標(biāo)準(zhǔn)差、估計(jì)值、概率、隨機(jī)、鐘型曲線、置信、大數(shù)定律、中心極限定理、正態(tài)概率分布隨機(jī)變量等等一系列的概念和術(shù)語,自是綿亙不絕,但是不同于其他書的是,這些概念和術(shù)語的背后,是一個(gè)個(gè)統(tǒng)計(jì)大師鮮活的形象、是一段段他們探索創(chuàng)新,歷盡坎坷

10、的人生故事。故事中穿插著大師們睿智的珍言、友誼的情懷、幽默的細(xì)節(jié)、個(gè)性的遭際。通過研讀女士品茶一書,結(jié)合自己學(xué)習(xí)和掌握與統(tǒng)計(jì)相關(guān)的知識(shí),至少讓我在以下幾個(gè)方面有了更深刻的認(rèn)識(shí):一、 關(guān)于統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)就是用來處理數(shù)據(jù)的,它是關(guān)于數(shù)據(jù)的一門學(xué)問。根據(jù)大百科全書對(duì)統(tǒng)計(jì)學(xué)的定義:統(tǒng)計(jì)學(xué)是用以收集數(shù)據(jù),分析數(shù)據(jù)和由數(shù)據(jù)得出結(jié)論的一組概念、原則和方法。統(tǒng)計(jì)分析數(shù)據(jù)的方法大體上可分為描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)兩大類。描述統(tǒng)計(jì)是研究數(shù)據(jù)收集、處理和描述的統(tǒng)計(jì)學(xué)方法。其內(nèi)容包括如何取得研究所需要的數(shù)據(jù),如何用圖表形式對(duì)數(shù)據(jù)進(jìn)行處理的展示,如何通過對(duì)數(shù)據(jù)的綜合、概括與分析,得出所關(guān)心的數(shù)據(jù)特征。推斷統(tǒng)計(jì)則是研究如何利用樣

11、本數(shù)據(jù)來推斷總體特征的統(tǒng)計(jì)學(xué)方法,內(nèi)容包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩大類。二、關(guān)于顯著性檢驗(yàn)女士品茶第11章“假設(shè)檢驗(yàn)”中提到:“K.皮爾遜常常利用他的卡方擬合優(yōu)度檢驗(yàn)來證明某些數(shù)據(jù)符合某些特定的分布。在費(fèi)歇爾把更精確的方法引入到數(shù)理統(tǒng)計(jì)之后,K.皮爾遜的方法就不再為人接受了。但問題仍然存在。為了知道應(yīng)該估計(jì)哪些參數(shù),為了確定這些參數(shù)與所研究的科學(xué)問題之間有何關(guān)系,我們必須假設(shè)該數(shù)據(jù)符合某一特定的分布。統(tǒng)計(jì)學(xué)家們常常會(huì)利用顯著性檢驗(yàn)來證明數(shù)據(jù)符合何種分布?!痹趯?shí)際操作中,由于人力、物力、時(shí)間等問題,一般都用抽樣調(diào)查的方法抽取一定數(shù)量的具有代表性的群體,得出樣本數(shù)據(jù)來進(jìn)行研究,并對(duì)總體特征進(jìn)行統(tǒng)計(jì)推斷

12、,在這里面就會(huì)存在兩個(gè)問題,一是樣本的特征數(shù)量能否反映總體特征?二是兩種不同的樣本的數(shù)量標(biāo)志參數(shù)是否存在差異?只有解決這兩個(gè)問題,才能正確的推斷總體特征,也才能找出不同特征群體的需求差異,這就需要統(tǒng)計(jì)學(xué)中的顯著性檢驗(yàn)來解決。假設(shè)我們要檢驗(yàn)一位女士能否品嘗出兩杯茶的不同:是把牛奶倒進(jìn)了茶水里,還是把茶水倒進(jìn)牛奶里。我們給她兩杯茶,告訴她一杯是茶水倒入牛奶里,另一杯是牛奶倒入茶水中。她嘗了嘗,正確區(qū)別開了這兩杯茶。有可能她是憑猜測(cè),猜對(duì)的機(jī)會(huì)是一半對(duì)一半。我們?cè)俳o她同樣的這樣兩杯茶,她又說對(duì)了。如果她僅僅靠猜測(cè),那么連續(xù)兩次都猜對(duì)的機(jī)會(huì)是四分之一。如果我們?cè)俳o她兩杯茶,假如她仍然能正確地分辨出來。

13、若這人結(jié)果完全是猜出來的,此時(shí)猜對(duì)的機(jī)率則只有八分之一。我們繼續(xù)兩杯兩杯地讓她品嘗更多杯茶,而她依然每次都能夠正確地識(shí)別出來。某種意義上,我們就不得不相信她真的能品嘗出其中的差別了。假定她說錯(cuò)了一次,假定說錯(cuò)的這一次就發(fā)生在第24組,而其他的全對(duì),那么我們能否依然認(rèn)為她真的有分辨不同奶茶的能力呢?假如她的錯(cuò)誤是二十四分之四呢?或是二十四分之五呢?顯著性檢驗(yàn)是一種正規(guī)的統(tǒng)計(jì)方法,是在“待檢驗(yàn)的假設(shè)為真”的假設(shè)前提下,用來計(jì)算以往觀測(cè)到的結(jié)果發(fā)生的概率。當(dāng)觀測(cè)結(jié)果發(fā)生的概率很低時(shí),我們得出原假設(shè)不成立的結(jié)論。重要的一點(diǎn)是,假設(shè)檢驗(yàn)提供了一種拒絕某個(gè)假設(shè)的工具。上述例子中,待檢驗(yàn)的假設(shè)是:那位女士只

14、是憑猜測(cè)。假設(shè)檢驗(yàn)的目的不是讓我們接受某個(gè)假設(shè),即使與那個(gè)假設(shè)有關(guān)的概率非常高也不能接受。顯著性檢驗(yàn),是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計(jì)推斷方法。 用樣本指標(biāo)估計(jì)總體指標(biāo),其結(jié)論有的完全可靠,有的只有不同程度的可靠性,需要進(jìn)一步加以檢驗(yàn)和證實(shí)。通過檢驗(yàn),對(duì)樣本指標(biāo)與假設(shè)的總體指標(biāo)之間是否存在差別作出判斷,是否接受原假設(shè)。這里必須明確,進(jìn)行檢驗(yàn)的目的不是懷疑樣本指標(biāo)本身是否計(jì)算正確,而是為了分析樣本指標(biāo)和總體指標(biāo)之間是否存在顯著差異。從這個(gè)意義上,假設(shè)檢驗(yàn)又稱為顯著性檢驗(yàn)。假設(shè)檢驗(yàn)是除參數(shù)估計(jì)之外的另一類重要的統(tǒng)計(jì)推斷問題。它的基本思想可以用小

15、概率原理來解釋。所謂小概率原理,就是認(rèn)為小概率事件在一次試驗(yàn)中是幾乎不可能發(fā)生的。也就是說,對(duì)總體的某個(gè)假設(shè)是真實(shí)的,那么不利于或不能支持這一假設(shè)的事件A在一次試驗(yàn)中是幾乎不可能發(fā)生的;要是在一次試驗(yàn)中事件A竟然發(fā)生了,我們就有理由懷疑這一假設(shè)的真實(shí)性,拒絕這一假設(shè)。然而在應(yīng)用之前,首先了解各檢驗(yàn)方法的適用范圍及其特點(diǎn)是正確使用檢驗(yàn)方法的基本前提。其次,認(rèn)清研究目的。在具體的實(shí)際應(yīng)用中,靈活運(yùn)用檢驗(yàn)方法是關(guān)鍵。 檢驗(yàn)方法雖然有各自特點(diǎn)和適用范圍,但是可以對(duì)數(shù)據(jù)做稍微的處理、變化,或是換個(gè)角度分析,便可運(yùn)用不同的檢驗(yàn)方法;且各方法有適用范圍,當(dāng)然也有它的局限性,有時(shí)需要多種檢驗(yàn)方法配合

16、使用,相互補(bǔ)充,才能充分地挖掘信息。例如:獨(dú)立樣本T檢驗(yàn)法判斷AB產(chǎn)品對(duì)于抗過敏的功效評(píng)價(jià)在均值上是否有差異,而卡方檢驗(yàn)可判斷他們?cè)诟髟u(píng)價(jià)水平上的分布有無差異,假如判斷出他們功效水平無差異之后,我們還想知道他們到底是同樣的好還是同樣的差,這時(shí)可以再使用單樣本T 檢驗(yàn)對(duì)與均值評(píng)價(jià)水平相近的滿意度水平進(jìn)行差異性檢驗(yàn)來進(jìn)行定位。此外,我們還需要合理解釋檢驗(yàn)結(jié)果。不僅要正確識(shí)別檢驗(yàn)結(jié)果,還需要結(jié)合原始數(shù)據(jù)及實(shí)際意義,并針對(duì)研究目的來分析說明。運(yùn)用生物學(xué)的方法對(duì)生物界進(jìn)行觀察的時(shí)候,統(tǒng)計(jì)學(xué)的顯著性檢驗(yàn)是必不可少的。其作用就在于防止我們被一些非主要的偶發(fā)事件所欺騙。并不是因?yàn)槲覀兿Mパ芯炕蛟噲D

17、去查明這些偶發(fā)事件,而是因?yàn)樗鼈兣c許多我們無法控制的其他境況聯(lián)系在一起。一個(gè)觀測(cè)的結(jié)果,倘若在我們正在尋找的真正原因根本不存在的情況下,幾乎從未發(fā)生過,可以判斷這個(gè)觀測(cè)具有顯著性。如果偶然發(fā)生的機(jī)率低于二十分之一,通常的做法是判斷其結(jié)果具有顯著性。對(duì)實(shí)際調(diào)查者來說,顯著性水平的選擇是任意的,但便于應(yīng)用。不過,它并不意味著可以讓自己每20次實(shí)驗(yàn)中就被騙一次。顯著性檢驗(yàn)只是告訴他什么是應(yīng)該忽略掉的,也就是說應(yīng)該把所有那些無法得到顯著性結(jié)果的實(shí)驗(yàn)忽略掉。當(dāng)他知道如何設(shè)計(jì)一個(gè)實(shí)驗(yàn),而這個(gè)實(shí)驗(yàn)幾乎一定能給出一個(gè)顯著性的結(jié)果時(shí),他也只能說明,這僅是一種實(shí)驗(yàn)上可以驗(yàn)證的現(xiàn)象。所以,對(duì)那些孤立的具有顯著性的結(jié)

18、果,他不知道如何才能讓它們?cè)佻F(xiàn)出來,只能留待以后再做進(jìn)一步的調(diào)查研究了。三、關(guān)于抽樣調(diào)查女士品茶第17章“當(dāng)部分優(yōu)于總體時(shí)” 中提到:20世紀(jì)30年代的早期,印度發(fā)現(xiàn)了一個(gè)便利抽樣的典型案例。大包大包的黃麻堆到了孟買的碼頭上,準(zhǔn)備裝船運(yùn)往英國(guó)。為了估計(jì)黃麻的價(jià)值,便從每包中抽取一些,黃麻的質(zhì)量就由樣本來確定。抽樣是將一把中空的圓形刀片插入包中,再拔出來,刀片中央的空處便帶出了少量的黃麻。在包裝和上船過程中,外層的黃麻開始變質(zhì),而里面的被壓得越來越緊,冬天的時(shí)候常常凍得結(jié)得一塊。取樣員將空心刀片插入包中時(shí),由于中央更硬而發(fā)生偏離,所取的樣品更多的是外層已經(jīng)變質(zhì)的黃麻。這種使得樣本就會(huì)產(chǎn)生偏差,樣

19、本的質(zhì)量偏低,實(shí)際上整包黃麻的質(zhì)量要高出許多。加爾各答市總統(tǒng)學(xué)院物理系的普拉桑塔?錢德拉?馬哈拉諾比斯教授經(jīng)常引用這個(gè)例子(這是他在鐵道公司工作時(shí)發(fā)現(xiàn)的,該公司將黃麻運(yùn)往碼頭),說明為什么使得樣本不可信。馬哈拉諾比斯生于一個(gè)富裕的商人家庭,因此能夠供他上本科和研究生,并且選擇學(xué)習(xí)自己感興趣的科學(xué)和數(shù)學(xué)。抽樣調(diào)查是一種非全面調(diào)查,它是從全部調(diào)查研究對(duì)象中,抽選一部分單位進(jìn)行調(diào)查,并據(jù)以對(duì)全部調(diào)查研究對(duì)象作出估計(jì)和推斷的一種調(diào)查方法。顯然,抽樣調(diào)查雖然是非全面調(diào)查,但它的目的在于取得反映總體情況的信息資料,因而,也可起到全面調(diào)查的作用。相對(duì)于抽樣調(diào)查,普查工作量大,花費(fèi)大,組織工作復(fù)雜;其調(diào)查內(nèi)容

20、有限,易產(chǎn)生重復(fù)和遺漏現(xiàn)象;且由于工作量大而可能導(dǎo)致調(diào)查的精確度下降,調(diào)查質(zhì)量不易控制。所以在現(xiàn)實(shí)生活中,抽樣調(diào)查的優(yōu)越性是全面調(diào)查無法比擬的:一是質(zhì)量性高??杉辛α孔錾钊爰?xì)致調(diào)查并提高調(diào)查質(zhì)量。還可用于只能觀察局部單位的調(diào)查,如產(chǎn)品的破壞性質(zhì)量檢查,農(nóng)作物全面成熟前的產(chǎn)量實(shí)割實(shí)測(cè)等;二是經(jīng)濟(jì)性好。只調(diào)查部分單位(如5,1,1 等),可節(jié)約大量人力、物力和費(fèi)用開支;三是時(shí)效性強(qiáng)。可大大縮短調(diào)查和整理時(shí)間,較快取得調(diào)查結(jié)果;四是適應(yīng)面廣。在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)中,抽樣調(diào)查日益得到廣泛應(yīng)用,如人口普查的事后質(zhì)量檢查,生育率調(diào)查,農(nóng)產(chǎn)量調(diào)查,職工和農(nóng)民家計(jì)調(diào)查等;五是能夠解決全面調(diào)查無法或困難解決的問題。

21、如補(bǔ)充和訂正全面調(diào)查的結(jié)果,應(yīng)用于生產(chǎn)過程中產(chǎn)品質(zhì)量的檢查和控制,用于對(duì)總體的某種假設(shè)進(jìn)行檢驗(yàn)等等。但它有兩個(gè)主要缺點(diǎn)。第一個(gè)是只有當(dāng)我們確信對(duì)大總體具有充分的了解,可以將總體劃分為能用一些個(gè)體來代表的幾個(gè)子總體時(shí),判斷樣本才具有代表性。既然我們希望通過樣本來了解的問題,正是據(jù)以將大總體劃分為幾個(gè)勻質(zhì)組的依據(jù),如果我們對(duì)大總體已經(jīng)了解得這么清楚,可能就無需再進(jìn)行抽樣了。第二個(gè)問題更加麻煩,如果判斷樣本的估計(jì)結(jié)果是錯(cuò)的,我們無法知道該結(jié)果與真值到底相關(guān)多少。2000年夏天,有人就批評(píng)尼爾森媒體研究所抽取的樣本中西班牙裔家庭太少,因而低估了西班牙語電視的觀眾人數(shù)。馬哈拉諾比斯的解決辦法是采用隨機(jī)樣

22、本。我們采用隨機(jī)原則從大總體中抽取個(gè)體,由隨機(jī)樣本得到的數(shù)據(jù)很可能會(huì)錯(cuò),但是我們可以用數(shù)理統(tǒng)計(jì)學(xué)的理論確定該如何最優(yōu)地抽取樣本并測(cè)定數(shù)值,以確保長(zhǎng)期來看我們的數(shù)據(jù)將比其它數(shù)據(jù)更接近真值。并且,我們知道隨機(jī)抽樣概率分布的數(shù)學(xué)形式,可以計(jì)算總體那些待估參數(shù)的置信區(qū)間??梢?,隨機(jī)樣本要優(yōu)于使得樣本或者是判斷樣本,當(dāng)然,這并不是因?yàn)樗鼤?huì)保證得到正確的結(jié)果,而是因?yàn)槲覀兛梢杂?jì)算一個(gè)數(shù)值區(qū)間,以較高的概率保證真值落入這一區(qū)間內(nèi)。抽樣的數(shù)學(xué)理論在20世紀(jì)30年代得到了迅速發(fā)展,其中一部分應(yīng)歸功于由馬哈拉諾比斯領(lǐng)導(dǎo)下的印度統(tǒng)計(jì)研究所;一部分應(yīng)歸功于20世紀(jì)30年代后期奈曼發(fā)表的兩篇論文;還有一部分應(yīng)歸功于一群

23、年輕而富有朝氣的大學(xué)畢業(yè)生,他們?cè)诿绹?guó)實(shí)施新政的早期匯集于華盛頓。正是在這群在聯(lián)邦政府商務(wù)部和勞工部任職的年輕人,熱心于新政,提出了關(guān)于如何從總體中抽取樣本的許多實(shí)際問題,并成功地解決了這些問題。四、關(guān)于統(tǒng)計(jì)學(xué)的應(yīng)用領(lǐng)域從“女士品茶”中得到的統(tǒng)計(jì)實(shí)驗(yàn)設(shè)計(jì)從“女士品茶”中得到的是實(shí)驗(yàn)方式在“女士品茶”中,有許多的故事讓我們學(xué)會(huì)何選擇合適的實(shí)驗(yàn)對(duì)象,如何選擇合適的實(shí)驗(yàn)方法。如在做抽查實(shí)驗(yàn)時(shí),要選擇好抽查群體,不可只抽查一類人,這樣就會(huì)使得結(jié)果不準(zhǔn)確。例如:在K·皮爾遜看來,概率分布是可以通過收集有關(guān)數(shù)據(jù)來驗(yàn)證的。他認(rèn)為,若收集足夠多的數(shù)據(jù),那么可以用來代表總體的相關(guān)數(shù)據(jù)。生物統(tǒng)計(jì)雜志的記

24、者們從古墓中搜集到了數(shù)以百計(jì)的顱骨,灌入顆粒狀物以測(cè)定顱腔的容量大小,然后將得到的幾百個(gè)數(shù)據(jù)送給K?皮爾遜。一名工作人員還深入中美洲的叢林中,測(cè)量了成百上千個(gè)當(dāng)?shù)赝林用竦母觳查L(zhǎng)度,這些數(shù)據(jù)也送到了K·皮爾遜的生物統(tǒng)計(jì)實(shí)驗(yàn)室。然而,K·皮爾遜所使用的方法存在一個(gè)根本性的缺陷。他獲得的數(shù)據(jù)現(xiàn)在被稱為“便利樣本”,都屬于那些最容易得到的數(shù)據(jù),并不能真正代表總體分布。他們測(cè)定的顱腔大小,都只是來自那些碰巧被他們發(fā)現(xiàn)而打開了墓穴,那些沒有被發(fā)現(xiàn)的可能會(huì)與之大相徑庭。五、關(guān)于統(tǒng)計(jì)學(xué)的研究領(lǐng)域統(tǒng)計(jì)學(xué)具有廣泛的研究領(lǐng)域,理、工、農(nóng)、藝、文,幾乎沒有不用統(tǒng)計(jì)學(xué)的地方,所以,它形成了一個(gè)學(xué)科

25、群。通過閱讀和學(xué)習(xí)女士品茶,感受到統(tǒng)計(jì)的用途至少體現(xiàn)在以下兩方面:第一,統(tǒng)計(jì)學(xué)是科學(xué)的研究方法。任何科學(xué)都是研究客觀規(guī)律的,規(guī)律可以在反復(fù)試驗(yàn)中重復(fù)。沒有重復(fù)的事物不是科學(xué)研究的對(duì)象。我們周圍的事物每天都在重復(fù),太陽每天東升西落,春夏秋冬四季更替,宏觀經(jīng)濟(jì)每天運(yùn)行,只有運(yùn)行、重復(fù),才有規(guī)律。但人不能兩次踏入同一條河,事物的每一次重復(fù)決不是前一次的克隆。統(tǒng)計(jì)學(xué)就是變化中研究規(guī)律的科學(xué)。所以統(tǒng)計(jì)學(xué)是任何學(xué)科進(jìn)行科學(xué)研究的工作母機(jī),沒有統(tǒng)計(jì)學(xué)就沒有科學(xué)研究、沒有創(chuàng)新。第二,統(tǒng)計(jì)學(xué)是管理工作的工具。政治家無法脫離統(tǒng)計(jì)而施政,軍事家無法脫離信息而指揮,企業(yè)家無法脫離統(tǒng)計(jì)而決策,任何管理工作都要做到心中有

26、數(shù)。學(xué)好統(tǒng)計(jì),是搞好任何工作的前提。生活中充滿著統(tǒng)計(jì)的科學(xué)與藝術(shù),所以需要學(xué)習(xí)統(tǒng)計(jì)。一方面,統(tǒng)計(jì)工作涵蓋面很廣,包括精算、農(nóng)學(xué)、動(dòng)物學(xué)、人類學(xué)、考古學(xué)、審計(jì)學(xué)、晶體學(xué)、人口統(tǒng)計(jì)學(xué)、牙醫(yī)學(xué)、生態(tài)學(xué)、經(jīng)濟(jì)計(jì)量學(xué)、教育學(xué)、選舉預(yù)測(cè)和策劃、工程、流行病學(xué)等,幾乎無所不包。故干統(tǒng)計(jì)工作的需要學(xué)習(xí)統(tǒng)計(jì);另一方面,人們有時(shí)形容某人“缺數(shù)”,譯成專業(yè)術(shù)語就是“這個(gè)人沒學(xué)過統(tǒng)計(jì)”。故不干統(tǒng)計(jì)工作也要學(xué)統(tǒng)計(jì)。在女士品茶中給我印象最深刻的兩個(gè)人物就是費(fèi)歇爾和K.皮爾遜,不得不說他們是統(tǒng)計(jì)界的非常杰出的兩位。費(fèi)歇爾由于先天的部分原因?qū)е滤趲缀沃庇X方面異常靈敏,他認(rèn)為簡(jiǎn)而易見的數(shù)學(xué)知識(shí)其他數(shù)學(xué)家可能要花上數(shù)個(gè)月才能證

27、明。然而正因?yàn)槿绱怂且粋€(gè)非常沒有耐心的人,雖然他在統(tǒng)計(jì)學(xué)富有盛名,但他的貢獻(xiàn)一半以上是與遺傳學(xué)有關(guān)。而K.皮爾遜雖然拿的是政治學(xué)博士的學(xué)位,但他的主要興趣還是在科學(xué)哲學(xué)和數(shù)學(xué)模型的性質(zhì)上。他發(fā)表的科學(xué)的法則被視為關(guān)于科學(xué)和數(shù)學(xué)性質(zhì)最偉大的著作之一。而他提出的四個(gè)基本參數(shù)也普遍被應(yīng)用于各個(gè)領(lǐng)域。 同為兩大杰出的科學(xué)家,他們之間卻是水火不容。費(fèi)歇爾的政治見解與K.皮爾遜的完全不同。后者鐘情于社會(huì)主義與馬克思主義,他同情被壓迫者,并喜歡挑戰(zhàn)保守的優(yōu)等階級(jí) 費(fèi)歇爾則更關(guān)注優(yōu)生學(xué)。因?yàn)樗麄兊膶?duì)頭關(guān)系也影響了后代。從而費(fèi)歇爾與小皮爾遜的私交并不是很好。從這我們不得不說費(fèi)歇爾還真是記仇啊,他對(duì)小皮爾遜這位

28、溫文爾雅的先生存在著顯而易見的敵意。小皮爾遜一是代父受過二則是代合作伙伴耶日.奈曼受過費(fèi)歇爾特別討厭奈曼。盡管如此,小皮爾遜還是對(duì)費(fèi)歇爾極其尊重并高度評(píng)價(jià)他的工作。他曾經(jīng)寫道,他早就習(xí)慣了費(fèi)歇爾從來就不在著作中提到他的名字盡管兩人之間存在糾紛,但都竭力避免公開的沖突。通過我對(duì)費(fèi)歇爾與K.皮爾遜之間的恩怨了解,使得我對(duì)費(fèi)歇爾的印象大打折扣,但不可否認(rèn)的是,他的貢獻(xiàn)起著舉足輕重的地位。其實(shí)他們?cè)谡軐W(xué)上也存在這樣或那樣的間接交流。 K.皮爾遜把統(tǒng)計(jì)分布視為他所份分析數(shù)據(jù)的集合的真實(shí)描述,而按照費(fèi)歇爾的觀點(diǎn):真實(shí)分布只是一個(gè)抽象的數(shù)學(xué)公式。費(fèi)歇爾用他條理清晰的數(shù)學(xué)頭腦理清了殘留在K.皮爾遜觀點(diǎn)中的大量混淆,正是這些混淆使得K.皮爾遜沒有意識(shí)到自己觀點(diǎn)的深層本質(zhì)。費(fèi)歇爾用自己的觀點(diǎn)使得K.皮爾遜的理論更加明確。我們不能不說這不是他們之間的學(xué)術(shù)合作。而我們也不得不承認(rèn)知識(shí)是沒

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論