版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2023/9/14數(shù)據(jù)模型與決策數(shù)據(jù)的產(chǎn)生與圖表描述一、調(diào)查面面觀二、實(shí)驗(yàn)面面觀三、數(shù)據(jù)的圖表描述數(shù)據(jù)、模型與決策2023/9/14數(shù)據(jù)模型與決策一、調(diào)查面面觀1.1調(diào)查如何出錯(cuò)1.2抽樣誤差與非抽樣誤差1.3抽樣設(shè)計(jì)1.4解讀調(diào)查結(jié)論2023/9/14數(shù)據(jù)模型與決策例1.1誰(shuí)先動(dòng)手?有人調(diào)查研究酒吧里的打架致死事件,發(fā)現(xiàn)其中90%都是死掉的那個(gè)人先動(dòng)手。真是這樣嗎?如果你跟人打架把對(duì)方給揍死了,警察問(wèn)你誰(shuí)先動(dòng)手的時(shí)候你怎么回答?1.1調(diào)查如何出錯(cuò)2023/9/14數(shù)據(jù)模型與決策例1.2美國(guó)的種族效應(yīng)1989年,紐約市選出第一位黑人市長(zhǎng),維吉尼亞選出第一位黑人州長(zhǎng)。這兩個(gè)事件,在投票所訪問(wèn)投完票的選民后所預(yù)測(cè)到的勝負(fù)差距,都比實(shí)際開(kāi)票的差距大。因此,調(diào)查機(jī)構(gòu)相當(dāng)確定,有些受訪選民因?yàn)椴辉赋姓J(rèn)沒(méi)投票給黑人候選人而說(shuō)了謊。2023/9/14數(shù)據(jù)模型與決策例1.3權(quán)威人物的意見(jiàn)有兩個(gè)內(nèi)容相同的問(wèn)題:?jiǎn)栴}A:陸軍部和海軍部應(yīng)當(dāng)合并為統(tǒng)一的作戰(zhàn)部,您同意么?問(wèn)題B:艾森豪威爾將軍說(shuō),陸軍部和海軍部應(yīng)當(dāng)合并為統(tǒng)一的作戰(zhàn)部,您同意么?結(jié)果對(duì)問(wèn)題A表示同意的比例為29%,而對(duì)問(wèn)題B表示同意的比例為49%,兩者相距甚遠(yuǎn)。無(wú)疑,權(quán)威人物艾森豪威爾將軍的意見(jiàn)影響了被調(diào)查者的意見(jiàn)。2023/9/14數(shù)據(jù)模型與決策例1.4總統(tǒng)選舉預(yù)測(cè)1936年民主黨人羅斯福任美國(guó)總統(tǒng)第一任滿(mǎn),共和黨人蘭登與他競(jìng)選總統(tǒng)。
《文學(xué)摘要》雜志根據(jù)有約二百四十萬(wàn)人參加的民意測(cè)驗(yàn),預(yù)測(cè)蘭登會(huì)以57%對(duì)43%的優(yōu)勢(shì)獲勝。自1916年以來(lái)的五屆總統(tǒng)選舉中,《文學(xué)摘要》雜志都正確地預(yù)測(cè)出獲勝的一方,其影響力很大。那時(shí)蓋洛普剛剛設(shè)立起他的調(diào)查機(jī)構(gòu),他根據(jù)一個(gè)約五萬(wàn)人的樣本,預(yù)測(cè)羅斯福會(huì)以56%對(duì)44%的優(yōu)勢(shì)獲勝。實(shí)際結(jié)果是,羅斯福以62%對(duì)38%的優(yōu)勢(shì)勝出。當(dāng)時(shí)有人說(shuō),這次選舉的最大贏家不是羅斯福,而是蓋洛普。自這之后,蓋洛普的調(diào)查機(jī)構(gòu)得到迅速的發(fā)展,國(guó)內(nèi)外聞名,而《文學(xué)摘要》雜志不久就垮了。
《文學(xué)摘要》雜志的調(diào)查方法有什么問(wèn)題?2023/9/14數(shù)據(jù)模型與決策實(shí)際的抽樣調(diào)查是很復(fù)雜的,即使采用了好的隨機(jī)抽樣方法、準(zhǔn)確地計(jì)算了誤差界限,調(diào)查結(jié)果也不一定可靠。就拿例3.1來(lái)說(shuō),本來(lái)應(yīng)該是對(duì)打架雙方都進(jìn)行調(diào)查,但已經(jīng)死去的被調(diào)查者無(wú)法回答,而剩下的被調(diào)查者又可能為保全自己而不如實(shí)地回答。那么,這樣的調(diào)查結(jié)果會(huì)可靠嗎?下面,我們來(lái)看看抽樣調(diào)查有些什么樣的誤差來(lái)源,以及抽樣調(diào)查者應(yīng)如何與之奮斗。2023/9/14數(shù)據(jù)模型與決策統(tǒng)計(jì)調(diào)查的目的是取得能準(zhǔn)確反映客觀狀況的統(tǒng)計(jì)數(shù)據(jù)。在許多時(shí)候,調(diào)查結(jié)果并不能準(zhǔn)確地表現(xiàn)事實(shí),總會(huì)有誤差出現(xiàn)。在調(diào)查的各個(gè)階段,誤差都有可能出現(xiàn)。如果其中一個(gè)階段出現(xiàn)了較大誤差,可能會(huì)把其他階段都進(jìn)行得很好的一次調(diào)查毀掉,因此必須認(rèn)真細(xì)致地實(shí)施調(diào)查的每一個(gè)階段、嚴(yán)格控制誤差。為了保證統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量,了解誤差的來(lái)源與減小誤差的措施很有必要。1.2抽樣誤差與非抽樣誤差2023/9/14數(shù)據(jù)模型與決策繼續(xù)例1.4
從常理來(lái)看,應(yīng)該調(diào)查數(shù)據(jù)越多,結(jié)論越可靠。羅斯福的實(shí)際得票率為62%,《文學(xué)摘要》雜志的預(yù)測(cè)為43%,誤差達(dá)到19%。誤差之大令人驚異。這樣大的誤差是怎么得來(lái)的呢?經(jīng)過(guò)研究發(fā)現(xiàn),原因在于《文學(xué)摘要》雜志選取樣本有偏性。雜志是根據(jù)電話簿和俱樂(lè)部會(huì)員的名冊(cè),將問(wèn)卷郵寄給一千萬(wàn)人。當(dāng)時(shí)美國(guó)四個(gè)家庭中僅有一家裝電話。他選取的樣本有排斥窮人的選擇偏性。這樣的民意測(cè)驗(yàn)非常不利于民主黨人羅斯福。2023/9/14數(shù)據(jù)模型與決策
此外,《文學(xué)摘要》雜志調(diào)查的一千萬(wàn)人中只有二百四十萬(wàn)人回答了問(wèn)卷,不回答者可能非常有別于回答者,這二百四十萬(wàn)人代表不了被郵寄問(wèn)卷的一千萬(wàn)人。譬如,1936年《文學(xué)摘要》雜志的一次專(zhuān)門(mén)的調(diào)查,給在芝加哥的選民每三人寄去一張問(wèn)卷。約20%的被調(diào)查者作了回答,其中支持蘭登的超過(guò)半數(shù)。但是在選舉中,蘭登在芝加哥的得票率只有三分之一。所以當(dāng)出現(xiàn)高不回答率時(shí),謹(jǐn)防不回答偏性。心理研究表明,低收入和高收入的人傾向于不回答問(wèn)卷,因此中等收入的人在回答者中的比例過(guò)高。為此現(xiàn)代調(diào)查機(jī)構(gòu)更喜歡采用親自詢(xún)問(wèn)來(lái)代替郵寄問(wèn)卷2023/9/14數(shù)據(jù)模型與決策
即使親自詢(xún)問(wèn),也有不回答偏性的問(wèn)題。訪問(wèn)員來(lái)訪時(shí),不在家的人與在家接受訪問(wèn)的人可能在工作時(shí)間、家庭關(guān)系和社會(huì)背景等方面有比較大的差異,從而看法也不一樣。例如有一項(xiàng)關(guān)于快餐的市場(chǎng)調(diào)查。抽取500戶(hù)家庭進(jìn)行調(diào)查。白天訪問(wèn)時(shí),有150戶(hù)家庭沒(méi)人。能不能僅用白天有人的350戶(hù)家庭的數(shù)據(jù)?不能。這里有不回答偏性。白天不在家的150戶(hù)可能是吃快餐比較多的家庭。2023/9/14數(shù)據(jù)模型與決策誤差按其性質(zhì)可以分為兩類(lèi),一類(lèi)是抽樣誤差,它是由于抽選樣本的隨機(jī)性而產(chǎn)生的誤差。只有采用概率抽樣的方式才可能估計(jì)抽樣誤差。另一類(lèi)是非抽樣誤差,它是指除抽樣誤差以外的、由于各種原因而引起的誤差。在概率抽樣、非概率抽樣和全面調(diào)查中,非抽樣誤差都有可能存在。若采用了概率抽樣方法,那么我們可以估計(jì)出抽樣誤差的大小,還可以通過(guò)選擇樣本量的大小來(lái)控制抽樣誤差。在謹(jǐn)慎執(zhí)行的抽樣調(diào)查中,抽樣誤差通常不大。而非抽樣誤差相對(duì)比較難以估計(jì)和控制。2023/9/14數(shù)據(jù)模型與決策問(wèn)題的措辭也可能造成誤差問(wèn)題的措辭造成的誤差是計(jì)量誤差的一種。例3.3顯示了由于問(wèn)題的措辭不同而造成的不同的調(diào)查結(jié)果。研究表明,問(wèn)卷的不同用詞會(huì)造成被調(diào)查者不同的反應(yīng),從而造成調(diào)查誤差。我們來(lái)看幾個(gè)措辭不當(dāng)?shù)膯?wèn)題。2023/9/14數(shù)據(jù)模型與決策問(wèn):您住的地方到這里是多少時(shí)間的路程?1、不超過(guò)10分鐘2、10~20分鐘3、20~30分鐘4、30分鐘以上用什么方式呢?步行?騎自行車(chē)?乘汽車(chē)?還是坐飛碟?問(wèn):您全家的月收入是多少?1、低于2000元2、2000~5000元3、5000~8000元4、8000~11000元5、11000元以上“全家”的定義是什么?“月收入”包括哪些?而且各月收入不同怎么辦?2023/9/14數(shù)據(jù)模型與決策問(wèn):您是否贊成禁止私人擁有槍械以降低犯罪率?
1、很贊成2、比較贊成3、說(shuō)不清4、比較不贊成5、很不贊成你暗示了“禁止擁有槍械”就必然能“降低犯罪率”。明顯要我贊成吧?問(wèn):您在過(guò)去一年里購(gòu)買(mǎi)過(guò)哪些牌子的糖果?
(請(qǐng)?zhí)顚?xiě))
記憶大挑戰(zhàn)?怎么會(huì)記得一年那么長(zhǎng)的事?2023/9/14數(shù)據(jù)模型與決策
實(shí)際中的抽樣調(diào)查是比較復(fù)雜的,若僅采用簡(jiǎn)單隨機(jī)抽樣方法,很可能根本無(wú)法實(shí)現(xiàn)。本節(jié)主要介紹兩種常用的抽樣設(shè)計(jì)方法,一種是分層抽樣方法,另一種是整群抽樣方法。
1.3抽樣設(shè)計(jì)2023/9/14數(shù)據(jù)模型與決策例1.5PackGoodsInc.的分層抽樣方法
PackGoodsInc.是美國(guó)一家專(zhuān)門(mén)研究包裝食品和飲料(即以瓶子、盒子、罐頭或其他容器包裝的食品和飲料)銷(xiāo)售情況的市場(chǎng)研究公司。該公司以美國(guó)所有銷(xiāo)售包裝食品和飲料的商店(包括超市、食品店、便利店、藥店等)作為研究對(duì)象。抽樣時(shí),他們首先采用分層抽樣方法,即按照3個(gè)維度將總體劃分為18個(gè)“格子”,然后在每個(gè)“格子”中獨(dú)立進(jìn)行抽樣。這3個(gè)維度是:一、分層抽樣方法2023/9/14數(shù)據(jù)模型與決策1、地理區(qū)域,包含兩種:
大都市區(qū)域:人口超過(guò)一百萬(wàn)的州或省
州/?。撼╝)外的其他州或省。2、城市大小,包含三種情況:城市“A”:人口超過(guò)12萬(wàn)城市“B”:人口在5000至12萬(wàn)之間城市“C”:人口少于5000。3、商店類(lèi)型,分為三種情況:
食品超市,包括食品連鎖店
食品店:除食品超市外的其他食品店非食品店:一些挑選出的藥店等
2023/9/14數(shù)據(jù)模型與決策若按這3個(gè)維度對(duì)研究總體分類(lèi),那么共有18個(gè)類(lèi),它們可以用一個(gè)立方體來(lái)表示,如圖4.1所示,其中每個(gè)“格子”代表一類(lèi)。譬如,正前方標(biāo)有“1”的格子表示屬于大都市區(qū)域且人口少于5000人的城市中的所有食品超市。從例3.5,我們不難理解分層抽樣的定義:將總體分成若干個(gè)互不重疊的子總體,從每個(gè)子總體中獨(dú)立地進(jìn)行抽樣。每個(gè)子總體,也即例4.5中的“格子”,被成為層(stratum)。2023/9/14數(shù)據(jù)模型與決策分層抽樣的優(yōu)點(diǎn)在于可以提高樣本的代表性,使各個(gè)類(lèi)別(由所劃分的層決定)的樣本都能入樣,避免出現(xiàn)太極端、代表性太差的樣本。在一些大型抽樣調(diào)查中采用分層抽樣可以便于管理。譬如,在一個(gè)全國(guó)性的抽樣調(diào)查中,若以省、自治區(qū)、直轄市為層,那么可以各省、自治區(qū)、直轄市為單位進(jìn)行獨(dú)立抽樣和管理。研究表明,若層內(nèi)差異小、層間差異大,那么可以提高估計(jì)量的精度。2023/9/14數(shù)據(jù)模型與決策例1.6人體測(cè)量抽樣方案1985~1987年間,國(guó)家標(biāo)準(zhǔn)局、中國(guó)服裝工業(yè)總公司和中國(guó)人民解放軍總后軍需裝備研究所就人的體型尺寸設(shè)計(jì)了抽樣方案,以獲取人體各種尺寸的分布情況??紤]到我國(guó)人口分布的現(xiàn)狀以及人體測(cè)量的特點(diǎn),該抽樣方案首先將全國(guó)各省、市、自治區(qū)劃分為12個(gè)層。在每一層被抽中的省、市、自治區(qū)中,以一個(gè)自然的群體單位,如一個(gè)獨(dú)立的實(shí)際單位或其中的一個(gè)或幾個(gè)車(chē)間或班組,作為抽樣單元。一旦這個(gè)群體單位被抽中,那么該單位中的所有人都成為樣本接受測(cè)量。這樣,既簡(jiǎn)化了抽樣框又便于管理。另一方面,試調(diào)查時(shí)發(fā)現(xiàn),除了對(duì)體形尺寸有特殊要求的單位,從事不同職業(yè)人員的體形尺寸無(wú)明顯的差異,這說(shuō)明樣本的代表性也是比較好的。二、整群抽樣方法2023/9/14數(shù)據(jù)模型與決策從總體中按某種方式抽取若干個(gè)群體單位,觀測(cè)其中所有的單元,這種抽樣方法被稱(chēng)為整群抽樣。這些群體單位被稱(chēng)為群(cluster),例4.6中每一自然的群體單位就是一個(gè)群。在分群時(shí),希望群內(nèi)的單元差異大,群間的差異小,這樣,被抽到的群代表性好,整群抽樣的效率就高。由此可見(jiàn),分群的原則與分層的原則正好相反。2023/9/14數(shù)據(jù)模型與決策實(shí)際的抽樣調(diào)查是比較復(fù)雜的,很難采用單一的抽樣方法來(lái)進(jìn)行抽樣。譬如,例3.5中就采用了先分層抽樣,然后在各層中進(jìn)行整群抽樣,這種抽樣方法被稱(chēng)為分層整群抽樣。實(shí)際的抽樣方法可能還要復(fù)雜得多,不過(guò),了解了簡(jiǎn)單隨機(jī)抽樣、分層抽樣和整群抽樣,那么實(shí)際的抽樣方案大多就很容易理解了!除了這里介紹的抽樣方法外,還有其他的抽樣方法,譬如,多階抽樣、系統(tǒng)抽樣、不等概率抽樣等等。各種抽樣方法是可以結(jié)合起來(lái)使用的,譬如,全國(guó)性的抽樣調(diào)查常采用多階抽樣與分層抽樣相結(jié)合的方法。實(shí)際的抽樣方法2023/9/14數(shù)據(jù)模型與決策1.4解讀調(diào)查結(jié)論
誰(shuí)做的調(diào)查?一般來(lái)說(shuō),專(zhuān)業(yè)的抽樣調(diào)查機(jī)構(gòu)為了名聲,會(huì)好好做調(diào)查的。
總體是什么?也就是說(shuō),調(diào)查是在尋求哪些人的意見(jiàn)?樣本是怎樣選取的?注意看他們有沒(méi)有提隨機(jī)抽樣等方法。樣本多大?最好除了樣本大小外還有精確度的評(píng)估,譬如所有用同樣方法可能得到的樣本中的95%會(huì)落進(jìn)去的誤差界限。回應(yīng)率多少?也就是說(shuō),原來(lái)預(yù)定的受訪對(duì)象中有百分之多少確實(shí)提供了信息?用什么方式聯(lián)絡(luò)受訪者?電話?郵寄?面對(duì)面訪談?調(diào)查是什么時(shí)候做的?是不是剛好在一個(gè)可能影響結(jié)果的事件
問(wèn)題確實(shí)是怎么問(wèn)的?對(duì)于沒(méi)能提供上述問(wèn)題答案的調(diào)查,我們最好先持懷疑態(tài)度,不要被看似冠冕堂皇的幾個(gè)數(shù)據(jù)牽著鼻子走啊!2023/9/14數(shù)據(jù)模型與決策二、實(shí)驗(yàn)面面觀2.1幾個(gè)例子2.2實(shí)驗(yàn)設(shè)計(jì)2.3基本原則2023/9/14數(shù)據(jù)模型與決策
例2.1教學(xué)效果
諾瓦東南大學(xué)(NovaSoutheasternUniversity)的一項(xiàng)研究報(bào)告指出:學(xué)生在網(wǎng)上學(xué)習(xí)和在教室里學(xué)習(xí)效果一樣好,由此看來(lái),學(xué)生可以全部網(wǎng)上學(xué)習(xí),可以節(jié)約大量經(jīng)費(fèi)。觀測(cè)研究是被動(dòng)的數(shù)據(jù)搜集方式,它只觀察、記錄或測(cè)量,但是沒(méi)有主動(dòng)介入,而實(shí)驗(yàn)?zāi)苤鲃?dòng)產(chǎn)生數(shù)據(jù)。大部分的實(shí)驗(yàn)或觀測(cè)研究都是想知道一個(gè)或一些變量對(duì)另一個(gè)變量有何影響。本例中大學(xué)生是受試對(duì)象,解釋變量(因子)是學(xué)習(xí)環(huán)境,反應(yīng)變量(指標(biāo))是修完課后學(xué)生的考試成績(jī)。上網(wǎng)學(xué)習(xí)的同學(xué)是否和在教室上課的同學(xué)學(xué)的一樣好?需要指定一些學(xué)生到教室上課,并指定另外一些人上網(wǎng)學(xué)習(xí),然后進(jìn)行對(duì)比,這就是實(shí)驗(yàn)!2.1幾個(gè)例子2023/9/14數(shù)據(jù)模型與決策
例2.2美國(guó)政府研究如下一個(gè)問(wèn)題:是否需要為中低收入家庭提供日間托兒服務(wù)?
如果這項(xiàng)服務(wù)能使得這些兒童在日后收到更多更好的教育,則政府可以少付出福利金、增加稅收而很有效益??_來(lái)那州的一項(xiàng)啟蒙計(jì)劃從1972年開(kāi)始對(duì)一群兒童進(jìn)行跟蹤觀測(cè),結(jié)果顯示,良好的日間照護(hù)對(duì)兒童以后的就學(xué)和就業(yè)有很大影響。啟蒙計(jì)劃中受試對(duì)象是111個(gè)人,他們?cè)?972年還是名嬰兒,出生在低收入家庭,身體健康,所有這些嬰兒都得到社會(huì)工作者的幫助,其中隨機(jī)選出一半的人給予密集學(xué)前教育。這里進(jìn)行了對(duì)比,解釋變量是是否接受學(xué)期教育,而反應(yīng)變量則很復(fù)雜,包括是否上大學(xué)以及就業(yè)情況。2023/9/14數(shù)據(jù)模型與決策
潛在變量是對(duì)研究中其它變量間的關(guān)系有重大影響但未被列為解釋變量的變量。當(dāng)兩個(gè)變量對(duì)反應(yīng)變量的影響混在一起而無(wú)法區(qū)別時(shí),我們稱(chēng)這兩個(gè)變量是交叉的,交叉變量可以是解釋變量,也可以是潛在變量。在諾瓦東南大學(xué)的研究中,學(xué)生原來(lái)的程度是潛在變量,它和解釋變量交叉在一起。學(xué)生期末考試成績(jī)一樣好,我們無(wú)法判斷原因是什么。2023/9/14數(shù)據(jù)模型與決策例2.3
胃冷凍失敗了
胃冷凍能否使得胃潰瘍病人減輕疼痛?接受胃冷凍治療的病人表示治療后疼痛程度降低了,是否可以說(shuō)明胃冷凍有效?數(shù)年之后,有人做了另一項(xiàng)臨床實(shí)驗(yàn),把胃潰瘍病人分成兩組,一組接受胃冷凍治療,一組使用安慰劑。結(jié)果:在接受胃冷凍的82位病人中,34%病情有改善,而在使用安慰劑的78位病人中,38%有改善。從此,醫(yī)生在治療胃潰瘍時(shí)不再使用胃冷凍辦法。許多病人對(duì)如何治療都有正面反應(yīng),這稱(chēng)為安慰劑效應(yīng)。2023/9/14數(shù)據(jù)模型與決策例2.4
隨機(jī)化雙盲實(shí)驗(yàn)二十世紀(jì)六十年代前,脊髓灰質(zhì)炎(俗稱(chēng)小兒麻痹癥)是令人懼怕的疾病之一,嚴(yán)重危害著兒童的健康。1954年美國(guó)公共衛(wèi)生總署決定組織脊髓灰質(zhì)炎疫苗實(shí)驗(yàn)。實(shí)驗(yàn)對(duì)象是1、2、3年級(jí)的兒童。如何設(shè)計(jì)該實(shí)驗(yàn)?2023/9/14數(shù)據(jù)模型與決策
先后提出了多種方案。第1個(gè)實(shí)驗(yàn)方案是,給大量?jī)和臃N疫苗。如果1954年脊髓灰質(zhì)炎發(fā)病率比1953年明顯下降,就說(shuō)疫苗有效??尚袉幔康?個(gè)方案是,取得父母同意的兒童接種疫苗,組成處理組。其他兒童組成對(duì)照組。該方案如何?研究表明,高收入家庭的父母比低收入家庭的父母更贊成接種疫苗,而高收入家庭的兒童也更易受到脊髓灰質(zhì)炎的傷害。最后確定的一個(gè)方案是隨機(jī)化對(duì)照比較雙盲實(shí)驗(yàn)。該實(shí)驗(yàn)的處理組和對(duì)照組都來(lái)自父母同意接種疫苗的兒童們。將這些孩子隨機(jī)分配到處理組或?qū)φ战M(扔一枚均勻的硬幣,以50%對(duì)50%的機(jī)會(huì)將兒童分配到處理組或?qū)φ战M)。2023/9/14數(shù)據(jù)模型與決策隨機(jī)化對(duì)照比較雙盲實(shí)驗(yàn)結(jié)果如下表所示:
人數(shù)病例數(shù)每十萬(wàn)人中的病例數(shù)處理200,7455728對(duì)照201,22914271
可用假設(shè)檢驗(yàn)的方法對(duì)疫苗是否有效果進(jìn)行檢驗(yàn),留待以后討論。2023/9/14數(shù)據(jù)模型與決策在明確所要考察的(可控)因子及其水平后對(duì)實(shí)驗(yàn)進(jìn)行總體安排稱(chēng)為實(shí)驗(yàn)設(shè)計(jì)。要使一項(xiàng)實(shí)驗(yàn)設(shè)計(jì)有效必須在安排實(shí)驗(yàn)時(shí)注意以下幾點(diǎn):1)盡量減少實(shí)驗(yàn)誤差。
實(shí)驗(yàn)設(shè)計(jì)是Fisher在進(jìn)行農(nóng)業(yè)田間實(shí)驗(yàn)時(shí)提出的,他發(fā)現(xiàn)在田間實(shí)驗(yàn)中,環(huán)境條件難以嚴(yán)格控制,實(shí)驗(yàn)誤差不可忽視,故提出對(duì)實(shí)驗(yàn)方案必須作合理的安排,以減輕誤差的影響。2)盡量減少實(shí)驗(yàn)次數(shù)。
這意味著減少實(shí)驗(yàn)費(fèi)用、縮短實(shí)驗(yàn)周期,特別在生產(chǎn)中更要注意這一點(diǎn),過(guò)多的實(shí)驗(yàn)次數(shù)使企業(yè)難以承受,以至于不得不放棄實(shí)驗(yàn)設(shè)計(jì)方案。2.2實(shí)驗(yàn)設(shè)計(jì)2023/9/14數(shù)據(jù)模型與決策3)便于對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行統(tǒng)計(jì)分析。
由于在實(shí)驗(yàn)中存在隨機(jī)誤差,并體現(xiàn)在指標(biāo)的測(cè)量值上,所以對(duì)指標(biāo)值的分析只有用統(tǒng)計(jì)方法才是客觀的和科學(xué)的分析方法。這樣一來(lái),任何一個(gè)實(shí)驗(yàn)問(wèn)題就有兩個(gè)方面:實(shí)驗(yàn)的設(shè)計(jì)和數(shù)據(jù)的統(tǒng)計(jì)分析。這兩個(gè)方面緊密相連,設(shè)計(jì)時(shí)要想到下一步如何進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)分析時(shí)要考慮到實(shí)驗(yàn)是按什么設(shè)計(jì)方案進(jìn)行的。2023/9/14數(shù)據(jù)模型與決策實(shí)驗(yàn)設(shè)計(jì)有三個(gè)基本原則:重復(fù)、隨機(jī)化和區(qū)組。這三個(gè)基本原則在每個(gè)實(shí)驗(yàn)中都必須考慮。1)重復(fù):指一個(gè)實(shí)驗(yàn)點(diǎn)在相同條件下重復(fù)進(jìn)行若干次實(shí)驗(yàn)。重復(fù)次數(shù)愈多,所得結(jié)論愈可信。但這也帶來(lái)實(shí)驗(yàn)時(shí)間的延長(zhǎng)和實(shí)驗(yàn)費(fèi)用的增加。實(shí)驗(yàn)設(shè)計(jì)要求根據(jù)實(shí)際情況在兩者之間取得平衡。譬如在生物、化學(xué)和農(nóng)業(yè)實(shí)驗(yàn)中重復(fù)次數(shù)要略多一些,而在工業(yè)實(shí)驗(yàn)中,若實(shí)驗(yàn)穩(wěn)定,重復(fù)次數(shù)可略少一些。2.3基本原則2023/9/14數(shù)據(jù)模型與決策2)隨機(jī)化隨機(jī)化是指實(shí)驗(yàn)材料的分配和各實(shí)驗(yàn)點(diǎn)的實(shí)驗(yàn)次序都要隨機(jī)確定。它有如下一些好處:隨機(jī)化常能使各次實(shí)驗(yàn)結(jié)果相互獨(dú)立,而這是實(shí)驗(yàn)設(shè)計(jì)中正確使用統(tǒng)計(jì)方法分析實(shí)驗(yàn)結(jié)果的基石;可以使不可控因子的影響“抵消”部分,不至于積累成災(zāi);對(duì)實(shí)驗(yàn)人員尚未意識(shí)到的不可控因子的影響可以得到減弱;可使實(shí)驗(yàn)誤差得到準(zhǔn)確的估計(jì)。隨機(jī)化可視同參加保險(xiǎn),有可能會(huì)增加麻煩和費(fèi)用,但確能起到消災(zāi)防災(zāi)的作用,只有在隨機(jī)化實(shí)施十分困難的時(shí)才可以不進(jìn)行隨機(jī)化。2023/9/14數(shù)據(jù)模型與決策3)區(qū)組
一組實(shí)驗(yàn)總希望在相同或近似相同條件下進(jìn)行,但在很多實(shí)際場(chǎng)合很難得到,于是實(shí)驗(yàn)中常采用分“區(qū)組”方法:把實(shí)驗(yàn)單元分為若干個(gè)小組,使每組內(nèi)的實(shí)驗(yàn)條件相同或近似相同,而組與組之間在實(shí)驗(yàn)條件上允許有較大差異,這樣的小組在實(shí)驗(yàn)設(shè)計(jì)中被稱(chēng)為區(qū)組。有點(diǎn)類(lèi)似于抽樣調(diào)查中的分層。譬如,一項(xiàng)農(nóng)田實(shí)驗(yàn)中要到20個(gè)實(shí)驗(yàn)田快,但它們的肥程度、日照強(qiáng)弱、水份多少很難達(dá)到完全相同或近似相同。若把20個(gè)田塊快分成幾個(gè)區(qū)組,使區(qū)組內(nèi)差異小,而區(qū)組間允許差異大一些,這在很多場(chǎng)合就容易辦到。2023/9/14數(shù)據(jù)模型與決策數(shù)據(jù)收集好了,那我們就來(lái)看看從數(shù)據(jù)中能挖到什么寶藏了!例3.1交通事故的駕駛因素分析造成交通事故的駕駛因素有判斷失誤、察覺(jué)得晚、駕駛錯(cuò)誤、偏離規(guī)定的行駛路線和酒后或疲勞駕駛等。某地區(qū)交通管理部門(mén)對(duì)某段時(shí)間中的50起交通事故進(jìn)行駕駛因素分析,得到的原始數(shù)據(jù)如下:三、數(shù)據(jù)的圖表描述2023/9/14數(shù)據(jù)模型與決策駕駛錯(cuò)誤察覺(jué)得晚察覺(jué)得晚判斷失誤駕駛錯(cuò)誤察覺(jué)得晚判斷失誤察覺(jué)得晚判斷失誤察覺(jué)得晚判斷失誤酒后或疲勞駕駛察覺(jué)得晚判斷失誤察覺(jué)得晚駕駛錯(cuò)誤判斷失誤駕駛錯(cuò)誤察覺(jué)得晚判斷失誤酒后或疲勞駕駛察覺(jué)得晚察覺(jué)得晚察覺(jué)得晚察覺(jué)得晚察覺(jué)得晚偏離規(guī)定的行駛路線判斷失誤駕駛錯(cuò)誤察覺(jué)得晚判斷失誤判斷失誤判斷失誤察覺(jué)得晚駕駛錯(cuò)誤察覺(jué)得晚察覺(jué)得晚駕駛錯(cuò)誤察覺(jué)得晚判斷失誤判斷失誤駕駛錯(cuò)誤駕駛錯(cuò)誤判斷失誤駕駛錯(cuò)誤駕駛錯(cuò)誤酒后或疲勞駕駛察覺(jué)得晚察覺(jué)得晚察覺(jué)得晚2023/9/14數(shù)據(jù)模型與決策從例3.1的數(shù)據(jù),你能看出些什么?也許你看出了“察覺(jué)得晚”、“判斷失誤”等因素比較多,“偏離規(guī)定的行駛路線”、“酒后或疲勞駕駛”等因素比較少。很好!其實(shí),只要借助一些簡(jiǎn)單的圖表,就能對(duì)數(shù)據(jù)加以整理并進(jìn)行初步的定量分析。一些常用的軟件如Excel,幾乎能完美地為你完成這些圖表!2023/9/14數(shù)據(jù)模型與決策3.1頻數(shù)頻率分布表頻數(shù)頻率分布表是表明幾個(gè)不相重疊的類(lèi)中每一類(lèi)的頻數(shù)和頻率的表格,是很常用的一種數(shù)據(jù)描述方法。頻數(shù)和頻率分別是什么呢?頻數(shù)是指將樣本按照一定的方法分成若干類(lèi),每類(lèi)中含有這個(gè)樣本的個(gè)體的數(shù)目。頻率是指某個(gè)類(lèi)的頻數(shù)與樣本容量的比值。譬如,在例1中,“察覺(jué)得晚”這一因素出現(xiàn)了21次,那么其頻數(shù)為21,頻率為21/50=42%。2023/9/14數(shù)據(jù)模型與決策表1駕駛因素的頻數(shù)頻率分布表駕駛因素頻數(shù)頻率(%)察覺(jué)得晚2142判斷失誤1428駕駛錯(cuò)誤1122偏離規(guī)定的行駛路線12酒后或疲勞駕駛36合計(jì)501002023/9/14數(shù)據(jù)模型與決策我們從表1很容易看出:哪些因素是比較主要的因素?各因素之間頻率的差異有多大?等等。有時(shí),累積頻率也需要在頻數(shù)頻率分布表中列出。每一類(lèi)的累積頻率是指,從第一類(lèi)開(kāi)始累積到該類(lèi)的頻率總和,即將該類(lèi)及其之前的所有類(lèi)的頻率相加。譬如,為了分析駕駛因素中的主要因素,我們可以進(jìn)一步改進(jìn)表1,按照頻數(shù)或頻率從大到小的順序,將各因素排序后列出來(lái),并加上累積頻率一項(xiàng),結(jié)果列于表2中。2023/9/14數(shù)據(jù)模型與決策表2分析駕駛因素中主要因素的頻數(shù)頻率分布表駕駛因素頻數(shù)頻率(%)累積頻率%察覺(jué)得晚214242判斷失誤142870駕駛錯(cuò)誤112292酒后或疲勞駕駛3698偏離規(guī)定的行駛路線12100合計(jì)50100
軟件實(shí)施用Excel制作定性數(shù)據(jù)頻數(shù)頻率分布表2023/9/14數(shù)據(jù)模型與決策累積頻率更常用于有序數(shù)據(jù)的分析中。我們來(lái)看一個(gè)例子。例3.2博客調(diào)查(http://)PerseusDevelopment公司在其網(wǎng)頁(yè)上發(fā)布了一項(xiàng)關(guān)于博客的調(diào)查報(bào)告。該調(diào)查根據(jù)8個(gè)博客服務(wù)商提供的博客用戶(hù)資料,得到了各年齡段的人創(chuàng)建的博客數(shù),頻數(shù)頻率分布表3顯示了調(diào)查結(jié)果。2023/9/14數(shù)據(jù)模型與決策表3各年齡段的博客創(chuàng)建情況10-1255,5001.351.3513-192,120,00051.4552.8020-291,630,00039.5692.3530-39241,0005.8598.2030-4941,7001.0199.2150-5918,5000.4599.66年齡段創(chuàng)建的博客數(shù)
頻率(%)累積頻率(%)60-6913,9000.34100.00合計(jì)4,120,600100.00請(qǐng)注意表2和表3排列順序的不同。2023/9/14數(shù)據(jù)模型與決策用于數(shù)據(jù)描述的圖形比較多,譬如常用的餅狀圖、柱狀圖、直方圖,以及在統(tǒng)計(jì)學(xué)中常用的莖葉圖、排列圖等等。當(dāng)我們?cè)诳紤]各種圖的時(shí)候,把變量稍加分類(lèi)會(huì)有幫助。有的變量具備有意義的數(shù)值尺度,如身高幾厘米、考試成績(jī)幾分等;而有的變量只是把個(gè)體分到不同類(lèi)別而已,如性別、職業(yè)或教育程度。類(lèi)別變量只記錄所屬類(lèi)別,譬如,例1的變量就是類(lèi)別變量,它包含5個(gè)類(lèi),個(gè)體的數(shù)據(jù)就是指?jìng)€(gè)體屬于其中某個(gè)類(lèi)。要表示類(lèi)別變量的分布,可以用餅圖,也可用柱狀圖或條形圖,等等。3.2類(lèi)別變量的圖形顯示2023/9/14數(shù)據(jù)模型與決策以下圖形均由計(jì)算機(jī)繪制!ExcelMINITAB2023/9/14數(shù)據(jù)模型與決策2
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 贛州師范高等專(zhuān)科學(xué)?!斗课萁ㄖW(xué)課程實(shí)踐》2023-2024學(xué)年第一學(xué)期期末試卷
- 贛南醫(yī)學(xué)院《語(yǔ)音信息處理》2023-2024學(xué)年第一學(xué)期期末試卷
- 贛南科技學(xué)院《中小學(xué)體能訓(xùn)練與評(píng)價(jià)》2023-2024學(xué)年第一學(xué)期期末試卷
- 《瘧疾防治措施》課件
- 一次函數(shù)練習(xí)課課件
- 七年級(jí)語(yǔ)文上冊(cè)第三單元11論語(yǔ)十二章教案新人教版
- 三年級(jí)數(shù)學(xué)上冊(cè)4萬(wàn)以?xún)?nèi)的加法和減法二1加法練習(xí)課第1-2課時(shí)教學(xué)設(shè)計(jì)新人教版
- 三年級(jí)數(shù)學(xué)上冊(cè)教材梳理統(tǒng)計(jì)與可能性新人教版
- 三年級(jí)科學(xué)下冊(cè)第四單元磁鐵第5課磁力大小會(huì)變化嗎教學(xué)材料教科版
- 《如何制作專(zhuān)業(yè)化》課件
- 2025年大學(xué)華西醫(yī)院運(yùn)營(yíng)管理部招考聘用3人管理單位筆試遴選500模擬題附帶答案詳解
- 2025年放射科工作計(jì)劃
- 2024年中國(guó)干粉涂料市場(chǎng)調(diào)查研究報(bào)告
- 2024年副班主任工作總結(jié)(3篇)
- 課題申報(bào)書(shū):古滇青銅文化基因圖譜構(gòu)建及活態(tài)深化研究
- 2024年城鄉(xiāng)學(xué)校結(jié)對(duì)幫扶工作總結(jié)范例(3篇)
- 房地產(chǎn)法律風(fēng)險(xiǎn)防范手冊(cè)
- 《監(jiān)考人員培訓(xùn)》課件
- 期末綜合測(cè)試卷(試題)-2024-2025學(xué)年四年級(jí)上冊(cè)數(shù)學(xué)人教版
- 分布式光伏發(fā)電項(xiàng)目計(jì)劃書(shū)
- 水土保持方案投標(biāo)文件技術(shù)部分
評(píng)論
0/150
提交評(píng)論