




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、你應(yīng)該知道的統(tǒng)計知識中華資料採礦協(xié)會1何謂統(tǒng)計學(xué) 統(tǒng)計就是從數(shù)據(jù)中獲取資訊的科學(xué)收集資料整理資料分析資料導(dǎo)出結(jié)論敘述統(tǒng)計學(xué)、推論統(tǒng)計學(xué)2統(tǒng)計詞彙 母體個體樣本抽樣底冊參數(shù)統(tǒng)計量變數(shù)眾數(shù)中位數(shù)平均數(shù)3母體與樣本間的關(guān)係母體樣本抽樣樣本統(tǒng)計量推論母體參數(shù)抽樣誤差非抽樣誤差4個體樣本觀察值變數(shù)5騙人的平均數(shù)老謝應(yīng)徵工作公司規(guī)模:老闆、經(jīng)理2位、組長3位、職員5位。老闆:公司平均月薪6萬元,受訓(xùn)期間1萬五千元,很快會加薪。做不做?6平均數(shù):6萬中間數(shù):4萬眾數(shù):2萬7平均數(shù):量測觀察值散佈情形的中間值。標(biāo)準(zhǔn)差:衡量觀察值的散佈情形偏離平均值有多遠(yuǎn)。偏度:描述一個分配偏離對稱性的情形峰度:衡量觀察值偏離
2、平均數(shù)有多快。變異係數(shù):獲得相對的變異情形。變異係數(shù)標(biāo)準(zhǔn)差平均數(shù)8某次統(tǒng)計學(xué)考試,甲班平均分?jǐn)?shù)為80分,標(biāo)準(zhǔn)差為20,乙班平均分?jǐn)?shù)為75分,標(biāo)準(zhǔn)差為5,哪一班成績較優(yōu)?甲班乙班9資料衡量尺度量化的處理工具便稱為衡量的尺度,又稱量表(Scale)。問卷衡量尺度的設(shè)計是評估報告是否深入的關(guān)鍵。不同的量表應(yīng)用不同的統(tǒng)計分析,準(zhǔn)確性才會提高。考量的依據(jù):1.研究目的與問題深入的程度2.事後資料整理時之便利性3.各種可能選項的周延性與互斥性需兼顧4.統(tǒng)計的方法10一、名目尺度(nominal scale)此種量表是根據(jù)被調(diào)查對象的性質(zhì)而分類,如根據(jù)消費者答案可分為喜歡與不喜歡或是與否兩類。每類答案的數(shù)字
3、只作為分類之用,如果將這些答案數(shù)字(1,2,3)做運算,根本沒有意義,因為這些數(shù)字在此僅屬名義而已,真正目的是在分類。 二、順序尺度(ordinal scale)較類別量表多一特性,可以表示各類別之間的順序關(guān)係。如要求消費者根據(jù)其心中偏好,將五種飲料品牌依最喜歡到最不喜歡的順序排列,最喜歡給5分、最不喜歡給1分,這就是一種順序量表。不過代表順序的數(shù)字還是不能用來做運算,只能看出高低次序,卻無法確定順序之間的差異大小,例如若已知ABCDE,但並不知道A與B的差距,或C與D的差距,所以也無法得知兩種差距是否相等。11三、差距尺度(interval scale)較順序量表再推進一步,不單能表示順序關(guān)
4、係,尚能測量各順序之間的距離,可確定地指出5分與4分之差距等於4分與3分的差距。差距量表的分?jǐn)?shù)可用來做加減乘除的運算,此為其之一大優(yōu)點,但是不能說明6分為3分的兩倍,因為差距量表並沒有一個真正零點(真零)。四、比率尺度(ratio scale)比率量表除了具有差距量表的全部特色外,再加上真零這個特性。例如身高、年齡、體重等變數(shù)的測量都是用比率量表,故可說體重180磅的人比90磅的人重兩倍。不過在態(tài)度測量方面,運用比率量表顯然有困難,消費者給一種飲料100分,另一種給50分,但卻不表示喜歡程度有兩倍的差距。因為態(tài)度測量本質(zhì)上為一順序概念,顯然不宜用比率或差距量表測量。12適用於各類量表的統(tǒng)計分析
5、方法列如下表:13資料處理與展示統(tǒng)計圖表 定性資料次數(shù)分配表相對次數(shù)分配長條圖圓餅圖14資料處理與展示統(tǒng)計圖表 計量資料次數(shù)分配表相對次數(shù)分配表累加次數(shù)分配表累加相對次數(shù)分配表直方圖次數(shù)多邊圖枝葉圖散佈圖15次數(shù)分配表16交叉分析表17交叉分析表18圓餅圖19圓餅圖第一次購屋貸款:3人勞工貸款:2人公教補助貸款:4人自有住屋貸款中優(yōu)惠利率20圓餅圖知道的民眾主要特徵(14.7%)支持國民黨5059歲職業(yè)為軍公教或自營商男性不知道的民眾主要特徵(85.2%)年齡為2029歲職業(yè)為學(xué)生或家庭主婦女性21折線圖22直方圖23直方圖24直方圖25盒形圖26全班35位同學(xué)統(tǒng)計學(xué)考試分?jǐn)?shù)86,77,91,
6、60,35,76,92,47,88,67,23,59,72,75,83,77,68,8297,89,81,75,74,39,67,79,83,70,78,91,68,49,56,94,81 枝葉圖27根據(jù)統(tǒng)計顯示,多數(shù)車禍發(fā)生在車子行駛於一般車速的時候,只有少數(shù)車禍發(fā)生在車速超過時速150公里。開快車較安全。研究顯示,有個城市死於心臟病的人數(shù)與口香糖的消費量同時遽增。嚼口香糖導(dǎo)致心臟病。多數(shù)人都以一般車速開車,自然多數(shù)車禍發(fā)生於一般車速。這兩類數(shù)字的增加是因為人口快速成長的結(jié)果。28現(xiàn)在我要寄一封文件給一位我不認(rèn)識的人,我先寄給最有可能認(rèn)識目標(biāo)者的人,再請他轉(zhuǎn)寄,如此轉(zhuǎn)寄到目標(biāo)者手中,請問中間
7、經(jīng)過人數(shù)?現(xiàn)場有兩人是同月同日生的機率為?平均為5人23人機率略高於1/2,40人機率達(dá)到90以上。29解讀民意調(diào)查A候選人支持度31.2B候選人支持度28.5C候選人支持度24.9成功訪問1,068位受訪者,在95的信心水準(zhǔn)下,抽樣誤差為正負(fù)3。30分配(Distribution)包括了對位置 (location)、散佈 (spread) 及形狀 (shape) 的描述。在描述 (呈現(xiàn)) 變數(shù)的分配形狀時,應(yīng)了解:(1) 分配的形狀和分配的位置、散佈一樣重要(2) 在了解分配的形狀時,以視覺化的方式來呈現(xiàn)比以數(shù)字來 呈現(xiàn)更令人一目了然(3) 變數(shù)的分配形式?jīng)Q定了用哪一種統(tǒng)計技術(shù)來描述比較適當(dāng)
8、。31位置的衡量(measures of location) 平均數(shù)(Mean):平均數(shù)指的是算術(shù)平均數(shù),也就是在分配中各觀察值的和除以觀察數(shù)。中位數(shù)(Median):中位數(shù)是分配的中央點。在分配中有一半的觀察點低於,有一半的觀察點高於中位數(shù)。如果在分配中觀察點的數(shù)目是偶數(shù),則中位數(shù)是兩個中間數(shù)的平均數(shù)。眾數(shù)(Mode):眾數(shù)是出現(xiàn)次數(shù)最多的那個數(shù)字。32散佈的衡量(measures of spread) 變異數(shù)(Variance):變異數(shù)是衡量以平均數(shù)為基準(zhǔn)的分配情況。如果所有的分?jǐn)?shù)都相等,則變異數(shù)為零。分?jǐn)?shù)分散的情形愈大,則變異數(shù)愈大。標(biāo)準(zhǔn)差(Standard deviation):標(biāo)準(zhǔn)差
9、是變異數(shù)的平方根,它免除了變異數(shù)的平方,因而增加了解釋力。全距(Range):全距是分配中最大與最小的分?jǐn)?shù)之差,全距只涉及到最大與最小的分?jǐn)?shù),因此在衡量散佈方面是相當(dāng)粗糙的。33散佈的衡量(measures of spread)四分位距(interquartile range, IQR):是分配中第一、第三分位之差。它也稱為中點分配 (midspread)。第1分位Q1是第25% 的那個數(shù)字;中位數(shù)或Q2是第50% 的那個數(shù)字;第3分位Q3是第75% 的那個數(shù)字。 IQR=Q3-Q1四分位差(quartile deviation):四分位差或稱半四分位距 (semi-interquartile
10、 range) 是Q3與Q1間距離的一半。34形狀的衡量(measures of shape) 偏度(skewness):是描述一個分配偏離對稱性的情形,在對稱性的分配中,平均數(shù)、中位數(shù)、眾數(shù)都是在同樣的位置。偏態(tài)分為左偏態(tài) (或負(fù)偏態(tài)) 與右偏態(tài) (或正偏態(tài)) 二種。峰度(kurtosis):是描述一個分配的平坦或陡直情況。峰度共有三種:常態(tài)峰 (mesokurtic)、高狹峰 (leptokurtic) 及低闊峰 (platykurtic)。 35機率論(Probability Theory)機率:衡量某一事件可能發(fā)生的程度(機會),並針對此一事件發(fā)生之可能性賦予一量化的數(shù)值。及用來衡量不
11、確定性大小的工具。機率論隨機實驗機率理論事件機率性質(zhì)與運算法則貝氏定理36隨機實驗(Random Experiment)隨機實驗(Random Experiment):觀察一可產(chǎn)生各種可能結(jié)果(Outcome)的過程,稱為實驗;而若各種可能結(jié)果的出現(xiàn)(或發(fā)生)具有不確定性,則此一過程便稱為隨機實驗。必須滿足:1.實驗可以在相同條件下重複進行。2.所有結(jié)果是明確可知的,且不只一個。3.實驗後的結(jié)果為所有可能結(jié)果之一,但實驗前無法肯定會出現(xiàn)何種結(jié)果。37檢驗三件產(chǎn)品之樣本空間樹狀圖樣本點(sample point):每個可能的結(jié)果樣本空間(sample space):各種可能結(jié)果的集合事件(eve
12、nt):樣本空間的部分集合簡單事件(simple event):只包含一個樣本點複合事件(composite event):包含二個或以上的樣本點38各式樣本空間39機率測度的方法古典方法:P(E)=n(E)/n(S)限制條件:樣本空間必須是有限的樣本空間?;炯僭O(shè):樣本空間內(nèi)每一樣本點出現(xiàn)的機會皆相同??陀^方法(相對次數(shù)法):P(E)=lim(n/N) , N 重複進行此一實驗許多次,並觀察該事件出現(xiàn)次數(shù)的比例。主觀方法:P(E)=(個人對事件E發(fā)生的信心)40機率的公理1.2. 為互斥3. P(S)=1;P()=041事件機率聯(lián)合機率(joint probability)兩個或兩個以上事件
13、同時發(fā)生的機率。邊際機率(marginal probability)在兩個或兩個以上類別的樣本空間中,若僅考慮一類別個別發(fā)生的機率稱之。條件機率(conditional probability)已知B事件發(fā)生下,另一事件A發(fā)生的機率,稱為在B發(fā)生條件下,A的條件機率。42應(yīng)徵者的資料43事件的性質(zhì)獨立事件(Independent Event)係指一事件的發(fā)生不影響其他事件的發(fā)生,若A、B兩事件互為獨立,則:相依事件(Dependent Event)係指一事件的發(fā)生影響其他事件發(fā)生的機率。44互斥事件(Mutually Exclusive Event)事件沒有共同的樣本點稱之,即當(dāng)兩事件之交集為
14、空集合時。sssAAABBB45事件的運算法則餘集合的機率加法定理乘法定理分割定理ASB46貝氏定理(Bayes Theorem)事前機率取得新資訊事後機率(條件機率的形式)應(yīng)用貝氏定理事後機率事前機率條件機率47某公司計畫推出新產(chǎn)品,並認(rèn)為經(jīng)濟景氣好壞會影響新產(chǎn)品的銷售,公司行銷經(jīng)理主觀判斷景氣好、普通、不好的機率各為0.5、0.2、0.3。今公司委託專業(yè)市調(diào)公司進行市場景氣調(diào)查,但該市調(diào)公司之調(diào)查並非百分之百正確,根據(jù)過去經(jīng)驗,其正確率為0.9,不正確的誤認(rèn)為其他兩種是其他兩種狀況的機率各為0.05。若該市調(diào)公司調(diào)查結(jié)果為景氣好,而市場景氣真正為好的機率為多少?事前機率取得新資訊事後機率主
15、觀判斷景氣好、普通、不好的機率市調(diào)公司調(diào)查結(jié)果修正機率48機率分配49隨機變數(shù)(Random Variable)係以樣本空間為定義域的實數(shù)值函數(shù),也就是隨機實驗中對應(yīng)樣本點的實數(shù)值函數(shù)。X:擲一枚銅板二次,出現(xiàn)正面的次數(shù)正正正反反正反反2101/42/41/4樣本空間S隨機變數(shù)X機率f(x)50期望值(Expected Value)與變異數(shù)間斷機率分配:期望值:變異數(shù):連續(xù)機率分配:期望值:變異數(shù):51離散型機率分配二項分配(Binomial Distribution)幾何分配(Geometric Distribution)超幾何分配(Hypergeometric Distribution)波
16、瓦松分配 ( Possion Distribution)52二項分配(Binomial Distribution)伯努利試驗(Bernoulli Trial)每一次試驗皆僅有兩種可能結(jié)果,不是成功(S),就是失敗(F)。成功機率固定為為P(S)=p,失敗機率固定為為P(F)=1-p。每一次試驗之間互為獨立。進行n次的伯努利試驗,稱為二項實驗,若隨機變數(shù)X為n次試行實驗成功的次數(shù),X的機率分配稱為二項機率分配。53二項機率分配函數(shù):00.050.10.150.20.250.30.35123456n=5, p=0.5P(X=x)00.10.20.30.40.50.60.7123456n=5, p=
17、0.3P(X=x)00.10.20.30.40.50.60.7123456n=5, p=0.9P(X=x)54超幾何分配(Hypergeometric Distribution)超幾何實驗:從一含有N物的有限母體中,採不放回抽樣,抽取n個隨機樣本。N物中有S個屬成功類,另N-S個屬失敗類。隨機變數(shù)X為n個中,成功的次數(shù), X的機率分配稱為超幾何機率分配。S成功類S個失敗類N-S個x n-x55超幾何機率分配函數(shù):56幾何分配(Geometric Distribution)二項分配為進行n次的伯努利試驗的成功次數(shù)分配,如果未預(yù)先固定試驗的次數(shù),而在第一次成功發(fā)生之後才停止整個伯努利試驗,成功的次
18、數(shù)固定為1,所需試驗的次數(shù)則為一隨機變數(shù),此隨機變數(shù)的機率分配即稱為幾何分配。幾何機率分配函數(shù):57波瓦松分配 ( Possion Distribution)在一特定區(qū)間(或區(qū)域)內(nèi),觀察某特定事件發(fā)生的次數(shù)。上午10點至11點中,每10分鐘打進公司的電話通數(shù)。1天內(nèi)停車場停車數(shù)。高速公路每10公里路面有窪動的數(shù)目。秘書小姐每打一頁報告出現(xiàn)錯誤的字?jǐn)?shù)。波瓦松實驗:在一連續(xù)區(qū)間發(fā)生事件的次數(shù),與另一區(qū)間發(fā)生的次數(shù)是獨立的。在一連續(xù)區(qū)間內(nèi)發(fā)生事件的的期望值(平均數(shù))與區(qū)間大小成比例。在一極短的區(qū)間內(nèi),僅有兩種狀況,即發(fā)生一次或不發(fā)生,而發(fā)生兩次或以上的情形不予考慮。若一事件滿足上述三個特質(zhì),隨機變
19、數(shù)X定義為連續(xù)區(qū)間內(nèi)發(fā)生事件的次數(shù),則X為一波瓦松隨機變數(shù),其機率分配為波瓦松分配。58波瓦松分配函數(shù):式中 表示在某特定區(qū)間內(nèi)某事件所發(fā)生平均次數(shù),而e=2.71828。某公司訂有消費者7天內(nèi)不滿意免費退貨服務(wù),根據(jù)過去記錄,每7天平均2件被要求退貨,問在14天內(nèi)會被退5件的機率?59二項、超幾何與波瓦松分配之間關(guān)係超幾何分配二項分配波瓦松分配當(dāng)n/N20且np=7時,可用波瓦松分配取代二項分配60連續(xù)型機率分配均等分配(Uniform Distribution)常態(tài)分配(Normal Distribution)指數(shù)分配(Exponential Distribution)61均等分配(Uni
20、form Distribution)隨機變數(shù)在某區(qū)間(a,b)內(nèi)發(fā)生機率皆相同時,其機率分配稱之。機率密度函數(shù): abf(x)62某班火車抵達(dá)車站的時間在8點至8點10分之間,且在此時段中任何時點到站的可能性均相同。1.某乘客在8點3分抵達(dá)車站,可搭上火車的機率?2.某乘客在8點8分抵達(dá)車站,火車已開走的機率?3.計算期望值與變異數(shù),並解釋期望值的意義。X表示火車在8點以後到站的時間,63常態(tài)分配(Normal Distribution)又稱高斯分配(Gauss Distribution)。重要性:1.許多自然現(xiàn)象,工業(yè)生產(chǎn)、商業(yè)問題及社會現(xiàn)象均可用常態(tài)分配加以描述。2.許多統(tǒng)計量的的抽樣分配
21、在大樣本下呈常態(tài)分配。3.常態(tài)分配可進行許多統(tǒng)計推論,許多統(tǒng)計量的的抽樣分配如t分配、卡方分配、F分配都必須假設(shè)母體為常態(tài)分配才可獲得。4.間斷機率分配在某些條件下可利用常態(tài)分配求其近似值。64機率密度函數(shù):65常態(tài)分配特性:1.以平均數(shù) 為中心的對稱曲線。2.平均樹、眾數(shù)、中位數(shù)均相等( )。3.以 為中心,兩邊加減一個標(biāo)準(zhǔn)差之處,為常態(tài)曲線的反曲點(Inflection Point)。4.常態(tài)曲線左右兩尾與橫軸逐漸接近,但絕不會相交。5.以 為中心,兩邊加減一個標(biāo)準(zhǔn)差的區(qū)間,其機率(面積)為0.683,加減二個標(biāo)準(zhǔn)差的區(qū)間,其機率(面積)為0.954,加減三個標(biāo)準(zhǔn)差,其機率(面積)為0.9
22、97。66標(biāo)準(zhǔn)常態(tài)分配(Standard Normal Distribution):即平均數(shù)為0,標(biāo)準(zhǔn)差為1的常態(tài)分配。機率密度函數(shù): 標(biāo)準(zhǔn)化(Normalized):67某品牌家電用品的使用壽命為平均數(shù)4.5年,標(biāo)準(zhǔn)差為1年的常態(tài)分配。若其保證期間為二年,推算其退貨的比例。X表示該品牌家電用品使用壽命,某公司生產(chǎn)高級辦公桌,其裝配時間為常態(tài)分配,平均數(shù)56分鐘,標(biāo)準(zhǔn)差4分鐘?,F(xiàn)有一客戶要求於1個鐘頭後準(zhǔn)時到達(dá)公司提貨,如從現(xiàn)在開始裝配準(zhǔn)時完成交貨的機率為?X表示裝配一張桌子所需時間,68指數(shù)分配(Exponential Distribution)與波瓦松分配相反,指數(shù)隨機變數(shù)在說明接連兩件事
23、發(fā)生的間隔期間。69機率密度函數(shù):1.指數(shù)分配曲線為非對稱性,範(fàn)圍為(0, )。2.平均數(shù) 必大於0。x70某一型彩色電視機其壽命時間成指數(shù)分配,且平均壽命為10年。求該電視機的壽命時間之下列機率:1.壽命長達(dá)15年以上。2.兩年內(nèi)即發(fā)生故障而報廢。3.壽命時間介於2年至15年。X表示該電視機之壽命時間,71標(biāo)準(zhǔn)常態(tài)分配值zP(Zz)72指數(shù)分配值x73抽樣(Sampling) 估計誤差(Error of Estimation)抽樣誤差(Sampling Error)非抽樣誤差(Nonsampling Error)樣本統(tǒng)計量母體參數(shù)估計誤差抽樣誤差非抽樣誤差1.樣本數(shù)2.推論方法3.抽樣方法資
24、料整理時的疏失74抽樣方法非機率抽樣立意抽樣法便利抽樣法滾雪球抽樣法配額抽樣 機率抽樣簡單隨機抽樣分層抽樣集群抽樣系統(tǒng)抽樣 抽樣方法非機率抽樣法機率抽樣法75非機率抽樣法非機率抽樣:亦即樣本不按照其機率予以抽出,而是由抽樣者之主觀抽出或自願樣本。優(yōu)點:在某些調(diào)查時,有其必要性。缺點:(1)難以評斷樣本之代表性。 (2)無法估計精確度。 (3)樣本偏差往往較大。非機率抽樣之種類:1.立意樣本(Judged Sampling):調(diào)查研究人員根據(jù)自己的專長、知識、研究目的來選取代表性的樣本。如學(xué)者、專家或代表性之樣本。2.便利樣本(Convenient Sampling):事先不預(yù)定樣本,碰到即問或
25、自動回答者。如街頭訪問或主動打電話回答問題者。缺點:注意樣本之偏激性及兩極化。3.滾式樣本(輻射樣本):利用樣本尋找樣本,亦即利用樣本之滾雪球方式或輻射力抽取樣本。如都市中之原住民抽樣。使用時機:可用於當(dāng)樣本不易取得時,或針對特殊族群之調(diào)查。4.配額樣本:按母體某些特性予以配置樣本,但取樣時卻由調(diào)查員任意抽取。76機率抽樣機率抽樣:抽取之樣本是按照樣本之機率隨機抽出。優(yōu)點:1.樣本較具代表性。2.可計算估計之精確度。3.可隨不同之抽樣設(shè)計採取不同之抽樣方法。4.隨之不同之抽樣方法,採取相互配合之估計方法。機率抽樣之種類:1.簡單隨機抽樣:不對母體加以任何修飾或分割,而使每一樣本均有相同之被抽中
26、機率。2.分層隨機抽樣:將母體按照某些特性,分成數(shù)個不重疊的組群,這些組群即稱為層,而再由各層分別抽取樣本。3.系統(tǒng)抽樣:將母體之元素按順序編號後,有系統(tǒng)的每隔一定間隔抽取一個樣本之方法。4.集群抽樣:將母體中相鄰近之個體排成為一集體,而以集體為抽樣單位,即每一抽樣單位為一集體之抽樣單位。5.兩段集群抽樣:首先抽出一些樣本集體,再由樣本集體內(nèi)抽出部分基本個體。6.分層集群抽樣:將母體內(nèi)之集體予以分層後,再由各層抽取樣本。77簡單隨機抽樣法(simple random sampling)簡單隨機抽樣是一種最基礎(chǔ)且最簡便的抽樣方法。優(yōu)點是(i)當(dāng)母體底冊完整時,直接由母體中抽出樣本,方法簡單;和(
27、ii)每一單位被抽中的機率均相等,參數(shù)的估計較簡單。限制是(i)母體底冊不易取得,或取得很費時,費力且費錢;(ii)母體內(nèi)樣本單位太多時,作業(yè)不方便;(iii)樣本分配較分散,行政作業(yè)較不易;和(iv)樣本代表性恐有不足(尤其當(dāng)樣本點差異大時或重要性不同時)。使用最佳時機,便是當(dāng)(i)母體內(nèi)樣本單位不多,且有完備名冊,可茲編號時;(ii)母體內(nèi)樣本單位間的差異不大時(對研究的目的而言);和(iii)對母體資訊無法充份獲得時。簡單隨機抽樣法的準(zhǔn)確度會受下列二因素的影響,即(i)母體本身的變異,和(ii)樣本的大小。78分層抽樣法(stratified sampling)優(yōu)點是(i)可增加樣本代表
28、性;(ii)可提高估計的確度;(iii)可分別獲得各層的訊息,並做各層間的比較分析;(iv)可在各層設(shè)立行政單位,以便於執(zhí)行;和(v)可視各層情形,採取不同的抽樣方法。限制是(i)分層變數(shù)的選取(要與所欲估計的特徵值具有高度相關(guān));(ii)層數(shù)的釐定(要適當(dāng)並配合母體的分配狀況);(iii)分層標(biāo)準(zhǔn)的決定(各層不能有重疊現(xiàn)象);(iv)各層樣本的配置方法;和(v)分層後,樣本資料的整理及估計較複雜。使用最佳時機,便是當(dāng)(i)母體內(nèi)樣本單位的差異較大時;和(ii)分層後能達(dá)到層間差異大,層內(nèi)差異小的原則。原則上要使層內(nèi)變異小,而層間變異大;各層不能有重疊現(xiàn)象。 第一層第二層第K層:樣本79系統(tǒng)抽
29、樣法(systematic sampling) 優(yōu)點是(i)在抽取樣本的過程中,很容易完成抽樣工作;(ii)通常可使樣本普遍的散佈於母體內(nèi),使樣本更具代表性;和(iii)在某些條件下,系統(tǒng)抽樣可取代簡單隨機抽樣。限制是(i)對母體狀況宜略有所瞭解;(ii)避免系統(tǒng)樣本內(nèi)的樣本單位趨於一致;(iii)不易計算估計量的變異數(shù),和(iv)避免母體內(nèi)樣本單位特徵值的週期性變動。使用最好是當(dāng)(i)母體內(nèi)的樣本單位,按有興趣的特徵值而言是隨機的或按大小排列的;(ii)母體內(nèi)單位數(shù)過多,而抽取的樣本又較多時;和(iii)母體內(nèi)的單位數(shù)不能確定時。1 2 3 4 5 6 7 8 9 10 11 12 13 1
30、4 15 16 17 18 s (s+1) (s+2) N61218樣本母體K=N/n80群集抽樣法(cluster sampling)有時母體底冊的蒐集及編造極為困難或龐大,而在調(diào)查時又希望節(jié)省成本時,則可採用群集抽樣法。舉例來說,在森林區(qū)的材積調(diào)查中,將調(diào)查區(qū)劃分多個小塊以為群集。又如在住戶調(diào)查中,以鄰或區(qū)段作為群集以進行訪查。優(yōu)點是(i)母體底冊的編造較為簡單;(ii)調(diào)查行動半徑較小,調(diào)查成本較低;(iii)行政管理較為容易;和(iv)通信調(diào)查時較易宣傳及進行。限制是(i)群集內(nèi)樣本單位的一致性太強,則易浪費樣本;和(ii)群集大小的決定。使用最好時機是當(dāng)(i)母體底冊不易獲得時;(i
31、i)為簡省調(diào)查成本時;及(iii)群集內(nèi)差異大,而群集間的變異小。採用群集抽樣法進行樣本調(diào)查時,要注意到以下兩個原則。亦即,(i)根據(jù)經(jīng)驗、試查及實際狀況以決定適當(dāng)?shù)娜杭?;?ii)確定群集間變異小,而群集內(nèi)變異大。81抽樣分配母體參數(shù)(Parameter)描述母體資料特性的統(tǒng)計測量數(shù),為未知但固定的數(shù)。樣本統(tǒng)計量(Statistics)為一組隨機樣本的實數(shù)值函數(shù)。抽樣分配(Sampling Distribution)樣本統(tǒng)計量為一隨機變數(shù),其機率分配稱為抽樣分配。82樣本平均數(shù)的抽樣分配自一大小為N的母體抽出一組隨機樣本, 則樣本平均數(shù) 本身亦為隨機變數(shù), 有其機率分配。抽自無限母體:抽自有限母體:83母體常態(tài)分配非常態(tài)分配大樣本(n 30)小樣本(n 30)大樣本(n 30)小樣本(n中央極限定理=母體 已知=母體 未知=常態(tài)分配性質(zhì)t分配性質(zhì)常態(tài)分配性質(zhì)常態(tài)分配性質(zhì)視母體分配而定抽樣分配的型態(tài)84統(tǒng)計估計利用樣本統(tǒng)計量去推估母體參數(shù)的方法。點估計(Point Estimation)根據(jù)樣本資料求得一估計值,以推估未知的母體參數(shù)。評估估計量的好壞:不偏性(unbiasde)、有效性(efficiency)區(qū)間估計(Interval Estimation)根據(jù)樣本資料求得之點估計值,藉由點估計值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度辦公用品銷售折扣及定制服務(wù)合同
- 二零二五年度燃料研發(fā)與專利許可合同
- 二零二五年度股權(quán)代持合同:包含企業(yè)資產(chǎn)重組的綜合性協(xié)議
- 2025年度環(huán)保設(shè)施勞務(wù)分包安全責(zé)任協(xié)議
- 二零二五年度頂管施工安全教育與應(yīng)急預(yù)案制定合同
- 二零二五年度合資企業(yè)股份代持與清算協(xié)議
- 二零二五年度特色餐飲服務(wù)人員勞動合同范本
- 二零二五年度地質(zhì)鉆孔施工環(huán)境保護協(xié)議
- 二零二五年度集體勞動合同在民營企業(yè)中的創(chuàng)新
- 二零二五年度企業(yè)產(chǎn)品售后服務(wù)宣傳片委托協(xié)議
- 借哪吒精神燃開學(xué)斗志 開學(xué)主題班會課件
- 2025年初中主題班會課件:好習(xí)慣成就好人生
- 學(xué)校教職工代表大會全套會議會務(wù)資料匯編
- 中華人民共和國監(jiān)察法宣貫培訓(xùn)
- 2025年山東傳媒職業(yè)學(xué)院高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- 2025年春新教科版物理八年級下冊課件 第10章 流體的力現(xiàn)象 1 在流體中運動
- 2025年新人教PEP版英語三年級下冊全冊課時練習(xí)
- 《愛耳日課件》課件
- 《中醫(yī)基礎(chǔ)理論》課件-中醫(yī)學(xué)理論體系的基本特點-整體觀念
- 全國職業(yè)院校技能大賽高職組(商務(wù)數(shù)據(jù)分析賽項)備賽試題及答案
- GB/T 45107-2024表土剝離及其再利用技術(shù)要求
評論
0/150
提交評論