版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第二章,定量數(shù)據(jù)的統(tǒng)計描述,第一節(jié),頻率和頻率分布,頻率分布表,又稱頻率表,是統(tǒng)計描述大樣本數(shù)據(jù)的常用方法。頻率表可以顯示數(shù)據(jù)分布的范圍和形式。在某一地點隨機抽樣檢查了140名成年男子的紅細(xì)胞計數(shù)。1.連續(xù)定量變量的頻率分布,頻率表的編制:求范圍:rmax-min=5.95-3.82=2.13,確定組數(shù),組與組之間的距離1。確定組數(shù)(k):通常為11 2。確定組距離(I):兩個相鄰組的最小值(下限)之間的差值,通常等距。I=R /k,通常是一個偶數(shù)。3.確定分組界限:界限清楚,每個分組的起點稱為下限,終點稱為上限。最后一行應(yīng)該寫下下限和上限。4.列表標(biāo)記:獲取每組觀察單元的數(shù)量。在某處140名
2、正常男性中使用紅細(xì)胞數(shù)頻率表、直方圖和頻率表可以代替繁瑣的原始數(shù)據(jù),便于進(jìn)一步分析;便于觀察數(shù)據(jù)的分布類型;方便在遠(yuǎn)離群體的地方發(fā)現(xiàn)一些超大或超小的可疑值;當(dāng)樣本量較大時,每個片段的頻率可以作為概率的估計值。頻率分布的類型是對稱的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的、歪斜的。表2-1 1998年某地區(qū)96名婦女產(chǎn)前檢查頻率分布(頻率)累計數(shù)累計頻率0 44.24 4.21 7.3 11.5 2 11 11.5 22 22.9 3 13 13.5 3
3、5 36.5 426 27.1 61 63.5 523 24.0 84 87.5 12 12.5 96 100.0合計96 100、第2節(jié)集中趨勢指標(biāo)常用的平均值有算術(shù)平均值、幾何平均值和中位數(shù)。1,算術(shù)平均值(mean),算術(shù)平均值是指平均值或平均值。x代表變量x的樣本平均值,(希臘字母)代表總平均值。均值適用于對稱分布數(shù)據(jù)、正態(tài)分布數(shù)據(jù)或近似正態(tài)分布數(shù)據(jù)。計算方法直接法這種方法可以在樣品含量很小時使用。有n個觀測值,分別是X1、X2和Xn。平均值的計算公式是:例1。12歲男孩的身高(厘米)分別為125.5、126.0、127.0、128.5、147.0、131.0、132.0、141.5.
4、122.5、140.0。求平均值。加權(quán)法:當(dāng)樣本含量n較大時,一般將觀測值分組,列出頻率表,然后用加權(quán)法計算平均值。公式為:其中f為各組的頻率,x為各組的組中值。1.編制頻率表(1)計算總距離:R183.5162.920.6(cm) (2)計算群段和群距離:20.6 102.06,取整數(shù)2.0cm作為群距離;第一組的下限是162 (3)。列出頻率表:表7-1的第三列是組中值X,計算方法是將該組的下限和下一組的下限相加,除以2,如第一組X1=(162 164)/2=163,等等。第四列fX是頻率f與組中值x的乘積。根據(jù)公式,110名20歲健康男大學(xué)生的平均身高為172.73厘米。第二,幾何平均數(shù)
5、(g),用g表示.適用于對數(shù)正態(tài)分布數(shù)據(jù)或等比數(shù)據(jù),如抗體的平均滴度和平均滴度。計算方法:直接法:當(dāng)樣本含量n較小時,選擇該方法。有n個觀測值X1,X2,Xn,幾何平均值的計算公式為:以上公式需要連續(xù)相乘,需要開n次方,比較麻煩,所以一般以對數(shù)形式計算。6份血清樣本的抗體滴度分別為:1:2、1:4、1:8、1:8、1:16、13:32。幾何平均滴度為1:8,血清抗體平均滴度為0計算方法直接法:當(dāng)樣本含量n較小時,可按以下公式計算:當(dāng)n為奇數(shù)或偶數(shù)時,某一疾病5例患者的潛伏期分別為2、4、6、7和20,并得出中位數(shù)。在這種情況下,n=5是奇數(shù)天。如果在前一個病例中在第25天發(fā)現(xiàn)另一個患者,患者人
6、數(shù)將增加到6人。頻率表法:當(dāng)樣本含量n較大時,可以計算出中位數(shù)。將觀測數(shù)據(jù)匯總到頻率表中,計算累計頻率,并根據(jù)以下公式計算。l是這個組(中間組)的下限,I是組距離,F(xiàn)是這個組的頻率,f1是最后一個組的累積頻率。這個組的位置可以根據(jù)累計頻率值來判斷。當(dāng)某一組的累計頻率首次超過n/2或累計頻率首次超過50%時,定義為該組。107名正常人尿鉛含量分布,以百分位數(shù)(PX)表示,PX是一個位置指數(shù),用PX表示??偟膩碚f,這意味著在整個人口中其值小于PX的個體只有x;對于樣本,這意味著在按升序排列的序列中,小于PX的個體只占據(jù)x百分位,這是有序序列的除數(shù)值。第50百分位(P50)是中間值,中間值是特定的百
7、分位。計算公式:對上例數(shù)據(jù)計算P25和P75。如果計算P25,從第4列可以看出,組2的累積頻率超過25,這是P25所在的組。找到P75,同樣,P75在第四組,而在第三組,離散趨勢指標(biāo),兩組的測量數(shù)據(jù)如下,并分析其分布特征。甲組:98,99,100,101,102乙組:80,90,100,110,120。兩組的平均數(shù)據(jù)為100,表明濃度趨勢是相同的。然而,兩組數(shù)據(jù)的分布特征不同,五組數(shù)據(jù)之間的不均勻程度也不同。A組數(shù)據(jù)的變異范圍較小,而B組數(shù)據(jù)的變異范圍較大,即兩組數(shù)據(jù)的離散度不同,離散度是一個非常重要的統(tǒng)計指標(biāo)。1.范圍(R),也稱為極端范圍,是一組觀測值中最大值和最小值之間的差值,反映了個體
8、差異的范圍??偩嚯x大表示可變性大;相反,變化很小。在上例中,A組的總距離為4,B組的總距離為40,表明B組的變化程度較大。然而,總距離不能反映該組中除最大值和最小值之外的其他數(shù)據(jù)的可變性;它易受單個數(shù)據(jù)的影響,穩(wěn)定性差,采樣誤差大,還受N的大小影響。平均來說,N越大,總距離越大。四分位數(shù)范圍(Q)是兩個特定百分位數(shù)之間的差值,適用于測量任何分布的數(shù)據(jù),尤其是偏斜分布的數(shù)據(jù)(離差不應(yīng)用標(biāo)準(zhǔn)差表示)。四分位數(shù)范圍比整個范圍更穩(wěn)定,但仍未考慮每個觀測值的變化。方差和標(biāo)準(zhǔn)差,為了克服全距離的缺點,應(yīng)充分考慮組內(nèi)各觀測值的離散性??梢哉J(rèn)為,總體中每個變量值X與總體平均值之間的差異稱為偏離平均值X。由于平
9、均值有正負(fù)偏差,且其和為0,因此仍不能反映變異程度。因此,與平均值的偏差被平方,然后相加,這被稱為與平均值平方和的偏差。為了消除觀測值總數(shù)n的影響,與平均平方和的偏差除以n,即總體方差,用2表示。方差單位是原始測量單位(如kg)的平方,總體方差是平方,即總體標(biāo)準(zhǔn)差。測量單位與原始觀測值一致,即方差和標(biāo)準(zhǔn)差。在實際工作中,經(jīng)常會得到樣本數(shù)據(jù),而總體均值是未知的,因此只能使用樣本均值X來代替。這樣,使用樣本含量n而不是n,結(jié)果比率更小。英國統(tǒng)計學(xué)家W.S .戈塞特提出用n-1代替N,樣本的標(biāo)準(zhǔn)差更接近于總體標(biāo)準(zhǔn)差。年代給定f110和fX19000,有必要將fx2列添加到表中,將其乘以列(3)和(4
10、),將該列中的數(shù)據(jù)相加,并將fX23283646代入公式。4.變異系數(shù)。應(yīng)用: (1)比較具有不同測量單位的多組數(shù)據(jù)的可變性(2)計算平均值差異較大的多組數(shù)據(jù)的可變性:例如,某個地方的100名20歲男性,其平均身高為166.06厘米,標(biāo)準(zhǔn)偏差為4.95厘米,其平均體重為53.72千克,標(biāo)準(zhǔn)偏差為4.96千克。請比較哪一個具有更大的可變性。由于它們的測量單位不同,標(biāo)準(zhǔn)偏差不能直接比較,但變異系數(shù)應(yīng)該比較。身高、體重、使用離散指標(biāo)的注意事項:1離散指標(biāo)代表變量值的變化,常與集中指標(biāo)(如均值)相結(jié)合。雖然離散指標(biāo)的種類很多,但一般來說,它們的大值意味著大的變化和分散的值;小的值意味著變化小并且值集中
11、。為了比較兩個或幾個相似事物的變異,我們應(yīng)該使用相同的變異指數(shù)。3正態(tài)分布數(shù)據(jù)應(yīng)以平均值和標(biāo)準(zhǔn)偏差(有時是方差)為特征,并記錄為XS。有時,為了便于計算,正態(tài)分布數(shù)據(jù)也可以用中位數(shù)、百分位數(shù)和四分位數(shù)來描述,其結(jié)果與均值和標(biāo)準(zhǔn)差相似。使用離散指標(biāo)時的注意事項:4 .偏斜分布數(shù)據(jù)應(yīng)該用幾何平均值、中位數(shù)和四分位間距來描述。特別是當(dāng)數(shù)據(jù)分布明顯偏斜時,隨著病例數(shù)的增加,中位數(shù)和四分位數(shù)間距的代表性和穩(wěn)定性明顯優(yōu)于均值、標(biāo)準(zhǔn)差和方差。5.比較幾組數(shù)據(jù)的變異程度,如果每組數(shù)據(jù)的單位不完全相同,或者平均值相差很大,則使用變異系數(shù)。6要判斷幾個方差或變異系數(shù)之間是否存在顯著差異,需要進(jìn)行假設(shè)檢驗,而不僅僅是表面值。方框圖,一般選擇五個描述性統(tǒng)計(最小值,P25,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 骨干教師讀書筆記和心得7篇
- 閩教版信息技術(shù)三年級下冊《第二單元 我是計算機小畫家 7 多種形狀展創(chuàng)意》教學(xué)實錄
- 一周個人的工作總結(jié)有感10篇
- 七年級體育 體育與健康教育第12課教學(xué)實錄 人教新課標(biāo)版
- 個人簡歷自我評價(集錦15篇)
- 應(yīng)用暴露限值法評估中國花生黃曲霉毒素風(fēng)險
- 經(jīng)紀(jì)人管理辦法(試行)
- 電影《泰坦尼克號》中英文字幕
- 2022年小學(xué)英語教研組工作總結(jié)5篇
- 北師大版八年級上冊數(shù)學(xué)期末考試試卷含答案
- 房屋租賃合同范文錦集9篇
- DB63T 2376-2024 餐飲單位有害生物防治技術(shù)指南
- 中考語文名著《西游記》專項復(fù)習(xí):《三調(diào)芭蕉扇》
- 2023年安徽新華發(fā)行控股有限公司社會招聘筆試真題
- 軟件專業(yè)職業(yè)生涯規(guī)劃
- 2025蛇年春聯(lián)帶橫批
- 娛樂產(chǎn)業(yè)法律服務(wù)行業(yè)市場現(xiàn)狀分析及未來三至五年行業(yè)預(yù)測報告
- 專題06 非連續(xù)性閱讀(開放題型)-2023-2024學(xué)年八年級語文下學(xué)期期中專題復(fù)習(xí)(北京專用)(原卷版)
- 2024年世界職業(yè)院校技能大賽中職組“工程測量組”賽項考試題庫(含答案)
- 半結(jié)構(gòu)化面試題100題
- 靜脈治療小組管理
評論
0/150
提交評論