版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
12023/3/29數(shù)值變量資料的統(tǒng)計描述
正態(tài)分布及其應(yīng)用
2主要內(nèi)容§2.1頻數(shù)分布§2.2集中趨勢§2.3離散趨勢§2.4正態(tài)分布及其應(yīng)用2023/3/293§2.1頻數(shù)分布頻數(shù)分布表的概念頻數(shù)分布表的編制方法頻數(shù)分布的特征頻數(shù)分布的類型頻數(shù)分布表的用途2023/3/294例2.1某地2004年抽樣調(diào)查100名男大學(xué)生的身高(cm)1072023/3/295一、頻數(shù)分布表的概念當樣本含量n較大時,為了解樣本中觀察值的分布規(guī)律和便于指標計算,可編制頻數(shù)分布表,簡稱頻數(shù)表(frequencytable)。頻數(shù):對某一隨機現(xiàn)象進行重復(fù)觀察,或測量大量個體的某項特征,其中某個或某一組變量值出現(xiàn)的次數(shù)。頻數(shù)表:將各變量值與其相應(yīng)的頻數(shù)列成表格形式即為頻數(shù)表。2023/3/296二、頻數(shù)表的編制編制頻數(shù)表時不可能把所有的變量值及其相應(yīng)頻數(shù)都列出來,特別是當樣本例數(shù)n較大時,此時需要根據(jù)變量的取值范圍劃分為若干個組段,再匯總各組段的頻數(shù)。具體步驟如下:以例2.1資料為例。2023/3/297全距(或極差,range)是最大值與最小值之差,用R表示。例2.1中,最大值為183.5cm,最小值為162.9cm,故R=183.5-162.9=20.6(cm)。1.求全距數(shù)值變量資料頻數(shù)表的編制2023/3/298組段數(shù):根據(jù)樣本含量的多少確定,一般設(shè)8~13個組段。組距:各組段的起點和終點分別稱為下限和上限,相鄰兩組段的下限之差(或每一組段的上、下限之差)稱為組距。一般取等距分組,常用全距的1/10取整做組距。某組段(下限+上限)/2為組中值。劃分組段:各組段應(yīng)是連續(xù)的,不能有交叉或重疊。第一組段應(yīng)包括最小值;最末組段應(yīng)包括最大值,并同時寫出其下限與上限。例2.1中,全距的1/10為20.6/10=
2.06,組距取整為2.0cm;最小值為162.9cm,故第一組段的下限為162cm,第二組段的下限為164cm,依次類推,最末組段為182cm184cm,包含最大值183.5cm。
2.確定組段和組距數(shù)值變量資料頻數(shù)表的編制2023/3/2993.列出頻數(shù)表采用計算機或劃記法將原始數(shù)據(jù)匯總,得出各組段的觀察例數(shù),即頻數(shù),把各組段(或各觀察值)及其相應(yīng)的頻數(shù)列表即為頻數(shù)表。注意:最末組段應(yīng)寫出上、下限,其余組段只包含下限,不包含上限。
數(shù)值變量資料頻數(shù)表的編制2023/3/2910202023/3/2911三、頻數(shù)分布的特征頻數(shù)分布的兩個重要特征:
1.集中趨勢(centraltendency):身高向中央部分集中,以中等身高居多(172cm組段),此為集中趨勢。反映集中位置或平均水平。
2.離散程度(tendencyofdispersion):由中等身高到較矮或較高的頻數(shù)分布逐漸減少,反映了身高的離散程度。對于數(shù)值變量資料,應(yīng)用集中趨勢和離散程度二者結(jié)合起來分析其分布規(guī)律。
2023/3/2912圖
某地100名18歲男大學(xué)生身高的頻數(shù)分布集中趨勢離散程度452023/3/2913四、頻數(shù)分布的類型對稱分布:指頻數(shù)分布的集中位置在中間,左右兩側(cè)大致對稱。偏態(tài)分布:指頻數(shù)分布不對稱,集中位置偏向一側(cè):集中位置偏向數(shù)值小的一側(cè),稱為正偏態(tài)分布;集中位置偏向數(shù)值大的一側(cè),稱為負偏態(tài)分布。如有害化學(xué)物質(zhì)在正常人體內(nèi)的分布為正偏態(tài)分布;冠心病、大多數(shù)惡性腫瘤等慢性病患者的年齡分布為負偏態(tài)分布。不同的分布類型應(yīng)選用不同的統(tǒng)計分析方法。
2023/3/2914圖2-1某地100名18歲男大學(xué)生身高的頻數(shù)分布2023/3/2915五、頻數(shù)表的用途
頻數(shù)表可以揭示資料分布類型和分布特征,以便選取適當?shù)慕y(tǒng)計方法;便于進一步計算指標和進行統(tǒng)計分析;便于發(fā)現(xiàn)資料中的某些特大或特小的可疑值。當樣本含量特別大時,可以頻率估計概率。作為資料的陳述形式。在文獻報告中,用頻數(shù)表既可直觀地反映被研究事物的分布特征,又便于作進一步的分析研究。2023/3/2916§2.2集中趨勢平均數(shù)是一類用于描述數(shù)值變量資料集中趨勢的指標,反映一組同質(zhì)觀察值的平均水平或中心位置。統(tǒng)計上的平均數(shù)包括均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù)、調(diào)和均數(shù)等。2023/3/2917一、均數(shù)均數(shù)(mean)是算術(shù)均數(shù)(arithmeticmean)的簡稱。定義:指所有觀察值的代數(shù)和除以觀察值的個數(shù)。符號:樣本均數(shù)用表示,總體均數(shù)用(miu)表示。應(yīng)用:用于反映一組同質(zhì)觀察值的平均水平,應(yīng)用甚廣。
適用于正態(tài)或近似正態(tài)分布的數(shù)值變量資料。計算方法:直接法加權(quán)法2023/3/2918直接法:用于樣本含量n較小時,公式為:
式中,希臘字母(sigma)表示求和;
為各觀察值;n為樣本含量,即觀察值的個數(shù)。例2.2
某地隨機抽取10名18歲健康男大學(xué)生身高(cm)分別為168.7,178.4,170.0,170.4,172.1,167.6,172.4,170.7,177.3,169.7,求平均身高。
集中趨勢的描述指標---均數(shù)---直接法(cm)2023/3/2919加權(quán)法:用于頻數(shù)表資料或樣本中相同觀察值較多時,其公式為:例2.3計算例2.1表2-1資料100名男大學(xué)生的平均身高。
集中趨勢的描述指標---均數(shù)---加權(quán)法該100名18歲健康男大學(xué)生身高的均數(shù)為172.70cm。2023/3/2920幾何均數(shù)(geometricmean)定義:指一組觀察值的乘積,再被觀察值個數(shù)開方。符號:用表示應(yīng)用:適用于①數(shù)據(jù)經(jīng)過對數(shù)變換后呈正態(tài)分布的(對數(shù)正態(tài)分布)資料;②觀察值之間呈倍數(shù)或近似倍數(shù)變化(等比關(guān)系)的資料。如醫(yī)學(xué)實踐中的抗體滴度、平均效價等。計算方法:直接法頻數(shù)表法二、幾何均數(shù)2023/3/2921例2.4有6份血清的抗體效價為1:10,1:20,1:40,1:80,1:80,1:160,求其平均效價。
集中趨勢的描述指標---幾何均數(shù)---直接法該6份血清的平均抗體效價為1:45?;驑颖竞縩較小時2023/3/2922計算公式:例2.5某地區(qū)50名麻疹易感兒童接種麻疹疫苗1個月后,測其血凝抑制抗體滴度,如表2-2中(1)、(2)欄,求平均抗體滴度。集中趨勢的描述指標---幾何均數(shù)---頻數(shù)表法頻數(shù)表資料或樣本中相同觀察值較多時2023/3/2923集中趨勢的描述指標---幾何均數(shù)---加權(quán)法2023/3/2924注意:計算幾何均數(shù)時觀察值中不能有0;一組觀察值中不能同時有正值和負值。集中趨勢的描述指標---幾何均數(shù)---加權(quán)法即其血凝抗體滴度的平均滴度為1:57。2023/3/2925中位數(shù)(median)是一種位置指標。定義:將一組觀察值按由小到大的順序排列后位次居中的數(shù)值就是中位數(shù),小于和大于中位數(shù)的觀察值個數(shù)相等。符號:用M表示。應(yīng)用:用于描述任何分布,特別是偏態(tài)分布資料以及頻數(shù)分布的一端或兩端無確切數(shù)據(jù)資料的中心位置。計算方法:直接法頻數(shù)表法三、中位數(shù)50%50%M2023/3/2926直接法:用于樣本含量n較小的資料。
n為奇數(shù)時,n為偶數(shù)時,例2.6某病患者9名,其發(fā)病的潛伏期(d)分別為:2,3,3,3,4,5,6,9,16,求發(fā)病潛伏期的中位數(shù)。本例n=9,為奇數(shù),故(d)。集中趨勢的描述指標---中位數(shù)---直接法2023/3/2927計算步驟:①按所分組段由小到大計算累計頻數(shù)和累計頻率;②確定中位數(shù)所在組段,即累計頻率包含50%的組段;③求中位數(shù)。
式中,分別為中位數(shù)所在組段的下限、組距和頻數(shù);為小于L的各組段的累計頻數(shù)。例2.7某疾病控制中心記錄了199名沙門氏菌屬食物中毒患者發(fā)病的潛伏期(表2-3),計算平均發(fā)病潛伏期。集中趨勢的描述指標---中位數(shù)---頻數(shù)表法適用于n較大時2023/3/2928集中趨勢的描述指標---中位數(shù)---頻數(shù)表法2023/3/2929例:分別取甲、乙、丙三人每人的耳垂血,然后紅細胞計數(shù),每人數(shù)5個計數(shù)盤,得結(jié)果如下(萬/mm3)§2.3離散趨勢甲乙丙2023/3/2930全距(range,簡記為R)亦稱極差。定義:指一組同質(zhì)觀察值中最大值與最小值之差。全距反映了個體差異的范圍:全距大,說明變異度大;反之,全距小,說明變異度小。應(yīng)用:簡單明了。常用于說明傳染病、食物中毒等的最短及最長潛伏期。公式:R=xmax-xmin不足:①僅考慮了最大值與最小值之差
,不能反映組內(nèi)其它觀察值的變異度;②樣本含量越大,抽到較大或較小觀察值的可能性越大,故全距可能越大。因此,樣本含量相差懸殊時不宜用全距比較。
一、全距2023/3/2931二、百分位數(shù)百分位數(shù)(percentile)用表示,0<x<100,是描述一組數(shù)據(jù)某百分位的位置指標。將全部觀察值分為兩部分,理論上有x%的觀察值比它小,有(100-x)%的觀察值比它大。最常用的百分位數(shù)是,即中位數(shù)。應(yīng)用:①常與中位數(shù)結(jié)合應(yīng)用,可以描述一組資料在某百分位置上的水平,也可以描述資料的分布特征。
M-P5=P95–M時,分布近似對稱
M-P5<P95–M時,分布呈正偏態(tài)
M-P5>P95–M時,分布呈負偏態(tài)2023/3/2932百分位數(shù)(percentile)應(yīng)用:②也可用多個百分位數(shù)的結(jié)合來描述一組觀察值的分布特征,如和合用時,反映中間50%觀察值的分布情況;③百分位數(shù)可用于確定非正態(tài)分布資料的醫(yī)學(xué)參考值范圍。注意:應(yīng)用百分位數(shù),樣本含量要足夠大,否則不宜取靠近兩端的百分位數(shù)。計算公式:分別為所在組段的下限、組距和頻數(shù);為小于L的各組段的累計頻數(shù)。2023/3/2933百分位數(shù)2023/3/2934定義:四分位數(shù)間距(quartileinterval,Q)為上四分位數(shù)與下四分位數(shù)之差(或與之差)。計算公式:應(yīng)用:用于描述偏態(tài)分布以及分布的一端或兩端無確切數(shù)值資料或分布類型未知資料的離散程度。三、四分位數(shù)間距QLQMQU25%25%25%25%2023/3/2935四分位數(shù)間距包括了一組觀察值的一半,故可把四分位數(shù)間距看成是中間50%觀察值的極差。意義:Q越大,變異度越大;反之,Q越小,變異度越小。特點:由于四分位數(shù)間距不受兩端個別極大值或極小值的影響,因而它較全距穩(wěn)定,但仍未考慮全部觀察值的變異度。離散程度的描述指標---四分位數(shù)間距2023/3/2936極差和四分位數(shù)間距都只考慮了個別觀察值的大小差異,沒有全面反映每個觀察值的變異程度。就總體而言,即應(yīng)考慮總體中每個觀察值與總體均數(shù)的差值(),即離均差。因離均差之和,不能反映變異度的大小,故用離均差平方和(sumofsquaresofdeviationsfrommean)反映之。離均差平方和的大小除與變異度有關(guān)外,還與變量值的個數(shù)N有關(guān)。為了消除這一影響,取離均差平方和的均數(shù),稱方差(variance)或均方(meanofsquares)。四、方差2023/3/2937計算公式:總體方差樣本方差n-1為自由度(degreeoffreedom),一般用(niu)表示。因方差的度量單位是原度量單位的平方,故計算結(jié)果難以解釋。離散程度的描述指標---方差樣本方差用自由度n-1去除!2023/3/2938計算公式:總體標準差樣本標準差五、標準差樣本標準差用自由度n-1去除!2023/3/2939樣本標準差離均差平方和常用或表示。直接法:加權(quán)法:
求表2-1中100名18歲男大學(xué)生身高的標準差。2023/3/2940意義:標準差大,表示觀察值的變異度大;反之,標準差小,表示觀察值的變異度小。應(yīng)用:①適用于描述對稱分布資料尤其是正態(tài)分布資料的離散程度。②結(jié)合均數(shù),描述正態(tài)分布資料的頻數(shù)分布規(guī)律,用于估計醫(yī)學(xué)參考值范圍;③結(jié)合均數(shù),計算變異系數(shù);④結(jié)合樣本含量,計算標準誤,估計抽樣誤
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 經(jīng)營決策方案
- 期中(試題)-2024-2025學(xué)年人教PEP版(2024)英語三年級上冊
- 軍訓(xùn)軍列調(diào)整方案
- 福建公務(wù)員面試模擬148
- 吉林公務(wù)員面試模擬96
- 江蘇公共基礎(chǔ)知識真題2007年B類
- 云南行政職業(yè)能力模擬43
- 上海公務(wù)員面試模擬9
- 第二章+第一節(jié)+幼兒感知覺的發(fā)展+1(教案)-《幼兒心理學(xué)》(人教版第二版)
- 陜西行政職業(yè)能力2010年09月
- 2024年社區(qū)工作者面試題庫與答案
- 人工智能技術(shù)應(yīng)用專業(yè)調(diào)研報告
- 2024發(fā)展對象培訓(xùn)班考試試題與答案
- GB/T 15967-20241∶500 1∶1 000 1∶2 000地形圖數(shù)字航空攝影測量測圖規(guī)范
- (正式版)HGT 22820-2024 化工安全儀表系統(tǒng)工程設(shè)計規(guī)范
- 《中華民族共同體概論》考試復(fù)習(xí)題庫(含答案)
- NB-T 47013.15-2021 承壓設(shè)備無損檢測 第15部分:相控陣超聲檢測
- 信息安全風險評估記錄表
- 科技促進經(jīng)濟發(fā)展探討
- 大學(xué)綜合英語第一冊unit1(上海外語出版社)
- W5300控制器詳細設(shè)計及使用說明文檔
評論
0/150
提交評論