統(tǒng)計學(xué)的基礎(chǔ)知識

上傳人：q*** IP屬地：湖北上傳時間：2022-07-05 格式：PPT 頁數(shù)：112 大?。?.86MB 積分：28 舉報 版權(quán)申訴

已閱讀5頁，還剩107頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、預(yù)備內(nèi)容：統(tǒng)計學(xué)基礎(chǔ)知識統(tǒng)計學(xué)statistics統(tǒng)計學(xué)是收集、分析、解釋與報告數(shù)據(jù)資料的一門科學(xué)?！癮 science dealing with the collection, analysis, interpretation and presentation of masses of numerical data”. -Webster 國際大辭典第一節(jié) 統(tǒng)計學(xué)的一些基本概念 1. 總體與樣本2. 變量與隨機變量3. 同質(zhì)與變異4. 參數(shù)與統(tǒng)計量5. 誤差與錯誤6. 準(zhǔn)確性與精確性1. 總體與樣本 Population and sample樣本：從總體中隨機抽取的部分觀察單位。如某單位男士的

2、身高總體：根據(jù)研究目的確定的同質(zhì)研究對象的全體(集合)。如成年人的身高。分有限總體與無限總體從總體中得到樣本的方法：抽樣。（抽樣方法與樣本量）從樣本推論總體的方法：統(tǒng)計推斷（區(qū)間估計，假設(shè)檢驗等）抽樣與推斷p 變量可以測量的任何特征或?qū)傩?。Any characteristic or attribute that can be measured。如熱量值、蛋白質(zhì)含量、碳水化合物含量。p 隨機變量在概率論中稱變量為隨機變量 2、變量與隨機變量Variable and random variable3、變量（隨機變量）的分類p 離散型變量（discrete variable）：計數(shù)資料（15

3、，17，24，）p 連續(xù)性變量（continuous variable）：計量資料（1.65, 1.73, 1.77，）p 有序變量（ordinal variable）：等級資料（優(yōu)、良、中、差）4. 參數(shù)與統(tǒng)計量 Parameter and statistic參數(shù)：總體的統(tǒng)計指標(biāo)，如總體均數(shù)、標(biāo)準(zhǔn)差，采用希臘字母分別記為、。通常是固定的常數(shù)。抽樣統(tǒng)計量參數(shù) 推斷統(tǒng)計量：樣本的統(tǒng)計指標(biāo)，如樣本均數(shù)、標(biāo)準(zhǔn)差，采用拉丁字母分別記為。參數(shù)附近波動的隨機變量。SX、誤差與錯誤Error and mistake誤差：試驗中不可控因素所引起的實際觀察值與客觀真實值（真值）之差p 系統(tǒng)誤差

4、 systematic errorp 隨機誤差 random error錯誤：試驗過程中，人為作用引起的差錯如藥品稱量錯誤，數(shù)據(jù)錄入錯誤等誤差（Error）測量值 = 真值 + 隨機誤差 +非隨機誤差 Xi = i + i 1隨機誤差（抽樣誤差）：影響因素眾多，變化無方向性，不可避免，但可用統(tǒng)計方法進行分析。 2系統(tǒng)誤差受確定因素影響，大小變化有方向性。 3非系統(tǒng)誤差（錯誤）研究者偶然失誤而造成的誤差。偏差bias可以避免6. 準(zhǔn)確性與精確性準(zhǔn)確度(accuracy)或真實性(validity)：觀察值與真值的接近程度，受系統(tǒng)誤差的影響(常用指標(biāo)：如靈敏度、特異性)。精密度(pr

5、ecision) 、也稱可靠度（reliability）或重復(fù)性(repeatability）：重復(fù)觀察時觀察值與其均值的接近程度，受隨機誤差的影響（常用指標(biāo)：一致百分率、Kappa值）。系統(tǒng)誤差使數(shù)據(jù)偏離了其理論值，影響數(shù)據(jù)的準(zhǔn)確度準(zhǔn)確度。隨機誤差使數(shù)據(jù)相互分散，影響了數(shù)據(jù)的精密度精密度。準(zhǔn)確度和精密度都好準(zhǔn)確度差、精密度好準(zhǔn)確度？精密度差準(zhǔn)確度和精密度都差第二節(jié) 計量資料的統(tǒng)計描述連續(xù)型變量（可測量的變量）u頻數(shù)表與頻數(shù)分布u平均指標(biāo)（算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù)）u變異指標(biāo)（極差、百分位數(shù)與四分位間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)）一、頻數(shù)表與頻數(shù)分布 (frequency ta

6、ble and frequency distribution)160名正常成年女子的血清甘油三酯（mmol/L）男子血清總膽固醇水平（mmol/L） Stem-and-Leaf Plot Frequency Stem & Leaf 5.00 2 . 78999 13.00 3 . 0111222333444 34.00 3 . 5555555566666666777778888999999999 32.00 4 . 00000001111111222223333334444444 35.00 4 . 55555555566666666677777888888899999 17.00

7、5 . 00112222233333344 10.00 5 . 5555677899 4.00 6 . 0022 Stem width: 1.00 Each leaf: 1 case (s)莖葉圖二. 平均指標(biāo)總稱為平均數(shù)（average）反映了資料的集中趨勢（central tendency）。常用的有： 1. 算術(shù)均數(shù)（arithmetic mean），簡稱均數(shù)（mean） 2. 幾何均數(shù)（geometric mean） 3. 中位數(shù) （median） 4. 眾數(shù)（mode） 5. 調(diào)和均數(shù)（harmonic mean） 6. 截尾平均值（5% trimmed mean）1. 均數(shù)（mea

8、n）nXnXXXXn21iiikkkfXfffffXfXfXfXfX321332211適用條件：資料呈正態(tài)或近似正態(tài)分布的資料2. 幾何均數(shù)（geometric mean）nXXnXXXXnXGnGlglglg)lglg(lg1lg121nnGXXXX21幾何均數(shù)的適用條件與實例適用條件：呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布（正偏態(tài)）資料；如增長速度、抗體滴度資料抗體的效價滴度的倒數(shù)分別為：10、100、1000、10000、100000，求幾何均數(shù)。1000510lg10lg10lg10lg10lglg543211GX此例的算術(shù)均數(shù)為22222，顯然不能代表滴度的平均水平。對于同一資料，幾何均

9、數(shù) 中位數(shù)眾數(shù)負偏態(tài)分布時：均數(shù)中位數(shù) 幾何平均數(shù) 調(diào)和平均數(shù) 上述五種平均數(shù)，最常用的是算術(shù)平均數(shù)。幾種平均數(shù)之間的關(guān)系5% trimmed mean：將一組數(shù)中去掉最小的5數(shù)值，再去掉最大的5，然后將剩余的90計算平均值得出的數(shù)值。減小了極端值的影響。截尾平均值三. 變異（variation）指標(biāo) 反映數(shù)據(jù)的離散度（Dispersion ）。即個體觀察值的變異程度。常用的指標(biāo)有： 1. 極差（Range） (全距) 2. 百分位數(shù)與四分位數(shù)間距 Percentile and Quartile range 3. 方差 Variance 4. 標(biāo)準(zhǔn)差 Standard Deviation 5

10、. 變異系數(shù) Coefficient of Variation1. 極差（Range）（全距）minmaxXXR優(yōu)點：簡便缺點：1. 只利用了兩個極端值 2. n大，R也會大 3. 不穩(wěn)定 1.6m 1.8m2. 百分位數(shù)與四分位數(shù)間距 Percentile and quartile range百分位數(shù) ：數(shù)據(jù)從小到大排列，在百分尺度下，所占百分比對應(yīng)的值。記為Px。四分位間距Quartile range：QRP75 P25四分位半間距Quartile deviation：QDQR/2XFrequency 25%75%3. 方差方差（variance）也稱均方差（mean square

11、 deviation），樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。NXXSSXxxxn22221)-()-(square of Sum0)-()(.)()(總體方差）離均差平方和（離均差和11)(2222nnXXnXXS樣本方差4.標(biāo)準(zhǔn)差11)(222nnXXnXXS樣本標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差（Standard deviation, Std, SD）即方差的正平方根；其單位與原變量X的單位相同。NX2)(總體標(biāo)準(zhǔn)差樣本方差為什么要除以（n1）與自由度（degrees of freedom）有關(guān)。自由度是數(shù)學(xué)名詞，在統(tǒng)計學(xué)中，n個數(shù)據(jù)如不受任何條件的限制，則n個數(shù)據(jù)可取任意值，稱為有

12、n個自由度。若受到k個條件的限制，就只有（nk）個自由度了。例如一個有5個觀察值的樣本，因為受到統(tǒng)計數(shù)的約束，在5個離均差中，只有4個數(shù)值可以在一定范圍內(nèi)自由變動取值，而第五個離均差必須滿足這一限制條件。0)(_xxx基本概念：樣本容量及樣本個數(shù) 樣本容量(n)：指一個樣本所包含的單位數(shù)。一般將樣本單位數(shù)不少于三十個(50?)的樣本稱為大樣本，樣本單位數(shù)不到三十個的樣本稱為小樣本。樣本個數(shù)(g)：又稱樣本可能數(shù)目，是指從一個總體中抽取了多少個樣本?；靖拍睿撼闃诱`差抽樣誤差：指按照隨機原則抽樣時，樣本指標(biāo)與總體指標(biāo)之間存在的誤差。主要包括：總體平均數(shù)和樣本平均數(shù)的誤差；總體標(biāo)準(zhǔn)差

13、和樣本標(biāo)準(zhǔn)差的誤差。基本概念：抽樣平均誤差為什么要研究抽樣平均誤差？未知實際誤差未知：即使知道，由于樣本均值是隨機的，每次的誤差也不一樣。)(x均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤例如，從總體均數(shù)=4.136 mmol/L、標(biāo)準(zhǔn)差=0.817 mmol /L的正態(tài)分布總體N(4.136, 0.8172)中，隨機抽取n人為一個樣本（n=5, 10, 20, 30），并計算該樣本的均數(shù)、標(biāo)準(zhǔn)差。如此重復(fù)抽取1000次（g=1000），可得到1000份樣本，可得到1000份均數(shù) 和標(biāo)準(zhǔn)差S。X10001000份樣本的均數(shù)和標(biāo)準(zhǔn)差份樣本的均數(shù)和標(biāo)準(zhǔn)差均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤將這1000份樣本的均數(shù)看成新變量

14、值，按頻數(shù)分布方法，得到這1000份樣本均數(shù)的直方圖。隨機抽樣所得隨機抽樣所得10001000份樣本均數(shù)的分布份樣本均數(shù)的分布當(dāng)n5時當(dāng)n10時當(dāng)n20時當(dāng)n30時 1000份樣本均數(shù)的抽樣分布特點樣本含量均數(shù) 均數(shù)標(biāo)準(zhǔn)差 n mean sd 5 4.14030 0.36305 10 4.14039 0.25024 20 4.13859 0.17849 30 4.14173 0.14954 總體均數(shù) 4.136總體標(biāo)準(zhǔn)差 0.8170.817 /50.36540.817 /100.25840.817 /200.18270.817 /300.1492XSn理論上，樣本均數(shù)的標(biāo)準(zhǔn)差 1000份樣

15、本均數(shù)的抽樣分布特點：樣本均數(shù)的抽樣分布特點： 1000份樣本均數(shù)中，各樣本均數(shù)間存在差異，但各樣本均數(shù)在總體均數(shù)周圍波動。樣本均數(shù)的分布曲線為中間高，兩邊低，左右對稱，近似服從正態(tài)分布。隨著樣本量增加，樣本均數(shù)的標(biāo)準(zhǔn)差明顯變?。?.136(4.140,4.140,4.138,4.141)X0.817(0.365,0.258,0.183,0.149XSn4個抽樣實驗結(jié)果比較10;0.2584XnS30;0.1492XnS5;0.3654XnS20;0.1827XnS 通過增加樣本含量n來降低抽樣誤差。5. 變異系數(shù)%100XSCV(Coefficient of variation，CV)適

16、用條件：觀察指標(biāo)單位不同，如身高、體重同單位資料，但均數(shù)相差懸殊6. 數(shù)據(jù)的標(biāo)準(zhǔn)得分假定兩個水平類似的班級（一班和二班）上同一門課，但是由于兩個任課老師的評分標(biāo)準(zhǔn)不同，使得兩個班成績的均值和標(biāo)準(zhǔn)差都不一樣(SPSS數(shù)據(jù)：grade.sav)。分?jǐn)?shù)的均值標(biāo)準(zhǔn)差 CV一班 78.53 9.43 12%二班 70.19 7.00 10%那么得到90分的一班的張穎是不是比得到82分的二班的劉濤成績更好呢成績更好呢？怎么比較才能合理呢？數(shù)據(jù)的標(biāo)準(zhǔn)得分均值和標(biāo)準(zhǔn)差不同的數(shù)據(jù)不能夠直接比較，但是可以把它們進行標(biāo)準(zhǔn)化，然后再比較標(biāo)準(zhǔn)化后的數(shù)據(jù)。一個標(biāo)準(zhǔn)化的方法是把原始觀測值（亦稱得分，score）

17、和均值之差除以標(biāo)準(zhǔn)差；得到的度量稱為標(biāo)準(zhǔn)得分(standard score，又稱為z-score)。即：標(biāo)準(zhǔn)差均值觀察值標(biāo)準(zhǔn)得分-SXXscorez數(shù)據(jù)的標(biāo)準(zhǔn)得分然后可以比較來自不同樣本的標(biāo)準(zhǔn)得分。這樣：張穎的標(biāo)準(zhǔn)得分為劉濤的標(biāo)準(zhǔn)得分為顯然如果兩個班級水平差不多，劉濤的成劉濤的成績應(yīng)該優(yōu)于張穎的成績績應(yīng)該優(yōu)于張穎的成績；這是在標(biāo)準(zhǔn)化之前的數(shù)據(jù)中不易看到的。 22. 143. 953.78-9069. 100. 719.70-8210097N =班級二班一班得分1101009080706050402110097N =班級二班一班標(biāo)準(zhǔn)得分3210-1-2-3-421p原始數(shù)據(jù)是在各自的均

18、值附近，散布也不一樣。但它們的標(biāo)準(zhǔn)得分則在0周圍散布，而且散布也差不多。 p實際上，任何樣本經(jīng)過這樣的標(biāo)準(zhǔn)化后，就都變換成均值為0、方差為1的樣本。標(biāo)準(zhǔn)化后不同樣本觀測值的比較只有相對意義，沒有絕對意義。第三節(jié) 計數(shù)資料的統(tǒng)計描述按年齡（2歲一組）與職業(yè)整理統(tǒng)計軟件的種類SPSS：p這是一個很受歡迎的統(tǒng)計軟件；p容易操作，輸出漂亮，功能齊全;p對于非統(tǒng)計工作者是很好的選擇。 Excel：p作為數(shù)據(jù)表格軟件，有一定統(tǒng)計計算功能；p對于簡單分析比較方便；p對于較復(fù)雜的分析，需要使用函數(shù)，甚至根本沒有相應(yīng)的方法了。多數(shù)專門一些的統(tǒng)計推斷問題還需要其他專門的統(tǒng)計軟件來處理。統(tǒng)計軟件的種類SAS：p功

19、能非常齊全的軟件；p某些美國政府機構(gòu)認(rèn)可；p需要一定的訓(xùn)練才可以使用，對于非專業(yè)統(tǒng)計人員不那么方便。 S-plus：p統(tǒng)計學(xué)家喜愛的軟件；p其功能齊全，具有強大的編程功能；p專業(yè)統(tǒng)計人員可以編制自己的程序來實現(xiàn)自己的理論和方法。統(tǒng)計軟件的種類Statistica：p容易操作;p統(tǒng)計資料分析、圖表、資料管理;p應(yīng)用程序開發(fā)。Origin：p容易操作;p輸出圖形的清晰度高（很多雜志要求）。第三節(jié) 常見的概率分布一概率的有關(guān)概念二概率分布概述三離散型隨機變量的概率分布四正態(tài)分布五常用的抽樣分布一概率的有關(guān)概念樣本的實際發(fā)生率稱為頻率。設(shè)在相同條件下，獨立重復(fù)進行n次試驗，事件A出現(xiàn)

20、f 次，則事件A出現(xiàn)的頻率為f/n。概率：隨機事件發(fā)生的可能性大小，用大寫的P 表示；取值0，1。樣本含量n越大，頻率的波動幅度越小，頻率越接近概率。頻率與概率 frequency and probability必然事件 P = 1隨機事件 0 P 1不可能事件 P = 0 P 0.05（5）或P 0.01（1）稱為小概率事件(習(xí)慣)，統(tǒng)計學(xué)上認(rèn)為不大可能發(fā)生。隨機事件 Random events 概率分布：描述隨機變量值xi及這些值對應(yīng)概率P(X=xi)的表格、公式或圖形。離散型隨機變量離散型隨機變量概率分布概率分布連續(xù)型隨機變量連續(xù)型隨機變量概率分布概率分布二概率分布概述1.

21、1. 離散離散型隨機變量的型隨機變量的概率分布概率分布離散型隨機變量的概率分布（例一）f(x)離散型隨機變量的概率分布（例二）N=10, =0.2如新手上路某事件出錯的概率是0.2，連續(xù)進行10次這樣的事件，出現(xiàn)010次錯誤的概率分布： 2. 連續(xù)型隨機變量的概率分布與離散型變量不同的是連續(xù)型變量的取值充滿整個數(shù)值區(qū)間，無法一一列出其每一個可能值。一般將連續(xù)型隨機變量整理成頻數(shù)表，對頻數(shù)作直方圖，直方圖的每個矩形頂端連接的階梯形曲線來描述連續(xù)型變量的頻數(shù)分布。如果樣本量很大，組段很多，矩形頂端組成的階梯型曲線可變成光滑的分布曲線。大多數(shù)情況下，可采用一個函數(shù)擬合這一光滑曲線。這種函數(shù)稱為

22、概率密度函數(shù)（Probability density function，Pdf）。xxxfff 如果連續(xù)型隨機變量X的概率密度函數(shù)記為：則在區(qū)間x1,x2 范圍內(nèi)的概率可由微積分函數(shù)定義 211212( )( )( ,) (,)xxF XP xXxf x dxx x ()( )1F XPxf x dx )(xf三離散型隨機變量的概率分布離散型隨機變量的分布1、二項分布2、泊松分布連續(xù)型隨機變量的分布正態(tài)分布毒性試驗：白鼠死亡生存臨床試驗：病人治愈未愈臨床化驗：血清陽性陰性任一事件成功（A）失?。ǚ茿）這類“成功失敗型”試驗稱為Bernoulli試驗。1、二項分布Binomial d

23、istributionBernoulli試驗序列n次Bernoulli試驗構(gòu)成了Bernoulli試驗序列。其特點（如拋硬幣）如下：(1) 每次試驗結(jié)果，只能是兩個互斥的結(jié)果之一(A或非A)。(2) 每次試驗的條件不變。即每次試驗中，結(jié)果A發(fā)生的概率不變，均為。(3) 各次試驗獨立。即一次試驗出現(xiàn)什么樣的結(jié)果與前面已出現(xiàn)的結(jié)果無關(guān)。成功次數(shù)的概率分布二項分布例設(shè)某毒理試驗采用白鼠共3只，它們有相同的死亡概率，相應(yīng)存活概率為1-。記試驗后白鼠死亡的例數(shù)為X，分別求X0、1、2和3的概率 3只白鼠各種試驗結(jié)果及其發(fā)生概率二項分布的概率計算=BINOMDIST(1,3,0.4,0)=0.5，正

24、態(tài)0.5，左偏二項分布的特點2、泊松分布當(dāng)二項分布中n很大，很小時，二項分布就變成為Poisson分布，所以Poisson分布實際上是二項分布的極限分布。由二項分布的概率函數(shù)可得到泊松分布的概率函數(shù)為：0,1,2,!0XPoisson()xeP XxxxXP為大于的常數(shù)，服從以為參數(shù)的分布全部右偏越大越趨于正態(tài)PPoisson分布概率的特點Poisson分布與正態(tài)分布正態(tài)分布及二項分布二項分布的關(guān)系當(dāng)較小時， Poisson分布呈偏態(tài)分布，隨著增大，迅速接近正態(tài)分布，當(dāng)20時，可以認(rèn)為近似正態(tài)分布。 Poisson分布是二項分布的特例，某現(xiàn)象的發(fā)生率很小，而樣本例數(shù)n很大時，則二項

25、分布接近于Piosson分布。 n （應(yīng)用： Poisson替代二項分布）四正態(tài)分布正態(tài)分布（Normal distribution）也叫高斯分布（Gaussian distribution），是最常見、最重要的一種連續(xù)型分布。 1、正態(tài)分布的數(shù)學(xué)形式 2、正態(tài)曲線 3、標(biāo)準(zhǔn)正態(tài)分布 4、曲線下面積1、數(shù)學(xué)形式 XXXf,2)(exp21)(22）。正態(tài)曲線（就是為橫坐標(biāo)，繪制的曲線為縱坐標(biāo)，以的概率密度函數(shù)。稱為為總體標(biāo)準(zhǔn)差的總體均數(shù)，為，curve Normal)()(),(2XXfXXfXNX2、正態(tài)曲線（ normal curve ）圖形特點：鐘型中間高兩頭低左右對稱最高處對應(yīng)于X

26、軸的值就是均數(shù)曲線下面積為11. 標(biāo)準(zhǔn)差決定曲線的形狀 =0.5 0 f(x) =1 =2 0 f(x) max 1 2 N（，0.52）、N（，12）、N（，22） N（1 ，2）、）、N（2 ，2）正態(tài)分布曲線由兩個參數(shù)決定，即總體均數(shù)和總體標(biāo)準(zhǔn)差。在不變的情況下，函數(shù)曲線形狀不變，若變大時，曲線位置向右移；若變小時，曲線位置向左移，故稱為位置參數(shù)。在不變的情況下，函數(shù)曲線位置不變，若變大時，曲線形狀變的越來越“胖”和“矮”；若變小時，曲線形狀變的越來越“瘦”和“高”，故稱為形態(tài)參數(shù)或變異度參數(shù)。3、標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)離差標(biāo)準(zhǔn)正態(tài)分布：N(0,1)XZ221( ),2zzez

27、222)(exp21)(XXf正態(tài)分布： p標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)實質(zhì)上就是正態(tài)分布的概率密度函數(shù)中=0，=1的情形。p實質(zhì)上是作了一個坐標(biāo)軸的平移和尺度變換，使正態(tài)分布具有平均數(shù)為=0，標(biāo)準(zhǔn)差=1。這種變換稱為標(biāo)準(zhǔn)化正態(tài)變換。p因此將這種具有平均數(shù)為=0，標(biāo)準(zhǔn)差=1的正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布，記為N（0，1）。0.00.10.20.30.40.5-4-3-2-101234Xf(X) 4、曲線下面積dXeXFXX)2()(2221)(dueuuu2221)(u-累計概率分布函數(shù)：曲線下面積分布規(guī)律0-11-1.961.96-2.582.5868.27%95.00%99.00%-+-1.96

28、+1.96-2.58+2.5868.27%95.00%99.00%正態(tài)分布的特征，歸納起來有兩點：p 對稱性（symmetry）p 正態(tài)峰 (mesokurtosis) 偏度系數(shù)和峰度系數(shù)skewness and kurtosis 偏度 skewness若分布不對稱就是偏態(tài)，長尾拖向右側(cè)（變量值較大的一側(cè)）叫做正偏態(tài),或右偏態(tài)；長尾拖向左側(cè)（變量值較小的一側(cè)）叫做負偏態(tài)，或左偏態(tài)。正態(tài)分布時，mean、median、mode相等偏度系數(shù)(skewness):若分布是以平均值對稱的，則偏度=0；若分布是右偏的，則偏度系數(shù) 0；若分布是左偏的，則偏度系數(shù) 0。峰度系數(shù)是描述隨機變量陡峭度的參數(shù)，

29、分為：正態(tài)峰、平闊峰、尖峭峰。峰度 kurtosis a.尖峭峰 b.正態(tài)峰c.平闊峰峰度系數(shù)(kurtosis)：Skewness.088kurtosis-0.2215血清總膽固醇.sav正態(tài)分布在橫軸上方均數(shù)處最高。正態(tài)分布以均數(shù)為中心，左右對稱。正態(tài)分布由參數(shù)和確定。是位置參數(shù)，當(dāng)不變時,越大，則曲線沿橫軸越向右移動；反之，越小，曲線沿橫軸越向左移動是變異度參數(shù)，當(dāng)不變時，越大，表示數(shù)據(jù)越分散，曲線越平坦；越小，表示數(shù)據(jù)越集中，曲線越陡峭標(biāo)準(zhǔn)正態(tài)分布曲線與X軸所圍成的面積為1。在的區(qū)間內(nèi)占總面積的68.27%，在1.96的區(qū)間內(nèi)占總面積的95%；在2.58的區(qū)間內(nèi)占總面積的99

30、%。5、正態(tài)分布的特征五常用的抽樣分布如果總體不是正態(tài)總體，但其均數(shù)和標(biāo)準(zhǔn)差分別為和，則當(dāng)樣本含量n不斷增大時，樣本均數(shù)的分布也趨近于正態(tài)分布，且其均數(shù)為，標(biāo)準(zhǔn)差為不論總體的分布形式如何，只要樣本含量n足夠大時，樣本均數(shù)的分布就近似正態(tài)分布，此稱為中心極限定理。 1、中心極限定理 nXn2、常用的三種抽樣分布t 分布F分布2 2分布均為連續(xù)型隨機變量分布，分布只與自由度，即樣本含量有關(guān)。t分布根據(jù)中心極限定理，當(dāng)樣本含量足夠大時，對從均數(shù)為，標(biāo)準(zhǔn)差為的任意總體中隨機抽樣所得的樣本均數(shù)進行標(biāo)準(zhǔn)化變換，有(0,1)iiXNnt分布的演化由于總體標(biāo)準(zhǔn)差往往是未知的，此時往往用樣本標(biāo)準(zhǔn)差s

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

統(tǒng)計學(xué)的基礎(chǔ)知識

文檔簡介

溫馨提示

最新文檔

評論

統(tǒng)計學(xué)的基礎(chǔ)知識

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔