




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、預備內(nèi)容:統(tǒng)計學基礎知識預備內(nèi)容:統(tǒng)計學statistics統(tǒng)計學是收集、分析、解釋與報告數(shù)據(jù)資料的一門科學?!癮 science dealing with the collection, analysis, interpretation and presentation of masses of numerical data”. -Webster 國際大辭典統(tǒng)計學statistics統(tǒng)計學是收集、分析、解釋與報告數(shù)第一節(jié) 統(tǒng)計學的一些基本概念 1. 總體與樣本2. 變量與隨機變量3. 同質(zhì)與變異4. 參數(shù)與統(tǒng)計量5. 誤差與錯誤6. 準確性與精確性第一節(jié) 統(tǒng)計學的一些基本概念 1. 總體與樣
2、本1. 總體與樣本 Population and sample樣本:從總體中隨機抽取的部分觀察單位。如某單位男士的身高總體:根據(jù)研究目的確定的同質(zhì)研究對象的全體(集合)。如成年人的身高。分有限總體與無限總體1. 總體與樣本 Populatio從總體中得到樣本的方法:抽樣。 (抽樣方法與樣本量)從樣本推論總體的方法:統(tǒng)計推斷 (區(qū)間估計,假設檢驗等)抽樣與推斷從總體中得到樣本的方法:抽樣。抽樣與推斷變量可以測量的任何特征或?qū)傩浴ny characteristic or attribute that can be measured。 如熱量值、蛋白質(zhì)含量、碳水化合物含量。隨機變量在概率論中稱變量
3、為隨機變量 2、變量與隨機變量Variable and random variable變量可以測量的任何特征或?qū)傩?。Any character3、變量(隨機變量)的分類 離散型變量(discrete variable): 計數(shù)資料(15,17,24,) 連續(xù)性變量(continuous variable): 計量資料(1.65, 1.73, 1.77,) 有序變量(ordinal variable): 等級資料(優(yōu)、良、中、差)3、變量(隨機變量)的分類 離散型變量(discrete v4. 參數(shù)與統(tǒng)計量 Parameter and statistic參數(shù):總體的統(tǒng)計指標,如總體均數(shù)、標準差,
4、采用希臘字母分別記為、。通常是固定的常數(shù)。 總體樣本抽樣 統(tǒng)計量 參 數(shù) 推斷統(tǒng)計量:樣本的統(tǒng)計指標,如樣本均數(shù)、標準差,采用拉丁字母分別記為 。 參數(shù)附近波動的隨機變量 。4. 參數(shù)與統(tǒng)計量 Paramete誤差與錯誤Error and mistake誤差:試驗中不可控因素所引起的實際觀察值與客觀真實值(真值)之差系統(tǒng)誤差 systematic error隨機誤差 random error錯誤:試驗過程中,人為作用引起的差錯 如藥品稱量錯誤,數(shù)據(jù)錄入錯誤等誤差與錯誤Error and mistake誤差:試驗中不 誤差(Error)測量值 = 真值 + 隨機誤差 +非隨機誤差 Xi = i
5、+ i 1隨機誤差(抽樣誤差): 影響因素眾多,變化無方向性,不可避免,但可用統(tǒng)計方法進行分析。 2系統(tǒng)誤差 受確定因素影響,大小變化有方向性。 3非系統(tǒng)誤差(錯誤) 研究者偶然失誤而造成的誤差。偏差bias可以避免 誤差(Error)偏差bias6. 準確性與精確性準確度(accuracy)或真實性(validity):觀察值與真值的接近程度,受系統(tǒng)誤差的影響(常用指標:如靈敏度、特異性)。精密度(precision) 、也稱可靠度(reliability)或重復性(repeatability):重復觀察時觀察值與其均值的接近程度,受隨機誤差的影響(常用指標:一致百分率、Kappa值)。6.
6、 準確性與精確性準確度(accuracy)或真實性(va系統(tǒng)誤差使數(shù)據(jù)偏離了其理論值,影響數(shù)據(jù)的準確度。隨機誤差使數(shù)據(jù)相互分散,影響了數(shù)據(jù)的精密度。準確度和精密度都好 準確度差、精密度好 準確度?精密度差 準確度和精密度都差 系統(tǒng)誤差使數(shù)據(jù)偏離了其理論值,影響數(shù)據(jù)的準確度。準確度和精密第二節(jié) 計量資料的統(tǒng)計描述 連續(xù)型變量(可測量的變量)頻數(shù)表與頻數(shù)分布平均指標(算術均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù))變異指標(極差、百分位數(shù)與四分位間距、方差、標準差、變異系數(shù))第二節(jié) 計量資料的統(tǒng)計描述 連續(xù)型變量(可測量一、頻數(shù)表與頻數(shù)分布 (frequency table and frequency dist
7、ribution)一、頻數(shù)表與頻數(shù)分布 (frequency table a160名正常成年女子的血清甘油三酯(mmol/L) 160名正常成年女子的血清甘油三酯(mmol/L) 統(tǒng)計學的基礎知識分解課件男子血清總膽固醇水平(mmol/L) Stem-and-Leaf Plot Frequency Stem & Leaf 5.00 2 . 78999 13.00 3 . 0111222333444 34.00 3 . 5555555566666666777778888999999999 32.00 4 . 00000001111111222223333334444444 35.00 4 . 5
8、5555555566666666677777888888899999 17.00 5 . 00112222233333344 10.00 5 . 5555677899 4.00 6 . 0022 Stem width: 1.00 Each leaf: 1 case (s)莖葉圖男子血清總膽固醇水平(mmol/L) Stem-and-Le二. 平均指標總稱為平均數(shù)(average)反映了資料的集中趨勢(central tendency)。常用的有: 1. 算術均數(shù)(arithmetic mean),簡稱均數(shù)(mean) 2. 幾何均數(shù)(geometric mean) 3. 中位數(shù) (median
9、) 4. 眾數(shù)(mode) 5. 調(diào)和均數(shù)(harmonic mean) 6. 截尾平均值(5% trimmed mean)二. 平均指標總稱為平均數(shù)(average)反映了資料的集中1. 均數(shù)(mean)適用條件:資料呈正態(tài)或近似正態(tài)分布的資料1. 均數(shù)(mean)適用條件:資料呈正態(tài)或近似正態(tài)分布的資2. 幾何均數(shù)(geometric mean)2. 幾何均數(shù)(geometric mean)幾何均數(shù)的適用條件與實例適用條件:呈倍數(shù)關系的等比資料或?qū)?shù)正態(tài)分布(正偏態(tài))資料;如增長速度、抗體滴度資料抗體的效價滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例
10、的算術均數(shù)為22222,顯然不能代表滴度的平均水平。對于同一資料,幾何均數(shù) 中位數(shù)眾數(shù)負偏態(tài)分布時:均數(shù)中位數(shù) 幾何平均數(shù) 調(diào)和平均數(shù) 上述五種平均數(shù),最常用的是算術平均數(shù)。幾種平均數(shù)之間的關系 對于同一資料:幾種平均數(shù)之間的關系5% trimmed mean:將一組數(shù)中去掉最小的5數(shù)值,再去掉最大的5,然后將剩余的90計算平均值得出的數(shù)值。減小了極端值的影響。 截尾平均值5% trimmed mean:將一組數(shù)中去掉最小的5數(shù)值三. 變異(variation)指標 反映數(shù)據(jù)的離散度(Dispersion )。即個體觀察值的變異程度。常用的指標有: 1. 極差(Range) (全距) 2. 百
11、分位數(shù)與四分位數(shù)間距 Percentile and Quartile range 3. 方差 Variance 4. 標準差 Standard Deviation 5. 變異系數(shù) Coefficient of Variation三. 變異(variation)指標 反映數(shù)據(jù)1. 極差(Range)(全距)優(yōu)點:簡便缺點:1. 只利用了兩個 極端值 2. n大,R也會大 3. 不穩(wěn)定1. 極差(Range)(全距)優(yōu)點:簡便 1.6m 1.8m2. 百分位數(shù)與四分位數(shù)間距 Percentile and quartile range百分位數(shù) :數(shù)據(jù)從小到大排列,在百分尺度下,所占百分比對應的值。記
12、為Px。 四分位間距Quartile range:QRP75 P25四分位半間距Quartile deviation:QDQR/2XFrequency 25%75% 1.6m 3. 方差 方差 (variance)也稱均方差(mean square deviation),樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。3. 方差 方差 (variance)也稱均方差(m4.標準差 標準差 (Standard deviation, Std, SD)即方差的正平方根;其單位與原變量X的單位相同。總體標準差4.標準差 標準差 (Standard deviat樣本方差為什么要除以(n1)與
13、自由度(degrees of freedom)有關。自由度是數(shù)學名詞,在統(tǒng)計學中,n個數(shù)據(jù)如不受任何條件的限制,則n個數(shù)據(jù)可取任意值,稱為有n個自由度。若受到k個條件的限制,就只有(nk)個自由度了。例如一個有5個觀察值的樣本,因為受到統(tǒng)計數(shù)的約束,在5個離均差中,只有4個數(shù)值可以在一定范圍內(nèi)自由變動取值,而第五個離均差必須滿足 這一限制條件。樣本方差為什么要除以(n1)與自由度(degrees of基本概念:樣本容量及樣本個數(shù) 樣本容量(n):指一個樣本所包含的單位數(shù)。 一般將樣本單位數(shù)不少于三十個(50?)的樣本稱為大樣本,樣本單位數(shù)不到三十個的樣本稱為小樣本。 樣本個數(shù)(g):又稱樣本可
14、能數(shù)目,是指從一個總體中抽取了多少個樣本。基本概念:樣本容量及樣本個數(shù) 樣本容量(n):指一個樣本所基本概念:抽樣誤差 抽樣誤差:指按照隨機原則抽樣時,樣本指標與總體指標之間存在的誤差。 主要包括: 總體平均數(shù)和樣本平均數(shù)的誤差; 總體標準差和樣本標準差的誤差?;靖拍睿撼闃诱`差 抽樣誤差:指按照隨機原則抽樣時,樣本指標基本概念:抽樣平均誤差 為什么要研究抽樣平均誤差? 未知 實際誤差未知: 即使知道,由于樣本均值是隨機的,每次的誤差也不一樣。基本概念:抽樣平均誤差 為什么要研究抽樣平均誤差? 均數(shù)的抽樣誤差與標準誤例如,從總體均數(shù)=4.136 mmol/L、標準差=0.817 mmol /L
15、的正態(tài)分布總體N(4.136, 0.8172)中,隨機抽取n人為一個樣本(n=5, 10, 20, 30),并計算該樣本的均數(shù)、標準差。如此重復抽取1000次(g=1000),可得到1000份樣本,可得到1000份均數(shù) 和標準差S。均數(shù)的抽樣誤差與標準誤例如,從總體均數(shù)=4.136 mmo1000份樣本的均數(shù)和標準差均數(shù)的抽樣誤差與標準誤1000份樣本的均數(shù)和標準差均數(shù)的抽樣誤差與標準誤 將這1000份樣本的均數(shù)看成新變量值,按頻數(shù)分布方法,得到這1000份樣本均數(shù)的直方圖。隨機抽樣所得1000份樣本均數(shù)的分布當n5時 將這1000份樣本的均數(shù)看成新變量值,按頻數(shù)分布方法,當n10時當n10時
16、當n20時當n20時當n30時當n30時 1000份樣本均數(shù)的抽樣分布特點樣本含量 均數(shù) 均數(shù)標準差 n mean sd 5 4.14030 0.36305 10 4.14039 0.25024 20 4.13859 0.17849 30 4.14173 0.14954 總體均數(shù) 4.136總體標準差 0.817 1000份樣本均數(shù)的抽樣分布特點樣本含量 均數(shù) 1000份樣本均數(shù)的抽樣分布特點: 1000份樣本均數(shù)中,各樣本均數(shù)間存在差異,但各樣本均數(shù)在總體均數(shù)周圍波動。 樣本均數(shù)的分布曲線為中間高,兩邊低,左右對稱,近似服從正態(tài)分布。 隨著樣本量增加,樣本均數(shù)的標準差明顯變?。?1000份樣
17、本均數(shù)的抽樣分布特點:4個抽樣實驗結果比較 通過增加樣本含量n來降低抽樣誤差。4個抽樣實驗結果比較 通過增加樣本含量n來降低抽樣誤差。5. 變異系數(shù)(Coefficient of variation,CV)適用條件: 觀察指標單位不同,如身高、體重 同單位資料,但均數(shù)相差懸殊5. 變異系數(shù)(Coefficient of variat6. 數(shù)據(jù)的標準得分假定兩個水平類似的班級(一班和二班)上同一門課,但是由于兩個任課老師的評分標準不同,使得兩個班成績的均值和標準差都不一樣(SPSS數(shù)據(jù):grade.sav)。 分數(shù)的均值 標準差 CV一班 78.53 9.43 12%二班 70.19 7.00
18、10%那么得到90分的一班的張穎是不是比得到82分的二班的劉濤成績更好呢?怎么比較才能合理呢? 6. 數(shù)據(jù)的標準得分假定兩個水平類似的班級(一班和二班)上同數(shù)據(jù)的標準得分均值和標準差不同的數(shù)據(jù)不能夠直接比較,但是可以把它們進行標準化,然后再比較標準化后的數(shù)據(jù)。 一個標準化的方法是把原始觀測值(亦稱得分,score)和均值之差除以標準差;得到的度量稱為標準得分(standard score,又稱為z-score)。 即:數(shù)據(jù)的標準得分均值和標準差不同的數(shù)據(jù)不能夠直接比較,但是可以數(shù)據(jù)的標準得分然后可以比較來自不同樣本的標準得分。 這樣: 張穎的標準得分為 劉濤的標準得分為 顯然如果兩個班級水平差
19、不多,劉濤的成績應該優(yōu)于張穎的成績;這是在標準化之前的數(shù)據(jù)中不易看到的。 數(shù)據(jù)的標準得分然后可以比較來自不同樣本的標準得分。 原始數(shù)據(jù)是在各自的均值附近,散布也不一樣。但它們的標準得分則在0周圍散布,而且散布也差不多。 實際上,任何樣本經(jīng)過這樣的標準化后,就都變換成均值為0、方差為1的樣本。標準化后不同樣本觀測值的比較只有相對意義,沒有絕對意義。 統(tǒng)計學的基礎知識分解課件第三節(jié) 計數(shù)資料的統(tǒng)計描述第三節(jié) 計數(shù)資料的統(tǒng)計描述按年齡(2歲一組)與職業(yè)整理按年齡(2歲一組)與職業(yè)整理統(tǒng)計軟件的種類SPSS:這是一個很受歡迎的統(tǒng)計軟件;容易操作,輸出漂亮,功能齊全;對于非統(tǒng)計工作者是很好的選擇。 Ex
20、cel:作為數(shù)據(jù)表格軟件,有一定統(tǒng)計計算功能;對于簡單分析比較方便;對于較復雜的分析,需要使用函數(shù),甚至根本沒有相應的方法了。多數(shù)專門一些的統(tǒng)計推斷問題還需要其他專門的統(tǒng)計軟件來處理。統(tǒng)計軟件的種類SPSS:統(tǒng)計軟件的種類SAS:功能非常齊全的軟件;某些美國政府機構認可;需要一定的訓練才可以使用,對于非專業(yè)統(tǒng)計人員不那么方便。 S-plus:統(tǒng)計學家喜愛的軟件;其功能齊全,具有強大的編程功能;專業(yè)統(tǒng)計人員可以編制自己的程序來實現(xiàn)自己的理論和方法。統(tǒng)計軟件的種類SAS:統(tǒng)計軟件的種類Statistica:容易操作;統(tǒng)計資料分析、圖表、資料管理;應用程序開發(fā)。Origin:容易操作;輸出圖形的清晰
21、度高(很多雜志要求)。統(tǒng)計軟件的種類Statistica:第三節(jié) 常見的概率分布 一 概率的有關概念 二 概率分布概述三 離散型隨機變量的概率分布四 正態(tài)分布五 常用的抽樣分布第三節(jié) 常見的概率分布 一 概率的有關概念 二 概率分布一 概率的有關概念 一 概率的有關概念 樣本的實際發(fā)生率稱為頻率。設在相同條件下,獨立重復進行n次試驗,事件A出現(xiàn)f 次,則事件A出現(xiàn)的頻率為f/n。 概率:隨機事件發(fā)生的可能性大小,用大寫的P 表示;取值0,1。 樣本含量n越大,頻率的波動幅度越小,頻率越接近概率。 頻率與概率 frequency and probability 樣本的實際發(fā)生率稱為頻率。設在相同
22、條件下,獨立重復進必然事件 P = 1隨機事件 0 P 1不可能事件 P = 0 P 0.05(5)或P 0.01(1)稱為小概率事件(習慣),統(tǒng)計學上認為不大可能發(fā)生。隨機事件 Random eventsCertainImpossible0.501必然事件 P = 1隨機事件 Random 概率分布:描述隨機變量值xi及這些值對應概率P(X=xi)的表格、公式或圖形。 離散型隨機變量概率分布連續(xù)型隨機變量概率分布二 概率分布概述 概率分布:描述隨機變量值xi及這些值對應概率P(X=1. 離散型隨機變量的概率分布1. 離散型隨機變量的概率分布離散型隨機變量的概率分布(例一)f(x)離散型隨機變
23、量的概率分布(例一)f(x)離散型隨機變量的概率分布(例二)N=10, =0.2如新手上路某事件出錯的概率是0.2,連續(xù)進行10次這樣的事件,出現(xiàn)010次錯誤的概率分布: 離散型隨機變量的概率分布(例二)N=10, =0.2某事件2. 連續(xù)型隨機變量的概率分布 與離散型變量不同的是連續(xù)型變量的取值充滿整個數(shù)值區(qū)間,無法一一列出其每一個可能值。 一般將連續(xù)型隨機變量整理成頻數(shù)表,對頻數(shù)作直方圖,直方圖的每個矩形頂端連接的階梯形曲線來描述連續(xù)型變量的頻數(shù)分布。 2. 連續(xù)型隨機變量的概率分布 與離散型變量不同的是連統(tǒng)計學的基礎知識分解課件如果樣本量很大,組段很多,矩形頂端組成的階梯型曲線可變成光滑
24、的分布曲線。大多數(shù)情況下,可采用一個函數(shù)擬合這一光滑曲線。這種函數(shù)稱為概率密度函數(shù)(Probability density function,Pdf)。xxxfff如果樣本量很大,組段很多,矩形頂端組成的階梯型曲線可變成光滑如果連續(xù)型隨機變量X的概率密度函數(shù)記為:則在區(qū)間x1,x2 范圍內(nèi)的概率可由微積分函數(shù)定義 如果連續(xù)型隨機變量X的概率密度函數(shù)記為:三 離散型隨機變量的概率分布離散型隨機變量的分布1、二項分布2、泊松分布連續(xù)型隨機變量的分布正態(tài)分布三 離散型隨機變量的概率分布離散型隨機變量的分布1、二毒性試驗:白鼠 死亡生存臨床試驗:病人 治愈未愈臨床化驗:血清 陽性陰性任一事件 成功(A
25、)失?。ǚ茿)這類“成功失敗型”試驗稱為Bernoulli試驗。1、二項分布Binomial distribution毒性試驗:白鼠 死亡生存1、二項分布BinomBernoulli試驗序列n次Bernoulli試驗構成了Bernoulli試驗序列。 其特點(如拋硬幣)如下:(1) 每次試驗結果,只能是兩個互斥的結果之一(A或非A)。(2) 每次試驗的條件不變。即每次試驗中,結果A發(fā)生的概率不變,均為 。(3) 各次試驗獨立。即一次試驗出現(xiàn)什么樣的結果與前面已出現(xiàn)的結果無關。Bernoulli試驗序列n次Bernoulli試驗構成了B成功次數(shù)的概率分布二項分布例 設某毒理試驗采用白鼠共3只,它
26、們有相同的死亡概率,相應存活概率為1-。記試驗后白鼠死亡的例數(shù)為X,分別求X0、1、2和3的概率 成功次數(shù)的概率分布二項分布例 設某毒理試驗采用白鼠共3只白鼠各種試驗結果及其發(fā)生概率3只白鼠各種試驗結果及其發(fā)生概率統(tǒng)計學的基礎知識分解課件二項分布的概率計算=BINOMDIST(1,3,0.4,0)二項分布的概率計算=BINOMDIST(1,3,0.4,0)=0.5,正態(tài)0.5,左偏二項分布的特點=0.5,正態(tài)二項分布的特點2、 泊松分布當二項分布中n很大,很小時,二項分布就變成為Poisson分布,所以Poisson分布實際上是二項分布的極限分布。由二項分布的概率函數(shù)可得到泊松分布的概率函數(shù)為
27、:2、 泊松分布當二項分布中n很大,很小時,二項分布就變成為全部右偏越大越趨于正態(tài)PPoisson分布概率的特點全部右偏PPoisson分布概率的特點Poisson分布與正態(tài)分布及二項分布的關系當較小時, Poisson分布呈偏態(tài)分布,隨著增大,迅速接近正態(tài)分布,當20時,可以認為近似正態(tài)分布。Poisson分布是二項分布的特例,某現(xiàn)象的發(fā)生率很小,而樣本例數(shù)n很大時,則二項分布接近于Piosson分布。 n (應用: Poisson替代二項分布)Poisson分布與正態(tài)分布及二項分布的關系當較小時, 四 正態(tài)分布 正態(tài)分布(Normal distribution)也叫高斯分布(Gaussia
28、n distribution),是最常見、最重要的一種連續(xù)型分布。 1、正態(tài)分布的數(shù)學形式 2、正態(tài)曲線 3、標準正態(tài)分布 4、曲線下面積四 正態(tài)分布 正態(tài)分布(Normal di1、數(shù)學形式1、數(shù)學形式2、正態(tài)曲線( normal curve )圖形特點:鐘型中間高兩頭低左右對稱最高處對應于X軸的值就是均數(shù)曲線下面積為1標準差決定曲線的形狀Xf(X)m2、正態(tài)曲線( normal curve )圖形特點:Xf(N(,0.52)、N(,12)、N(,22) N(1 ,2)、N(2 ,2) 正態(tài)分布曲線由兩個參數(shù)決定,即總體均數(shù)和總體標準差。在不變的情況下,函數(shù)曲線形狀不變,若變大時,曲線位置向
29、右移;若變小時,曲線位置向左移,故稱為位置參數(shù)。在不變的情況下,函數(shù)曲線位置不變,若變大時,曲線形狀變的越來越“胖”和“矮”;若變小時,曲線形狀變的越來越“瘦”和“高”,故稱為形態(tài)參數(shù)或變異度參數(shù)。N(,0.52)、N(,12)、N(,22) N(13、標準正態(tài)分布 標準正態(tài)離差標準正態(tài)分布:N(0,1)正態(tài)分布: 3、標準正態(tài)分布 標準正態(tài)離差正態(tài)分布: 標準正態(tài)分布的概率密度函數(shù)實質(zhì)上就是正態(tài)分布的概率密度函數(shù)中=0,=1的情形。實質(zhì)上是作了一個坐標軸的平移和尺度變換,使正態(tài)分布具有平均數(shù)為=0,標準差=1。這種變換稱為標準化正態(tài)變換。因此將這種具有平均數(shù)為=0,標準差=1的正態(tài)分布稱為標
30、準正態(tài)分布,記為N(0,1)。標準正態(tài)分布的概率密度函數(shù)實質(zhì)上就是正態(tài)分布的概率密度函數(shù)中 4、曲線下面積u-累計概率分布函數(shù): 4、曲線下面積u-累計概率分布函數(shù):曲線下面積分布規(guī)律0-11-1.961.96-2.582.5868.27%95.00%99.00%-+-1.96+1.96-2.58+2.5868.27%95.00%99.00%曲線下面積分布規(guī)律0-11-1.961.96-2.582.5正態(tài)分布的特征,歸納起來有兩點: 對稱性(symmetry) 正態(tài)峰 (mesokurtosis) 偏度系數(shù)和峰度系數(shù)skewness and kurtosis 正態(tài)分布的特征,歸納起來有兩點:偏
31、度系數(shù)和峰度系數(shù)skew偏度 skewness若分布不對稱就是偏態(tài),長尾拖向右側(cè)(變量值較大的一側(cè))叫做正偏態(tài),或右偏態(tài);長尾拖向左側(cè)(變量值較小的一側(cè))叫做負偏態(tài),或左偏態(tài)。 正態(tài)分布時,mean、median、mode相等偏度 skewness若分布不對稱就是偏態(tài),長尾拖向右側(cè)(變偏度系數(shù)(skewness):若分布是以平均值對稱的,則偏度=0;若分布是右偏的,則偏度系數(shù) 0;若分布是左偏的,則偏度系數(shù) 0。偏度系數(shù)(skewness):若分布是以平均值對稱的,則偏度峰度系數(shù)是描述隨機變量陡峭度的參數(shù),分為:正態(tài)峰、平闊峰、尖峭峰 。峰度 kurtosis a.尖峭峰 b.正態(tài)峰c.平闊峰
32、峰度系數(shù)是描述隨機變量陡峭度的參數(shù),分為:正態(tài)峰、平闊峰、尖峰度系數(shù)(kurtosis):Skewness.088kurtosis-0.2215血清總膽固醇.sav峰度系數(shù)(kurtosis):Skewness.088ku正態(tài)分布在橫軸上方均數(shù)處最高。正態(tài)分布以均數(shù)為中心,左右對稱。正態(tài)分布由參數(shù)和確定。 是位置參數(shù),當不變時,越大,則曲線沿橫軸越向右移動;反之,越小,曲線沿橫軸越向左移動 是變異度參數(shù),當不變時,越大,表示數(shù)據(jù)越分散,曲線越平坦;越小,表示數(shù)據(jù)越集中,曲線越陡峭標準正態(tài)分布曲線與X軸所圍成的面積為1。在的區(qū)間內(nèi)占總面積的68.27%, 在1.96的區(qū)間內(nèi)占總面積的95%; 在
33、2.58的區(qū)間內(nèi)占總面積的99%。5、正態(tài)分布的特征 正態(tài)分布在橫軸上方均數(shù)處最高。5、正態(tài)分布的特征 五 常用的抽樣分布五 常用的抽樣分布如果總體不是正態(tài)總體,但其均數(shù)和標準差分別為和,則當樣本含量n不斷增大時,樣本均數(shù)的分布也趨近于正態(tài)分布,且其均數(shù)為,標準差為 不論總體的分布形式如何,只要樣本含量n足夠大時,樣本均數(shù)的分布就近似正態(tài)分布 ,此稱為中心極限定理。 1、 中心極限定理 如果總體不是正態(tài)總體,但其均數(shù)和標準差分別為和,則當樣本2、常用的三種抽樣分布t 分布F分布2分布 均為連續(xù)型隨機變量分布,分布只與自由度,即樣本含量有關。2、常用的三種抽樣分布t 分布均為連續(xù)型隨機變量分布,分布只t分布根據(jù)中心極限定理,當樣本含量足夠大時,對從均數(shù)為,標準差
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- epc合同范本 發(fā)票問題
- 兼職外教合同范本
- 小巷工程建設合同范本
- 醫(yī)院特聘專家聘用合同范本
- 廠房保密合同范例
- 專業(yè)技術合同范本
- 企業(yè)變更服務合同范本
- 單位和個人購銷合同范本
- 化工篩粉機銷售合同范本
- 南溪租房合同范例
- 中南財經(jīng)政法大學806經(jīng)濟學(宏、微觀)考試大綱解析
- 卵巢癌術后護理查房
- 三輪車售后服務合同
- 2019年10月自考00371公安決策學試題及答案含解析
- 剪映課件pptx-2024鮮版
- 產(chǎn)科麻醉專家共識
- 富氫水完整課件
- 學校食堂員工用電安全培訓
- GLB-2防孤島保護裝置試驗報告
- 2024年邵陽職業(yè)技術學院高職單招(英語/數(shù)學/語文)筆試歷年參考題庫含答案解析
- 非斜視性雙眼視異常的臨床分析與處理
評論
0/150
提交評論