統(tǒng)計學:04 數據的概括性度量_第1頁
統(tǒng)計學:04 數據的概括性度量_第2頁
統(tǒng)計學:04 數據的概括性度量_第3頁
統(tǒng)計學:04 數據的概括性度量_第4頁
統(tǒng)計學:04 數據的概括性度量_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數據類型品質數據數值型數據匯總表原始數據分組數據時序數據多變量數據條形圖餅圖環(huán)形圖莖葉圖箱線圖直方圖線圖散點圖氣泡圖雷達圖數據的整理1.品質數據的整理:數據的分類2.數值型數據的整理:數據的分組上節(jié)內容總結第四章數據分布特征的測度統(tǒng)計學第四章數據分布特征的測度§4.1集中趨勢的測度§4.2離散程度的測度§4.3偏態(tài)與峰態(tài)的測度§4.1集中趨勢的測度4.1.1.分類數據:眾數4.1.2.順序數據:中位數和分位數4.1.3.數值型數據:平均數4.1.4.眾數、中位數和平均數的比較一.集中趨勢1.集中趨勢(Centraltendency)是指一組數據向其中心值靠攏的傾向和程度,它反映了一組數據中心點的位置所在。2.不同類型的數據用不同的集中趨勢測度值3.低層次數據的集中趨勢測度值適用于高層次的測量數據,反過來,高層次數據的集中趨勢測度值并不適用于低層次的測量數據4.選用哪一個測度值來反映數據的集中趨勢,要根據所掌握的數據的類型來確定4.1.1分類數據--眾數1.眾數是指一組數據中出現次數最多的變量值,用M0

表示,它是集中趨勢的測度值之一2.眾數主要用于分類數據,也可用于順序數據和數值型數據3.眾數是一個位置代表值,它不受極端值的影響。一組數據可能沒有眾數,也可能有幾個眾數。眾數(眾數的不唯一性)一個眾數

原始數據:567

9877多于一個眾數

原始數據:252828

36424248無眾數

原始數據:10591268一個眾數

原始數據:567

877分類數據的眾數(例題)【例4.1】根據第三章表3-4中的數據,計算“飲料品牌”眾數解:這里的變量為“飲料品牌”,是個分類變量,不同的品牌就是變量值。在所調查的50人中,購買碳酸飲料的人數最多,為15人,因此眾數為“可口可樂”這一品牌,即

Mo=碳酸飲料表3-4不同品牌飲料的頻數分布飲料品牌戶數(戶)百分比(%)

果汁礦泉水綠茶其他碳酸飲料610118151220221630合計50100順序數據的眾數(例題)【例4.2】根據第三章甲城市家庭對住房狀況評價的數據,計算眾數解:這里的數據為順序數據。變量為“回答類別”。甲城市中對住房表示不滿意的戶數最多,為108戶,因此眾數為“不滿意”這一類別,即

Mo=不滿意表3-6甲城市家庭對住房狀況評價的頻數分布回答類別甲城市戶數(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510合計300100.0順序數據的眾數表3-7乙城市家庭對住房狀況評價的頻數分布回答類別乙城市戶數(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意21997864387.033.026.021.312.7合計300100.0

根據第三章乙城市家庭對住房狀況評價的數據,計算眾數解:這里的數據為順序數據。變量為“回答類別”。乙城市中對住房表示不滿意的戶數最多,為99戶,因此眾數為“不滿意”這一類別,即

Mo=不滿意數值型數據的眾數(例題)【例4.3】在某城市中隨機抽取9個家庭,調查得到每個家庭的人均月收入數據如下(單位:元)。要求計算人均月收入的眾數。108075010801080850960200012501630解:人均月收入出現頻數最多的是1080,因此,眾數Mo=1080元。Excel中的統(tǒng)計函數:利用MODE函數可計算數值型數據的眾數。4.1.2順序數據:中位數和分位數在一組數據中,可以找出某個位置上的數據,這些位置上的數據就是相應的分位數,包括中位數、四分位數、十分位數、百分位數等。Me50%50%1.中位數(2)中位數主要用于測度順序數據的集中趨勢,也可用于數值型數據的集中趨勢,但不能用于分類數據的集中趨勢。(1)中位數是一組數據排序后處于中間位置上的變量值,用Me來表示。(3)中位數不受極端值的影響。中位數的位置確定未分組數據計算中位數的步驟:(1)對數據進行排序:(2)確定中位數的位置:(3)求出中位數的值:順序數據的中位數(例題)【例4.4】根據第三章甲城市家庭對住房狀況評價的數據,計算中位數解:這是順序數據。變量為“回答類別”。其中的五個選項即為變量值。由于變量值本身就是排序的,根據中位數的位置確定公式有:表3-6甲城市家庭對住房狀況評價的頻數分布回答類別甲城市戶數(戶)向上累積頻數

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300-順序數據的中位數(例題)表3-7乙城市家庭對住房狀況評價的頻數分布回答類別乙城市戶數(戶)向上累積頻數

非常不滿意

不滿意

一般

滿意

非常滿意219978643821120198262300合計300-

根據第三章乙城市家庭對住房狀況評價的數據,計算中位數解:這是順序數據。變量為“回答類別”。其中的五個選項即為變量值。由于變量值本身就是排序的,根據中位數的位置確定公式有:數值型數據的中位數(例題)【例4.5】在某城市中隨機抽取9個家庭,調查得到每個家庭的人均月收入數據如下(單位:元)。要求計算人均月收入的中位數。15007507801080850960200012501630解:先將上面的數據排序,結果如下:75078085096010801250150016302000所以中位數是1080,即Me=1080元。數值型數據的中位數(例題)如果數據個數為偶數時怎樣計算中位數。假定在例4.5中抽取了10個家庭,每個家庭的人均月收入數據排序后為:66075078085096010801250150016302000Excel中的統(tǒng)計函數:利用MEDIAN函數可計算數值型數據的中位數。四分位數中位數是從中間點將全部數據等分為兩部分。與中位數類似的還有四分位數、十分位數、百分位數等。它們分別是用3個點、9個點、99個點將數據4等分、10等分、100等分后各分位點上的值。2.四分位數四分位數也稱四分位點,它是一組數據排序后處于25%和75%位置上的值。四分位數是通過3個點將全部數據等分為4部分,其中每部分包含25%的數據。顯然,中間的四分位數就是中位數,因此通常所說的四分位數是指在25%位置上的數據(稱為下四分位數)和處在75%位置上的數據(稱為上四分位數)。QLMeQU25%25%25%25%四分位數的確定計算四分位數的步驟:(1)對數據進行排序:(2)確定四分位數的位置:(3)求出四分位數的值:如果位置是整數,四分位數就是該位置對應的值;如果是在0.5的位置上,則取該位置兩側的平均數;如果是在0.25或0.75的位置上,則四分位數等于該位置的下側值加上按比例分攤兩側的差值。數值型數據的四分位數(例題)【例4.6】在某城市中隨機抽取9個家庭,調查得到每個家庭的人均月收入數據如下(單位:元)。要求計算人均月收入的四分位數。75078085096010801250150016302000解:其他計算四分位數的方法(1)一種較為準確的算法:Excel中的統(tǒng)計函數:利用QUARTILE函數可計算數值型數據的四分位數。(2)以中位數為中心,從兩端再計算出中位數,確定位置的公式為:(3)Excel給出的四分位數位置的確定方法為:4.1.3數值型數據:平均數平均數也稱為均值,它是一組數據相加后除以數據的個數得到的結果。1.簡單平均數與加權平均數平均數是集中趨勢的最主要測度值,主要用于數值型數據,而不適用于分類數據和順序數據。(1)簡單平均數是指根據未經分組數據計算的平均數計算方法:4.1.3數值型數據:平均數(2)加權平均數是指根據分組數據計算的平均數。計算方法:注:加權平均數實際是假定了各組數據在組內是均勻分布的。4.1.3數值型數據:平均數例題【例4.7】根據下表中的數據,計算電腦銷售量的平均數。解:按銷量分組(臺)組中值fi頻數fiMifi140—1501454580150—16015591395160—170165162640170—180175274725180—190185203700190—200195173315200—210205102050210—22021581720220—2302254900230—24023551175合計—120222004.1.3數值型數據:平均數平均數在統(tǒng)計學中具有重要地位,它是進行統(tǒng)計分析和統(tǒng)計推斷的基礎。從統(tǒng)計思想上看,平均數是一組數據的重心所在,是數據誤差相互抵消的必然結果。Excel中的統(tǒng)計函數:利用AVERAGE函數可計算數值型數據的算術平均數。4.1.3數值型數據:幾何平均數2.幾何平均數幾何平均數(geometricmean)是n個變量值乘積的n次方根,用G表示。幾何平均數是適用于特殊的一種平均數,它主要用于計算比率的平均。當所掌握的變量值本身是比率的形式時,采用幾何平均數計算平均比率更為合理。在實際應用中,幾何平均數主要用于計算現象的平均增長率。Excel中的統(tǒng)計函數:利用GEOMEAN函數可計算數值型數據的幾何平均數。幾何平均數(例題分析)【例4.8】一位投資者購持有一種股票,在2001--2004年收益率分別為4.5%、2.1%、25.5%、1.9%。要求計算該投資者在這4年內的平均收益率。設平均收益為解:即該投資者的投資平均收益率為8.0787%。假定該投資者最初投入10000元,按各年的幾何平均收益率計算,2004年的本利和應為:幾何平均數(例題分析)如果按算術平均數計算,評價收益率則為:注:兩種算法相差214.02元,而這部分收益投資者按算術平均收益率計算,該投資者2004年的本利和應為:這說明,對于比率數據的平均采用幾何平均要比算術平均更為合理。是沒有拿到的。算術平均數與幾何平均數比較當所平均的各比率數值差別不大時,算術平均和幾何設開始的數值為逐年增加率為則第n年的數值為:從用n年,每年的增長率都相同,這個增長率到故上式為就是平均的結果相差不大,如果各比率的數值相差較大時,二者的差別就很明顯。4.1.4眾數、中位數和平均數的比較1.眾數、中位數和平均數的關系從分布的角度看,眾數始終是一組數據分布的最高峰值,中位數是處于一組數據中間位置上的值,而平均數則是全部數據的算術平均。左偏分布眾數、中位數、平均數具有以下關系:對稱分布右偏分布4.1.4眾數、中位數和平均數的比較2.眾數、中位數和平均數的特點和應用場合掌握眾數、中位數和平均數的特點,有助于在實際應用中選擇合理的測度值來描述數據的集中趨勢。(1)眾數是一組數據分布的峰值,它是一種位置代表值,不受極端值的影響。其缺點是具有不唯一性,一組數據可能有一個眾數,也可能有兩個或多個眾數,也可能沒有眾數。眾數只有在數據量較大時才有意義,當數據較少時,不宜使用眾數。雖然順序數據和數值型數據也可以計算眾數,但主要適合作為分類數據的集中趨勢測度值。4.1.4眾數、中位數和平均數的比較(2)中位數是一組數據中間位置上的代表值,不受數據極端值的影響。當一組數據的分布偏斜程度較大時,使用中位數也許是一個好的選擇。中位數主要適合作為順序數據的集中趨勢測度值。(3)平均數是對數值型數據計算的,而且利用了全部數據信息,它是實際中應用最廣泛的集中趨勢測度值。當數據呈對稱分布時,3個代表值相等或近似相等,這時則應選擇平均數作為集中趨勢的代表值。但平均數的主要缺點是易受數據極端值的影響,對于偏態(tài)分布的數據,平均數的代表性較差。因此,當數據為偏態(tài)分布,特別是當偏斜程度較大時,可以考慮選擇中位數或眾數,這時它們的代表性要比平均數好。數據類型與集中趨勢測度值(總結)表4-4數據類型和所適用的集中趨勢測度值數據類型分類數據順序數據數值型數據適用的測度值眾數中位數均值—四分位數幾何平均數—眾數

中位數——四分位數——眾數4.2離散程度的測度4.2.1.分類數據:異眾比率4.2.2.順序數據:四分位差4.2.3.數值型數據:方差及標準差4.2.4.相對離散程度:離散系數數據的分散程度(離中趨勢)是數據分布的另一個重要特征,它反映的是各變量值遠離其中心值的程度,數據的離散程度越大,集中趨勢的測度值對該組數據的代表性就越差;離散程度越小,其代表性就越好。描述數據離散程度采用的測度值,根據所依據數據類型的不同主要有異眾比率、四分位差、方差和標準差。此外,還有極差、平均差以及測度相對離散程度的離散系數等。4.2離散程度的測度4.2.1分類數據:異眾比率1.

異眾比率(variationratio)是指非眾數組的頻數占總頻數的比例,用Vr表示。2. 計算公式為3.異眾比率主要用于衡量眾數對一組數據的代表程度.異眾比率越大,說明非眾數組的頻數占總頻數的比重越大,眾數的代表性就越差;異眾比率越小,說明非眾數組的頻數占總頻數的比重越小,眾數的代表性就越好.4.異眾比率主要用于適合測度分類數據的離散程度,當然,對于順序數據以及數值型數據也可計算異眾比率.分類數據的異眾比率(例題)【例4.9】根據第三章表3-4中的數據,計算異眾比率解:這說明在所調查的50人當中,購買其他品牌飲料的人數占70%,異眾比率比較大。因此,用“碳酸飲料”代表消費者購買飲料品牌的狀況,其代表性不是很好表3-4不同品牌飲料的頻數分布飲料品牌戶數(戶)百分比(%)

果汁礦泉水綠茶其他碳酸飲料610118151220221630合計501004.2.2順序數據:四分位差1.四分位差(quartiledeviation)也稱內距或四分間距,它是指上四分位與下四分位之差,用Qd表示。3.四分位差反映了中間50%數據的離散程度,其數值越小,說明中間的數據越集中;其數值越大,說明中間的數據越分散。2.計算公式為4.四分位差不受極值的影響。順序數據的四分位差例題解:四分位差為:【例4.10】根據例4.6的計算結果,計算家庭人均月收入的四分位差。6.四分位差主要用于測度順序數據的離散程度,對于數值型數據也可計算四分位差,但不適合分類數據.5.由于中位數處于數據的中間位置,故四分位差的大小在一定程度上也說明了中位數對一組數據的代表程度。4.2.3數值型數據:方差和標準差測度數值型數據離散程度的方法主要有極差、平均差、方差和標準差,其中最常用的是方差和標準差。(2)計算公式為1.極差(1)極差(range)是指一組數據的最大值與最小值之差,也稱全距,用R表示。(3)極差是描述數據離散程度的最簡單測度值,計算簡單,易于理解,但它容易受極端值的影響。由于極差只是利用了一組數據兩端的信息,不能反映出中間數據的分散情況,因而不能準確描述出數據的分散程度。數值型數據:平均差(2)計算公式:2.平均差(1)平均差(meandeviation)也稱平均絕對離差,它是各變量值與其平均數離差絕對值的平均數,用Md表示.未分組數據分組數據數值型數據的平均差例題根據計算公式,得:【例4.11】根據第三章表3-9中的數據,計算電腦銷售量的平均差。解:頻數fi組中值Mi按銷量分組(臺)2040—120—合計250505235230—240160404225220—230240308215210—2202002010205200—2101701017195190—2000020185180—1902701027175170—1803202016165160—170270309155150—160160404145140—150數值型數據:平均差平均差以平均數為中心,反映了每個數據與平均數的平均差異程度,它能全面準確地反映一組數據的離散程度。平均差越大,說明數據的離散程度越大;反之,則說明數據的離散程度越小。為了避免離差之和等于零而無法計算平均差這一問題,平均差在計算時對離差取了絕對值,以離差的絕對值來表示總離差,這就給計算帶來了不便,因而實際中應用較少。但平均差的實際意義比較清楚,容易理解。Excel中的統(tǒng)計函數:利用AVEDEV函數可計算數值型數據的平均差。數值型數據:方差和標準差3.方差與標準差(1)方差(variance)是各變量值與平均數離差平方的平均數。它在數學處理上是通過平方的辦法消去離差正負號,然后再進行平均。(3)方差(或標準差)能較好地反映出數據的離散稱度,是實際中應用最廣泛的離散程度測度值。(2)標準差(standarddeviation)是方差的平方根。與方差不同的是,標準差是具有量綱的,它與變量值的計算單位相同,其實際意義要比方差清楚。因此,在對實際問題進行分析時更多地使用標準差。數值型數據:方差和標準差(4)樣本方差與樣本標準差的計算公式:未分組數據分組數據方差標準差數值型數據:方差和標準差(5)總體方差與總體標準差的計算公式:未分組數據分組數據方差標準差Excel中的統(tǒng)計函數:利用STDEV函數可計算數值型數據的樣本標準差。數值型數據:方差和標準差(6)自由度自由度(degreeoffreedom)是指附加給獨立的觀測值的約束或限制的個數。從字面含義來看,自由度是指一組數據中可以自由取值的個數。當樣本數據的個數為n時,若樣本平均數確定后,則附加給n個觀測值的約束個數就是1個,因此只有n-1個數據可以自由取值,其中必有一個數據不能自由取值。按照這一邏輯,如果對n個觀測值附加的約束個數為k個,自由度則為n-k。數值型數據:方差和標準差(7)樣本方差的自由度樣本方差的自由度是n-1,即樣本個數減1。因為在計算離差平方和時,必須先求出樣本平均數,而

則是附加給的一個約束,因此離差平方和只有n-1個獨立的觀測值,因不是n個。樣本方差用自由度去除,其原因可以從多方面來解釋,從實際應用的角度來看,在抽樣估計中,當我們用樣本方差去估計總體方差時,它是的無偏估計量。數值型數據的方差和標準差例題原始數據:10 591368解:數值型數據的方差和標準差例題根據計算公式,得:【例4.12】根據第三章表3-9中的數據,計算電腦銷售量的標準差。解:頻數fi組中值Mi按銷量分組(臺)55400—120—合計1250025005235230—240640016004225220—23072009008215210—220400040010205200—210170010017195190—2000020185180—190270010027175170—180640040016165160—17081009009155150—160640016004145140—150上節(jié)內容總結

統(tǒng)計表包括四部分:表頭、行標題、列標題、數字資料、附加說明統(tǒng)計表的結構數據的概括性度量1.集中趨勢度量分類數據:眾數順序數據:中位數分位數數值型數據:平均數2.離散程度的度量分類數據:異眾比率順序數據:四分位差數值型數據:極差平均差方差和標準差標準分數3.相對位置的度量有了平均數和標準差之后,可以計算一組數據中各個數值的標準分數,以測度每個數據在該組數據中的相對位置,并可以用它來判斷一組數據是否有離群數據。(1)標準分數標準分數(standardscore)是變量值與其平均值的離差除以標準差后的值,也稱標準化值或z分數。計算方法:注:標準分數給出了一組數據中各數值的相對位置。標準分數

比如,如果某個數值的標準分數為-1.5,就知道該數值低于平均數1.5倍的標準差。標準分數具有平均數為0,標準差為1的特性。實際上,z分數只是將原始數據進行了線性變換,它并沒有改變一個數據在該組數據中的位置,也沒有改變該組數據分布的形狀,而只是將該組數據變?yōu)槠骄鶖禐?,標準差為1。也是我們常用的統(tǒng)計標準化公式,在對多個具有不同量綱的變量進行處理時,常常需要對各變量進行標準化處理。標準分數

比如,一組數據為25,28,31,34,37,40,43其平均數為34,標準差為6。其變換如下圖所示:標準分數的例題9個家庭人均月收入標準化值計算表家庭編號人均月收入(元)標準分數z

123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996【例4.13】根據例4.5的數據,計算每個家庭人均月收入的標準分數。解:經驗法則(2)經驗法則當一組數據對稱分布時,經驗法則表明:約有68%的數據在平均數加減1個標準差的范圍之內。約有95%的數據在平均數加減2個標準差的范圍之內。約有99%的數據在平均數加減3個標準差的范圍之內。一組數據中低于或高于均值加減3倍標準差之外的數值是很少的,也就是說,在均值加減3個標準差的范圍內幾乎包含了全部數據。離群點(outlier)或異常值是指在3個標準差之外的數據。切比雪夫不等式經驗法則適合于對稱分布的數據。如果一組數據不是對稱分布,經驗法則就不再使用,這時可使用切比雪夫不等式,它對任何分布形狀的數據都適用。切比雪夫不等式提供的是“下界”對于任意分布形態(tài)的數據,根據切比雪夫不等式,至少有(1-1/k2)的數據落在是k個標準差之內。對于k=2,3,4,該不等式的含義是:①至少有75%的數據落在平均數加減2個標準差的范圍之內。②至少有89%的數據落在平均數加減3個標準差的范圍之內。③至少有94%的數據落在平均數加減4個標準差的范圍之內。(3)切比雪夫不等式(Chebyshev’sinequality)4.2.4相對離散程度:離散系數1.方差和標準差是反映數據分散程度的絕對值,其數值的大小一方面受原變量值本身水平高低的影響,也就是與變量的平均數大小有關,變量值絕對水平高的,離散程度的測度值自然也就大,絕對水平小的離散程度的測度值自然也就小;另一方面,它們與原變量值的計量單位相同,采用不同計量單位計量的變量值,其離散程度的測度值也就不同。因此,對于平均水平不同或計量單位不同的不同組別的變量值,是不能用標準差直接比較其離散程度的。2. 為消除數據水平高低和計量單位不同對離散程度測度值的影響,需要定義離散系數。4.2.4相對離散程度:離散系數3. 離散系數(或變異系數)(coefficientofvariation),它是一組數據的標準差與其相應的平均數之比。4. 計算公式5. 離散系數是測度數據離散程度的相對統(tǒng)計量,其作用主要是用于比較對不同樣本數據的離散程度。離散系數大,說明數據的離散程度也大;離散系數小,說明數據的離散程度也小。注:當平均數接近零時,離散系數的值趨于增大,此時必須慎重解釋。離散系數的例題【例4.14】在奧運會女子10米氣手槍比賽中,每個運動員首先進行每組10槍共4組的預賽,然后根據預賽總成績確定進入決賽的8名運動員。決賽時8名運動員再進行10槍射擊,再將預賽成績加上決賽成績以確定最后的名次。在2008年8月10日舉行的第29屆北京奧運會女子10米氣手槍決賽中,進入決賽的8名運動員的預賽成績和最后10槍的決賽成績如表所示。評價哪名運動員的發(fā)揮更穩(wěn)定。離散系數的例題姓名國家預賽成績納塔利婭.帕杰琳娜俄羅斯391108.51010.210.610.59.89.79.59.3郭文珺中國3901010.510.410.410.110.39.410.710.89.7卓各巴德拉赫.蒙赫珠勒蒙古3879.3108.78.39.29.58.510.79.29.2妮諾.薩盧克瓦澤格魯吉亞3869.810.3109.510.210.710.410.69.110.8維多利亞.柴卡白俄羅斯3849.39.410.410.110.210.59.210.59.88.6萊萬多夫斯卡.薩貢波蘭3848.110.39.29.99.810.49.99.410.79.6亞斯娜.舍卡里奇塞爾維亞38410.29.69.99.99.39.19.7109.39.9米拉.內萬蘇芬蘭3848.79.39.210.39.8109.79.99.99.7離散系數的例題解:如果各運動員決賽10槍的平均成績差異不大,可以直接比較標準差的大小,否則需要計算離散系數。姓名國家平均數標準差離散系數納塔利婭.帕杰琳娜俄羅斯9.810.61540.062737郭文珺中國10.230.43720.042746卓各巴德拉赫.蒙赫珠勒蒙古9.260.70740.076395妮諾.薩盧克瓦澤格魯吉亞10.140.54610.053856維多利亞.柴卡白俄羅斯9.80.64980.066305萊萬多夫斯卡.薩貢波蘭9.730.73340.075376亞斯娜.舍卡里奇塞爾維亞9.690.35730.036874米拉.內萬蘇芬蘭9.650.46250.047926數據類型與離散程度測度值表4-8數據類型和所適用的離散程度測度值數據類型分類數據順序數據數值型數據適用的測度值異眾比率四分位差

方差或標準差

—異眾比率離散系數(比較時用)——

平均差——

極差——

四分位差——

異眾比率4.3偏態(tài)與峰態(tài)的測度集中趨勢和離散程度是數據分布的兩個重要特征,但要全面了解數據分布的特點,還需要知道數據分布的形狀是否對稱、偏斜的程度以及分布的扁平程度等。4.3.1.偏態(tài)及其測度4.3.2.峰態(tài)及其測度4.3.1偏態(tài)及其測度1.偏態(tài)(skewness)一詞是由統(tǒng)計學家K.Pearson于1895年首次提出的,它是對數據分布對稱性的測度。2.偏態(tài)系數(coefficientofskewness)是測度偏態(tài)的統(tǒng)計量,記作SK。3.計算公式(樣本數據):未分組數據分組數據4.3.1偏態(tài)及其測度4.偏態(tài)系數說明:未分組數據分組數據4.3.1偏態(tài)及其測度5.計算公式(總體數據):未分組數據分組數據Excel中的統(tǒng)計函數:利用SKEW函數可計算數值型數據的偏態(tài)系數。數值型數據的偏態(tài)系數例題【例4.15】根據第3章表3-9中的數據,計算電腦銷售量的偏態(tài)系數。解:頻數fi組中值Mi按銷量分組(臺)540000—120—合計6250001250005235230—240256000640004225220—230216000270008215210—22080000800010205200—21017000100017195190—2000020185180—190-27000-100027175170—180-128000-800016165160—170-243000-270009155150—160-256000-64000

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論