




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第四章數據分布的特征和度量第一節(jié)分布的集中趨勢——數值平均數主要內容算術平均數中位數眾數幾何平均數和調和平均數下面是一個小故事:一個人到某公司求職,經過調查,得出關于該公司工資的一些數據,如果是你,應該如何選擇?撓頭的數值公司員工的月薪如下:我們有三種方法選擇集中趨勢:(1)根據頻數:哪個變量值出現次數越多,就選擇哪個變量值,比如民主決策的表決機制。(2)根據居中:比如一個城鎮(zhèn)居民的生活水平,居中的是小康家庭,那么就用小康家庭來代表該城鎮(zhèn)的生活水平。(3)根據平均:用平均數來代表變量的平均水平。關于集中趨勢的一個故事吉斯莫先生有一個小工廠,生產超級小玩意兒。管理人員由吉斯莫先生、他的弟弟、六個親戚組成。工作人員由5個領工和10個工人組成。工廠經營得很順利,現在需要一個新工人?,F在吉斯莫先生正在接見薩姆,談工作問題。吉斯莫:我們這里報酬不錯。平均薪金是每周300美元。你在學徒期間每周得75美元,不過很快就可以加工資。薩姆工作了幾天之后,要求見廠長。薩姆;你欺騙我!我已經找其他工人核對過了,沒有一個人的工資超過每周100元。平均工資怎么可能是一周300元呢?吉斯莫:啊,薩姆,不要激動。平均工資是300元。我要向你證明這一點。吉斯莫:這是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六個親戚每人得250元,五個領工每人得200元,10個工人每人100元。總共是每周6900元,付給23個人,對吧?薩姆:對,對,對!你是對的,平均工資是每周300元。可你還是蒙騙了我。吉斯莫;我不同意!你實在是不明白。我已經把工資列了個表,并告訴了你,工資的中位數是200元,可這不是平均工資,而是中等工資。薩姆:每周100元又是怎么回事呢?吉斯莫:那稱為眾數,是大多數人掙的工資。吉斯莫:老弟,你的問題是出在你不懂平均數、中位數和眾數之間的區(qū)別。薩姆:好,現在我可懂了。我……我辭職!一、統(tǒng)計平均數的含義與作用
(一)、統(tǒng)計平均數的含義表示社會經濟現象總體各單位某一標志在一定時間、地點條件下所達到的一般水平,亦即總體各單位標志值的差異抽象化,反映在具體條件下各單位標志值達到的一般水平。(二)、統(tǒng)計平均數的特點將數量差異抽象化只能用于同類現象的計算能反映總體變量的集中趨勢集中趨勢:總體各單位的次數分布從兩邊向中間集中的趨勢,也叫趨中性。(三)、平均指標的作用反映總體各單位變量分布的集中趨勢和一般水平比較同類現象在不同單位的發(fā)展水平比較同類現象在不同時期的發(fā)展變化趨勢和規(guī)律可用于分析現象之間的依存關系和進行數量的估算(四)、平均指標的兩大類別數值平均數(常用的有算術平均數、調和平均數、幾何平均數和冪平均數)位置平均數(常用的有中位數和眾數)二、算數平均數算術平均數的統(tǒng)計定義公式計算平均數的要求:總體標志總量必須是總體各單位標志值的總和,標志值和單位之間一一對應。實際上由于所掌握的統(tǒng)計資料不同,計算平均數有簡單算術平均數和加權算術平均數兩種。(一).簡單算術平均數(用于未分組資料或變量分配數列中,各組次數都相等的情況)
注意:對求和符號,此時流動腳標的變動范圍是1,2,3,…,N,如果為未分組資料,N為總體單位總數,如為次數相等的分組數列,N為組數。
[例]求74、85、69、9l、87、74、69這些數字的算術平均數。[解]
(二).加權算術平均數(用于分組資料中,各分組次數不同的情況)
注意:對求和符號,此時流動腳標的變動范圍是1,2,3…,n,n是組數,而不是總體單位數。很顯然,算術平均數不僅受各變量值(X)大小的影響,而且受各組單位數(頻數)的影響。由于對于總體的影響要由頻數(f)大小所決定,所以f也被稱為權數。值得注意的是,在統(tǒng)計計算中,權數不僅用來衡量總體中各標志值在總體中作用,同時反映了指標的結構,所以它有兩種表現形式:絕對數(頻數)和相對數(頻率)。這樣一來,在統(tǒng)計學中,凡對應于分組資料的計算式,都被稱為加權式。(1)、權數的意義和作用權數:各組次數(頻數)的大小所對應的標志值對平均數的影響具有權衡輕重的作用。當各組的次數都相同時,即當f1=f2=f3=…=fn時:加權算術平均數就等于簡單算術平均數。
(2)、權數的選擇一般來說,次數就是權數,但也有不合適的情況對于組距數列,要用每一組的組中值權充該組統(tǒng)一的變量值。[例]求下表所示數據的的算術平均數(三)、是非標志的平均數
(成數)在總體中,具有某種性質的單位占總體的比率為p,P也稱為總體中具有某種屬性的單位成數,是是非標志的平均數。不具有該種性質的單位占總體的比率為q。在總體中,將總體分為兩大類,一類為具有某種性質的單位,它的單位數用表示,另一類為不具有某種性質的單位,它的單位數用表示,他們的和為總體單位總數N,即,那么P的計算公式如下:是非標志的平均數主要是針對于品質數據而言,把品質標志性質上的差異過度到數量上的變異。(四)、算術平均數的數學性質(1)算術平均數與標志值個數的乘積等于各標志值的總和。簡單算術平均數:加權算術平均數:(2)各個標志值與其算術平均數的離差之和等于零。簡單算術平均數:加權算術平均數:(3)各標志值與算術平均數離差的平方和為最小值。三、調和平均數(不能有標志值為0)1.簡單調和平均數:標志值的倒數的算術平均數的倒數。
適用場合:各標志值對應的標志總量為一個單位或是相等的情況。n指標志值的項數2.加權調和平均數計算公式:在權數選擇合適時,加權調和平均數實際上是加權算術平均數的變形:當各組標志總量相等,m1=m2=…=mn時,加權調和平均數可化簡成為簡單調和平均數形式。3.平均數計算方法的選擇設:則:例:某商品在三個市場上的銷售情況四、幾何平均數G
(geometricmean)N個變量值連乘積的N次方根。(不能有變量值為0)。適用于:(1)計算某種比率的平均數;(2)計算大致具有幾何級數關系的一組數字的平均數,如經濟指標的平均發(fā)展速度。1、簡單幾何平均數(適用于為分組資料)對數式:(2)加權幾何平均數(適用于分組資料)
對數式:
應該指出,用以計算幾何平均數的各項數值必須大于0,否則就不能計算幾何平均數或計算結果無實際意義。
例一:某水泥生產企業(yè)1995的水泥為100萬噸,1996年與1995年相比增長9%,1997年比1996年增長16%、1998年比1997增長20%,求各年的平均增長率。
例二:某投資銀行某筆投資的年利率按復利計算,25年的年利率如下:
年利率發(fā)展速度年數
103%1
105%4
108%8
110%10
115%2五、冪平均數設有一組變量求各變量k次方的和:根據算術平均數的數學性質1,以冪平均代替各具體變量xi,其數值總和不變,則稱為k階冪平均數,當k取不同的整數值時,冪平均數就給出不同的數值平均數計算公式。
當k=1時,冪平均數,為算術平均數計算公式。當k=-1時,冪平均數,為調和平均數計算公式。當K趨近于0時,為幾何平均數計算公式。冪平均數的是關于k階的遞增函數,即冪平均數是隨著k的增大而增大,隨著k的減少而減少,當k1<k2時,就有:
因為算術平均數、幾何平均數、調和平均數都是冪平均數的k階數由1遞減為0又減為-1的特例,三者之間的一般數量關系為:調和平均數小于幾何平均數小于算術平均數;當各變量相等時,調和平均數等于幾何平均數等于算術平均數。第二節(jié)分布的集中趨勢—位置平均數一、眾數(Mode
)1.定義:眾數是指社會現象總體中最普遍出現的標志值。用Mo表示。
眾數只與次數有關,可以用于定類、定序、定距、定比資料。2.眾數的確定
1).對于未分組資料(直接觀察)首先,將所有數據順序排列;然后,只要觀察到某些變量值(與相鄰變量值相比較)出現的次數(或頻數)呈現“峰”值,這些變量值就是眾數。
2).對于分組資料單項式分配數列確定眾數:出現次數最多的標志值就是眾數。組距式分配數列確定眾數:由組距數列確定眾數,先確定眾數組,再通過一定的公式計算眾數的近似值。組距式數列確定眾數的公式下限公式:
上限公式:
求下表中的眾數眾數求下表中的眾數(1)眾數僅受上下相鄰兩組頻數大小的影響,不受極端值影響,對開口組仍可計算眾數;增強了變量數列的一般水平代表性。(2)受抽樣變動影響大;(3)眾數不唯一確定。(4)眾數標示為其峰值所對應的變量值,能很容易區(qū)分出單峰、多峰。因而具有明顯偏態(tài)集中趨勢、且總體單位較多的頻數分布,用眾數最合適。3.眾數的性質二、中位數1.定義:中位數是將總體各個單位按其標志值的大小順序排列,處于數列中點的那個單位的標志值,在總體中,標志值小于中位數的單位占一半;標志值大于中位數的單位也占一半。2.中位數的確定1)未分組資料確定中位數。將總體各單位的標志值按照大小順序排列,當總體單位數n為奇數時:當總體單位數n為偶數時,:例求54,65,78,66,43這些數字的中位數。例、求54,65,78,66,43,38這些數字的中位數。你會嗎?2)單項式分組資料確定中位數當為奇數時:,
當為偶數時,3)組距式分組資料確定中位數
當根據組距數列求中位數時,要采用所謂的比例值法:先根據N/2在累計頻數分布中找到中位數所在組,然后假定該組中各變量值是均勻分布的,再用以下任何一種方法求出中位數。下限公式:向上累計
上限公式:向下累計[例]某年級學生身高如下,求中位數3.中位數的性質(1)各變量值對中位數之差的絕對值總和,小于它們對任何其他數的絕對值總和。
(2)中位數不受極端值的影響。對某些不具有數學特點或不能用數字測定時可用中位數。
(3)分組資料有不確定組距時,仍可求得中位數。
(4)中位數受抽樣變動的影響較算術平均數略大。三.其他分位數
(一)四分位數
中位數所有單位被等分為兩部分,因而被稱為二分位數。類似于求中位數,我們還可求出四分位數、十分位數、百分位數。將總體中的各單位分割成相等的四部分,則這三個分割的變量值就是四分位數。若以Q1、Q2、Q3分別代表第一、第二、第三四分位數。Q2
即中位數,對于未分組數據,Q1、Q3即為1/4和3/4所對應的標志值;對于單項式分組,求累計頻數,找1/4和3/4位置所對應的Q1、Q3值;對于組距式分組,Q1、Q3的計算方法分別分別是:四、各種平均數的比較(一)數值平均數與位置平均數的比較
首先,數值平均數和位置平均數都是表明總體數據的集中趨勢和一般特征,都是屬于抽象化的代表值,但它們的代表性意義有所不同。數值平均數由總體中全部變量值參與計算,反映了所有數值的代表性水平,但它易受極端數值的影響,如果其中有若干極大或極小數值,就把它的平均數拉高或拉低了,與一般的趨勢產生了若干背離。而位置平均數是由數據在數列中的位置來決定的,極端數值的出現并不影響位置平均數總體的代表性,可能更能夠說明該數列的一般水平和趨勢。對兩類平均數的應用,應該根據統(tǒng)計研究目的和數據的特征,分別采用適合的方法加以分析。 其次,兩者所依據的統(tǒng)計資料屬性不同,各種數值平均數對數據的量化尺度要求只能應用定距數據和定比數據,而位置平均數則不同,它們還適用于各種定序尺度的數據,眾數甚至還適用于各種定類數據。(二).眾數、中位數和算術平均數的關系區(qū)別:1)
三者的含義不相同;2)
三者的計算(確定)方法不同;3)
對資料的要求不同,4)對數據的“靈敏度”、“抗耐性”和“概括能力”不同。聯系:(1)
三者都是作為反映總體一般水平(或集中趨勢)的平均指標:(2)
三者之間存在著一定的數量關系,A.在對稱的正態(tài)分布條件下:算術平均數等于眾數等于中位數:B.在非對稱正態(tài)分布的情況下,眾數、中位數和平均數三者的差別取決于偏斜的程度,偏斜的程度越大,它們之間的差別越大。(3)、皮爾生經驗法則分布在輕微偏斜的情況下,眾數、中位數和算術平均數數量關系的經驗公式為:(三)算術平均數、調和平均數和幾何平均數的關系假設有數據、,(),對這三者關系證明如下:令:
則:,即又則:,即由上可得,算術平均數≥幾何平均數≥調和平均數。第三節(jié)分布的離散趨勢一、變異指標的含義與作用1.定義:變異指標反映總體內部的離中趨勢或變異狀況。變異指標值越大,表明總體各單位標志的變異程度越大。2.作用:(1)衡量平均指標的代表性。(2)反映現象變動的均衡性。(3)研究總體標志值分布偏離正態(tài)的情況。(4)進行抽樣推斷等統(tǒng)計分析的一個基本指標。變異指標如按數量關系來分有以下兩類;凡用絕對數來表達的變異指標,統(tǒng)稱絕對離勢;凡用相對數來表達的變異指標,統(tǒng)稱相對離勢;主要有極差、平均差、四分位差、標準差等。主要有異眾比率、標準差系數、平均差系數和一些常用的偏態(tài)系數。二、極差1)極差也稱全距,它是統(tǒng)計總體中兩個極端標志值之差,表明總體中標志值變動的范圍。2)計算公式: (未分組及單項式) (分組) 式中:Umax代表最高組的上限;Lmin代表最低組的下限。3)特點:計算簡便,直觀易于理解。三、四分位差1)計算公式:數列的3/4位次與1/4位次的標志值之差。2)特點:四分位差避免了數列中極端值的影響,但去頭棄尾,丟失大量的原始數據。四、異眾比率() 它是指非眾數組的頻數與全部頻數之比,更多地用來反映定類尺度的眾數的代表性。其計算公式:
式中:是眾數組的次數,為變量值的總次數。五、平均差(A.D)1、定義:平均絕對偏差,總體所有單位的標志值與其平均數的離差絕對值的算術平均數。2、計算公式:3、特點:平均差是根據全部變量計算出來的,所以對整個變量的離散趨勢有較充分的代表性。因采取離差絕對值的方法來消除正負影響,不適合代數方法演算,其應用受到限制在實際應用中,平均數可用中位數代替,且以中位數為比較標準,計算出來的平均差為最小值。[例1]試分別以算術平均數為基準,求85,69,69,74,87,91,74這些數字的平均差。[例2]試以算術平均數為基準,求下表所示數據的平均差。
計算左邊數列的平均差六、方差與標準差(一)數量標志的方差與標準差1、數量標志方差與標準差的計算。其計算公式為:未分組的資料:方差:標準差:用分組資料計算方差:標準差2、總方差、組間方差和組內方差。在資料分組的條件下,總體各標志值對平均數的方差可以分解為組內方差和組間方差。其關系式:式中:代表總體方差;代表組內方差的平均數;代表組間方差。3、方差與標準差的數學性質:1)變量的方差等于變量平方的平均數減去變量平均數的平方。即:2)變量對其算術平均數的方差小于對任意常數的方差。因為,所以,當(x0為任意常數)時,3)n個同性質獨立變量和的方差等于各個變量方差的和。設:則:4)n個同性質獨立變量平均數的方差等于各變量方差平均數的1/n。設:則:
5)變量線性變換的方差等于變量的方差乘以變量系數的平方。設:則:(二)是非標志的方差與標準差七、變異系數1、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年同學聚會的主題方案策劃
- 2025年幼兒園12月份工作方案
- 2025年生產員工工作方案
- 勞務協(xié)議【適用于退休返聘人員】
- 2025年電動吊桿控制臺項目可行性研究報告
- 2025年琉璃瓦花飾項目可行性研究報告
- 2025年玻璃鋼隔離墩項目可行性研究報告
- 2025年玫瑰花蕾提取物項目可行性研究報告
- 2025年煮沸消毒設備項目可行性研究報告
- 廈門軟件職業(yè)技術學院《專業(yè)表現技法》2023-2024學年第二學期期末試卷
- (四調)武漢市2025屆高中畢業(yè)生四月調研考試 數學試卷(含答案詳解)
- 2024年中國礦產資源集團大數據有限公司招聘筆試真題
- 鼠疫防控知識宣傳課件
- 公路工程資料管理辦法
- 記者證考試心理素質試題及答案
- 3.1重組DNA技術的基本工具第1課時課件高二下學期生物人教版選擇性必修3
- 導學案:5.5 跨學科實踐:制作望遠鏡(學生版)
- 2025年河南機電職業(yè)學院單招職業(yè)技能測試題庫及參考答案
- 第11課《山地回憶》課件-2024-2025學年統(tǒng)編版語文七年級下冊
- 科學防癌預防先行
- 3.4蛋白質工程的原理和應用課件高二下學期生物人教版選擇性必修3
評論
0/150
提交評論