版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
-.z.統計學原理教案第一章總論一、社會經濟統計的研究對象1、統計的涵義統計一詞在不同的場合可以有不同的涵義。統計有時指統計工作,即統計實踐活動,是對社會經濟現象的數量方面進展搜集、整理和分析的全過程;統計有時指統計資料,即通過統計工作過程所取得各項數據資料和與之相關的其他實際資料;統計有時指統計科學,即關于認識客觀現象數量特征和數量關系的原理原則和方式方法的科學。統計的三種涵義是密切聯系的。統計工作和統計資料是統計活動和統計成果的關系,統計學和統計工作是理論和實踐的關系。2、社會經濟統計學的研究對象社會經濟統計學的研究對象是社會經濟現象總體的數量特征和數量關系,通過這些數量方面的研究反映社會經濟現象開展變化的規(guī)律性。統計學和統計工作是理論和實踐的關系,它們所要認識的研究對象是一致的。3.社會經濟統計學研究對象的特點可概括為:社會性;總體性;變異性。二、統計工作過程及統計研究方法1、統計工作過程統計工作過程所包括的環(huán)節(jié)有統計設計、統計調查、統計整理、統計分析、統計資料的提供與開發(fā)。2、統計研究方法統計研究方法有大量觀察法、統計分組法、綜合指標法、統計模型法、歸納推斷法。三、國家統計的職能國家統計兼有信息職能、咨詢職能、監(jiān)視職能等三種職能。四、統計學的幾個根本概念及相互關系1、統計總體與總體單位統計總體是根據統計研究的任務目的所確定的研究事物的全體,是客觀存在的具有共同性質的個體所構成的整體。構成統計總體的個體單位稱總體單位。在一次特定圍、目的的統計研究中,統計總體與總體單位是不容混淆的,二者的含義是確切的,是包含與被包含的關系。但是隨著統計研究任務、目的及圍的變化,統計總體和總體單位可以相互轉化。統計總體同時具有大量性、同質性、變異性等特點。大量性是指構成總體的總體單位數要足夠的多,總體應由大量的總體單位所構成,大量性是對統計總體的根本要求;同質性是指總體中各單位至少有一個或一個以上不變標志,即至少有一個具有*一共同標志表現的標志,使它們可以結合起來構成總體,同質性是構成統計總體的前提條件;變異性就是指總體中各單位至少有一個或一個以上變異標志,即至少有一個不同標志表現的標志,作為所要研究問題的對象。變異性是統計研究的重點。2、標志與標志表現標志是說明總體單位所共同具有的屬性和特征的名稱。標志有品質標志和數量標志之分。品質標志說明總體單位的屬性特征,無法量化,如職工的性別、文化程度,企業(yè)的經濟成份,產品品牌等。數量標志說明總體單位的數量特征,能夠量化,如職工的工齡、工資水平,企業(yè)的職工數、總產值、總產量、勞動生產率等??傮w單位與統計標志是有區(qū)別的??傮w單位是統計標志的直接承當者,是載體;統計標志依附于總體單位并說明總體單位的屬性和特征。依附于*個總體單位的標志可以有多個。標志表現即標志特征在各單位的具體表現。如果說標志是統計所要調查的工程,則標志表現是調查所得結果,標志的實際表達。標志表現有品質標志表現和數量標志表現之分。品質標志表現只能用文字表述,因此不能轉化為統計指標,但對其對應的單位進展總計時就形成統計指標。數量標志表現是一具體數值,也稱標志值。就一個品質標志或數量標志而言,其具體表現可能多種多樣,不能將標志與標志表現混為一談。如對三個工人的月工資計算平均數,只能說是對三個標志表現或三個標志值〔變量值〕計算平均數,不能說對三個數量標志計算平均數,因為數量標志只有一個,即工人“月工資〞。3、變異與變量如果*一標志的具體表現在總體各單位一樣,則稱該標志為不變標志;如果*一標志的具體表現在各單位不盡一樣,則稱該標志為可變標志??勺儤酥镜臉酥颈憩F由一種狀態(tài)變到另一種狀態(tài),統計上把這種現象或過程稱變異。變異是一種普遍現象,有變異才有必要進展統計。變異有屬性變異和數量變異之分。屬性變異說明質的差異,數量變異說明量的差異。不變的數量標志稱常量或參數??勺兊臄盗繕酥竞退械慕y計指標稱變量。變量的數值表現稱變量值,即標志值或指標值。變量按其數值是否連續(xù)可分為連續(xù)性變量和離散性變量。連續(xù)性變量的數值是連續(xù)不斷的,任意兩個變量值之間可以做無數種分割,如工業(yè)總產值、商品銷售額、身高、體重等,既可用小數表示,也可用整數表示;離散變量的取值可以按一定次序一一列舉,如工廠數、工人數、機器臺數等,變量值通常用整數表示。4、統計指標和指標體系統計指標是反映社會經濟現象總體綜合數量特征的科學概念或疇。正確理解統計指標時應注意:①統計指標反映現象總體的數量特征;②一個完整的統計指標應該由總體圍、時間、地點、指標數值和數值單位等容構成。統計指標和統計標志是一對既有明顯區(qū)別又有密切聯系的概念。二者的主要區(qū)別是:①指標是說明總體特征的,標志是說明總體單位特征的;②指標具有可量性,無論是數量指標還是質量指標,都能用數值表示,而標志不一定。數量標志具有可量性,品質標志不具有可量性。標志和指標的主要聯系表現在:①指標值往往由數量標志值匯總而來;②在一定條件下,數量標志和指標存在著變換關系。統計指標按其反映的數量特點不同可分為數量指標和質量指標。數量指標是反映現象總規(guī)模水平或工作總量的指標,也稱總量指標,一般通過數量標志值直接匯總而來,用絕對數表示,指標數值均有單位;質量指標是反映現象總體相對水平或工作質量的統計指標,又分為相對指標和平均指標,分別用相對數和平均數表示,它們通常是由兩個總量指標比照派生出來的,反映現象之間在聯系和比照關系。數量指標和質量指標的關系表現在:數量指標是計算質量指標的根底,質量指標往往是相應的數量指標進展比照的結果。統計指標體系是各種互相聯系的指標群構成的整體,用以說明所研究的社會經濟現象各方面互相依從和互相制約的關系。一個指標的作用總是有限的,它只能反映現象總體的*一側面,只有使用指標體系才能反映現象總體全貌。統計指標體系大體上可分為根本統計指標體系和專題統計指標體系兩大類。第二章統計調查一、統計調查的根本任務和要求1、統計調查統計調查是按照預定的統計任務,運用科學的方法,有組織有方案地向客觀實際搜集資料的過程。統計調查既是對現象總體認識的開場,也是進展資料整理和分析的根底環(huán)節(jié)。2、統計調查的根本任務統計調查既是對現象總體認識的開場,也是進展資料整理和分析的根底環(huán)節(jié)。統計調查的根本任務是取得反映社會經濟現象總體全部或局部單位以數字資料為主體的信息。3、統計調查的根本要求統計調查的根本要準確性和及時性,是衡量統計工作質量的重要標志。二、統計調查方案統計調查方案是調查工作有方案、有組織、有系統進展的保證。統計調查方案應確定的容有:調查目的、調查對象、調查工程、調查表、調查時間和調查時限、調查的組織工作。1、調查目的確定調查目的是任何一項統計調查方案首先要解決的問題。不同的調查目的需要不同的調查資料,不同的調查資料又有不同的搜集方法。調查目的明確了,搜集資料的圍和方法也就確定下來了。2、調查對象調查對象即統計總體,是根據調查目的所確定的研究事物的全體。統計總體這一概念在統計調查階段稱調查對象。在確定調查對象時,還必須確定調查單位和報告單位。調查單位也就是總體單位,它是調查對象的組成要素,即調查對象所包含的具體單位。調查對象和調查單位的概念不是固定不變的,隨著調查目的的不同二者可以互相變換。報告單位也稱填報單位,也是調查對象的組成要素。它是提交調查資料的單位,一般是基層企事業(yè)組織。調查單位是調查資料的直接承當者,報告單位是調查資料的提交者,二者有時一致,有時不一致。如工業(yè)企業(yè)生產經營情況調查,每一工業(yè)企業(yè)既是調查單位,又是報告單位;工業(yè)企業(yè)職工收入狀況調查,每一職工是調查單位,每一工業(yè)企業(yè)是報告單位。3、調查工程調查工程即依附于調查單位〔總體單位〕的統計標志,其標志表現就是統計調查所得的資料。確定調查工程時,首先應注意所選擇的工程能夠取得確切資料,其次注意所選擇的工程應有確切的涵義和統一解釋,另外要注意各工程之間的聯系和銜接,便于核對和分析。4、調查表調查表是用來表現調查工程的表格,其目的是保證統計資料的規(guī)化和標準化。調查表有單一表和一覽表兩種形式。單一表是一個調查單位填寫一份表格,可以容納較多的工程。一覽表是許多調查單位共同填寫一份表格,在調查工程不多時較為簡便,且便于合計和核對過失。為了正確填寫調查表,須附有填表說明和工程解釋。5、調查時間和時限調查時間指調查資料所屬時間。如果調查的是時期現象,調查時間是資料所反映的起訖時間;如果調查的是時點現象,調查時間是統一規(guī)定的標準時點。調查時限是進展調查工作的期限,包括搜集資料和報送資料的整個工作所需要的時間。如*管理局要求所屬企業(yè)在1996年1月底上報95年工業(yè)總產值資料,則調查時間是一年,調查時限是一個月;又如*管理局要求所屬企業(yè)在96年1月10日上報95年產成品庫存資料,則調查時間是標準時間1995年12月31日,調查期限是10天。6、調查的組織工作調查的組織工作包括明確調查機構、調查地點、選擇調查的組織形式等問題。三、統計調查的種類1、統計調查按組織形式,可分為統計報表和專門調查。統計報表是國家統計系統和專業(yè)部門為了定期取得系統、全面的統計資料而采用的一種搜集資料的方式,目的在于掌握經常變動的、對國民經濟有重大意義的指標的統計資料。專門調查是為了了解和研究*種情況或問題而專門組織的統計調查,包括抽樣調查、普查、重點調查和典型調查等幾種調查方法。2、統計調查按研究總體的圍,可分為全面調查和非全面調查。全面調查是對構成調查對象的所有單位進展逐一的、無一遺漏的調查,包括全面統計報表和普查;非全面調查是對調查對象中的一局部單位進展調查,包括非全面統計報表、抽樣調查、重點調查和典型調查。3、統計調查按調查登記的時間是否連續(xù),分為連續(xù)調查和非連續(xù)調查。連續(xù)調查是指對研究對象的變化進展連續(xù)不斷的登記,如工業(yè)企業(yè)總產值、產品產量、原材料消耗量等,在觀察期連續(xù)登記。連續(xù)調查所得資料是現象在一段時間的總量。不連續(xù)調查是指間隔一段相當長的時間對研究對象*一時刻的資料進展登記。如人口數、機器設備臺數等資料短期變化不大,沒有必要連續(xù)登記資料。不連續(xù)調查所得資料表達現象在*一瞬間所具有的水平。4、統計調查按搜集資料的方法分為直接調查、憑證調查、派員調查、問卷調查。直接調查又稱直接觀察,由調查人員到現場對調查單位直接查看、測量和計量;憑證調查是以各種原始和核算憑證為調查資料來源,依照統一的表格形式和要求,按照隸屬關系,逐級向有關部門提供資料的方法;采訪調查是通過指派調查員對被調查者詢問、采訪,提出所要了解的問題,借以搜集資料;問卷調查是以問卷形式提問。此外,也有人根據調查工作時間的周期長短,將統計調查劃分為經常性調查和一次性調查。所謂經常性調查是指調查周期在一年以的調查,間隔超過一年的為一次性調查。這種劃分和調查對象沒有關系,不要把經常性調查誤以為是全面調查,也不要誤以為經常性調查就是調查時期現象,而一次性調查就是調查時點現象。四、統計調查方法常用的統計調查方法有統計報表、普查、抽樣調查、重點調查、典型調查等,它們各有其特點。1994年全國統計工作會議提出要建立以必要的周期性普查為根底,經常性的抽樣調查為主體,同時輔之以重點調查、科學推算和少量的全面報表綜合運用的統計調查方法體系。1、統計報表統計報表是按國家統一規(guī)定的表式,統一的指標工程,統一的報送時間,自下而上逐級定期提供根本統計資料的調查方式方法。我國大多數統計報表要求調查對象全部單位填報,屬于全面調查疇,所以又稱全面統計報表。統計報表具有統一性、全面性、周期性、可靠性等特點。目前我國統計報表,是由國家統計報表、業(yè)務部門統計報表和地方統計報表組成,其中國家統計報表是統計報表體系的根本局部。2、普查普查是專門組織的不連續(xù)性全面調查。主要調查一定時點狀況的社會經濟現象的總量,搜集那些不能夠或者不適宜用定期全面報表搜集的統計資料,以搞清重要的國情國力。普查的主要特點是不連續(xù)調查。普查的組織形式有兩種:一是組織專門的普查機構,配備一定數量的普查人員,對調查單位直接進展登記;另一種是利用普查單位的原始記錄和核算資料,頒發(fā)一定的調查表格由調查單位自填上報。普查按資料匯總的特點分為一般普查和快速普查。前者逐級上報資料,后者越過中間環(huán)節(jié),由基層單位將資料直接報送給最高領導機關。普查和全面統計報表都屬于全面調查,但二者并不能互相代替。普查屬于不連續(xù)調查,調查容主要是反映國情國力方面的根本統計資料;而全面統計報表屬于連續(xù)調查,調查容主要是需要經常掌握的各種統計資料。全面統計報表要經常填報,因此報表容固定,調查工程較少;而普查是專門組織的一次性調查,在調查時可以包括更多的單位、分組更細、工程更多。因此,有些社會經濟現象不可能也不需要進展經常調查,但又需要掌握比擬全面、詳細的資料時,就可通過普查來解決。普查花費的人力、物力和時間較多,不宜經常組織,取得經常性的統計資料還需要靠全面統計報表。3、抽樣調查抽樣調查是按隨機原則從總體中選取一局部單位進展觀察,用以推算總體數量的一種非全面調查。抽樣調查的特點:①既是非全面調查,又要到達對總體數量特征的認識;②按隨機原則去抽取調查單位。抽樣調查具有經濟性、時效性、準確性、靈活性等特點。抽樣調查的作用:一是能夠解決全面調查無法或難以解決的問題;二是可以補充和訂正全面調查的結果,三是可用于生產過程中產品質量的檢查和控制,四是可用于對總體的*種假設進展檢驗。抽樣調查是非全面調查中最完善、最有科學根據的方式方法。抽樣調查的根本形式有簡單隨機抽樣、類型隨機抽樣、等距抽樣、整群抽樣。4、重點調查重點調查是專門組織的一種非全面調查,它是對所要調查的全部單位選擇一部份重點單位進展調查。重點調查的關鍵是選擇好重點單位。所謂重點單位,是從標志量的方面而言的,盡管這些單位在全部單位中只是一局部,但這些單位的*一主要標志量占總體單位標志總量的絕大比重。對這些單位進展調查,就可以了解調查對象的根本情況。重點調查中重點單位的選擇著眼于標志量的比重,因而重點單位的選擇具有客觀性。當調查目的是掌握現象的根本情況,而局部單位又能比擬集中地反映所研究的工程和指標時,可用重點調查。重點調查可以定期進展,也可以不定期進展,重點調查實際上是圍比擬小的全面調查,它的目的是反映現象總體的根本情況。抽樣調查和重點調查都是專門組織的非全面調查,具有調查單位少,省時省力的特點,在選取調查單位時不受主觀因素的影響。但二者之間有明顯的區(qū)別:首先是調查單位的意義和取得方式不同,重點調查是選擇為數不多但標志量占總體標志總量絕大比重的單位進展調查;抽樣調查中的樣本單位是按照隨機原則從研究總體中抽取的、具有較高代表性。其次,二者研究目的不同。重點調查是為了了解現象總體的根本情況,但不能推斷總體總量;抽樣調查的目的在于以樣本量來推斷總體總量。再次,適用場合不同。重點調查適用于局部單位能比擬集中地反映所研究的工程或指標的場合;抽樣調查最適合于不能或很難進展全面調查,而又需要全面數值的場合,在能進展全面調查的場合也有獨到的作用。5、典型調查典型調查是根據調查的任務目的,對所研究的現象總體進展初步分析的根底上,有意識的選擇假設干具有代表性的單位進展調查,借以認識事物開展變化的規(guī)律。典型調查的特點一是深入細致的調查,既可以搜集數字資料,又可以搜集不能用數字反映的實際情況;二是調查單位是有意識的選擇出來的假設干有代表性的單位,它更多地取決于調查者的主觀判斷和決策。典型調查和重點調查相比,前者調查單位的選擇取決于調查者的主觀判斷,后者調查單位的選擇具有客觀性;前者在一定條件下可以用典型單位的量推斷總體總量,后者不具備用重點單位的量推斷總體總量的條件。典型調查在做總體數量上的推斷時無法估計誤差,推斷結果只是一個近似值。抽樣調查和重點調查、典型調查的根本區(qū)別就在于選取調查單位的方法不同。五、各種調查方式的結合運用不同的統計調查的方式方法,各有其特點和作用。在實際工作中,并非單用一種方式方法,而是多種方式方法的結合運用。這是因為:①國民經濟和社會開展情況復雜,國民經濟門類眾多,必須應用多種多樣的統計調查方法,才能搜集到豐富的統計資料;②任何一種統計調查方法,都有它的優(yōu)越性與局限性,各有不同的實施條件,只用一種統計調查方法,不能滿足多種需要。第三章統計整理一、統計整理的概念和容1、統計整理根據統計研究的任務與要求,對統計調查所搜集到的原始資料進展分組、匯總,使其條理化、系統化的工作過程稱統計整理。統計整理包括對原始資料和次級資料的整理。統計整理是統計調查的繼續(xù),是統計分析的前提和根底,在整個統計工作中發(fā)揮著承上啟下的作用。2、統計整理的意義通過統計調查所取得的總體各單位的資料是零星的,分散的,只能說明總體單位的情況,而不能反映總體特征。統計整理對調查資料進展科學加工,使之系統化,成為說明總體特征的綜合資料,實現了由反映總體單位特征的標志向反映總體綜合數量特征的統計指標的轉化,是從對社會經濟現象個體量的觀察到對社會經濟現象總體量的認識的連接點,是人們對社會經濟現象從感性認識到理性認識的過渡階段。統計整理在整個統計工作中發(fā)揮著承上啟下的作用。3、統計整理的方法統計整理的方法是分組、匯總和編表。分組是根據研究任務的要求,對調查所得的原始資料,確定哪些分組或分類。統計分組是統計整理的關鍵。匯總是在統計分組的根底上,把總體單位各種標志的標志值匯總起來,匯總主要有手工匯總和電子計算機匯總。編表是把匯總的資料按一定的規(guī)則在表格上表現出來。4、統計整理的容和步驟〔1〕確定應整理的指標和確定應分的組;〔2〕對各項指標進展匯總,確定各組和總體的單位數和標志總量;〔3〕用統計表現分組、匯總的結果。二、統計分組1、統計分組的意義根據統計研究任務的要求和研究現象總體的在特點,把現象總體按*一標志劃分為假設干性質不同但又有聯系的幾個局部稱統計分組??傮w的變異性是統計分組的客觀依據。統計分組是總體進展的一種定性分類,它把總體劃分為一個個性質不同的圍更小的總體。2、統計分組的種類①統計分組按其任務和作用不同,分為類型分組、構造分組和分析分組。類型分組的目的是劃分經濟類型,構造分類的目的是研究同質總體的構成,分析分組的目的是研究現象總體部諸標志間的依從和制約關系。②統計分組按分組標志的多少分為簡單分組和復合分組。簡單分組是將總體按一個標志進展分組,復合分組是將總體按兩個或兩個以上的標志重疊起來進展分組。③統計分組按分組標志的性質分為品質分組和變量分組。品質分組是將總體按品質標志進展分組,如企業(yè)按經濟成份、地理位置分組,職工按性別、文化程度分組等;變量分組是將總體按數量標志進展分組,如企業(yè)按職工人數、勞動生產率分組,職工按工齡、工資分組等。3、分組體系與分組標志的選擇①分組體系統計分組后所形成的一系列互相聯系、互相補充的組的整體稱分組體系。分組體系有平行分組體系和復合分組體系兩種。平行分組體系是選擇兩個或兩個以上的標志對總體進展一次次簡單分組后所形成的體系;復合分組體系就是復合分組后形成的體系。②分組標志的選擇分組標志的選擇是統計分組的關鍵。分組標志,即將同質總體區(qū)分為不同組的標準或依據。分組標志一旦選定,就必然突出了總體在該標志下的性質差異,其他的差異看不見了。分組標志選擇不當,不但無法顯示現象的根本特征,甚至會混淆事物的性質,歪曲社會經濟的真實情況。正確選擇分組標志,必須根據統計研究的任務目的,抓住反映現象本質區(qū)別和在聯系的標志作為分組標志。4、統計分組的方法〔1〕品質標志分組方法品質標志分組一般較簡單,分組標志一旦確定,組數、組名、組與組之間的界限也就確定。有些復雜的品質標志分組可根據統一規(guī)定的劃分標準和分類目錄進展。〔2〕數量標質分組方法按數量標志分組的目的并不是單純確定各組在數量上的差異,而是要通過數量上的變化來區(qū)分各組的不同類型和性質。數量標志分組方法從以下幾個方面來說明:①單項式分組和組距式分組對離散變量,如果變量值的變動幅度小,就可以一個變量值對應一組,稱單項式分組。如居民家庭按兒童數或人口數分組,均可采用單項式分組。離散變量如果變量值的變動幅度很大,變量值的個數很多,則把整個變量值依次劃分為幾個區(qū)間,各個變量值則按其大小確定所歸并的區(qū)間,區(qū)間的距離稱為組距,這樣的分組稱為組距式分組。也就是說,離散變量根據情況既可用單項式分組,也可用組距式分組。在組距式分組中,相鄰組既可以有確定的上下限,也可將相鄰組的組限重疊。連續(xù)變量由于不能一一列舉其變量值,只能采用組距式的分組方式,且相鄰的組限必須重疊。如以總產值、商品銷售額、勞動生產率、工資等為標志進展分組,就只能是相鄰組限重疊的組距式分組。在相鄰組組限重疊的組距式分組中,假設*單位的標志值正好等于相鄰兩組的上下限的數值時,一般把此值歸并到作為下限的那一組〔適用于連續(xù)變量和離散變量〕。組距式分組使資料的真實性受到一定程度的損害。組距式分組的假定條件是:變量在各組的分布都是均勻的〔即各組標志值呈線性變化〕。通過組距式分組以后,把各組部各單位的次要差異抽象去了,而把各組之間的主要差異突出出來,這樣,各組分配的規(guī)律性可以更容易顯示出來。根據這個道理,如組距太小,分組過細,容易將屬于同類的單位劃分到不同的組,因而顯示不出現象類型的特點;但如果組距太大,組數太少,會把不同性質的單位歸并到同一組中,失去區(qū)分事物的界限,達不到正確反映客觀事實的目的。因此,組距的大小、組數確實定應根據研究對象的經濟容和標志值的分散程度等因素,不可強求一致。②等距分組和不等距分組等距分組是各組保持相等的組距,也就是說各組標志值的變動都限于一樣的圍。不等距分組即各組組距不相等的分組。統計分組時采用等距分組還是不等距分組,取決于研究對象的性質特點。在標志值變動比擬均勻的情況下宜采用等距分組。等距分組便于各組單位數和標志值直接比擬,也便于計算各項綜合指標。在標志值變動很不均勻的情況下宜采用不等距分組。不等距分組有時更能說明現象的本質特征。③組限和組中值組距兩端的數值稱組限。其中,每組的起點數值稱為下限,每組的終點數值稱為上限。上限和下限的差稱組距,表示各組標志值變動的圍。各組標志值的平均數,各組標志數的平均數在統計分組后很難計算出來,就常以組中值近似代替。組中值僅存在于組距式分組數列中,單項式分組中不存在組中值。組中值的計算是有假定條件的,即假定各組標志值的變化是均勻的〔與組距式分組的假定條件一樣〕。一般情況下,組中值=〔上限+下限〕÷2對于第一組是“多少以下〞,最后一組是“多少以上〞的開口組,組中值的計算可參照鄰組的組距來決定。即:缺下限開口組組中值=上限—1/2鄰組組距,缺上限開口組組中值=下限+1/2鄰組組距。三、統計分布〔分配數列〕1、分配數列的概念、構成要素在統計分組的根底上,列出各組對應的單位數,形成總體單位數在各個組的分布,稱統計分布,又稱分配數列或次數分布。分配數列包括兩個要素:總體按*標志所分的組和各組對應的單位數〔頻數〕2、分配數列的類型分配數列包括品質分配數列和變量分配數列,分別由品質標志分組和數量標志分組形成。變量數列又有單項式數列和組距式數列,分別由單項式分組和組距式分組形成。3、頻數和頻率統計分組后各組對應的單位數稱頻數,也叫次數;各組單位數占總體單位總數的比重稱頻率。各組的頻率大于0,所有組的頻率總和等于1。在變量分配數列中,頻數〔頻率〕說明對應組標志值的作用程度。頻數〔頻率〕數值越大說明該組標志值對于總體水平所起的作用也越大,反之,頻數〔頻率〕數值越小,說明該組標志值對于總體水平所起的作用越小。組距數列中,影響各組次數分布的要素是組數、組距、組限和組中值。
有時為了更簡便地概括總體各單位的分布特征,還需要編制累計頻數數列和累計頻率數列。累計有向上累計和向下累計的方法。向上累計是指將各組頻數和頻率由變量值低的組向變量值高的組累計,說明在這些數值以下所有數值所占的比重;向下累計是指將各組頻數和頻率由變量值高的組向變量值低的組累計,說明在這些數值以上所有數值所占的比重?!卜植紨盗小辰M別各組單位數比重〔%〕…〔頻數或次數〕〔頻率〕………………品質數列—按品質標志分組形成的分配數列變量數列—按數量標志分組形成的分配數列變量數列的編制步驟將原始資料順序排序,確定變量值的變動圍;確定組數、組距、組限;匯總,計算各組單位數,各組單位數所占比重,以及各組的累計頻數和累計頻率等;編制統計表例如:*班級40名學生學習成績分組資料按成績分組學生人數比重〔%〕60以下37.560-70615.070-801537.580-901230.090-100410.0合計40100例如:*車間40名工人完成生產方案百分數資料:90,65,100,102,100,104,112,120,124,98,110,110,120,120,114,100,109,119,123,107,110,99,132,135,107,107,109,102,102,101,110,109,107,103,103,102,102,102,104,104按完成方案百分數分組〔%〕工人數比重〔%〕90以下12.590-10037.5100-1102255.0110-120717.5120-130512.5130-14025.0合計40100按完成方案百分數分組〔%〕向上累計工人數向上累計比重〔%〕90以下12.590-100410100-1102665110-1203382.5120-1303895130-14040100合計————進展向下累計。按完成方案百分數分組〔%〕向下累計工人數向下累計比重〔%〕90以下4010090-1003997.5100-1103690110-1201435120-130717.5130-14025合計————4、次數分布特征現象總體的性質不同,其次數分布也不同。歸納起來主要有四種類型:①鐘型分布特征是“兩頭大,中間小〞,即靠近中間的變量值分布的次數多,靠近兩邊的變量分布次數少,形假設古鐘。②U型分布其特征與鐘型分布正相反,靠近中間的變量值分布的次數少,靠近兩端的變量值分布次數多,形成“兩頭大,中間小〞的U字型分布。如人口死亡現象按年齡分布便是如此。③J型分布在社會經濟現象中,一些統計總體分布曲線呈J型。④洛倫茲分布洛倫茲曲線專門用以檢定社會收入分配的平等程度。洛倫茲曲線拓展可運用于其他社會經濟現象,研究總體各單位標志分布集中狀況或平均性。洛倫茲曲線又稱集中曲線,其運作的條件是:現象總體各組頻率與相應的各組標志總量的比重。5、變量分配數列編制的步驟〔3,3,5〕①將原始資料按其數值大小重新排列只有把得到的原始資料按其數值大小重新排列順序,才能看出變量分布的集中趨勢和特點,為確定全距、組距和組數作準備。②確定全距全距是變量值中最大值和最小值的差數。確定全距,主要是確定變量值的變動圍和變動幅度。如果是變動幅度不大的離散變量,即可編制單項式變量數列,如果是變量幅度較大的離散變量或者是連續(xù)變量,就要編制組距式變量數列。③確定組距和組數前面已經介紹過組距數列有等距和不等距之分,應視研究對象的特點和研究目的而定。組距的大小和組數的多少,是互為條件和互相制約的。當全距一定時,組距大,組數就少;組距小,組數就多。在實際應用中,組距應是整數,最好是5或10的整倍數。在確定組距時,必須考慮原始資料的分布狀況和集中程度,注意組距的同質性,尤其是對帶有根本性的質量界限,絕不能混淆,否則就失去分組的意義。在等距分組條件下,存在以下關系:組數=全距/組距④確定組限組限要根據變量的性質來確定。如果變量值相對集中,無特大或特小的極端數值時,則采用閉口式,使最小組和最大組也都有下限和上限;反之,如果變量值相比照擬分散,則采用開口式,使最小組只有上限〔用“**以下〞表示〕,最大組只有下限〔用“**以上表示〕。如果是離散型變量,可根據具體情況采用不重疊組限或重疊組限的表示方法,而連續(xù)型變量則只能用重疊組限來表示。在采用閉口式時,應做到最小組的下限低于最小變量值,最大組的上限高于最大變量值,但不要過于懸殊。⑤編制變量數列經過統計分組,明確了全距、組距、組數和組限及組限表示方法以后,就可以把變量值歸類排列,最后把各組單位數經綜合后填入相應的各組次數欄中。四、統計表1、統計表的概念、構成統計表是縱橫穿插的線條所繪制表現統計資料的一種表格形式。廣義統計表包括統計工作各階段所使用的一切表格。從形式上看,統計表是由總標題,橫行標題、縱欄標題和指標數值四局部組成;沉著上看,統計表是由主詞和賓詞兩局部構成。主詞是統計表要說明的總體或總體分成的多個組,賓詞是說明主詞的統計指標。2、統計表的種類統計表根據主詞是否分組及分組情況分為簡單表、簡單分組表和復合分組表;統計表按作用不同分為調查表、匯總表和分析表。表標題縱欄標題指標數值橫行標題統計表的類型:簡單表〔不分組〕 簡單分組表復合分組表統計表的設計及填寫要規(guī)各項標題應簡明確切;容應簡明扼要;各欄目按邏輯順序依次排列,可編號;左右開口,同一欄數字對齊;缺數字用···,不存在數據用——;注明計量單位;需要時注明資料來源。等等。四、統計圖 用統計圖可以更直觀、更形象地表示統計資料。常用的統計圖有直方圖、折線圖、曲線圖、餅圖等,有平面圖,也有立體圖。直方圖折線圖餅圖柱形圖曲線圖直方圖直方圖第四章綜合指標一、總量指標1、總量指標的概念總量指標又稱統計絕對數,它是反映社會經濟現象開展的總規(guī)模、總水平的綜合指標。2、總量指標的種類總量指標的種類有以下幾種劃分方法:按其反映總體容的不同,分為總體單位總量和總體標志總量,前者是總體所有單位的總數,后者是總體中各單位標志值的總和。總體單位是標志的直接承當者,標志總量不會獨立于單位總量而存在。在一個特定的總體,只存在一個單位總量,而同時并存多個標志總量,構成一個總量指標體系。同一總量指標在不同情況下可有不同的性質。例如對各企業(yè)工人總數指標來說,當研究企業(yè)平均規(guī)模時,以企業(yè)為總體單位,企業(yè)總數為單位總量,各企業(yè)工人總數為標志總量;當研究企業(yè)勞動效益時,以工人為總體單位,各企業(yè)工人總數為單位總量,這時企業(yè)的總產量成為標志總量。所以說總體單位總量和總體標志總量并不是固定不變的,二者隨研究目的不同而變化。按其反映時間狀況的不同,分為時期指標和時點指標。時期指標是反映*種社會經濟現象在一段時間開展變化結果的總量指標;時點指標是反映社會經濟現象在*一時間(瞬間)狀況上的總量指標。按其所采用計量單位的不同分為實物指標、價值指標和勞動量指標。實物指標是以實物單位計量的統計指標;價值指標是以貨幣單位計量的統計指標;按實物單位計算的指標最大的特點是它直接反映產品的使用價值或現象的具體容,能具體說明事物的規(guī)模和水平,但指標的綜合性能較差,無法進展匯總。按價值單位計量的最大優(yōu)點是它具有最廣泛的綜合性和概括能力,可以表示現象的總規(guī)模和總水平,但它脫離了物質容。二者要結合應用。勞動量指標是以勞動單位即工日、工時等勞動時間計量的統計指標。3、總量指標的作用總量指標的作用表現在以下幾方面:〔1〕總量指標是對社會經濟現象總體認識的起點?!玻病晨偭恐笜耸蔷幹品桨?,實行經營管理的主要依據?!玻场晨偭恐笜耸怯嬎阆鄬χ笜撕推骄笜说母住6?、相對指標1、相對指標的概念和表現形式相對指標又稱統計相對數。它是兩個有聯系的現象數值的比率,用以反映現象的開展程度、構造、強度、普遍程度或比例關系。在統計分析中運用相對指標,可使我們能夠更清楚地認識現象之間的關系,可以使不能直接比照的現象找到可以比照的根底。相對指標就是應用比照的方法,來反映社會經濟現象中*些相關事物間數量聯系程度的綜合指標,其表現形式為相對數。相對指標可以反映現象之間的相互聯系程度,說明總表達象的質量,經濟效益和經濟實力情況,利用相對指標可使原來不能直接比照的數量關系變?yōu)榭杀?,有利于對所研究的事物進展比擬分析。因為相對指標是運用比照的方法提醒現象之間的聯系程度,用以反映現象之間的差異程度。所以,計算相對指標時分子分母指標是否具有可比性,是計算結果能否正確反映現象之間數量關系的重要條件。分子分母指標的可比性主要包括:指標容是否相適應;總體圍是否一致;計算方法是否一樣;計量單位是否統一。2、相對指標的種類和計算各種相對指標應用的特點和計算方法如下:〔1〕構造相對指標構造相對指標是在對總體分組的根底上,以總體總量作為比擬標準,求出各組總量占總體總量的比重,來反映總體部組成情況的綜合指標。構造相對指標=各組〔或局部〕總量/總體總量計算構造相對指標能夠反映總體部構造和現象的類型特征?!玻病潮壤鄬χ笜吮壤鄬χ笜耸强傮w中不同局部數量比照的相對指標,用以分析總體圍各個局部、各個分組之間的比例關系和協調平衡狀況。比例相對指標=總體中*一局部數值/總體中另一局部數值〔3〕比擬相對指標比擬相對指標是不同單位的同類現象數量比照而確定的相對指標,用以說明*一同類現象在同一時間各單位開展的不平衡程度,以說明同類實物在不同條件下的數量比照關系。比擬相對指標=甲單位*指標值/乙單位同一指標值〔4〕強度相對指標強度相對指標是兩個性質不同但有一定聯系的總量指標之間的比照,用來說明*一現象在另一現象中開展的強度、密度和普遍程度。它和其他相對指標根本不同的特點,就在于它不是同類現象指標的比照。強度相對指標以雙重計量單位表示,是一種復名數。強度相對指標=*種現象總量指標/另一個有聯系但性質不同的現象總量指標強度相對指標的分子分母位置可以互換,因而有正指標、逆指標之分。實際應用時應注意與平均指標的區(qū)別。在掌握了幾種常用的相對指標的概念、作用及計算后,要注意區(qū)分不同的相對指標。構造相對指標是以總體總量為比擬標準,計算各組總量占總體總量的比重,來反映總體部組成情況的綜合指標。如:各工種的工人占全部工人的比重。比例相對指標是總體不同局部數量比照的相對數,用以分析總體圍各個局部之間比例關系和協調平衡狀況。如:輕重工業(yè)比例。比例相對指標和比擬相對指標的區(qū)別是:⑴子項與母項的容不同,比例相對指標是同一總體,不同組成局部的指標數值的比照;比擬相對指標是同一時間同類指標在空間上的比照。⑵說明問題不同,比例相對指標說明總體部的比例關系;比擬相對指標說明現象開展的不均衡程度。比擬相對指標是不同單位的同類指標比照而確定的相對數,用以說明同類現象在同一時期各單位開展的不平衡程度。如:甲地職工平均收入是乙地職工平均收入的1.3倍。主要區(qū)別是:⑴其它各種相對指標都屬于同一總體的數量進展比照,而強度相對指標除此之外,也可以是兩種性質不同的但又有聯系的屬于不同總體的總量指標之間的比照。⑵計算結果表現形式不同。其它相對指標用無名數表示,而強度相對指標主要是用有名數表示。⑶當計算強度相對指標的分子、分母的位置互換后,會產生正指標和逆指標,而其它相對指標不存在正、逆指標之分。〔5〕方案完成程度相對指標方案完成程度相對指標是用來檢查、監(jiān)視方案執(zhí)行情況的相對指標。它以現象在*一段時間的實際完成數與方案數比照,來觀察方案完成程度。方案完成程度相對指標=實際完成數/方案數此指標根據下達方案任務時期的長短和方案任務數值的表現形式不同,而有多種計算方法,實際應用時需注意區(qū)別。公式中分子減分母的差額表示方案執(zhí)行的絕對效果。例1、*企業(yè)1997年*種產品單位本錢為800元,1998年方案規(guī)定比1998年下降8%,實際下降6%。企業(yè)1998年產品銷售量方案為上年的108%,1997~1998年動態(tài)相對指標為114%,試確定:⑴該種產品1998年單位本錢方案與實際的數值。⑵1998年單位產品本錢方案完成程度⑶1998年單位產品本錢實際比方案多或少降低的百分點。⑷1998年產品銷售方案完成程度。解:以1997年的產品單位本錢為基數,根據1998年的方案百分比和實際完成百分比可以計算出:⑴1998年方案單位產品本錢800×〔100%-8%〕=736〔元〕實際單位產品本錢800×〔100%-6%〕=752〔元〕⑵單位產品本錢方案完成程度相對數=⑶1993年實際比方案少降低6%-8%=-2%即2個百分點⑷1993年產品銷售方案完成程度%=三、平均指標1、平均指標的概念、特點和種類平均指標又稱統計平均數,用以反映社會經濟現象總體各單位*一數量標志在一定時間、地點條件下所到達的一般水平的綜合指標。平均指標的特點:〔1〕把總體各單位標志值的差異抽象化了;〔2〕平均指標是個代表值,代表總體各單位標志值的一般水平。平均指標的種類有:算術平均數、調和平均數、幾何平均數、眾數和中位數。前三種平均數是根據總體所有標志值計算的所以稱為數值平均數,后兩種平均數是根據標志值所處的位置確定的,因此稱為位置平均數。平均指標的作用主要表現在:它可以反映總體各單位變量分量分布的集中趨勢,可以用來比擬同類現象在不同單位開展的一般水平;用來比擬同一單位的同類指標在不同時期的開展狀況;還可以用來分析現象之間的依存關系等相對指標數值的表現形式有有名數和無名數兩種。強度相對指標與平均指標的區(qū)別主要表現在以下兩點:〔1〕指標的含義不同。強度相對指標說明的是*一現象在另一現象中開展的強度、密度或普遍程度;而平均指標說明的是現象開展的一般水平?!玻病秤嬎惴椒ú煌?。強度相對指標與平均指標,雖然都是兩個有聯系的總量指標之比,但是,強度相對指標分子與分母的聯系,只表現為一種經濟關系,而平均指標是在一個同質總體標志總量和單位總量的比例關系。分子與分母的聯系是一種在的聯系,即分子是分母〔總體單位〕所具有的標志,比照結果是對總體各單位*一標志值的平均。2、平均指標的計算〔1〕算術平均數的計算算術平均數是計算平均指標的最常用方法,它的根本公式形式是總體標志總量除以總體單位總量。在實際工作中,由于資料的不同,算術平均數有兩種計算形式:即簡單算術平均數和加權算術平均數或簡單算術平均數適用于未分組的統計資料,如果各單位標志值和總體單位數,可采用簡單算術平均數方法計算。加權算術平均數適用于分組的統計資料,如果各組的變量值和變量值出現的次數,則可采用加權算術平均數計算。在,公式中,各組次數具有權衡各組變量值輕重的作用,*一組的次數越大,則該組的變量值對平均數的影響就越大,反之越小。加權算術平均數的大小受兩個因素的影響,其一是受變量值大小的影響。其二是受次數分配值即各組次數占總次數比重的影響。加權算術平均數中的權數,指的就是標志值出現的次數或各組次數占總次數的比重。在計算平均數時,由于出現次數多的標志值對平均數的形成影響大些,出現次數少的標志值對平均數的形成影響小些,因此就把次數稱為權數。在分組數列的條件下,當各組標志值出現的次數或各組次數所占比重均相等時,權數就失去了權衡輕重的作用,這時用加權算術平均數計算的結果與用簡單算術平均數計算的結果一樣?!玻病痴{和平均數的計算在實際工作中,有時由于缺乏總體的單位數資料,而不能直接計算平均數,這時就可采用調和平均數計算。因此在統計工作中,調和平均數常常被作為算術平均數的變形來使用。調和平均數也有簡單調和平均數和加權調和平均數兩種形式。例2、*月*企業(yè)按工人勞動生產率上下分組的生產班組數和產量資料如下:按工人勞動生產率分組〔件/人〕生產班組產量〔件〕50-6010825060-707650070-805525080-902255090以上11520試計算該企業(yè)工人平均勞動生產率。解:列計算表如下:按工人勞動生產率分組〔件/人〕組中值產量件人數50-6055825015060-7065650010070-807552507080-908525503090以上95152016合計
24070366工人平均勞動生產率〔件/人〕注意此題計算中權數的選擇。資料中“生產班組〞可以是次數,但并不是適宜的權數。因為此題中的工人勞動生產率是按件/人計算的,和生產班組沒有直接關系,所以它不能作為權數進展平均數的計算。此題應以“產量〞權數,進展加權調和平均數的計算。加權算術平均數與加權調和平均數是計算平均指標時常常用到的兩個指標。加權算術平均數中的權數一般情況下是資料已經分組得出分配數列的情況下標志值的次數。而加權調和平均數的權數是直接給定的標志總量。在經濟統計中,經常因為無法直接得到被平均標志值的相應次數的資料而采用調和平均數形式來計算,使調和平均數的計算結果與加權算術平均數的計算結果一樣,所以在實際應用加權算術平均數時,需注意權數的選擇。應用平均指標必須注意的問題有:⑴計算和應用平均指標,必須注意現象總體的同質性;⑵用組平均數補充說明總平均數;⑶計算和運用平均數時,要注意極端數值的影響,因為算術平均數受極端數值的影響很明顯?!玻场潮姅岛椭形粩当姅岛椭形粩凳莾蓚€位置平均數,在一定條件下用它們反映變量數列的一般水平是非常有效的。眾數是總體中出現次數最多的變量值。在單位數不多或一個無明顯集中趨勢的資料中,眾數的測定沒有意義。一般來講,只有根據分組數列才能確定眾數。中位數是將總體各單位標志值按大小順序排列后,處于中間位置的那個數值。根據未分組資料和分組資料都可確定中位數。4、變異指標變異指標又稱標志變動度,它綜合反映總體各個單位標志值的差異程度或離散程度。以平均指標為根底,結合運用變異指標是統計分析的一個重要方法。變異指標的作用有:反映現象總體總單位變量分布的離中趨勢;說明平均指標的代表性程度;測定現象變動的均勻性或穩(wěn)定性程度。從以上三點作用可以看出,變異指標總是和平均指標相結合,從另一個側面說明總體的特征?!玻病匙儺愔笜说姆N類和計算變異指標包括以下幾種:全距、平均差、標準差和變異系數。全距是測定標志變異程度的最簡單的指標,它是標志的最大值和最小值之差,反映總體標志值的變動圍。用公式表示為:全距=最大標志值-最小標志值從計算可知,全距僅取決于兩個極端數值,不能全面反映總體各單位標志值變異的程度,也不能拿來評價平均指標的代表性。平均差是各單位標志值對其算術平均數的離差絕對值的算術平均數,反映的是各標志值對其平均數的平均差異程度。其計算方法有簡單和加權兩種形式。標準差是總體中各單位標志值與算術平均數的離差平方的算術平均數的平方根,又稱為均方差。它是測定標志變動程度的最主要的指標。標準差的實質與平均差根本一樣,只是在數學處理方法上與平均差不同,平均差是用取絕對值的方法消除離差的正負號然后用算術平均的方法求出平均離差;而標準差是用平方的方法消除離差的正負號,然后對離差的平方計算算術平均數,并開方求出標準差。標準差的計算也有簡單和加權兩種形式,計算公式如下:σ=;σ=變異系數是以相對數形式表示的變異指標。它是通過變異指標中的全距、平均差或標準差與平均數比照得到的。常用的是標準差系數。變異系數的應用條件是:當所比照的兩個數列的水平上下不同時,就不能采用全距、平均差或標準差進展比照分析,因為它們都是絕對指標,其數值的大小不僅受各單位標志值差異程度的影響,而且受到總體單位標志值本身水平上下的影響;為了比照分析不同水平的變量數列之間標志值的變異程度,就必須消除數列水平上下的影響,這時就要計算變異系數。變異系數反映的是單位平均水平下標志值的離散程度,因而通過計算變異系數為水平上下不同的兩個數列提供了比照的根底。標準差系數的計算方法如下例3、兩種不同水稻品種,分別在5個田塊上試種,其產量如下:甲品種乙品種田塊面積〔畝〕產量〔公斤〕田塊面積〔畝〕產量〔公斤〕1.26001.58401.14951.47701.04451.25400.95401.05200.84200.9450要求:假定生產條件一樣,確定哪一品種具有較大穩(wěn)定性,宜于推廣。解:甲品種乙品種*f*f*f*f5001.2600——5601.58404024004501.1495-5027505501.47703012604451.0445-5530255201.0520——6000.954010090004501.2540-7058805250.8420255005000.9450-20360合計5.02500—15275合計6.03120—9900注:⑴⑵⑶因V乙<V甲故乙品種具有較大穩(wěn)定性,宜于推廣。第五章抽樣推斷教學目的和要求:通過本章學習,要對抽樣推斷的特點、作用及一些根本概念有正確的理解。掌握抽樣推斷的抽樣平均誤差、極限誤差的計算方法。在此根底上,能運用抽樣推斷的一般原理,對全及總體的指標值作出具有一定概率保證程度的推斷,并能正確進展相應的假設檢驗。統計是研究總體的,總體中包含假設干個總體單位。但在很多情況下我們不可能或沒有必要對總體中包含的所有單位進展觀察。例如,城鄉(xiāng)居民家庭收支情況、森林木材蓄積量、*些產品的性能和使用壽命檢驗等。因此只能在了解局部單位情況的根底上對總體進展統計推斷。所謂統計推斷是按隨機原則從總體中抽取局部單位作為樣本,利用樣本資料所提供的信息對總體數量規(guī)律做出科學推論的一種統計分析方法。根據統計推斷所研究問題的側重點不同,具體分為參數估計〔Parameterestimation〕和假設檢驗〔Hypothesistesting〕。參數估計是在未知總體數量特征情況下,根據樣本數據對總體數量特征做出科學的估計;假設檢驗是根據樣本數據對事先為總體數量特征做出的*種假設進展驗證,來判斷這種假定的真?zhèn)?。參數估計和假設檢驗所依據的根本理論是一樣的,即都是抽樣分布理論。第一節(jié)抽樣分布中的幾個根本概念總體與樣本總體〔Population〕是研究對象的全體,它是由許多具有*種一樣性質的個體單位組成的,總體中所包含的單位數用N表示??傮w各單位的標志值用*1,*2,*3,…,*N表示。在統計推斷中,總體又分為目標總體和抽樣總體。目標總體是統計推斷所要估計的總體;而被抽樣總體是直接從中抽取樣本單位的總體,又稱為作業(yè)總體。兩者有時是一致的,有時是不一致的。例如,對*種待出廠的產品進展質量檢驗,目標總體和被抽樣總體都是該種產品的全部;而對我國*種產品在國際市場上的銷售情況進展研究,目標總體是在國際市場銷售該種商品的全部,被抽樣總體只能是在指定地點和時間條件下銷售的該種商品,目標總體和作業(yè)總體是不一致的。這種情況下,要特別注意作業(yè)總體確實定,作業(yè)總體確定的根底原則就是從作業(yè)總體中抽取的樣本能根本上反映目標總體的情況。樣本〔Sample〕是從總體中隨機抽取的n個單位組成的集合體,對這n個*項標志進展觀察所得的數據〔*1,*2,…,*n〕稱為樣本觀察值。從總體中抽取樣本要采取一定抽樣組織方式,主要有簡單隨計抽樣、系統抽樣、分層抽樣和整群抽樣等。其中簡單隨機抽樣是最根本的,但這種方式的使用往往是建立在其他幾種方式的根底之上。簡單隨機抽樣一般適用于總體單位數較少、情況較簡單的現象;而對于總體單位數較多、情況較復雜的現象,就需要采用其他幾種抽樣組織方式特別是一些社會經濟問題的研究。關于抽樣組織方式我們要在本章的第四節(jié)介紹。在確定了抽樣組織方式根底上,還有一個抽樣方法即重復抽樣和不重復抽樣的問題。作為統計推斷對象的總體是確定的,惟一的;而作為觀察對象的樣本,是不確定的,隨機的??傮w參數與樣本統計量總體的數量特征就是總體參數,簡稱參數,因為總體是確定的、惟一的,所以參數也是惟一的、確定的,而且在抽樣推斷前是未知的,例如,總體平均數、總體比率、總體方差等。樣本統計量是樣本的數量特征,是根據樣本構造出的,統計量是樣本的函數,所以統計量也是隨機的。與總體參數相對應,常使用的樣本統計量有;樣本平均數、樣本比率、樣本方差等。樣本容量與樣本個數樣本容量是樣本中所包含的單位數,一般用n表示,當n﹥30時稱為大樣本,當n≤30時稱為小樣本。*些情況下,樣本容量不同,其抽樣分布也不同。樣本個數的多少與樣本容量、抽樣方法和抽樣組織方式等因素有關。抽樣方法樣本有三種,即方便樣本、判斷樣本和隨機樣本。在此討論的抽樣方法是指隨機樣本的抽取方法。根據從總體中隨機抽取*一單位后是否將其放回到總體中去參加下一次抽取,抽樣方法可分為重置抽樣和不重置抽樣。假設放回,就是重置抽樣;假設不放回,就稱為不重置抽樣。重置抽樣的特點是:n個單位的樣本是由n次連續(xù)抽取的結果構成的;每次抽取的結果與前一次和后一次的結果無關,即每一次抽取都是相互獨立的;每次抽取中被抽中的時機是均等的。因此,重置抽樣下每次抽取都是在總體N個單位中進展的,同一單位有重復被抽取的可能。不重置抽樣的特點是:n個單位的樣本是由n次連續(xù)抽取構成的,但由于每次抽取不重復,因此相當于從總體中同時抽取n個單位樣本;每次抽取的結果是不獨立的,上一次抽取的結果影響下一次的抽??;每個單位在每次抽取時中選時機是均等,但在不同次抽取中中選時機是不均等的。因此,不重置抽樣每次抽取都是在〔N-m〕個單位中進展的,其中m是已經抽取的單位數,這樣同一個單位就沒有重復中選的可能。很顯然,在樣本容量一樣情況下,重置抽樣的樣本個數多于不重置抽樣的樣本個數,而不重置抽樣的樣本代表性高于重置抽樣。另外,根據從總體中抽取的n個樣本單位的方法,按照是否考慮中選順序可以分為考慮順序抽樣和不考慮順序抽樣。考慮順序抽樣是指從總體中抽取n個樣本單位構成樣本,不僅要考慮樣本各個單位的不同性質,還要考慮各單位的中選順序。一樣性質單位構成的樣本,由于中選的先后順序不同,就作為不同的樣本。不考慮順序抽樣,只考慮樣本的組成單位性質如何,而不考慮單位中選的先后順序,只要樣本單位性質一樣,各個單位中選順序不同,也視為一個樣本。在社會經濟現象和企業(yè)管理問題研究中,常使用的是不考慮順序的不重置抽樣。第二節(jié)抽樣分布抽樣分布就是樣本統計量的概率分布。所謂樣本統計量是指樣本指標,它是定義在一個樣本空間上的樣本隨機變量的函數。一個樣本可以構造出去多統計量,如樣本平均數、樣本成數、樣本方差等等,根據統計推斷的需要而定。而且統計量的觀察值是建立在隨機抽樣的根底上,隨著抽到的樣本單位不同,其觀察值也會有變化,統計量的取值也隨之變化,所以統計量本身也是隨機變量。從同一總體中抽出樣本容量一樣的所有可能樣本后,計算每個樣本統計量的取值和相應的概率,就組成樣本統計量的概率分布,簡稱抽樣分布。統計量的取值不但和樣本容量有關,而且和抽樣方法〔試驗方法〕有關,我們從最簡單的情況入手。本節(jié)討論簡單隨機樣本,重置試驗的抽樣分布和不重置試驗的抽樣分布。重置抽樣分布㈠樣本平均數的分布樣本平均數是由總體中全部樣本平均數的可能取值和與之相應的概率組成。先舉例說明。*施工班組5個人的日工資為34、38、42、46、50元,則:總體工人日平均工資〔元〕總體日工資方差現在用重置抽樣的方法從5人中間隨機抽2個構成樣本,并求樣本平均工資來推斷總體的平均工資水平。由于是重置抽樣,所以第一個單位是從總的5種工資中取第一種,第二單位也是從同一總體的5種中取一種,共有25個樣本,各樣本的日平均工資如表4-1所示。表4-1樣本日工資平均數單位:元樣本變量3438424650343436384042383638404244423840424446464042444648504244464850從上表容易看出樣本的平均數及其次數,可以整理列出樣本平均數的分布表以及圖示如下:根據以上資料,可以計算樣本日工資平均數的平均數和樣本日工資平均數的方差。〔34×1+36×2+38×3+40×4+42×5+44×4+46×3+48×2+50×1〕=42〔元〕表4-2樣本日平均數工資分布樣本日平均工資〔元〕頻數頻率3411/253622/253833/254044/254255/254444/254633/254822/255011/25合計2515/254/253/252/251/25343638404244464850圖4-6樣本日平均工資分布圖=[〔34-42〕2+〔36-42〕2×2+〔38-42〕2×3+〔40-42〕2×4+〔44-42〕2×4+〔46-42〕2×3+〔48-42〕2×2+〔50-42〕2]=16〔元〕2〔元〕從以上計算,可以得到兩個重要的結論:重置抽樣的樣本平均數的平均數等于總體平均數,即:〔4.37〕上例兩者都等于42元。這說明雖然每個樣本平均數的取值可能與總體平均數有一定離差,但總體看來,所有樣本平均數說來和總體平均數是沒有離差的。抽樣平均數的標準差反映樣本平均數與總體平均數的平均誤差程度,這是因為:所以,稱之為抽樣平均誤差,或抽樣標準誤差,以表示。重置抽樣的抽樣平均誤差等于總體標準差除以樣本單位數的平方根。即:〔4.38〕在本例中,直接以總體標準差σ〔*〕和樣本單位數代入上式得:〔元〕所得結果和上面計算的結果完全一致。它說明所有樣本日平均工資和總體日平均工資的平均離差為4元。以上的結論具有普遍的意義,現在加以一般的推導。設總體變量*:*1,*2,…,,其中平均數為,標準差為。樣本容量為的變量*,*1,*2,…*n。按照平均數的定義和它的數學性質。重置抽樣條件下,由于*1,*2,…,*n是相互獨立的,而且都是從*1,*2,…,*N中抽取,每個中選時機相等,概率均為1/N。==…==所以,〔4.39〕〔4.39〕按照方差的定義以及它的數學性質?!?.40〕在重置抽樣條件下,由于*1,*2,…,*n是相互獨立的,而且都是從總體*1,*2,…,*n中抽取,所以變量*i與總體*是同分布的,因而有:所以==從這一等式可以看出兩項重要事實:首先,抽樣平均誤差比總體標準差小得多,僅為總體標準查的。例如一個縣的糧食畝產上下懸殊,畝產標準差σ為80公斤,如果隨機取100畝求平均畝產,則樣本平均畝產量的差異就顯著縮小,平均誤差只及總體畝產標準差的,即斤。所以用樣本平均畝產來代表總體平均畝產是更有效的。其次,抽樣平均誤差和總體標準差成正比變化,而和樣本單位n的平方根成反比變化。例如在同一總體中,如果抽樣單位數擴大為原來的4倍,則抽樣平均誤差就縮小一半,如果抽樣平均誤差增加一倍,則樣本單位數只需原來的1/4等等。㈡抽樣成數的分布可以把是非標志作為〔0,1〕分布,其中總體平均數就是總體成數本身,,總體方差?,F在從總體中用重置抽樣方法抽取個單位計算樣本成數,當然也是隨機變量,其分布實質上就是〔0,1〕樣本平均數的分布。樣本平均數分布的性質可以推廣到抽樣成數的分布,即有〔4.42〕上式表示樣本成數的平均數等于總體成數平均數,即總體成數本身?!?.43〕上式表示樣本成數的抽樣平均誤差亦即樣本成數的標準差等于總體成數的方差除以樣本單位數之商的平方根?!纠?-6】*批零件的一級品率為80%,現在用重置抽樣方法從中抽取100件,求樣本一級品率的抽樣平均誤差。這說明樣本成數與總體成數的抽樣誤差平均說來到達4%。隨著樣本單位數的增加,抽樣平均誤差也將減少。不重置抽樣分布㈠樣本平均數的分布仍用上面一樣的例子,即從*施工班組5個人日工資分別為34、38、42、46、50元,平均工資元,方差元2中,用不重置抽樣方法抽取2個構成樣本,并求樣本平均工資來推斷總體的平均工資水平。共有5×4=20個樣本,各樣本的日平均工資可以列表如下:表4-3樣本日工資平均數單位:元樣本變量343842465034—363840423836—4042443840—444646404244—485042444648—經過整理列出樣本的平均數的分布表以及圖示如下:表4-4樣本日平均工資公布樣本日平均工資〔元〕頻數頻率3621/103821/104042/104242/104442/104621/104821/10合計2012/101/1036384042444648圖4-7樣本日平均工資分布圖現在根據以上資料計算樣本平均數的平均數和樣本平均數的方差?!苍砙〔36-42〕2×2+〔38-42〕2×2+(40-42)2×4+(44-42)2×4+(46-42)2×2+(48-42)2×2]=12(元)2〔元〕從以上計算,也可以得到兩個重要的結論:不重置抽樣分布雖然與重置抽樣分布不同,但它的樣本平均數的平均數仍等于總體平均數,即:〔4.44〕本例兩者都等于42元,這也說明,用不重置樣本平均數來估計總體平均數,從總體來看,所有樣本平均數平均數說來是沒有離差的。抽樣平均數的標準差也是放映樣本平均數與總體平均數的平均差程度。即:〔4.45〕所以抽樣平均數的標準差也可稱為抽樣平均誤差,或抽樣標準誤差,用來表示,不重置抽樣的抽樣平均誤差等于重置抽樣的抽樣平均誤差乘以修正因子,即:(4.46)用各項數字代入上式得:所得結果與上面按定義計算的完全一致。這說明不重置抽樣的平均誤差總是小于重置抽樣的平均誤差,從樣本平均數分布來看,樣本平均數更集中于總體平均數。但如果總體單位數N很大,修正因子接近于1,則兩者幾乎沒有什么差異,因此在大樣本情況下,通??梢杂弥刂贸闃诱`差來代替不重置抽樣誤差。以上結論也具有普遍意義,現在加以一般的推導。設總體變量*:*1,*2,…*N,其平均數為*,標準差為。樣本容量為n的變量。按照平均數的定義:在不重置抽樣條件下,*1,*2,…,*n的抽選不是獨立的,現在分別討論E〔*1〕,E〔*2〕,…,E〔*n〕。E〔*1〕表示抽第1單位為*1,*2,…,的平均數。每單位出現的概率相等,均為1/N。所以:E〔*2〕表示抽第2單位為*1,*2,…,*N的平均數。但要第二單位抽中**i則必須第一單位不為*i,所以第1單位不為*i而第2單位為*i的概率為:依此類推所以(4.47)按照抽樣平均誤差的定義:由于是不重置抽樣,樣本*i與*j不是獨立的,共有n〔n-1〕項的E〔*i-*〕〔*j-*〕≠0,現在分別討論E〔*i-*〕2與E〔*i-*〕〔*j-*〕。式中k,L=1,2,…,N,PkL表示第i個被抽中的單位取值為*k,第j個被抽中的單位取值為*L的概率。其概率等于。又由于=代入上式求得:(4.48)當總體N很大時,N-1≈N則有(4.49)㈡樣本成數的分布總體成數P可以表現為是非標志〔0,1〕分布的平均數,而它的標準差σp也可以從總體成數推出來。即;從總體N個單位中,用不重置抽樣方法取n個單位計算樣本成數p,它的分布就是〔0,1〕樣本不重置平均數的分布。即有在得布道總體成數P的資料時,也可以用實際樣本的抽樣成數p來代替。例如,要估計*地區(qū)10000名適齡兒童的入學率,用不重置抽樣方法從這個地區(qū)抽取400名兒童,檢查有320名兒童入學,求樣本入學率的平均誤差。根據條件:p=320/400=80%σ2=P〔1-P〕=80%×20%=16%在重置抽樣下,入學率的抽樣平均誤差為:在不重置抽樣下,入學率的抽樣平均誤差為:兩者相比,抽樣平均誤差相差甚少。當總體的單位數很大時,不重置抽樣分布也就趨近于重置抽樣分布,抽樣平均誤差就接近一致了?,F在把各種抽樣平均誤差公式匯編列表如下:表4—5抽樣平均誤差公式匯編重置抽樣不重置抽樣樣本平均數誤差樣本成數誤差第三節(jié)正態(tài)分布和正態(tài)逼近重置抽樣分布和不重置抽樣分布都是離散型變量分布,正態(tài)分布則是連續(xù)型的變量分布。許多客觀現象屬于連續(xù)型變量,例如農作物畝產量、棉花纖維長度、機械零件尺寸、測量誤差等等,都必須用連續(xù)型的正態(tài)分布來描述其變化規(guī)律。在統計推斷中正態(tài)分布居于特別重要地位,它作為抽樣平均數和抽樣成數分布的極限式,可以為抽樣的概率估計提供簡便的方法。正態(tài)分布的密度函數對于連續(xù)變量可以用密度函數來描述其概率分布情況,正態(tài)分布的密度函數為:式中為正態(tài)分布的平均數,σ﹥0是它的標準差。這兩個參數決定正態(tài)分布函數的形狀。所以正態(tài)分布可以簡記為,其圖形如圖4—8。F〔*〕0*-σ**+σ*圖4—8正態(tài)分布圖正態(tài)分布密度函數有如下特性:對稱性。即以為對稱軸,曲線完全對稱地向兩邊延伸。非負性。密度函數f〔*〕都處于o*軸的上方。當時為最大值。f〔*〕的值隨遞增而遞減。變動平均數而σ不變,則并不改正態(tài)分布的形狀,而只改變正態(tài)分布的中心位置,如圖4—9。在處為密度函數f〔*〕的拐點,即在的區(qū)間里,曲線凸向上。如圖4-8。變動標準差σ而不變,則并不改變正態(tài)分布的中心位置,而只改變分布曲線的尖峭程度,如圖4-10。當σ變小時,密度函數曲線的中心局部縱坐標升高,曲線兩側迅速趨于*,表示變量分布比擬集中。反之,當σ變大時,則曲線呈現扁平,表示變量分布比擬分散。F〔*〕*=-50*=5圖4—9不同平均數的正態(tài)分布當*→±∞時,密度函數f〔*〕→0,即曲線向兩邊下垂,伸向無窮遠處。F〔*〕σ=0.5σ=1σ=2*圖4—10不同標準差的正態(tài)分布正態(tài)分布函數及其標準化根據正
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【優(yōu)化方案】2022屆高三物理大一輪復習-第5章-第2節(jié)-動能-動能定理-教學講義-
- 【導與練】2021高考地理總復習課時作業(yè):第2章-第3課時-常見天氣系統
- 互聯網時代下的課程設計與教學實踐
- 2021高考英語語法填空、閱讀類訓練(11)及答案(含短文改錯)
- 【創(chuàng)新設計】2021高考物理二輪復習(江蘇專用)題型通關-專練4
- 【優(yōu)化方案】2021高考英語(外研版)總復習階段綜合檢測(六)
- 【中學教材全解】2013-2020學年高中數學同步測試(人教A版-必修3)第一章-第一章-算法初步
- 四年級數學(四則混合運算帶括號)計算題專項練習與答案
- 【ks5u發(fā)布】山東省菏澤市2020-2021學年高二上學期期中考試生物試題掃描版含答案
- 【全程復習方略】2020-2021學年北師大版高中數學必修一課時作業(yè)(二十一)-3.4.2
- 核價管理制度
- 傲盾抗DDOS防火墻安裝使用手冊
- 衛(wèi)生部健康體檢項目目錄
- 2023年上海英語高考卷及答案完整版
- 金屬非金屬礦山(地下礦山)考試題庫
- 手衛(wèi)生依從性
- 第一學期六年級家長會課件1
- 最新國家開放大學電大《工程數學》期末題庫及答案
- 年產120萬噸氧化鋁拜爾法生產高壓溶出工藝設計
- APQP產品開發(fā)流程與管理(汽車行業(yè))課件
- 2021年監(jiān)理工程師《建設工程案例分析(水利工程)》真題及答案
評論
0/150
提交評論