統(tǒng)計學基礎教案_第1頁
統(tǒng)計學基礎教案_第2頁
統(tǒng)計學基礎教案_第3頁
統(tǒng)計學基礎教案_第4頁
統(tǒng)計學基礎教案_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、導 讀1.介紹教材統(tǒng)計學,李金昌主編,北京: 機械工業(yè)出版社,2007第1版2.本課程的學習要求平時成績(考勤、作業(yè)、課程論文)、考試成績3.本課程的成績評定方法A. 平時占30-40%:(1) 完成作業(yè)四次,課程論文分解,占10%;(2) 形成課程論文及PPT講解,按完成質量給分,占10% ;(3) 登錄統(tǒng)計學精品課程網站:; “互動交流”,表達對某一統(tǒng)計問題理解(300字以上);務必注明班級及姓名,占10%;(4) 期中測驗(隨機事件),若事件發(fā)生,占10% .B. 期末閉卷考試(或考查)占60-70%。 4.本課程教學改革整體思路:u 整體思路: 課堂理論教學-社會實踐調查-課堂小組討論

2、: u 具體安排: 第1周-第3周:總體安排、自由分組、選題:完成作業(yè)1(調查方案) 第4周-第6周:選題、方案設計、問卷設計:完成作業(yè)2(調查問卷) 第7周-第9周:開展實地調查、數據整理:完成作業(yè)3(描述性統(tǒng)計分析) 第9周-第14周:數據處理、結論探討:完成作業(yè)(統(tǒng)計推斷、模型預測) 第14周-第18周:課堂小組講解、小組討論第一章 總 論教學目的:理解統(tǒng)計的含義與本質;對統(tǒng)計學產生與發(fā)展的簡要歷史,特別是對主要學派有所了解;比較全面地認識統(tǒng)計學的學科性質和作用;熟知統(tǒng)計數據的各種類型、特征以及計量尺度,掌握統(tǒng)計數據的研究過程和基本方法;對總體、個體、樣本、標志、變量、指標和指標體系等統(tǒng)

3、計學的基本概念有比較系統(tǒng)、全面的掌握。教學重點:理解統(tǒng)計的含義與本質; 總體、個體、樣本、標志、變量、指標和指標體系等統(tǒng)計學的基本概念有比較系統(tǒng)、全面的掌握教學難點: 1.統(tǒng)計學的涵義   2.統(tǒng)計學的性質  3.統(tǒng)計學中幾個重要的概念 教學課時:3課時課堂方法設計:介紹統(tǒng)計學產生歷史及思想,分析統(tǒng)計學及方法的用處,以案例、課程論文、選題激發(fā)學生的學習積極性;進一步理解統(tǒng)計的基礎知識、概念和思想。教學過程:第一節(jié) 什么是統(tǒng)計學一統(tǒng)計的含義與本質1統(tǒng)計的含義及其關系: a) 統(tǒng)計數據:二手資料和原始數據;經過觀察、調查所取得具有信息價值的數字資料b) 統(tǒng)計

4、活動:即統(tǒng)計實踐活動,是對統(tǒng)計數據進行搜集、整理和分析的全過程 c) 統(tǒng)計學:理論概括和總結?!笆占头治鰯祿目茖W和藝術”。統(tǒng)計學是一門關于數據資料的收集、整理、分析和推斷的科學。復旦大學統(tǒng)計規(guī)律案例分析。2. 統(tǒng)計的本質:關于為何統(tǒng)計,統(tǒng)計什么和如何統(tǒng)計的思想。二統(tǒng)計學的產生和發(fā)展1古典統(tǒng)計學時期:(1)亞里斯多德撰寫“城邦政情”或“城邦紀要”(2)英國威廉·配第(W.petty,1623-1670),政治算術政治經濟學之父(3)英國約克大學約翰·格朗特(John Graunt),1662年,出版關于死亡率的自然觀察和政治觀察。被稱為統(tǒng)計學的創(chuàng)始人,政治算術學派的代表。

5、 2 近代統(tǒng)計學時期(統(tǒng)計分析科學)數理統(tǒng)計學派:創(chuàng)始人和代表人物,比利時凱特萊(L.A.J.Quetelet,1796-1874),現代統(tǒng)計學之父。雅各布·伯努利(Jacob Bernoulli)(16541705)荷蘭人;1713年出版猜度術,給出“伯努利數”、“伯努利大數定律。貝葉斯(Thomas R. Bayes, 17021761)英國數學家。首先將歸納理論法用于機率理論,創(chuàng)立貝葉斯統(tǒng)計理論。費歇爾(Fisher,18901962)偉大的英國統(tǒng)計學家、數理統(tǒng)計學最主要的奠基者由費歇爾所確立的統(tǒng)計推斷理論,樣本分布理論,試驗計劃法及分布理論對奠定20世紀統(tǒng)計學的基礎

6、理論作出了很大的貢獻 3現代統(tǒng)計學時期 小樣本思想、t分布理論、卡方分布、方差分析、假設檢驗、估計理論、誤差理論、決策理論、多元統(tǒng)計、時間序列、面板數據等方法的出現醫(yī)學統(tǒng)計學、天文統(tǒng)計學、傳媒統(tǒng)計學、管理統(tǒng)計學、金融統(tǒng)計學、國民經濟統(tǒng)計學、社會統(tǒng)計學、教育統(tǒng)計學、心理統(tǒng)計學、生物統(tǒng)計學等學科的出現三、統(tǒng)計學的學科性質1研究對象數量性:統(tǒng)計研究對象是客觀事物的數量方面總體性:社會經濟統(tǒng)計認識社會經濟現象時,主要是研究社會經濟現象的總體數量規(guī)律,即通過大量的觀察,獲得足夠多的統(tǒng)計資料,說明、認知總體現象的變化情況及規(guī)律。 差異性:就是要從所研究現象總體的各個個體之間的差異中概括出共同普遍的特征,并

7、對差異情況作出必要的反映2學科地位方法性:統(tǒng)計學是一門方法論科學,其任務是為研究現象的數量提供科學的理論、原則和方法,就是提供工具和手段。層次性:統(tǒng)計學是一門一級學科,擁有完整、嚴密的學科體系,具有很強的層次性,其二級學科包括理論統(tǒng)計學、應用統(tǒng)計學、統(tǒng)計學史和統(tǒng)計學其他學科等。通用性:統(tǒng)計學是一門通用的方法論科學,其一般的理論、原則和方法在任何研究數量的領域均可用。3構成內容描述性:研究如何取得反映客觀現象的數據,并通過圖表形式對所收集的數據進行加工處理和顯示,進而通過綜合、概括與分析得出反映客觀現象的規(guī)律性數量特征。推斷性:研究如何通過樣本數據去推斷總體數量特征。是在對樣本數據進行描述的基礎

8、上,對統(tǒng)計總體的未知數量特征作出以概率形式表述的推斷。四統(tǒng)計學的作用(一)統(tǒng)計學為我們認識自然、認識社會提供了必需的方法和途徑(二)統(tǒng)計學在指導生產活動中發(fā)揮著重要作用(三)統(tǒng)計學在社會經濟管理活動中的作用更顯著(四)統(tǒng)計學為科學研究提供了有力手段 第二節(jié) 統(tǒng)計數據類型與研究方法一統(tǒng)計數據類型1按照所采用的計量尺度不同,可以分為定性數據與定量數據定性數據是指只能用文字或數字代碼來表現事物的品質特征或屬性特征的數據,具體又分為定類數據與定序數據兩種。 定類數據:按照事物的某種屬性對其進行平行的分類或分組所形成的數據。定序數據:對事物之間等級或順序差別測度所形成的數據。定量數據是指用數值來表現事物

9、數量特征的數據,具體又分為定距數據與定比數據兩種 定距數據:對事物類別或次序之間間距的測度所形成的數據。定比數據(比率尺度):是能夠測算兩個測度值之間比值的數據。2按照其表現形式不同,可以分為絕對數、相對數和平均數絕對數:反映現象或事物絕對數量特征的數據,它以最直觀、最基本的形式體現現象或事物的外在數量特征,有明確的計量單位。相對數:反映現象或事物相對數量特征的數據,它通過另外兩個相關統(tǒng)計數據的對比來體現現象(事物)內部或現象(事物)之間的聯系關系,其結果主要表現為沒有明確計量單位的無名數,少部分表現為有明確計量單位的有名數(限于強度相對數)。 平均數:反映現象或事物平均數量特征的數據,體現現

10、象某一方面的一般數量水平。 3按照其來源不同,可以分為觀測數據與實驗數據4按照其加工程度不同,可以分為原始數據與次級數據5按照其時間或空間狀態(tài)不同,可以分為時序數據與截面數據二統(tǒng)計數據研究過程包括四個基本環(huán)節(jié):1.統(tǒng)計設計:制定統(tǒng)計數據研究方案 2.數據搜集:按照統(tǒng)計設計的要求,有針對地獲取所需的統(tǒng)計數據的環(huán)節(jié),也稱為統(tǒng)計調查環(huán)節(jié) 3.數據整理:通過統(tǒng)計觀測或實驗所獲得的原始數據,進行必要的系統(tǒng)化處理,使之條理化、綜合化,成為能反映總體特征的統(tǒng)計數據的環(huán)節(jié) 4.數據分析與解釋:數據分析是在數據整理的基礎上,圍繞統(tǒng)計設計所確定的研究任務,運用各種統(tǒng)計方法對數據進行各種統(tǒng)計分析,得出某些有用的定量

11、結論的環(huán)節(jié) 三統(tǒng)計數據研究方法基本方法有五種:1.大量觀察法:大數定律2.統(tǒng)計分組法:傳統(tǒng)分組法、判別分析法和聚類分析法等 3.綜合指標法:常見的綜合指標有總量指標、相對指標和平均指標 4.統(tǒng)計推斷法:根據概率論和樣本分布理論,由樣本觀測數據來推斷總體數量特征參數估計或假設檢驗 5.統(tǒng)計模型法:建立回歸模型、相關模型等 第三節(jié)統(tǒng)計學的基本概念一總體與樣本1總體:統(tǒng)計研究的客觀對象的全體,是具有某種共同性質的事物所組成的集合體(也稱為母體)(1)總體的含義與特征大量性、同質性和差異性三個特征 (2)總體的分類 a)總體單位是否有限有限總體和無限總體要檢驗一批燈泡的壽命有限總體 要全面考察該企業(yè)生

12、產的燈泡的壽命無限總體b)總體存在形式具體總體和抽象總體今天來上統(tǒng)計學的所有學生總體具體總體某種工藝條件下生產的產品形成的總體抽象總體c)總體單位是否能計數可計數總體和不可計數總體d)總體單位是否人為劃分自然總體和人為總體自然確定:個人、企業(yè)、家庭等自然形成的總體人為劃定:一公斤小麥、一百公斤小麥、一噸小麥等人為劃分的總體;一公頃草地、一百公頃草地、一平方公里草地等人為形成的總體。(3)個體的含義:構成統(tǒng)計總體的個別事物稱為個體(也稱總體單位)(4)總體與個體的關系 a.) 總體容量隨著個體數的增減變化b.) 隨著研究目的不同,總體中的個體可發(fā)生變化c.) 隨著研究范圍的變化,總體與個體的角色

13、可以變換2樣本:(1)樣本的含義:所謂樣本就是從總體中抽取一部分個體所組成的集合,也稱子樣。(2)樣本與總體的關系 a.) 樣本是總體的代表和縮影b.) 樣本是用來推斷總體的c.) 總體和樣本的角色是可以改變的二標志和變量1標志(1)標志的含義:所謂標志,就是用以描述個體所具有的特征的名稱。標志在每個個體上的具體表現結果稱為標志表現。(2)標志的種類:a)按其結果表現方式不同 品質標志:只能用文字表示; 數量標志:用數值表示的。b)按其在每個個體上表現的結果是否相同:不變標志:在每個個體上的標志表現完全相同;可變標志:在每個個體上的表現不盡相同。 c)按其表現個體的直接程度不同:直接標志:直接

14、表現個體特征的標志;間接標志:間接表現個體特征的標志。2變量(1)變量的含義:a.) 狹義:可變的數量標志。 b.) 廣義:變量是可變的數量標志和可變的品質標志。(2)變量的分類:      a) 按其反映數據的計量尺度不同,可以分為定性變量和定量變量 b) 按其所受的影響因素分:確定性變量和隨機變量。 c) 按其變量值的變化是否連續(xù):連續(xù)性變量和離散性變量。三統(tǒng)計指標和指標體系1 統(tǒng)計指標 (1)含義:反映社會經濟現象總體數量特征的概念及其具體數值 a.) 說明總體數量特征的;b.) 有廣義與狹義之分廣義:說明總體數量特征的概念和數

15、值。包括六個基本要素狹義:說明總體數量特征的概念和名稱。包括三個基本要素c.)注意問題:指標都必須用數字表示。(2)統(tǒng)計指標與標志的關系區(qū)別:a.)研究對象不同; b.)表現形式不同.聯系:a.)依據與結果; b.)相互轉化。(3)統(tǒng)計指標的種類a.)按計算范圍分:總體指標和樣本指標總體指標也稱總體參數,是惟一的但往往未知;樣本指標也稱樣本統(tǒng)計量,是可知的但非唯一。b.) 按反映現象的內容分:數量指標和質量指標數量指標也稱為總量指標,按照其反映現象內容的不同,分為總體標志總量和總體容量,按照其反映現象時間狀況的不同,分為時期指標與時點指標。質量指標分為相對指標和平均指標,相對指標反映事物內部或

16、相關事物之間相對數量關系,包括:結構相對指標(總體中部分總量與總體總量之比)比例相對指標(總體中某部分總量與其他部分總量之比)比較相對指標(兩個同類指標之比)動態(tài)相對指標(同一指標在不同時間之比) 強度相對指標(兩個性質不同但有聯系的總量指標之比) 計劃完成程度相對指標(實際指標與計劃指標之比) 平均指標是反映變量分布集中趨勢或中心位置的指標,表明變量的一般數量水平,包括算術平均指標、幾何平均指標、調和平均指標、眾數指標和中位數指標。c.) 按反映的時間分:靜態(tài)指標和動態(tài)指標。(4)統(tǒng)計指標的設計:對指標的名稱和涵義、計算范圍和方法、 資料搜集和統(tǒng)計量化、計量單位等進行具體規(guī)定。(5)總體與個

17、體、指標與標志的關系總體由個體組成,指標是由標志構成2指標體系反映同一總體或樣本多個方面數量特征的一系列相互聯系的統(tǒng)計指標所形成的體系,成為統(tǒng)計指標體系。(1)含義:若干統(tǒng)計指標組成,互相制約有機整體。(2)形式:數學等式關系、相互補充關系、因果關系、相關關系。(3)指標體系的設計:目的性原則、科學性原則、可行性原則、靈活性原則、層次性原則、聯系性原則、協(xié)調性原則本章總結:本章是學習統(tǒng)計學的入門章節(jié),篇中涉及了大量的概念性知識,并且相對容易混淆,希望同學們在課后要認真復習這些基礎知識,為我們學習以后各章打好基礎,練習主要完成學習指導和我刻印的習題,復習教材的“本章小節(jié)”,將其系統(tǒng)化,理解再記憶

18、。 作業(yè)布置:習題第一題、第二題、第三題1,3,7,9,10小題。第二章 統(tǒng)計資料的收集、整理與顯示教學目的:本章闡述統(tǒng)計數據收集、整理與顯示的理論方法,理解統(tǒng)計數據收集的含義和要求,熟悉統(tǒng)計數據收集的各種方式、方法,掌握統(tǒng)計整理得而理論和方法,包括分組,和統(tǒng)計表格的設計,了解統(tǒng)計圖的意義,統(tǒng)計數據整理與顯示中的應用。教學重點: 1.統(tǒng)計數據收集以及收集幾種方法。2.設計統(tǒng)計調查方案的方法。3.統(tǒng)計數據分組的類型原則和方法。4.分組的方法,統(tǒng)計分布的編制。 5.熟練了解統(tǒng)計圖和掌握Excel的相關應用。教學難點: 1.幾種調查方法的特點和應用。 2.統(tǒng)計收集的方法之間的區(qū)別與聯系。3.了解統(tǒng)計

19、表的編制。教學課時: 8學時教學方法設計:1.直接講陳法;練習與新課相結合,示例加以鞏固。教學過程:第一節(jié)      統(tǒng)計數據的收集一、統(tǒng)計數據收集的含義和要求統(tǒng)計數據收集是整個統(tǒng)計活動的基礎階段,通常也稱為統(tǒng)計調查階段。統(tǒng)計數據收集的基本要求是準確性、及時性和完整性。二、統(tǒng)計數據收集方案設計統(tǒng)計數據收集方案應包括以下一些內容:數據收集目的、數據及其類型、數據收集對象和觀測單位、觀測標志和調查表、數據收集方式與方法、數據所屬時間和數據收集期限、數據收集地點和數據收集的組織。三、統(tǒng)計數據收集方式統(tǒng)計數據收集方式有兩種:統(tǒng)計調查方式和實驗

20、方式。(一)統(tǒng)計調查方式統(tǒng)計調查就是按照預定的統(tǒng)計任務,運用科學的統(tǒng)計調查方法,有計劃有組織地向客觀對象搜集資料的過程。1、普查概念:根據特定的統(tǒng)計研究目的而專門組織的一次性的全面調查,用以收集所研究現象總體的全面資料。組織方式: a)專門組織普查機構調查; b)利用現有統(tǒng)計資料;基本原則: a)標準時點(避免重復和遺漏)b)調查步驟(同一次調查在不同階段)統(tǒng)一性原則 c)指標口徑(內涵)d)調查時間(起止)e)普查周期:我國為期十年的普查制度2、抽樣調查抽樣調查是一種非全面調查,就是從總體中抽取樣本,以樣本推斷總體的統(tǒng)計調查方式。 抽樣調查是目前我國應用最廣泛的統(tǒng)計調查方式。抽樣調查可分為概

21、率抽樣和非概率抽樣兩類。你覺得的“隨機”和“隨意”有區(qū)別嗎?(1)概率抽樣a)概率抽樣是按照隨機原則抽取樣本,即總體中的每個個體都有已知的、非零的概率被抽取到樣本中來。b)特點:在樣本的抽取上遵循隨機原則在調查的功能上能以部分推斷總體在推斷的手段上運用概率估計的方法在推斷的理論上,以大數定律和中心極限定理為依據在推斷的效果上,抽樣誤差可以計算并加以控制c)概率抽樣從抽樣方法上看,可以分為重復抽樣和不重復抽樣兩種。重復抽樣的特點是:總體的每個個體都有數次被抽中的可能性,次抽樣之間相互獨立。不重復抽樣的特點是:總體中每個個體都只有一次被抽中的可能性,次抽樣之間不相互獨立 d)概率抽樣從抽樣組織形式

22、上看,可分為簡單隨機抽樣、分層抽樣、等距抽樣、整群抽樣和多階段抽樣五種。簡單隨機抽樣是抽樣調查最基本的組織形式,具體的樣本抽取方式有抽簽法和隨機數表法等;分層抽樣特點是必須具備總體所有個體的名錄和至少一個分層標志的全面資料,各層的抽樣相互獨立,盡量把總體差異通過分層而轉化為層間差異;等距抽樣的特點依固定的間隔和規(guī)定的順序來抽取個體,屬于不重復抽樣;整群抽樣要盡量把總體差異轉化為群內差異等,一般屬于不重復抽樣;多階段抽樣特點是整群抽樣和分層抽樣兩種組織形式的綜合。(2)非概率抽樣非概率抽樣是非隨機抽樣調查,是憑人們的主觀判斷或根據便利性原則來抽取樣本。有任意抽樣、典型抽樣、定額抽樣和流動總體抽樣

23、等幾種。任意抽樣,也稱隨意抽樣,即抽樣者隨意地或任意地(通常是遵循簡便性原則)從總體中抽取樣本。典型抽樣,也稱有目的抽樣、代表性抽樣,即抽樣者根據自己的知識、經驗和判斷從總體中挑選出“典型的”或“有代表性”的單位來組成樣本。定額抽樣也稱配額抽樣,抽樣者按照規(guī)定的定額獲得一個在某些特征上與總體結構大致成比例的樣本。它是先對總體按一定標志分類,并按比例分配每類應調查單位的定額,然后由抽樣者在每類進行判斷抽樣。 流動總體抽樣,也稱“捕獲標記再捕獲” (Capture-Tag-Recapture) 抽樣,即抽樣者先從流動總體中獲取部分單位,加以標記后放回總體,過一段時間后再獲取部分單位,然后根據 再獲

24、取單位中有標記單位的比例來推算總體的數量。3、重點調查重點調查是對數據收集對象總體中的部分重點個體進行觀測的統(tǒng)計調查方式。特點: 以客觀原則來確定觀測單位;屬于范圍較小的全面調查。關鍵是選擇重點單位 確定最低標志值確定最低重點單位累計標志值比重 4、統(tǒng)計推算統(tǒng)計推算的概念和特點;統(tǒng)計推算方法。統(tǒng)計推算是以已掌握的各種統(tǒng)計數據為基礎,根據事物之間的內在聯系或發(fā)展規(guī)律,對被研究現象數量特征做出估算或測算的一種間接統(tǒng)計調查方式; 例如插值法、平均值估計法等。(二)實驗方式含義:所謂實驗方式,就是運用自然科學的試驗法,通過觀測人為安排條件下試驗產生的各種結果并加以記錄的方式來獲取數據,或通過人為安排條

25、件下的試驗來探求某個或某些因素對所研究事物的數量影響程度和作用方式,憑借實驗結果來揭示所考察因素與所研究事物之間的數量因果關系。 原則:均衡分散性原則;整齊可比性原則 常用的實驗設計:(1)完全隨機試驗(2)隨機區(qū)組試驗 (3)拉丁方試驗 (4)正交試驗 (三)數據收集誤差數據收集誤差存在兩種誤差:觀測性誤差和代表性誤差。觀測性誤差也叫登記性誤差或調查性誤差,在全面調查和非全面調查中都會產生,是一種非一致性誤差;代表性誤差是指在抽樣調查中,因樣本不能完全代表總體而產生,又分為系統(tǒng)性代表性誤差和偶然性代表性誤差兩種。四、統(tǒng)計數據收集方法統(tǒng)計數據收集方法,是指獲取被調查對象數據的渠道或途徑,常用的

26、方法有直接觀察法、通訊法、采訪法、登記法等幾種。五、問卷設計問卷是依據統(tǒng)計研究目的和要求,按照一定的理論假設設計出來的、由一系列問題、項目、備選答案及說明所組成的、向被調查者搜集資料的一種工具。問卷一般由引言、被調查者基本情況、問題和答案、結語四個部分組成。設計時應考慮三個方面問題:問題的編排順序;提問方式和措辭要點;問卷調查說明等。引言和注釋 (WWH三原則)首先 要說明調查者的身份(who)其次 要說明調查的大致內容和進行這項調查的目的(why) 最后 要說明調查對象的選取方法和對 調查結果保密的措施(how)問題設計的原則1、所列問題必須符合客觀實際情況2、問題不能太多3、問題必須是被調

27、查者有能力回答的4、不要直接提社會上禁忌的和敏感性的問題5、問題不能帶有誘導性6、問題的內容要具體、單一7、問題的語言要簡單易懂、標準規(guī)范8、問題的排列要講究邏輯性第二節(jié) 統(tǒng)計數據的整理一、統(tǒng)計整理的含義與要求統(tǒng)計整理的含義:統(tǒng)計資料整理是根據統(tǒng)計研究的目的,按照統(tǒng)計整理方案的要求,對統(tǒng)計調查所得到的大量的原始資料進行科學的加工、匯總、或對已經加工過的資料進行再加工,使之系統(tǒng)化、條理化、成為能夠反映總體特征的綜合資料的工作過程1) 依據:研究目的;2) 內容:原始資料、次級資料;3) 目的:反映個體的資料轉化為反映總體的資料。4) 意義:調查的繼續(xù),分析的基礎。要求:科學性、條理性和充分性。二

28、、統(tǒng)計整理的內容和步驟分組、匯總、編表(圖),其中匯總是中心內容:根據研究任務的要求,選擇應整理的指標,并根據分析的需要確立具體的分組。對統(tǒng)計資料進行匯總,計算。 使用統(tǒng)計圖表描述匯總計算的結果。統(tǒng)計整理的步驟:設計整理方案統(tǒng)計資料的審核進行科學的統(tǒng)計分組統(tǒng)計匯總編制統(tǒng)計圖表 三、統(tǒng)計分組    (一)含義與性質 統(tǒng)計分組是根據事物內在的特點和統(tǒng)計研究的任務,按一定的標志,將統(tǒng)計總體劃分為若干個不同的類型或部分(組)的一種統(tǒng)計方法。分組之后應保持組內資料的同質性和組間資料的差異性。統(tǒng)計分組的關鍵選擇分組標志。(二)統(tǒng)計分組的種類 a.) 

29、60; 按分組標志性質分:品質標志分組和數量標志分組b.)  按分組標志多少:簡單分組和復合分組。 四、分布數列(一)分布數列的概念和種類1分布數列的概念:在統(tǒng)計分組的基礎上,把總體的所有單位按組歸并排列,形成總體中各個單位在各組間的分布,稱為分布數列,也稱為統(tǒng)計分布或次數分布。分布數列的組成要素:總體按某標志所分的組(組別)和分配在各組的單位數(頻數)及各組單位數占總體單體數的比重(頻率)2分布數列的種類a)品質數列b)變量數列 單項數列 組距數列 等距數列          

30、60;              異距數列 3分布數列的構成: a ) 組別 b )分配在各組的單位數。(二)分布數列的編制1、單項數列a)概念單一變量值為一組;b)適用范圍:變動范圍不大的離散變量和取整數的連續(xù)變量。c)編制步驟:確定組數 ; 把總體單位分配在相應各組。2、組距數列a)  概念以區(qū)間表示一個組;b) 適用范圍:連續(xù)變量、變動范圍大的離散變量;c) 步驟:確定組距、組數;確定等距或異距;確定組限;算組中值。.3、組距數列編制中應該注意的問題

31、a)   組距和組數:組距的概念;組數的概念;關系 b)  組限的確定:組限的概念、確定的方法、確定的原則;c)  等距數列或異距數列的選擇消除不可比因素的方法:次數密度 d.)  組中值計算:作用、計算條件、計算方法、注意問題:開口組(三)頻率分布1頻率分布的性質:頻率在0到1之間;各頻率之和等于12頻率分布圖:3累計頻率的計算:a)   累計頻率的概念:累計頻數和累計頻率;累計頻率計算的方法;b)  向上累計和向下累計n 向上累計是將各組頻數(率)曲線標志值低的組向標志值高的組依次累計,說明至某組上限以下的各組

32、頻數(率)累計分布狀況。n 向下累計是將各組頻數(率)由標志高的組向標志值低的組依次累計,說明至某組下限以上各組頻數(率)累計分布狀況。第三節(jié) 統(tǒng)計數據的顯示一、 統(tǒng)計表(一)概念經過匯總,得到一系列總量指標的數字資料,把這些數字按一定的邏輯順序在表格上表現出來,這種表稱為統(tǒng)計表。廣義上看,任何用以反映統(tǒng)計資料的表格都是統(tǒng)計表。統(tǒng)計表是表現統(tǒng)計資料的最常用的形式,也是統(tǒng)計分析的重要工具。(二)結構統(tǒng)計表的結構從外表形式看,由總標題、橫行標題和縱欄標題、指標數值等部分構成。1、從內容看:主詞、賓詞2、從形式看:總標題、橫行標題、縱欄標題、指標(三)種類 簡單表未分組資料;分組表按一個標

33、志分組;復合表兩個以上標志并層疊分組。二、統(tǒng)計圖1.直方圖:用矩形的寬度和高度來表示頻數分布的圖形,實際上是用矩形的面積來表示各組的頻數分布。2.折線圖:折線圖也稱頻數多邊形圖(Frequency polygon),是在直方圖的基礎上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉,折線圖的兩個終點要與橫軸相交。3.曲線圖:U型分布是一種剛好與鐘型分布相反的分布,其標準是越靠近中心變量值,分布次數越少;越遠離中心變量值則分布次數越多。形成“中間小,兩頭大”的分布特征。象英文的“U”字。J型分布的特征有正反兩種情況,一種是次數隨變量的增大而逐漸增多,稱為正J形分布;若次數隨變量

34、值的增大反而減少,則稱為反J型分布,象英文的“J”字。4.莖葉圖和箱形圖的含義和編制方法。A.用于顯示未分組的原始數據的分布B.由“莖”和“葉”兩部分構成,其圖形是由數字組成的C.以該組數據的高位數值作樹莖,低位數字作樹葉D.對于n(20n300)個數據,莖葉圖最大行數不超過 L = 10 × log 10 n E.莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可大體上看出一組數據的分布狀況,但沒有給出具體的數值莖葉圖既能給出數據的分布狀況,又能給出每一個原始數值,保留了原始數據的信息5.雷達圖:先做一個圓,然后將圓P等分,得到P個點,令這P個點分別對應P個變量,在將這P個點與圓心連線,

35、得到P個幅射狀的半徑,這P個半徑分別作為P個變量的坐標軸,每個變量值的大小由半徑上的點到圓心的距離表示。再將同一樣本的值在P個坐標上的點連線。這樣,n個樣本形成的n個多邊形就是一個雷達圖。本章總結:1.統(tǒng)計收集的內容和方法、統(tǒng)計調查的組織。2.掌握統(tǒng)計資料的整理的方法及技術和統(tǒng)計表。作業(yè)布置:習題第三題1, 9, 10題。第三章 變量分布特征的描述教學目的:理解變量分布的三大特征,即集中趨勢、離中趨勢和分布形狀的含義;理解平均指標、離散指標和形狀指標的意義與作用,熟練掌握各種平均數、各種離散指標的計算方法并加以應用。 教學重點:理解變量分布的三大特征,即集中趨勢、離中趨勢和分布形狀的含義。掌握

36、各種平均數、各種離散指標的計算方法。掌握偏系數和峰度系數的計算方法。教學難點:熟練各種平均數、離散指標的計算方法,了解區(qū)別和聯系。 教學課時:5學時教學方法設計:示例法、軟件演示法、教案法第一節(jié) 集中趨勢的描述學習要求:理解變量分布三大特征即集中趨勢、離中趨勢和分布形狀的的含義;理解平均指標、離散指標和形狀指標的意義與作用;熟練掌握各種平均數的計算方法并加以正確的應用,科學理解加權平均數中權數的意義,正確認識算術平均數與調和平均數之間的應用關系,以及算術平均數、中位數和眾數三者之間的數量關系;熟練掌握各種離散指標的計算方法并加以正確的應用,尤其是要深刻理解方差、標準差和離散系數的內涵;熟練掌握

37、偏度系數和峰度系數的計算方法并加以正確的應用,尤其是要了解動差的含義。 變量分布特征可以從以下三個方面加以描述:集中趨勢:反映變量分布中各變量值向中心值靠攏的程度;離中趨勢:反映變量分布中各變量值遠離中心值的程度;分布形狀:反映變量分布的偏斜程度和尖陡程度。一、集中趨勢與平均指標集中趨勢亦稱為趨中性,是指變量分布以某一數值為中心的傾向。用平均指標來反映,平均指標的種類。平均指標主要用來表明同質總體中某一標志值,在一定時間、地點條件下所達到的一般水平。其數值表現平均數。數值平均數:從總體各單位變量值中抽象出具有一般水平的量,這個量是根據各個單位的具體標志值計算出來的,有算術平均數、調和平均數、幾

38、何平均數等形式。數值平均數包括: 算術平均數:簡單算術平均 加權算術平均 調和平均數:簡單調和平均 加權調和平均 幾何平均數:簡單幾和平均 加權幾和平均 位置平均數:先將總體各單位的變量值按一定順序排列,然后取某一位置的變量值來反映總體各單位的一般水平。位置平均數有眾數、中位數、四分位數等形式位置平均數包括:眾數 中位數 分位數平均指標的作用:(1)通過反映變量分布的一般水平,幫助人們對研究現象的一般數量特征有一個客觀的認識。(2)利用平均指標可以對不同空間的發(fā)展水平進行比較。(3)利用平均指標可以對某一現象總體在不同時間上的發(fā)展水平進行比較,以說明這種現象發(fā)展變化的趨勢或規(guī)律性。(4)利用平

39、均指標可以分析現象之間的依存關系或進行數量上的推算。(5)平均指標還可以作為研究和評價事物的一種數量標準或參考。 二、數值平均數(一)算術平均數算術平均數一般就稱為平均數(mean)。其定義是:觀察值的總和除以觀察值個數的商。在實際工作中,由于所掌握的統(tǒng)計資料的不同,利用上述公式進行計算時,可分為簡單算術平均數和加權算術平均數兩種。1、基本計算公式:總體標志總量/總體單位總數2、簡單算術平均數:簡單算術平均數的公式根據未經分組整理的原始數據計算的均值。設一組數據為x1,x2,x3,xn。則簡單算術平均數的計算公式如下: (1)計算公式:  (2)適用范圍:末分組資料。3、加

40、權算術平均數:根據分組整理的數據計算的算術平均數(1)計算公式:   (2)注意點 (3)適用范圍:分組資料中已知分母加總資料。(4)注意問題權數及權數的作用-算術平均數的大小,不僅取決于研究對象的變量值(x),而且受各變量值重復出現的頻數(f)或頻率(ff)大小的影響,頻數或頻率較大,該組數據的大小對算術平均數的影響就大,反之則小。 4、算術平均數的數學性質(1)各變量值與其算術平均數的離差之和等于零.(2)各變量值與其算術平均數的離差平方和最小. (3)兩個獨立的同性質變量代數和的平均數等于各變量平均數的代數和. (4)兩個獨立的同性質變量乘積的平均數等于各變量平均數的

41、乘積. 5、算術平均數的優(yōu)缺點: 優(yōu)點: a.)可推算總體標志總量;b.)便于代數運算; c.)抽樣中具有良好穩(wěn)定性。 缺點:a.)受極端值的影響大;b.)組距數列中有較大假設性。(二)調和平均數1問題的提出例:市場上蘋果的價格有三種:3元/斤;2.4元/斤;1.2元/斤,現有兩種可供選擇的方案:甲各買30元或乙各買15斤,問選擇何方案為優(yōu)?2調和平均數的概念(1) 概念:標志值倒數的算術平均數的倒數。調和平均數是變量值倒數的算術平均數的倒數。又稱倒數平均數。調和平均通常是作為算術平均數的變形來使用的。但一些特殊的領域,如綜合評價,調和平均卻是一種獨立的統(tǒng)計平均數,有著特定的應用價值

42、。(2) 特點: a ) 常作為算術平均數的變形 b) 標志值中有數據為零時無法計算。(3)簡單調和平均數適用范圍:末分組資料。(4)加權調和平均數 實質:加權算術平均數的變形。調和平均數易受極端值的影響,且受極小值的影響比受極大值的影響更大。只要有一個變量值為零,就不能計算調和平均數。當組距數列有開口組時,其組中值即使按相鄰組距計算了,假定性也很大,這時,調和平均數的代表性就很不可靠。調和平均數應用的范圍較小。 適用范圍:分組資料已知基本公式分子加總資料。(三)由相對數或平均數計算平均數 基本步驟:1.)寫出基本公式; 2.)確定計算公式;3.)具體計算。(四)幾和平均數幾何平均數

43、也稱幾何均值,它是n個變量值乘積的n次方根。適用對象:現象的總比率是若干項變量的乘積,或現象的總發(fā)展速度是各時期發(fā)展速度的連乘積時,計算平均比率或平均發(fā)展速度。1、簡單幾和平均數:直接將n項變量連乘,對其連乘積開n次方根所得的平均數即為簡單幾何平均數。 適用范圍:資料末分組,變量值互相影響。2、加權幾和平均數:與算術平均數一樣,當資料中的某些變量值重復出現時,相應地,簡單幾何平均數就變成了加權幾何平均數。 適用范圍:分組資料,變量值互相影響。幾何平均數特點:(1)受極端值的影響較算術平均數小。(2)如果變量值有負值,計算出的幾何平均數就會成為負數或虛數。(3)僅適用于具有等

44、比或近似等比關系的數據。(4)其對數是各變量值對數的算術平均數(五)算術平均數、調和平均數、幾和平均數的數學關系同一資料計算結果:xGH三、位置平均數位置平均數,就是根據總體中處于特殊位置上的個別單位或部分單位的標志值來確定的代表值,它對于整個總體來說,具有非常直觀的代表性,因此,常用來反映分布的集中趨勢。常用的眾數、中位數。(一)中位數1、中位數的概念:總體單位按某一標志值排隊后中間位置的標志值。中位數是將數據按大小順序排列起來,形成一個數列,居于數列中間位置的那個數據就是中位數。2、中位數的計算確定中位數,必須將總體各單位的標志值按大小順序排列,最好是編制出變量數列。這里有兩種情況:(1)

45、末分組資料中位數的計算基本步驟:1)將總體單位按某一標志進行排隊 ; 2)確定中數的位置:(n+1)/2 3)中間位置上的那個標志值即為中位數。 (2)分組資料中位數的計算基本步驟:1.)計算累計頻數(向上累計頻數或向下累計頻數); 2.)確定中位數的位置:f/2 3.) 單項數列:該組的標志值即為中位數 ;組距數列,根據上下限公式計算中位數。   (3)中位數的特點:中位數是以它在所有標志值中所處的位置確定的全體單位標志值的代表值,不受分布數列的極大或極小值影響,從而在一定程度上提高了中位數對分布數列的代表性。有些離散型變量的單項式數列,當次數分布偏態(tài)時,中位數的代表性會

46、受到影響。3)缺乏敏感性。 (二)分位數1、概念將變量的數值按大小順序排列并等分為若干部分后,處于等分點位置的數值。常用的分位數有四分位數、十分位數和百分位數。,和分別表示第一個、第二個和第三個四分位數,則他們的位置分別為:,和,根據位置即可確定各個四分位數。(三)眾數1、眾數的概念:眾數是指總體中出現次數最多的那個標志值。用Mo表示。它主要用于定類(品質標志)數據的集中趨勢,當然也適用于作為定序(品質標志)數據以及定距和定比(數量標志)數據集中趨勢的測度值。眾數也不受數列中極端變量值的影響,它可反映總體各單位某一標志值的集中趨勢。2、末分組資料眾數的計算:直接根據眾數概念(單項數列同)。&#

47、160; 3、分組資料眾數的計算:a.)確定眾數組;b.)根據上下限公式計算眾數的具體數值。   4眾數的特點眾數不受分布數列的極大或極小值的影響;當分組數列沒有任何一組的次數占多數,而是近似于均勻分布時,則該次數分配數列無眾數。若將無眾數的分布數列重新分組或各組頻數依序合并,又會使分配數列再現出明顯的集中趨勢。如果與眾數組相比鄰的上下兩組的次數相等,則眾數組的組中值就是眾數值;如果與眾數組比鄰的上一組的次數較多,而下一組的次數較少,則眾數在眾數組內會偏向該組下限;如果與眾數組比鄰的上一組的次數較少,而下一組的次數較多,則眾數在眾數組內會偏向該組上限。缺乏敏感性。

48、這是由于眾數的計算只利用了眾數組的數據信息,不象數值平均數那樣利用了全部數據信息。(四)中位數、眾數、算術平均數的關系在對稱分布(即正態(tài))時:在右偏時 :在左偏時 :適度偏態(tài)時 :第二節(jié)  離中趨勢的描述一、離中趨勢和離散指標離中趨勢,就是變量分布中各變量值背離中心值的傾向。如果說集中趨勢是總體或變量分布同質性的體現,那么離中趨勢就是總體或變量分布變異性的體現 。離散指標就是反映變量值變動范圍和差異程度的指標,即反映變量分布中各變量值遠離中心值或代表值程度的指標,亦稱為變異指標或標志變動度指標。離散指標是衡量平均指標代表性的尺度。一般來講,數據分布越分散,變異指標越大,平均指標的代表

49、性越?。粩祿植荚郊?,變異指標越小,平均指標的代表性越大。常用的離散指標主要有:全距(亦稱極差)、四分位差、異眾比率、平均差、標準差、離散系數等。離散指標的作用:用離散指標衡量和比較平均指標的代表性。用離散指標反映經濟活動過程的均衡性、穩(wěn)定性和節(jié)奏性。離散指標為統(tǒng)計推斷提供依據。 二、離散指標的測度(一)全距1、概念:總體各單位標志值中最大標志值與最小標志值之差。=- 2、特點:(1)簡明;(2)只反映變異范圍;(3)只受兩個數值影響;最容易受極端值影響。沒有反映中間數值的影響,沒有反映分布情況。(二)四分位差四分位差是四分位數中第一個四分位數與第三個四分位數之差,也稱為內距或四分間距,通常

50、用表示,即:通常與中位數相結合,用以表明變量分布中間50%數值的離散程度,(三)異眾比率異眾比率是分布數列中非眾數組的頻數與總頻數之比,通常用來表示,即:其中為眾數組的頻數。通常與眾數相結合,用以表明眾數代表性的高低。(四)平均差1、概念:總體各單位標志值與其算術平均數的離差絕對值的算術平均數。特點:(1)反映了全部標志值的變動情況;(2)受平均數水平高低、計量單位(不同性質的現象)影響;(3)取絕對值的方法消除離差正負號,不便于代數處理。2、平均差的計算: 優(yōu)點:利用了全部數據信息,能比較客觀反映變量分布的離散程度。不足:取了絕對值,因而數學處理不是很方便,數學性質也不是最優(yōu),應用

51、上受到了一些限制。(五)方差和標準差1、概念方差是變量的各變量值與其均值的離差平方的算術平均數,標準差則是方差的平方根。方差和標準差是測度變量分布離散程度最重要的指標。2、方差的計算公式為: (根據未分組數據) (根據變量數列)標準差的計算公式為: (根據未分組數據) (根據變量數列)優(yōu)點:方差和標準差利用了全部數據信息,因而能準確反映變量分布的離散程度。尤其是標準差與平均差相比,不僅具有平均差的優(yōu)點,而且彌補了平均差的不足,再加上標準差的計量單位與變量相同,意義比方差明確,所以標準差在實踐中得到了廣泛的應用。說明:一是根據組距式數列計算的方差和標準差只是一個近似值;二是在根據樣本數據(甚至是

52、有限總體數據)計算方差和標準差時,分母應該是(),但當很大時,可以忽略與之間的區(qū)別。3、方差和標準差的性質(1)常數的方差為0。(2)若,為常數,則的方差與的方差之間的關系為:(3)標準差是計算標準化值的依據。假設變量的標準化統(tǒng)計量用表示,標準化值用表示,則 服從均值為0、標準差為1的標準正態(tài)分布。也叫標準得分或標準統(tǒng)計值。 (六)離散系數為了不同變量分布之間離散程度的可比性,就必須消除不同均值水平和不同計量單位的影響,就應該計算相對離散指標。相對離散指標也叫離散系數變異系數或標準差系數,是變量的標準差與均值之比,通常用來表示,即:V和Vs分別表示總體離散系數和樣本離散系數。離散系數要是用于對

53、不同組別數據的離散程度進行比較,離散系數越大,說明變量分布的離散程度越強,平均數的代表性越差。三、是非標志的平均數和標準差是非標志,又稱交替標志,它是用“是” “否”或“有”“無”來表示的。由于是非標志只有兩個標志表現,使得研究問題大為簡化。常用1表示具有某種標志表現,其單位數用N1表示,用0表示不具有某種標志表現,其單位數用N0表示,全部總體單位數用N表示。這兩部分單位數(N1和N0)在總體單位數(N)中所占的比例,即 “是”或“非”的單位數在全體單位數中所占比例,稱為“成數”,分別記為p和q。1、是非標志的概念:品質標志中能用1或0進行描述的標志。2、成數:總體中標志值為1或標志值為0 的

54、單位數(N1和N0)占總體單位總數(N)的比重,用P或Q表示。其中: P=N1/N ; Q=N0/N ; P+Q=13、是非標志的平均數:是非標志的平均數=P4、是非標志的標準差: 5. 是非標志的標準差系數:例1:某批產品共500件,其中合格品480件,不合格品20件,要求計算成數、標準差和標準差系數。解:P=480/500=96%Q=20/500=4%標準差:(96%*4%)0.5=19.6%標準差系數:19.6%/96%0.2041第三節(jié) 分布形狀的描述一、分布形狀和形狀指標變量分布的形狀要用形狀指標來反映。形狀指標就是反映變量分布具體形狀,即左右是否對稱、偏斜程度與陡峭程度如何的指標。

55、 反映變量分布偏斜程度的指標,稱為偏度系數;反映變量分布陡峭程度的指標,稱為峰度系數。二、偏度系數偏度指變量分布偏斜的方向及其程度。偏度系數來實現的,通常用來表示。偏度系數的計算主要有以下三種方法:1、利用算術平均數與眾數或中位數的離差計算 一般情況下,偏度系數的變動范圍為(3,3)。當0時,為正值,變量分布屬于正偏;當0時,為負值,變量分布屬于負偏;當=0,變量分布屬于無偏(即對稱分布)。的絕對值越接近于3,表明變量分布的偏斜程度越嚴重;的絕對值越接近于0,表明變量分布的偏斜程度越輕微。2、利用四分位數計算 偏度系數的取值范圍為(1,1)。偏度系數的絕對值越接近于1,表明變量分布的偏斜程度越嚴重;偏度系

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論