應(yīng)用統(tǒng)計(jì)學(xué)講義_第1頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)講義_第2頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)講義_第3頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)講義_第4頁(yè)
應(yīng)用統(tǒng)計(jì)學(xué)講義_第5頁(yè)
已閱讀5頁(yè),還剩71頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《應(yīng)用統(tǒng)計(jì)學(xué)》講義

高曉彩編

西北大學(xué)公共管理學(xué)院

第一章緒論

第一節(jié)統(tǒng)計(jì)學(xué)的基本概念

一、一般稱謂

Statistics,單數(shù)表示“統(tǒng)計(jì)學(xué)”、復(fù)數(shù)表示“統(tǒng)計(jì)、統(tǒng)計(jì)數(shù)字、統(tǒng)計(jì)資料”。

*由學(xué)生給出實(shí)例

“全班管理學(xué)平均成績(jī)?yōu)?7分”——統(tǒng)計(jì)結(jié)果(資料)

“第四次人口普查”——統(tǒng)計(jì)工作過(guò)程

“用EXCEL軟件將05級(jí)人力資料管理班學(xué)生開(kāi)設(shè)的5門課程平均成績(jī)用

圖表進(jìn)行比較分析”---------分析統(tǒng)計(jì)數(shù)據(jù)的方法與技術(shù),即統(tǒng)計(jì)學(xué)。

二、統(tǒng)計(jì)學(xué)的定義

定義P2:統(tǒng)計(jì)學(xué)是研究數(shù)據(jù)收集、整理、顯示與分析方法(或公式)的科學(xué)。

目的是探索數(shù)據(jù)內(nèi)在數(shù)量規(guī)律性,以達(dá)到對(duì)客觀事物總體的科學(xué)認(rèn)識(shí)。

*以全班平均身高測(cè)量為例

1、數(shù)據(jù)收集的方法:研究如何獲得統(tǒng)計(jì)分析的原始數(shù)據(jù)。

身高測(cè)量的記錄紙——問(wèn)卷設(shè)計(jì)方法

全班都測(cè)嗎?——調(diào)查對(duì)象確定方法

用測(cè)量尺一個(gè)個(gè)測(cè)量還是打電話詢問(wèn)?——調(diào)查實(shí)施方法

2、數(shù)據(jù)整理方法:

有一份記錄紙記錄值為“0.76米”,是否記錄有誤?——資料審核方法

男、女生分開(kāi)計(jì)算平均值嗎?——統(tǒng)計(jì)分組方法

測(cè)量對(duì)象中男生占%、女生占%——統(tǒng)計(jì)匯總方法

3、數(shù)據(jù)顯示方法:

結(jié)果用語(yǔ)言描述還是做成表格?——統(tǒng)計(jì)表制作方法

表格不夠直觀,做成圖形。——統(tǒng)計(jì)圖制作

4、數(shù)據(jù)分析的方法:

研究如何通過(guò)統(tǒng)計(jì)描述和推斷的方法來(lái)探索數(shù)據(jù)內(nèi)在規(guī)律性。

“全班62人,抽取30人測(cè)量,平均身高為1.68米,分布基本為正態(tài)分布”

——數(shù)據(jù)描述

“由此估計(jì)全班平均身高為1.70米”-------統(tǒng)計(jì)推斷

三、學(xué)習(xí)方法與統(tǒng)計(jì)軟件

注重應(yīng)用。

2

EXCEL

SPSS(StatisticalProductandServiceSolutions),統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案,

原名為社會(huì)科學(xué)統(tǒng)計(jì)軟件包。

第二節(jié)統(tǒng)計(jì)學(xué)的分科

從方法構(gòu)成分類法、從方法研究與應(yīng)用分類法。

一、描述統(tǒng)計(jì)學(xué)與推斷統(tǒng)計(jì)學(xué)

(一)描述統(tǒng)計(jì)學(xué)(DescriptiveStatistics)

P7定義。內(nèi)容包括數(shù)據(jù)收集、整理、顯示與分布特征的描述。

1、數(shù)據(jù)收集與整理:?jiǎn)柧碓O(shè)計(jì)、資料審核、統(tǒng)計(jì)分組與統(tǒng)計(jì)匯總。(第二

章1-4節(jié))。

2、數(shù)據(jù)顯示:統(tǒng)計(jì)表、統(tǒng)計(jì)圖(如餅圖、線圖等)制作。(第二章9節(jié))

3、數(shù)據(jù)分布特征描述:(第三章5—7節(jié))

*以正態(tài)分布為例

一般水平(均值)--------集中趨勢(shì)

變異情況(標(biāo)準(zhǔn)差)--------離散趨勢(shì)

(二)推斷統(tǒng)計(jì)學(xué)(InferentialStatistics)

P7定義。如果數(shù)據(jù)的獲得是通過(guò)抽樣法取得,就需要用樣本(部分個(gè)體)

數(shù)據(jù)推斷總體(所有個(gè)體)數(shù)量特征。

1、參數(shù)(抽樣)估計(jì):(第四、五章)

用樣本統(tǒng)計(jì)量指標(biāo)值(均值、標(biāo)準(zhǔn)差、率等)推斷總體(所有個(gè)體)統(tǒng)計(jì)

指標(biāo)值。

例1:全班62人,抽取30人測(cè)量,平均身高為1.68米,分布基本為正態(tài)分布,

由此估計(jì)全班平均身高為多少?

2、假設(shè)檢驗(yàn):(第六章,兩個(gè)總體之間比較)

用樣本統(tǒng)計(jì)量指標(biāo)值檢驗(yàn)總體是否具體某種性質(zhì)。

例1:“廠家標(biāo)簽值每盒重250g對(duì)嗎?”——質(zhì)量檢驗(yàn)問(wèn)題。

例2:“本次技術(shù)改革是成功的?”——技改效果評(píng)價(jià)。

特例3:“美、英、日三國(guó)人均收入基本處于同一水平?”——多組比較(第

七章)。

特例4:“體重與身高成正比,用身高來(lái)預(yù)測(cè)一下身高”——相關(guān)與回歸分

析。(第八章)

3

(三)描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)的關(guān)系

P7圖l-lo

由描述統(tǒng)計(jì)獲得樣本統(tǒng)計(jì)量指標(biāo)值

在大概率條件下進(jìn)行推斷總體

推斷統(tǒng)計(jì)的結(jié)果是研究問(wèn)題的最終答案。

二、理論統(tǒng)計(jì)與應(yīng)用統(tǒng)計(jì)

1、TheoreticalStatistics:研究統(tǒng)計(jì)理論與方法的數(shù)理證明。

2、AppliedStatistics:研究用統(tǒng)計(jì)方法解決實(shí)際問(wèn)題。(第九章~第十二章)。

第三節(jié)統(tǒng)計(jì)學(xué)基本術(shù)語(yǔ)

一、總體、單位與樣本

1、總體(Population):指統(tǒng)計(jì)研究所確定的所有客觀對(duì)象構(gòu)成的集合。

總體確定實(shí)例分析:“第四次人口普查”、“西北大學(xué)學(xué)生狀況調(diào)查”

無(wú)限總體——總體單位無(wú)數(shù)總體、N很大的總體(抽樣比<5%)

有限總體——總體單位數(shù)有限

2、單位(Unit):用N表示總體所有單位數(shù)。

3、樣本(sample):

按隨機(jī)化原則從總體中抽取一定數(shù)量的單位所組成的小集合。

隨機(jī)抽樣

實(shí)例分析:政府政績(jī)反映與扶貧款申請(qǐng)兩種情況下的家庭人均收入調(diào)查。

樣本量(capacityofsample),用n表示。

大樣本:n>30o

小樣本:n<=30

二、標(biāo)志與指標(biāo)

1、標(biāo)志:指總體單位所具有的屬性(如性別、職業(yè)、身高等)。即問(wèn)卷設(shè)計(jì)

中每一個(gè)調(diào)查項(xiàng)目或變量。

品質(zhì)標(biāo)志(品質(zhì)變量):如性別、職業(yè)

數(shù)值標(biāo)志(數(shù)值變量):如身高、家庭經(jīng)濟(jì)

2、統(tǒng)計(jì)指標(biāo):綜合反映總體數(shù)量特征的概念和統(tǒng)計(jì)結(jié)果值。

如職工總?cè)藬?shù)為1200人,男性占60%,女性占40%。

三、參數(shù)與統(tǒng)計(jì)量

1、參數(shù)(parameter):指用于說(shuō)明總體的指標(biāo)。

4

均值一口

標(biāo)準(zhǔn)差----0

方差——。?

率——P

2、統(tǒng)計(jì)量(statistics):指用于說(shuō)明樣本的指標(biāo)。

均值一x

標(biāo)準(zhǔn)差——S

方差——S2

率——P

本章小結(jié):

以“西北大學(xué)學(xué)生消費(fèi)狀況分析”為例,讓學(xué)生總結(jié):(1)研究目標(biāo)

(2)研究過(guò)程及方法。

強(qiáng)調(diào):(1)研究的最終目標(biāo)是掌握總體特征。

(2)過(guò)程:

A、總體一>抽樣樣本測(cè)量一>總體特征值。需要概率論作中界。

B、總體每個(gè)單位都測(cè)量一>總體特征值。

5

第二章統(tǒng)計(jì)數(shù)據(jù)的描述

第一節(jié)數(shù)據(jù)的計(jì)量尺度

**何謂數(shù)據(jù)?

中文——反映客觀現(xiàn)象的數(shù)值、符號(hào)、圖形、音像資料等。強(qiáng)調(diào)了數(shù)據(jù)的來(lái)源,

即客觀現(xiàn)象。

英文"data"------informationpreparedforandoperatedonacomputerprogramme0

強(qiáng)調(diào)了數(shù)據(jù)的處理方式。

綜合之——數(shù)據(jù)是用一定的方法所測(cè)得的量化反映客觀事物屬性的信息。即收集

反映客觀事物屬性的信息(數(shù)據(jù))的第一步工作就是確定測(cè)量方法。

依據(jù)客觀事物屬性的不同特點(diǎn),其測(cè)量方法分為四種。

一、列名尺度(又稱定類尺度)

1、nominalscale:按事物的某種屬性對(duì)其進(jìn)行平行分類或分組。其劃分的各類

別之間無(wú)大小或優(yōu)劣之分,且次序可以改變。

2、適用:

取值只能大體進(jìn)行平行分類的品質(zhì)標(biāo)志(變量)。

3、記錄形式:

品質(zhì)變量名:類別名羅列或用無(wú)意數(shù)字代表。

例:性別:男/女

或性別:(1)男(2)女

二、順序尺度(又稱定序尺度)

1、ordinalscale:按事物的某種屬性對(duì)其進(jìn)行分類或分組基礎(chǔ)上,將類別等級(jí)

由大到小或由小到大排序。

2、適用:

取值可以進(jìn)行分類且各類別具有等級(jí)差異的品質(zhì)標(biāo)志(變量)。

3、記錄形式:

品質(zhì)變量名:類別名序號(hào)由大到小或由小到大排列。

例:文化程度:(1)文盲;(2)小學(xué);(3)初中;(4)高中以上。

三、間隔尺度(定距尺度)

Kintervalscale:選定一個(gè)測(cè)量單位,對(duì)數(shù)值標(biāo)志在分類排序基礎(chǔ)上測(cè)量其間

距。測(cè)量出的數(shù)值間有加、減意義,無(wú)乘除意義。

2、適用:

6

可用數(shù)值記錄其值而無(wú)比率意義的數(shù)值標(biāo)志。

3、記錄形式:

數(shù)值變量名:____________

四、比例尺度(定比尺度)

1、ratioscale:選定一個(gè)測(cè)量單位,對(duì)數(shù)值標(biāo)志在測(cè)量間距基礎(chǔ)上,測(cè)量其比

率。

2、適用:

可用數(shù)值記錄其值且有比率意義的數(shù)值標(biāo)志。

3、記錄形式:

數(shù)值變量名:____________

綜合例題分析:

企業(yè)狀況調(diào)查

企業(yè)類型:(1)民營(yíng);(2)合資企業(yè);(3)國(guó)有企業(yè)。

企業(yè)文化環(huán)境:(1)優(yōu)(2)良好(3)一般(4)較差(5)差

工人平均工資:

工人對(duì)企業(yè)管理的滿意度:1—2—3—4—5—6—7—8—9—10

第二節(jié)調(diào)查問(wèn)卷設(shè)計(jì)

-、問(wèn)卷構(gòu)成

(一)表頭:即調(diào)查表的名稱。

(二)表體

1、說(shuō)明詞(前言):包括問(wèn)候語(yǔ)、調(diào)查目的說(shuō)明、填表說(shuō)明和問(wèn)卷編號(hào)等。

2、調(diào)查項(xiàng)目

(三)表外附加:包括調(diào)查人簽名、調(diào)查日期、被調(diào)查人合作程度等。

二、實(shí)例練習(xí)

某家電企業(yè)想通過(guò)市場(chǎng)調(diào)查了解以下問(wèn)題:

(1)企業(yè)產(chǎn)品的知名度

(2)產(chǎn)品的市場(chǎng)占有率

(3)用戶對(duì)產(chǎn)品質(zhì)量的評(píng)價(jià)及滿意程度

讓學(xué)生設(shè)計(jì)一份調(diào)查問(wèn)卷,進(jìn)行講評(píng)。

7

第三節(jié)統(tǒng)計(jì)數(shù)據(jù)的收集

統(tǒng)計(jì)調(diào)查——社會(huì)經(jīng)濟(jì)類研究問(wèn)題

數(shù)據(jù)來(lái)源:直接來(lái)源

科學(xué)實(shí)驗(yàn)——自然科學(xué)類研究問(wèn)題

間接來(lái)源:圖書、期刊、網(wǎng)絡(luò)查詢等

本節(jié)主要講授統(tǒng)計(jì)調(diào)查。

一、統(tǒng)計(jì)調(diào)查的類型

(-)普查

1、定義:

指對(duì)總體中所有單位都實(shí)施調(diào)查。

如人口普查、農(nóng)業(yè)普查、庫(kù)存物資清查等。調(diào)查結(jié)果直接給出了總體的準(zhǔn)

確情況。

2、適用:

國(guó)家或部門需要準(zhǔn)確掌握其國(guó)情、國(guó)力及資源狀況時(shí)。

(二)重點(diǎn)調(diào)查

1、定義:在調(diào)查對(duì)象中選擇兒個(gè)在總體中占有絕大比重的單位進(jìn)行調(diào)查。

例:(1)對(duì)全國(guó)2005年鋼鐵生產(chǎn)狀況調(diào)查。

可對(duì)鞍鋼、上綱、武鋼、太鋼、寶鋼五大鋼鐵生產(chǎn)巨頭進(jìn)行調(diào)查。

(2)陜西師范類院校生源狀況調(diào)查。

可對(duì)陜師大、咸陽(yáng)師范學(xué)院、渭南師范等招生大的院校調(diào)查。

2、適用:

當(dāng)調(diào)查目的只要求掌握總體的大體狀況,而在總體中又明顯存在若干個(gè)能

集中反映總體狀況的單位時(shí)。

(三)抽樣調(diào)查

1、定義:根據(jù)隨機(jī)原則從調(diào)查總體中抽取一定數(shù)量的單位進(jìn)行調(diào)查,然后由

樣本統(tǒng)計(jì)量推斷總體。

例:中國(guó)西部地區(qū)成人受教育狀況調(diào)查。

普查、重點(diǎn)調(diào)查是否適用?

2、適用:

當(dāng)調(diào)查目的只要求掌握總體的大體狀況,而在總體中不存在或不明顯存在

8

若干個(gè)能集中反映總體狀況的單位時(shí)。

(四)典型調(diào)查

1、定義:指在對(duì)調(diào)查對(duì)象進(jìn)行全面分析基礎(chǔ)上,有意識(shí)選擇部分有典型性單

位進(jìn)行的調(diào)查。

例:交通事故調(diào)查中,對(duì)某些事故高發(fā)段或重大事故的調(diào)查。

2、適用:

對(duì)特殊事件或典型事例的分析。

二、基本抽樣方法

(-)簡(jiǎn)單隨機(jī)抽樣法

1、定義:指對(duì)總體單位不進(jìn)行任何的分類或排序,完全按隨機(jī)化原則進(jìn)行。

2、適用資料:總體各單位特征差異較小。

3、基本方法

(1)抽簽法:為無(wú)任何抽樣工具下采用的一種最簡(jiǎn)單的方法,抽出的樣

本誤一般較大。

(2)隨機(jī)數(shù)字表法:在無(wú)計(jì)算機(jī)抽樣工具情況下采用。

**用隨機(jī)數(shù)字表進(jìn)行說(shuō)明。課堂演示。

(3)計(jì)算機(jī)隨機(jī)抽樣法

在EXCEL軟件中用RAND()函數(shù)。

**結(jié)合上機(jī)操作說(shuō)明

(-)分層抽樣

1、定義:按影響調(diào)查結(jié)果的某一標(biāo)志對(duì)總體進(jìn)行分層(類),在各層中進(jìn)行

隨機(jī)抽樣。

2、適用資料:總體各類別中存在有較大的特征差異。

3、方法

(1)按影響調(diào)查結(jié)果的某一標(biāo)志對(duì)總體進(jìn)行分層,或按空間方位進(jìn)行分層。

例:(1)大學(xué)生消費(fèi)狀況調(diào)查,可按年級(jí)分為大1~大4四類

(2)產(chǎn)品全國(guó)市場(chǎng)調(diào)查,可按東、南、西、北、中分別抽取五大城市

調(diào)查。

(2)確定樣本量n(待講)

(3)確定各層的抽樣數(shù)目nl

有兩種分配方法:

9

等額分配法----ni=n/k

等比例分配法—ni=Ni/N*n

(4)按簡(jiǎn)單隨機(jī)法在各層進(jìn)行抽樣。

n=Zni

(三)等距抽樣法

1、定義:對(duì)總體單位進(jìn)行排序基礎(chǔ)上,按一定的間距進(jìn)行抽樣。

2、適用資料?:

(1)總體各單位數(shù)值存在由大到小的順序差異。

如工資料調(diào)查

(2)總體各單位的位置自然處于排序狀態(tài)

如居民門牌號(hào)、企業(yè)自動(dòng)生產(chǎn)線上的產(chǎn)品。

3、方法

(1)無(wú)關(guān)標(biāo)志排隊(duì)等距抽樣法

指排隊(duì)標(biāo)志與調(diào)查內(nèi)容無(wú)關(guān)(適用2)。

A、按無(wú)關(guān)標(biāo)志對(duì)各單位進(jìn)行排隊(duì);

B、計(jì)算抽樣間距

K=N/n

C、按間距K進(jìn)行抽樣

**以“某小區(qū)共有1500戶居民,從中抽取300戶進(jìn)行調(diào)查”為例講解

K=5,在第1間距內(nèi)任意取1戶為起點(diǎn)(如第3戶)進(jìn)行抽樣。

(2)有關(guān)標(biāo)志排隊(duì)等距抽樣

(1)半距起點(diǎn)法

**圖示說(shuō)明

I——O——I——O——I——O——I——O——I——O——I——o—

優(yōu)點(diǎn)是較簡(jiǎn)單,但僅能抽到一個(gè)樣本。

(2)對(duì)稱等距抽樣

**圖示說(shuō)明

1—0---------1----0—1—0---------1----0—1—0---------1----0—|

(四)整群抽樣法

10

1、定義:將總體按某指標(biāo)分為若干部分(群),然后以“群”為單位進(jìn)行抽

樣,對(duì)抽到“群”中的所有個(gè)體都進(jìn)行調(diào)查。

如:以班為單位的抽樣調(diào)查

***以主講教師本人參加的項(xiàng)目“秦巴山區(qū)示范區(qū)兒童MR患病狀況調(diào)查”

為例

其中有一個(gè)鄉(xiāng)共有6個(gè)自然村,0~14歲兒童人數(shù)分別為190、134、116、106、

144、175。用整群法抽取430名兒童進(jìn)行調(diào)查。

**讓學(xué)生用抽簽法進(jìn)行抽樣。

三、數(shù)據(jù)整理

1、資料審核

邏輯排除法、極端數(shù)據(jù)排除、計(jì)算等

2、分組

(1)按品質(zhì)標(biāo)志分組——品質(zhì)型數(shù)列

(2)按數(shù)值標(biāo)志分組一一離散型數(shù)列、組距式數(shù)列(組下限、組上限、組距、

全距)

上機(jī)實(shí)踐操作1:

一、EXCEL軟件介紹

二、SPSS軟件介紹

(-)>啟動(dòng)

Whatwouldyouliketodo?

Runthetutorial瀏覽操作指導(dǎo)

Typeindata顯示數(shù)據(jù)編輯窗口,建立新數(shù)據(jù)文件

Runanexistingquery運(yùn)行已存在的文件

CreatenewqueryusingDatabaseWizard運(yùn)用數(shù)據(jù)庫(kù)向?qū)Ы⒁粋€(gè)新文件

Openanexistingdatasource打開(kāi)已存在的數(shù)據(jù)文件

Openanthertypeoffile打開(kāi)其它類型的文件

(二)數(shù)據(jù)編輯

1、定義變量:對(duì)立數(shù)據(jù)結(jié)構(gòu)或產(chǎn)生一個(gè)空白表

VariableView

11

(1)Name不超過(guò)8個(gè)字符

(2)Type:Numeric(標(biāo)準(zhǔn)數(shù)值型)、comma(顯示逗號(hào)的數(shù)值型)、Dot

(顯示句點(diǎn)的數(shù)值型)、Scientificnotation(科學(xué)計(jì)數(shù)型)、Date(日期型)、Dollar

(美元型)、Customcurrency(自定義型)、String(字符型)

(3)Width填寫數(shù)據(jù)的最大字符數(shù)

(4)Decimals小數(shù)點(diǎn)位數(shù)

(5)Label變量名標(biāo)簽,起注釋作用

(6)Values變量值標(biāo)簽,對(duì)變量可能取值進(jìn)一步描述

(7)Missing定義缺失值

(8)Columns顯示變量的長(zhǎng)度

(9)Align變量對(duì)齊方式

(10)Measure變量的測(cè)量尺度

Nominal(定性)、Ordinal(定序)、Scale(定距或定比)

2、編輯數(shù)據(jù)(點(diǎn)Dataview)

輸入數(shù)據(jù),可用“edit”窗口進(jìn)行

3、修改

可用edit、data窗口結(jié)合完成,變量、觀察值的修改、刪除、增加。

(三)數(shù)據(jù)整理(Data窗口)

Sortcases排序

Selectcases選擇數(shù)據(jù)(如對(duì)所有女生進(jìn)行操作)

Aggregate分類匯總

Mergrfiles文件合并

(四)數(shù)據(jù)轉(zhuǎn)換(Transform窗口)

由1個(gè)或兩個(gè)變量值產(chǎn)生出一個(gè)新變量的值

(五)分析(Analyze)

作業(yè):(1)輸入“學(xué)生科研情況調(diào)查表”

(2)從1-30個(gè)數(shù)字中抽樣10個(gè)數(shù)字

12

第四節(jié)數(shù)據(jù)統(tǒng)計(jì)匯總

指在分組基礎(chǔ)上,對(duì)數(shù)據(jù)分布情況用表(頻數(shù)分布表)或圖(統(tǒng)計(jì)圖)進(jìn)行

描述。

一、頻數(shù)分布表

(-)>定義:指在統(tǒng)計(jì)分組基礎(chǔ)上,對(duì)附合各組特征的單位進(jìn)行分類匯總,形

成總體各單位在各組中的分布,又稱分布數(shù)列。

(二)一般形式

由三列組成:

標(biāo)志(valid)頻數(shù)(frequency)頻率(percent)

組1

組2

合計(jì)(total)

(三)類型

**以P21-P23為例,讓學(xué)生先看數(shù)列表,再講解。

單項(xiàng)數(shù)列:(1)品質(zhì)變量P21表2.4、表2.5

(2)離散型數(shù)值變量,數(shù)據(jù)類型較少P22表2.6

組距數(shù)列:(1)離散型數(shù)值變量,數(shù)據(jù)類型較多;P23表2.8

(2)連續(xù)型數(shù)值變量。

組上限——每組最大值

組下限——每組最小值

組距——組上限-下限

(四)編制

1、單項(xiàng)數(shù)列表

用計(jì)算機(jī)自動(dòng)完成

SPSS----》analysis----》descriptivestatistic----》frequency

2、組距數(shù)列表

人工與計(jì)算機(jī)結(jié)合完成。

(1)確定組數(shù)

A、經(jīng)驗(yàn)法或行業(yè)約定法。

13

例:P23表2.9對(duì)年齡的分組按人群特點(diǎn)分為嬰幼兒、少年兒童、中青年、

老年。

B、正態(tài)分布數(shù)據(jù):斯特吉斯經(jīng)驗(yàn)公式法(Sturges'rule)o

K=l+3.3221ogl0"

n——數(shù)據(jù)個(gè)數(shù)K——組數(shù)

(2)計(jì)算組距

等距數(shù)列d=(極大值-極小值)/K

(3)確定各組上、下限

第一組:下限=總體數(shù)據(jù)極小值-組距/2

上限=總體數(shù)據(jù)極小值+組距/2

其它組順延。

(4)計(jì)算各組頻數(shù)、頻率、累積頻數(shù)、累積頻率、組中值

頻數(shù)、頻率:計(jì)算時(shí)可用計(jì)算機(jī)進(jìn)行——按各組上、下以及上限組不在內(nèi)

原則進(jìn)行數(shù)據(jù)分類替換,再進(jìn)行匯總。

累積頻數(shù)、累積頻率:

向上累積值意義——指達(dá)到本組上限以下的人數(shù)或比例。

向下累積值意義——指達(dá)到本組下限以上的人數(shù)或比例。

組中值=(組上限+下限)/2

缺下限組組中值=上限-鄰組組距/2

缺上限組組中值=下限+鄰組組距/2

綜合練習(xí):50名工人,最少日加工零件數(shù)為107件,最多為139件,試編制距

式頻數(shù)分布表

K=l+3.3221ogl050=7

D=(139-107)/7=5

■wr

105-110

110-115

115-120

120-125

125-130

130-135

134-140

14

二、頻數(shù)分布圖

直方圖:以組距為X軸,頻數(shù)或頻率為Y軸

折線圖:連接直方圖各組中值。

P25圖2.2

當(dāng)N為無(wú)窮大時(shí),形成光滑線,即得分布曲線。

P25圖2.3正態(tài)、偏態(tài)分布(左、右偏的特點(diǎn))

洛倫茨曲線:以組距為X軸,累積頻數(shù)為Y軸

P25圖2.4

第五節(jié)統(tǒng)計(jì)圖制作

數(shù)據(jù)顯示包括了統(tǒng)計(jì)表的統(tǒng)計(jì)圖兩種主要形式,本節(jié)主要講述圖與表的配合

使用及其制作。

一、常用統(tǒng)計(jì)圖

1、條形圖(barcharts)

圖例:以各組代表值為X軸,以測(cè)量值為Y軸。

**給出不同的數(shù)據(jù)表、圖例,并講解適用情況

適用:(1)同一總體,不同測(cè)量指標(biāo)值(標(biāo)準(zhǔn)分?jǐn)?shù))的比較;

——同班同學(xué)不同課程考試成績(jī)比較。

(2)不同總體,同質(zhì)性測(cè)量指標(biāo)值間的比較。

——不同班級(jí)同一門課程考試成績(jī)的比較。

2、餅圖(pie)

圖例:以各組數(shù)據(jù)值構(gòu)成餅圖各扇形面積,總面積之各為100虬

**給出數(shù)據(jù)表、圖例,并講解適用情況

適用:(1)同一總體,不同部分所占比例的比較,用餅圖;

——P23表2.8或同班同學(xué)不同年齡組學(xué)生所占比例的比較。

(2)不同總體,同質(zhì)性部分所占比例的比較,用環(huán)形圖。

——兩個(gè)班各年齡組學(xué)生所占比例的相互比較。

3、線圖(line)

圖例:以時(shí)間為X軸,以測(cè)量值為Y軸。

**給出數(shù)據(jù)表、圖例,并講解適用情況

適用:隨時(shí)間變化的數(shù)據(jù),發(fā)展趨勢(shì)分析。

15

4、散點(diǎn)圖(scatterplots)

圖例:以第一變量為X軸,第二變量為Y軸。

**給出數(shù)據(jù)表、圖例,并講解適用情況

適用:兩個(gè)變量相關(guān)關(guān)系趨勢(shì)分析。

5、直方圖(histogram)

圖例:以各組組距或代表值為X軸,以頻數(shù)或頻率為Y軸。

適用:數(shù)據(jù)分布趨勢(shì)分析。

上機(jī)實(shí)踐操作2:

(1)頻數(shù)分布表、直方圖制作。

P59第1題

(2)其它統(tǒng)計(jì)圖制作

用P61第6題數(shù)據(jù)制作餅圖。

第六節(jié)數(shù)據(jù)分布集中趨勢(shì)測(cè)量

指計(jì)算一組數(shù)據(jù)的一般水平或中心值。

一、均值(mean)

總體用也樣本用于。

表示總體或樣本人群的平均水平。

(一)公式:

1、未分組數(shù)據(jù)(第一手資料)

P32公式2.3

xi——每個(gè)觀察值

n——數(shù)據(jù)個(gè)數(shù)

2、分組資料(二手資料)

P32公式2.4——給出頻數(shù)的二手資料

xi——每組組中值或代表值

fi——每組頻數(shù)

16

P32公式2.5——給出頻率的二手資料

xi——每組組中值或代表值

fi/Sfi——每組頻率

(二)適用資料

正態(tài)分布的數(shù)值型變量。

如身高、體重、IQ等。

二、眾數(shù)Mode

指調(diào)查數(shù)據(jù)中出現(xiàn)次數(shù)最多的標(biāo)志值。用M。表示。

表示總體或樣本人群中大多數(shù)人的水平。

(一)公式:

1、未分組一手?jǐn)?shù)據(jù)

即為調(diào)查數(shù)據(jù)中出現(xiàn)次數(shù)最多的標(biāo)志值。

例:P22,表2.6

Mo=19

表示本班大多數(shù)學(xué)生為19歲.

2、分組組距式數(shù)據(jù)

P29公式2.1

L一眾數(shù)組下限

A1——眾數(shù)組頻數(shù)與上一組頻數(shù)之差。

△2——眾數(shù)組頻數(shù)與下一組頻數(shù)之差。

i——眾數(shù)組組距

例:P23,表2.8數(shù)據(jù)

眾數(shù)組(頻數(shù)最大的組)為第3組,

Mo=100+(13-7)/(13-7+13-5)*10=104.29(件)

(二)適用資料

(1)用定序尺度測(cè)量的組距式數(shù)據(jù)

例:

問(wèn)卷變量為家庭人月均收入:(1)200-400;(2)400-600;(3)600-800;

4)800以上

要計(jì)算當(dāng)?shù)卮蠖鄶?shù)家庭的人月均收入水平。

17

(2)社會(huì)經(jīng)濟(jì)現(xiàn)象中不宜用均值作為一般水平的現(xiàn)象。

如:車輛高度、服裝加工等

(3)數(shù)值型數(shù)據(jù),數(shù)據(jù)明顯為偏態(tài)分布,極差較小(尖峰分布)

三、中位數(shù)median

指調(diào)查數(shù)據(jù)由低到高排列后,處于最中間位置的標(biāo)志值。用Me表示。

表示總體或樣本人群中處于中等水平的個(gè)體水平。

(一)公式:

1、未分組一手?jǐn)?shù)據(jù)

數(shù)據(jù)排序后

n為奇數(shù)時(shí):

Me=X(n+1)/2

n為偶數(shù)時(shí):

Me=(Xn/2+Xn/2+1)/2

例:P22,表2.7數(shù)據(jù)排序后,第15位(30/2)數(shù)據(jù)為103件,第16位(30/2+1)

數(shù)據(jù)為105件,則:

Me=(103105)/2=104(件)

表示30名工人中,處于中等水平的工人日加工零件數(shù)為104件。

2、分組組距式數(shù)據(jù)

P31公式2.2

N/2——中位數(shù)組位置,即向下累積達(dá)到次數(shù)半值的組

L——中位數(shù)組下限

Sm-1——中位數(shù)組以前各組的頻數(shù)之各和。

fm——中位數(shù)組頻數(shù)

i——中位數(shù)組組距

例:P24,表2.10數(shù)據(jù)

中位數(shù)組為第3組,

Mo=100+(15-10)713*10=103.8(^)

(二)適用資料

(1)用定序尺度測(cè)量的組距式數(shù)據(jù)

例:

問(wèn)卷變量為家庭人月均收入:(1)200-400;(2)400-600;(3)600-800;

18

4)800以上

要計(jì)算當(dāng)?shù)刂械人郊彝サ娜嗽戮杖胨健?/p>

(2)數(shù)值型數(shù)據(jù),數(shù)據(jù)明顯為偏態(tài)分布,極差較大(偏峰分布)

***兒何均值、分位數(shù)、切尾均值自學(xué)了解。

綜合練習(xí):

2004年,對(duì)某市500戶居民家庭月收入抽樣調(diào)查數(shù)據(jù)為:

組別戶數(shù)

500元以下40

500-80090

800-1100110

1100-1400105

1400-170070

1700-200050

200以上35

合計(jì)500

求:(1)本市居民家庭平均月收入

(2)本市大多數(shù)居民家庭月收入

(3)本市中等水平居民家庭月收入

第七節(jié)數(shù)據(jù)分布離散趨勢(shì)測(cè)量

***圖示并舉例說(shuō)明

例:數(shù)據(jù)3、3、4的平均值為3.3,數(shù)據(jù)1、5、4的平均值同樣是3.3,其

區(qū)別是,第一組數(shù)據(jù)每個(gè)值與均值相差不大,而第二組差異較大。(讓學(xué)生自己

計(jì)算并總結(jié))。

即:離散趨勢(shì)測(cè)量是描述一組數(shù)據(jù)中,每個(gè)觀察值偏離平均值的狀況,即數(shù)

據(jù)的變異性。

一、常用離散趨勢(shì)測(cè)量指標(biāo)

(一)極差(range)

1、公式

R=max(xi)-min(xi)

19

**值的圖示及意義說(shuō)明(分布曲線的跨度)

2、適用資料:

偏態(tài)分布數(shù)據(jù),即一般水平用Mo、Me表示時(shí),其離差狀況用R表示。

(二)方差與標(biāo)準(zhǔn)差(variance,standarddeviation)

方差:總體用。2表示,樣本用d表示;

標(biāo)準(zhǔn)差:總體用。表示,樣本用S表示。

1、公式

(1)未分組一手資料

總體:

2(xrx)2

o2=----------

N

£(xj-x)2

o=SQR(----------)

N

樣本:

Z(Xi-x)2

s2=----------P40,公式2.10

n-l

£(Xi-x)2Sxi2-(ZxD2/n

s=SQR(----------)=SQR(---------------)**計(jì)算機(jī)編程公式

n-ln-l

Xi-------每個(gè)觀察值

n-l----自由度(degreeoffreedom,df)

(1)表示數(shù)據(jù)中與均值進(jìn)行離差計(jì)算數(shù)據(jù)的個(gè)數(shù)。由于當(dāng)n=l時(shí),x,=x

勺元=0,因此,在總離差計(jì)算數(shù)據(jù)的個(gè)數(shù)中要減去1。

(2)表示在n個(gè)單位中,當(dāng)均值一定時(shí),可自由取值的單位個(gè)數(shù)。

例:有5個(gè)數(shù)據(jù)1、2、3、4、5,其均值為3,則只有四個(gè)單位可經(jīng)自由取

值,最后一個(gè)為定值。

(2)分組二手資料

以樣本為例:

s2——P41,公式2.11

20

S——P41,公式2.13

提問(wèn):Xi、fi各代表什么?

2、標(biāo)準(zhǔn)差的特點(diǎn)及適用資料

特點(diǎn):(1)有單位,與測(cè)量指標(biāo)單位相同。

**圖示其意義,1S表示平均差異的單位值)

(2)有正、負(fù),+說(shuō)明高于均值,-表示低于均值

**圖示說(shuō)明:正態(tài)分布中,界于均值與±1S、均值與±2S之間以及低于均值

IS、2s的意義,從而引出大、小概率的含義。

適用:正態(tài)分布數(shù)據(jù),即一般水平用均值表示時(shí),其離差狀況用S表示。

(三)離散系數(shù)

1、公式

P42公式2.14**分別對(duì)應(yīng)于總體及樣本

2、特點(diǎn)及適用資料

特點(diǎn):無(wú)單位的標(biāo)準(zhǔn)化值。

適用:(1)對(duì)同一總體不同測(cè)量指標(biāo)的離散程度進(jìn)行比較。

例:對(duì)全班同學(xué)體重測(cè)量得到的標(biāo)準(zhǔn)差為18kg,身高測(cè)量得到的標(biāo)準(zhǔn)差為

0.18m,對(duì)二者的離散程度進(jìn)行比較。能否直接比較?

(2)對(duì)不同總體同一測(cè)量指標(biāo)的離散程度進(jìn)行比較。

例:對(duì)全班同學(xué)體重測(cè)量得到女生的標(biāo)準(zhǔn)差為6kg,男生測(cè)量得到的標(biāo)準(zhǔn)差

為18kg,對(duì)二者的離散程度進(jìn)行比較。能否直接比較?

二、標(biāo)準(zhǔn)差的應(yīng)用

(一)計(jì)算標(biāo)準(zhǔn)分?jǐn)?shù)(standardscore)

對(duì)總體狀況進(jìn)行綜合評(píng)價(jià)計(jì)算總分時(shí),為使不同測(cè)量指標(biāo)之間值具有可加

性,從而使用了標(biāo)準(zhǔn)分?jǐn)?shù)法。

例:對(duì)個(gè)體綜合實(shí)力進(jìn)行評(píng)價(jià),有健康指標(biāo)(身高、體重)、智商、心理素

質(zhì)、人際交往等,由于測(cè)量指標(biāo)間使用工具及單位的不同,不能直接用原始分?jǐn)?shù)

進(jìn)行簡(jiǎn)單相加,必須進(jìn)行標(biāo)準(zhǔn)分?jǐn)?shù)化后才可評(píng)價(jià)。

1、公式

一般公式_

Xj-X

Z=----------

S

Xi?測(cè)量的原始分?jǐn)?shù)

21

z分?jǐn)?shù)的變異公式:

為消除Z分?jǐn)?shù)的負(fù)值和小數(shù),對(duì)Z進(jìn)行擴(kuò)大。

T=aZ+b

2、以高考分?jǐn)?shù)計(jì)算為例(P2知識(shí)閱讀)

單科分_

Xj-X

Z=--------

S

Xi——表示考生某門課程的原始分?jǐn)?shù)

5、S分別代表全國(guó)考生某門課程的平均分?jǐn)?shù)和標(biāo)準(zhǔn)差

總分

Z總、=Z語(yǔ)文+Z數(shù)學(xué)+Z英語(yǔ)+Z理綜

例:甲生乙生全國(guó)考生

語(yǔ)文120115100(10)

數(shù)學(xué)9595110(15)

英語(yǔ)130120120(10)

理綜合210240210(15)

總分550555

從原始分?jǐn)?shù)看,優(yōu)生錄取乙

標(biāo)準(zhǔn)分?jǐn)?shù):Z甲=2Z乙=1.9應(yīng)優(yōu)生錄取甲。

(二)檢驗(yàn)數(shù)據(jù)分布的形態(tài)

1、檢驗(yàn)數(shù)據(jù)分布的偏態(tài)---偏斜系數(shù)(skewness)

2(Xi-x)3fj

SK=-----------

nS3

SK=O,正態(tài)分布

SK<0,左偏分布

SK>0,右偏分布

2、檢驗(yàn)數(shù)據(jù)分布的峰態(tài)---峰度系數(shù)(kurtosis)

22

Z(xrx)4fj

K=---------------3

nS4

K=0,正態(tài)分布

K<0,平峰分布

K>0,尖峰分布

三、數(shù)據(jù)分布特點(diǎn)描述指標(biāo)的綜合選擇

在分別掌握了集中趨勢(shì)(元、Mo、Me)、離散趨勢(shì)(R、S)、偏態(tài)(SK)

及峰度(K)后,如何從計(jì)算機(jī)給出的多種指標(biāo)值中選擇適合研究者所取數(shù)據(jù)的

分布特點(diǎn)值呢?

(1)當(dāng)SK=O時(shí),即正態(tài)分布時(shí),選取無(wú)、S分別作為集中與離散趨勢(shì)指標(biāo),

表不為:xiS

(2)當(dāng)SKW0,且K<0,即偏態(tài)平峰分布時(shí),選取Me、R分別作為集中

與離散趨勢(shì)指標(biāo),

表示為:MeR(或范圍min~max)

(3)當(dāng)SKW0,且K>0,即偏態(tài)尖峰分布時(shí),選取Mo、R分別作為集中

與離散趨勢(shì)指標(biāo),

表示為:MOR(或范圍min~max)

上機(jī)實(shí)踐操作3:

數(shù)據(jù)集中與離散趨勢(shì)測(cè)量.

SPSS----analysis----descriptive-----frequency-----statistics

centraltendency、dispersion、distribution

作業(yè):(1)用P60第2題求出無(wú)、Mo、Me、R、S值

(2)依據(jù)數(shù)據(jù)分布特點(diǎn),選擇適合本組數(shù)據(jù)分布趨勢(shì)的指標(biāo)值

本章小結(jié):本章應(yīng)重點(diǎn)掌握

(1)調(diào)查問(wèn)卷設(shè)計(jì)及四種計(jì)量尺度的適用情況;

(2)常用統(tǒng)計(jì)方法及其應(yīng)用

(3)常用數(shù)據(jù)集中趨勢(shì)與離散趨勢(shì)測(cè)量指標(biāo)及其應(yīng)用

(4)常用統(tǒng)計(jì)圖應(yīng)用情況及其制作。

23

第三章概率與概率分布

第一節(jié)概率論基礎(chǔ)

-、概率的基本概念

1、隨機(jī)現(xiàn)象

指在一定條件下可能發(fā)生也可能不發(fā)生的現(xiàn)象。

***思考

(1)調(diào)查問(wèn)卷中的項(xiàng)目(標(biāo)志)、樣本統(tǒng)計(jì)量(1、S、P)屬于隨機(jī)變量

嗎?

(2)問(wèn)卷中的項(xiàng)目(標(biāo)志)、樣本統(tǒng)計(jì)量(亍、S、P)的取值是否屬于隨

機(jī)現(xiàn)象?

2、隨機(jī)試驗(yàn)

指對(duì)隨機(jī)現(xiàn)象取值規(guī)律進(jìn)行觀察的過(guò)程。

***思考

統(tǒng)計(jì)調(diào)查過(guò)程屬于隨機(jī)試驗(yàn)嗎?它觀察的是什么的取值規(guī)律?是對(duì)問(wèn)卷中

的項(xiàng)目(標(biāo)志)、樣本統(tǒng)計(jì)量(無(wú)、S、P)的取值規(guī)律進(jìn)行觀察嗎?

3、隨機(jī)事件

指隨機(jī)試驗(yàn)的每一個(gè)可能出現(xiàn)的結(jié)果。

***思考

調(diào)查問(wèn)卷中品質(zhì)型變量所設(shè)計(jì)的選擇項(xiàng)(如性別:(1)男;(2)女)、數(shù)值型

變量調(diào)查時(shí)每份問(wèn)卷所填寫的值屬于隨機(jī)事件嗎?

4、樣本空間

指隨機(jī)試驗(yàn)所有可能結(jié)果的集合。

***舉例說(shuō)明

5、統(tǒng)計(jì)概率(試驗(yàn)概率)

定義:P74o設(shè)在相同條件下重復(fù)試驗(yàn)n次,事件A發(fā)生的次數(shù)為m,則事件

A發(fā)生的頻率為m/n,當(dāng)n~>8時(shí),m/n趨于一個(gè)定值p,則稱p為事件A的概

率。

P(A)=p??m/n

反概率q^l-p

***思考:

在家庭人口數(shù)頻數(shù)分布表中,m、n、p各代表什么?事件A如何表示?

24

6、概率分布

指隨機(jī)變量所有取值的概率所形成的分布數(shù)列或分布圖。

例:P74表3.1,頻數(shù)分布與概率分布的關(guān)系

**當(dāng)!1玲8時(shí),頻數(shù)分布即為概率分布。

與頻數(shù)分布相同,概率分布也相應(yīng)劃分為離散型概率分布、連續(xù)型概率分布。

二、概率論與推斷統(tǒng)計(jì)的關(guān)系

推斷統(tǒng)計(jì)是研究如何用樣本統(tǒng)計(jì)量推斷總體參數(shù)值,原則是在已知樣本方、S、

P取值概率分布形式的基礎(chǔ)上,在大概率條件下進(jìn)行推斷。

1、斤、S、P的概率分布形式

又稱為抽樣分布。經(jīng)大量研究表明:

x----大樣本下服從正態(tài)分布

小樣本下服從t分布

S——單個(gè)樣本的S2服從Xz分布,兩個(gè)樣本S//S2?服從F分布

P——大樣本下近似服從正態(tài)分布

小樣本下服從二項(xiàng)分布

2、大、小概率及臨界值

(1)一般的,將概率值在95%以上為大概率事件,概率值小于5%的稱為

小概率事件。

(2)臨界值指發(fā)生小概率事件的臨界點(diǎn)值。

第二節(jié)、常用隨機(jī)變量的概率分布及其應(yīng)用

一、離散型隨機(jī)變量概率分布

(-)分布形式及特點(diǎn)

1、分布表示形式:

(1)表格式*P83表3.2等同于離散型頻數(shù)分布表

(2)函數(shù)與累積分布函數(shù)式

函數(shù)式:

P(X=Xi)i=l,2,3,4,*P83

累積分布函數(shù)式:

F(X)=P(XWx)=2P(Xi)等同于離散型頻數(shù)分布表中的頻率的向下

累積

(3)圖示式(形):*P83圖3.5

25

2、性質(zhì)

(1)P(Xi)20

(2)SP(Xi)=l

(二)二項(xiàng)分布

指只有兩種可能取值結(jié)果的隨機(jī)變量的概率分布,并將其中一個(gè)結(jié)果稱為

“成功事件”,另一個(gè)稱為“失敗事件”

1、定義

P87

kknk

P(X=K)=Cnp(1-p)'

記為X~b(n,p)

例:人口調(diào)查結(jié)果表明,男性比率為50%,求在100份問(wèn)卷中,男性問(wèn)卷

出現(xiàn)10人的概率?

P(X=10)=CiooIOO.510(1-0.5)100-10

2、二項(xiàng)分布數(shù)學(xué)用表的使用

為累積概率分布表

二、連續(xù)型隨機(jī)變量的概率分布

(一)概率密度函數(shù)與概率分布函數(shù)

統(tǒng)計(jì)數(shù)據(jù)在其頻數(shù)分布基礎(chǔ)上,形成直方圖與折線圖,當(dāng)n-8時(shí),折圖變

為光滑曲線以及由曲線與X軸相圍形成曲線下的面積,如果該光滑曲線可用方程

f(x)表示,則稱其為概率密度函數(shù);如果曲線下的面積可用方程F(x)表示,

則稱其為概率分布函數(shù)。

**圖示說(shuō)明

1、概率密度函數(shù)

P83

設(shè)X為連續(xù)型隨機(jī)變量X(-8,+8),a,b(a<b)為任意兩個(gè)實(shí)數(shù),如果存

在一個(gè)非負(fù)的可積分函數(shù)f(x),使得X在(a,b)區(qū)間上取值的概率為:

P(a<X<b)=/\f(x)dx

則稱f(x)為X的概率密度函數(shù)。

**圖示說(shuō)明,在該區(qū)間上概率值實(shí)際上等于曲線與a—》b線段圍成的面積值。

26

2、概率分布函數(shù)

P84

設(shè)X為連續(xù)型隨機(jī)變量X(-8,+8),X為任意一個(gè)實(shí)數(shù),f(x)為X的概

率密度函數(shù),P(XWx)為X的向下累積概率,則稱P(XWx)為X的概率分

布函數(shù),記作F(x),則:

F(x)=P(X<x)=/.Jf(x)dx

**圖示說(shuō)明,概率分布函數(shù)實(shí)際上為曲線在-8一》x范圍的面積方程。

(二)連續(xù)型概率分布函數(shù)的性質(zhì)

(1)F(x)20,*曲線f(x)總位于X軸上方。

(2)F(x)=/」8f(x)dx=l*曲線f(x)與X軸間的總面積等于1。

bb

(3)P(a<X<b)=/af(x)dx=f.?f(x)dx-f.Jf(x)dx

(三)正態(tài)分布

1、定義:P91,公式3.27。分布圖形見(jiàn)P91圖3.7

記為X~N(U,o2)

如,成年男子身高X~N(L72,0.272)

2、性質(zhì)P93圖3.8

(1)曲線以X=u為對(duì)稱軸左右對(duì)稱,且在X=u處達(dá)到峰值。

正態(tài)分布為一個(gè)分布族,當(dāng)口與。變化時(shí),曲線變化。

(2)f(x)dx=0.6826

11+20

(3)fM.2af(x)dx=0.9545^0.95(或95%),

即大概率區(qū)間,用ba表示

*則左尾+右尾心0.05,即小概率區(qū)間,用a=0.05表示。

左尾=右尾=a/2=0.025

**圖示說(shuō)明大概率、左尾與右尾小概率。

(4)/一3。"+3設(shè)(x)dx=0.9973^0.99(或99%),即極大概率區(qū)間

*則左尾+右尾心0.01,即極小概率區(qū)間,用a=0.05表示。

左尾=右尾=a/2=0.005

**圖示說(shuō)明大概率、左尾與右尾小概率。

(四)標(biāo)準(zhǔn)正態(tài)分布

27

1、定義:P92o即均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布。

記為X~N(0,1)

標(biāo)準(zhǔn)正態(tài)分布為一個(gè)唯一的曲線。

2、一般正態(tài)分布的標(biāo)準(zhǔn)分布化

若X~N(U,。>則變量Z=(X-U)/。服從(0,1)分布。

例:身高X~N(1.72,0.27,),

則身高X的標(biāo)準(zhǔn)分?jǐn)?shù)變量2=(X-1.72)/0.27為服從(0,1)分布。

(五)標(biāo)準(zhǔn)正態(tài)分布大、小概率臨界值的確定

**再次圖示說(shuō)明大、小概率以及臨界點(diǎn)。

1、標(biāo)準(zhǔn)正態(tài)分布表——附表1P434

x列為變量X的最小取值的第1位整數(shù)與小數(shù);

橫行表示變量X最小取值的第2位小數(shù);

坐標(biāo)點(diǎn)上的值表示從(-8,x)的累積概率值;

例:求X<=1.12的概率,0.868643

2、用標(biāo)準(zhǔn)正態(tài)分布表查臨界值

a=0.05時(shí),查坐標(biāo)點(diǎn)P=0.975,知96

a=0.01時(shí),查坐標(biāo)點(diǎn)P=0.995,知Z0.oo5=2.58

應(yīng)用例:已知成年男子身高X~N(1.72,0.272),某同學(xué)身高測(cè)量值為2.30,試在

a=0.05時(shí)判斷其身高發(fā)生是否為小概率事件?

解:該同學(xué)身高標(biāo)準(zhǔn)值為

Z=(2.30-1.72)/0.27=2.14

由于a=0.05時(shí),大小概率臨界值為Zo.o25=l.96,該同學(xué)身高Z大于此值,

因此為小概率事件。

三、t分布、X。分布、F分布

(一)、t分布

1、分布曲線:圖示說(shuō)明。(了解)

記作:X-t(df)

2、用t分布表查臨界值——P436,附表2o

左列:為不同的自由度

模行:不同的右尾a值,常用0.025、0.005兩列。

28

坐標(biāo)點(diǎn)值:為臨界值

例:a=0.05,df=12時(shí),to.025.12=2.1788

a=0.01,df=12時(shí),to.nos.12=3.0545

**讓學(xué)生查:

=

a=0.05)df16時(shí),to.025.16=-

=

a=0.01,df16時(shí),t<),cos.i6=?

應(yīng)用例:已知在小樣本下,成年男子身高服從t分布

(X-1.72)

t=------------------

027/SQR(n)

某班有學(xué)生28人,有?同學(xué)身高測(cè)量值為1.68,試在a=0.05時(shí)判斷其身高

發(fā)生是否為小概率事件?

解:該同學(xué)身高t值為

t=(1.68-1.72)/O.27/SQR(27)=-0.77

由于a=0.05時(shí),大小概率臨界值為L(zhǎng)隔27=2.0518,即-M咻27=-2.0518該同學(xué)

身高t大于此值,因此為大概率事件。

(二)、X?分布

1、分布曲線:由海爾墨特(Hermert)和卡.皮爾遜(K.Pearson)Pl16,圖示說(shuō)

明。(了解)

記作:X~x2(df)

2、用一分布表查臨界值——P437,附表3。

左列:為不同的自由度

模行:不同的右尾a值,常用0.05、0.01兩列。

坐標(biāo)點(diǎn)值:為臨界值

例:a=0.05,df=12時(shí),X),05.12=21.026

a=0.01,df=12時(shí),to.oi,12=26.217

**讓學(xué)生查:

2-Q

a=0.05,df=16時(shí),X0.05,16一?

2_

a=0.01,df=16時(shí),AY0.01.16~??

應(yīng)用例:已知男、女生愛(ài)好結(jié)構(gòu)X服從(分布,某班有學(xué)生28人,男、女愛(ài)

好結(jié)構(gòu)一值3.27,試在a=0.05,df=3時(shí)判斷其值是否為小概率事件?

29

解:a=0.05,df=3時(shí),大小概率臨界值為X2°M3=7.815,該班x?值小于此

值,因此為大概率事件。

(三)、F分布

1、分布曲線:以統(tǒng)計(jì)學(xué)家R.A.Fisher姓氏的第一字母命名,P120,圖示說(shuō)明。

(了解)

記作:X?F(dfl,df2)

2、用F分布表查臨界值——P439,附表4。

左列:分母自由度

模行:分子自由度

坐標(biāo)點(diǎn)值:不同a下的臨界值,常用a=0.05區(qū)(P440)

例:a=0.05,dfl=12,df2=13時(shí),x—⑵后2.67

**讓學(xué)生查:

a=0.05,dfl=15時(shí),df2=21,F0—=?

應(yīng)用例:已知男、女生愛(ài)考試成績(jī)方差之比服從F分布,某班有女生11人,

男生17人,女生與男生某課程方差之比F值為4.27,試在a=0.05,dfl=10,

df2=16時(shí)判斷其值是否為小概率事件?

解:a=0.05,dfl=10,df2=16時(shí),大小概率臨界值為F。⑻。…=2.49,該班

F值大于此值,因此為小概率事件。

本章小結(jié):本章應(yīng)重點(diǎn)掌握

(1)推斷統(tǒng)計(jì)與概率論的關(guān)系

(2)常見(jiàn)概率分布大、小臨界值的確定方法(四種數(shù)學(xué)用表的查法)

30

第四章抽樣分布

研究當(dāng)把亍、S、P、X1-X2>S|2/s/、P1-P2這些來(lái)自于樣本的統(tǒng)計(jì)量,重

新當(dāng)成隨機(jī)變量時(shí),它們的概率分布屬于哪種形式。

第一節(jié)抽樣分布的基本概念及應(yīng)用

一、抽樣分布的概念

1、抽樣分布:假設(shè)從一個(gè)總體中抽取容量相同的各種樣本,則從這些樣本

計(jì)算出的某統(tǒng)計(jì)量的所有可能取值的概率分布,稱為該統(tǒng)計(jì)量的抽樣分布。

**圖示說(shuō)明。P108-P110

抽樣調(diào)查設(shè)計(jì)為m個(gè)小組,各組都調(diào)查15個(gè),得到不同的均值,求其頻數(shù)

分布:

X頻率

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論