




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
《應(yīng)用統(tǒng)計(jì)學(xué)》講義
高曉彩編
西北大學(xué)公共管理學(xué)院
第一章緒論
第一節(jié)統(tǒng)計(jì)學(xué)的基本概念
一、一般稱謂
Statistics,單數(shù)表示“統(tǒng)計(jì)學(xué)”、復(fù)數(shù)表示“統(tǒng)計(jì)、統(tǒng)計(jì)數(shù)字、統(tǒng)計(jì)資料”。
*由學(xué)生給出實(shí)例
“全班管理學(xué)平均成績(jī)?yōu)?7分”——統(tǒng)計(jì)結(jié)果(資料)
“第四次人口普查”——統(tǒng)計(jì)工作過(guò)程
“用EXCEL軟件將05級(jí)人力資料管理班學(xué)生開(kāi)設(shè)的5門課程平均成績(jī)用
圖表進(jìn)行比較分析”---------分析統(tǒng)計(jì)數(shù)據(jù)的方法與技術(shù),即統(tǒng)計(jì)學(xué)。
二、統(tǒng)計(jì)學(xué)的定義
定義P2:統(tǒng)計(jì)學(xué)是研究數(shù)據(jù)收集、整理、顯示與分析方法(或公式)的科學(xué)。
目的是探索數(shù)據(jù)內(nèi)在數(shù)量規(guī)律性,以達(dá)到對(duì)客觀事物總體的科學(xué)認(rèn)識(shí)。
*以全班平均身高測(cè)量為例
1、數(shù)據(jù)收集的方法:研究如何獲得統(tǒng)計(jì)分析的原始數(shù)據(jù)。
身高測(cè)量的記錄紙——問(wèn)卷設(shè)計(jì)方法
全班都測(cè)嗎?——調(diào)查對(duì)象確定方法
用測(cè)量尺一個(gè)個(gè)測(cè)量還是打電話詢問(wèn)?——調(diào)查實(shí)施方法
2、數(shù)據(jù)整理方法:
有一份記錄紙記錄值為“0.76米”,是否記錄有誤?——資料審核方法
男、女生分開(kāi)計(jì)算平均值嗎?——統(tǒng)計(jì)分組方法
測(cè)量對(duì)象中男生占%、女生占%——統(tǒng)計(jì)匯總方法
3、數(shù)據(jù)顯示方法:
結(jié)果用語(yǔ)言描述還是做成表格?——統(tǒng)計(jì)表制作方法
表格不夠直觀,做成圖形。——統(tǒng)計(jì)圖制作
4、數(shù)據(jù)分析的方法:
研究如何通過(guò)統(tǒng)計(jì)描述和推斷的方法來(lái)探索數(shù)據(jù)內(nèi)在規(guī)律性。
“全班62人,抽取30人測(cè)量,平均身高為1.68米,分布基本為正態(tài)分布”
——數(shù)據(jù)描述
“由此估計(jì)全班平均身高為1.70米”-------統(tǒng)計(jì)推斷
三、學(xué)習(xí)方法與統(tǒng)計(jì)軟件
注重應(yīng)用。
2
EXCEL
SPSS(StatisticalProductandServiceSolutions),統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案,
原名為社會(huì)科學(xué)統(tǒng)計(jì)軟件包。
第二節(jié)統(tǒng)計(jì)學(xué)的分科
從方法構(gòu)成分類法、從方法研究與應(yīng)用分類法。
一、描述統(tǒng)計(jì)學(xué)與推斷統(tǒng)計(jì)學(xué)
(一)描述統(tǒng)計(jì)學(xué)(DescriptiveStatistics)
P7定義。內(nèi)容包括數(shù)據(jù)收集、整理、顯示與分布特征的描述。
1、數(shù)據(jù)收集與整理:?jiǎn)柧碓O(shè)計(jì)、資料審核、統(tǒng)計(jì)分組與統(tǒng)計(jì)匯總。(第二
章1-4節(jié))。
2、數(shù)據(jù)顯示:統(tǒng)計(jì)表、統(tǒng)計(jì)圖(如餅圖、線圖等)制作。(第二章9節(jié))
3、數(shù)據(jù)分布特征描述:(第三章5—7節(jié))
*以正態(tài)分布為例
一般水平(均值)--------集中趨勢(shì)
變異情況(標(biāo)準(zhǔn)差)--------離散趨勢(shì)
(二)推斷統(tǒng)計(jì)學(xué)(InferentialStatistics)
P7定義。如果數(shù)據(jù)的獲得是通過(guò)抽樣法取得,就需要用樣本(部分個(gè)體)
數(shù)據(jù)推斷總體(所有個(gè)體)數(shù)量特征。
1、參數(shù)(抽樣)估計(jì):(第四、五章)
用樣本統(tǒng)計(jì)量指標(biāo)值(均值、標(biāo)準(zhǔn)差、率等)推斷總體(所有個(gè)體)統(tǒng)計(jì)
指標(biāo)值。
例1:全班62人,抽取30人測(cè)量,平均身高為1.68米,分布基本為正態(tài)分布,
由此估計(jì)全班平均身高為多少?
2、假設(shè)檢驗(yàn):(第六章,兩個(gè)總體之間比較)
用樣本統(tǒng)計(jì)量指標(biāo)值檢驗(yàn)總體是否具體某種性質(zhì)。
例1:“廠家標(biāo)簽值每盒重250g對(duì)嗎?”——質(zhì)量檢驗(yàn)問(wèn)題。
例2:“本次技術(shù)改革是成功的?”——技改效果評(píng)價(jià)。
特例3:“美、英、日三國(guó)人均收入基本處于同一水平?”——多組比較(第
七章)。
特例4:“體重與身高成正比,用身高來(lái)預(yù)測(cè)一下身高”——相關(guān)與回歸分
析。(第八章)
3
(三)描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)的關(guān)系
P7圖l-lo
由描述統(tǒng)計(jì)獲得樣本統(tǒng)計(jì)量指標(biāo)值
在大概率條件下進(jìn)行推斷總體
推斷統(tǒng)計(jì)的結(jié)果是研究問(wèn)題的最終答案。
二、理論統(tǒng)計(jì)與應(yīng)用統(tǒng)計(jì)
1、TheoreticalStatistics:研究統(tǒng)計(jì)理論與方法的數(shù)理證明。
2、AppliedStatistics:研究用統(tǒng)計(jì)方法解決實(shí)際問(wèn)題。(第九章~第十二章)。
第三節(jié)統(tǒng)計(jì)學(xué)基本術(shù)語(yǔ)
一、總體、單位與樣本
1、總體(Population):指統(tǒng)計(jì)研究所確定的所有客觀對(duì)象構(gòu)成的集合。
總體確定實(shí)例分析:“第四次人口普查”、“西北大學(xué)學(xué)生狀況調(diào)查”
無(wú)限總體——總體單位無(wú)數(shù)總體、N很大的總體(抽樣比<5%)
有限總體——總體單位數(shù)有限
2、單位(Unit):用N表示總體所有單位數(shù)。
3、樣本(sample):
按隨機(jī)化原則從總體中抽取一定數(shù)量的單位所組成的小集合。
隨機(jī)抽樣
實(shí)例分析:政府政績(jī)反映與扶貧款申請(qǐng)兩種情況下的家庭人均收入調(diào)查。
樣本量(capacityofsample),用n表示。
大樣本:n>30o
小樣本:n<=30
二、標(biāo)志與指標(biāo)
1、標(biāo)志:指總體單位所具有的屬性(如性別、職業(yè)、身高等)。即問(wèn)卷設(shè)計(jì)
中每一個(gè)調(diào)查項(xiàng)目或變量。
品質(zhì)標(biāo)志(品質(zhì)變量):如性別、職業(yè)
數(shù)值標(biāo)志(數(shù)值變量):如身高、家庭經(jīng)濟(jì)
2、統(tǒng)計(jì)指標(biāo):綜合反映總體數(shù)量特征的概念和統(tǒng)計(jì)結(jié)果值。
如職工總?cè)藬?shù)為1200人,男性占60%,女性占40%。
三、參數(shù)與統(tǒng)計(jì)量
1、參數(shù)(parameter):指用于說(shuō)明總體的指標(biāo)。
4
均值一口
標(biāo)準(zhǔn)差----0
方差——。?
率——P
2、統(tǒng)計(jì)量(statistics):指用于說(shuō)明樣本的指標(biāo)。
均值一x
標(biāo)準(zhǔn)差——S
方差——S2
率——P
本章小結(jié):
以“西北大學(xué)學(xué)生消費(fèi)狀況分析”為例,讓學(xué)生總結(jié):(1)研究目標(biāo)
(2)研究過(guò)程及方法。
強(qiáng)調(diào):(1)研究的最終目標(biāo)是掌握總體特征。
(2)過(guò)程:
A、總體一>抽樣樣本測(cè)量一>總體特征值。需要概率論作中界。
B、總體每個(gè)單位都測(cè)量一>總體特征值。
5
第二章統(tǒng)計(jì)數(shù)據(jù)的描述
第一節(jié)數(shù)據(jù)的計(jì)量尺度
**何謂數(shù)據(jù)?
中文——反映客觀現(xiàn)象的數(shù)值、符號(hào)、圖形、音像資料等。強(qiáng)調(diào)了數(shù)據(jù)的來(lái)源,
即客觀現(xiàn)象。
英文"data"------informationpreparedforandoperatedonacomputerprogramme0
強(qiáng)調(diào)了數(shù)據(jù)的處理方式。
綜合之——數(shù)據(jù)是用一定的方法所測(cè)得的量化反映客觀事物屬性的信息。即收集
反映客觀事物屬性的信息(數(shù)據(jù))的第一步工作就是確定測(cè)量方法。
依據(jù)客觀事物屬性的不同特點(diǎn),其測(cè)量方法分為四種。
一、列名尺度(又稱定類尺度)
1、nominalscale:按事物的某種屬性對(duì)其進(jìn)行平行分類或分組。其劃分的各類
別之間無(wú)大小或優(yōu)劣之分,且次序可以改變。
2、適用:
取值只能大體進(jìn)行平行分類的品質(zhì)標(biāo)志(變量)。
3、記錄形式:
品質(zhì)變量名:類別名羅列或用無(wú)意數(shù)字代表。
例:性別:男/女
或性別:(1)男(2)女
二、順序尺度(又稱定序尺度)
1、ordinalscale:按事物的某種屬性對(duì)其進(jìn)行分類或分組基礎(chǔ)上,將類別等級(jí)
由大到小或由小到大排序。
2、適用:
取值可以進(jìn)行分類且各類別具有等級(jí)差異的品質(zhì)標(biāo)志(變量)。
3、記錄形式:
品質(zhì)變量名:類別名序號(hào)由大到小或由小到大排列。
例:文化程度:(1)文盲;(2)小學(xué);(3)初中;(4)高中以上。
三、間隔尺度(定距尺度)
Kintervalscale:選定一個(gè)測(cè)量單位,對(duì)數(shù)值標(biāo)志在分類排序基礎(chǔ)上測(cè)量其間
距。測(cè)量出的數(shù)值間有加、減意義,無(wú)乘除意義。
2、適用:
6
可用數(shù)值記錄其值而無(wú)比率意義的數(shù)值標(biāo)志。
3、記錄形式:
數(shù)值變量名:____________
四、比例尺度(定比尺度)
1、ratioscale:選定一個(gè)測(cè)量單位,對(duì)數(shù)值標(biāo)志在測(cè)量間距基礎(chǔ)上,測(cè)量其比
率。
2、適用:
可用數(shù)值記錄其值且有比率意義的數(shù)值標(biāo)志。
3、記錄形式:
數(shù)值變量名:____________
綜合例題分析:
企業(yè)狀況調(diào)查
企業(yè)類型:(1)民營(yíng);(2)合資企業(yè);(3)國(guó)有企業(yè)。
企業(yè)文化環(huán)境:(1)優(yōu)(2)良好(3)一般(4)較差(5)差
工人平均工資:
工人對(duì)企業(yè)管理的滿意度:1—2—3—4—5—6—7—8—9—10
第二節(jié)調(diào)查問(wèn)卷設(shè)計(jì)
-、問(wèn)卷構(gòu)成
(一)表頭:即調(diào)查表的名稱。
(二)表體
1、說(shuō)明詞(前言):包括問(wèn)候語(yǔ)、調(diào)查目的說(shuō)明、填表說(shuō)明和問(wèn)卷編號(hào)等。
2、調(diào)查項(xiàng)目
(三)表外附加:包括調(diào)查人簽名、調(diào)查日期、被調(diào)查人合作程度等。
二、實(shí)例練習(xí)
某家電企業(yè)想通過(guò)市場(chǎng)調(diào)查了解以下問(wèn)題:
(1)企業(yè)產(chǎn)品的知名度
(2)產(chǎn)品的市場(chǎng)占有率
(3)用戶對(duì)產(chǎn)品質(zhì)量的評(píng)價(jià)及滿意程度
讓學(xué)生設(shè)計(jì)一份調(diào)查問(wèn)卷,進(jìn)行講評(píng)。
7
第三節(jié)統(tǒng)計(jì)數(shù)據(jù)的收集
統(tǒng)計(jì)調(diào)查——社會(huì)經(jīng)濟(jì)類研究問(wèn)題
數(shù)據(jù)來(lái)源:直接來(lái)源
科學(xué)實(shí)驗(yàn)——自然科學(xué)類研究問(wèn)題
間接來(lái)源:圖書、期刊、網(wǎng)絡(luò)查詢等
本節(jié)主要講授統(tǒng)計(jì)調(diào)查。
一、統(tǒng)計(jì)調(diào)查的類型
(-)普查
1、定義:
指對(duì)總體中所有單位都實(shí)施調(diào)查。
如人口普查、農(nóng)業(yè)普查、庫(kù)存物資清查等。調(diào)查結(jié)果直接給出了總體的準(zhǔn)
確情況。
2、適用:
國(guó)家或部門需要準(zhǔn)確掌握其國(guó)情、國(guó)力及資源狀況時(shí)。
(二)重點(diǎn)調(diào)查
1、定義:在調(diào)查對(duì)象中選擇兒個(gè)在總體中占有絕大比重的單位進(jìn)行調(diào)查。
例:(1)對(duì)全國(guó)2005年鋼鐵生產(chǎn)狀況調(diào)查。
可對(duì)鞍鋼、上綱、武鋼、太鋼、寶鋼五大鋼鐵生產(chǎn)巨頭進(jìn)行調(diào)查。
(2)陜西師范類院校生源狀況調(diào)查。
可對(duì)陜師大、咸陽(yáng)師范學(xué)院、渭南師范等招生大的院校調(diào)查。
2、適用:
當(dāng)調(diào)查目的只要求掌握總體的大體狀況,而在總體中又明顯存在若干個(gè)能
集中反映總體狀況的單位時(shí)。
(三)抽樣調(diào)查
1、定義:根據(jù)隨機(jī)原則從調(diào)查總體中抽取一定數(shù)量的單位進(jìn)行調(diào)查,然后由
樣本統(tǒng)計(jì)量推斷總體。
例:中國(guó)西部地區(qū)成人受教育狀況調(diào)查。
普查、重點(diǎn)調(diào)查是否適用?
2、適用:
當(dāng)調(diào)查目的只要求掌握總體的大體狀況,而在總體中不存在或不明顯存在
8
若干個(gè)能集中反映總體狀況的單位時(shí)。
(四)典型調(diào)查
1、定義:指在對(duì)調(diào)查對(duì)象進(jìn)行全面分析基礎(chǔ)上,有意識(shí)選擇部分有典型性單
位進(jìn)行的調(diào)查。
例:交通事故調(diào)查中,對(duì)某些事故高發(fā)段或重大事故的調(diào)查。
2、適用:
對(duì)特殊事件或典型事例的分析。
二、基本抽樣方法
(-)簡(jiǎn)單隨機(jī)抽樣法
1、定義:指對(duì)總體單位不進(jìn)行任何的分類或排序,完全按隨機(jī)化原則進(jìn)行。
2、適用資料:總體各單位特征差異較小。
3、基本方法
(1)抽簽法:為無(wú)任何抽樣工具下采用的一種最簡(jiǎn)單的方法,抽出的樣
本誤一般較大。
(2)隨機(jī)數(shù)字表法:在無(wú)計(jì)算機(jī)抽樣工具情況下采用。
**用隨機(jī)數(shù)字表進(jìn)行說(shuō)明。課堂演示。
(3)計(jì)算機(jī)隨機(jī)抽樣法
在EXCEL軟件中用RAND()函數(shù)。
**結(jié)合上機(jī)操作說(shuō)明
(-)分層抽樣
1、定義:按影響調(diào)查結(jié)果的某一標(biāo)志對(duì)總體進(jìn)行分層(類),在各層中進(jìn)行
隨機(jī)抽樣。
2、適用資料:總體各類別中存在有較大的特征差異。
3、方法
(1)按影響調(diào)查結(jié)果的某一標(biāo)志對(duì)總體進(jìn)行分層,或按空間方位進(jìn)行分層。
例:(1)大學(xué)生消費(fèi)狀況調(diào)查,可按年級(jí)分為大1~大4四類
(2)產(chǎn)品全國(guó)市場(chǎng)調(diào)查,可按東、南、西、北、中分別抽取五大城市
調(diào)查。
(2)確定樣本量n(待講)
(3)確定各層的抽樣數(shù)目nl
有兩種分配方法:
9
等額分配法----ni=n/k
等比例分配法—ni=Ni/N*n
(4)按簡(jiǎn)單隨機(jī)法在各層進(jìn)行抽樣。
n=Zni
(三)等距抽樣法
1、定義:對(duì)總體單位進(jìn)行排序基礎(chǔ)上,按一定的間距進(jìn)行抽樣。
2、適用資料?:
(1)總體各單位數(shù)值存在由大到小的順序差異。
如工資料調(diào)查
(2)總體各單位的位置自然處于排序狀態(tài)
如居民門牌號(hào)、企業(yè)自動(dòng)生產(chǎn)線上的產(chǎn)品。
3、方法
(1)無(wú)關(guān)標(biāo)志排隊(duì)等距抽樣法
指排隊(duì)標(biāo)志與調(diào)查內(nèi)容無(wú)關(guān)(適用2)。
A、按無(wú)關(guān)標(biāo)志對(duì)各單位進(jìn)行排隊(duì);
B、計(jì)算抽樣間距
K=N/n
C、按間距K進(jìn)行抽樣
**以“某小區(qū)共有1500戶居民,從中抽取300戶進(jìn)行調(diào)查”為例講解
K=5,在第1間距內(nèi)任意取1戶為起點(diǎn)(如第3戶)進(jìn)行抽樣。
(2)有關(guān)標(biāo)志排隊(duì)等距抽樣
(1)半距起點(diǎn)法
**圖示說(shuō)明
I——O——I——O——I——O——I——O——I——O——I——o—
優(yōu)點(diǎn)是較簡(jiǎn)單,但僅能抽到一個(gè)樣本。
(2)對(duì)稱等距抽樣
**圖示說(shuō)明
1—0---------1----0—1—0---------1----0—1—0---------1----0—|
(四)整群抽樣法
10
1、定義:將總體按某指標(biāo)分為若干部分(群),然后以“群”為單位進(jìn)行抽
樣,對(duì)抽到“群”中的所有個(gè)體都進(jìn)行調(diào)查。
如:以班為單位的抽樣調(diào)查
***以主講教師本人參加的項(xiàng)目“秦巴山區(qū)示范區(qū)兒童MR患病狀況調(diào)查”
為例
其中有一個(gè)鄉(xiāng)共有6個(gè)自然村,0~14歲兒童人數(shù)分別為190、134、116、106、
144、175。用整群法抽取430名兒童進(jìn)行調(diào)查。
**讓學(xué)生用抽簽法進(jìn)行抽樣。
三、數(shù)據(jù)整理
1、資料審核
邏輯排除法、極端數(shù)據(jù)排除、計(jì)算等
2、分組
(1)按品質(zhì)標(biāo)志分組——品質(zhì)型數(shù)列
(2)按數(shù)值標(biāo)志分組一一離散型數(shù)列、組距式數(shù)列(組下限、組上限、組距、
全距)
上機(jī)實(shí)踐操作1:
一、EXCEL軟件介紹
二、SPSS軟件介紹
(-)>啟動(dòng)
Whatwouldyouliketodo?
Runthetutorial瀏覽操作指導(dǎo)
Typeindata顯示數(shù)據(jù)編輯窗口,建立新數(shù)據(jù)文件
Runanexistingquery運(yùn)行已存在的文件
CreatenewqueryusingDatabaseWizard運(yùn)用數(shù)據(jù)庫(kù)向?qū)Ы⒁粋€(gè)新文件
Openanexistingdatasource打開(kāi)已存在的數(shù)據(jù)文件
Openanthertypeoffile打開(kāi)其它類型的文件
(二)數(shù)據(jù)編輯
1、定義變量:對(duì)立數(shù)據(jù)結(jié)構(gòu)或產(chǎn)生一個(gè)空白表
VariableView
11
(1)Name不超過(guò)8個(gè)字符
(2)Type:Numeric(標(biāo)準(zhǔn)數(shù)值型)、comma(顯示逗號(hào)的數(shù)值型)、Dot
(顯示句點(diǎn)的數(shù)值型)、Scientificnotation(科學(xué)計(jì)數(shù)型)、Date(日期型)、Dollar
(美元型)、Customcurrency(自定義型)、String(字符型)
(3)Width填寫數(shù)據(jù)的最大字符數(shù)
(4)Decimals小數(shù)點(diǎn)位數(shù)
(5)Label變量名標(biāo)簽,起注釋作用
(6)Values變量值標(biāo)簽,對(duì)變量可能取值進(jìn)一步描述
(7)Missing定義缺失值
(8)Columns顯示變量的長(zhǎng)度
(9)Align變量對(duì)齊方式
(10)Measure變量的測(cè)量尺度
Nominal(定性)、Ordinal(定序)、Scale(定距或定比)
2、編輯數(shù)據(jù)(點(diǎn)Dataview)
輸入數(shù)據(jù),可用“edit”窗口進(jìn)行
3、修改
可用edit、data窗口結(jié)合完成,變量、觀察值的修改、刪除、增加。
(三)數(shù)據(jù)整理(Data窗口)
Sortcases排序
Selectcases選擇數(shù)據(jù)(如對(duì)所有女生進(jìn)行操作)
Aggregate分類匯總
Mergrfiles文件合并
(四)數(shù)據(jù)轉(zhuǎn)換(Transform窗口)
由1個(gè)或兩個(gè)變量值產(chǎn)生出一個(gè)新變量的值
(五)分析(Analyze)
作業(yè):(1)輸入“學(xué)生科研情況調(diào)查表”
(2)從1-30個(gè)數(shù)字中抽樣10個(gè)數(shù)字
12
第四節(jié)數(shù)據(jù)統(tǒng)計(jì)匯總
指在分組基礎(chǔ)上,對(duì)數(shù)據(jù)分布情況用表(頻數(shù)分布表)或圖(統(tǒng)計(jì)圖)進(jìn)行
描述。
一、頻數(shù)分布表
(-)>定義:指在統(tǒng)計(jì)分組基礎(chǔ)上,對(duì)附合各組特征的單位進(jìn)行分類匯總,形
成總體各單位在各組中的分布,又稱分布數(shù)列。
(二)一般形式
由三列組成:
標(biāo)志(valid)頻數(shù)(frequency)頻率(percent)
組1
組2
合計(jì)(total)
(三)類型
**以P21-P23為例,讓學(xué)生先看數(shù)列表,再講解。
單項(xiàng)數(shù)列:(1)品質(zhì)變量P21表2.4、表2.5
(2)離散型數(shù)值變量,數(shù)據(jù)類型較少P22表2.6
組距數(shù)列:(1)離散型數(shù)值變量,數(shù)據(jù)類型較多;P23表2.8
(2)連續(xù)型數(shù)值變量。
組上限——每組最大值
組下限——每組最小值
組距——組上限-下限
(四)編制
1、單項(xiàng)數(shù)列表
用計(jì)算機(jī)自動(dòng)完成
SPSS----》analysis----》descriptivestatistic----》frequency
2、組距數(shù)列表
人工與計(jì)算機(jī)結(jié)合完成。
(1)確定組數(shù)
A、經(jīng)驗(yàn)法或行業(yè)約定法。
13
例:P23表2.9對(duì)年齡的分組按人群特點(diǎn)分為嬰幼兒、少年兒童、中青年、
老年。
B、正態(tài)分布數(shù)據(jù):斯特吉斯經(jīng)驗(yàn)公式法(Sturges'rule)o
K=l+3.3221ogl0"
n——數(shù)據(jù)個(gè)數(shù)K——組數(shù)
(2)計(jì)算組距
等距數(shù)列d=(極大值-極小值)/K
(3)確定各組上、下限
第一組:下限=總體數(shù)據(jù)極小值-組距/2
上限=總體數(shù)據(jù)極小值+組距/2
其它組順延。
(4)計(jì)算各組頻數(shù)、頻率、累積頻數(shù)、累積頻率、組中值
頻數(shù)、頻率:計(jì)算時(shí)可用計(jì)算機(jī)進(jìn)行——按各組上、下以及上限組不在內(nèi)
原則進(jìn)行數(shù)據(jù)分類替換,再進(jìn)行匯總。
累積頻數(shù)、累積頻率:
向上累積值意義——指達(dá)到本組上限以下的人數(shù)或比例。
向下累積值意義——指達(dá)到本組下限以上的人數(shù)或比例。
組中值=(組上限+下限)/2
缺下限組組中值=上限-鄰組組距/2
缺上限組組中值=下限+鄰組組距/2
綜合練習(xí):50名工人,最少日加工零件數(shù)為107件,最多為139件,試編制距
式頻數(shù)分布表
K=l+3.3221ogl050=7
D=(139-107)/7=5
■wr
105-110
110-115
115-120
120-125
125-130
130-135
134-140
14
二、頻數(shù)分布圖
直方圖:以組距為X軸,頻數(shù)或頻率為Y軸
折線圖:連接直方圖各組中值。
P25圖2.2
當(dāng)N為無(wú)窮大時(shí),形成光滑線,即得分布曲線。
P25圖2.3正態(tài)、偏態(tài)分布(左、右偏的特點(diǎn))
洛倫茨曲線:以組距為X軸,累積頻數(shù)為Y軸
P25圖2.4
第五節(jié)統(tǒng)計(jì)圖制作
數(shù)據(jù)顯示包括了統(tǒng)計(jì)表的統(tǒng)計(jì)圖兩種主要形式,本節(jié)主要講述圖與表的配合
使用及其制作。
一、常用統(tǒng)計(jì)圖
1、條形圖(barcharts)
圖例:以各組代表值為X軸,以測(cè)量值為Y軸。
**給出不同的數(shù)據(jù)表、圖例,并講解適用情況
適用:(1)同一總體,不同測(cè)量指標(biāo)值(標(biāo)準(zhǔn)分?jǐn)?shù))的比較;
——同班同學(xué)不同課程考試成績(jī)比較。
(2)不同總體,同質(zhì)性測(cè)量指標(biāo)值間的比較。
——不同班級(jí)同一門課程考試成績(jī)的比較。
2、餅圖(pie)
圖例:以各組數(shù)據(jù)值構(gòu)成餅圖各扇形面積,總面積之各為100虬
**給出數(shù)據(jù)表、圖例,并講解適用情況
適用:(1)同一總體,不同部分所占比例的比較,用餅圖;
——P23表2.8或同班同學(xué)不同年齡組學(xué)生所占比例的比較。
(2)不同總體,同質(zhì)性部分所占比例的比較,用環(huán)形圖。
——兩個(gè)班各年齡組學(xué)生所占比例的相互比較。
3、線圖(line)
圖例:以時(shí)間為X軸,以測(cè)量值為Y軸。
**給出數(shù)據(jù)表、圖例,并講解適用情況
適用:隨時(shí)間變化的數(shù)據(jù),發(fā)展趨勢(shì)分析。
15
4、散點(diǎn)圖(scatterplots)
圖例:以第一變量為X軸,第二變量為Y軸。
**給出數(shù)據(jù)表、圖例,并講解適用情況
適用:兩個(gè)變量相關(guān)關(guān)系趨勢(shì)分析。
5、直方圖(histogram)
圖例:以各組組距或代表值為X軸,以頻數(shù)或頻率為Y軸。
適用:數(shù)據(jù)分布趨勢(shì)分析。
上機(jī)實(shí)踐操作2:
(1)頻數(shù)分布表、直方圖制作。
P59第1題
(2)其它統(tǒng)計(jì)圖制作
用P61第6題數(shù)據(jù)制作餅圖。
第六節(jié)數(shù)據(jù)分布集中趨勢(shì)測(cè)量
指計(jì)算一組數(shù)據(jù)的一般水平或中心值。
一、均值(mean)
總體用也樣本用于。
表示總體或樣本人群的平均水平。
(一)公式:
1、未分組數(shù)據(jù)(第一手資料)
P32公式2.3
xi——每個(gè)觀察值
n——數(shù)據(jù)個(gè)數(shù)
2、分組資料(二手資料)
P32公式2.4——給出頻數(shù)的二手資料
xi——每組組中值或代表值
fi——每組頻數(shù)
16
P32公式2.5——給出頻率的二手資料
xi——每組組中值或代表值
fi/Sfi——每組頻率
(二)適用資料
正態(tài)分布的數(shù)值型變量。
如身高、體重、IQ等。
二、眾數(shù)Mode
指調(diào)查數(shù)據(jù)中出現(xiàn)次數(shù)最多的標(biāo)志值。用M。表示。
表示總體或樣本人群中大多數(shù)人的水平。
(一)公式:
1、未分組一手?jǐn)?shù)據(jù)
即為調(diào)查數(shù)據(jù)中出現(xiàn)次數(shù)最多的標(biāo)志值。
例:P22,表2.6
Mo=19
表示本班大多數(shù)學(xué)生為19歲.
2、分組組距式數(shù)據(jù)
P29公式2.1
L一眾數(shù)組下限
A1——眾數(shù)組頻數(shù)與上一組頻數(shù)之差。
△2——眾數(shù)組頻數(shù)與下一組頻數(shù)之差。
i——眾數(shù)組組距
例:P23,表2.8數(shù)據(jù)
眾數(shù)組(頻數(shù)最大的組)為第3組,
Mo=100+(13-7)/(13-7+13-5)*10=104.29(件)
(二)適用資料
(1)用定序尺度測(cè)量的組距式數(shù)據(jù)
例:
問(wèn)卷變量為家庭人月均收入:(1)200-400;(2)400-600;(3)600-800;
4)800以上
要計(jì)算當(dāng)?shù)卮蠖鄶?shù)家庭的人月均收入水平。
17
(2)社會(huì)經(jīng)濟(jì)現(xiàn)象中不宜用均值作為一般水平的現(xiàn)象。
如:車輛高度、服裝加工等
(3)數(shù)值型數(shù)據(jù),數(shù)據(jù)明顯為偏態(tài)分布,極差較小(尖峰分布)
三、中位數(shù)median
指調(diào)查數(shù)據(jù)由低到高排列后,處于最中間位置的標(biāo)志值。用Me表示。
表示總體或樣本人群中處于中等水平的個(gè)體水平。
(一)公式:
1、未分組一手?jǐn)?shù)據(jù)
數(shù)據(jù)排序后
n為奇數(shù)時(shí):
Me=X(n+1)/2
n為偶數(shù)時(shí):
Me=(Xn/2+Xn/2+1)/2
例:P22,表2.7數(shù)據(jù)排序后,第15位(30/2)數(shù)據(jù)為103件,第16位(30/2+1)
數(shù)據(jù)為105件,則:
Me=(103105)/2=104(件)
表示30名工人中,處于中等水平的工人日加工零件數(shù)為104件。
2、分組組距式數(shù)據(jù)
P31公式2.2
N/2——中位數(shù)組位置,即向下累積達(dá)到次數(shù)半值的組
L——中位數(shù)組下限
Sm-1——中位數(shù)組以前各組的頻數(shù)之各和。
fm——中位數(shù)組頻數(shù)
i——中位數(shù)組組距
例:P24,表2.10數(shù)據(jù)
中位數(shù)組為第3組,
Mo=100+(15-10)713*10=103.8(^)
(二)適用資料
(1)用定序尺度測(cè)量的組距式數(shù)據(jù)
例:
問(wèn)卷變量為家庭人月均收入:(1)200-400;(2)400-600;(3)600-800;
18
4)800以上
要計(jì)算當(dāng)?shù)刂械人郊彝サ娜嗽戮杖胨健?/p>
(2)數(shù)值型數(shù)據(jù),數(shù)據(jù)明顯為偏態(tài)分布,極差較大(偏峰分布)
***兒何均值、分位數(shù)、切尾均值自學(xué)了解。
綜合練習(xí):
2004年,對(duì)某市500戶居民家庭月收入抽樣調(diào)查數(shù)據(jù)為:
組別戶數(shù)
500元以下40
500-80090
800-1100110
1100-1400105
1400-170070
1700-200050
200以上35
合計(jì)500
求:(1)本市居民家庭平均月收入
(2)本市大多數(shù)居民家庭月收入
(3)本市中等水平居民家庭月收入
第七節(jié)數(shù)據(jù)分布離散趨勢(shì)測(cè)量
***圖示并舉例說(shuō)明
例:數(shù)據(jù)3、3、4的平均值為3.3,數(shù)據(jù)1、5、4的平均值同樣是3.3,其
區(qū)別是,第一組數(shù)據(jù)每個(gè)值與均值相差不大,而第二組差異較大。(讓學(xué)生自己
計(jì)算并總結(jié))。
即:離散趨勢(shì)測(cè)量是描述一組數(shù)據(jù)中,每個(gè)觀察值偏離平均值的狀況,即數(shù)
據(jù)的變異性。
一、常用離散趨勢(shì)測(cè)量指標(biāo)
(一)極差(range)
1、公式
R=max(xi)-min(xi)
19
**值的圖示及意義說(shuō)明(分布曲線的跨度)
2、適用資料:
偏態(tài)分布數(shù)據(jù),即一般水平用Mo、Me表示時(shí),其離差狀況用R表示。
(二)方差與標(biāo)準(zhǔn)差(variance,standarddeviation)
方差:總體用。2表示,樣本用d表示;
標(biāo)準(zhǔn)差:總體用。表示,樣本用S表示。
1、公式
(1)未分組一手資料
總體:
2(xrx)2
o2=----------
N
£(xj-x)2
o=SQR(----------)
N
樣本:
Z(Xi-x)2
s2=----------P40,公式2.10
n-l
£(Xi-x)2Sxi2-(ZxD2/n
s=SQR(----------)=SQR(---------------)**計(jì)算機(jī)編程公式
n-ln-l
Xi-------每個(gè)觀察值
n-l----自由度(degreeoffreedom,df)
(1)表示數(shù)據(jù)中與均值進(jìn)行離差計(jì)算數(shù)據(jù)的個(gè)數(shù)。由于當(dāng)n=l時(shí),x,=x
勺元=0,因此,在總離差計(jì)算數(shù)據(jù)的個(gè)數(shù)中要減去1。
(2)表示在n個(gè)單位中,當(dāng)均值一定時(shí),可自由取值的單位個(gè)數(shù)。
例:有5個(gè)數(shù)據(jù)1、2、3、4、5,其均值為3,則只有四個(gè)單位可經(jīng)自由取
值,最后一個(gè)為定值。
(2)分組二手資料
以樣本為例:
s2——P41,公式2.11
20
S——P41,公式2.13
提問(wèn):Xi、fi各代表什么?
2、標(biāo)準(zhǔn)差的特點(diǎn)及適用資料
特點(diǎn):(1)有單位,與測(cè)量指標(biāo)單位相同。
**圖示其意義,1S表示平均差異的單位值)
(2)有正、負(fù),+說(shuō)明高于均值,-表示低于均值
**圖示說(shuō)明:正態(tài)分布中,界于均值與±1S、均值與±2S之間以及低于均值
IS、2s的意義,從而引出大、小概率的含義。
適用:正態(tài)分布數(shù)據(jù),即一般水平用均值表示時(shí),其離差狀況用S表示。
(三)離散系數(shù)
1、公式
P42公式2.14**分別對(duì)應(yīng)于總體及樣本
2、特點(diǎn)及適用資料
特點(diǎn):無(wú)單位的標(biāo)準(zhǔn)化值。
適用:(1)對(duì)同一總體不同測(cè)量指標(biāo)的離散程度進(jìn)行比較。
例:對(duì)全班同學(xué)體重測(cè)量得到的標(biāo)準(zhǔn)差為18kg,身高測(cè)量得到的標(biāo)準(zhǔn)差為
0.18m,對(duì)二者的離散程度進(jìn)行比較。能否直接比較?
(2)對(duì)不同總體同一測(cè)量指標(biāo)的離散程度進(jìn)行比較。
例:對(duì)全班同學(xué)體重測(cè)量得到女生的標(biāo)準(zhǔn)差為6kg,男生測(cè)量得到的標(biāo)準(zhǔn)差
為18kg,對(duì)二者的離散程度進(jìn)行比較。能否直接比較?
二、標(biāo)準(zhǔn)差的應(yīng)用
(一)計(jì)算標(biāo)準(zhǔn)分?jǐn)?shù)(standardscore)
對(duì)總體狀況進(jìn)行綜合評(píng)價(jià)計(jì)算總分時(shí),為使不同測(cè)量指標(biāo)之間值具有可加
性,從而使用了標(biāo)準(zhǔn)分?jǐn)?shù)法。
例:對(duì)個(gè)體綜合實(shí)力進(jìn)行評(píng)價(jià),有健康指標(biāo)(身高、體重)、智商、心理素
質(zhì)、人際交往等,由于測(cè)量指標(biāo)間使用工具及單位的不同,不能直接用原始分?jǐn)?shù)
進(jìn)行簡(jiǎn)單相加,必須進(jìn)行標(biāo)準(zhǔn)分?jǐn)?shù)化后才可評(píng)價(jià)。
1、公式
一般公式_
Xj-X
Z=----------
S
Xi?測(cè)量的原始分?jǐn)?shù)
21
z分?jǐn)?shù)的變異公式:
為消除Z分?jǐn)?shù)的負(fù)值和小數(shù),對(duì)Z進(jìn)行擴(kuò)大。
T=aZ+b
2、以高考分?jǐn)?shù)計(jì)算為例(P2知識(shí)閱讀)
單科分_
Xj-X
Z=--------
S
Xi——表示考生某門課程的原始分?jǐn)?shù)
5、S分別代表全國(guó)考生某門課程的平均分?jǐn)?shù)和標(biāo)準(zhǔn)差
總分
Z總、=Z語(yǔ)文+Z數(shù)學(xué)+Z英語(yǔ)+Z理綜
例:甲生乙生全國(guó)考生
語(yǔ)文120115100(10)
數(shù)學(xué)9595110(15)
英語(yǔ)130120120(10)
理綜合210240210(15)
總分550555
從原始分?jǐn)?shù)看,優(yōu)生錄取乙
標(biāo)準(zhǔn)分?jǐn)?shù):Z甲=2Z乙=1.9應(yīng)優(yōu)生錄取甲。
(二)檢驗(yàn)數(shù)據(jù)分布的形態(tài)
1、檢驗(yàn)數(shù)據(jù)分布的偏態(tài)---偏斜系數(shù)(skewness)
2(Xi-x)3fj
SK=-----------
nS3
SK=O,正態(tài)分布
SK<0,左偏分布
SK>0,右偏分布
2、檢驗(yàn)數(shù)據(jù)分布的峰態(tài)---峰度系數(shù)(kurtosis)
22
Z(xrx)4fj
K=---------------3
nS4
K=0,正態(tài)分布
K<0,平峰分布
K>0,尖峰分布
三、數(shù)據(jù)分布特點(diǎn)描述指標(biāo)的綜合選擇
在分別掌握了集中趨勢(shì)(元、Mo、Me)、離散趨勢(shì)(R、S)、偏態(tài)(SK)
及峰度(K)后,如何從計(jì)算機(jī)給出的多種指標(biāo)值中選擇適合研究者所取數(shù)據(jù)的
分布特點(diǎn)值呢?
(1)當(dāng)SK=O時(shí),即正態(tài)分布時(shí),選取無(wú)、S分別作為集中與離散趨勢(shì)指標(biāo),
表不為:xiS
(2)當(dāng)SKW0,且K<0,即偏態(tài)平峰分布時(shí),選取Me、R分別作為集中
與離散趨勢(shì)指標(biāo),
表示為:MeR(或范圍min~max)
(3)當(dāng)SKW0,且K>0,即偏態(tài)尖峰分布時(shí),選取Mo、R分別作為集中
與離散趨勢(shì)指標(biāo),
表示為:MOR(或范圍min~max)
上機(jī)實(shí)踐操作3:
數(shù)據(jù)集中與離散趨勢(shì)測(cè)量.
SPSS----analysis----descriptive-----frequency-----statistics
centraltendency、dispersion、distribution
作業(yè):(1)用P60第2題求出無(wú)、Mo、Me、R、S值
(2)依據(jù)數(shù)據(jù)分布特點(diǎn),選擇適合本組數(shù)據(jù)分布趨勢(shì)的指標(biāo)值
本章小結(jié):本章應(yīng)重點(diǎn)掌握
(1)調(diào)查問(wèn)卷設(shè)計(jì)及四種計(jì)量尺度的適用情況;
(2)常用統(tǒng)計(jì)方法及其應(yīng)用
(3)常用數(shù)據(jù)集中趨勢(shì)與離散趨勢(shì)測(cè)量指標(biāo)及其應(yīng)用
(4)常用統(tǒng)計(jì)圖應(yīng)用情況及其制作。
23
第三章概率與概率分布
第一節(jié)概率論基礎(chǔ)
-、概率的基本概念
1、隨機(jī)現(xiàn)象
指在一定條件下可能發(fā)生也可能不發(fā)生的現(xiàn)象。
***思考
(1)調(diào)查問(wèn)卷中的項(xiàng)目(標(biāo)志)、樣本統(tǒng)計(jì)量(1、S、P)屬于隨機(jī)變量
嗎?
(2)問(wèn)卷中的項(xiàng)目(標(biāo)志)、樣本統(tǒng)計(jì)量(亍、S、P)的取值是否屬于隨
機(jī)現(xiàn)象?
2、隨機(jī)試驗(yàn)
指對(duì)隨機(jī)現(xiàn)象取值規(guī)律進(jìn)行觀察的過(guò)程。
***思考
統(tǒng)計(jì)調(diào)查過(guò)程屬于隨機(jī)試驗(yàn)嗎?它觀察的是什么的取值規(guī)律?是對(duì)問(wèn)卷中
的項(xiàng)目(標(biāo)志)、樣本統(tǒng)計(jì)量(無(wú)、S、P)的取值規(guī)律進(jìn)行觀察嗎?
3、隨機(jī)事件
指隨機(jī)試驗(yàn)的每一個(gè)可能出現(xiàn)的結(jié)果。
***思考
調(diào)查問(wèn)卷中品質(zhì)型變量所設(shè)計(jì)的選擇項(xiàng)(如性別:(1)男;(2)女)、數(shù)值型
變量調(diào)查時(shí)每份問(wèn)卷所填寫的值屬于隨機(jī)事件嗎?
4、樣本空間
指隨機(jī)試驗(yàn)所有可能結(jié)果的集合。
***舉例說(shuō)明
5、統(tǒng)計(jì)概率(試驗(yàn)概率)
定義:P74o設(shè)在相同條件下重復(fù)試驗(yàn)n次,事件A發(fā)生的次數(shù)為m,則事件
A發(fā)生的頻率為m/n,當(dāng)n~>8時(shí),m/n趨于一個(gè)定值p,則稱p為事件A的概
率。
P(A)=p??m/n
反概率q^l-p
***思考:
在家庭人口數(shù)頻數(shù)分布表中,m、n、p各代表什么?事件A如何表示?
24
6、概率分布
指隨機(jī)變量所有取值的概率所形成的分布數(shù)列或分布圖。
例:P74表3.1,頻數(shù)分布與概率分布的關(guān)系
**當(dāng)!1玲8時(shí),頻數(shù)分布即為概率分布。
與頻數(shù)分布相同,概率分布也相應(yīng)劃分為離散型概率分布、連續(xù)型概率分布。
二、概率論與推斷統(tǒng)計(jì)的關(guān)系
推斷統(tǒng)計(jì)是研究如何用樣本統(tǒng)計(jì)量推斷總體參數(shù)值,原則是在已知樣本方、S、
P取值概率分布形式的基礎(chǔ)上,在大概率條件下進(jìn)行推斷。
1、斤、S、P的概率分布形式
又稱為抽樣分布。經(jīng)大量研究表明:
x----大樣本下服從正態(tài)分布
小樣本下服從t分布
S——單個(gè)樣本的S2服從Xz分布,兩個(gè)樣本S//S2?服從F分布
P——大樣本下近似服從正態(tài)分布
小樣本下服從二項(xiàng)分布
2、大、小概率及臨界值
(1)一般的,將概率值在95%以上為大概率事件,概率值小于5%的稱為
小概率事件。
(2)臨界值指發(fā)生小概率事件的臨界點(diǎn)值。
第二節(jié)、常用隨機(jī)變量的概率分布及其應(yīng)用
一、離散型隨機(jī)變量概率分布
(-)分布形式及特點(diǎn)
1、分布表示形式:
(1)表格式*P83表3.2等同于離散型頻數(shù)分布表
(2)函數(shù)與累積分布函數(shù)式
函數(shù)式:
P(X=Xi)i=l,2,3,4,*P83
累積分布函數(shù)式:
F(X)=P(XWx)=2P(Xi)等同于離散型頻數(shù)分布表中的頻率的向下
累積
(3)圖示式(形):*P83圖3.5
25
2、性質(zhì)
(1)P(Xi)20
(2)SP(Xi)=l
(二)二項(xiàng)分布
指只有兩種可能取值結(jié)果的隨機(jī)變量的概率分布,并將其中一個(gè)結(jié)果稱為
“成功事件”,另一個(gè)稱為“失敗事件”
1、定義
P87
kknk
P(X=K)=Cnp(1-p)'
記為X~b(n,p)
例:人口調(diào)查結(jié)果表明,男性比率為50%,求在100份問(wèn)卷中,男性問(wèn)卷
出現(xiàn)10人的概率?
P(X=10)=CiooIOO.510(1-0.5)100-10
2、二項(xiàng)分布數(shù)學(xué)用表的使用
為累積概率分布表
二、連續(xù)型隨機(jī)變量的概率分布
(一)概率密度函數(shù)與概率分布函數(shù)
統(tǒng)計(jì)數(shù)據(jù)在其頻數(shù)分布基礎(chǔ)上,形成直方圖與折線圖,當(dāng)n-8時(shí),折圖變
為光滑曲線以及由曲線與X軸相圍形成曲線下的面積,如果該光滑曲線可用方程
f(x)表示,則稱其為概率密度函數(shù);如果曲線下的面積可用方程F(x)表示,
則稱其為概率分布函數(shù)。
**圖示說(shuō)明
1、概率密度函數(shù)
P83
設(shè)X為連續(xù)型隨機(jī)變量X(-8,+8),a,b(a<b)為任意兩個(gè)實(shí)數(shù),如果存
在一個(gè)非負(fù)的可積分函數(shù)f(x),使得X在(a,b)區(qū)間上取值的概率為:
P(a<X<b)=/\f(x)dx
則稱f(x)為X的概率密度函數(shù)。
**圖示說(shuō)明,在該區(qū)間上概率值實(shí)際上等于曲線與a—》b線段圍成的面積值。
26
2、概率分布函數(shù)
P84
設(shè)X為連續(xù)型隨機(jī)變量X(-8,+8),X為任意一個(gè)實(shí)數(shù),f(x)為X的概
率密度函數(shù),P(XWx)為X的向下累積概率,則稱P(XWx)為X的概率分
布函數(shù),記作F(x),則:
F(x)=P(X<x)=/.Jf(x)dx
**圖示說(shuō)明,概率分布函數(shù)實(shí)際上為曲線在-8一》x范圍的面積方程。
(二)連續(xù)型概率分布函數(shù)的性質(zhì)
(1)F(x)20,*曲線f(x)總位于X軸上方。
(2)F(x)=/」8f(x)dx=l*曲線f(x)與X軸間的總面積等于1。
bb
(3)P(a<X<b)=/af(x)dx=f.?f(x)dx-f.Jf(x)dx
(三)正態(tài)分布
1、定義:P91,公式3.27。分布圖形見(jiàn)P91圖3.7
記為X~N(U,o2)
如,成年男子身高X~N(L72,0.272)
2、性質(zhì)P93圖3.8
(1)曲線以X=u為對(duì)稱軸左右對(duì)稱,且在X=u處達(dá)到峰值。
正態(tài)分布為一個(gè)分布族,當(dāng)口與。變化時(shí),曲線變化。
(2)f(x)dx=0.6826
11+20
(3)fM.2af(x)dx=0.9545^0.95(或95%),
即大概率區(qū)間,用ba表示
*則左尾+右尾心0.05,即小概率區(qū)間,用a=0.05表示。
左尾=右尾=a/2=0.025
**圖示說(shuō)明大概率、左尾與右尾小概率。
(4)/一3。"+3設(shè)(x)dx=0.9973^0.99(或99%),即極大概率區(qū)間
*則左尾+右尾心0.01,即極小概率區(qū)間,用a=0.05表示。
左尾=右尾=a/2=0.005
**圖示說(shuō)明大概率、左尾與右尾小概率。
(四)標(biāo)準(zhǔn)正態(tài)分布
27
1、定義:P92o即均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布。
記為X~N(0,1)
標(biāo)準(zhǔn)正態(tài)分布為一個(gè)唯一的曲線。
2、一般正態(tài)分布的標(biāo)準(zhǔn)分布化
若X~N(U,。>則變量Z=(X-U)/。服從(0,1)分布。
例:身高X~N(1.72,0.27,),
則身高X的標(biāo)準(zhǔn)分?jǐn)?shù)變量2=(X-1.72)/0.27為服從(0,1)分布。
(五)標(biāo)準(zhǔn)正態(tài)分布大、小概率臨界值的確定
**再次圖示說(shuō)明大、小概率以及臨界點(diǎn)。
1、標(biāo)準(zhǔn)正態(tài)分布表——附表1P434
x列為變量X的最小取值的第1位整數(shù)與小數(shù);
橫行表示變量X最小取值的第2位小數(shù);
坐標(biāo)點(diǎn)上的值表示從(-8,x)的累積概率值;
例:求X<=1.12的概率,0.868643
2、用標(biāo)準(zhǔn)正態(tài)分布表查臨界值
a=0.05時(shí),查坐標(biāo)點(diǎn)P=0.975,知96
a=0.01時(shí),查坐標(biāo)點(diǎn)P=0.995,知Z0.oo5=2.58
應(yīng)用例:已知成年男子身高X~N(1.72,0.272),某同學(xué)身高測(cè)量值為2.30,試在
a=0.05時(shí)判斷其身高發(fā)生是否為小概率事件?
解:該同學(xué)身高標(biāo)準(zhǔn)值為
Z=(2.30-1.72)/0.27=2.14
由于a=0.05時(shí),大小概率臨界值為Zo.o25=l.96,該同學(xué)身高Z大于此值,
因此為小概率事件。
三、t分布、X。分布、F分布
(一)、t分布
1、分布曲線:圖示說(shuō)明。(了解)
記作:X-t(df)
2、用t分布表查臨界值——P436,附表2o
左列:為不同的自由度
模行:不同的右尾a值,常用0.025、0.005兩列。
28
坐標(biāo)點(diǎn)值:為臨界值
例:a=0.05,df=12時(shí),to.025.12=2.1788
a=0.01,df=12時(shí),to.nos.12=3.0545
**讓學(xué)生查:
=
a=0.05)df16時(shí),to.025.16=-
=
a=0.01,df16時(shí),t<),cos.i6=?
應(yīng)用例:已知在小樣本下,成年男子身高服從t分布
(X-1.72)
t=------------------
027/SQR(n)
某班有學(xué)生28人,有?同學(xué)身高測(cè)量值為1.68,試在a=0.05時(shí)判斷其身高
發(fā)生是否為小概率事件?
解:該同學(xué)身高t值為
t=(1.68-1.72)/O.27/SQR(27)=-0.77
由于a=0.05時(shí),大小概率臨界值為L(zhǎng)隔27=2.0518,即-M咻27=-2.0518該同學(xué)
身高t大于此值,因此為大概率事件。
(二)、X?分布
1、分布曲線:由海爾墨特(Hermert)和卡.皮爾遜(K.Pearson)Pl16,圖示說(shuō)
明。(了解)
記作:X~x2(df)
2、用一分布表查臨界值——P437,附表3。
左列:為不同的自由度
模行:不同的右尾a值,常用0.05、0.01兩列。
坐標(biāo)點(diǎn)值:為臨界值
例:a=0.05,df=12時(shí),X),05.12=21.026
a=0.01,df=12時(shí),to.oi,12=26.217
**讓學(xué)生查:
2-Q
a=0.05,df=16時(shí),X0.05,16一?
2_
a=0.01,df=16時(shí),AY0.01.16~??
應(yīng)用例:已知男、女生愛(ài)好結(jié)構(gòu)X服從(分布,某班有學(xué)生28人,男、女愛(ài)
好結(jié)構(gòu)一值3.27,試在a=0.05,df=3時(shí)判斷其值是否為小概率事件?
29
解:a=0.05,df=3時(shí),大小概率臨界值為X2°M3=7.815,該班x?值小于此
值,因此為大概率事件。
(三)、F分布
1、分布曲線:以統(tǒng)計(jì)學(xué)家R.A.Fisher姓氏的第一字母命名,P120,圖示說(shuō)明。
(了解)
記作:X?F(dfl,df2)
2、用F分布表查臨界值——P439,附表4。
左列:分母自由度
模行:分子自由度
坐標(biāo)點(diǎn)值:不同a下的臨界值,常用a=0.05區(qū)(P440)
例:a=0.05,dfl=12,df2=13時(shí),x—⑵后2.67
**讓學(xué)生查:
a=0.05,dfl=15時(shí),df2=21,F0—=?
應(yīng)用例:已知男、女生愛(ài)考試成績(jī)方差之比服從F分布,某班有女生11人,
男生17人,女生與男生某課程方差之比F值為4.27,試在a=0.05,dfl=10,
df2=16時(shí)判斷其值是否為小概率事件?
解:a=0.05,dfl=10,df2=16時(shí),大小概率臨界值為F。⑻。…=2.49,該班
F值大于此值,因此為小概率事件。
本章小結(jié):本章應(yīng)重點(diǎn)掌握
(1)推斷統(tǒng)計(jì)與概率論的關(guān)系
(2)常見(jiàn)概率分布大、小臨界值的確定方法(四種數(shù)學(xué)用表的查法)
30
第四章抽樣分布
研究當(dāng)把亍、S、P、X1-X2>S|2/s/、P1-P2這些來(lái)自于樣本的統(tǒng)計(jì)量,重
新當(dāng)成隨機(jī)變量時(shí),它們的概率分布屬于哪種形式。
第一節(jié)抽樣分布的基本概念及應(yīng)用
一、抽樣分布的概念
1、抽樣分布:假設(shè)從一個(gè)總體中抽取容量相同的各種樣本,則從這些樣本
計(jì)算出的某統(tǒng)計(jì)量的所有可能取值的概率分布,稱為該統(tǒng)計(jì)量的抽樣分布。
**圖示說(shuō)明。P108-P110
抽樣調(diào)查設(shè)計(jì)為m個(gè)小組,各組都調(diào)查15個(gè),得到不同的均值,求其頻數(shù)
分布:
X頻率
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 重慶八中學(xué)、九十五中學(xué)等校2024-2025學(xué)年普通中考第一次適應(yīng)性檢測(cè)試題物理試題含解析
- 新疆應(yīng)用職業(yè)技術(shù)學(xué)院《企業(yè)與公司制度》2023-2024學(xué)年第二學(xué)期期末試卷
- 河北省滄州任丘市重點(diǎn)中學(xué)2024-2025學(xué)年初三考前全真模擬密卷化學(xué)試題試卷(1)含解析
- 山東省濰坊市寒亭達(dá)標(biāo)名校2025屆初三省重點(diǎn)高中三校聯(lián)考語(yǔ)文試題試卷含解析
- 廈門大學(xué)《流行歌曲演唱》2023-2024學(xué)年第二學(xué)期期末試卷
- 西南交通大學(xué)希望學(xué)院《節(jié)奏訓(xùn)練III》2023-2024學(xué)年第一學(xué)期期末試卷
- 浙江省金華市重點(diǎn)中學(xué)2025年高三下學(xué)期5月月考數(shù)學(xué)試題含解析
- 浙江東方職業(yè)技術(shù)學(xué)院《城市綠地系統(tǒng)規(guī)劃》2023-2024學(xué)年第二學(xué)期期末試卷
- 寧德職業(yè)技術(shù)學(xué)院《生物分離工(全英文)》2023-2024學(xué)年第二學(xué)期期末試卷
- 南陽(yáng)理工學(xué)院《中國(guó)音樂(lè)史與作品欣賞》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年河北省唐山市中考一模道德與法治試題(含答案)
- 放療皮膚反應(yīng)分級(jí)護(hù)理
- 2025年03月內(nèi)蒙古鄂爾多斯市東勝區(qū)事業(yè)單位引進(jìn)高層次人才和緊缺專業(yè)人才50人筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- 衛(wèi)生院全國(guó)預(yù)防接種日宣傳活動(dòng)總結(jié)(8篇)
- 小學(xué)消防知識(shí)教育
- 安徽2025年03月合肥高新技術(shù)產(chǎn)業(yè)開(kāi)發(fā)區(qū)管理委員會(huì)公開(kāi)招考60名工作人員筆試歷年參考題庫(kù)考點(diǎn)剖析附解題思路及答案詳解
- 2025年第三屆天揚(yáng)杯建筑業(yè)財(cái)稅知識(shí)競(jìng)賽題庫(kù)附答案(601-700題)
- 2025年四川綿陽(yáng)市投資控股(集團(tuán))有限公司招聘筆試參考題庫(kù)附帶答案詳解
- 勞務(wù)派遣勞務(wù)外包服務(wù)方案(技術(shù)方案)
- 高一信息技術(shù)第六章結(jié)構(gòu)圖
- 豆各莊鄉(xiāng)土地儲(chǔ)備住宅房屋騰退補(bǔ)償安置辦法
評(píng)論
0/150
提交評(píng)論