社會(huì)統(tǒng)計(jì)學(xué)期中期末考試考點(diǎn)_第1頁
社會(huì)統(tǒng)計(jì)學(xué)期中期末考試考點(diǎn)_第2頁
社會(huì)統(tǒng)計(jì)學(xué)期中期末考試考點(diǎn)_第3頁
社會(huì)統(tǒng)計(jì)學(xué)期中期末考試考點(diǎn)_第4頁
社會(huì)統(tǒng)計(jì)學(xué)期中期末考試考點(diǎn)_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一章:緒論

社會(huì)學(xué)研究與統(tǒng)計(jì)分析

一、研究的科學(xué)性(研究方法論)

▲確定課題一了解情況一建立假設(shè)一確立概念和測(cè)量方法(術(shù)語)一設(shè)計(jì)問卷一試填問卷

調(diào)查實(shí)施(抽樣調(diào)查)一校核與登錄--統(tǒng)計(jì)分析與命題的檢驗(yàn)

例:中學(xué)升學(xué)率調(diào)查

課題確定:升學(xué)率差異較大;學(xué)生擇校

了解情況:收集文獻(xiàn),前人研究;咨詢相關(guān)人員;典型個(gè)案觀察(好壞各2-3所中學(xué))

假設(shè):構(gòu)思影響因素:1、師資專業(yè)水平,2、學(xué)生入學(xué)水平,3、父母教育水平

師資水平高升學(xué)率高

入學(xué)成績好升學(xué)率高

父母教育水平高升學(xué)率高

操作化定義:如,師資:學(xué)歷、職稱、獲獎(jiǎng)等;學(xué)生水平:考分、地域、性別等;父母水平:

學(xué)歷、職業(yè)、教育子女的時(shí)間等(注意:每一個(gè)定義就是一個(gè)變量,要注意變量的各種可能

取值)

設(shè)計(jì)問卷:依操作化定義而定。三個(gè)方面:基本資料;態(tài)度;原因。

實(shí)施調(diào)查:地點(diǎn)、抽樣對(duì)象、樣本量、組織與培訓(xùn)、實(shí)施。(要注意地域的代表性和抽樣的隨

機(jī)性)

校核與登錄

統(tǒng)計(jì)分析與檢驗(yàn):資料統(tǒng)計(jì)由計(jì)算機(jī)完成

統(tǒng)計(jì)分析:

1、假設(shè)檢驗(yàn);

2、相關(guān)分析;

3、結(jié)論:對(duì)策與建議;或提出新的假設(shè)

二、社會(huì)調(diào)查資料的特點(diǎn)與統(tǒng)計(jì)學(xué)的運(yùn)用

調(diào)查資料的特點(diǎn):

?隨機(jī)性

?統(tǒng)計(jì)規(guī)律性

社會(huì)統(tǒng)計(jì)學(xué)即有關(guān)社會(huì)調(diào)查資料的收集、整理、分析和推論的統(tǒng)計(jì)方法。

二、調(diào)查資料的特點(diǎn)與統(tǒng)計(jì)學(xué)的運(yùn)用

在研究中運(yùn)用統(tǒng)計(jì)分析的前提:統(tǒng)計(jì)分析:

?資料的信度和效度?描述統(tǒng)計(jì)

?資料收集的科學(xué)性?推斷統(tǒng)計(jì)

?資料在總體中的分布

統(tǒng)計(jì)分析中常見的錯(cuò)誤:

混淆統(tǒng)計(jì)聯(lián)系與因果關(guān)系:根據(jù)觀測(cè)數(shù)據(jù)得到的統(tǒng)計(jì)聯(lián)系(如相關(guān)關(guān)系)只是因果關(guān)系存在

的必要條件,而不是充分條件。

生態(tài)學(xué)錯(cuò)誤:混淆宏觀模式與微觀模式。如:教育、經(jīng)濟(jì)水平越高的地區(qū)生育水平越低,不

能引申為個(gè)人教育水平與生育水平的關(guān)系。

還原論錯(cuò)誤:根據(jù)較低層次研究單位的分析結(jié)果推斷較高層次單位的運(yùn)行規(guī)律。

混淆統(tǒng)計(jì)檢驗(yàn)顯著與實(shí)際意義顯著:統(tǒng)計(jì)檢驗(yàn)是否顯著相對(duì)于以下三個(gè)條件:實(shí)際差異幅

度、置信度、抽樣規(guī)模。如果樣本規(guī)模很大,在降低置信度要求的情況下,統(tǒng)計(jì)檢驗(yàn)會(huì)顯著,

但實(shí)際意義不大。

關(guān)于平均值的理解:

樣本均值是人們采用最多的一種描述數(shù)據(jù)的方法,它反映了一組數(shù)據(jù)整體上的一些信息,然

而容易掩蓋一些極端的情況,所以有時(shí)候樣本均值不一定合理。

思考1.甲同學(xué)聽說,有個(gè)身高1.75米的成年人在平均水深為1米的小河中淹死了,他覺

得不可思議。這件事情是否是一個(gè)玩笑?

思考2.一位統(tǒng)計(jì)學(xué)家把一只腳放進(jìn)100℃的開水里,另一只腳放進(jìn)冰水中。然后宣布:現(xiàn)

在,在平均值的意義上,我感覺很舒服。

關(guān)于正確解釋統(tǒng)計(jì)數(shù)據(jù):

下面是某高速公路上發(fā)生的交通事故有關(guān)數(shù)據(jù):

速度km/h小于7070~180大于180

數(shù)量12323

丙同學(xué)由此得出結(jié)論說:統(tǒng)計(jì)數(shù)據(jù)顯示,在高速公路上,汽車速度越高,也就越安全。

實(shí)際上絕大多數(shù)的汽車行駛速度都在70~180,因此發(fā)生事故的次數(shù)也就多。

三、統(tǒng)計(jì)分析方法的選擇

全面調(diào)查與抽樣調(diào)查的分析方法不同:

全面調(diào)查一統(tǒng)計(jì)描述抽樣調(diào)查一統(tǒng)計(jì)推論

單變量與多變量的分析方法不同:

單變量一集中與分散特征多變量一相關(guān)性(有時(shí)需要將多個(gè)指標(biāo)合并。)

不同層次變量的分析方法不同:按計(jì)量尺度的不同分為定性變量和定量變量兩大類:

定類變量定序變量定距變量定比變量

定類變量

按某一個(gè)品質(zhì)特征將總體單位劃分若干個(gè)類型;

有屬性之分,無大小、程度之分

兩個(gè)原則:互斥原則;窮盡原則。

如:性別;婚姻。

定類-定類:列聯(lián)表;定類-定序:非參數(shù)檢驗(yàn);定類-定距:方差分析;

定序變量

除類別、屬性之分外,還有等級(jí)、秩序之分

如:教育程度;社會(huì)經(jīng)濟(jì)地位

定序-定序:等級(jí)相關(guān)

定距變量

除定類、定序外,取值之間有標(biāo)準(zhǔn)化的量度

可進(jìn)行加減運(yùn)算,但不能進(jìn)行乘除運(yùn)算

典型例子:智商測(cè)定

定距-定距:回歸與相關(guān)

定比變量

除定類、定序、定距之特征外,取值可

構(gòu)成一個(gè)有意義的比例

有一個(gè)絕對(duì)固定的、非任意的零點(diǎn)

可進(jìn)行乘除運(yùn)算

絕大多數(shù)經(jīng)濟(jì)變量可進(jìn)行定比測(cè)定

如:年齡;收入;

第二章單變量統(tǒng)計(jì)描述分析

一、分布'統(tǒng)計(jì)表、統(tǒng)計(jì)圖

1、分布

一個(gè)概念或變量,在各個(gè)情況出現(xiàn)的次數(shù)或頻次。

表現(xiàn)形式:(X1,n1).(X2,n2).(X3.n3)—Xn是變量X的一切可能取值

n:頻次分布%:百分比分布P:概率分布

某校學(xué)生的父親職業(yè)

職業(yè)nP%

干部1100.20020.0

工人1520.27627.6

農(nóng)民2280.52452.4

總數(shù)5501.000100.0

變量取值需要注意的問題:

(1)完整性

(2)互斥性

P23表2T~2-4

2、統(tǒng)計(jì)表

統(tǒng)計(jì)表:用表格形式來表示變量分布。

統(tǒng)計(jì)表的制作要注意的問題:

1、表號(hào)、表頭(標(biāo)題、時(shí)間、地點(diǎn))內(nèi)容簡明

2、統(tǒng)計(jì)欄數(shù)多時(shí),要加編號(hào)

3、數(shù)字填寫要求:位數(shù)對(duì)準(zhǔn),同欄數(shù)字、小數(shù)位要一致,相同數(shù)字不可以寫“同上”,無

數(shù)字欄用“一”,缺資料“…”

4、表中數(shù)字用同一單位時(shí),標(biāo)在右上角

表3.141997?1998年城鎮(zhèn)居民家庭抽樣調(diào)查資料總標(biāo)題

項(xiàng)目單位1997年1998年*---縱-

‘一、調(diào)查戶數(shù)

戶3789039080)標(biāo)

二、平均每戶家庭人口數(shù)人3.193.16題

橫三、平均每戶就業(yè)人口數(shù)人1.831.80

5458.34|

四、平均每人全部收入元5188.54標(biāo)

標(biāo)

五、平均每人實(shí)際支出元4945.875322.95數(shù)

#消費(fèi)性支出元4185.644331.61值

非消費(fèi)性支出元755.94987.17

12.40J

1六、平均每人居住面積平方米11.90

資料來源:《中國統(tǒng)計(jì)摘要1999》,中國統(tǒng)計(jì)出版社,1999,第79頁.附

注:1.本表為城市和縣城的城鎮(zhèn)居民家庭抽樣調(diào)查材料.加

2.消費(fèi)性支出項(xiàng)目包括:食品、衣著、家庭設(shè)備用品及服務(wù)、醫(yī)療

保健、交通和通訊、娛樂教育文化服務(wù)、居住、雜項(xiàng)商品和服務(wù).

5、表的左右兩端不封閉

2.統(tǒng)計(jì)表

不同層次變量統(tǒng)計(jì)表制作:

(1)定類變量(2)定序變量(3)定距變量

(1)定類變量

表1T某單位職工民族情況匯總(2016年2月)

按民族分組人數(shù)(人)比重(%)

144048

66022

90030

合計(jì)3000100

多選項(xiàng)統(tǒng)計(jì)解決方案:P26二分法;分類法;加權(quán)平均法

(2)定序變量

表1T某單位職工年齡情況匯總(2016年2月)

按年齡段分組人數(shù)(人)比重(%)

14448

6622

9030

合計(jì)300100

(3)定距變量

某單位職工日加工零件匯總(2016年3月10日)

按零件數(shù)分組頻數(shù)(人)頻率(%)

105-110

110~115

115-120X

120-12514

125~130

1

130-135

135-140

合計(jì)50100

【例】某生產(chǎn)車間50名工人日加工零件數(shù)如下(單位:個(gè))。試采用統(tǒng)計(jì)圖表的

方式對(duì)數(shù)據(jù)進(jìn)行整理和顯示。

117122124129139107117130122125

108131125117122133126122118108

110118123126133134127123118112

112134127123119113120123127135

137114120128124115139128124121

分組方法

單項(xiàng)式分組組距分組

等距分組異距分組

表1某車間50名工人日加工零件數(shù)分組表

零件數(shù)頻數(shù)零件數(shù)頻數(shù)零件數(shù)頻數(shù)

(個(gè))(人)(個(gè))(人)(個(gè))(人)

107111911282

108212021291

110112111301

112212241311

113112341332

114112431542

115112521351

117312621371

118312731392

表2某車間50名工人日加工零件數(shù)分組表

零件數(shù)分組頻次(人)頻率(%)

110以下36

110-114510

115-119816

120-1241421

125-1291020

130-13461:

135及以上48

合計(jì)50100

定距變量分組時(shí)需注意:

1)組數(shù)適宜2)等距分組和非等距分組3)精度確定

計(jì)量資料頻數(shù)表的編制

一般情況下,樣本含量小于50的統(tǒng)計(jì)資料無須編制頻數(shù)表,但對(duì)于大樣本含量的資料,編制頻

數(shù)表有利于進(jìn)一步的統(tǒng)計(jì)分析、且頻數(shù)表本身也具有統(tǒng)計(jì)描述的作用。

編制頻數(shù)表的步驟

噪一組段包括極小值,最后

一組段包括極大值,除最后

一組段可同時(shí)標(biāo)出上下限,

其他組段只標(biāo)出下限。

舉例說明計(jì)量資料頻數(shù)表的編制過程

某地13歲女孩118人的身高(cm)資料

151134143144152145146141143156

142141142145149141150140147144

144139145139144147140139135148

139144138146146142150145138147

143140138145146148151145138148

143141160155138140150148137148

135147139148139140144142129143

142149154148153146132146148145

136145144137143150143146149143

143157143146139142143131135149

135149138152141150146142147136

141146143149147140138142

步驟如下:

R=160-129=31o組段數(shù)=10;組距=以10=3.1比3(金);按要求確定每一組段上下限。分組統(tǒng)

計(jì)每一組段的頻數(shù),編制頻數(shù)表。

計(jì)量資料頻數(shù)分布表

118例13歲女孩身高(cm)資料頻數(shù)表

頻數(shù)標(biāo)明組段真實(shí)組段頻數(shù)中心值

12130

A

2129?131128.5?131.52133

A

3132?134131.5-134.58136

A9

4135-137134.5?137.5213

X0

5138-140137.5?140.5214

A-

6141?143140.5?143.514

X5

7144?146143.5?146.522514

18

8147?149146.5?149.5915

A1

9150-152149.5?152.53154

1

10153?155152.5?155.52157

A1

-1156?158155.5-158.51166

1

-159~161158.5-161.5

合計(jì)118

頻數(shù)分布表的用途

揭示數(shù)值變量頻數(shù)分布的類型和特征

作為陳述資料的形式

便于發(fā)現(xiàn)一些特大或特小的可疑值

便于進(jìn)一步的統(tǒng)計(jì)分析

3、統(tǒng)計(jì)圖

統(tǒng)計(jì)圖就是用圖形的形式來表示變量的分布。

餅圖反映所占比例;適用于定類;

條形圖高度:頻次或百分比;寬度無意義;

定類:離散長條;定序:緊挨長條或離散長條;

直方圖高度:頻次密度=頻次/組距;寬度有意義;緊挨長條;適用于定距;

折線圖直方圖頂點(diǎn)中心相連;要計(jì)算組中心值。適用于定距變量;

105110115120125130135140

日加工零件數(shù)(個(gè))

某車間工人日加工零件數(shù)的直方圖

直方圖與條形圖的區(qū)別

?條形圖中,條形的長度表示各類別頻數(shù)或百分比,寬度則往往固定,沒有數(shù)值意義。

?直方圖中,矩形的高度表示每一組的頻次密度或相對(duì)頻次密度,寬度則表示各組的組距,

其高度與寬度均有數(shù)值意義。

?直方圖的各矩形通常是連續(xù)排列,條形圖則有連續(xù)排列,也有離散排列。

?直方圖適用于定距變量,條形圖適用于定類變量和定序變量。

,折線圖也稱頻數(shù)多邊形圖(Frequencypolygon)?

?在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直

線連接而成。

折線圖(Polygon)

?用各組變量值或組中值與相應(yīng)的頻數(shù)或頻率作為每個(gè)點(diǎn)的橫縱坐標(biāo),連線而成。

?折線的兩個(gè)端點(diǎn)與橫軸相交,具體的做法是:

-第一個(gè)矩形的頂部中點(diǎn)通過豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)

矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸。

對(duì)某公司職員月平均收入進(jìn)行抽樣調(diào)查,得以下數(shù)據(jù)資料。

按收入分組人數(shù)比重(%)

(元)

1000-1499910

1500?19992123.3

2000?24993235.6

2500?29991516.7

3000?35001314.4

合計(jì)90100

直方圖(Histogram)

4、累計(jì)圖和累計(jì)表

cft:向上累計(jì)?小于某一數(shù)字的頻數(shù)

cfI:向下累計(jì)。大于某一數(shù)字的頻數(shù)

年齡人數(shù)cfTcfl

153318

166915

179189

按收入多占全部收人口累計(jì)累計(jì)的收入百分比

少形成的入的比重百分比

絕對(duì)平均絕對(duì)不平實(shí)際情況

人口序列(%)(%)

(%)均(%)(%)

最低的10.122020010.12

20%

第二個(gè)14.074040024.19

20%

第三個(gè)17.826060042.01

20%

第四個(gè)21.998080064.00

20%

第五個(gè)36.00100100100100.00

20%

資料來源:(統(tǒng)計(jì)研究》1986年第1期

>

1

(號(hào)

)

p(%

人口

曲線

洛侖茲

/A+B

數(shù):A

基尼系

布圖分

5、分

)

(peak

研究

峰點(diǎn)

(1)

ry)

(symmet

研究

對(duì)稱

(2)

曲線

與J形

形曲線

(3)U

峰狀曲

曲線

不對(duì)稱

對(duì)稱與

U形曲

曲線

反J形

曲線

正J形

2-23

P42圖

變。

而改

不同

組的

隨著分

狀,會(huì)

的形

布圖

:分

注意

計(jì)量資料頻數(shù)分布的類型和特征

二、集中趨勢(shì)測(cè)量法

用典型變量或特征值來代表變量全貌。

1.眾數(shù)(mode)

頻數(shù)最多的變量值,適合于單峰對(duì)稱;適用任何層次的變量(定類、定序、定距);

2.中位數(shù)(median)

數(shù)據(jù)序列中央位置之值。適合于定序及以上變量(定序、定距);

根據(jù)原始資料:

將數(shù)據(jù)排序后,排在中間位置的數(shù),數(shù)據(jù)分為兩半,一半比它大,一半比它??;median()

根據(jù)頻次分布:P45

累計(jì)百分比c%3中間值位置50%的變量值;

累計(jì)頻次eft,中間值位置N+1/2的變量值;

尋找累計(jì)百分比c%f中50%的點(diǎn);

P46表2-19

分組數(shù)據(jù),根據(jù)分組區(qū)間:

尋找累計(jì)百分比c%t中50%的點(diǎn);

P46表2-19

X/(U-L)=(50%-L%)/(U%-L%)

X/(l.0-0.8)=(50%-36.3%)/(54.5%-36.3%)

X/0.2=13.7%/18.2%

X=0.15

中位值Md=0.8+0.15=0.95

3.均值

算術(shù)平均、加權(quán)平均,可適用于定距變量。

1)對(duì)于未分組資料

-Yx..

X——average()

N

注意:對(duì)求和符號(hào),此時(shí)流動(dòng)腳標(biāo)的變動(dòng)范圍是1,2.3.…,凡是總體單位數(shù)。

[例]求74、85、69、91>87、74、69這些數(shù)字的算術(shù)平均數(shù)。

[解]

根據(jù)頻次/頻率分布求;P49

叉=

N

2)對(duì)于分組資料

7=工咕

注意:對(duì)求和符號(hào),此時(shí)流動(dòng)腳標(biāo)的變動(dòng)范圍是1,2,3…,〃,〃是組數(shù),而不是總體單位

數(shù)。

很顯然,算術(shù)平均數(shù)不僅受各變量值(M大小的影響,而且受各組單位數(shù)(頻數(shù))的影響。由于

對(duì)于總體的影響要由頻數(shù)(戶)大小所決定,所以尸也被稱為權(quán)數(shù)。值得注意的是,在統(tǒng)計(jì)計(jì)

算中,權(quán)數(shù)不僅用來衡量總體中各標(biāo)志值在總體中作用,同時(shí)反映了指標(biāo)的結(jié)構(gòu),所以它有

兩種表現(xiàn)形式:絕對(duì)數(shù)(頻數(shù))和相對(duì)數(shù)(頻率)。

[例]求下表(單項(xiàng)數(shù)列)所示數(shù)據(jù)的算術(shù)平均數(shù)

人口數(shù)(X)戶數(shù)⑴頻率(P)

250.10

380.16

4160.32

5100.20

660.12

740.08

810.02

合計(jì)501.00

對(duì)于組距數(shù)列,要用每一組的組中值權(quán)充該組統(tǒng)一的變量值。

[例]求下表所示數(shù)據(jù)的的算術(shù)平均數(shù)

間距頻數(shù)(f)組中值(X)

148—1521150

152—1562154

156—1605158

160—16410162

164—16819166

168—17225170

172—17617174

176—18012178

180—1845182

184—1883186

188—1920190

192—1961194

合計(jì)100

"d(冗M(jìn)3

對(duì)稱的

負(fù)偏正偏

圖3.5中位數(shù)、眾數(shù)和算術(shù)平均數(shù)的位置比較

三、離散程度測(cè)度

7(1)異眾比率;(2)極差和四分位差;(3)方差、標(biāo)準(zhǔn)差;

所謂離散趨勢(shì),是指數(shù)列中各變量值之間的差距和離散程度。離勢(shì)小,平均數(shù)的代表性高;

離勢(shì)大,平均數(shù)代表性低。

例如有A、B、C、D四組學(xué)生各5人的成績?nèi)缦拢?/p>

A組:60,60,60,60,60

B組:58,59,60,61,62

C組:40,50,60,70,80

D組:80,80,80,80,80

數(shù)據(jù)顯示,平均數(shù)相同,離散趨勢(shì)可能不同;平均數(shù)不同,離散趨勢(shì)可能相同。

(1)異眾比率(variationratio)

非眾數(shù)在總數(shù)N中所占的比例產(chǎn)(N-f)/Nf為眾值的頻數(shù)

{1,3,4,5,6,6,6,7}T=(8-3)/8=0.625

(2)極差(Range)

最大值和最小值之差,也叫全距。全距越大,表示變動(dòng)越大。

R(極差)=Xmax-Xmin

[例]求74,84,69,91,87,74,69這些數(shù)字的全距。

[解]把數(shù)字按順序重新排列:69,69,74,74,84,87,91,顯然有

R=Xmax-Xmin=91—69=22

優(yōu)點(diǎn):計(jì)算簡單、直觀。

缺點(diǎn):(1)受極端值影響大;

(2)沒有量度中間各個(gè)單位的差異性;

(3)受抽樣變動(dòng)影響大,大樣本全距比小樣本全距大。

(3)四分互差(interquartilerange)

第三四分位數(shù)和第一四分位數(shù)的半距。避免全距受極端值影響大的缺點(diǎn)。

四分位差越小,說明中間部分的數(shù)據(jù)越集中;四分位差越大,則意味著中間部分的數(shù)據(jù)越分

散。

四分位數(shù):將所有數(shù)值按大小順序排列并分成四等份,最小的四分位數(shù)稱為下四分位數(shù),中

點(diǎn)位置的四分位數(shù)是中位數(shù),最大的四分位數(shù)為上四分位數(shù)?quartile(array,k)。k為0,則

返回最小值;k為1,返回第1個(gè)四分位數(shù)…,k為4,返回最大值。

百分位數(shù):測(cè)定數(shù)據(jù)在總體中的百分位置的指標(biāo)。將數(shù)值按大小排列,分成100個(gè)等份,則

這99個(gè)數(shù)值或99個(gè)點(diǎn)就稱為百分位數(shù)。percentile(array,k)k為0—1之間的百分點(diǎn)值。

(4)方差(variance)62與標(biāo)準(zhǔn)差(standarddeviation)6

方差:將觀察值與均值之差的平方和除以全部觀察總數(shù)N。

標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差:所有觀察值與其均值的離差平方的平均數(shù)的平方根。反映總體中各數(shù)值的

平均離差程度。標(biāo)準(zhǔn)差有總體標(biāo)準(zhǔn)差stdevp()和樣本標(biāo)準(zhǔn)差之分stdev()

求72、81、86、69、57這些數(shù)字的標(biāo)準(zhǔn)差。

轉(zhuǎn)容:耍73.05=/守=片=私。6

[例]調(diào)查大一男生60人的身高情況如下表所示,求他們身高的標(biāo)準(zhǔn)差。

組距力£

150?154+

154?158+2P

158?162”7。

162?166,10+

166-170-16-

170-174^12.

174?178.7。

178?182~5,

合計(jì)「60.

第三章概率

一、基礎(chǔ)概率

1、隨機(jī)現(xiàn)象與隨機(jī)試驗(yàn)

隨機(jī)現(xiàn)象一一非確定性現(xiàn)象(隨機(jī)現(xiàn)象也存在規(guī)律)

隨機(jī)試驗(yàn):對(duì)隨機(jī)現(xiàn)象的觀察

隨機(jī)試驗(yàn)須符合的條件:

1)可以在相同的條件下重復(fù)進(jìn)行

2)試驗(yàn)的所有結(jié)果是事先已知的,并且不止一個(gè)

3)每次試驗(yàn)只能出現(xiàn)可能結(jié)果的一種,且不能預(yù)先判斷是哪一種如:擲硬幣

2,概率的概念

隨機(jī)事件:隨機(jī)現(xiàn)象結(jié)果的集合;

概率:隨機(jī)事件發(fā)生可能性大小的數(shù)量表示。反映隨機(jī)事件內(nèi)涵的統(tǒng)計(jì)規(guī)律性。

三種情況:

1)不可能事件0概率P

2)必然事件S概率

3)必然與不可能之間E概率

3、概率的計(jì)算方法

1)頻率法

頻數(shù)與頻率

隨機(jī)事件E出現(xiàn)的次數(shù)n一一頻數(shù)

n與實(shí)驗(yàn)次數(shù)N的比值一頻率

頻率的三種狀況:

概率是實(shí)驗(yàn)或觀察次數(shù)N趨于無窮時(shí),相應(yīng)頻率的穩(wěn)定值。

頻率是一個(gè)近似值,概率是一個(gè)理論值、唯一的精確值,比頻率完美。

二、概率分布、均值與方差

1、概率分布:

隨機(jī)現(xiàn)象一共有多少種結(jié)果,以及每種結(jié)果伴隨的概率。

為了研究方便,將隨機(jī)現(xiàn)象進(jìn)行量化,看做變量,把隨機(jī)變現(xiàn)象的各種結(jié)果看做變量的

各種取值。

={X1=硬幣正面,X2=硬幣反面}

概率分布:(XI,pl)(X2,p2)

分布列表明全部概率在各可能取值之間的分布規(guī)律,全面描述離散隨機(jī)變量的統(tǒng)計(jì)規(guī)律。(變

量取值要滿足:完備,不相容)

(1)離散型隨機(jī)變量及其概率分布

可能的取值是有限個(gè)或可數(shù)個(gè)數(shù),這些取值都具有確定的概率。

適用于定類、定序、定距變量。

概率分布:R■;=工i)=Pi

性質(zhì):

I)PkNG2)EPK=;

K=J

由此可以計(jì)算隨機(jī)變量取值Xi所對(duì)應(yīng)的概率pi,也可以計(jì)算隨機(jī)變量在某一區(qū)間的概率。

【例】投擲一顆骰子后出現(xiàn)的點(diǎn)數(shù)是一個(gè)離散型隨機(jī)變量。寫出擲一枚骰子出現(xiàn)點(diǎn)數(shù)的概率

分布

概率分布

X=Xj123456

P(X=xi)=pi1/61/61/61/61/61/6

P(x=3,4,5)=

[例]某地區(qū)兒童普查數(shù)據(jù)如下表,求其兒童年齡概率分布圖。求3歲以下兒童的概率情況。

年齡(X)百分比(%)

210%

316%

432%

520%

612%

78%

82%

合計(jì)100%

概率

3歲以下兒童的概率情況

離散型隨機(jī)變量的概率分布

1.列出離散型隨機(jī)變量X的所有可能取值

2.列出隨機(jī)變量取這些值的概率

3.通常用下面的表格來表示

X=XjAT],X?'.一,大〃

P(X=xi)=piPl9Pl9…,Pn

4.P(X=x/)=pi稱為離散型隨機(jī)變量的概率函數(shù)

*

=1

PR;XA

(2)連續(xù)型隨機(jī)變量及其概率分布一一概率密度函數(shù)

可能的取值,連續(xù)地充滿某個(gè)區(qū)間。適用于定距變量。

因?yàn)槿≈凳沁B

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論