版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第一章:緒論
社會(huì)學(xué)研究與統(tǒng)計(jì)分析
一、研究的科學(xué)性(研究方法論)
▲確定課題一了解情況一建立假設(shè)一確立概念和測(cè)量方法(術(shù)語)一設(shè)計(jì)問卷一試填問卷
調(diào)查實(shí)施(抽樣調(diào)查)一校核與登錄--統(tǒng)計(jì)分析與命題的檢驗(yàn)
例:中學(xué)升學(xué)率調(diào)查
課題確定:升學(xué)率差異較大;學(xué)生擇校
了解情況:收集文獻(xiàn),前人研究;咨詢相關(guān)人員;典型個(gè)案觀察(好壞各2-3所中學(xué))
假設(shè):構(gòu)思影響因素:1、師資專業(yè)水平,2、學(xué)生入學(xué)水平,3、父母教育水平
師資水平高升學(xué)率高
入學(xué)成績好升學(xué)率高
父母教育水平高升學(xué)率高
操作化定義:如,師資:學(xué)歷、職稱、獲獎(jiǎng)等;學(xué)生水平:考分、地域、性別等;父母水平:
學(xué)歷、職業(yè)、教育子女的時(shí)間等(注意:每一個(gè)定義就是一個(gè)變量,要注意變量的各種可能
取值)
設(shè)計(jì)問卷:依操作化定義而定。三個(gè)方面:基本資料;態(tài)度;原因。
實(shí)施調(diào)查:地點(diǎn)、抽樣對(duì)象、樣本量、組織與培訓(xùn)、實(shí)施。(要注意地域的代表性和抽樣的隨
機(jī)性)
校核與登錄
統(tǒng)計(jì)分析與檢驗(yàn):資料統(tǒng)計(jì)由計(jì)算機(jī)完成
統(tǒng)計(jì)分析:
1、假設(shè)檢驗(yàn);
2、相關(guān)分析;
3、結(jié)論:對(duì)策與建議;或提出新的假設(shè)
二、社會(huì)調(diào)查資料的特點(diǎn)與統(tǒng)計(jì)學(xué)的運(yùn)用
調(diào)查資料的特點(diǎn):
?隨機(jī)性
?統(tǒng)計(jì)規(guī)律性
社會(huì)統(tǒng)計(jì)學(xué)即有關(guān)社會(huì)調(diào)查資料的收集、整理、分析和推論的統(tǒng)計(jì)方法。
二、調(diào)查資料的特點(diǎn)與統(tǒng)計(jì)學(xué)的運(yùn)用
在研究中運(yùn)用統(tǒng)計(jì)分析的前提:統(tǒng)計(jì)分析:
?資料的信度和效度?描述統(tǒng)計(jì)
?資料收集的科學(xué)性?推斷統(tǒng)計(jì)
?資料在總體中的分布
統(tǒng)計(jì)分析中常見的錯(cuò)誤:
混淆統(tǒng)計(jì)聯(lián)系與因果關(guān)系:根據(jù)觀測(cè)數(shù)據(jù)得到的統(tǒng)計(jì)聯(lián)系(如相關(guān)關(guān)系)只是因果關(guān)系存在
的必要條件,而不是充分條件。
生態(tài)學(xué)錯(cuò)誤:混淆宏觀模式與微觀模式。如:教育、經(jīng)濟(jì)水平越高的地區(qū)生育水平越低,不
能引申為個(gè)人教育水平與生育水平的關(guān)系。
還原論錯(cuò)誤:根據(jù)較低層次研究單位的分析結(jié)果推斷較高層次單位的運(yùn)行規(guī)律。
混淆統(tǒng)計(jì)檢驗(yàn)顯著與實(shí)際意義顯著:統(tǒng)計(jì)檢驗(yàn)是否顯著相對(duì)于以下三個(gè)條件:實(shí)際差異幅
度、置信度、抽樣規(guī)模。如果樣本規(guī)模很大,在降低置信度要求的情況下,統(tǒng)計(jì)檢驗(yàn)會(huì)顯著,
但實(shí)際意義不大。
關(guān)于平均值的理解:
樣本均值是人們采用最多的一種描述數(shù)據(jù)的方法,它反映了一組數(shù)據(jù)整體上的一些信息,然
而容易掩蓋一些極端的情況,所以有時(shí)候樣本均值不一定合理。
思考1.甲同學(xué)聽說,有個(gè)身高1.75米的成年人在平均水深為1米的小河中淹死了,他覺
得不可思議。這件事情是否是一個(gè)玩笑?
思考2.一位統(tǒng)計(jì)學(xué)家把一只腳放進(jìn)100℃的開水里,另一只腳放進(jìn)冰水中。然后宣布:現(xiàn)
在,在平均值的意義上,我感覺很舒服。
關(guān)于正確解釋統(tǒng)計(jì)數(shù)據(jù):
下面是某高速公路上發(fā)生的交通事故有關(guān)數(shù)據(jù):
速度km/h小于7070~180大于180
數(shù)量12323
丙同學(xué)由此得出結(jié)論說:統(tǒng)計(jì)數(shù)據(jù)顯示,在高速公路上,汽車速度越高,也就越安全。
實(shí)際上絕大多數(shù)的汽車行駛速度都在70~180,因此發(fā)生事故的次數(shù)也就多。
三、統(tǒng)計(jì)分析方法的選擇
全面調(diào)查與抽樣調(diào)查的分析方法不同:
全面調(diào)查一統(tǒng)計(jì)描述抽樣調(diào)查一統(tǒng)計(jì)推論
單變量與多變量的分析方法不同:
單變量一集中與分散特征多變量一相關(guān)性(有時(shí)需要將多個(gè)指標(biāo)合并。)
不同層次變量的分析方法不同:按計(jì)量尺度的不同分為定性變量和定量變量兩大類:
定類變量定序變量定距變量定比變量
定類變量
按某一個(gè)品質(zhì)特征將總體單位劃分若干個(gè)類型;
有屬性之分,無大小、程度之分
兩個(gè)原則:互斥原則;窮盡原則。
如:性別;婚姻。
定類-定類:列聯(lián)表;定類-定序:非參數(shù)檢驗(yàn);定類-定距:方差分析;
定序變量
除類別、屬性之分外,還有等級(jí)、秩序之分
如:教育程度;社會(huì)經(jīng)濟(jì)地位
定序-定序:等級(jí)相關(guān)
定距變量
除定類、定序外,取值之間有標(biāo)準(zhǔn)化的量度
可進(jìn)行加減運(yùn)算,但不能進(jìn)行乘除運(yùn)算
典型例子:智商測(cè)定
定距-定距:回歸與相關(guān)
定比變量
除定類、定序、定距之特征外,取值可
構(gòu)成一個(gè)有意義的比例
有一個(gè)絕對(duì)固定的、非任意的零點(diǎn)
可進(jìn)行乘除運(yùn)算
絕大多數(shù)經(jīng)濟(jì)變量可進(jìn)行定比測(cè)定
如:年齡;收入;
第二章單變量統(tǒng)計(jì)描述分析
一、分布'統(tǒng)計(jì)表、統(tǒng)計(jì)圖
1、分布
一個(gè)概念或變量,在各個(gè)情況出現(xiàn)的次數(shù)或頻次。
表現(xiàn)形式:(X1,n1).(X2,n2).(X3.n3)—Xn是變量X的一切可能取值
n:頻次分布%:百分比分布P:概率分布
某校學(xué)生的父親職業(yè)
職業(yè)nP%
干部1100.20020.0
工人1520.27627.6
農(nóng)民2280.52452.4
總數(shù)5501.000100.0
變量取值需要注意的問題:
(1)完整性
(2)互斥性
P23表2T~2-4
2、統(tǒng)計(jì)表
統(tǒng)計(jì)表:用表格形式來表示變量分布。
統(tǒng)計(jì)表的制作要注意的問題:
1、表號(hào)、表頭(標(biāo)題、時(shí)間、地點(diǎn))內(nèi)容簡明
2、統(tǒng)計(jì)欄數(shù)多時(shí),要加編號(hào)
3、數(shù)字填寫要求:位數(shù)對(duì)準(zhǔn),同欄數(shù)字、小數(shù)位要一致,相同數(shù)字不可以寫“同上”,無
數(shù)字欄用“一”,缺資料“…”
4、表中數(shù)字用同一單位時(shí),標(biāo)在右上角
表3.141997?1998年城鎮(zhèn)居民家庭抽樣調(diào)查資料總標(biāo)題
項(xiàng)目單位1997年1998年*---縱-
欄
‘一、調(diào)查戶數(shù)
戶3789039080)標(biāo)
二、平均每戶家庭人口數(shù)人3.193.16題
指
橫三、平均每戶就業(yè)人口數(shù)人1.831.80
5458.34|
行
四、平均每人全部收入元5188.54標(biāo)
標(biāo)
五、平均每人實(shí)際支出元4945.875322.95數(shù)
題
#消費(fèi)性支出元4185.644331.61值
非消費(fèi)性支出元755.94987.17
12.40J
1六、平均每人居住面積平方米11.90
資料來源:《中國統(tǒng)計(jì)摘要1999》,中國統(tǒng)計(jì)出版社,1999,第79頁.附
注:1.本表為城市和縣城的城鎮(zhèn)居民家庭抽樣調(diào)查材料.加
2.消費(fèi)性支出項(xiàng)目包括:食品、衣著、家庭設(shè)備用品及服務(wù)、醫(yī)療
保健、交通和通訊、娛樂教育文化服務(wù)、居住、雜項(xiàng)商品和服務(wù).
5、表的左右兩端不封閉
2.統(tǒng)計(jì)表
不同層次變量統(tǒng)計(jì)表制作:
(1)定類變量(2)定序變量(3)定距變量
(1)定類變量
表1T某單位職工民族情況匯總(2016年2月)
按民族分組人數(shù)(人)比重(%)
144048
66022
90030
合計(jì)3000100
多選項(xiàng)統(tǒng)計(jì)解決方案:P26二分法;分類法;加權(quán)平均法
(2)定序變量
表1T某單位職工年齡情況匯總(2016年2月)
按年齡段分組人數(shù)(人)比重(%)
14448
6622
9030
合計(jì)300100
(3)定距變量
某單位職工日加工零件匯總(2016年3月10日)
按零件數(shù)分組頻數(shù)(人)頻率(%)
105-110
110~115
115-120X
120-12514
125~130
1
130-135
135-140
合計(jì)50100
【例】某生產(chǎn)車間50名工人日加工零件數(shù)如下(單位:個(gè))。試采用統(tǒng)計(jì)圖表的
方式對(duì)數(shù)據(jù)進(jìn)行整理和顯示。
117122124129139107117130122125
108131125117122133126122118108
110118123126133134127123118112
112134127123119113120123127135
137114120128124115139128124121
分組方法
單項(xiàng)式分組組距分組
等距分組異距分組
表1某車間50名工人日加工零件數(shù)分組表
零件數(shù)頻數(shù)零件數(shù)頻數(shù)零件數(shù)頻數(shù)
(個(gè))(人)(個(gè))(人)(個(gè))(人)
107111911282
108212021291
110112111301
112212241311
113112341332
114112431542
115112521351
117312621371
118312731392
表2某車間50名工人日加工零件數(shù)分組表
零件數(shù)分組頻次(人)頻率(%)
110以下36
110-114510
115-119816
120-1241421
125-1291020
130-13461:
135及以上48
合計(jì)50100
定距變量分組時(shí)需注意:
1)組數(shù)適宜2)等距分組和非等距分組3)精度確定
計(jì)量資料頻數(shù)表的編制
一般情況下,樣本含量小于50的統(tǒng)計(jì)資料無須編制頻數(shù)表,但對(duì)于大樣本含量的資料,編制頻
數(shù)表有利于進(jìn)一步的統(tǒng)計(jì)分析、且頻數(shù)表本身也具有統(tǒng)計(jì)描述的作用。
編制頻數(shù)表的步驟
噪一組段包括極小值,最后
一組段包括極大值,除最后
一組段可同時(shí)標(biāo)出上下限,
其他組段只標(biāo)出下限。
舉例說明計(jì)量資料頻數(shù)表的編制過程
某地13歲女孩118人的身高(cm)資料
151134143144152145146141143156
142141142145149141150140147144
144139145139144147140139135148
139144138146146142150145138147
143140138145146148151145138148
143141160155138140150148137148
135147139148139140144142129143
142149154148153146132146148145
136145144137143150143146149143
143157143146139142143131135149
135149138152141150146142147136
141146143149147140138142
步驟如下:
R=160-129=31o組段數(shù)=10;組距=以10=3.1比3(金);按要求確定每一組段上下限。分組統(tǒng)
計(jì)每一組段的頻數(shù),編制頻數(shù)表。
計(jì)量資料頻數(shù)分布表
118例13歲女孩身高(cm)資料頻數(shù)表
頻數(shù)標(biāo)明組段真實(shí)組段頻數(shù)中心值
12130
A
2129?131128.5?131.52133
A
3132?134131.5-134.58136
A9
4135-137134.5?137.5213
X0
5138-140137.5?140.5214
A-
6141?143140.5?143.514
X5
7144?146143.5?146.522514
18
8147?149146.5?149.5915
A1
9150-152149.5?152.53154
1
10153?155152.5?155.52157
A1
-1156?158155.5-158.51166
1
-159~161158.5-161.5
合計(jì)118
頻數(shù)分布表的用途
揭示數(shù)值變量頻數(shù)分布的類型和特征
作為陳述資料的形式
便于發(fā)現(xiàn)一些特大或特小的可疑值
便于進(jìn)一步的統(tǒng)計(jì)分析
3、統(tǒng)計(jì)圖
統(tǒng)計(jì)圖就是用圖形的形式來表示變量的分布。
餅圖反映所占比例;適用于定類;
條形圖高度:頻次或百分比;寬度無意義;
定類:離散長條;定序:緊挨長條或離散長條;
直方圖高度:頻次密度=頻次/組距;寬度有意義;緊挨長條;適用于定距;
折線圖直方圖頂點(diǎn)中心相連;要計(jì)算組中心值。適用于定距變量;
頻
次
密
度
105110115120125130135140
日加工零件數(shù)(個(gè))
某車間工人日加工零件數(shù)的直方圖
直方圖與條形圖的區(qū)別
?條形圖中,條形的長度表示各類別頻數(shù)或百分比,寬度則往往固定,沒有數(shù)值意義。
?直方圖中,矩形的高度表示每一組的頻次密度或相對(duì)頻次密度,寬度則表示各組的組距,
其高度與寬度均有數(shù)值意義。
?直方圖的各矩形通常是連續(xù)排列,條形圖則有連續(xù)排列,也有離散排列。
?直方圖適用于定距變量,條形圖適用于定類變量和定序變量。
,折線圖也稱頻數(shù)多邊形圖(Frequencypolygon)?
?在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直
線連接而成。
折線圖(Polygon)
?用各組變量值或組中值與相應(yīng)的頻數(shù)或頻率作為每個(gè)點(diǎn)的橫縱坐標(biāo),連線而成。
?折線的兩個(gè)端點(diǎn)與橫軸相交,具體的做法是:
-第一個(gè)矩形的頂部中點(diǎn)通過豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)
矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸。
對(duì)某公司職員月平均收入進(jìn)行抽樣調(diào)查,得以下數(shù)據(jù)資料。
按收入分組人數(shù)比重(%)
(元)
1000-1499910
1500?19992123.3
2000?24993235.6
2500?29991516.7
3000?35001314.4
合計(jì)90100
直方圖(Histogram)
4、累計(jì)圖和累計(jì)表
cft:向上累計(jì)?小于某一數(shù)字的頻數(shù)
cfI:向下累計(jì)。大于某一數(shù)字的頻數(shù)
年齡人數(shù)cfTcfl
153318
166915
179189
按收入多占全部收人口累計(jì)累計(jì)的收入百分比
少形成的入的比重百分比
絕對(duì)平均絕對(duì)不平實(shí)際情況
人口序列(%)(%)
(%)均(%)(%)
最低的10.122020010.12
20%
第二個(gè)14.074040024.19
20%
第三個(gè)17.826060042.01
20%
第四個(gè)21.998080064.00
20%
第五個(gè)36.00100100100100.00
20%
資料來源:(統(tǒng)計(jì)研究》1986年第1期
漏
>
1
(號(hào)
)
p(%
人口
曲線
洛侖茲
/A+B
數(shù):A
基尼系
析
布圖分
5、分
)
(peak
研究
峰點(diǎn)
(1)
ry)
(symmet
研究
對(duì)稱
(2)
曲線
與J形
形曲線
(3)U
線
峰狀曲
曲線
不對(duì)稱
對(duì)稱與
線
U形曲
曲線
反J形
曲線
正J形
2-23
P42圖
變。
而改
不同
組的
隨著分
狀,會(huì)
的形
布圖
:分
注意
計(jì)量資料頻數(shù)分布的類型和特征
二、集中趨勢(shì)測(cè)量法
用典型變量或特征值來代表變量全貌。
1.眾數(shù)(mode)
頻數(shù)最多的變量值,適合于單峰對(duì)稱;適用任何層次的變量(定類、定序、定距);
2.中位數(shù)(median)
數(shù)據(jù)序列中央位置之值。適合于定序及以上變量(定序、定距);
根據(jù)原始資料:
將數(shù)據(jù)排序后,排在中間位置的數(shù),數(shù)據(jù)分為兩半,一半比它大,一半比它??;median()
根據(jù)頻次分布:P45
累計(jì)百分比c%3中間值位置50%的變量值;
累計(jì)頻次eft,中間值位置N+1/2的變量值;
尋找累計(jì)百分比c%f中50%的點(diǎn);
P46表2-19
分組數(shù)據(jù),根據(jù)分組區(qū)間:
尋找累計(jì)百分比c%t中50%的點(diǎn);
P46表2-19
X/(U-L)=(50%-L%)/(U%-L%)
X/(l.0-0.8)=(50%-36.3%)/(54.5%-36.3%)
X/0.2=13.7%/18.2%
X=0.15
中位值Md=0.8+0.15=0.95
3.均值
算術(shù)平均、加權(quán)平均,可適用于定距變量。
1)對(duì)于未分組資料
-Yx..
X——average()
N
注意:對(duì)求和符號(hào),此時(shí)流動(dòng)腳標(biāo)的變動(dòng)范圍是1,2.3.…,凡是總體單位數(shù)。
[例]求74、85、69、91>87、74、69這些數(shù)字的算術(shù)平均數(shù)。
[解]
根據(jù)頻次/頻率分布求;P49
叉=
N
2)對(duì)于分組資料
7=工咕
注意:對(duì)求和符號(hào),此時(shí)流動(dòng)腳標(biāo)的變動(dòng)范圍是1,2,3…,〃,〃是組數(shù),而不是總體單位
數(shù)。
很顯然,算術(shù)平均數(shù)不僅受各變量值(M大小的影響,而且受各組單位數(shù)(頻數(shù))的影響。由于
對(duì)于總體的影響要由頻數(shù)(戶)大小所決定,所以尸也被稱為權(quán)數(shù)。值得注意的是,在統(tǒng)計(jì)計(jì)
算中,權(quán)數(shù)不僅用來衡量總體中各標(biāo)志值在總體中作用,同時(shí)反映了指標(biāo)的結(jié)構(gòu),所以它有
兩種表現(xiàn)形式:絕對(duì)數(shù)(頻數(shù))和相對(duì)數(shù)(頻率)。
[例]求下表(單項(xiàng)數(shù)列)所示數(shù)據(jù)的算術(shù)平均數(shù)
人口數(shù)(X)戶數(shù)⑴頻率(P)
250.10
380.16
4160.32
5100.20
660.12
740.08
810.02
合計(jì)501.00
對(duì)于組距數(shù)列,要用每一組的組中值權(quán)充該組統(tǒng)一的變量值。
[例]求下表所示數(shù)據(jù)的的算術(shù)平均數(shù)
間距頻數(shù)(f)組中值(X)
148—1521150
152—1562154
156—1605158
160—16410162
164—16819166
168—17225170
172—17617174
176—18012178
180—1845182
184—1883186
188—1920190
192—1961194
合計(jì)100
"d(冗M(jìn)3
對(duì)稱的
負(fù)偏正偏
圖3.5中位數(shù)、眾數(shù)和算術(shù)平均數(shù)的位置比較
三、離散程度測(cè)度
7(1)異眾比率;(2)極差和四分位差;(3)方差、標(biāo)準(zhǔn)差;
所謂離散趨勢(shì),是指數(shù)列中各變量值之間的差距和離散程度。離勢(shì)小,平均數(shù)的代表性高;
離勢(shì)大,平均數(shù)代表性低。
例如有A、B、C、D四組學(xué)生各5人的成績?nèi)缦拢?/p>
A組:60,60,60,60,60
B組:58,59,60,61,62
C組:40,50,60,70,80
D組:80,80,80,80,80
數(shù)據(jù)顯示,平均數(shù)相同,離散趨勢(shì)可能不同;平均數(shù)不同,離散趨勢(shì)可能相同。
(1)異眾比率(variationratio)
非眾數(shù)在總數(shù)N中所占的比例產(chǎn)(N-f)/Nf為眾值的頻數(shù)
{1,3,4,5,6,6,6,7}T=(8-3)/8=0.625
(2)極差(Range)
最大值和最小值之差,也叫全距。全距越大,表示變動(dòng)越大。
R(極差)=Xmax-Xmin
[例]求74,84,69,91,87,74,69這些數(shù)字的全距。
[解]把數(shù)字按順序重新排列:69,69,74,74,84,87,91,顯然有
R=Xmax-Xmin=91—69=22
優(yōu)點(diǎn):計(jì)算簡單、直觀。
缺點(diǎn):(1)受極端值影響大;
(2)沒有量度中間各個(gè)單位的差異性;
(3)受抽樣變動(dòng)影響大,大樣本全距比小樣本全距大。
(3)四分互差(interquartilerange)
第三四分位數(shù)和第一四分位數(shù)的半距。避免全距受極端值影響大的缺點(diǎn)。
四分位差越小,說明中間部分的數(shù)據(jù)越集中;四分位差越大,則意味著中間部分的數(shù)據(jù)越分
散。
四分位數(shù):將所有數(shù)值按大小順序排列并分成四等份,最小的四分位數(shù)稱為下四分位數(shù),中
點(diǎn)位置的四分位數(shù)是中位數(shù),最大的四分位數(shù)為上四分位數(shù)?quartile(array,k)。k為0,則
返回最小值;k為1,返回第1個(gè)四分位數(shù)…,k為4,返回最大值。
百分位數(shù):測(cè)定數(shù)據(jù)在總體中的百分位置的指標(biāo)。將數(shù)值按大小排列,分成100個(gè)等份,則
這99個(gè)數(shù)值或99個(gè)點(diǎn)就稱為百分位數(shù)。percentile(array,k)k為0—1之間的百分點(diǎn)值。
(4)方差(variance)62與標(biāo)準(zhǔn)差(standarddeviation)6
方差:將觀察值與均值之差的平方和除以全部觀察總數(shù)N。
標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差:所有觀察值與其均值的離差平方的平均數(shù)的平方根。反映總體中各數(shù)值的
平均離差程度。標(biāo)準(zhǔn)差有總體標(biāo)準(zhǔn)差stdevp()和樣本標(biāo)準(zhǔn)差之分stdev()
求72、81、86、69、57這些數(shù)字的標(biāo)準(zhǔn)差。
轉(zhuǎn)容:耍73.05=/守=片=私。6
[例]調(diào)查大一男生60人的身高情況如下表所示,求他們身高的標(biāo)準(zhǔn)差。
組距力£
150?154+
154?158+2P
158?162”7。
162?166,10+
166-170-16-
170-174^12.
174?178.7。
178?182~5,
合計(jì)「60.
第三章概率
一、基礎(chǔ)概率
1、隨機(jī)現(xiàn)象與隨機(jī)試驗(yàn)
隨機(jī)現(xiàn)象一一非確定性現(xiàn)象(隨機(jī)現(xiàn)象也存在規(guī)律)
隨機(jī)試驗(yàn):對(duì)隨機(jī)現(xiàn)象的觀察
隨機(jī)試驗(yàn)須符合的條件:
1)可以在相同的條件下重復(fù)進(jìn)行
2)試驗(yàn)的所有結(jié)果是事先已知的,并且不止一個(gè)
3)每次試驗(yàn)只能出現(xiàn)可能結(jié)果的一種,且不能預(yù)先判斷是哪一種如:擲硬幣
2,概率的概念
隨機(jī)事件:隨機(jī)現(xiàn)象結(jié)果的集合;
概率:隨機(jī)事件發(fā)生可能性大小的數(shù)量表示。反映隨機(jī)事件內(nèi)涵的統(tǒng)計(jì)規(guī)律性。
三種情況:
1)不可能事件0概率P
2)必然事件S概率
3)必然與不可能之間E概率
3、概率的計(jì)算方法
1)頻率法
頻數(shù)與頻率
隨機(jī)事件E出現(xiàn)的次數(shù)n一一頻數(shù)
n與實(shí)驗(yàn)次數(shù)N的比值一頻率
頻率的三種狀況:
概率是實(shí)驗(yàn)或觀察次數(shù)N趨于無窮時(shí),相應(yīng)頻率的穩(wěn)定值。
頻率是一個(gè)近似值,概率是一個(gè)理論值、唯一的精確值,比頻率完美。
二、概率分布、均值與方差
1、概率分布:
隨機(jī)現(xiàn)象一共有多少種結(jié)果,以及每種結(jié)果伴隨的概率。
為了研究方便,將隨機(jī)現(xiàn)象進(jìn)行量化,看做變量,把隨機(jī)變現(xiàn)象的各種結(jié)果看做變量的
各種取值。
={X1=硬幣正面,X2=硬幣反面}
概率分布:(XI,pl)(X2,p2)
分布列表明全部概率在各可能取值之間的分布規(guī)律,全面描述離散隨機(jī)變量的統(tǒng)計(jì)規(guī)律。(變
量取值要滿足:完備,不相容)
(1)離散型隨機(jī)變量及其概率分布
可能的取值是有限個(gè)或可數(shù)個(gè)數(shù),這些取值都具有確定的概率。
適用于定類、定序、定距變量。
概率分布:R■;=工i)=Pi
性質(zhì):
I)PkNG2)EPK=;
K=J
由此可以計(jì)算隨機(jī)變量取值Xi所對(duì)應(yīng)的概率pi,也可以計(jì)算隨機(jī)變量在某一區(qū)間的概率。
【例】投擲一顆骰子后出現(xiàn)的點(diǎn)數(shù)是一個(gè)離散型隨機(jī)變量。寫出擲一枚骰子出現(xiàn)點(diǎn)數(shù)的概率
分布
概率分布
X=Xj123456
P(X=xi)=pi1/61/61/61/61/61/6
P(x=3,4,5)=
[例]某地區(qū)兒童普查數(shù)據(jù)如下表,求其兒童年齡概率分布圖。求3歲以下兒童的概率情況。
年齡(X)百分比(%)
210%
316%
432%
520%
612%
78%
82%
合計(jì)100%
概率
3歲以下兒童的概率情況
離散型隨機(jī)變量的概率分布
1.列出離散型隨機(jī)變量X的所有可能取值
2.列出隨機(jī)變量取這些值的概率
3.通常用下面的表格來表示
X=XjAT],X?'.一,大〃
P(X=xi)=piPl9Pl9…,Pn
4.P(X=x/)=pi稱為離散型隨機(jī)變量的概率函數(shù)
*
=1
PR;XA
(2)連續(xù)型隨機(jī)變量及其概率分布一一概率密度函數(shù)
可能的取值,連續(xù)地充滿某個(gè)區(qū)間。適用于定距變量。
因?yàn)槿≈凳沁B
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- Unit3 It's Too Expensive(說課稿)-2024-2025學(xué)年北師大版(一起)英語四年級(jí)上冊(cè)001
- 2025【各行各業(yè)合同協(xié)議模板】【各行各業(yè)合同協(xié)議模板】商鋪轉(zhuǎn)讓協(xié)議
- 2025常用版工程工程合同樣式
- 2023八年級(jí)英語下冊(cè) Module 9 Friendship Unit 1 Could I ask if you've mentioned this to her第二課時(shí)說課稿 (新版)外研版
- 2025墻體廣告制作發(fā)布合同
- 2025國際貿(mào)易合同樣本參考
- Unit 3 My weekend plan Part A Let's talk Let's learn大單元整體說課稿表格式-2024-2025學(xué)年人教PEP版英語六年級(jí)上冊(cè)
- 9 生活離不開規(guī)則說課稿-2023-2024學(xué)年道德與法治三年級(jí)下冊(cè)統(tǒng)編版
- 3 《百合花》 (說課稿)-2024-2025學(xué)年高一語文同步說課稿與知識(shí)梳理(統(tǒng)編版必修上冊(cè))
- Unit 4 My home PB Let's learn (說課稿)-2024-2025學(xué)年人教PEP版英語四年級(jí)上冊(cè)
- 淺談堤防施工前怎么做好碾壓試驗(yàn)
- 銀行內(nèi)部舉報(bào)管理規(guī)定
- 平面幾何強(qiáng)化訓(xùn)練題集:初中分冊(cè)數(shù)學(xué)練習(xí)題
- 項(xiàng)目獎(jiǎng)金分配獎(jiǎng)勵(lì)制度和方案完整版
- 支氣管鏡試題
- 陰道鏡幻燈課件
- 現(xiàn)代漢語詞匯學(xué)精選課件
- PCB行業(yè)安全生產(chǎn)常見隱患及防范措施課件
- 上海音樂學(xué)院 樂理試題
- SAP中國客戶名單
- WZCK-20系列微機(jī)直流監(jiān)控裝置使用說明書(v1.02)
評(píng)論
0/150
提交評(píng)論