概率、信息描述與抽樣推斷小結(jié)._第1頁
概率、信息描述與抽樣推斷小結(jié)._第2頁
概率、信息描述與抽樣推斷小結(jié)._第3頁
概率、信息描述與抽樣推斷小結(jié)._第4頁
概率、信息描述與抽樣推斷小結(jié)._第5頁
已閱讀5頁,還剩100頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、概率與正態(tài)曲線概率與正態(tài)曲線 1.1.研究隨機性和規(guī)律性的兩個例子研究隨機性和規(guī)律性的兩個例子 1 1)2020世紀世紀5050年代,小兒麻痹癥育苗的研究。年代,小兒麻痹癥育苗的研究。實驗組(疫苗)實驗組(疫苗)20萬5656對照組(安慰對照組(安慰劑)劑)20萬138138問題是:問題是:5656和和138138之間的差別是否超過了之間的差別是否超過了隨機性所能解釋的范圍。隨機性所能解釋的范圍。 2)1970,美國越戰(zhàn)的征兵1183366305931/71/114/98/631/1210011073問題是:73和和110之間的差別是否超過了隨機性之間的差別是否超過了隨機性所能解釋的范圍。所能

2、解釋的范圍。 思考題思考題 擰松水龍頭,讓其剛好到只有水滴下來,計算擰松水龍頭,讓其剛好到只有水滴下來,計算并記錄并記錄1515分鐘內(nèi)每個分鐘內(nèi)每個2020秒里的水滴數(shù)。利用你秒里的水滴數(shù)。利用你的數(shù)據(jù),請說出該水滴在什么方面是隨機的?的數(shù)據(jù),請說出該水滴在什么方面是隨機的?什么方面又是有規(guī)律的?什么方面又是有規(guī)律的? 1 1)隨機性隨機性和和規(guī)律性規(guī)律性是統(tǒng)計學(xué)的兩個重要概念。是統(tǒng)計學(xué)的兩個重要概念。規(guī)律規(guī)律性本身包含著隨機性性本身包含著隨機性。統(tǒng)計可以定義為在隨機性中尋。統(tǒng)計可以定義為在隨機性中尋找規(guī)律性,當(dāng)兩種規(guī)律之間的差異超出了隨機性本身找規(guī)律性,當(dāng)兩種規(guī)律之間的差異超出了隨機性本身的

3、影響(或者解釋范圍),變化趨勢就發(fā)生了。的影響(或者解釋范圍),變化趨勢就發(fā)生了。 2 2)概率為我們從數(shù)據(jù)中得出結(jié)論提供了基礎(chǔ),)概率為我們從數(shù)據(jù)中得出結(jié)論提供了基礎(chǔ),統(tǒng)計統(tǒng)計學(xué)家利用概率判斷數(shù)據(jù)間的差異是否超出了隨機性本學(xué)家利用概率判斷數(shù)據(jù)間的差異是否超出了隨機性本身的影響身的影響。 3 3)統(tǒng)計很少對總體進行直接的研究,都是通過對具)統(tǒng)計很少對總體進行直接的研究,都是通過對具有代表性的樣本的研究,來對總體的信息進行推斷。有代表性的樣本的研究,來對總體的信息進行推斷。一、概率論發(fā)展簡史一、概率論發(fā)展簡史1. 1. 概率論的起源概率論的起源Pascal(16231662) Fermat, (

4、16011665) 16541654年,賭年,賭金分配問題金分配問題 賭金分配問題賭金分配問題 梅雷說:有一次他與某賭友梅雷說:有一次他與某賭友( (代稱為代稱為A A先生先生) )擲骰擲骰子時,各押子時,各押3232個金幣為賭注,雙方約定如果誰先個金幣為賭注,雙方約定如果誰先贏得贏得3 3局,就可以把賭金全部拿走,但因為梅雷局,就可以把賭金全部拿走,但因為梅雷臨時有事,所以賭局不得不中途中斷。此時梅雷臨時有事,所以賭局不得不中途中斷。此時梅雷已經(jīng)贏得已經(jīng)贏得2 2局,而局,而A A先生只贏先生只贏1 1局,局,如何公平分配如何公平分配賭金?賭金? 起點起點費馬費馬:情況情況1 12 23 3

5、4 4勝者勝者梅雷、梅雷梅雷、梅雷 梅雷、梅雷、A AA A、梅雷、梅雷A A、A A帕斯卡爾:帕斯卡爾: 16551655年,荷蘭數(shù)學(xué)家惠更斯年,荷蘭數(shù)學(xué)家惠更斯 (Christopher (Christopher Huygens) Huygens) 訪問巴黎時,了解到帕斯卡爾與費馬訪問巴黎時,了解到帕斯卡爾與費馬的通信研究,對這類問題產(chǎn)生興趣,后來,他撰的通信研究,對這類問題產(chǎn)生興趣,后來,他撰寫寫骰子游戲骰子游戲(Dice Game, 1657) (Dice Game, 1657) 來探討機率來探討機率問題的原理,其中包含許多習(xí)題,被許多人認為問題的原理,其中包含許多習(xí)題,被許多人認為是

6、機率史上第一本教科書。是機率史上第一本教科書。提出了期望的概念提出了期望的概念。 17131713年,瑞士數(shù)學(xué)家伯努利(年,瑞士數(shù)學(xué)家伯努利(Jacob BernoulliJacob Bernoulli,1654 17051654 1705)出版了)出版了猜度術(shù)猜度術(shù)一書,一書,提出了提出了大數(shù)定理大數(shù)定理 。 17651765年,法國數(shù)學(xué)家棣莫弗年,法國數(shù)學(xué)家棣莫弗(A.DeMoivre,16671754A.DeMoivre,16671754)的)的機會的學(xué)說機會的學(xué)說一書出版,一書出版,17331733年就發(fā)現(xiàn)了正態(tài)曲線年就發(fā)現(xiàn)了正態(tài)曲線,以及論述,以及論述了不存在運氣。了不存在運氣。 1

7、9331933年,俄羅斯數(shù)學(xué)家科爾莫戈羅夫年,俄羅斯數(shù)學(xué)家科爾莫戈羅夫(1903(190319871987)以德文出版的經(jīng)典性著作)以德文出版的經(jīng)典性著作概率論基礎(chǔ)概率論基礎(chǔ),標(biāo)志著概率論的公理化完成,這就是我們現(xiàn)在看標(biāo)志著概率論的公理化完成,這就是我們現(xiàn)在看到的概率論的情形。到的概率論的情形。2. 2. 概率論專有名詞概率論專有名詞隨機實驗隨機實驗(Random trial)(Random trial):滿足如下三個條件就可以稱:滿足如下三個條件就可以稱之為隨機實驗:(之為隨機實驗:(1 1)在同一條件下可無限次重復(fù);()在同一條件下可無限次重復(fù);(2 2)實驗結(jié)果有多個,且不確定;(實驗結(jié)

8、果有多個,且不確定;(3 3)事前不知實驗結(jié)果)事前不知實驗結(jié)果(outcomeoutcome)。拋硬幣)。拋硬幣 基本事件基本事件(Elementary event)(Elementary event):一次隨機實驗的可能結(jié):一次隨機實驗的可能結(jié)果,稱為基本事件或者基本隨機事件。果,稱為基本事件或者基本隨機事件。若隨機實驗若隨機實驗E E是是“拋兩次硬幣拋兩次硬幣”,其基本事件就是,其基本事件就是“+ +、”,“+ +、+”+”,“,”,“,+”+”。樣本空間樣本空間(Sample space)(Sample space):所有基本事件所組成的集合,:所有基本事件所組成的集合,稱為樣本空間或

9、基本空間。稱為樣本空間或基本空間。接上例,其樣本空間就是集合接上例,其樣本空間就是集合“+“+、”,“+ +、+”+”,“,”,“,+”+”。 隨機事件隨機事件(Random event)(Random event):簡稱事件,指一些由基本事件所組成的集合。簡稱事件,指一些由基本事件所組成的集合。 例如,接上例,事件例如,接上例,事件“兩次出現(xiàn)相同面兩次出現(xiàn)相同面”,就有兩個,就有兩個基本事件組成:基本事件組成:+ +、+”+”,“,”。 不相容事件不相容事件(Mutually exclusive events)(Mutually exclusive events):在隨機試驗中,不能同時發(fā)生

10、或其交集為空集的幾在隨機試驗中,不能同時發(fā)生或其交集為空集的幾個事件,稱為不相容事件。反之為相容事件個事件,稱為不相容事件。反之為相容事件 接上例,事件接上例,事件“兩次同時出現(xiàn)正面兩次同時出現(xiàn)正面”和和“兩次同時出兩次同時出現(xiàn)反面現(xiàn)反面” ” 就是不相容事件。就是不相容事件。“至少出現(xiàn)一次正面至少出現(xiàn)一次正面”和和“至少出現(xiàn)反面至少出現(xiàn)反面”就是兩個相容事件就是兩個相容事件3. 3. 概率的含義概率的含義 概率概率(Probability)是一個是一個0 0到到1 1之間的數(shù),描述了一個事件發(fā)之間的數(shù),描述了一個事件發(fā)生的經(jīng)常程度生的經(jīng)常程度。小概率(接近。小概率(接近于于0)的事件很少發(fā)生

11、,而大)的事件很少發(fā)生,而大概率(接近于概率(接近于1)的事件則經(jīng))的事件則經(jīng)常發(fā)生。常發(fā)生。 概率對統(tǒng)計的意義:對于統(tǒng)計,概率對統(tǒng)計的意義:對于統(tǒng)計,概率告訴我們,概率告訴我們,在樣本數(shù)據(jù)的在樣本數(shù)據(jù)的基礎(chǔ)上,如果試驗重復(fù)多次,基礎(chǔ)上,如果試驗重復(fù)多次,各種結(jié)果發(fā)生的經(jīng)常程度是多各種結(jié)果發(fā)生的經(jīng)常程度是多大大。.5 01不可能不可能必然必然4.4.獲得概率的基本方法獲得概率的基本方法 利用機會均等法則利用機會均等法則(Equality likely (Equality likely approach)approach) 使用相對頻次使用相對頻次(Relative frequency)(Rel

12、ative frequency)的方的方法法利用主觀概率利用主觀概率(Subjective approach)(Subjective approach) 4.1 4.1 利用機會均等法則利用機會均等法則如果試驗有如果試驗有n n種可能的結(jié)果,使某特定事件出種可能的結(jié)果,使某特定事件出現(xiàn)的結(jié)果數(shù)量為現(xiàn)的結(jié)果數(shù)量為k k,那么(,那么(k/nk/n)就是出現(xiàn)該事)就是出現(xiàn)該事件的概率。件的概率。思考題:一副撲克思考題:一副撲克5252張(大、小王去掉),洗均勻,張(大、小王去掉),洗均勻,隨機取一張牌,那么該張牌是梅花的概率是多少?隨機取一張牌,那么該張牌是梅花的概率是多少?kn要注意兩點要注意兩

13、點: (1)分清楚你求解問題中什么是你的n,什么是你的k。 (2) 其實我們在這樣做的時候,就已經(jīng)接受了兩個前提假設(shè)兩個前提假設(shè):a)實驗的可能結(jié)果是已知的;b)由于對稱性,每一個結(jié)果的可能性都是相同的。往往這兩個前提假設(shè)不一定滿足.思考題思考題再求以下問題的概率中,以上的哪個前提假設(shè)再求以下問題的概率中,以上的哪個前提假設(shè)不滿足:不滿足: 1 1)一場賽馬比賽,有)一場賽馬比賽,有6 6匹馬,求某一匹馬勝匹馬,求某一匹馬勝出的概率。出的概率。 2 2)求解生男孩和女孩的概率)求解生男孩和女孩的概率14講小結(jié)講小結(jié)一、一、霍桑實驗霍桑實驗中的群體實驗中的群體實驗 這個實驗的目的就是要看看,當(dāng)每

14、個工人的工這個實驗的目的就是要看看,當(dāng)每個工人的工作情況不但與自己的報酬、而且與同伴的報酬作情況不但與自己的報酬、而且與同伴的報酬緊密關(guān)聯(lián)時,工人會如何辦?怎樣協(xié)作?緊密關(guān)聯(lián)時,工人會如何辦?怎樣協(xié)作?實驗條件:(1)人員:14名男職工,其中9名繞線工,3名是焊接工,2名檢驗工;(2)計件工作制度,但卻不是按個人的產(chǎn)量計酬,而是按集體的總產(chǎn)量計酬;報酬由廠方直接支付給個人,而不是交由小組自行分配。這樣,工人完成的工作數(shù)額,不但決定著自己的工資,而且直接影響著一起干活的同事們的收入。實驗結(jié)果:工人每天只完成了60006600個焊接點(標(biāo)準每個工人應(yīng)該完成7312個焊接點),且天天如此。為什么?為

15、什么? 解釋解釋1 1:可能是這些工人的智力或者動作協(xié)調(diào):可能是這些工人的智力或者動作協(xié)調(diào)性有問題。性有問題。 再做研究,研究測試結(jié)果否定了這一解釋。再做研究,研究測試結(jié)果否定了這一解釋。合理的解釋:工人們自動限制產(chǎn)量的理由是,如果他們過分努力地工作,就可能造成群體內(nèi)同伴的失業(yè),或者公司會制定出更高的生產(chǎn)定額來。所以群體會迫使其中的個體進行一致限產(chǎn)。也就是工人會受到也就是工人會受到非正式組織的影響。非正式組織的影響。 證實在工人當(dāng)中存在著一種非正式的組織在工人當(dāng)中存在著一種非正式的組織,而且這種非正式的組織對工人的生產(chǎn)率有著極其重要非正式的組織對工人的生產(chǎn)率有著極其重要的影響的影響 總結(jié)一下該

16、研究的研究過程不支持支持提出假設(shè)數(shù) 據(jù) 分數(shù) 據(jù) 分析析假設(shè)成為一種假說,進而為理論數(shù)據(jù)支持假設(shè)么?理論研究(產(chǎn)生方式)理論研究(產(chǎn)生方式)2通過實驗或其他方式收集數(shù)據(jù)二、變量(二、變量(variablevariable) 變量簡單的說就是事物的特征或者屬性。變量簡單的說就是事物的特征或者屬性。 研究者在研究項目開始的時候,就要確定他們所要研究的變量是什么。 變量的值(變量的值(value)通常是對某一個特定單位的度量,這種單位常常被視為一個個體一個個體(element)。什么是個體取決于你的研究問題。 2 21 1 變量的測量層次變量的測量層次 1 1)思考題:)思考題:請回答以下收集到的數(shù)

17、據(jù),可以進行請回答以下收集到的數(shù)據(jù),可以進行“ ”,“”,“、” ” ,“,”中的哪些運算?中的哪些運算? (1 1)五個人的性別:)五個人的性別:1 1,0 0,0 0,1 1,1 1(1 1:男性;:男性;0 0:女:女性)性) (2 2)五個人的身高:)五個人的身高:170170,173173,165165,180180,161161(單位:(單位:厘米)厘米) (3 3)七天的氣溫(攝氏溫度)七天的氣溫(攝氏溫度):):1515,2424,2727,1818,3434,3030,1919。 (4 4)五個人對一項政策滿意程度的評分:)五個人對一項政策滿意程度的評分: 5 5,3 3,3

18、 3,4 4,2 2(1 1:十分不滿意;:十分不滿意;2 2:不滿意;:不滿意;3 3:一般或中立;:一般或中立;4 4:滿意;:滿意;5 5:十分滿意):十分滿意) 2 2)思考題:)思考題: (1 1)我們用一個量表測量人們對一項法律的態(tài)度,)我們用一個量表測量人們對一項法律的態(tài)度,如果如果1 1表示不贊成,表示不贊成,2 2表示無所謂,表示無所謂,3 3表示贊成,對表示贊成,對于于3 3個人我們測得的值分別為:個人我們測得的值分別為:3 3、1 1、2 2,這些數(shù)據(jù),這些數(shù)據(jù)為為_數(shù)據(jù)。數(shù)據(jù)。 (2 2)測量)測量1010個大學(xué)生所在的年級,如果用個大學(xué)生所在的年級,如果用1 1表示大

19、表示大一、一、2 2表示大二、表示大二、3 3表示大三、表示大三、4 4表示大四、表示大四、5 5表示其表示其他。測量的值為:他。測量的值為:1 1、3 3、4 4、1 1、2 2、3 3、2 2、1 1、1 1、4 4,這些數(shù)據(jù)為這些數(shù)據(jù)為_數(shù)據(jù)。數(shù)據(jù)。 (3 3)測得)測得5 5個人的第一次結(jié)婚年齡(單位:周歲)個人的第一次結(jié)婚年齡(單位:周歲)為:為:2020、2222、2424、3030和和2626,這些數(shù)據(jù)為,這些數(shù)據(jù)為_數(shù)據(jù)。數(shù)據(jù)。 三、頻數(shù)分布數(shù)列三、頻數(shù)分布數(shù)列 1.統(tǒng)計分組后,每個組分配的總體單位數(shù)稱為頻數(shù)或次數(shù)(f)。 頻數(shù)/總體單位總數(shù)=頻率。 2.意義 整理了雜亂無章的

20、數(shù)據(jù),同時顯示出一批數(shù)的分布情況,是數(shù)理統(tǒng)計學(xué)中隨機變量及其概論分布概念在實際中的應(yīng)用。例1 家庭所擁有的電視機數(shù)對于廣告行業(yè)來說是一個重要的信息,下面的數(shù)據(jù)是隨機抽取的50戶家庭中每個家庭所擁有的電視機數(shù)。 1 1 1 2 6 3 3 4 2 4 3 2 1 5 2 1 3 6 2 2 3 1 1 4 3 2 2 2 2 3 0 3 1 2 1 2 3 1 1 3 3 2 1 1 3 1 5 1 你能從中發(fā)現(xiàn)什么?電視機數(shù)電視機數(shù)頻次頻次頻率頻率0 01 10.020.021 116160.320.322 214140.280.283 312120.240.244 43 30.060.065

21、 52 20.040.046 62 20.040.04 思考題: (1)如果要讓你去獲取你所在樓層的家庭擁有的電視機數(shù)量的分布,你怎么去獲?。?(2)如果要讓你去獲取廣州市家庭擁有的電視機數(shù)量的分布,你怎么去獲?。克?、集中趨勢分析四、集中趨勢分析 集中趨勢是數(shù)據(jù)分布的中心,描述集中趨勢的指標(biāo)有算集中趨勢是數(shù)據(jù)分布的中心,描述集中趨勢的指標(biāo)有算術(shù)平均數(shù)術(shù)平均數(shù)( )( )、幾何平均數(shù)(、幾何平均數(shù)( )、中位)、中位數(shù)(數(shù)( )、眾數(shù))、眾數(shù)( )( )等。等。MeoMxG眾數(shù)眾數(shù)中位數(shù)中位數(shù) 1.平均數(shù)的分類平均數(shù)的分類2.算術(shù)平均數(shù)的計算公式 算術(shù)平均數(shù) 1.1.簡單算術(shù)平均數(shù)簡單算術(shù)平均數(shù)

22、: : 2.加權(quán)算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù):12nXXXXXnnffXffffffkkk212211XXXX 例1:應(yīng)用條件:資料未分組,各組出現(xiàn)的次數(shù)都是應(yīng)用條件:資料未分組,各組出現(xiàn)的次數(shù)都是1 1。5 5名學(xué)生的學(xué)習(xí)成績分別為:名學(xué)生的學(xué)習(xí)成績分別為:7575、9191、6464、5353、8282。則平均成績?yōu)椋?。則平均成績?yōu)椋?=73(分) 分分平平均均成成績績73536558253649075 x例2:某車間某車間2020名工人加工某種零件資料:名工人加工某種零件資料:按日產(chǎn)量分組(件)按日產(chǎn)量分組(件)x x工人數(shù)(人)工人數(shù)(人)f f 日產(chǎn)總量日產(chǎn)總量 xfxf 14 14 2

23、 2 28 28 15 15 4 4 60 60 16 16 8 8 128 128 17 17 5 5 85 85 18 18 1 1 18 18 合計合計 20 20 319 319 件件平均日產(chǎn)量平均日產(chǎn)量1620319 x= 16(件)件)123111111nniinnHXXXXX甲甲乙乙丙丙1.200.500.801800012500 64001500025000 8000合計合計3690048000 12312311231nnniininiimmmmmHmmmmmXXXXX%44. 94500425%7105%10200%121201052001201mxmH調(diào)和平均數(shù)調(diào)和平均數(shù)

24、(例題分析例題分析)(1)(2))/(38. 11667. 23215 . 11113n1nH元公斤6.5 6.5 6.519.51.38(/ )111114.08336.56.56.511.52mHmx 公 斤元 (3)(4)3 2 161.24(/)11114.8332111.52mHmx 公斤元元)(公斤/5 . 1325 . 11nxx200 200 20060025.2(/)111123.81200200200302820mHmx公 里小)/(266156222220228230fxfx小時公里4. 幾何平均數(shù)的計算公式 幾何平均數(shù) 1.簡單幾何平均數(shù): : 2.加權(quán)幾何平均數(shù): n

25、nxxx 21GG ffnffnxxx 2121例:1.某產(chǎn)品經(jīng)過三個流水連續(xù)作業(yè)的車間加工生產(chǎn)而成,本月第一車間的產(chǎn)品合格率為90%,第二車間的產(chǎn)品合格率為80%,第三車間的產(chǎn)品合格率為70%。則全廠的總合格率為:%4.50%70%80%90總合格率這樣平均合格率為321%70%80%90nnxxxG平均合格率%58.79%4.503 例2:設(shè)某筆為期20年的投資按復(fù)利計算收益,前10年的年利率為10%,中間5年的利率為8%,最后5年的年利率為6%。求平均年利率。 解答:假設(shè)初始投資額為a,則20年后的本利和為A。則 Aa(1+10%)10(1+8%)5(1+6%)5 所謂的平均年利率,設(shè)為

26、r,就是要使得a(1+r)20=A, 即a(1+r)20= a(1+10%)10(1+8%)5(1+6%)5 %49.10820506. 1508. 1101 . 1)1 (r年平均本利率%49.81%49.108r年平均利率5.眾數(shù)眾數(shù) 1.眾數(shù)的含義:眾數(shù)的含義:總體中出現(xiàn)次數(shù)最多、頻率最高的標(biāo)志值??傮w中出現(xiàn)次數(shù)最多、頻率最高的標(biāo)志值。 2.確定眾數(shù)的方法。確定眾數(shù)的方法。 (1)單項數(shù)列確定眾數(shù)單項數(shù)列確定眾數(shù) 21(件)(件)按日產(chǎn)量分組(件)按日產(chǎn)量分組(件)工人數(shù)(人)工人數(shù)(人)20201515212130302222202023231010oM眾數(shù)的缺點只考慮出現(xiàn)次數(shù)最多的資

27、料,忽略了其他數(shù)值大小,故較不具敏感性除非知道全部的資料,否則我們無法由兩組已知眾數(shù),求出合并后的眾數(shù),故不適合代數(shù)運算。眾數(shù)不具存在唯一性,可能只有一個、可能不只一個、也可能不存在 (2)由組距數(shù)列確定眾數(shù)由組距數(shù)列確定眾數(shù)dLdffffffLM211)10)10)100( dUdffffffUM212)10)10)100(n例例1:9個家庭的人均月收入數(shù)據(jù)個家庭的人均月收入數(shù)據(jù)21neXMn例例2:10個家庭的人均月收入數(shù)據(jù)個家庭的人均月收入數(shù)據(jù) 2122nneXXM3)由組距分組數(shù)列確定中位數(shù) (1)確定“中位數(shù)組”。 向上累計次數(shù)等于 (2)假定中位數(shù)組內(nèi)分布是均勻的,計算出中位數(shù)來。

28、2feeeemmmemdfSfLM12eeeeemmmmdffSUM2向上累計時向上累計時向下累計時向下累計時eeeeemmmdfmSfUM12中位數(shù)計算公式比較眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的相對比較眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的相對位置位置 MeMo MeMo MeMo Me0時, 分布是右偏(正偏)的;當(dāng)SK0,故也稱正偏態(tài);當(dāng)分布為左偏態(tài)時,SK0,故也稱負偏態(tài)。但除非是分組頻數(shù)分布數(shù)據(jù),否則SK公式中的眾數(shù)M0有很大的隨易性。例例1 1:兩種投資組合:甲、乙,表中是:兩種投資組合:甲、乙,表中是9 9筆過去半筆過去半年期投資報酬率,請問哪種投資組合的風(fēng)險大?年期投資報酬率,請問哪種投資組合的風(fēng)

29、險大?甲()甲() 9 917172 26 6191910104 413138 8乙()乙() 6 615153 31 116163 32 28 82 2 注意,兩者的標(biāo)準差相同:注意,兩者的標(biāo)準差相同:0.056960.05696,但是,但是 CVCV甲甲58.25%58.25% CVCV乙乙91.45%91.45% 所以乙的風(fēng)險較大。所以乙的風(fēng)險較大。例例2 2:某地:某地7 7歲男孩身高的均數(shù)為歲男孩身高的均數(shù)為123.10cm123.10cm,標(biāo)準,標(biāo)準差為差為4.714.71;體重均數(shù)為;體重均數(shù)為22.59kg22.59kg,標(biāo)準差為,標(biāo)準差為2.26kg,2.26kg,比較其變異

30、度?比較其變異度? 體重 2.26100%10.14%22.29CV 身高 4.71100% 3.83%123.10CV 七、抽樣七、抽樣統(tǒng) 計 量 參 數(shù)樣本容量:n 總體容量:N樣本平均數(shù): 總體平均數(shù):樣本比例: p 總體比例:P樣本標(biāo)準差:s 總體標(biāo)準差:樣本方差: S2 總體方差:2x總體與樣本總體與樣本參數(shù)參數(shù): :統(tǒng)計量統(tǒng)計量1.1.抽樣基本概念抽樣基本概念 全及總體和樣本總體全及總體和樣本總體1.抽樣基本概念 根據(jù)全及總體計算的反映總體數(shù)量特征的指標(biāo)稱為全及指標(biāo),又叫參數(shù)。常用的總體參數(shù)有總體平均數(shù)和總體標(biāo)準差(或總體方差)。 總體平均數(shù): = 總體方差(或總體標(biāo)準差): =2

31、Nx2)(Nx)(2FXFNX1.抽樣基本概念 樣本指標(biāo)是指根據(jù)樣本總體計算的指標(biāo),又叫統(tǒng)計量。 樣本平均數(shù):樣本平均數(shù): 樣本方差或樣本標(biāo)準差樣本方差或樣本標(biāo)準差 S2 = n-1為樣本變量自由度為樣本變量自由度1)(2nxx1)(2nsxxfxfnxx抽樣平均數(shù)的平均誤差例題:某工廠有1500個工人,用簡單隨機重復(fù)抽樣的方法抽出50個工人作為樣本,調(diào)查其工資水平資料如下:月平均工資(元)524534 540 550 560580600660工人數(shù)(個)469108643計算樣本平均數(shù)和抽樣平均誤差計算樣本平均數(shù)和抽樣平均誤差解:列表計算 xfxf5244209612965184534632

32、0467640565409486040036005501055001001000560844800058063480400240060042400160064006603198010000300005028000526402)(xxfxx2)( 計算平均數(shù)即平均工資:元)(5605028000fxfx元)(樣本方差(45.325052640)2ffxx元)抽樣平均誤差(59. 45045.32nx抽樣調(diào)查的優(yōu)點抽樣調(diào)查的優(yōu)點: (1 1)經(jīng)濟性。)經(jīng)濟性。 (2 2)時效性強。抽樣調(diào)查可以迅速、及時地獲)時效性強。抽樣調(diào)查可以迅速、及時地獲取到所需要的信息。取到所需要的信息。 (3 3)準確性

33、高。)準確性高。抽樣調(diào)查的一個原則:抽樣調(diào)查的一個原則: “確信鍋里的湯被確信鍋里的湯被攪拌均勻攪拌均勻”。2.2.抽樣調(diào)查的方法抽樣調(diào)查的方法概率抽樣概率抽樣(Probability sampling)(Probability sampling)非概率抽樣非概率抽樣(Nonprobability(Nonprobability sampling) sampling)2.12.1概率抽樣概率抽樣(Probability sampling)(Probability sampling) 1 1)簡單隨機抽樣)簡單隨機抽樣(simple random sampling)(simple random s

34、ampling)就是等概率抽樣,每個個體以相同的概率被抽中。就是等概率抽樣,每個個體以相同的概率被抽中。這也可以分為重復(fù)抽樣和不重復(fù)抽樣兩種形式。這也可以分為重復(fù)抽樣和不重復(fù)抽樣兩種形式。 2 2)分層抽樣)分層抽樣(Stratified sampling)(Stratified sampling)在抽樣之前將總體劃分為不同的層(群),然后在在抽樣之前將總體劃分為不同的層(群),然后在各個層中抽取一定數(shù)量的元素組成樣本。各個層中抽取一定數(shù)量的元素組成樣本。分層抽樣的時候應(yīng)該是各個層內(nèi)之間的元素的差異分層抽樣的時候應(yīng)該是各個層內(nèi)之間的元素的差異比較小,而使層之間的元素比較大。各個層的劃分比較小,

35、而使層之間的元素比較大。各個層的劃分要根據(jù)研究者的判斷和研究目的。要根據(jù)研究者的判斷和研究目的。概率抽樣概率抽樣(Probability sampling)(Probability sampling) 3 3)等距離抽樣)等距離抽樣(systematic sampling,(systematic sampling,系統(tǒng)抽樣)系統(tǒng)抽樣)首先將總體中的個體按照某種順序排列起來,然后首先將總體中的個體按照某種順序排列起來,然后按照某種規(guī)則確定一個隨機起點,然后,每隔一定按照某種規(guī)則確定一個隨機起點,然后,每隔一定的間隔抽取一個元素,直到抽滿的間隔抽取一個元素,直到抽滿n n個元素形成一個樣個元素形成

36、一個樣本為止。本為止。 4 4)整群抽樣)整群抽樣(Cluster sampling)(Cluster sampling)就是首先將總體劃分為若干個群,然后以這些群為就是首先將總體劃分為若干個群,然后以這些群為抽樣單位從中抽出部分群,在對抽選出的群中的所抽樣單位從中抽出部分群,在對抽選出的群中的所有元素進行觀察。有元素進行觀察。 思考題:假如你要調(diào)查廣州市市區(qū)內(nèi)的居民月收入,假思考題:假如你要調(diào)查廣州市市區(qū)內(nèi)的居民月收入,假設(shè)抽樣容量為設(shè)抽樣容量為10001000。你如何展開抽樣?。你如何展開抽樣? 1)1)便利抽樣便利抽樣(Convenience sampling(Convenience s

37、ampling)研究者出于收集數(shù)據(jù)的便利,而不考慮抽樣的概率,研究者出于收集數(shù)據(jù)的便利,而不考慮抽樣的概率,所進行的抽樣。例如:街頭訪談、電話訪談、向自所進行的抽樣。例如:街頭訪談、電話訪談、向自己的親朋好友收集數(shù)據(jù)。己的親朋好友收集數(shù)據(jù)。這種樣本數(shù)據(jù)收集過程都加入了某中人為的干擾和這種樣本數(shù)據(jù)收集過程都加入了某中人為的干擾和選擇,選擇,所以從方便樣本中得出的結(jié)果對于總體信息所以從方便樣本中得出的結(jié)果對于總體信息的推論程度是有限的的推論程度是有限的。 思考題:思考題: 有時候雜志要求讀者回答某些問題并寄回答案,從而構(gòu)有時候雜志要求讀者回答某些問題并寄回答案,從而構(gòu)成一個樣本。成一個樣本。 請問

38、這個樣本能不能代表讀者群總體?請問這個樣本能不能代表讀者群總體?為什么?為什么?2.22.2非概率抽樣非概率抽樣(Nonprobability(Nonprobability sampling)sampling) 2)2)判斷抽樣判斷抽樣(Judgment sampling)(Judgment sampling)是指經(jīng)過專家考慮后,以適當(dāng)?shù)姆绞竭M是指經(jīng)過專家考慮后,以適當(dāng)?shù)姆绞竭M行抽樣。行抽樣。例如:研究青少年吸毒問題。例如:研究青少年吸毒問題。3.3.抽樣誤差抽樣誤差 一般而言,樣本統(tǒng)計量的分布就叫作一般而言,樣本統(tǒng)計量的分布就叫作抽樣分布抽樣分布 抽樣平均誤差就是抽樣平均數(shù)(或抽樣成數(shù))的抽

39、樣平均誤差就是抽樣平均數(shù)(或抽樣成數(shù))的標(biāo)準差。反映抽樣平均數(shù)(或抽樣成數(shù))與總體標(biāo)準差。反映抽樣平均數(shù)(或抽樣成數(shù))與總體平均數(shù)(或總體成數(shù))的平均誤差程度。平均數(shù)(或總體成數(shù))的平均誤差程度。 抽樣誤差抽樣誤差= = 數(shù)據(jù)收集、整理、記錄和制表過程中產(chǎn)生的數(shù)據(jù)收集、整理、記錄和制表過程中產(chǎn)生的誤差是非抽樣誤差。誤差是非抽樣誤差。x影響抽樣誤差大小因素影響抽樣誤差大小因素 總體方差或總體標(biāo)準差的大?。ㄕ壤┛傮w方差或總體標(biāo)準差的大小(正比例) 樣本容量的大?。ǚ幢壤颖救萘康拇笮。ǚ幢壤?抽樣組織方式和抽樣方法抽樣組織方式和抽樣方法 抽樣平均誤差是反映抽樣誤差一般水平的指標(biāo)。抽樣平均誤

40、差是反映抽樣誤差一般水平的指標(biāo)。常用抽樣平均的標(biāo)準差或抽樣成數(shù)的標(biāo)準差作常用抽樣平均的標(biāo)準差或抽樣成數(shù)的標(biāo)準差作為衡量誤差一般水平的尺度。為衡量誤差一般水平的尺度。計算公式:計算公式:成成 數(shù)數(shù)平均數(shù)平均數(shù)不重復(fù)抽不重復(fù)抽樣樣成成 數(shù)數(shù)平均數(shù)平均數(shù)重復(fù)抽樣重復(fù)抽樣xnx2nx= = =np2nPP)1( p= = =x)1 (2Nnnx= =p)1 ()1 (NnnPp= = 例例1 1:從某廠生產(chǎn)的10000只日光燈管中隨機抽取100只進行檢查,假如該廠日光燈管平均使用壽命的標(biāo)準差為100小時,試計算該廠日光燈管平均使用壽命的抽樣平均誤差。 在重復(fù)抽樣條件下: 在不重復(fù)抽樣條件下: (小時)101001

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論