




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第十模塊 概率與統(tǒng)計(jì)第四十八講 隨機(jī)抽樣用樣本估計(jì)總體變量間的相互關(guān)系統(tǒng)計(jì)案例回歸課本本1.樣本本及抽樣樣的定義義(1)在在數(shù)理統(tǒng)統(tǒng)計(jì)中稱稱研究對對象的全全體為總體,組成總總體的每每一個基本單元元為個體,從總體體中抽取取若干個個個體x1,x2,xn,這樣的的n個個個體x1,x2,xn稱為大小為n(容量量為n)的一個個樣本.(2)抽抽樣:抽抽樣是為為了獲取總體體的信息息,特別在在客觀實(shí)實(shí)際中對對總體的全部個個體逐一一進(jìn)行研研究,有有的是不不適宜不可能能或不必必要的.因此,抽樣調(diào)查查是獲取總總體信息息的重要要方法.2.隨機(jī)機(jī)抽樣(1)簡簡單隨機(jī)機(jī)抽樣:從一個個總體中中通過逐個抽取取的方法法從中抽取
2、取一個樣樣本,且且每次抽抽取時各各個個體體被抽到到的概率率相等,這樣的的抽樣稱稱為簡單隨機(jī)機(jī)抽樣.這樣抽抽出的樣樣本稱為為簡單隨隨機(jī)樣本本.簡單單隨機(jī)抽抽樣的基基本方法法有抽簽法和和隨機(jī)數(shù)數(shù)表法.(2)系系統(tǒng)抽樣樣:系統(tǒng)統(tǒng)抽樣被被稱為等距抽樣樣或機(jī)械械抽樣.它按照照時間或或空間的的等距間隔隔抽取樣本本,即將將總體分分成幾個個部分,然后按按照預(yù)先先定出的的規(guī)則,從每一一部分抽取一個個個體,得到所所需要的的樣本,這種抽抽樣稱為為系統(tǒng)抽抽樣.系系統(tǒng)抽樣樣與簡單單隨機(jī)抽抽樣的聯(lián)聯(lián)系在于于:將總總體均分分后的每每一部分分進(jìn)行抽抽樣時,采用的的是簡單隨機(jī)機(jī)抽樣.(3)分分層抽樣樣:當(dāng)總總體中一一部分個個體
3、與另另一部分分個體有有明顯的差差異且易易于區(qū)別別時,常將將相近的的個體歸歸成一組組,然后后按照各各部分所所占的比例進(jìn)行抽樣樣,這種種抽樣稱稱為分層抽樣樣.其中所所分成的的各部分分稱為層.分層抽抽樣時,每一個個個體被被抽到的的概率都都是相等的.3.頻率率分布表表頻率率分布直直方圖與與莖葉圖圖(1)頻頻率分布布樣本中所所有數(shù)據(jù)據(jù)(或者者數(shù)據(jù)組組)的頻頻數(shù)和樣樣本容量量的比,就是該該數(shù)據(jù)的的頻率.所有數(shù)數(shù)據(jù)(或或者數(shù)據(jù)據(jù)組)的的頻率的的分布變變化規(guī)律律叫做頻率分布布,可以用用頻率分布布表頻率分布布直方圖圖頻率分分布折線線圖莖莖葉圖等等來表示示.(2)頻頻率分布布折線圖圖:連接接頻率分分布直方方圖中各
4、各小長方方形上端端的中點(diǎn),就得到到頻率分分布折線線圖.(3)總總體密度度曲線如果樣本本容量不不斷增大大,分組組的組距距不斷縮縮小,則則頻率分分布直方方圖實(shí)際際上越來來越接近近于總體在各各小組內(nèi)內(nèi)所取值值的個數(shù)數(shù)與總數(shù)數(shù)比值的的大小,它可以以用一光滑曲線線來描繪,這條光滑曲線線就叫做總總體密度度曲線.(4)莖莖葉圖表表示數(shù)據(jù)據(jù)有兩個個突出的的優(yōu)點(diǎn),其一是是統(tǒng)計(jì)圖圖上沒有有原始數(shù)據(jù)據(jù)的損失,所有信信息都可可以從這這個莖葉葉圖中得得到,其其二是在在比賽時時隨時記記錄,方方便記錄錄與表示示.4.用樣樣本的數(shù)數(shù)字特征征估計(jì)總總體的數(shù)數(shù)字特征征(1)眾眾數(shù),中中位數(shù),平均數(shù)數(shù)在一組數(shù)數(shù)據(jù)中,出現(xiàn)次次數(shù)最多
5、的數(shù)據(jù)叫叫做這組組數(shù)據(jù)的的眾數(shù).將一組數(shù)數(shù)據(jù)按大大小依次次排列,把處在在中間位置的一一個數(shù)據(jù)據(jù)(或中中間兩個個數(shù)據(jù)的的平均數(shù)數(shù))叫做做這組數(shù)數(shù)據(jù)的中中位數(shù).如果n個個數(shù),x1,x2,xn,那么(x1+x2+xn)叫做這n個數(shù)的的平均數(shù)數(shù).總體中所所有個體體的平均均數(shù)叫做做總體平均均數(shù).樣本中所所有個體體的平均均數(shù)叫做做樣本平均均數(shù),如果在在n個數(shù)數(shù)據(jù)中,x1出現(xiàn)了f1次,x2出現(xiàn)f2次,xk出現(xiàn)fk次(這里里f1+f2+fk=n),那么(x1f1+x2f2+xkfk),叫做這這n個數(shù)數(shù)的加權(quán)權(quán)平均數(shù)數(shù).5.兩個個變量的的相關(guān)關(guān)關(guān)系(1)當(dāng)當(dāng)自變量量的取值值一定時,因變變量的取取值帶有有隨機(jī)性,
6、這兩個個變量之之間的關(guān)關(guān)系叫做做相關(guān)關(guān)關(guān)系.如果一個個變量的的值由小小變大時時,另一一個變量量的值也也在由小小到大,這種相相關(guān)稱為為正相關(guān);反之,如果一一個變量量的值由由小變大大時,另另一個變變量的值值在由大大到小,這種關(guān)關(guān)系稱為為負(fù)相關(guān).變量間間的這種種關(guān)系與與函數(shù)關(guān)關(guān)系不同同,它是是一種非非確定關(guān)關(guān)系.(2)散散點(diǎn)圖:表示具具有相關(guān)關(guān)系系的兩個變變量的一一組數(shù)據(jù)據(jù)的圖形形叫做散散點(diǎn)圖.6.回歸歸直線方方程(1)一一般地,設(shè)x和和y是具具有相關(guān)關(guān)關(guān)系的的兩個變變量,且且對應(yīng)于于n個觀觀測值的的n個點(diǎn)點(diǎn)大致分分布在一一條直線線的附近近,若所所求的直直線方程程為我們將這這個方程程叫做回歸直線線方
7、程,a,b叫做回歸系數(shù)數(shù),相應(yīng)的的直線叫叫做回歸直線線.(2)最最小二乘乘法使離差平平方和Q=(y1-bx1-a)2+(y2-bx2-a)2+(yn-bxn-a)2為最小的的方法,叫做最最小二乘乘法.7.回歸歸分析(1)回回歸直線線方程=bx+a中中,上述方程程對應(yīng)的的直線叫叫做回歸直線線,而對兩兩個變量量所進(jìn)行行的上述述統(tǒng)計(jì)分分析叫做做線性回歸歸分析.相關(guān)系數(shù)數(shù)用相關(guān)系數(shù)數(shù)來描述線線性相關(guān)關(guān)關(guān)系的的強(qiáng)弱.當(dāng)r0時,兩個變變量正相關(guān);當(dāng)r0時,兩個變變量負(fù)相關(guān),r的絕絕對值越越接近1,表明明兩個變變量的線線性相關(guān)關(guān)性越強(qiáng),r的絕絕對值接接近于0,表明明兩個變變量之間間幾乎不存在線性相關(guān)關(guān)關(guān)系.
8、通常當(dāng)當(dāng)|r|大于r0.05時,認(rèn)為為兩個變變量有很很強(qiáng)的線線性相關(guān)關(guān)關(guān)系,因而求求回歸直直線方程程才有意意義.數(shù)據(jù)點(diǎn)和和它在回回歸直線線上相應(yīng)應(yīng)位置的的差異(y1-i)是隨機(jī)機(jī)誤差效效應(yīng),稱稱i=yi-i為殘差,將所得得值平方方后加起起來,用用數(shù)學(xué)符符號表示示為(yi-i)2稱為殘差平方方和,它代表表了隨機(jī)機(jī)誤差的的效應(yīng).8.獨(dú)立立性檢驗(yàn)驗(yàn)(1)分分類變量量的定義義如果某種種變量的的不同“值”表示個體體所屬的的不同類類別,像像這樣的的變量稱稱為分類變量量.(2)22列列聯(lián)表一般地,假設(shè)有有兩個分分類變量量X和Y,它們們的值域域分別為為x1,x2和y1,y2,其樣樣本頻數(shù)數(shù)列聯(lián)表表(稱為為22
9、列聯(lián)表表)為K2=用用它的大大小可以以決定是是否拒絕絕原來的的統(tǒng)計(jì)假假設(shè)H0,如果K2值較大,就拒絕絕H0,即拒絕絕事件A與與B無關(guān)關(guān).考點(diǎn)陪練練1.(2010重慶)某某單位有有職工750人人,其中中青年職職工350人,中年職職工250人,老年職職工150人,為了了了解該單單位職工工的健康康情況,用分層層抽樣的的方法從從中抽取取樣本.若樣本本中的青青年職工工為7人人,則樣樣本容量量為()A.7B.15C.25D.35解析:設(shè)設(shè)樣本容容量為n,則依依題意有有n=7,n=15,選B.答案:B2.(2010湖北)將將參加夏夏令營的的600名學(xué)生生編號為為:001,002,600.采用用系統(tǒng)抽抽樣方法
10、法抽取一一個容量量為50的樣本本,且隨隨機(jī)抽得得的號碼碼為003.這這600名學(xué)生生分住在在三個營營區(qū),從從001到300的第第營區(qū)區(qū),從301到到495在第營區(qū),從496到600在在第營營區(qū),三三個營區(qū)區(qū)被抽中中的人數(shù)數(shù)依次為為()A.26,16,8B.25,17,8C.25,16,9D.24,17,9解析:依依題意及及系統(tǒng)抽抽樣的意意義可知知,將這這600名學(xué)生生按編號號依次分分成50組,每每一組各各有12名學(xué)生生,第k(kN*)組抽中中的號碼碼是3+12(k-1).令令3+12(k-1)300,得得k,因此第第營區(qū)區(qū)被抽中中的人數(shù)數(shù)是25;令3003+12(k-1)495得10.828,
11、所以我我們有99.9%的把把握說,A,B兩藥對對該病的的治愈率率之間有有顯著差差別.方法與與技巧上上述結(jié)論論是對所所有服用用A藥或或B藥的的病人而而言的,絕不要要誤以為為只對100個個病人成成立.這這就體現(xiàn)現(xiàn)了統(tǒng)計(jì)計(jì)的意義義,即由由樣本推推斷出全全體.技法二數(shù)數(shù)形結(jié)結(jié)合思想想【典例2】為為了了了解中學(xué)學(xué)生的身身高情況況,對某某中學(xué)同同齡的若若干女生生的身高高進(jìn)行測測量,將將所得數(shù)數(shù)據(jù)整理理后,畫畫出頻率率分布直直方圖如如圖所示示,已知知圖中從從左到右右15組的頻頻率分別別為0.05,0.10,0.15,0.15,0.30,68組組的頻數(shù)數(shù)分別為為7,5,3,第二小小組的頻頻數(shù)為6.(1)畫畫出
12、頻率率分布表表;(2)試試問這組組數(shù)據(jù)中中的中位位數(shù)在哪哪個身高高的范圍圍內(nèi)?(3)如如果本次次測試身身高在157cm以以上(包包括157cm)的的為良好好,試估估計(jì)該校校女生身身高良好好率是多多少?解題切切入點(diǎn)通通過第二二組的頻頻數(shù)和頻頻率先求求出學(xué)生生總數(shù),其他問問題就十十分容易易解決了了,主要要考查同同學(xué)們對對頻率分分布表和和頻率分分布直方方圖的掌掌握情況況,考查查識圖讀圖的的能力,以及靈靈活運(yùn)用用圖表表解決實(shí)實(shí)際問題題的能力力.解(1)因?yàn)闉榈诙M組的頻數(shù)數(shù)是6,頻率是是0.1,所以以學(xué)生總總數(shù)為60.1=60,所以15組的的頻數(shù)分分別為3,6,9,9,18;68組組的頻率率分別為為頻率分布布表
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年貴州農(nóng)業(yè)職業(yè)學(xué)院單招職業(yè)傾向性測試題庫帶答案
- 2025年度綠化項(xiàng)目管理與勞務(wù)派遣合同
- 2025年度教育機(jī)構(gòu)分紅合作協(xié)議范本(含師資培訓(xùn))
- 2025年度房地產(chǎn)企業(yè)勞動合同管理制度與購房合同附件
- 2025年度出國工人勞務(wù)合同(含緊急救援與安全應(yīng)急)
- 2025年度城市綜合體開發(fā)項(xiàng)目多人合伙股東合作協(xié)議
- 2025年度健康醫(yī)療副總經(jīng)理聘用與市場拓展合同
- 2025年度員工向公司借款額度限制合同
- 2025年度住宅小區(qū)施工圍擋安裝及安全管理合同
- 2023-2024學(xué)年廣東省珠海市香洲區(qū)第二中學(xué)高三下學(xué)期三模生物試卷
- 水泥攪拌樁記錄表格范本
- DL∕T 458-2020 板框式旋轉(zhuǎn)濾網(wǎng)
- GB∕T 8163-2018 輸送流體用無縫鋼管
- Windows Azure云平臺基本操作手冊
- 短視頻:策劃制作與運(yùn)營課件
- T∕ASC 17-2021 電動汽車充換電設(shè)施系統(tǒng)設(shè)計(jì)標(biāo)準(zhǔn)
- 水閘設(shè)計(jì)步驟計(jì)算書(多表)
- PowerPoint使用技巧培訓(xùn)課件(共35張)
- SMA瀝青路面的設(shè)計(jì)與施工
- 腎內(nèi)科相關(guān)基礎(chǔ)知識學(xué)習(xí)教案
- (完整版)Frenchay構(gòu)音障礙評定
評論
0/150
提交評論