正態(tài)分布和線性回歸_第1頁
正態(tài)分布和線性回歸_第2頁
正態(tài)分布和線性回歸_第3頁
正態(tài)分布和線性回歸_第4頁
正態(tài)分布和線性回歸_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、專題:正態(tài)分布和線性回歸一、 根底知識回憶1.正態(tài)分布:假設(shè)總體密度曲線就是或近似地是函數(shù)的圖象其中:是圓周率;e是自然對數(shù)的底;x是隨機(jī)變量的取值,為正態(tài)分布的平均值;是正態(tài)分布的標(biāo)準(zhǔn)差這個總體是無限容量的抽樣總體,其分布叫做正態(tài)分布正態(tài)分布由參數(shù),唯一確定,記作,E()=,D()=.2.函數(shù)f(x)圖象被稱為正態(tài)曲線(1)從形態(tài)上看,正態(tài)分布是一條單峰、對稱呈鐘形的曲線,其對稱軸為x=,并在x=時(shí)取最大值。(2)從x=點(diǎn)開始,曲線向正負(fù)兩個方向遞減延伸,不斷逼近x軸,但永不與x軸相交,因此說曲線在正負(fù)兩個方向都是以x軸為漸近線的,(3)當(dāng)?shù)闹狄欢〞r(shí), 越大,曲線越“矮胖,總體分布越分散;越

2、小,曲線越“高總體分布越集中3. 把即=0,=1稱為標(biāo)準(zhǔn)正態(tài)分布,這樣的正態(tài)總體稱為標(biāo)準(zhǔn)正態(tài)總體,其密度函數(shù)為,x(-,+),相應(yīng)的曲線稱為標(biāo)準(zhǔn)正態(tài)曲線.利用標(biāo)準(zhǔn)正態(tài)分布表可求得標(biāo)準(zhǔn)正態(tài)總體在某一區(qū)間內(nèi)取值的概率. (1)對于標(biāo)準(zhǔn)正態(tài)總體,是總體取值小于的概率,即:,其中,其值可以通過“標(biāo)準(zhǔn)正態(tài)分布表查得,也就是圖中陰影局部的面積,它表示總體取值小于的概率(2)標(biāo)準(zhǔn)正態(tài)曲線關(guān)于y軸對稱。因?yàn)楫?dāng)時(shí),;而當(dāng)時(shí),根據(jù)正態(tài)曲線的性質(zhì)可得:,并且可以求得在任一區(qū)間內(nèi)取值的概率:,顯然(0)=0.5.5.對于任一正態(tài)總體,都可以通過使之標(biāo)準(zhǔn)化,那么,P()=P()=,求得其在某一區(qū)間內(nèi)取值的概率.例如:

3、N(1,4),那么,設(shè)=,那么,有P(3)=P(1)=0.8413.6. (1)=0.8413、(2)=0.9772、(3)=0.9987 二、例題1.下面給出三個正態(tài)總體的函數(shù)表示式,請找出其均值和標(biāo)準(zhǔn)差1,-x+ 2,-x+3,-x+2.正態(tài)總體的函數(shù)表示式是,-x+)1求fx的最大值;2利用指數(shù)函數(shù)性質(zhì)說明其單調(diào)區(qū)間,以及曲線的對稱軸3.利用標(biāo)準(zhǔn)正態(tài)分布表(1)=0.8413、(2)=0.9772、(3)=0.9987)求標(biāo)準(zhǔn)正態(tài)總體在下面區(qū)間取值的概率10,1;21,3;3-1,2.利用標(biāo)準(zhǔn)正態(tài)分布表(1)=0.8413、(1.84)=0.9671),求正態(tài)總體在下面區(qū)間取值的概率1在

4、N(1,4)下,求F(3)2在下,求P(-1.84X+1.84)*.對于正態(tài)總體取值的概率:(-,+:(-2,+2:(-3,+3:取值的概率分別為68.3%、95.4%、99.7%。因此我們時(shí)常只在區(qū)間(-3,+3)內(nèi)研究正態(tài)總體分布情況,而忽略其中很小的一局部,這一局部情況發(fā)生為小概率事件。6.以下關(guān)于正態(tài)曲線性質(zhì)的表達(dá)正確的選項(xiàng)是(1)曲線關(guān)于直線x=對稱,這個曲線只在x軸上方;(2)曲線關(guān)于直線x=對稱,這個曲線只有當(dāng)x(-3,3)時(shí)才在x軸上方;(3)曲線關(guān)于y軸對稱,因?yàn)榍€對應(yīng)的正態(tài)密度函數(shù)是一個偶函數(shù);(4)曲線在x=時(shí)處于最高點(diǎn),由這一點(diǎn)向左右兩邊延伸時(shí),曲線逐漸降低;(5)曲

5、線的對稱軸由確定,曲線的形狀由確定;(6)越大,曲線越“矮胖,總體分布越分散;越小,曲線越“高總體分布越集中(A)只有()()()() (B) 只有(2)()() (C) 只有(3)()()() (D) 只有()()()7.把一個正態(tài)曲線a沿著橫軸方向向右移動2個單位,得到一個新的曲線b,以下說法不正確的選項(xiàng)是 (A)曲線b仍然是正態(tài)曲線 (B)曲線a和曲線b的最高點(diǎn)的縱坐標(biāo)相等(C)以曲線a為概率密度曲線的總體的方差比以曲線b為概率密度曲線的總體的方差大2(D)以曲線a為概率密度曲線的總體的期望比以曲線b為概率密度曲線的總體的期望小28.在正態(tài)總體(0,)中,數(shù)值落在(-,-1)(1,+)里

6、的概率為A0.097 B.046 (C)0.03 (D)0.0039.設(shè)隨機(jī)變量N(2,4),那么D()等于 (A)1 (B)2 (C)0.5 (D)410.設(shè)隨機(jī)變量(,),且P(C)=P(C),那么C等于 ( ) (A)0 (B) (C)- (D)11.正態(tài)總體的概率密度函數(shù)為,那么總體的平均數(shù)和標(biāo)準(zhǔn)差分別是 (A)0和8 (B)0和4 (C)0和2 (D)0和 12.填空題(1)假設(shè)隨機(jī)變量N(1,0.25),那么2的概率密度函數(shù)為 .(2)期望為2,方差為的正態(tài)分布的密度函數(shù)是 .(3)正態(tài)總體落在區(qū)間(0.2,+)的概率是0.5,那么相應(yīng)的正態(tài)曲線f(x)在x= 時(shí),到達(dá)最高點(diǎn).(4

7、)N(0,1),P(1.96)=(1.96)=0.9750,那么(-1.96)= .(5)某種零件的尺寸服從正態(tài)分布N(0,4),那么不屬于區(qū)間(-4,4)這個尺寸范圍的零件約占總數(shù)的 .(6)某次抽樣調(diào)查結(jié)果說明,考生的成績(百分制)近似服從正態(tài)分布,平均成績?yōu)?2分,96分以上的考生占考生總數(shù)的2.3%,那么考生成績在60至84分之間的概率為 . (1)=0.8413、(2)=0.977、(3)=0.9987參考答案:1(1)0,1(2)1,2(3)-1,0.5;2.(1)x=-1時(shí),(2)對稱軸為x=-1.3.(1)0.3413(2)0.1574(3)0.81854. (1)F(3)=0

8、.8413(2) P(-1.84X+1.84)=0.9342;6.A;7.C;8.D;9.A;10.B;11.C;12.(1);(2) ;(3)0.2;(4)0.025;(5)4.56%;(6)=12;P=0.6826.F(96)=, F(84)- F(60)= 正態(tài)分布和線性回歸高考要求 1.了解正態(tài)分布的意義及主要性質(zhì) 2.了解線性回歸的方法和簡單應(yīng)用知識點(diǎn)歸納 1正態(tài)分布密度函數(shù):,0,-x其中是圓周率;e是自然對數(shù)的底;x是隨機(jī)變量的取值;為正態(tài)分布的均值;是正態(tài)分布的標(biāo)準(zhǔn)差.正態(tài)分布一般記為 2正態(tài)分布是由均值和標(biāo)準(zhǔn)差唯一決定的分布例1、下面給出三個正態(tài)總體的函數(shù)表示式,請找出其均值

9、和標(biāo)準(zhǔn)差1,-x+ 2,-x+解: (1)0,1 (2)1,2 3正態(tài)曲線的性質(zhì):正態(tài)分布由參數(shù)、唯一確定,如果隨機(jī)變量N(,2),根據(jù)定義有:=E,=D。正態(tài)曲線具有以下性質(zhì):1曲線在x軸的上方,與x軸不相交。2曲線關(guān)于直線x =對稱。3曲線在x =時(shí)位于最高點(diǎn)。4當(dāng)x 時(shí),曲線下降。并且當(dāng)曲線向左、右兩邊無限延伸時(shí),以x軸為漸近線,向它無限靠近。5當(dāng)一定時(shí),曲線的形狀由確定。越大,曲線越“矮胖,表示總體越分散;越小,曲線越“瘦高,表示總體的分布越集中。五條性質(zhì)中前三條較易掌握,后兩條較難理解,因此應(yīng)運(yùn)用數(shù)形結(jié)合的原那么,采用比照教學(xué) 4標(biāo)準(zhǔn)正態(tài)曲線:當(dāng)=0、=l時(shí),正態(tài)總體稱為標(biāo)準(zhǔn)正態(tài)總體

10、,其相應(yīng)的函數(shù)表示式是,-x+其相應(yīng)的曲線稱為標(biāo)準(zhǔn)正態(tài)曲線 標(biāo)準(zhǔn)正態(tài)總體N0,1在正態(tài)總體的研究中占有重要的地位 任何正態(tài)分布的概率問題均可轉(zhuǎn)化成標(biāo)準(zhǔn)正態(tài)分布的概率問題 5.標(biāo)準(zhǔn)正態(tài)總體的概率問題: 對于標(biāo)準(zhǔn)正態(tài)總體N0,1,是總體取值小于的概率,即 ,其中,圖中陰影局部的面積表示為概率 只要有標(biāo)準(zhǔn)正態(tài)分布表即可查表解決.從圖中不難發(fā)現(xiàn):當(dāng)時(shí),;而當(dāng)時(shí),0=0.5 例2 設(shè),且總體密度曲線的函數(shù)表達(dá)式為:,xR。1求,;2求的值。分析:根據(jù)表示正態(tài)曲線函數(shù)的結(jié)構(gòu)特征,對照函數(shù)求出和。利用一般正態(tài)總體與標(biāo)準(zhǔn)正態(tài)總體N0,1概率間的關(guān)系,將一般正態(tài)總體劃歸為標(biāo)準(zhǔn)正態(tài)總體來解決。解:1由于,根據(jù)一般

11、正態(tài)分布的函數(shù)表達(dá)形式,可知=1,故XN1,2。2 。點(diǎn)評:在解決數(shù)學(xué)問題的過程中,將未知的,不熟悉的問題轉(zhuǎn)化為的、熟悉的、已解決了的問題,是我們常用的手段與思考問題的出發(fā)點(diǎn)。通過本例我們還可以看出一般正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布間的內(nèi)在關(guān)聯(lián)。9相關(guān)關(guān)系:當(dāng)自變量一定時(shí),因變量的取值帶有一定的隨機(jī)性的兩個變量之間的關(guān)系稱為相關(guān)關(guān)系 相關(guān)關(guān)系與函數(shù)關(guān)系的異同點(diǎn)如下:相同點(diǎn):均是指兩個變量的關(guān)系 不同點(diǎn):函數(shù)關(guān)系是一種確定的關(guān)系;而相關(guān)關(guān)系是一種非確定關(guān)系;函數(shù)關(guān)系是自變量與因變量之間的關(guān)系,這種關(guān)系是兩個非隨機(jī)變量的關(guān)系;而相關(guān)關(guān)系是非隨機(jī)變量與隨機(jī)變量的關(guān)系10回歸分析一元線性回歸分析: 對具有相關(guān)

12、關(guān)系的兩個變量進(jìn)行統(tǒng)計(jì)分析的方法叫做回歸分析 通俗地講,回歸分析是尋找相關(guān)關(guān)系中非確定性關(guān)系的某種確定性 對于線性回歸分析,我們要注意以下幾個方面:1回歸分析是對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計(jì)分析的方法。兩個變量具有相關(guān)關(guān)系是回歸分析的前提。2散點(diǎn)圖是定義在具有相關(guān)系的兩個變量根底上的,對于性質(zhì)不明確的兩組數(shù)據(jù),可先作散點(diǎn)圖,在圖上看它們有無關(guān)系,關(guān)系的密切程度,然后再進(jìn)行相關(guān)回歸分析。3求回歸直線方程,首先應(yīng)注意到,只有在散點(diǎn)圖大至呈線性時(shí),求出的回歸直線方程才有實(shí)際意義,否那么,求出的回歸直線方程毫無意義。11散點(diǎn)圖:表示具有相關(guān)關(guān)系的兩個變量的一組數(shù)據(jù)的圖形叫做散點(diǎn)圖.散點(diǎn)圖形象地反映了

13、各對數(shù)據(jù)的密切程度 粗略地看,散點(diǎn)分布具有一定的規(guī)律 12. 回歸直線設(shè)所求的直線方程為,其中a、b是待定系數(shù),,相應(yīng)的直線叫做回歸直線,對兩個變量所進(jìn)行的上述統(tǒng)計(jì)分析叫做回歸分析 13.相關(guān)系數(shù):相關(guān)系數(shù)是因果統(tǒng)計(jì)學(xué)家皮爾遜提出的,對于變量y與x的一組觀測值,把= 叫做變量y與x之間的樣本相關(guān)系數(shù),簡稱相關(guān)系數(shù),用它來衡量兩個變量之間的線性相關(guān)程度. 14.相關(guān)系數(shù)的性質(zhì): 1,且越接近1,相關(guān)程度越大;且越接近0,相關(guān)程度越小.一般的,當(dāng) 0.75 時(shí),就可以判斷其具有很強(qiáng)的相關(guān)性,這時(shí)求線性回歸方程才有意義。例3 假設(shè)關(guān)于某設(shè)備的使用年限x和所支出的維修費(fèi)用y萬元,有如下的統(tǒng)計(jì)資料:x23456y2.23.85.56.57.0假設(shè)由資料可知y對x呈線性相關(guān)關(guān)系。試求:1線性回歸方程;2估計(jì)使用年限為10年時(shí),維修費(fèi)用是多少?分析:此題為了降低難度,告訴了y與x間呈線性相關(guān)關(guān)系,目的是訓(xùn)練公式的使用。解:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論