版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
§8.1
成對數(shù)據(jù)的統(tǒng)計相關性第八章
成對數(shù)據(jù)的統(tǒng)計分析學習目標XUEXIMUBIAO1.結(jié)合實例,了解樣本相關系數(shù)的統(tǒng)計含義.2.了解樣本相關系數(shù)與標準化數(shù)據(jù)向量夾角的關系.3.結(jié)合實例,會通過樣本相關系數(shù)比較多組成對樣本數(shù)據(jù)的相關性.內(nèi)容索引知識梳理題型探究隨堂演練課時對點練1知識梳理PARTONE1.相關關系的定義:兩個變量有關系,但沒有確切到可由其中一個去精確地決定另一個的程度,這種關系稱為相關關系.思考相關關系是函數(shù)關系嗎?答案不是.函數(shù)關系是唯一確定的關系.知識點一相關關系2.相關關系的分類(1)按變量間的增減性分為
相關和
相關.①正相關:當一個變量的值增加時,另一個變量的相應值也呈現(xiàn)
的趨勢;②負相關:當一個變量的值增加時,另一個變量的相應值呈現(xiàn)
的趨勢.(2)按變量間是否有線性特征分為
相關和
相關(曲線相關).①線性相關:如果兩個變量的取值呈現(xiàn)正相關或負相關,而且散點落在
附近,我們稱這兩個變量線性相關;②非線性相關或曲線相關:如果兩個變量具有相關性,但不是
相關,我們稱這兩個變量非線性相關或曲線相關.正負增加減少線性非線性一條直線線性1.散點圖:為了直觀描述成對樣本數(shù)據(jù)的變化特征,把每對成對樣本數(shù)據(jù)都用直角坐標系中的點表示出來,由這些點組成的統(tǒng)計圖,叫做散點圖.2.樣本相關系數(shù)(1)我們常用樣本相關系數(shù)r來確切地反映成對樣本數(shù)據(jù)(xi,yi)的相關程度,其中r=
.知識點二相關關系的刻畫(2)樣本相關系數(shù)r的取值范圍為
.①若r>0時,成對樣本數(shù)據(jù)
相關;②若r<0時,成對樣本數(shù)據(jù)
相關;③當|r|越接近
時,成對樣本數(shù)據(jù)的線性相關程度越強;④當|r|越接近
時,成對樣本數(shù)據(jù)的線性相關程度越弱.[-1,1]正負101.函數(shù)關系是一種確定關系,而相關關系是一種不確定關系.(
)2.樣本相關系數(shù)r越大,兩變量的相關性越強.(
)3.散點圖可以直觀地分析出兩個變量是否具有相關性.(
)4.若變量x,y滿足函數(shù)關系,則這兩個變量線性相關.(
)思考辨析判斷正誤SIKAOBIANXIPANDUANZHENGWU√×√×2題型探究PARTTWO一、變量間相關關系的判斷例1
(1)(多選)下列關系中,屬于相關關系的是A.正方形的邊長與面積之間的關系B.農(nóng)作物的產(chǎn)量與施肥量之間的關系C.出租車費與行駛的里程D.降雪量與交通事故的發(fā)生率之間的關系√√解析A中,正方形的邊長與面積之間的關系是函數(shù)關系;B中,農(nóng)作物的產(chǎn)量與施肥量之間不具有嚴格的函數(shù)關系,但具有相關關系;C為確定的函數(shù)關系;D中,降雪量與交通事故的發(fā)生率之間具有相關關系.(2)某種產(chǎn)品的廣告支出費x與銷售額y之間有如下對應數(shù)據(jù)(單位:百萬元):x24568y3040605070①畫出散點圖;解以x對應的數(shù)據(jù)為橫坐標,y對應的數(shù)據(jù)為縱坐標,所作的散點圖如圖所示.②從散點圖中判斷銷售金額與廣告支出費成什么樣的關系?解從圖中可以發(fā)現(xiàn)廣告支出費與銷售金額之間具有相關關系,并且當廣告支出費由小變大時,銷售金額也大多由小變大,圖中的數(shù)據(jù)大致分布在某條直線的附近,即x與y成正相關關系.反思感悟兩個變量是否相關的兩種判斷方法(1)根據(jù)實際經(jīng)驗:借助積累的經(jīng)驗進行分析判斷.(2)利用散點圖:通過散點圖,觀察它們的分布是否存在一定的規(guī)律,直觀地進行判斷.如果發(fā)現(xiàn)點的分布從整體上看大致在一條直線附近,那么這兩個變量就是線性相關的,注意不要受個別點的位置的影響.跟蹤訓練1
(多選)在下列所示的四個圖中,每個圖的兩個變量具有相關關系的圖是解析圖A的兩個變量具有函數(shù)關系;圖BC的兩個變量具有相關關系;圖D的兩個變量之間既不是函數(shù)關系,也不是相關關系.√√二、樣本相關系數(shù)的性質(zhì)例2
(1)甲、乙、丙、丁四位同學各自對A,B兩變量的線性相關性做試驗,并用回歸分析方法分別求得樣本相關系數(shù)r如下表:
甲乙丙丁r0.820.780.690.85則哪位同學的試驗結(jié)果體現(xiàn)A,B兩變量有更強的線性相關性A.甲
B.乙
C.丙
D.丁解析|r|越接近1,相關性越強,故選D.√(2)在一組成對樣本數(shù)據(jù)為(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點圖中,若這組成對樣本數(shù)據(jù)的樣本相關系數(shù)為-1,則所有的樣本點(xi,yi)(i=1,2,…,n)滿足的方程可以是A.y=-
x+1 B.y=x-1C.y=x+1 D.y=-x2√解析∵這組成對樣本數(shù)據(jù)的樣本相關系數(shù)為-1,∴這一組成對樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)線性相關,且是負相關.∴可排除B,C,D,故選A.反思感悟樣本相關系數(shù)的性質(zhì)(1)r的絕對值越接近0,相關性越弱.(2)r的絕對值越接近1,相關性越強.跟蹤訓練2
(1)對變量x,y有成對樣本數(shù)據(jù)(xi,yi)(i=1,2,…,10),得散點圖圖1;對變量u,v有成對樣本數(shù)據(jù)(ui,vi)(i=1,2,…,10),得散點圖圖2.由這兩個散點圖可以判斷A.變量x與y正相關,u與v正相關B.變量x與y正相關,u與v負相關C.變量x與y負相關,u與v正相關D.變量x與y負相關,u與v負相關√解析由這兩個散點圖可以判斷,變量x與y負相關,u與v正相關.(2)(多選)對兩個變量的樣本相關系數(shù)r,下列說法正確的是A.|r|越大,相關程度越大B.|r|越小,相關程度越大C.|r|趨近于0時,沒有線性相關關系D.|r|越接近1時,線性相關程度越強解析對于A,|r|越大,相關程度越大,A正確;對于B,|r|越小,相關程度越小,B錯誤;對于C,|r|趨近于0時,線性相關關系越弱,C錯誤;對于D,|r|越接近1時,線性相關程度越強,D正確.綜上,正確的是AD.√√三、樣本相關系數(shù)的計算及應用例3
某廠的生產(chǎn)原料耗費x(單位:百萬元)與銷售額y(單位:百萬元)之間有如下的對應關系:x2468y30405070(1)畫出(x,y)的散點圖;解畫出(x,y)的散點圖如圖所示.(2)計算x與y之間的樣本相關系數(shù),并刻畫它們的相關程度.由樣本相關系數(shù)r≈0.9827,可以推斷生產(chǎn)原料耗費與銷售額這兩個變量正線性相關,且相關程度很高.反思感悟線性相關強弱的判斷方法(1)散點圖:散點圖只是粗略作出判斷,其圖象越接近直線,相關性越強.(2)樣本相關系數(shù):樣本相關系數(shù)能夠較準確的判斷相關的程度,其絕對值越大,相關性越強.跟蹤訓練3
假設關于某種設備的使用年限x(單位:年)與所支出的維修費用y(單位:萬元)有如下統(tǒng)計資料:x23456y2.23.85.56.57.03隨堂演練PARTTHREE1.(多選)下列命題正確的是A.任意兩個變量都具有相關關系B.圓的周長與該圓的直徑具有相關關系C.某商品的需求量與該商品的價格是一種非確定性關系D.當兩個變量相關且樣本相關系數(shù)r>0時,表明兩個變量正相關12345解析A顯然不對,B是函數(shù)關系,CD正確.√√2.若變量y與x之間的樣本相關系數(shù)r=-0.9832,則變量y與x之間A.不具有線性相關關系B.具有線性相關關系C.它們的線性相關關系還需要進一步確定D.不確定12345解析變量y與x之間的樣本相關系數(shù)r=-0.9832,|r|=0.9832接近1,樣本相關系數(shù)的絕對值越大,相關性越強,∴變量y與x之間有較強的線性相關關系,故選B.√3.兩個變量x,y的樣本相關系數(shù)r1=0.7859,兩個變量u,v的樣本相關系數(shù)r2=-0.9568,則下列判斷正確的是A.變量x與y正相關,變量u與v負相關,變量x與y的線性相關性較強B.變量x與y負相關,變量u與v正相關,變量x與y的線性相關性較強C.變量x與y正相關,變量u與v負相關,變量u與v的線性相關性較強D.變量x與y負相關,變量u與v正相關,變量u與v的線性相關性較強12345√解析由樣本相關系數(shù)r1=0.7859>0知x與y正相關,由樣本相關系數(shù)r2=-0.9568<0知u,v負相關,又|r1|<|r2|,∴變量u與v的線性相關性比x與y的線性相關性強.故選C.12345123454.據(jù)兩個變量x,y之間的成對樣本數(shù)據(jù)畫出散點圖如圖,這兩個變量是否具有線性相關關系___.(填“是”或“否”)否解析圖中的點分布雜亂,兩個變量不具有線性相關關系.123455.部門所屬的10個工業(yè)企業(yè)生產(chǎn)性固定資產(chǎn)價值與工業(yè)增加值資料如下表(單位:百萬元):固定資產(chǎn)價值33566789910工業(yè)增加值15172528303637424045根據(jù)上表資料計算的樣本相關系數(shù)約為_______.0.9918123451.知識清單:(1)相關關系.(2)散點圖.(3)正相關、負相關、線性相關、非線性相關.(4)樣本相關系數(shù).2.方法歸納:數(shù)形結(jié)合.3.常見誤區(qū):相關關系與函數(shù)關系不分,樣本相關系數(shù)絕對值的大小與相關程度的關系.課堂小結(jié)KETANGXIAOJIE4課時對點練PARTFOUR1.若“名師出高徒”成立,則名師與高徒之間存在什么關系A.相關關系
B.函數(shù)關系C.無任何關系
D.不能確定基礎鞏固2345678910111213141516√12.(多選)給出下列關系,其中有相關關系的是A.人的年齡與他(她)擁有的財富之間的關系B.曲線上的點與該點的坐標之間的關系C.蘋果的產(chǎn)量與氣候之間的關系D.森林中的同一種樹木,其截面直徑與高度之間的關系√√√234567891011121314151613.兩個變量的相關關系有①正相關,②負相關,③不相關,則下列散點圖從左到右分別反映的變量間的相關關系是A.①②③
B.②③①
C.②①③
D.①③②√23456789101112131415161解析對于(1),圖中的點成帶狀分布,且從左到右上升,是①正相關關系;對于(2),圖中的點沒有明顯的帶狀分布,是③不相關;對于(3),圖中的點成帶狀分布,且從左到右是下降的,是②負相關關系.故選D.234567891011121314151614.(多選)某校地理學興趣小組在某座山測得海拔高度、氣壓和沸點的六組數(shù)據(jù)繪制成散點圖如圖所示,則下列說法正確的是A.沸點與海拔高度呈正相關B.沸點與氣壓呈正相關C.沸點與海拔高度呈負相關D.沸點與海拔高度、沸點與氣壓
的相關性都很強√√√23456789101112131415161解析由左圖知氣壓隨海拔高度的增加而減小,由右圖知沸點隨氣壓的升高而升高,所以沸點與氣壓呈正相關,沸點與海拔高度呈負相關,由于兩個散點圖中的點都成線性分布,所以沸點與海拔高度、沸點與氣壓的相關性都很強,故B,C,D正確,A錯誤.234567891011121314151615.變量X與Y相對應的一組成對樣本數(shù)據(jù)為(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),變量U與V相對應的一組成對樣本數(shù)據(jù)為(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示變量Y與X之間的樣本相關系數(shù),r2表示變量V與U之間的樣本相關系數(shù),則A.r2<r1<0 B.0<r2<r1 C.r2<0<r1 D.r1=r2√解析由已知中的數(shù)據(jù)可知:第一組成對樣本數(shù)據(jù)正相關,則樣本相關系數(shù)大于零,第二組成對樣本數(shù)據(jù)負相關,則樣本相關系數(shù)小于零,故選C.234567891011121314151616.如圖所示的兩個變量不具有相關關系的有______.(填序號)解析①是確定的函數(shù)關系;②中的點大都分布在一條曲線周圍;③中的點大都分布在一條直線周圍;④中點的分布沒有任何規(guī)律可言,x,y不具有相關關系.①④234567891011121314151617.給出下列x,y值的數(shù)據(jù)如下:解析由表中數(shù)據(jù)可以得到x,y之間是一種函數(shù)關系:y=2x+1,所以x,y是一種確定的關系,即函數(shù)關系.則根據(jù)數(shù)據(jù)可以判斷x和y的關系是_________.(填“確定關系”“相關關系”或“沒有關系”)x1248y35917確定關系234567891011121314151618.對某高三學生在連續(xù)9次數(shù)學測試中的成績(單位:分)進行統(tǒng)計得到如圖所示的散點圖.下面關于這位同學的數(shù)學成績的分析中,正確的序號有________.①該同學的數(shù)學成績總的趨勢是在逐步提高;②該同學在這連續(xù)九次測試中的最高分與最低分的差超過40分;③該同學的數(shù)學成績與測試序號具有線性相關性,且為正相關.①②③23456789101112131415161解析散點圖從左向右看呈上升趨勢,所以該同學的數(shù)學成績總的趨勢是在逐步提高,①正確;該同學在這連續(xù)九次測試中的最高分大于130分,最低分小于90分,極差超過40分,②正確;該同學的數(shù)學成績與測試序號具有比較明顯的線性相關性,且為正相關,③正確.234567891011121314151619.某個男孩的年齡與身高的統(tǒng)計數(shù)據(jù)如下表所示:年齡x(歲)123456身高y(cm)788798108115120(1)畫出散點圖;解散點圖如圖所示.23456789101112131415161(2)判斷y與x是否具有線性相關關系,如果相關,是正相關還是負相關.年齡x(歲)123456身高y(cm)788798108115120解由圖知,所有數(shù)據(jù)點接近一條直線排列,因此,認為y與x具有線性相關關系,且是正相關關系.2345678910111213141516110.關于兩個變量x和y的7組數(shù)據(jù)如下表所示:x21232527293235y711212466115325求變量y與x的樣本相關系數(shù),并判斷變量y與x之間是正相關還是負相關.2345678910111213141516123456789101112131415161∵r>0,∴變量y與x之間是正相關關系.23456789101112131415161綜合運用11.兩個變量y與x的模型中,分別選擇了4個不同模型,它們的樣本相關系數(shù)r如下,其中擬合效果最好的模型是A.模型1 B.模型2 C.模型3 D.模型4模型模型1模型2模型3模型4樣本相關系數(shù)r0.980.800.500.25√2345678910111213141516112.某統(tǒng)計部門對四組成對樣本數(shù)據(jù)進行統(tǒng)計分析后,獲得如圖所示的散點圖,關于樣本相關系數(shù)的比較,其中正確的是A.r4<r2<0<r1<r3
B.r2<r4<0<r1<r3 C.r2<r4<0<r3<r1
D.r4<r2<0<r3<r1√23456789101112131415161解析根據(jù)散點圖的特征,數(shù)據(jù)大致呈增長趨勢的是正相關,數(shù)據(jù)呈遞減趨勢的是負相關;數(shù)據(jù)越集中在一條直線附近,說明相關性越強,由題中數(shù)據(jù)可知:(1)(3)為正相關,(2)(4)為負相關,故r1>0,r3>0,r2<0,r4<0,又(1)與(2)中散點圖更接近于一條直線,故r1>r3,r2<r4,因此r2<r4<0<r3<r1.故選C.2345678910111213141516113.如圖所示,有5組(x,y)數(shù)據(jù),去掉哪一組數(shù)據(jù)之后,剩下的4組數(shù)據(jù)成線性相關關系A.E
B.D C.B D.A√解析去掉D組數(shù)據(jù)之后,剩下的4組數(shù)據(jù)成線性相關關系.2345678910111213141516114.高三年級267位學生參加期末考試,某班37位學生的語文成績、數(shù)學成績與總成績在全年級的排名情況如圖所示,甲、乙、丙為該班三位學生.從這次考試成績看:(1)在甲、乙兩人中,其語文成績名次比其總成績名次靠前的學生是___;乙解析在甲、乙兩人中,其語文成績名次比其總成績名次靠前的學生是乙;23456789101112131415161(2)在語文和數(shù)學兩個科目中,丙同學的成績名次更靠前的科目是_____.數(shù)學23456789101112131415161解析由高三年級267位學生參加期末考試,某班37位學生的語文成績、數(shù)學成績與總成績在全年級的排名情況的散點圖可知,兩個圖中,同一個人的總成績是不會變的.第二個圖看,丙是從右往左數(shù)第5個點,即丙的總成績在班里倒數(shù)第5.在左邊的圖中,找到倒數(shù)第5個點,它表示的就是丙,發(fā)現(xiàn)這個點的位置比右邊圖中丙的位置高,所以語文名次更“大”,即數(shù)學的成績更靠前.2345678910111213141516115.某商家今年上半年各月的人均銷售額(單位:千元)與利潤率統(tǒng)計表如下:拓廣探究月份123456人均銷售額658347利潤率(%)12.610.418.53.08.116.3根據(jù)表中數(shù)據(jù),下列說法正確的是A.利潤率與人均銷售額成正比例函數(shù)關系B.利潤率與人均銷售額成反比例函數(shù)關系C.利潤率與人均銷售額成正相關關系D.利潤率與人均銷售額成負相關關系√23456789101112131415161解析根據(jù)題意,畫出利潤率與人均銷售額的散點圖,如圖所示.由散點圖可知,利潤率與人均銷售額成正相關關系.故選C.2345678910111213141516116.現(xiàn)隨機抽取了我校10名學生在入學考試中的數(shù)學成績(x)與入學后的第一次考試數(shù)學成績(y),數(shù)據(jù)如下表:學生號12345678910x12010811710410311010410599108y84648468696869465771計算這10個學生的兩次數(shù)學考試成績的樣本相關系數(shù)r,并判斷兩者是否具有線性相關關系.2345678910111213141516123456789101112131415161∴樣本相關系數(shù)為≈0.7506,∴這10個學生的兩次數(shù)學考試成績具有線性相關關系.23456789101112131415161§8.2一元線性回歸模型及其應用第八章
成對數(shù)據(jù)的統(tǒng)計分析學習目標XUEXIMUBIAO1.結(jié)合實例,了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計
意義.2.了解最小二乘原理,掌握一元線性回歸模型參數(shù)的最小二乘估計
方法.3.針對實際問題,會用一元線性回歸模型進行預測.內(nèi)容索引知識梳理題型探究隨堂演練課時對點練1知識梳理PARTONE稱
為Y關于x的一元線性回歸模型.其中Y稱為_______或
,x稱為
或
,
稱為截距參數(shù),
稱為斜率參數(shù);e是
與
之間的隨機誤差,如果e=
,那么Y與x之間的關系就可以用一元線性函數(shù)模型來描述.知識點一一元線性回歸模型因變量響應變量自變量解釋變量abYbx+a0知識點二最小二乘法思考1
經(jīng)驗回歸方程一定過成對樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)中的某一點嗎?答案
不一定.思考2
點(
)在經(jīng)驗回歸直線上嗎?答案在.知識點三殘差與殘差分析1.殘差對于響應變量Y,通過觀測得到的數(shù)據(jù)稱為
,通過經(jīng)驗回歸方程得到的
稱為
,
減去
稱為殘差.2.殘差分析
是隨機誤差的估計結(jié)果,通過對
的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.觀測值預測值觀測值預測值殘差殘差知識點四對模型刻畫數(shù)據(jù)效果的分析1.殘差圖法在殘差圖中,如果殘差比較均勻地集中在以
,則說明經(jīng)驗回歸方程較好地刻畫了兩個變量的關系.2.殘差平方和法殘差平方和
越小,模型的擬合效果越好.橫軸為對稱軸的水平帶狀區(qū)域內(nèi)3.R2法大小思考利用經(jīng)驗回歸方程求得的函數(shù)值一定是真實值嗎?答案不一定,他只是真實值的一個預測估計值.1.求經(jīng)驗回歸方程前可以不進行相關性檢驗.(
)2.在殘差圖中,縱坐標為殘差,橫坐標可以選為樣本編號.(
)3.利用經(jīng)驗回歸方程求出的值是準確值.(
)4.殘差平方和越小,線性回歸模型的擬合效果越好.(
)5.R2越小,線性回歸模型的擬合效果越好.(
)思考辨析判斷正誤SIKAOBIANXIPANDUANZHENGWU√√×××2題型探究PARTTWO一、求經(jīng)驗回歸方程例1
某研究機構(gòu)對高三學生的記憶力x和判斷力y進行統(tǒng)計分析,得下表數(shù)據(jù):x681012y2356(1)請畫出上表數(shù)據(jù)的散點圖;解散點圖如圖所示:(2)請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關于x的經(jīng)驗回歸方程
;(3)試根據(jù)求出的經(jīng)驗回歸方程,預測記憶力為9的同學的判斷力.即預測記憶力為9的同學的判斷力為4.反思感悟求經(jīng)驗回歸方程可分如下四步來完成(4)寫:寫出經(jīng)驗回歸方程.跟蹤訓練1
隨著我國經(jīng)濟的發(fā)展,居民儲蓄存款逐年增長.設某地區(qū)城鄉(xiāng)居民人民幣儲蓄存款(年底余額)如下表:年份20152016201720182019時間代號t12345儲蓄存款y(千億元)567810(2)用所求經(jīng)驗回歸方程預測該地區(qū)2021年(t=7)的人民幣儲蓄存款.年份20152016201720182019時間代號t12345儲蓄存款y(千億元)567810所以預測該地區(qū)2021年的人民幣儲蓄存款為12千億元.例2
已知某種商品的價格x(單位:元)與需求量y(單位:件)之間的關系有如下一組數(shù)據(jù):二、線性回歸分析x1416182022y1210753求y關于x的經(jīng)驗回歸方程,并借助殘差平方和和R2說明回歸模型擬合效果的好壞.列出殘差表:所以回歸模型的擬合效果很好.反思感悟刻畫回歸效果的三種方法(1)殘差圖法,殘差點比較均勻地落在水平的帶狀區(qū)域內(nèi)說明選用的模型比較合適.跟蹤訓練2
為研究重量x(單位:克)對彈簧長度y(單位:厘米)的影響,對不同重量的6個物體進行測量,數(shù)據(jù)如下表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散點圖并求經(jīng)驗回歸方程;解散點圖如圖.(2)求出R2;
x51015202530y7.258.128.959.9010.911.8解殘差表如下:所以回歸模型的擬合效果很好.(3)進行殘差分析.x51015202530y7.258.128.959.9010.911.8解由殘差表中的數(shù)值可以看出第3個樣本點的殘差比較大,需要確認在采集這個數(shù)據(jù)的時候是否有人為的錯誤,如果有,則需要糾正數(shù)據(jù),重新建立回歸模型;由表中數(shù)據(jù)可以看出殘差點比較均勻地落在寬度不超過0.15的狹窄的水平帶狀區(qū)域中,說明選用的線性回歸模型的精度較高,由以上分析可知,彈簧長度與重量成線性關系.三、非線性回歸例3下表為收集到的一組數(shù)據(jù):(1)作出x與y的散點圖,并猜測x與y之間的關系;x21232527293235y711212466115325解作出散點圖如圖,從散點圖可以看出x與y不具有線性相關關系,根據(jù)已有知識可以發(fā)現(xiàn)樣本點分布在某一條指數(shù)函數(shù)型曲線y=c1
的周圍,其中c1,c2為待定的參數(shù).(2)建立x與y的關系,預報回歸模型并計算殘差;x21232527293235y711212466115325解對兩邊取對數(shù)把指數(shù)關系變?yōu)榫€性關系,令z=lny,則有變換后的樣本點應分布在直線z=bx+a(a=lnc1,b=c2)的周圍,這樣就可以利用經(jīng)驗回歸模型來建立y與x之間的非線性經(jīng)驗回歸方程了,數(shù)據(jù)可以轉(zhuǎn)化為x21232527293235z1.9462.3983.0453.1784.1904.7455.784殘差表如下:yi7112124661153256.44311.10119.12532.95056.770128.381290.3250.557-0.1011.875-8.9509.23-13.38134.675(3)利用所得模型,預測x=40時y的值.x21232527293235y711212466115325反思感悟非線性回歸問題的處理方法(1)指數(shù)函數(shù)型y=ebx+a①函數(shù)y=ebx+a的圖象,如圖所示;②處理方法:兩邊取對數(shù)得lny=lnebx+a,即lny=bx+a.令z=lny,把原始數(shù)據(jù)(x,y)轉(zhuǎn)化為(x,z),再根據(jù)線性回歸模型的方法求出a,b.(2)對數(shù)函數(shù)型y=blnx+a①函數(shù)y=blnx+a的圖象,如圖所示;②處理方法:設x′=lnx,原方程可化為y=bx′+a,再根據(jù)線性回歸模型的方法求出a,b.(3)y=bx2+a型處理方法:設x′=x2,原方程可化為y=bx′+a,再根據(jù)線性回歸模型的方法求出a,b.跟蹤訓練3
為了研究甲型H1N1中的某種細菌隨時間x變化的繁殖個數(shù)y,收集數(shù)據(jù)如下:天數(shù)x123456繁殖個數(shù)y612254995190求y關于x的非線性經(jīng)驗回歸方程.解作出散點圖如圖(1)所示.由散點圖看出樣本點分布在一條指數(shù)型曲線y=cebx的周圍,則lny=bx+lnc.令z=lny,a=lnc,則z=bx+a.x123456z1.792.483.223.894.555.25相應的散點圖如圖(2)所示.從圖(2)可以看出,變換后的樣本點分布在一條直線附近,因此可以用經(jīng)驗回歸方程來擬合.x123456z1.792.483.223.894.555.253隨堂演練PARTTHREE1.(多選)以下四個散點圖中,兩個變量的關系適合用線性回歸模型刻畫的是12345解析AC中的點分布在一條直線附近,適合線性回歸模型.√√2.甲、乙、丙、丁四位同學在建立變量x,y的回歸模型時,分別選擇了4種不同模型,計算可得它們的決定系數(shù)R2分別如下表:哪位同學建立的回歸模型擬合效果最好A.甲
B.乙
C.丙
D.丁
甲乙丙丁R20.980.780.500.85√解析決定系數(shù)R2越大,表示回歸模型的擬合效果越好.123453.已知人的年齡x與人體脂肪含量的百分數(shù)y的經(jīng)驗回歸方程為y=0.577x-0.448,如果某人36歲,那么這個人的脂肪含量A.一定是20.3%B.在20.3%附近的可能性比較大C.無任何參考數(shù)據(jù)D.以上解釋都無道理√解析將x=36代入經(jīng)驗回歸方程得y=0.577×36-0.448≈20.3,故這個人的脂肪含量在20.3%附近的可能性較大,故選B.123456312345123451.知識清單:(1)一元線性回歸模型.(2)最小二乘法、經(jīng)驗回歸方程的求法.(3)對模型刻畫數(shù)據(jù)效果的分析:殘差圖法、殘差平方和法和R2法.2.方法歸納:數(shù)形結(jié)合、轉(zhuǎn)化化歸.3.常見誤區(qū):不判斷變量間是否具有線性相關關系,盲目求解經(jīng)驗回歸方程致誤.課堂小結(jié)KETANGXIAOJIE4課時對點練PARTFOUR1.如果兩個變量之間的線性相關程度很高,則其R2的值應接近于A.0.5 B.2 C.0 D.1基礎鞏固123456789101112131415√16解析R2越接近于1,相關程度越高,故選D.2.對變量x,y進行回歸分析時,依據(jù)得到的4個不同的回歸模型畫出殘差圖,則下列模型擬合精度最高的是√12345678910111213141516解析用殘差圖判斷模型的擬合效果,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明這樣的模型比較合適,帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高.123456789101112131415163.工人工資y(元)與勞動生產(chǎn)率x(千元)的相關關系的經(jīng)驗回歸方程為
=50+80x,下列判斷正確的是A.勞動生產(chǎn)率為1000元時,工人工資為130元B.勞動生產(chǎn)率提高1000元時,工人工資平均提高80元C.勞動生產(chǎn)率提高1000元時,工人工資平均提高130元D.當月工資為250元時,勞動生產(chǎn)率為2000元解析因為經(jīng)驗回歸方程的斜率為80,所以x每增加1,y平均增加80,即勞動生產(chǎn)率提高1000元時,工人工資平均提高80元.√123456789101112131415164.兩個變量的散點圖如圖,可考慮用如下函數(shù)進行擬合比較合理的是A.y=a·xb
B.y=a+blnxC.y=a·ebx
D.y=a·解析由散點圖可知,此曲線類似對數(shù)函數(shù)型曲線,因此可用函數(shù)y=a+blnx模型進行擬合.√12345678910111213141516√√解析經(jīng)驗回歸方程是一個模擬函數(shù),它表示的是一系列離散的點大致所在直線的位置及其大致變化規(guī)律,所以有些散點不一定在經(jīng)驗回歸直線上.√1234567891011121314151612.1123456789101112131415167.若經(jīng)驗回歸直線方程中的回歸系數(shù)
=0,則樣本相關系數(shù)r=____.0123456789101112131415168.某品牌服裝專賣店為了解保暖襯衣的銷售量y(件)與平均氣溫x(℃)之間的關系,隨機統(tǒng)計了連續(xù)四旬的銷售量與當旬平均氣溫,其數(shù)據(jù)如表:
(1)表中數(shù)據(jù)m=____;40時間二月上旬二月中旬二月下旬三月上旬旬平均氣溫x(℃)381217旬銷售量y(件)55m332412345678910111213141516(2)氣象部門預測三月中旬的平均氣溫約為22℃,據(jù)此估計,該品牌的保暖襯衣在三月中旬的銷售量約為____件.14時間二月上旬二月中旬二月下旬三月上旬旬平均氣溫x(℃)381217旬銷售量y(件)55m3324故三月中旬的銷售量約為14件.123456789101112131415169.已知變量x,y有如下對應數(shù)據(jù):
(1)作出散點圖;解散點圖如圖所示.x1234y134512345678910111213141516(2)用最小二乘法求關于x,y的經(jīng)驗回歸方程.x1234y134512345678910111213141516123456789101112131415161234567891011121314151612345678910111213141516(2)①判斷變量x與y之間是正相關還是負相關;②當使用年限為8年時,試估計支出的維修費是多少?解由(1)知,當x=8時,
=1.2×8+0.2=9.8,即使用年限為8年時,支出的維修費約是9.8萬元.12345678910111213141516綜合運用√1234567891011121314151612.恩格爾系數(shù)是食品支出總額占個人消費支出總額的比重.據(jù)某機構(gòu)預測,n(n≥10)個城市職工購買食品的人均支出y(千元)與人均月消費支出x(千元)具有線性相關關系,且經(jīng)驗回歸方程為
=0.4x+1.2,若其中某城市職工的人均月消費支出為5千元,則該城市職工的月恩格爾系數(shù)約為A.60% B.64% C.58% D.55%√1234567891011121314151613.(多選)設某大學的女生體重y(單位:kg)與身高x(單位:cm)具有線性相關關系.根據(jù)一組樣本數(shù)據(jù)(xi,yi)(i=1,2,…,n),用最小二乘法建立的經(jīng)驗回歸方程為
=0.85x-85.71,則下列結(jié)論中正確的是A.y與x具有正的線性相關關系B.經(jīng)驗回歸方程過樣本點的中心(
)C.若該大學某女生身高增加1cm,則其體重約增加0.85kgD.若該大學某女生身高為170cm,則可判定其體重必為58.79kg√√√解析A,B,C均正確,是經(jīng)驗回歸方程的性質(zhì),D項是錯誤的,經(jīng)驗回歸方程只能預測學生的體重,應為大約58.79kg.1234567891011121314151614.某數(shù)學老師身高176cm,他爺爺、父親和兒子的身高分別是173cm,170cm,182cm.因兒子的身高與父親的身高有關,該老師用線性回歸分析的方法預測他孫子的身高為_____cm.18512345678910111213141516解析因為兒子的身高與父親的身高有關,所以設兒子的身高為Y(單位:cm),父親身高為X(單位:cm),根據(jù)數(shù)據(jù)列表:X173170176Y170176182于是兒子身高與父親身高的關系式為Y=X+3,當X=182時,Y=185.故預測該老師的孫子的身高為185cm.12345678910111213141516拓廣探究x1234yee3e4e6若x=5,則預測y的值可能為A.e5
B. C.e7 D.√12345678910111213141516列出x,z的取值對應的表格如下:x1234z1346123456789101112131415161234567891011121314151616.某工廠為了對新研發(fā)的一種產(chǎn)品進行合理定價,將該產(chǎn)品按事先擬定的價格進行試銷,得到如下數(shù)據(jù):單價x(元)88.28.48.68.89銷量y(件)90848380756812345678910111213141516單價x(元)88.28.48.68.89銷量y(件)90848380756812345678910111213141516(2)預計在今后的銷售中,銷量與單價仍然服從(1)中的關系,且該產(chǎn)品的成本是4元/件,為使工廠獲得最大利潤,該產(chǎn)品的單價應定為多少元?(利潤=銷售收入-成本)解設工廠獲得的利潤為L元,依題意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20(x-8.25)2+361.25.故當單價定為8.25元時,工廠可獲得最大利潤.12345678910111213141516§8.3列聯(lián)表與獨立性檢驗第八章
成對數(shù)據(jù)的統(tǒng)計分析學習目標XUEXIMUBIAO1.通過實例,理解2×2列聯(lián)表的統(tǒng)計意義.2.通過實例,了解2×2列聯(lián)表獨立性檢驗及其應用.內(nèi)容索引知識梳理題型探究隨堂演練課時對點練1知識梳理PARTONE為了表述方便,我們經(jīng)常會使用一種特殊的隨機變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類隨機變量稱為分類變量.分類變量的取值可以用_____表示.知識點一分類變量實數(shù)知識點二2×2列聯(lián)表1.2×2列聯(lián)表給出了成對分類變量數(shù)據(jù)的
.2.定義一對分類變量X和Y,我們整理數(shù)據(jù)如下表所示:XY合計Y=0Y=1X=0aba+bX=1cdc+d合計a+cb+dn=a+b+c+d像這種形式的數(shù)據(jù)統(tǒng)計表稱為2×2列聯(lián)表.交叉分類頻數(shù)知識點三獨立性檢驗1.定義:利用χ2的取值推斷分類變量X和Y
的方法稱為χ2獨立性檢驗,讀作“卡方獨立性檢驗”.簡稱獨立性檢驗.2.χ2=
,其中n=a+b+c+d.3.獨立性檢驗解決實際問題的主要環(huán)節(jié)(1)提出零假設H0:X和Y相互獨立,并給出在問題中的解釋.(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計算χ2的值,并與臨界值xα比較.(3)根據(jù)檢驗規(guī)則得出推斷結(jié)論.(4)在X和Y不獨立的情況下,根據(jù)需要,通過比較相應的頻率,分析X和Y間的影響規(guī)律.是否獨立思考獨立性檢驗與反證法的思想類似,那么獨立性檢驗是反證法嗎?答案不是.因為反證法不會出錯,而獨立性檢驗依據(jù)的是小概率事件幾乎不發(fā)生.1.分類變量中的變量與函數(shù)的變量是同一概念.(
)2.等高堆積條形圖可初步分析兩分類變量是否有關系,而獨立性檢驗中χ2取值則可通過統(tǒng)計表從數(shù)據(jù)上說明兩分類變量的相關性的大小.(
)3.事件A與B的獨立性檢驗無關,即兩個事件互不影響.(
)4.χ2的大小是判斷事件A與B是否相關的統(tǒng)計量.(
)思考辨析判斷正誤SIKAOBIANXIPANDUANZHENGWU√√××2題型探究PARTTWO一、等高堆積條形圖的應用例1
為了解鉛中毒病人與尿棕色素為陽性是否有關系,分別對病人組和對照組的尿液作尿棕色素定性檢查,結(jié)果如下:組別尿棕色素合計陽性數(shù)陰性數(shù)鉛中毒病人29736對照組92837合計383573試畫出列聯(lián)表的等高堆積條形圖,分析鉛中毒病人和對照組的尿棕色素陽性數(shù)有無差別,鉛中毒病人與尿棕色素為陽性是否有關系?解等高堆積條形圖如圖所示:其中兩個淺色條的高分別代表鉛中毒病人和對照組樣本中尿棕色素為陽性的頻率.由圖可以直觀地看出鉛中毒病人與對照組相比,尿棕色素為陽性的頻率差異明顯,因此鉛中毒病人與尿棕色素為陽性有關系.反思感悟等高堆積條形圖的優(yōu)劣點(2)劣點:不能給出推斷“兩個分類變量有關系”犯錯誤的概率.跟蹤訓練1
網(wǎng)絡對現(xiàn)代人的生活影響較大,尤其是對青少年,為了解網(wǎng)絡對中學生學習成績的影響,某地區(qū)教育主管部門從轄區(qū)初中生中隨機抽取了1000人調(diào)查,發(fā)現(xiàn)其中經(jīng)常上網(wǎng)的有200人,這200人中有80人期末考試不及格,而另外800人中有120人不及格.利用等高堆積條形圖判斷學生學習成績與經(jīng)常上網(wǎng)有關嗎?解根據(jù)題目所給的數(shù)據(jù)得到如下2×2列聯(lián)表:學習成績上網(wǎng)合計經(jīng)常不經(jīng)常不及格80120200及格120680800合計2008001000得出等高堆積條形圖如圖所示:比較圖中陰影部分高可以發(fā)現(xiàn)經(jīng)常上網(wǎng)不及格的頻率明顯高于經(jīng)常上網(wǎng)及格的頻率,因此可以認為學習成績與經(jīng)常上網(wǎng)有關.命題角度1有關“相關的檢驗”例2
某校對學生課外活動進行調(diào)查,結(jié)果整理成下表:試根據(jù)小概率值α=0.005的獨立性檢驗,分析喜歡體育還是文娛與性別是否有關系.二、由χ2進行獨立性檢驗性別喜歡合計體育文娛男生212344女生62935合計275279解零假設為H0:喜歡體育還是喜歡文娛與性別沒有關系.∵a=21,b=23,c=6,d=29,n=79,根據(jù)小概率值α=0.005的獨立性檢驗,我們推斷H0不成立,即認為喜歡體育還是喜歡文娛與性別有關.反思感悟用χ2進行“相關的檢驗”步驟(1)零假設:即先假設兩變量間沒關系.(2)計算χ2:套用χ2的公式求得χ2值.(3)查臨界值:結(jié)合所給小概率值α查得相應的臨界值xα.(4)下結(jié)論:比較χ2與xα的大小,并作出結(jié)論.跟蹤訓練2
甲、乙兩機床加工同一種零件,抽檢得到它們加工后的零件尺寸x(單位:cm)及個數(shù)y,如下表:零件尺寸x1.011.021.031.041.05零件個數(shù)y甲37893乙7444a由表中數(shù)據(jù)得y關于x的經(jīng)驗回歸方程為
=-91+100x(1.01≤x≤1.05),其中合格零件尺寸為1.03±0.01(cm).完成下面列聯(lián)表,并依據(jù)小概率值α=0.01的獨立性檢驗,分析加工零件的質(zhì)量與甲、乙是否有關.機床加工零件的質(zhì)量合計合格零件數(shù)不合格零件數(shù)甲
乙
合計
所以a=11.由于合格零件尺寸為1.03±0.01cm,故甲、乙加工的合格與不合格零件的數(shù)據(jù)表為:機床加工零件的質(zhì)量合計合格零件數(shù)不合格零件數(shù)甲24630乙121830合計362460零假設為H0:加工零件的質(zhì)量與甲、乙無關.因為χ2=10>6.635=x0.01,根據(jù)小概率值α=0.01的獨立性檢驗,我們推斷H0不成立.即認為加工零件的質(zhì)量與甲、乙有關.命題角度2有關“無關的檢驗”例3
下表是某屆某校本科志愿報名時,對其中304名學生進入高校時是否知道想學專業(yè)的調(diào)查表:
知道想學專業(yè)不知道想學專業(yè)合計男生63117180女生4282124合計105199304根據(jù)表中數(shù)據(jù),則下列說法正確的是____.(填序號)①性別與知道想學專業(yè)有關;②性別與知道想學專業(yè)無關;③女生比男生更易知道所學專業(yè).②所以性別與知道想學專業(yè)無關.反思感悟獨立性檢驗解決實際問題的主要環(huán)節(jié)(1)提出零假設H0:X和Y相互獨立,并給出在問題中的解釋.(2)根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計算χ2的值,并與臨界值xα比較.(3)根據(jù)檢驗規(guī)則得出推斷結(jié)論.(4)在X和Y不獨立的情況下,根據(jù)需要,通過比較相應的頻率,分析X和Y間的影響規(guī)律.跟蹤訓練3
某省進行高中新課程改革,為了解教師對新課程教學模式的使用情況,某一教育機構(gòu)對某學校的教師關于新課程教學模式的使用情況進行了問卷調(diào)查,共調(diào)查了50人,其中有老教師20人,青年教師30人.老教師對新課程教學模式贊同的有10人,不贊同的有10人;青年教師對新課程教學模式贊同的有24人,不贊同的有6人.(1)根據(jù)以上數(shù)據(jù)建立一個2×2列聯(lián)表;解2×2列聯(lián)表如下表所示:教師年齡對新課程教學模式合計贊同不贊同老教師101020青年教師24630合計341650(2)試根據(jù)小概率值α=0.01的獨立性檢驗,分析對新課程教學模式的贊同情況與教師年齡是否有關系.解零假設為H0:對新課程教學模式的贊同情況與教師年齡無關.≈4.963<6.635=x0.01,根據(jù)小概率值α=0.01的獨立性檢驗,沒有充分證據(jù)推斷H0不成立,即認為對新課程教學模式的贊同情況與教師年齡無關.3隨堂演練PARTTHREE1.下面是一個2×2列聯(lián)表:12345解析∵a+21=73,∴a=52,b=a+8=52+8=60.XY合計Y=0Y=1X=0a2173X=182533合計b46
則表中a,b處的值分別為A.94,96 B.52,50 C.52,60
D.54,52√2.某班主任對全班50名學生進行了作業(yè)量的調(diào)查,數(shù)據(jù)如下表:性別作業(yè)量合計大不大男生18927女生81523合計262450則推斷“學生的性別與認為作業(yè)量大有關”這種推斷犯錯誤的概率不超過A.0.01 B.0.005 C.0.05
D.0.001√12345∴犯錯誤的概率不超過0.05.性別作業(yè)量合計大不大男生18927女生81523合計262450123453.(多選)若在研究吸煙與患肺癌的關系中,通過收集、整理分析數(shù)據(jù)得“吸煙與患肺癌有關”的結(jié)論,并且有99%以上的把握認為這個結(jié)論是成立的,則下列說法中正確的是A.在犯錯誤的概率不超過0.01的前提下,認為吸煙和患肺癌有關系B.1個人吸煙,那么這個人有99%的概率患有肺癌C.在100個吸煙者中一定有患肺癌的人D.在100個吸煙者中可能一個患肺癌的人也沒有√√解析獨立性檢驗的結(jié)論是一個統(tǒng)計量,統(tǒng)計的結(jié)果只是說明事件發(fā)生的可能性的大小,具體到一個個體,則不一定發(fā)生.123454.根據(jù)如圖所示的等高堆積條形圖可知喝酒與患胃病____關系.(填“有”或“沒有”)有解析從等高堆積條形圖上可以明顯地看出喝酒患胃病的頻率遠遠大于不喝酒患胃病的頻率.123455.某銷售部門為了研究具有相關大學學歷和能按時完成銷售任務的關系,對本部門200名銷售人員進行調(diào)查,所得數(shù)據(jù)如下表所示:
能按時完成銷售任務不能按時完成銷售任務合計具有相關大學學歷574299不具有相關大學學歷3665101合計93107200根據(jù)上述數(shù)據(jù)能得出結(jié)論:有_____以上的把握認為“銷售人員具有相關大學學歷與能按時完成銷售任務是有關系的”.99%12345因為9.67>6.635=x0.01,所以有99%以上的把握認為“銷售人員具有相關大學學歷與能按時完成銷售任務是有關系的”.123451.知識清單:(1)分類變量.(2)2×2列聯(lián)表.(3)等高堆積條形圖.(4)獨立性檢驗,χ2公式.2.方法歸納:數(shù)形結(jié)合.3.常見誤區(qū):對獨立性檢驗的原理不理解,導致不會用χ2分析問題.課堂小結(jié)KETANGXIAOJIE4課時對點練PARTFOUR1.觀察下列各圖,其中兩個分類變量x,y之間關系最強的是基礎鞏固12345678910111213141516解析觀察等高堆積條形圖易知D選項兩個分類變量之間關系最強.√2.(多選)給出下列實際問題,其中用獨立性檢驗可以解決的問題有A.兩種藥物治療同一種病是否有區(qū)別B.吸煙者得肺病的概率C.吸煙是否與性別有關系D.網(wǎng)吧與青少年的犯罪是否有關系√√√解析獨立性檢驗是判斷兩個分類變量是否有關系的方法,而B是概率問題,故選ACD.123456789101112131415163.為了研究高中學生中性別與對鄉(xiāng)村音樂態(tài)度(喜歡和不喜歡兩種態(tài)度)的關系,運用2×2列聯(lián)表進行獨立性檢驗,經(jīng)計算χ2=8.01,則所得到的統(tǒng)計學結(jié)論是認為“性別與喜歡鄉(xiāng)村音樂有關系”的把握約為A.0.1% B.0.5%C.99.5% D.99.9%解析因為χ2=8.01>7.879=x0.005,所以認為性別與喜歡鄉(xiāng)村音樂有關系的把握有99.5%.√123456789101112131415164.某同學寒假期間對其30位親屬的飲食習慣進行了一次調(diào)查,列出了如下2×2列聯(lián)表:年齡飲食習慣合計偏愛蔬菜偏愛肉類50歲以下481250歲以上16218合計201030則可以說其親屬的飲食習慣與年齡有關的把握為A.95% B.99% C.99.5% D.99.9%√12345678910111213141516所以有99.5%的把握認為其親屬的飲食習慣與年齡有關.123456789101112131415165.考察棉花種子處理情況跟生病之間的關系得到下表數(shù)據(jù):種子種子合計處理未處理得病32101133不得病61213274合計93314407根據(jù)以上數(shù)據(jù),可得出A.種子是否經(jīng)過處理跟生病有關
B.種子是否經(jīng)過處理跟生病無關C.種子是否經(jīng)過處理決定是否生病
D.以上都是錯誤的√12345678910111213141516≈0.164<2.706=x0.1,即沒有把握認為種子是否經(jīng)過處理跟生病有關.123456789101112131415166.χ2的大小可以決定是否拒絕原來的統(tǒng)計假設H0,如果χ2值較大,就拒絕H0,即接受兩個分類變量____關系.(填“有”或“無”)有123456789101112131415167.下表是關于男嬰與女嬰出生時間調(diào)查的列聯(lián)表:
時間合計晚上白天男嬰45AB女嬰E35C合計98D180那么,A=____,B=____,C=____,D=____,E=____.479288825312345678910111213141516123456789101112131415168.某高?!敖y(tǒng)計初步”課程的教師隨機調(diào)查了選該課的一些學生的情況,具體數(shù)據(jù)如下表:性別專業(yè)合計非統(tǒng)計專業(yè)統(tǒng)計專業(yè)男131023女72027合計203050為了判斷主修統(tǒng)計專業(yè)是否與性別有關系,根據(jù)表中的數(shù)據(jù),得到χ2=
≈4.844,因為χ2>3.841,所以判定主修統(tǒng)計專業(yè)與性別有關系,那么這種判斷出錯的可能性最大為____.5%12345678910111213141516解析因為χ2>3.841=x0.05,所以依據(jù)小概率值α=0.05的獨立性檢驗,認為主修統(tǒng)計專業(yè)與性別有關,出錯的可能性最大為5%.123456789101112131415169.在某測試中,卷面滿分為100分,60分為及格,為了調(diào)查午休對本次測試前兩個月復習效果的影響,特對復習中進行午休和不進行午休的考生進行了測試成績的統(tǒng)計,數(shù)據(jù)如下表所示:分數(shù)段29~4041~5051~6061~7071~8081~9091~100午休考生人數(shù)23473021143114不午休考生人數(shù)175167153017312345678910111213141516(1)根據(jù)上述表格完成列聯(lián)表;
人數(shù)合計及格人數(shù)不及格人數(shù)午休
不午休
合計
12345678910111213141516解2×2列聯(lián)表如下表所示:
人數(shù)合計及格人數(shù)不及格人數(shù)午休80100180不午休65135200合計14523538012345678910111213141516(2)根據(jù)列聯(lián)表可以得出什么樣的結(jié)論?對今后的復習有什么指導意義?
人數(shù)合計及格人數(shù)不及格人數(shù)午休80100180不午休65135200合計14523538012345678910111213141516由P1>P2,可以粗略判斷午休與考生考試及格有關系,并且午休的及格率高,所以在以后的復習中考生應盡量適當午休,以保持最佳的學習狀態(tài).1234567891011121314151610.為了解某班學生喜愛打籃球是否與性別有關,對本班48人進行了問卷調(diào)查得到了如下的2×2列聯(lián)表:性別打籃球合計喜愛不喜愛男生
6
女生10
合計
48已知在全班48人中隨機抽取1人,抽到喜愛打籃球的學生的概率為
.(1)請將上面的2×2列聯(lián)表補充完整(不用寫計算過程);12345678910111213141516解列聯(lián)表補充如下:性別打籃球合計喜愛不喜愛男生22628女生101020合計32164812345678910111213141516(2)根據(jù)小概率值α=0.05的獨立性檢驗,能否據(jù)此推斷喜愛打籃球與性別有關?解零假設H0:喜愛打籃球與性別無關,根據(jù)小概率值α=0.05的獨立性檢驗,我們推斷H0不成立,即認為喜愛打籃球與性別有關.12345678910111213141516(3)現(xiàn)從女生中抽取2人進一步調(diào)查,設其中喜愛打籃球的女生人數(shù)為X,求X的分布列與均值.解喜愛打籃球的女生人數(shù)X的可能取值為0,1,2.故X的分布列為12345678910111213141516綜合運用11.(多選)下列關于回歸分析與獨立性檢驗的說法不正確的是A.回歸分析和獨立性檢驗沒有什么區(qū)別B.回歸分析是對兩個變量準確關系的分析,而獨立性檢驗是分析兩個變
量之間的不確定關系C.回歸分析研究兩個變量之間的相關關系,獨立性檢驗是對兩個變量是
否具有某種關系的一種檢驗D.獨立性檢驗可以100%確定兩個變量之間是否具有某種關系√√√解析由回歸分析及獨立性檢驗的特點知,選項C正確.1234567891011121314151612.在調(diào)查中發(fā)現(xiàn)480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列說法正確的是A.男人、女人中患色盲的頻率分別為0.038和0.006C.男人中患色盲的比例比女人中患色盲的比例大,可以認為患色盲與性
別是有關的D.調(diào)查人
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024至2030年中國數(shù)顯手動平面磨床行業(yè)投資前景及策略咨詢研究報告
- 2024至2030年中國定軸式動力換檔變速箱行業(yè)投資前景及策略咨詢研究報告
- 2024年中國無碳卷筒紙市場調(diào)查研究報告
- 2024年隨州客運從業(yè)資格證理論考試題
- 2024年赤峰道路旅客運輸知識考試題庫
- 2024年固原客運從業(yè)資格證仿真考試題庫
- 2024年毫州公交車從業(yè)資格證考試
- 新員工心得體會
- 紅領巾廣播站廣播稿11篇
- 揚州何園玉繡樓導游詞(21篇)
- 運營管理已完畢第七講庫存
- 巴歇爾槽構(gòu)造圖(附有CAD圖)
- 羅馬數(shù)字對照表
- 《口腔頜面部神經(jīng)》PPT課件.ppt
- 17電梯地坎標高確認表XLBG版本
- 2.2--金風1.5兆瓦風力發(fā)電機組測量傳感器與模塊
- 零星用工單(派工單)
- 關于初中英語學習的調(diào)查問卷
- 慢性阻塞性肺疾病臨床路徑
- 人身保險產(chǎn)品條款部分條目示范寫法規(guī)定
- CT的基本結(jié)構(gòu)和成像原理
評論
0/150
提交評論