2025年新高考數(shù)學(xué)復(fù)習(xí)壓軸題講義:概率與統(tǒng)計下的新定義(五大題型)_第1頁
2025年新高考數(shù)學(xué)復(fù)習(xí)壓軸題講義:概率與統(tǒng)計下的新定義(五大題型)_第2頁
2025年新高考數(shù)學(xué)復(fù)習(xí)壓軸題講義:概率與統(tǒng)計下的新定義(五大題型)_第3頁
2025年新高考數(shù)學(xué)復(fù)習(xí)壓軸題講義:概率與統(tǒng)計下的新定義(五大題型)_第4頁
2025年新高考數(shù)學(xué)復(fù)習(xí)壓軸題講義:概率與統(tǒng)計下的新定義(五大題型)_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

專題03概率與統(tǒng)計下的新定義

【題型歸納目錄】

題型一:二項式定理新定義

題型二:排列組合新定義

題型三:概率新定義

題型四:統(tǒng)計方法新定義

題型五:信息端問題

【方法技巧與總結(jié)】

解概率與統(tǒng)計下的新定義題,就是要細讀定義關(guān)鍵詞,理解本質(zhì)特征,適時轉(zhuǎn)化為“熟悉”問題.總

之,解決此類問題,取決于己有知識、技能、數(shù)學(xué)思想的掌握和基本活動經(jīng)驗的積累,還需要不斷的實踐

和反思,不然就談不上“自然”的、完整的解題.

【典型例題】

題型一:二項式定理新定義

【典例1-1】(2024?湖南衡陽?二模)莫比烏斯函數(shù)在數(shù)論中有著廣泛的應(yīng)用.所有大于1的正整數(shù)”都可以

被唯一表示為有限個質(zhì)數(shù)的乘積形式:九=可席…優(yōu)(左為”的質(zhì)因數(shù)個數(shù),P,為質(zhì)數(shù),

=例如:90=2X32X5>對應(yīng)1=3,R=2,%=3,2=5,==1,2=2,,=1.現(xiàn)對任意

l,n=l

〃eN*,定義莫比烏斯函數(shù)〃⑺=<(一球,4=4=,,,=〃=1

0,存在01

⑴求〃(78),〃075);

(2)若正整數(shù)%〉互質(zhì),證明:〃(孫)=〃(耳〃(耳;

⑶若〃>1且〃(〃)=1,記〃的所有真因數(shù)(除了1和"以外的因數(shù))依次為如出,…,4”,證明:

〃(《)+〃(出)+…+〃(%)=—2?

【解析】(1)因為78=2x3x13,易知左=3,0=2,p2=3,p3=13,z;=1,^=1,^=1,

所以〃(78)=(—1)3=—1;

又375=3x53,因為5的指數(shù)3>1,所以〃(375)=0;

⑵①若x=l或。=1,因為〃⑴=1,所以〃(孫)=

②若尤,ywi,且存在質(zhì)數(shù)。,使得x或y的質(zhì)因數(shù)分解中包含//(廠>1),則w的質(zhì)因數(shù)分解中一定也包含

p',

所以〃(孫)==°,

③若羽ywl,且不存在②中的P,可設(shè)x=“02…=…%,

其中P1,P2…口1,4"%…%均為質(zhì)數(shù),則?=P|P?…040…4,

因為尤,y互質(zhì),所以Pi,p『5""%…p互不相等,

所以M孫)=(一1戶=(T>(T)'=〃(*)〃(y),

綜上可知M盯)=〃(力〃3

(3)由于〃(")=1,所以可設(shè)“="。2…P”k為偶數(shù),

”的所有因數(shù),除了1之外都是R,P2,…,"中的若干個數(shù)的乘積,從%個質(zhì)數(shù)中任選《,=1,2,…,女)個數(shù)的

乘積一共有C;種結(jié)果,

所以〃⑴+〃(%)+4(%)+…+4(4)+〃(〃)

=〃(l)+[〃(Pl)+〃(〃)+…+〃(〃)]+[〃(。1。2)+〃(。2。3)+…+〃(PlPj]+…+〃(〃)

=I+C1(T)+C(T)2+…+優(yōu)(一1廣+(一以=(1一1)*=。,

所以…=O_"(l)_M(n)=—2.

【典例1-2】(2024.安徽合肥?一模)“4-數(shù)”在量子代數(shù)研究中發(fā)揮了重要作用.設(shè)q是非零實數(shù),對任意

〃cN*,定義“4-數(shù)”(嘰=1+4++/T利用“4-數(shù)”可定義“4-階乘"("/二⑴涅山(初,且(0兒=1.和

“4—組合數(shù)”,即對任意上eN,附eN*,kW力

⑴計算:

(2)證明:對于任意左,〃wN*,左+1?〃,

n+m+l\(〃\C

⑶證明:對于任意%,加£N,〃6N*,左+1<〃,

【解析】(1)由定義可知,

[5)=⑸!2⑴2⑵2⑶式4)2(5)2

【31一(3)!2(2)C[(1)2(2)2(3)2][(1)2(2)2]

_(4)式5)2_(1+2+22+23乂1+2+22+23+2,).⑶

⑴2⑵21X0+2))

(磯5)/(1/

(左)!“〃一女兒[k}\q{n-k)\q

n-1n-1n八5

+qk?q+?q

k-1k傳T)!“〃_女兒。兒("%T兒

qq

=(小

kklknkx

又(k)q+q\n-k)q=l+q++q~+q(\+q++q~~)

=l+q++/i=(心

所以m+1

(3)由定義得:

對任意keN,weN*,后

結(jié)合(2)可知

n+m+1n+m\n+m-kn+m

所以

z+1k+1k

qqq

n+m

\Jn+m-\\=,_Jn+m-1

k+1k

k+1[I)qI

上述加+i個等式兩邊分別相加得:

([n+%m+1+l\(n「孕工’Ink+i:\

【變式1-1](2024?高三.江蘇蘇州?階段練習(xí))甲、乙、丙三人以正四棱錐和正三棱柱為研究對象,設(shè)棱長為

”,若甲從其中一個底面邊長和高都為2的正四棱錐的5個頂點中隨機選取3個點構(gòu)成三角形,定義隨機變

量X的值為其三角形的面積;若乙從正四棱錐(和甲研究的四棱錐一樣)的8條棱中任取2條,定義隨機變量

4的值為這兩條棱的夾角大小(弧度制);若丙從正三棱柱的9條棱中任取2條,定義隨機變量”的值為這兩

條棱的夾角大小(弧度制).

(1)比較三種隨機變量的數(shù)學(xué)期望大??;(參考數(shù)據(jù)

arctan^5?0.3661,arctan?0.2677,arctan2^2?0.3918)

(2)現(xiàn)單獨研究棱長",記(x+l)x(x+gjx+且〃eN*),其展開式中含x項的系數(shù)為S“,含

f項的系數(shù)為T”.

①若*a/+b"+c,對"=2,3,4成立,求實數(shù)b,c的值;

②對①中的實數(shù)。,b,c用數(shù)字歸納法證明:對任意〃22且“eN*,3=M2+加+。都成立.

【解析】(1)如圖所示:

由題意設(shè)。/為正四棱錐。-ABCE的高,G為A3中點,

由于正四棱錐的底面邊長和高都是2,

所以AC=BE=2&,£>B=2,所以=

由對稱性以及三線合一可知DG=后斤=V5,

若甲從其中一個底面邊長和高都為2的正四棱錐的5個頂點中隨機選取3個點構(gòu)成三角形,

則X的所有可能取值為]x2x2=2,x2x岔=6,x2&x2=2近,

222

且P(X=2)="=|,尸(X=2碼=,.中=&)=卷=|,

所以個)=(>2+“應(yīng)+|x如=4+22+2占>4+2X;+2X2=2,

若乙從正四棱錐(和甲研究的四棱錐一樣)的8條棱中任取2條,

則4的所有可能取值為"I,。,arctan君,arctan]g,arctan272,

廠/八714c22

E<)=—x-----i-Ox-----1-arctan一+arctan2^2x

v7228282828

代入?yún)⒖紨?shù)據(jù)arctan#i?0.3661,arctanX0.2677,arctan2V2?0.3918,得1.0890,

M

若丙從正三棱柱的9條棱中任取2條,

則力的所有可能取值為1TT*TT0,

兀187112c613KY……

磯〃)=—x-----1——x-----FOX——=——?1.1345

2363363636

所以E(X)>磯叼〉E?.

(2)①因為(x+l)x[x+g]xx[x+)]中x項的系數(shù)為S",

一般地,從(x+l)x(x+;卜x[x+:]中的第七個因式中取一個x,其余因式中取常數(shù)即可得到一個x

項,

知在k1+2++nn(n+1)

而這一項的系數(shù)為一;,S=---------------=———-)

n\nn\2-nl

因為(尤+l)x(x+g)x+中f項的系數(shù)為T“,

一般地,從(x+l)x[x+g]xx[x+:]中的第個因式中各取一個x,其余因式中取常數(shù)即可得到

一個/項,

,,]

而這一項的系數(shù)為之,從而Eij,

n\^\<i<j<n

2x333x44x55

從而S==1,S4=

22x2!22x3!2x4!"12?

旦1X2+1X3+2X3JIx2+lx3+lx4+2x3+2x4+3x435

22!33!644!"24

4a+2b+c=—=—

S23

由題意中+3"W解得“4,八-5c=J

16a+4b+c=—=—

邑2

—T,3ra2-n-2+Z

②用數(shù)學(xué)歸納法證明:“22且〃eN*時,-^=an2+bn+c=---=~卷——

7^__j__2_

--

當〃=2時,s233-4126,故結(jié)論對〃=2成立,

2

假設(shè)結(jié)論對n=k22,keN*成立,即今=合爐=(1譬+2),

、k1/iz

k\Tk/x

幾I+_%!看+信+1)(1+2++%)_人工+化+1"!&_聽+1+)

IJI11=----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

加優(yōu)+1)!加(左+1)!%45+優(yōu)+1)1+A±1

黑+化+1)--1)"+2)+%+1

k+i-_

i+---------------i+—

1+2+…+左k

_("0(3左+2)+12左+12_3/+11)+10_信+2乂3左+5)

[(A+1)-1工3(左+1)+2]

12

所以結(jié)論對〃=左+1也成立,

故?=?!?+bw+c=^---------------,對任意"22,”eN”成立.

S.12

題型二:排列組合新定義

【典例2-1】(2024.高三.北京.階段練習(xí))設(shè)"為正整數(shù),集合A={a|a=外,*{01},左=1,2,,n.

對于集合A中的任意元素£=(玉,々,…,%)和分=定義

1(%月)=|%一乂|+卜一對++\xn-yn\-

⑴當”=4時,若以=(0,1,0,1),若=(1,1,0,1),直接寫出所有使d(a,7)=2,d(Q,7)=3同時成立的A的元素

⑵當〃=3時,設(shè)3是A的子集,且滿足:對于3中的任意兩個不同元素a,回北%夕)22.求集合3中元素

個數(shù)的最大值;

⑶給定不小于2的“,設(shè)8是A的子集,且滿足:對于3中的任意兩個不同的元素以£,〃(0,022,寫出

一個集合8,使其元素個數(shù)最多,并說明理由.

【解析】⑴?.?=(0,l,0,l),J(a,y)=2

???滿足條件的/有

a0101

Y0000

ye{(0,0,0,。),(0,0,1,1),(0,1,1,0)}(2)列出集合4的元素

000

001

010

011

100

101

110

111

B是A的子集,且滿足:對于B中的任意兩個不同元素a,p,d(a,£巨2

滿足條件的集合8的元素的個數(shù)的最大值為4.

001

010

100

111

(3).d(a,夕巨2

???8中的元素應(yīng)該含有奇數(shù)個1

若"=2,則含有奇數(shù)個1的元素有C;=2個;

若n=3,則含有奇數(shù)個1的元素有1+優(yōu)=4個;

若n=4,則含有奇數(shù)個1的元素有《+優(yōu)=8個;

若"=5,則含有奇數(shù)個1的元素有《+《+雋=16個;

當〃=3時,B={(0,0,1),(0,1,0),(1,0,0),(1,1,1))

【典例2-2】(2024?高三?浙江?開學(xué)考試)一般地,〃元有序?qū)崝?shù)對(%,%,,、耳)稱為“維向量.對于兩個〃維

向量。=(4,出,,%),6=(4也,也),定義:兩點間距離d=J(4-aJ?+色一的J+…+(X-%利用

“維向量的運算可以解決許多統(tǒng)計學(xué)問題.其中,依據(jù)“距離”分類是一種常用的分類方法:計算向量與每個

標準點的距離4,,與哪個標準點的距離4最近就歸為哪類.某公司對應(yīng)聘員工的不同方面能力進行測試,

得到業(yè)務(wù)能力分值(卬)、管理能力分值(%)、計算機能力分值(%)、溝通能力分值(%)(分值

%eN*,^e{l,2,3,4}代表要求度,l分最低,5分最高)并形成測試報告.不同崗位的具體要求見下表:

業(yè)務(wù)能力分值管理能力分值計算機能力分值溝通能力分值合計分

崗位

(4)(%)3)(%)值

會計⑴215412

業(yè)務(wù)員

523515

后勤⑶235313

管理員

454417

(4)

對應(yīng)聘者的能力報告進行四維距離計算,可得到其最適合的崗位.設(shè)四種能力分值分別對應(yīng)四維向量

"=的四個坐標.

(1)將這四個崗位合計分值從小到大排列得到一組數(shù)據(jù),直接寫出這組數(shù)據(jù)的第三四分位數(shù);

(2)小剛與小明到該公司應(yīng)聘,已知:只有四個崗位的擬合距離的平方力均小于20的應(yīng)聘者才能被招錄.

⑴小剛測試報告上的四種能力分值為4=(4,3,2,5),將這組數(shù)據(jù)看成四維向量中的一個點,將四種職業(yè)

123、4的分值要求看成樣本點,分析小剛最適合哪個崗位;

(ii)小明已經(jīng)被該公司招錄,其測試報告經(jīng)公司計算得到四種職業(yè)1、2、3、4的推薦率(0分別為

而14石13石9‘熱7(?"行"試d2求小明]的各項能力分信

【解析】⑴將四個崗位合計分值從小到大排列得到數(shù)據(jù)12,13,15,17,

又,="0=4x0.75=3,所以這組數(shù)據(jù)的第三四分位數(shù)為號2=16.

(2)⑴由圖表知,會計崗位的樣本點為4=(2』,5,4),則葉=(2-4)2+(1-3)2+(5-2)2+(4-5)2=18,

業(yè)務(wù)員崗位的樣本點為分=(5,2,3,5),則d;=(5-4>+(2-3>+(3-2)2+(5-5)2=3,

后勤崗位的樣本點為鳳=(2,3,5,3),則d;=(2-4>+(3-3>+(5-2f+(3-=17,

管理員崗位的樣本點為力,=(4,5,4,4),則/=(4-4)2+(5-3)2+(4-2>+(4-5)2=9,

所以&<&<&<4,故小剛最適合業(yè)務(wù)員崗位.

?四種職業(yè)1234的推薦率⑺分別為m,。且。"力+小?廠

力14

,

14T幺+++

d;+d;+d;+d:43-

43

d;_1341332逍4

=一I+++

+d;++d;4343

9

所以■j2,得到

一d&

dl9-+++

d;+d;+d;+d:4343

7

4T成d2*

d;_7-++3+

d;+d;+d;+d;4343

又d:(ne{1,2,3,4})均小于20,所以#+召+存+或<80,且/eN*(海{1,2,3,4}),

故可得到片=14,以=13,據(jù)=9,或=7,

設(shè)小明業(yè)務(wù)能力分值、管理能力分值、計算機能力分值、溝通能力分值分別為a,》,Gd,且a,b,c,deN*,

l<a,b,c.d<5,

依題有(〃-2)2+(b—I)?+(c-5)2+(d-4)2=d;=14①,

(a-5)2+(b-2)2+(c-3)2+(d-5)2=dl=13(2),

(a-2y+S-3y+(c-5y+(d-3>=d;=9③,

(a—4/+S—5)2+(c—4/+(d—4)2=d:=7④,

由①一③得,

(a-2)2+(Z?-1)2+(c-5)2+(rf-4)2-[(a-2)2+(b-3)2+(c-5)2+(^-3)2]=14-9=5,

整理得:2b—d=3,

b=2,d=l

故有<0=3,d=3三組正整數(shù)解,

b=4,d=5

對于第一組解,代入④式有(a-4)2+9+(c-4)2+9=7,不成立;

對于第二組解,代入①式有(。-2)2+(c-5)2=4,

缶=4[a—1

解得「或。,代入②④式均不成立;

[c=51c=3

對于第三組解,代入②式有5-5)2+(c-3)2=9,

4=2

\a=1…………b=4

解得,,代入①②③④均成立,故,;

[c=3c=3

d=5

故小明業(yè)務(wù)能力分值、管理能力分值、計算機能力分值、溝通能力分值分別為2,4,3,5.

題型三:概率新定義

【典例3-1】(2024?浙江?一模)混管病毒檢測是應(yīng)對單管病毒檢測效率低下的問題,出現(xiàn)的一個創(chuàng)新病毒檢

測策略,混管檢測結(jié)果為陰性,則參與該混管檢測的所有人均為陰性,混管檢測結(jié)果為陽性,則參與該混

管檢測的人中至少有一人為陽性.假設(shè)一組樣本有N個人,每個人患病毒的概率相互獨立且均為

目前,我們采用K人混管病毒檢測,定義成本函數(shù)/(Xjut+XX,這里X指該組樣本N

個人中患病毒的人數(shù).

⑴證明:E[〃X)]Z2JF.N;

(2)若OvpvlOr104KW20.證明:某混管檢測結(jié)果為陽性,則參與該混管檢測的人中大概率恰有一人

為陽性.

【解析】⑴由題意可得X滿足二項分布XB(N,p),

由E(aX+6)=aE(X)+。知,E\_f(X)l=—+K-E(X)=—+K-pN>2^-N,當且僅當,=&時取等

KKK

號;

(2)記A=p(混管中恰有1例陽性|混管檢測結(jié)果為陽性),

4=p(混管中恰有i例陽性尸C,KP’(1一p廣,i=0,1,,K,

令/z(x)=e-_2/]0-3<彳<2乂]0-3,

則=

當xe(-2xl(F3,0)時,/z(x)為單調(diào)遞減,

當xe(0,2x10-3)時,〃")>o,為單調(diào)遞增,所以〃(x)N〃(O)=O,

2xlo-3-32xl-3

且〃(-2x10-3)=e--(-2xlO^-l-O,/z(2xl0)=e°-(2x10^)-1~0,

所以當—2xl(f3<x<2xl(f3,e,-尤—IBO即e,~x+l,兩邊取自然對數(shù)可得%句110+1),

所以當0<P<1()Y,10WKV20時,

所以(1_?>=6.。切?e7Kp?1—Kp,

4_"(1-廣&[1-伍一1)同

貝”=

i-]-(1-域Kp

故某混管檢測結(jié)果為陽性,則參與該混管檢測的人中大概率恰有一人為陽性.

【典例3-2】(2024?遼寧?模擬預(yù)測)條件概率與條件期望是現(xiàn)代概率體系中的重要概念.近年來,隨著人們對

隨機現(xiàn)象的不斷觀察和研究,條件概率和條件期望已經(jīng)被廣泛的利用到日常生產(chǎn)生活中.定義:設(shè)X,Y是

離散型隨機變量,則X在給定事件丫=》條件下的期望為

P(X=x^Y=y}(、

E(XW=y)=,P(X=尤/y=y)=>再■l',其中{4%,…,當}為X的所有可能取值集合,

i=li=lrv-y)

p(X=x,y=y)表示事件“x=x”與事件“Y=y”都發(fā)生的概率.某射擊手進行射擊訓(xùn)練,每次射擊擊中目

標的概率均為p(0<〃<l),射擊進行到擊中目標兩次時停止.設(shè)J表示第一次擊中目標時的射擊次數(shù),"表

示第二次擊中目標時的射擊次數(shù).

⑴求尸仁=2,〃=5),尸(〃=5);

(2)求E(的=5),22).

【解析】(1)由題設(shè),P值=2,〃=5)=(1—。>,(1一。>(1—。)/=(1一。)3/,

尸何=5)=C(1一。只/=縱1一pFp2.

(2)由題設(shè),夙目〃=5)=1[%><?(J=x,,〃=5)

i=l尸(〃=5)

P(〃=5)4442

同(1),PS=n)=2P2=(n_1)(1_pr-2p2,P(Ji〃=")=(i_pyTp2,

x

3尸(《,〃=〃)12n-25T廠l+D

所以項目"")?印〉P(L)^^+百+…+”產(chǎn)

22

【變式3-1](2024.福建漳州.一模)在數(shù)字通信中,信號是由數(shù)字。和1組成的序列,發(fā)送每個信號數(shù)字之間

相互獨立.由于隨機因素的干擾,發(fā)送的信號0或1有可能被錯誤地接收為1或0.

⑴記發(fā)送信號變量為x,接收信號變量為「且滿足P(X=O)=;,p(y=i|x=o)=|,

p(y=0|X=l)=|,求尸(y=0);

an

(2)當發(fā)送信號0時,接收為0的概率為J,定義隨機變量7的“有效值”為“(〃)=-=x,)lgP(〃=x;)

4z=i

(其中天是〃的所有可能的取值,,=1,2,…發(fā)送信號“000”的接收信號為“%力%”,記4為%,%,%

三個數(shù)字之和,求4的“有效值”.(1g3?0.48,1g2?0.30)

i2

【解析】⑴由題意可知:p(x=i)=i-p(x=0)=-,p(y=oix=o)=i-p(y=i|x=o)=-,

所以尸(y=o)=尸(y=0|X=0)尸(x=o)+尸(y=0|X=l)尸(X=l)=gx:+;x;=H

(2)由題意可知:當發(fā)送信號0時,接收為0的概率為3:,接收為1的概率為1:,

44

可知:4的可能取值有0,1,2,3,

則尸("°)=03=葛尸(9)=叫

…心盜[吟吟3)二審$,

—小片山—+〃/八(27、2727.279.9

'/16464646464646464)

54QA-|45

=——(31g3-61g2)+—(21g3-61g2)-—1g2=——-Ig3+61g2

_o4o4o4Jlo

45

?——x0.48+6x0.30=0.45,

16

即J的“有效值”約為0.45.

題型四:統(tǒng)計方法新定義

【典例4-1](2024?全國?模擬預(yù)測)某校20名學(xué)生的數(shù)學(xué)成績%0=1,2,.,,20)和知識競賽成績%。=1,2,,20)

如下表:

學(xué)生編號i12345678910

數(shù)學(xué)成績W100999693908885838077

知識競賽成績B29016022020065709010060270

學(xué)生編號i11121314151617181920

數(shù)學(xué)成績X,75747270686660503935

知識競賽成績%4535405025302015105

20

計算可得數(shù)學(xué)成績的平均值是元=75,知識競賽成績的平均值是9=90,并且元)丁6464

Z=1

2020

£(X-J)2=149450,£(x,.-x)(y,-y)=21650.

上1Z=1

(1)求這組學(xué)生的數(shù)學(xué)成績和知識競賽成績的樣本相關(guān)系數(shù)(精確到0.01).

(2)設(shè)NeN*,變量x和變量丁的一組樣本數(shù)據(jù)為{(%,?)1,=1,2,,,N},其中x,(i=l,2,,N)兩兩不相同,

%(i=l,2,,N)兩兩不相同.記尤,在卜|“=1,2,,N}中的排名是第4位,%在舊舊=1,2,,N}中的排

名是第S,位,1=1,2,,N.定義變量x和變量y的“斯皮爾曼相關(guān)系數(shù),,(記為夕)為變量x的排名和變量y的

排名的樣本相關(guān)系數(shù).

6N

⑴記4=4f,i=i,2,,N.證明:N(N?一余與.

(ii)用⑴的公式求這組學(xué)生的數(shù)學(xué)成績和知識競賽成績的“斯皮爾曼相關(guān)系數(shù)”(精確到0。1).

(3)比較(1)和(2)(ii)的計算結(jié)果,簡述“斯皮爾曼相關(guān)系數(shù)”在分析線性相關(guān)性時的優(yōu)勢.

ZU-元n

i=ln(n+l)(2n+l)

注:參考公式與參考數(shù)據(jù).;ILK=;76464x149450?31000.

£(^-^)2£(x-y)2k=l6

/=1Z=1

【解析】(1)

由題意,這組學(xué)生數(shù)學(xué)成績和知識競賽成績的樣本相關(guān)系數(shù)為

20

Z&-元)(y-9)

2165021650…

i=l?--------?0.70

2020

£(x..-x)2£(x-y)276464x1495031000

i=li=l

(2)⑴證明:因為{4}和{Sj都是1,2,LN的一個排列,所以

fN44Ns,.=N(N+1)

Z=1Z=12

NNN(N+1)(2N+1)

=£s;=

1=11=16

N+l

從而{?}和{S}的平均數(shù)都是R=S=2

NQNNNN2N(N+1)(2N+1)N(N+1yN(N+1)(N-1)

因此,f(K-R)=£&-2應(yīng)史=^R;-NR

i=lZ=1?=1Z=16412

N_

2N(N+1)(N-1)

同理可得E(s,-?y=

Z=112

NcN

NNcR,_R)_(S「用2

由于fd;本(R「s)-==2(兄-R)+2(E-s可-2t(6-Q(s,「子)

1=1Z=1Z=1i=\?=1

N

一2±(4一用母一目,

12i=l

NWV+IXN-l)」0

-司(E-于)

126lNx;

i=l2日—i_

所以夕二=(

N(N+1)(N—1)NN2-1)Z=1

12

(ii)由題目數(shù)據(jù),可寫出與與S,的值如下:

同學(xué)編號i12345678910

數(shù)學(xué)成績排名%12345678910

知識競賽成績排名S/p>

同學(xué)編號i11121314151617181920

數(shù)學(xué)成績排名&11121314151617181920

知識競賽成績排名S,12141311161517181920

N

所以N=20,并且£力=9xO2+4xl2+3x22+2x32+lx42+lx82=114.

i=l

因此這組學(xué)生的數(shù)學(xué)成績和知識競賽成績的斯皮爾曼相關(guān)系數(shù)是

p=\——7—-~~X114~O.91

20(202-1)7

(3)答案①:斯皮爾曼相關(guān)系數(shù)對于異常值不太敏感,如果數(shù)據(jù)中有明顯的異常值,那么用斯皮爾曼相關(guān)系

數(shù)比用樣本相關(guān)系數(shù)更能刻畫某種線性關(guān)系;

答案②:斯皮爾曼相關(guān)系數(shù)刻畫的是樣本數(shù)據(jù)排名的樣本相關(guān)系數(shù),與具體的數(shù)值無關(guān),只與排名有

關(guān).如果一組數(shù)據(jù)有異常值,但排名依然符合一定的線性關(guān)系,則可以采用斯皮爾曼相關(guān)系數(shù)刻畫線性關(guān)

系.

【典例4-2】(2024?全國?模擬預(yù)測)冰雪運動是深受學(xué)生喜愛的一項戶外運動,為了研究性別與學(xué)生是否喜

愛冰雪運動之間的關(guān)系,從某高校男、女生中各隨機抽取100名進行問卷調(diào)查,得到如下列聯(lián)表

(m<40,/7/eN).

喜愛不喜愛

男生80-m20+m

女生60+m40-m

(1)當相=0時,從樣本中不喜愛冰雪運動的學(xué)生中,按性別采用分層抽樣的方法抽取6人,再從這6人中

隨機抽取3人調(diào)研不喜愛的原因,記這3人中女生的人數(shù)為求4的分布列與數(shù)學(xué)期望.

(2淀義/=Z(%一%)(2ViV3,2V其中%為列聯(lián)表中第i行第,列的實際數(shù)據(jù),如

%

為列聯(lián)表中第i行與第?;列的總頻率之積再乘以列聯(lián)表的總額數(shù)得到的理論頻數(shù),如4.2=8。-",

功,2=黑乂黑x200=70.基于小概率值a的檢驗規(guī)則:首先提出零假設(shè)變量X,F相互獨立),然后

計算六的值,當K?、五時,我們推斷“0不成立,即認為X和y不獨立,該推斷犯錯誤的概率不超過a;

否則,我們沒有充分證據(jù)推斷“。不成立,可以認為X和y獨立.根據(jù)K2的計算公式,求解下面問題:

①當機=0時,依據(jù)小概率值1=0.005的獨立性檢驗,分析性別與是否喜愛冰雪運動有關(guān)?

②當機<10時,依據(jù)小概率值&=0.1的獨立性檢驗,若認為性別與是否喜愛冰雪運動有關(guān),則至少有多少

名男生喜愛冰雪運動?

附:

a0.10.0250.005

Xa2.7065.0247.879

【解析】(1)當m=0時,用分層抽樣的方法抽取的不喜愛冰雪運動的6人中,男生有2人,女生有4人,

由題意可知,J的可能取值為1,2,3.

「2cl3

2信=1)=罟.1,%=2)=罟=|3,P(1)=罟c°C1

(2)①零假設(shè)為H。:性別與是否喜愛冰雪運動獨立,即性別與是否喜愛冰雪運動無關(guān)聯(lián).

當m=0時,42=80,B22=70,43=20,B23=0.5x0.3x200=30,

A32=60,B32=0.5x0.7x200=70,A33=40,B33=0.5x0.3x200=30,

(4,2一區(qū)2,2)+(4,3-82,3)+(4,2-員,2)+(&3-四,3)

K2=

°2,243員2B33

22

(80—70)2(20—30)2(60-70)(40-30)200八…

=-----x9.524?

70-3070-3021

9.524>7.879=x0005,

,根據(jù)小概率值。=0.005的獨立性檢驗,我們推斷“。不成立,即認為性別與是否喜愛冰雪運動有關(guān)聯(lián),

此推斷犯錯誤的概率不超過0.005.

②如_(80一機―70『+.(J+機—30)2+(60+機一70)2+(40-m-30)2_2(10-m)2

'—70307030—21

由題意可知,>2,706,整理得(10-帆)2228.413.

又m<10,m<4,加的最大值為4.

X80-4=76,,至少有76名男生喜愛冰雪運動.

【變式3(2024.高三北京.期末)在測試中‘客觀題難度的計算公式為月吟,其中為第i題的難度,

(2)從抽樣的20名學(xué)生中隨機抽取2名學(xué)生,記這2名學(xué)生中第5題答對的人數(shù)為X,求X的分布列和數(shù)

學(xué)期望;

⑶定義統(tǒng)計量5=匕(尸;-6)2+(只-£)2++(尸;-月,溝,其中P'為第i題的實測難度,耳為第i題的預(yù)估難度

n1

。=1,2,,〃).規(guī)定:若S<Q05,則稱該次測試的難度預(yù)估合理,否則為不合理.判斷本次測試的難度預(yù)

估是否合理.

【解析】(1)因為20人中答對第5題的人數(shù)為4人,因此第5題的實測難度為4=0.2,

所以估計240人中有240x0.2=48人實測答對第5題.

(2)X的可能取值是0,1,2.

C1C132C23

p(X=l)=^A=2_.P(X=2)=W=3

C;o9595

⑶第1題的實測難度為*0.8,同理可得:第2題的實測難度為*0.8,

1414

第3題的實測難度為三二0.7,第4題的實測難度為三二0.7,第5題的實測難度為0.2,

故S=J(0.8-0.9)2+(0.8-0.8)2+(0.7-0.7)2+(0.7-0.6)2+(0.2-0.4)2]=0,012.

因為5=0.012<0.05,

所以,該次測試的難度預(yù)估是合理的.

題型五:信息燧問題

【典例5-1】(2024.高三.河北?階段練習(xí))信息燧是信息論之父香農(nóng)(S/2G"[o〃)定義的一個重要概念,香農(nóng)在

1948年發(fā)表的論文《通信的數(shù)學(xué)理論》中指出,任何信息都存在冗余,把信息中排除了冗余后的平均信息

量稱為“信息蠟”,并給出了計算信息嫡的數(shù)學(xué)表達式:設(shè)隨機變量X所有可能的取值為1,2,,n(neN*),

且尸(X=i)=p,>0(』,2,-,*£p,=1,定義X的信息嫡H(X)=-J>JogzP,.

i=li=l

(1)當”=1時,計算a(x);

⑵若口J(i=l,2,.判斷并證明當〃增大時,"(X)的變化趨勢;

n

(3)若"=2〃M"[eN*),隨機變量¥所有可能的取值為1,2.加,且尸(¥=/)=0+。2,=1,2,,m),證

明:H(x)>H(r).

【解析】⑴當〃=1時,則i=l,R=l,所以〃(X)=_(lxlog21)=0

⑵”(X)隨著"的增大而增大.

當口=1,2,㈤,則H(X)=-(L]og2qx〃=_k>g2,=log2",

n\nnJn

設(shè)/⑺=log2〃,〃£N*,則/(n+l)-/(n)=log2(n+l)-log2n=log2^l>0,

n

因此a(X)隨著n的增大而增大.

(3)證明:若九=2m(meN*),隨機變量y所有可能的取值為1,2,,根,且

P(y=力=Pj+P2m+l-jU=1,2,,m).

2m2mi

“(X)=-£p,?1唯Pi=£P(guān),」題2—

z=li=lPi

i1i1i1i1

+

=Pl.l°g2—+夕2.l°g2—++P2fn-1?l°g2----P21n,---.

PlPlPlm-XPim

]

HK

()=(A+P2nl).l°g2---+(0+必m-1).l°g2---------++(P"+Pm+i>bg2

+

A+PirnP”P2mTP,nPm+1

因為0<P,+P2,“+iT<l(i=l,2m),故l°g2丁一---->0

Pi十Plm+l-i

故H(y)>P「l°g2---+。2.10g2---------+-+必m-1.l°g2---------+Pzjlogz-'—

Pl+P2,nPl+Plm-lPl+Plm-XP/Pl"

/、11八

由于p,,0(i=l,2,,2m),所以一>二------>0,

PiPi+Plm+\-i

,1,1,11

所以l°g2—>logo----------,所以P,Tog?一〉p,?log?----------,

++

PiPiP2,n+l-iPiPiPlm+X-i

所以刀(x)>H(y).

【典例5-2】(2024?高三?河北?期末)在信息論中,崎(entropy)是接收的每條消息中包含的信息的平均量,又

被稱為信息燧、信源嫡、平均自信息量.這里,“消息”代表來自分布或數(shù)據(jù)流中的事件、樣本或特征.(嫡最好理

解為不確定性的量度而不是確定性的量度,因為越隨機的信源

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論