應(yīng)用多元統(tǒng)計(jì)分析課后標(biāo)準(zhǔn)答案_第1頁
應(yīng)用多元統(tǒng)計(jì)分析課后標(biāo)準(zhǔn)答案_第2頁
應(yīng)用多元統(tǒng)計(jì)分析課后標(biāo)準(zhǔn)答案_第3頁
應(yīng)用多元統(tǒng)計(jì)分析課后標(biāo)準(zhǔn)答案_第4頁
應(yīng)用多元統(tǒng)計(jì)分析課后標(biāo)準(zhǔn)答案_第5頁
已閱讀5頁,還剩67頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

AA----izi.

弟一早

2.1.試敘述多元聯(lián)合分布和邊際分布之間的關(guān)系。

解:多元聯(lián)合分布討論多個(gè)隨機(jī)變量聯(lián)合到一起的概率分布狀況,X=(X,,X2,.X。)'的聯(lián)

合分布密度函數(shù)是一個(gè)P維的函數(shù),而邊際分布討論是X=(X],X2,XQ'的子向量的概

率分布,其概率密度函數(shù)的維數(shù)小于p?

2.2設(shè)二維隨機(jī)向量(X1X2)'服從二元正態(tài)分布,寫出其聯(lián)合分布。

解:設(shè)(X|X2)'的均值向量為p=(從〃2)',協(xié)方差矩陣為巧巧;,則其聯(lián)合

分布密度函數(shù)為

2.3已知隨機(jī)向量(X1X2)'的聯(lián)合密度函數(shù)為

21(d-C)(X]-a)+(h——c)—2(Xj—。)(無2—c)]

/UpX)

2s—a)2(d—c)2

其中aV%<b,c4%2V〃。求

(1)隨機(jī)變量X1和X2的邊緣密度函數(shù)、均值和方差;

⑵隨機(jī)變量X,和x2的協(xié)方差和相關(guān)系數(shù);

(3)判斷X1和X?是否相互獨(dú)立。

(1)解:隨機(jī)變量X,和X]的邊緣密度函數(shù)、均值和方差;

fzx_fJ2[((7—c)(Xj—a)+(b-a)(x—c)—2(x)-a)(x—c)]

U1)=22

Jc(h-a)\d-c)2

2(d-c)(X—a)/2[(〃-a)(x2-c)-2(%j-a)(x2-c)]

(b-a)2(d-c)2(b-a)2(d-c)2

d出

2(d-c)(x{-a)x2+r-。2[(b—a)t—2(x,—a)t}

2+22

(b-a)\d-c)cJ0-(b-a)(d-c)""

22

2(d—c)(x”[(b-a)t-2(x}-d)t]"'_1

2+22

(b-a)\d-c)c(b-a)(d-c)0b-a

所以

由于X|服從均勻分布,則均值為皆,方差為

同理,由于X?服從均勻分布兒(毛)=<1^內(nèi)e[c,d],則均值為竺£,

0其它2

方差為

12

(2)解:隨機(jī)變量X,和X?的協(xié)方差和相關(guān)系數(shù);

COV(Xj,x2)

2[(J-0)(玉一a)+S—a)(x-c)-2(%—a)(x一c)]

22dX'dx?

(b—ci)2(t/—c)2

(c-d)(b-a)

36

_COV(Xp^)_1

aa3

x\-*2

(3)解:判斷X1和X?是否相互獨(dú)立。

Xi和X2由于f(xt,x2)*4(x))4(x2),所以不獨(dú)立。

2.4設(shè)X=(X],X2,X,,)'服從正態(tài)分布,已知其協(xié)方差矩陣X為對(duì)角陣,證明其分量是

相互獨(dú)立的隨機(jī)變量。

解:因?yàn)閄=(X],X2,.X。)'的密度函數(shù)為

1

0

1

一;(X-N)TT7

(X-M

1

1(七一勺尸

%)'exp<_J_匆-〃1)-_j(工2一〃3)-—---------------->

2of2cr;2可j

山山exp卜號(hào)+/(%).??"

則其分量是相互獨(dú)立。

2.5由于多元正態(tài)分布的數(shù)學(xué)期望向量和均方差矩陣的極大似然分別為

"201588000.0038900.0083722500.00-736800.00'

38900.0013.06716710.00-35.80

V乙—一

83722500.0016710.0036573750.00-199875.00

、-736800.00-35.800-199875.0016695.10,

10

—1

注:利用X=-X'i,其中/,,=

px[nnn

01

在SPSS中求樣本均值向量的操作步驟如下:

1.選擇菜單項(xiàng)Ana1yze-*DescriptiveStatistics-*Descriptives,打開Descrip

tives對(duì)話框。將待估計(jì)的四個(gè)變量移入右邊的Variables列表框中,如圖2.1。

圖2.1Descriptives對(duì)話框

2.單擊Options按鈕,打開Options子對(duì)話框。

在對(duì)話框中選擇Mean復(fù)選框,即計(jì)算樣本均值向量,如圖2.2所示。單擊Continue

按鈕返回主對(duì)話框。

圖2.20ptions子對(duì)話框

3.單擊OK按鈕,執(zhí)行操作。則在結(jié)果輸出窗口中給出樣本均值向量,如表2.1,即樣

本均值向量為(35.3333,12.3333,17.1667,1.5250E2).

描述統(tǒng)計(jì)里

N均值

X1635650.0000

x2612.3333

x3617325.0000

x46152.5000

有效的N(列表狀態(tài))6

表2.1樣本均值向量

在SPSS中計(jì)算樣本協(xié)差陣的步驟如下:

1.選擇菜單項(xiàng)Analyze->Corre1ate-*Bivariate,打

開BivariateCorrelations對(duì)話框。將三個(gè)變量移入右邊的Variab1es

列表框中,如圖2.3。

圖2.3BivariateCorre1ations對(duì)話框

2.單擊Options按鈕,打開Options子對(duì)話框。選

擇Cross-productdeviationsandcovariances復(fù)選框,即計(jì)算樣本離差陣

和樣本協(xié)差陣,如圖2.4。單擊Continue按鈕,返回主對(duì)話框。

圖2.4Options子對(duì)話框

3.單擊OK按鈕,執(zhí)行操作。則在結(jié)果輸出窗口中給

出相關(guān)分析表,見表2.2。表中Covariance給出樣本協(xié)差陣。(另外,PearsonC

orrelation為皮爾遜相關(guān)系數(shù)矩陣,SumofSquaresandCross-produ

cts為樣本離差陣。)

相關(guān)性

XIx2x3x4

x1Pearson相關(guān)性1.758.975”-.402

顯著性(雙惻).081.001.430

平方與叉程的和1.008E9194500.0004.186E8-3684000.000

協(xié)方差2.016E838900.0008.372E7-736800.000

N6666

x2Pearson相關(guān)隹.7581.764-.077

顯著性(雙惻).081.077.885

平方與叉租的和194500.00065.33383550.000-179.000

協(xié)方差38900.00013.06716710.000-35.800

N6666

x3Pearson相關(guān)性.975-7641-.256

顯著性(雙側(cè)).001.077.625

平方與叉租的和4186E883550.0001.829E8-999375.000

協(xié)方差8.372E716710.0003.657E7-199875.000

N6666

x4Pearson相關(guān)性-.402-.077-.2561

顯著性(蟻惻).430,885.625

平方與叉程的和-3684000.000-179.000-999375.00083475.500

協(xié)方差?736800.000-35.800?199875.00016695.100

N6666

2.6漸近無偏性、有效性和一致性;

2.7設(shè)總體服從正態(tài)分布,X?有樣本XyXz,…,由于又是相互獨(dú)立的正

態(tài)分布隨機(jī)向量之和,所以及也服從正態(tài)分布。又

£(x)=£|Xx,.n〉Un=

k/=!

〃i=lHi=l〃

所以X?N〃(內(nèi)X)。

2.8方法1:七二一1-^^*,-*)△,.—*)'

1fl____

方雙

E(E)=,E(YX,.X;-〃雙)

〃一1片

^^E(X,.X;)-nE(XX9

1〃y1

Y^-n-(n—1)E=Lo

n-1白nn-1

方法2:S=t(X廠及)(X,」X)'

i=l

Z[X,-N一(X—N)][Xj叩一(X-R)]

I=I

,

=£(X「N)(X,r)'—2£(X,.-H)(X-fi)+n(X-n)(X|i-如y

i=li=\

=S(X,.-|1)(X「H)'-2〃(玄-必玄-n)z+n(X-|i)(X—>

i=\

=Z(X/g(x,r)'-〃(火-Ji)區(qū)-N'

i=l

喈十士晦(x,r)(x-H(j"),

二2度E區(qū)-M(X,-_N(又_N)''E。

故二一為£的無偏估計(jì)。

n-1

2.9.設(shè)X(?X⑵,...,X(“)是從多元正態(tài)分布X~Np(",£)抽出的一個(gè)簡(jiǎn)單隨機(jī)樣本,試求S

的分布。

證明:設(shè)

*、

***

***=(左)為一正交矩陣,即「T=I。

111

、4Iy/n4n,

令z=(z1z2Zn)=(x,x2xjr,

由于Xj(i=1,2,3,4,〃)獨(dú)立同正態(tài)分布,且「為正交矩陣

所以Z'=(Z]Z2Z“)獨(dú)立同正態(tài)分布。且有

z?=X,,E(Z“)=E(xj=Gp,Var(Zn)=E

E(Z“)=E(W%X,)(a=l,2,3,.,〃一1)

J=1

j=i7〃

=廊24%=0

i=\

J=1

=為物"兇)=£曲厚

7=1j=l

所以Z|Z2---Z“T獨(dú)立同N(0,E)分布。

又因?yàn)镾=t(x,-又)(X廠5)'

i=l

_〃

=ZXjX丁欣對(duì)

因?yàn)椤?x14fxi=z“z;

\>/=1八i=\7

2

又因?yàn)閤2…xj

J=1,

(xj

X、

/、,x;

=(“x2xn)rr

,z;、

=(Z|z2zn)Z2

Z”

所以原式Sx'_zz=£zw—z.z:

j=lj=l

=Z1Z;+Z2Z;+...+Z?Z;-ZnZ;1

i^S=^Z,Z;,由于Z1,Z2,,Z,T獨(dú)立同正態(tài)分布M,(O,E),所以

j=l

$=*£”(〃—1,Z)

>1

2.10.設(shè)Xj(4xp)是來自(也.工)的簡(jiǎn)單隨機(jī)樣本,i=l,2,3,,Z,

⑴已知Hl=%=...=人=Jl且=22=…==£,求JI和E的估計(jì)。

(2)已知Xi=L2=?..=£欠=工求出,“,…,,出,和E的估計(jì)。

1卜"a

解:(1)A=X=-------------------Z£x;,

n,+〃2+???+?*Zi

£_"=li=l_______________________

n[+&+…+%

(2)ln£3,,”,Z)

ln[(2])。國[*exp[—垃£(x:-x;-|i”)]

La=\i=\

In1f<①

InL(M,L)=--pnln(2^)--In|E|(x:-兒)'T(x:-兒)

Z224=11=1

*??)=-卜"+;££(x;-4)(x;—兒yA)2=o

"ZLa=li=l

Sin加廣)=£1(X「內(nèi))=0(/=1,2,.../)

i=\

解之,得

knj

i”,EE(xu-\)(xu-

M=可=,!>"上=且上-----------

n.*7〃1+〃2+…+〃*

第三章

3.1試述多元統(tǒng)計(jì)分析中的各種均值向量和協(xié)差陣檢驗(yàn)的基本思想和步驟。

其基本思想和步驟均可歸納為:

答:

第一,提出待檢驗(yàn)的假設(shè)H。和H1;

第二,給出檢驗(yàn)的統(tǒng)計(jì)量及其服從的分布;

第三,給定檢驗(yàn)水平,查統(tǒng)計(jì)量的分布表,確定相應(yīng)的臨界

值,從而得到否定域;

。第四,根據(jù)樣本觀測(cè)值計(jì)算出統(tǒng)計(jì)量的值,看是否落入否定域中,以便對(duì)待判假設(shè)做出決策

(拒絕或接受)。

均值向量的檢驗(yàn):

統(tǒng)計(jì)量拒絕域

均值向量的檢驗(yàn):

在單一變量中

(X-Ao)^

當(dāng)"已知z=

a

IZl>Z/2

當(dāng),未知

s

1〃>如2("-1)

1?_

(S2=——Z(X,-又)2作為02的估計(jì)量)

一個(gè)正態(tài)總體H()t|i=%

甯=〃6_〃。),廣途一〃0)~/(p)

協(xié)差陣N已知T:>片

(//-1)—/?+12T?(\

協(xié)差陣E未知--——-----T-F(p,n-p)

n-p2

T>Fa

("Dp

2,

(T=(n-l)[^(X-n0)S-'V^(X-3)])

兩個(gè)正態(tài)總體Ho:ji,=ji2

有共同已知協(xié)差陣T~=(X-Y)^-1(X-Y)~2(p)甯>/

n+mZ

有共同未知協(xié)差陣F=(2+加―2)一2+172?F(p,n+m-p-l)F>Fa

(〃+/n-2)p

(其中

T2=(n+m-2)J-^-(X-Y)S-'EK(X-Y))

Vn+m\n^m

協(xié)差陣不等n=mF=P也宏s'G~F(p,n—p)

P

F>Fa

協(xié)差陣不等n#mF=(n—P)nq,s“G~F(p,n—p)

P

F>Fa

多個(gè)正態(tài)總體Ho:=〃2=…=Nk

SSARk-D

單因素方差F(k-l,n-k)

SSE/(n-k)

F>F,

多因素方差A(yù)_B__H_~A(p,n-k,k-l)

|T||A+E|

協(xié)差陣的檢驗(yàn)

檢驗(yàn)2=£。

%:£=L,

%£="L,

檢驗(yàn)£]=%=~工kHo:=%=…=Z

統(tǒng)計(jì)量4=戶口國產(chǎn)小產(chǎn)口仍2

3.2試述多元統(tǒng)計(jì)中霍特林T2分布和威爾克斯A分布分別與一元統(tǒng)計(jì)中t分布和F分布的關(guān)

系。

答:(!)霍特林T2分布是t分布對(duì)于多元變量的推廣。

22

t=_Ay(S)-'(N-M而若設(shè)X~Np(ji,E),S~Wp(n,E)且X與S

相互獨(dú)立,p,則稱統(tǒng)計(jì)量T:=n(X-囚的分布為非中心霍特林「分布。

若X~N?(0,£),S~%(〃,£)且X與S相互獨(dú)立,令T2=nX'S-'X,則

----------T~b(p,〃-p+1)o

np

(2)威爾克斯八分布在實(shí)際應(yīng)用中經(jīng)常把人統(tǒng)計(jì)量化為統(tǒng)計(jì)量進(jìn)而化為尸統(tǒng)計(jì)量,

利用F統(tǒng)計(jì)量來解決多元統(tǒng)計(jì)分析中有關(guān)檢驗(yàn)問題。

A與E統(tǒng)計(jì)量的關(guān)系

P?|〃2F統(tǒng)計(jì)量及分別

,八

-P+11-A(p,〃]!,l)

任意任意1-------------------------------F(/7,n.-p+1)

pA(p,4,l)

%—Pl-jA(p,〃|,2)

任意任意2r---------------?P(2p,2(〃|/?))

PjA(p,〃1,2)

區(qū).上幽(…)

I任意任意

4-17A(2,4,%)sc/1'、

2任意任意-r-------------F(2n,,2(nl1))

n2JA(2,〃1,“2)

3.3試述威爾克斯統(tǒng)計(jì)量在多元方差分析中的重要意義。

答:威爾克斯統(tǒng)計(jì)量在多元方差分析中是用于檢驗(yàn)均值的統(tǒng)計(jì)量。

"o:內(nèi)=%=%至少存在存/使也片均

用似然比原則構(gòu)成的檢驗(yàn)統(tǒng)計(jì)量為A=(^=」^~A(p,〃-給定檢驗(yàn)水

lTl|A+E|〃

平a,查Wilks分布表,確定臨界值,然后作出統(tǒng)計(jì)判斷。

第四章

4.1簡(jiǎn)述歐幾里得距離與馬氏距離的區(qū)別和聯(lián)系。

答:設(shè)p維歐幾里得空間RP中的兩點(diǎn)X=(X/;,…Xp)'和Y=(0Y;.““Yp)‘。則歐幾里得

距離為YJ;。歐幾里得距離的局限有①在多元數(shù)據(jù)分析中,其度量不合理。②會(huì)受

到實(shí)際問題中量綱的影響。

設(shè)X,Y是來自均值向量為|1,協(xié)方差為工的總體G中的p維樣本。則馬氏距離為D(X,Y)

=(X-Y)?E-lx-Y)。當(dāng)£"*=1即單位陣時(shí),D(X,Y)=(X-Y)'a-¥>里式%-Y>

即歐幾里得距離。

因此,在一定程度上,歐幾里得距離是馬氏距離的特殊情況,馬氏距離是歐幾里得距離的

推廣。

4.2試述判別分析的實(shí)質(zhì)。

答:判別分析就是希望利用已經(jīng)測(cè)得的變量數(shù)據(jù),找出一種判別函數(shù),使得這一函數(shù)具有某

種最優(yōu)性質(zhì),能把屬于不同類別的樣本點(diǎn)盡可能地區(qū)別開來。設(shè)R1,R2,…,Rk是p維空

間Rp的k個(gè)子集,如果它們互不相交,且它們的和集為R,,則稱R,,R?…Rp為Rp的一個(gè)

劃分。判別分析問題實(shí)質(zhì)上就是在某種意義上,以最優(yōu)的性質(zhì)對(duì)P維空間Rp構(gòu)造一個(gè)“劃

分”,這個(gè)“劃分”就構(gòu)成了一個(gè)判別規(guī)則。

4.3簡(jiǎn)述距離判別法的基本思想和方法。

答:距離判別問題分為①兩個(gè)總體的距離判別問題和②多個(gè)總體的判別問題。其基本思想都

是分別計(jì)算樣本與各個(gè)總體的距離(馬氏距離),將距離近的判別為一類。

①兩個(gè)總體的距離判別問題

設(shè)有協(xié)方差矩陣£相等的兩個(gè)總體&和&其均值分別是和〃2,對(duì)于一個(gè)新的樣品%要

判斷它來自哪個(gè)總體。計(jì)算新樣品才到兩個(gè)總體的馬氏距離加(4G,)和萬(尤名),則

XWG],4(X,GQgD-(X,G2)

XEG2>呢x,G.)>Z/(X,G2,

具體分析,

22

D(X,G,)-D(X,G2)

=XX-1X-2X2。1+吟口-(X£TX-2X2T%+NA'”)

=2XT-'仙一冉)+山匚冉一照匚出

=2XX-1(%-冉)+(冉+颶)£'3f2)

=—2(X—與2)

\2)

=_2(X_.)'a=_2a'(X_@)

記W(X)=a'(X-@)則判別規(guī)則為

XWG-W(X)NO

XrG2,W(X)<0

②多個(gè)總體的判別問題.

設(shè)有%個(gè)總體G.G2,…,G*,其均值和協(xié)方差矩陣分別是出12,…,人和二,%,…,%,

且4=2?=-=£*=£。計(jì)算樣本到每個(gè)總體的馬氏距離,到哪個(gè)總體的距離最小就屬

于哪個(gè)總體。

具體分析,Z)2(X,Ga)=(X—4)'£'(X-gJ

=次£一》2%£飛+心”

=XT-'X-2(I;X+Ca)

取L=£為“,6=—];工"“,a=l,2,…,左。

可以取線性判別函數(shù)為

Wa(X)=raX+Ca,a=1,2,…水

相應(yīng)的判別規(guī)則為XeG,若叱(X)=maxO:X+Ca)

\<a<k

4.4簡(jiǎn)述貝葉斯判別法的基本思想和方法。

基本思想:設(shè)k個(gè)總體G1,G2,…,G小其各自的分布密度函數(shù)/(x),/2(x),…,人(x),假設(shè)k

個(gè)總體各自出現(xiàn)的概率分別為0,…,①,q;>0,火/=1。設(shè)將本來屬于??傮w的樣品

1=1

錯(cuò)判到總體Gj時(shí)造成的損失為C(_/|i),i,j=\,2,…,ko

設(shè)k個(gè)總體G,G?,G&相應(yīng)的〃維樣本空間為R=(鳥,&,。

在規(guī)則R下,將屬于G;的樣品錯(cuò)判為Gj的概率為

P(八i,R)=\&(x)dx=i^j

J勺

則這種判別規(guī)則下樣品錯(cuò)判后所造成的平均損失為

r(z|R)=1i)P(j\i,R)]i=1,2,…M

內(nèi)

則用規(guī)則R來進(jìn)行判別所造成的總平均損失為

g(R)=Z%r(i,R)

i=\

=£q,£c(八

i=lJ=l

貝葉斯判別法則,就是要選擇一種劃分鳥,6,,使總平均損失g(R)達(dá)到極小。

kk

基本方法:g(R)=IOP(./Ii,R)

1=1j=l

=E^Eco'io£力(x)dx

i=lj=IJ

=ZJR(X/C(力i)fi(x))dx

j=lji=T

令(川i)E(x)=/(x),則g(R)=Ejjj(x)dx

i=lj=\Jj

若有另一劃分R*=(R:,R;,R;),g(R*)="%(x)dx

則在兩種劃分下的總平均損失之差為

kk

g(R)-g(R)=CR」“(X)-hj(x)Mx

i=\j=\」Q)

因?yàn)樵谔?hào)上加(x)<號(hào)(x)對(duì)一切j成立,故上式小于或等于零,是貝葉斯判別的解。

從而得到的劃分R=因,&,)為K一回“(X)一嘿/(X)[i=1,2,…次

4.5簡(jiǎn)述費(fèi)希爾判別法的基本思想和方法。

答:基本思想:從2個(gè)總體中抽取具有,個(gè)指標(biāo)的樣品觀測(cè)數(shù)據(jù),借助方差分析的思想構(gòu)造

一個(gè)線性判別函數(shù)

U(X)=u,Xl+u2X2++upXp=u'X

系數(shù)u=(%,%,…,叫,)’可使得總體之間區(qū)別最大,而使每個(gè)總體內(nèi)部的離差最小。將新樣

品的P個(gè)指標(biāo)值代入線性判別函數(shù)式中求出u(x)值,然后根據(jù)判別一定的規(guī)則,就可以判

別新的樣品屬于哪個(gè)總體。

4.6試析距離判別法、貝葉斯判別法和費(fèi)希爾判別法的異同。

答:①費(fèi)希爾判別與距離判別對(duì)判別變量的分布類型無要求。二者只是要求有各類母體的兩

階矩存在。而貝葉斯判別必須知道判別變量的分布類型。因此前兩者相對(duì)來說較為簡(jiǎn)單。

②當(dāng)k=2時(shí),若工-工;二工則費(fèi)希爾判別與距離判別等價(jià)。當(dāng)判別變量服從正態(tài)分布時(shí),二

者與貝葉斯判別也等價(jià)。

③當(dāng)時(shí),費(fèi)希爾判別用衛(wèi)十E:作為共同協(xié)差陣,實(shí)際看成等協(xié)差陣,此與距離判

別、貝葉斯判別不同。

④距離判別可以看為貝葉斯判別的特殊情形。貝葉斯判別的判別規(guī)則是X[G],W

(X)itod

xe,w(x)<lnd

G2

距離判別的判別規(guī)則是

?X「W(X)iO

XE,W(X)<0

G2

二者的區(qū)別在于閾值點(diǎn)。當(dāng)0=%,C(1|2)=C(2|1)時(shí),d=l,ind=。?二者完全相同。

4.7設(shè)有兩個(gè)二元總體G;和G?,從中分別抽取樣本計(jì)算得到

和=(:),"=巴)$=因烈假設(shè)工=!:;,試用距離判別法建立判別函數(shù)和

判別規(guī)則。樣品X=(6,0)'應(yīng)屬于哪個(gè)總體?

解出水⑴=用,再次⑵二仁),群手=(二J

%=球(x-R)=(x-llVr'\Hj-jij)

(x-JI)=(6X))-(4,0.5)=(2AS;

F1__L/76-2.1\

-3967V-24IS)

血-%)=(2廿

“=(如焉(乙二)?=4>°

?XeGi即樣品X屬于總體G]

4.8某超市經(jīng)銷十種品牌的飲料,其中有四種暢銷,三種滯銷,三種平銷。下表是這十種品

牌飲料的銷售價(jià)格(元)和顧客對(duì)各種飲料的口味評(píng)分、信任度評(píng)分的平均數(shù)。

銷售情況產(chǎn)品序號(hào)銷售價(jià)格口味評(píng)分信任度評(píng)分

12.258

22.567

暢銷

33.039

43.286

52.876

平銷63.587

74.898

81.734

滯銷92.242

102.743

⑴根據(jù)數(shù)據(jù)建立貝葉斯判別函數(shù),并根據(jù)此判別函數(shù)對(duì)原樣本進(jìn)行回判。

⑵現(xiàn)有一新品牌的飲料在該超市試銷,其銷售價(jià)格為3.0,顧客對(duì)其口味的評(píng)分平

均為8,信任評(píng)分平均為5,試預(yù)測(cè)該飲料的銷售情況。

解:增加group變量,令暢銷、平銷、滯銷分別為group1、2、3;銷售價(jià)格為人,口味評(píng)分為

X如信任度評(píng)分為X3,用SPSS解題的步驟如下:

1.在SPSS窗口中選擇Analyze-?-Classify-*Discriminate,調(diào)出判別分析主

界面,將左邊的變量列表中的“group”變量選入分組變量中,將Xi、X2、X3

變量選入自變量中,并選擇Enterindependentstogether單選按鈕,即使

用所有自變量進(jìn)行判別分析。

2.點(diǎn)擊DefineRange按鈕,定義分組變量的取值范圍。本例中分類變量的

范圍為1到3,所以在最小值和最大值中分別輸入1和3。單擊Continue按

鈕,返回主界面。如圖4.1

圖4.1判別分析主界面

3.單擊Statistics...按鈕,指定輸出的描述統(tǒng)計(jì)量和判別函數(shù)系數(shù)。選中Func

tionCoefficients欄中的Fisher,s:給出Bayes判別函數(shù)的系數(shù)。(注意:

這個(gè)選項(xiàng)不是要給出Fisher判別函數(shù)的系數(shù)。這個(gè)復(fù)選框的名字之所以為

Fishery是因?yàn)榘磁袆e函數(shù)值最大的一組進(jìn)行歸類這種思想是由Fisher提出來

的。這里極易混淆,請(qǐng)讀者注意辨別。)如圖4.2。單擊Continue按鈕,返回主界

面。

圖4.2statistics子對(duì)話框

4.單擊Classify...按鈕,彈出classification子對(duì)話框,選中Disp1ay選項(xiàng)欄

中的Summarytable復(fù)選框,即要求輸出錯(cuò)判矩陣,以便實(shí)現(xiàn)題中對(duì)原樣本

進(jìn)行回判的要求。如圖43。

圖4.3classification對(duì)話框

5.返回判別分析主界面,單擊OK按鈕,運(yùn)行判別分析過程。

1)根據(jù)判別分析的結(jié)果建立Bayes判別函數(shù):

Bayes判別函數(shù)的系數(shù)見表4.1?表中每一列表示樣本判入相應(yīng)類的Bayes判別函數(shù)系數(shù)。

由此可建立判別函數(shù)如下:

Groupl:KI=-81.843-11.689X1+12.297X2+16.761X3

Group2:F2=-94.536-10.707X1+13.361X2+17.086X3

Groups:K3=-l7.449-2.194X1+4.960X2+6.447X3

將各樣品的自變量值代入上述三個(gè)Bayes判別函數(shù),得到三個(gè)函數(shù)值。比較這三個(gè)函數(shù)值,

哪個(gè)函數(shù)值比較大就可以判斷該樣品判入哪一類。

ClassificationFunctionCoeftici

ents

group

123

X1-11.689-10.707-2.194

x212.29713.3614.960

x316.76117.0866.447

(Constant)-81.843-94.536-17.449

Fisher's1ineardiscriminantfunctions

表4.1Bayes判別函數(shù)系數(shù)

根據(jù)此判別函數(shù)對(duì)樣本進(jìn)行回判,結(jié)果如表4.2。從中可以看出在4種暢銷飲料中,有3種被正

確地判定,有1種被錯(cuò)誤地判定為平銷飲料,正確率為75%。在3種平銷飲料中,有2種被正

確判定,有1種被錯(cuò)誤地判定為暢銷飲料,正確率為66.7%。3種滯銷飲料均正確判定。整

體的正確率為80.0%。

ClassiticationResu1tsa

PredietedGroupMem

bership

grou

P123Total

0riginCount13l04

al2

1203

30033

%175.025.0.0100.0

233.366.7.0100.0

3.0.0100.0100.0

a.80.0%oforiginalgroupedcasescorrectlycla

ssified.

表4.2錯(cuò)判矩陣

2)該新飲料的Xl=3.0,X2=8,X3=5,將這3個(gè)自變量代入上一小題得到的Bayes判

別函數(shù),丫2的值最大,該飲料預(yù)計(jì)平銷。也可通過在原樣本中增加這一新樣本,重復(fù)上

述的判別過程,并在classification子對(duì)話框中同時(shí)要求輸出casewiseresuits,

運(yùn)行判別過程,得到相同的結(jié)果。

4.9銀行的貸款部門需要判別每個(gè)客戶的信用好壞(是否未履行還貸責(zé)任),以決定是否給

予貸款??梢愿鶕?jù)貸款申請(qǐng)人的年齡(XJ、受教育程度(X2)、現(xiàn)在所從事工作的年數(shù)(X?)、

未變更住址的年數(shù)(X,)、收入(X$)、負(fù)債收入比例(X)、信用卡債務(wù)(X,)、其它債務(wù)

(X,)等來判斷其信用情況。下表是從某銀行的客戶資料中抽取的部分?jǐn)?shù)據(jù),⑴根據(jù)樣本資

料分別用距離判別法、Bayes判別法和Fisher判別法建立判別函數(shù)和判別規(guī)則。⑵某客戶

的如上情況資料為(53,1,9,18,50,11.20,2.02,3.58),對(duì)其進(jìn)行信用好壞的判別。

目前信用客戶

4X,X」XsXfX,Xs

好壞序號(hào)

123172316.600.34

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論