多元統(tǒng)計分析思考題答案_第1頁
多元統(tǒng)計分析思考題答案_第2頁
免費預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、可編輯修改WORD版本可編輯修改WORD版本 6/6可編輯修改WORD版本多元統(tǒng)計分析思考題答案 多元統(tǒng)計分析思考題答案 記得老師課堂上說過考試內(nèi)容不會超出這九道思考題,如下九道題題目中有錯誤的或不清楚的地方,歡迎大家指出、更改、補充。 1、 簡述信度分析 答題提示:要答可靠度概念,可靠度度量,克朗巴哈系數(shù)、拆半系數(shù)、單項與總體相關(guān)系數(shù)、稀釋相關(guān)系數(shù)等(至少要答四個系數(shù),至少要給出兩個指標(biāo)的公式) 答: 信度(Reliability )即可靠性,它是指采用同樣的方法對同一對象重復(fù)測量時所得結(jié)果的一致性程度。信度指標(biāo)多以相關(guān)系數(shù)表示,大致可分為三類:穩(wěn)定系數(shù)(跨時間的一致性),等值系數(shù)(跨形式的

2、一致性)和內(nèi)在一致性系數(shù)(跨項目的一致性)。信度分析的方法主要有以下四種: 1)、重測信度法 這一方法是用同樣的問卷對同一組被調(diào)查者間隔一定時間重復(fù)施測,計算兩次施測結(jié)果的相關(guān)系數(shù)。重測信度屬于穩(wěn)定系數(shù)。重測信度法特別適用于事實式問卷,如果沒有突發(fā)事件導(dǎo)致被調(diào)查者的態(tài)度、意見突變,這種方法也適用于態(tài)度、意見式問卷。由于重測信度法需要對同一樣本試測兩次,被調(diào)查者容易受到各種事件、活動和他人的影響,而且間隔時間長短也有一定限制,因此在實施中有一定困難。 2)、復(fù)本信度法 復(fù)本信度法是讓同一組被調(diào)查者一次填答兩份問卷復(fù)本,計算兩個復(fù)本的相關(guān)系數(shù)。復(fù)本信度屬于等值系數(shù)。復(fù)本信度法要求兩個復(fù)本除表述方式

3、不同外,在內(nèi)容、格式、難度和對應(yīng)題項的提問方向等方面要完全一致,而在實際調(diào)查中,很難使調(diào)查問卷達到這種要求,因此采用這種方法者較少。 3)、折半信度法 折半信度法是將調(diào)查項目分為兩半,計算兩半得分的相關(guān)系數(shù),進而估計整個量表的信度。折半信度屬于內(nèi)在一致性系數(shù),測量的是兩半題項得分間的一致性。這種方法一般不適用于事實式問卷(如年齡與性別無法相比),常用于態(tài)度、意見式問卷的信度分析。在問卷調(diào)查中,態(tài)度測量最常見的形式是5級李克特(Likert )量表。進行折半信度分析時,如果量表中含有反意題項,應(yīng)先將反意題項的得分作逆向處理,以保證各題項得分方向的一致性,然后將全部題項按奇偶或前后分為盡可能相等的

4、兩半,計算二者的相關(guān)系數(shù)。 為了校正差異,兩半測驗的方差相等時,常運用斯皮爾曼-布朗公式(Spearman-Brown Formula ):rxx=2rhh/(1+rhh),其中,rhh :兩半測驗的相關(guān)系數(shù);rxx :估計或修正后的信度。該公式可以估計增長或縮短一個測驗對其信度系數(shù)的影響。當(dāng)兩半測驗的方差不同時,應(yīng)采用盧倫公式(Rulon Formula )或弗拉納根公式(Flanagan Formula )進行修正。 4)、信度系數(shù)法 Cronbach 信度系數(shù)是目前最常用的信度系數(shù),其公式為: ? ?-=21211X n i i S S n n 其中,2i S 為每一項目的方差;2X S

5、 為測驗總分方差。 從公式中可以看出,系數(shù)評價的是量表中各題項得分間的一致性,屬于內(nèi)在一致性系數(shù)。 這種方法適用于態(tài)度、意見式問卷(量表)的信度分析。 2、簡述多元尺度分析在你工作中的應(yīng)用 答: 多元尺度分析(Multi-dimension Analysis)是市場研究的一種有力手段,是市場調(diào)查、分析數(shù)據(jù)的統(tǒng)計方法之一。它可以通過低維空間(通常是二維空間)展示多個研究對象(比如品牌)之間的聯(lián)系,利用平面距離來反映研究對象之間的相似程度。由于多維尺度分析法通常是基于研究對象之間的相似性(距離)的,只要獲得了兩個研究對象之間的距離矩陣,我們就可以通過相應(yīng)統(tǒng)計軟件做出他們的相似性知覺圖。 在實際應(yīng)用

6、中,距離矩陣的獲得主要有兩種方法:一種是采用直接的相似性評價,先對所有評價對象進行兩兩組合,然后要求被訪者對所有的這些組合間進行直接相似性評價,這種方法我們稱之為直接評價法;另一種為間接評價法,由研究人員根據(jù)事先經(jīng)驗,找出影響人們評價研究對象相似性的主要屬性,然后對每個研究對象,讓被訪者對這些屬性進行逐一評價,最后將所有屬性作為多維空間的坐標(biāo),通過距離變換計算對象之間的距離。 多維尺度分析的主要思路是利用對被訪者對研究對象的分組,來反映被訪者對研究對象相似性的感知,這種方法具有一定直觀合理性。 在工作中,通過多維尺度分析,可以將消費者對商品相似性的判斷產(chǎn)生一張能夠看出這些商品間相關(guān)性的圖形。

7、例如:有十個百貨商場,讓消費者排列出對這些百貨商場兩兩間相似的感知程度,根據(jù)這些數(shù)據(jù),用多維尺度分析,可以判斷消費者認(rèn)為哪些商場是相似的,從而可以判斷競爭對手。 用于反映多個研究事物間相似(不相似)程度,通過適當(dāng)?shù)慕稻S方法,將這種相似(不相似)程度在低維度空間中用點與點之間的距離表示出來,并有可能幫助識別那些影響事物間相似性的潛在因素。這種方法在市場研究中應(yīng)用得非常廣泛。 3、簡述兩個變量之間的相關(guān)分析 答題提示:答什么是相關(guān),對連續(xù)型變量用相關(guān)系數(shù),對離散型變量用質(zhì)相關(guān)系數(shù) 答: 相關(guān)分析(correlation analysis),研究隨機變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法。相關(guān)關(guān)系是一種非

8、確定性的關(guān)系。相關(guān)性探討的是兩變量間相關(guān)情況的的大致趨勢。相關(guān)分析涉及兩個變量:應(yīng)變量和自變量。應(yīng)變量(response variable)是度量研究結(jié)果的變量;自變量是解釋或影響反應(yīng)變量的變量。 兩變量數(shù)據(jù)相關(guān)檢驗的步驟:一、圖示兩變量數(shù)據(jù)以及各個統(tǒng)計數(shù)字;二、查看整體狀態(tài)及數(shù)據(jù)的離散情況;三、如果有較穩(wěn)定的關(guān)系,就用簡單的數(shù)學(xué)模式描述該關(guān)系。 對連續(xù)型變量常用相關(guān)系數(shù)刻畫兩個變量之間的相關(guān)性,而對離散型變量則用質(zhì)相關(guān)系數(shù)。 4、聚類和判別分析的異同 答:聚類分析是把研究目標(biāo)分割成為具有相同屬性的小的群體。對變量的聚類稱為R型聚類,而對觀測值聚類稱為Q型聚類。它們在數(shù)學(xué)上是無區(qū)別的。聚類的基

9、本想法:根據(jù)某種距離,把最近的聚在一起。這里的距離含義很廣,如歐氏距離、馬氏距離等距離,相似系數(shù)也可看作為距離。 判別分析的基本思路是:設(shè)有G1、G2、GK個總體,從不同的總體中抽出不同的樣本,根據(jù)樣本建立判別法則判別新的樣品屬于哪一個總體。當(dāng)然,根據(jù)不同的方法,建立的判別法則也是不同的。常用的判別方法有:距離判別、Fisher判別、Bayes判別。 判別分析和聚類分析都是分類。其主要不同點就是,在聚類分析中一般人們事先并不知道或一定要明確應(yīng)該分成幾類,完全根據(jù)數(shù)據(jù)來確定。而在判別分析中,至少有一個已經(jīng)明確知道類別的“訓(xùn)練樣本”,利用這個數(shù)據(jù),就可以建立判別準(zhǔn)則,并通過預(yù)測變量來為未知類別的觀

10、測值進行判別了。 可以先聚類以得知類型,再進行判別. 5、因子分析和主成分分析的異同 答:主成分分析和因子分析是多元統(tǒng)計方法中關(guān)系密切的兩種方法,應(yīng)用范圍十分廣泛,可以解決經(jīng)濟、教育、科技、社會等領(lǐng)域中的綜合評價問題。主成分分析采用降維的思想,將研究對象的多個相關(guān)變量(指標(biāo))綜合為少數(shù)幾個不相關(guān)的變量,反映原變量提供的主要信息。因子分析是主成分分析的推廣和發(fā)展,它將具有錯綜復(fù)雜關(guān)系的變量綜合為數(shù)量較少的幾個因子,以再現(xiàn)原始變量與因子之間的相互關(guān)系,同時根據(jù)不同因子還可以對變量進行分類,它屬于多元分析中處理降維的一種統(tǒng)計方法。但是,在許多論文中用SPSS進行綜合分析時,出現(xiàn)這兩種方法運用混淆的錯

11、誤。比如,主成分分析中對變量進行了因子旋轉(zhuǎn),因子分析的公因子系數(shù)錯誤等問題。本文就此對主成分分析和因子分析的異同進行比較,并在SPSS和DPS軟件上如何實現(xiàn)給予說明。 一、主成分分析與因子分析的異同點 兩者的相同點:1、思想一致:都是降維的思想;2、應(yīng)用范圍一致:都要求變量之間具有不完全的相關(guān)性;3、數(shù)據(jù)處理過程一致:數(shù)據(jù)的無量綱化,求相關(guān)系數(shù)矩陣的特征值和特征向量,通過累計貢獻率確定主成分個數(shù)、因子個數(shù);4、合成方法一致:都沒有考慮原始變量之間的關(guān)系,直接用線性關(guān)系處理變量與主成分和因子之間的關(guān)系。 兩者的不同點:1、方差損失上:主成分解釋了原始變量的全部方差,無方差損失;因子模型中除了有公

12、因子外還有特殊因子,公因子只解釋了部分信息,有方差損失;2、唯一性:主成分分析不存在因子旋轉(zhuǎn),主成分是唯一的;因子分析進行因子旋轉(zhuǎn),解不唯一;3、 實際意義:主成分沒有實際意義;公因子有實際意義;4、應(yīng)用:主成分側(cè)重信息貢獻、影響力綜合評價;因子分析側(cè)重成因清晰性的綜合評價。 1.因子分析中是把變量表示成各因子的線性組合,而主成分分析中則是把主成分表示成幾個變量的線性組合。 2.主成分分析的重點在于解釋個變量的總方差,而因子分析則把重點放在解釋各變量之間的協(xié)方差。 3.主成分分析中不需要有假設(shè)(assumptions),因子分析則需要一些假設(shè)。因子分析的假設(shè)包括:各個共同因子之間不相關(guān),特殊因

13、子(specific factor)之間也不相關(guān),共同因子和特殊因子之間也不相關(guān)。 4.主成分分析中,當(dāng)給定的協(xié)方差矩陣或者相關(guān)矩陣的特征值是唯一的時候,的主成分一般是獨特的;而因子分析中因子不是獨特的,可以旋轉(zhuǎn)得到不到的因子。 5.在因子分析中,因子個數(shù)需要分析者指定(spss根據(jù)一定的條件自動設(shè)定,只要是特征值大于1的因子進入分析),而指 定的因子數(shù)量不同而結(jié)果不同。在主成分分析中,成分的數(shù)量是一定的,一般有幾個變量就有幾個主成分。 和主成分分析相比,由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子,在解釋方面更加有優(yōu)勢。大致說來,當(dāng)需要尋找潛在的因子,并對這些因子進行解釋的時候,更加傾向于使用因

14、子分析,并且借助旋轉(zhuǎn)技術(shù)幫助更好解釋。而如果想把現(xiàn)有的變量變成少數(shù)幾個新的變量(新的變量幾乎帶有原來所有變量的信息)來進入后續(xù)的分析,則可以使用主成分分析。當(dāng)然,這中情況也可以使用因子得分做到。所以這中區(qū)分不是絕對的。 總得來說,主成分分析主要是作為一種探索性的技術(shù),在分析者進行多元數(shù)據(jù)分析之前,用主成分分析來分析數(shù)據(jù),讓自己對數(shù)據(jù)有一個大致的了解是非常重要的。主成分分析一般很少單獨使用:a,了解數(shù)據(jù)。(screening the data),b,和cluster analysis一起使用,c,和判別分析一起使用,比如當(dāng)變量很多,個案數(shù)不多,直接使用判別分析可能無解,這時候可以使用主成份發(fā)對變

15、量簡化。(reduce dimensionality)d,在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數(shù)),還可以用來處理共線性。 在算法上,主成分分析和因子分析很類似,不過,在因子分析中所采用的協(xié)方差矩陣的對角元素不在是變量的方差,而是和變量對應(yīng)的共同度(變量方差中被各因子所解釋的部分。)。 6、系統(tǒng)聚類與K-means聚類的基本原理 答: 系統(tǒng)聚類法基本原理和步驟為: 1、先計算n個樣本兩兩間的距離 2、構(gòu)造n個類,每個類只包含一個樣本 3、合并距離最近的兩類為一新類 4、計算新類與當(dāng)前各類的距離 5、類的個數(shù)是否等于1,如果不等于回到3在做 6、畫出聚類圖 7、決定分類個數(shù)

16、和類 K-means聚類的基本原理: 聚類可以走著瞧,不一定事先確定有多少類;但是K-means聚類卻要求先說好要分多少類??雌饋碛行┲饔^。 假定分3類,這個方法還進一步要求你事先確定3個點為“聚類種子”(多數(shù)軟件會自動選種子);也就是說,把這3個點作為三類中每一類的基石。然后根據(jù)和這三個點的距離遠近,把所有點分成三類。再把這三類的中心(均值)作為新的基石或種子(原來“種子”就沒用了),再重新按照距離分類。如此疊代下去,直到達到停止疊代的要求(比如,各類最后變化不大了,或者疊代次數(shù)太多了)。顯然,前面的聚類種子的選擇并不必太認(rèn)真,它們很可能最后還會分到同一類中呢。 7、Fisher判別和貝葉斯

17、判別的基本原理 答: Fisher判別法是一種先投影的方法。使多維問題簡化為一維問題來處理。選擇一個適當(dāng)?shù)耐队拜S,使所有的樣品點都投影到這個軸上得到一個投影值。對這個投影軸的方向的要求是:使每一類內(nèi)的投影值所形成的類內(nèi)離差盡可能小,而不同類間的投影值所形成的類間離差盡可能大。進行投影后,再根據(jù)距離判別思想由距離的遠近得到判別準(zhǔn)則,從而進行判別分析。 貝葉斯(BAYES)判別思想是根據(jù)先驗概率求出后驗概率,并依據(jù)后驗概率分布作出統(tǒng)計推斷。所謂先驗概率,就是用概率來描述人們事先對所研究的對象的認(rèn)識的程度;所謂后驗概率,就是根據(jù)具體資料、先驗概率、特定的判別規(guī)則所計算出來的概率。它是對先驗概率修正后

18、的結(jié)果。 8、舉例說明你在工作中如何應(yīng)用主成分分析和因子分析 (因主成分分析有什么什么缺點,可用因子分析什么什么旋轉(zhuǎn)) 答: 主成分分析:將多個變量通過線性變換以選出較少個數(shù)重要變量的一種多元統(tǒng)計分析方法。在分析問題的時候,往往提出很多有關(guān)的變量來描述一個事物,在宏觀經(jīng)濟研究領(lǐng)域中,表述國家基本經(jīng)濟面貌的時有很多指標(biāo),如人口、國土面積、公路里程、GDP、財政收入等等。在對人的描述的時候,有身高、體重、學(xué)歷、年齡、工作等多項可直接測量的指標(biāo)。眾多的指標(biāo)中,有很多是相互關(guān)聯(lián)的,不能清晰的反應(yīng)數(shù)據(jù)問題,人們希望能將這些指標(biāo)進行高度概括,用有限的指標(biāo)精煉的概括,清晰地反應(yīng)數(shù)據(jù)全貌。將原有變量重新組合成

19、幾個相 互無關(guān)的新變量,同時根據(jù)實際從中選出較少的變量盡可能多地反映原有變量統(tǒng)計信息,在數(shù)學(xué)上也叫做降維處理。 當(dāng)我們展開區(qū)域競爭力研究的時候,可以利用主成分分析法。首先要根據(jù)區(qū)域競爭力選擇適合的指標(biāo)體系,以綜合競爭力開展的研究的指標(biāo)體系如:國內(nèi)生產(chǎn)總值(GDP)、第三產(chǎn)業(yè)比重、工業(yè)占第二產(chǎn)業(yè)比重、郵電業(yè)務(wù)總量、用電量、全社會固定資產(chǎn)投資、外商直接投資、科學(xué)研究等。取得31個?。ㄊ?、自治區(qū))的數(shù)據(jù)。對原始指標(biāo)數(shù)據(jù)的標(biāo)準(zhǔn)化采集p 維隨機向量x = (X1,X2,.,Xp)T),31個樣品xi = (xi1,xi2,.,xip)T ,i=1,2, (31) 由于指標(biāo)間量綱不同,將數(shù)據(jù)進行標(biāo)準(zhǔn)化操作

20、。求的相關(guān)系數(shù)矩陣R的特征方程及p個特征根,及特征向量。將標(biāo)準(zhǔn)化的指標(biāo)量轉(zhuǎn)化成主成分,并根據(jù)特征根的大小確定主成分貢獻率,將前n個主成分累計貢獻率超過85%對各個樣本的權(quán)系數(shù)重新組合,計算各個樣本在n個主成分上的得分,根據(jù)得分將不同地區(qū)劃成不同的組合,這樣就可以將原有因指標(biāo)眾多而無法分清的地區(qū)間區(qū)別,可以通過有限個主成分將各地區(qū)區(qū)分出來,將競爭力相近的地區(qū)主成分得分基本靠近,幾何做圖的意義是,在主軸上的各樣本點分別集中在各自的主軸附近。進一步分析各個主軸的經(jīng)濟學(xué)含義。完成主成分分析。 因子分析:它的目的在于研究原始變量的內(nèi)部關(guān)系,通過尋找變量的共同因素來簡化和分析變量中存在的復(fù)雜關(guān)系。它把每個

21、變量分解為兩部分因素,一部分是由這些變量內(nèi)含的共同因素所構(gòu)成,即所謂公共因素部分,另一部分是每個變量各種獨有的因素,即所謂獨特因素或單一因素部分。 仍然沿用對地區(qū)競爭力分析的案例,由于根據(jù)主成分分析得到的n個主成分,將多個指標(biāo)投影到少量的主成分之上,簡化了數(shù)據(jù)結(jié)構(gòu),但仍然無法明確主成分的含義,也無法明確指標(biāo)間的關(guān)系。這樣利用因子分析,將各個變量中的公共因子找到,也就是造成地區(qū)間競爭力不同的的共性因素,同時找到各地區(qū)不同的獨特因素。首先對各省數(shù)據(jù)進行標(biāo)準(zhǔn)化處理。根據(jù)正交因子模型:X=+A*F+,其中F為X的公共因子,為X的特殊因子,A為因子載荷矩陣。根據(jù)標(biāo)準(zhǔn)化數(shù)據(jù)計算協(xié)方差陣,并且求的其特征根和標(biāo)準(zhǔn)化特征向量,確定m 個方差累積貢獻率達到85%以上的公因子個數(shù)。由于公因子解不唯一,為了取得更好對公因子的經(jīng)濟學(xué)解釋,對公因子進行方差最大的正交旋轉(zhuǎn),將各列載荷向0或1兩極方向分化,將大大有利于對公因子進行解釋。本案例中,得到2個公因子,gdp等指標(biāo)在第一公因子上的載荷比較高,可以將第一公因子解釋為經(jīng)濟層面的硬件因素,而教育投入、科研投入等指標(biāo)在第

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論