多元統(tǒng)計分析思考題答案

上傳人：小*** IP屬地：浙江上傳時間：2022-10-05 格式：DOCX 頁數(shù)：6 大?。?2.28KB 積分：9.6 舉報 版權(quán)申訴

免費預(yù)覽已結(jié)束，剩余1頁可下載查看

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、可編輯修改WORD版本可編輯修改WORD版本 6/6可編輯修改WORD版本多元統(tǒng)計分析思考題答案多元統(tǒng)計分析思考題答案記得老師課堂上說過考試內(nèi)容不會超出這九道思考題，如下九道題題目中有錯誤的或不清楚的地方，歡迎大家指出、更改、補充。 1、簡述信度分析答題提示：要答可靠度概念，可靠度度量，克朗巴哈系數(shù)、拆半系數(shù)、單項與總體相關(guān)系數(shù)、稀釋相關(guān)系數(shù)等（至少要答四個系數(shù)，至少要給出兩個指標(biāo)的公式）答：信度（Reliability ）即可靠性，它是指采用同樣的方法對同一對象重復(fù)測量時所得結(jié)果的一致性程度。信度指標(biāo)多以相關(guān)系數(shù)表示，大致可分為三類：穩(wěn)定系數(shù)（跨時間的一致性），等值系數(shù)（跨形式的

2、一致性）和內(nèi)在一致性系數(shù)（跨項目的一致性）。信度分析的方法主要有以下四種： 1)、重測信度法這一方法是用同樣的問卷對同一組被調(diào)查者間隔一定時間重復(fù)施測，計算兩次施測結(jié)果的相關(guān)系數(shù)。重測信度屬于穩(wěn)定系數(shù)。重測信度法特別適用于事實式問卷，如果沒有突發(fā)事件導(dǎo)致被調(diào)查者的態(tài)度、意見突變，這種方法也適用于態(tài)度、意見式問卷。由于重測信度法需要對同一樣本試測兩次，被調(diào)查者容易受到各種事件、活動和他人的影響，而且間隔時間長短也有一定限制，因此在實施中有一定困難。 2)、復(fù)本信度法復(fù)本信度法是讓同一組被調(diào)查者一次填答兩份問卷復(fù)本，計算兩個復(fù)本的相關(guān)系數(shù)。復(fù)本信度屬于等值系數(shù)。復(fù)本信度法要求兩個復(fù)本除表述方式

3、不同外，在內(nèi)容、格式、難度和對應(yīng)題項的提問方向等方面要完全一致，而在實際調(diào)查中，很難使調(diào)查問卷達到這種要求，因此采用這種方法者較少。 3)、折半信度法折半信度法是將調(diào)查項目分為兩半，計算兩半得分的相關(guān)系數(shù)，進而估計整個量表的信度。折半信度屬于內(nèi)在一致性系數(shù)，測量的是兩半題項得分間的一致性。這種方法一般不適用于事實式問卷（如年齡與性別無法相比），常用于態(tài)度、意見式問卷的信度分析。在問卷調(diào)查中，態(tài)度測量最常見的形式是5級李克特（Likert ）量表。進行折半信度分析時，如果量表中含有反意題項，應(yīng)先將反意題項的得分作逆向處理，以保證各題項得分方向的一致性，然后將全部題項按奇偶或前后分為盡可能相等的

4、兩半，計算二者的相關(guān)系數(shù)。為了校正差異，兩半測驗的方差相等時，常運用斯皮爾曼-布朗公式（Spearman-Brown Formula ）：rxx=2rhh/(1+rhh)，其中，rhh ：兩半測驗的相關(guān)系數(shù)；rxx ：估計或修正后的信度。該公式可以估計增長或縮短一個測驗對其信度系數(shù)的影響。當(dāng)兩半測驗的方差不同時，應(yīng)采用盧倫公式（Rulon Formula ）或弗拉納根公式（Flanagan Formula ）進行修正。 4)、信度系數(shù)法 Cronbach 信度系數(shù)是目前最常用的信度系數(shù)，其公式為： ? ?-=21211X n i i S S n n 其中，2i S 為每一項目的方差；2X S

5、為測驗總分方差。從公式中可以看出，系數(shù)評價的是量表中各題項得分間的一致性，屬于內(nèi)在一致性系數(shù)。這種方法適用于態(tài)度、意見式問卷（量表）的信度分析。 2、簡述多元尺度分析在你工作中的應(yīng)用答：多元尺度分析(Multi-dimension Analysis)是市場研究的一種有力手段，是市場調(diào)查、分析數(shù)據(jù)的統(tǒng)計方法之一。它可以通過低維空間（通常是二維空間）展示多個研究對象（比如品牌）之間的聯(lián)系，利用平面距離來反映研究對象之間的相似程度。由于多維尺度分析法通常是基于研究對象之間的相似性（距離）的，只要獲得了兩個研究對象之間的距離矩陣，我們就可以通過相應(yīng)統(tǒng)計軟件做出他們的相似性知覺圖。在實際應(yīng)用

6、中，距離矩陣的獲得主要有兩種方法：一種是采用直接的相似性評價，先對所有評價對象進行兩兩組合，然后要求被訪者對所有的這些組合間進行直接相似性評價，這種方法我們稱之為直接評價法；另一種為間接評價法，由研究人員根據(jù)事先經(jīng)驗，找出影響人們評價研究對象相似性的主要屬性，然后對每個研究對象，讓被訪者對這些屬性進行逐一評價，最后將所有屬性作為多維空間的坐標(biāo)，通過距離變換計算對象之間的距離。多維尺度分析的主要思路是利用對被訪者對研究對象的分組，來反映被訪者對研究對象相似性的感知，這種方法具有一定直觀合理性。在工作中，通過多維尺度分析，可以將消費者對商品相似性的判斷產(chǎn)生一張能夠看出這些商品間相關(guān)性的圖形。

7、例如：有十個百貨商場，讓消費者排列出對這些百貨商場兩兩間相似的感知程度，根據(jù)這些數(shù)據(jù)，用多維尺度分析，可以判斷消費者認(rèn)為哪些商場是相似的，從而可以判斷競爭對手。用于反映多個研究事物間相似（不相似）程度，通過適當(dāng)?shù)慕稻S方法，將這種相似（不相似）程度在低維度空間中用點與點之間的距離表示出來，并有可能幫助識別那些影響事物間相似性的潛在因素。這種方法在市場研究中應(yīng)用得非常廣泛。 3、簡述兩個變量之間的相關(guān)分析答題提示：答什么是相關(guān)，對連續(xù)型變量用相關(guān)系數(shù)，對離散型變量用質(zhì)相關(guān)系數(shù) 答：相關(guān)分析（correlation analysis），研究隨機變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法。相關(guān)關(guān)系是一種非

8、確定性的關(guān)系。相關(guān)性探討的是兩變量間相關(guān)情況的的大致趨勢。相關(guān)分析涉及兩個變量：應(yīng)變量和自變量。應(yīng)變量(response variable)是度量研究結(jié)果的變量；自變量是解釋或影響反應(yīng)變量的變量。兩變量數(shù)據(jù)相關(guān)檢驗的步驟：一、圖示兩變量數(shù)據(jù)以及各個統(tǒng)計數(shù)字；二、查看整體狀態(tài)及數(shù)據(jù)的離散情況；三、如果有較穩(wěn)定的關(guān)系，就用簡單的數(shù)學(xué)模式描述該關(guān)系。對連續(xù)型變量常用相關(guān)系數(shù)刻畫兩個變量之間的相關(guān)性，而對離散型變量則用質(zhì)相關(guān)系數(shù)。 4、聚類和判別分析的異同答：聚類分析是把研究目標(biāo)分割成為具有相同屬性的小的群體。對變量的聚類稱為R型聚類，而對觀測值聚類稱為Q型聚類。它們在數(shù)學(xué)上是無區(qū)別的。聚類的基

9、本想法：根據(jù)某種距離，把最近的聚在一起。這里的距離含義很廣，如歐氏距離、馬氏距離等距離，相似系數(shù)也可看作為距離。判別分析的基本思路是：設(shè)有G1、G2、GK個總體，從不同的總體中抽出不同的樣本，根據(jù)樣本建立判別法則判別新的樣品屬于哪一個總體。當(dāng)然，根據(jù)不同的方法，建立的判別法則也是不同的。常用的判別方法有：距離判別、Fisher判別、Bayes判別。判別分析和聚類分析都是分類。其主要不同點就是，在聚類分析中一般人們事先并不知道或一定要明確應(yīng)該分成幾類，完全根據(jù)數(shù)據(jù)來確定。而在判別分析中，至少有一個已經(jīng)明確知道類別的“訓(xùn)練樣本”，利用這個數(shù)據(jù)，就可以建立判別準(zhǔn)則，并通過預(yù)測變量來為未知類別的觀

10、測值進行判別了。可以先聚類以得知類型,再進行判別. 5、因子分析和主成分分析的異同答：主成分分析和因子分析是多元統(tǒng)計方法中關(guān)系密切的兩種方法，應(yīng)用范圍十分廣泛，可以解決經(jīng)濟、教育、科技、社會等領(lǐng)域中的綜合評價問題。主成分分析采用降維的思想，將研究對象的多個相關(guān)變量（指標(biāo)）綜合為少數(shù)幾個不相關(guān)的變量，反映原變量提供的主要信息。因子分析是主成分分析的推廣和發(fā)展，它將具有錯綜復(fù)雜關(guān)系的變量綜合為數(shù)量較少的幾個因子，以再現(xiàn)原始變量與因子之間的相互關(guān)系，同時根據(jù)不同因子還可以對變量進行分類，它屬于多元分析中處理降維的一種統(tǒng)計方法。但是，在許多論文中用SPSS進行綜合分析時，出現(xiàn)這兩種方法運用混淆的錯

11、誤。比如，主成分分析中對變量進行了因子旋轉(zhuǎn)，因子分析的公因子系數(shù)錯誤等問題。本文就此對主成分分析和因子分析的異同進行比較，并在SPSS和DPS軟件上如何實現(xiàn)給予說明。一、主成分分析與因子分析的異同點兩者的相同點：1、思想一致：都是降維的思想；2、應(yīng)用范圍一致：都要求變量之間具有不完全的相關(guān)性；3、數(shù)據(jù)處理過程一致：數(shù)據(jù)的無量綱化，求相關(guān)系數(shù)矩陣的特征值和特征向量，通過累計貢獻率確定主成分個數(shù)、因子個數(shù)；4、合成方法一致：都沒有考慮原始變量之間的關(guān)系，直接用線性關(guān)系處理變量與主成分和因子之間的關(guān)系。兩者的不同點：1、方差損失上：主成分解釋了原始變量的全部方差，無方差損失；因子模型中除了有公

12、因子外還有特殊因子，公因子只解釋了部分信息，有方差損失；2、唯一性：主成分分析不存在因子旋轉(zhuǎn)，主成分是唯一的；因子分析進行因子旋轉(zhuǎn)，解不唯一；3、實際意義：主成分沒有實際意義；公因子有實際意義；4、應(yīng)用：主成分側(cè)重信息貢獻、影響力綜合評價；因子分析側(cè)重成因清晰性的綜合評價。 1.因子分析中是把變量表示成各因子的線性組合，而主成分分析中則是把主成分表示成幾個變量的線性組合。 2.主成分分析的重點在于解釋個變量的總方差，而因子分析則把重點放在解釋各變量之間的協(xié)方差。 3.主成分分析中不需要有假設(shè)(assumptions),因子分析則需要一些假設(shè)。因子分析的假設(shè)包括：各個共同因子之間不相關(guān)，特殊因

13、子（specific factor）之間也不相關(guān)，共同因子和特殊因子之間也不相關(guān)。 4.主成分分析中，當(dāng)給定的協(xié)方差矩陣或者相關(guān)矩陣的特征值是唯一的時候，的主成分一般是獨特的；而因子分析中因子不是獨特的，可以旋轉(zhuǎn)得到不到的因子。 5.在因子分析中，因子個數(shù)需要分析者指定（spss根據(jù)一定的條件自動設(shè)定，只要是特征值大于1的因子進入分析），而指定的因子數(shù)量不同而結(jié)果不同。在主成分分析中，成分的數(shù)量是一定的，一般有幾個變量就有幾個主成分。和主成分分析相比，由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子，在解釋方面更加有優(yōu)勢。大致說來，當(dāng)需要尋找潛在的因子，并對這些因子進行解釋的時候，更加傾向于使用因

14、子分析，并且借助旋轉(zhuǎn)技術(shù)幫助更好解釋。而如果想把現(xiàn)有的變量變成少數(shù)幾個新的變量（新的變量幾乎帶有原來所有變量的信息）來進入后續(xù)的分析，則可以使用主成分分析。當(dāng)然，這中情況也可以使用因子得分做到。所以這中區(qū)分不是絕對的。總得來說，主成分分析主要是作為一種探索性的技術(shù)，在分析者進行多元數(shù)據(jù)分析之前，用主成分分析來分析數(shù)據(jù)，讓自己對數(shù)據(jù)有一個大致的了解是非常重要的。主成分分析一般很少單獨使用：a，了解數(shù)據(jù)。(screening the data),b,和cluster analysis一起使用，c，和判別分析一起使用，比如當(dāng)變量很多，個案數(shù)不多，直接使用判別分析可能無解，這時候可以使用主成份發(fā)對變

15、量簡化。（reduce dimensionality）d,在多元回歸中，主成分分析可以幫助判斷是否存在共線性（條件指數(shù)），還可以用來處理共線性。在算法上，主成分分析和因子分析很類似，不過，在因子分析中所采用的協(xié)方差矩陣的對角元素不在是變量的方差，而是和變量對應(yīng)的共同度（變量方差中被各因子所解釋的部分。）。 6、系統(tǒng)聚類與K-means聚類的基本原理答：系統(tǒng)聚類法基本原理和步驟為： 1、先計算n個樣本兩兩間的距離 2、構(gòu)造n個類，每個類只包含一個樣本 3、合并距離最近的兩類為一新類 4、計算新類與當(dāng)前各類的距離 5、類的個數(shù)是否等于1，如果不等于回到3在做 6、畫出聚類圖 7、決定分類個數(shù)

16、和類 K-means聚類的基本原理：聚類可以走著瞧，不一定事先確定有多少類；但是K-means聚類卻要求先說好要分多少類?？雌饋碛行┲饔^。假定分3類，這個方法還進一步要求你事先確定3個點為“聚類種子”(多數(shù)軟件會自動選種子)；也就是說，把這3個點作為三類中每一類的基石。然后根據(jù)和這三個點的距離遠近，把所有點分成三類。再把這三類的中心(均值)作為新的基石或種子(原來“種子”就沒用了)，再重新按照距離分類。如此疊代下去，直到達到停止疊代的要求（比如，各類最后變化不大了，或者疊代次數(shù)太多了）。顯然，前面的聚類種子的選擇并不必太認(rèn)真，它們很可能最后還會分到同一類中呢。 7、Fisher判別和貝葉斯

17、判別的基本原理答： Fisher判別法是一種先投影的方法。使多維問題簡化為一維問題來處理。選擇一個適當(dāng)?shù)耐队拜S,使所有的樣品點都投影到這個軸上得到一個投影值。對這個投影軸的方向的要求是：使每一類內(nèi)的投影值所形成的類內(nèi)離差盡可能小，而不同類間的投影值所形成的類間離差盡可能大。進行投影后，再根據(jù)距離判別思想由距離的遠近得到判別準(zhǔn)則，從而進行判別分析。貝葉斯（BAYES）判別思想是根據(jù)先驗概率求出后驗概率，并依據(jù)后驗概率分布作出統(tǒng)計推斷。所謂先驗概率,就是用概率來描述人們事先對所研究的對象的認(rèn)識的程度；所謂后驗概率，就是根據(jù)具體資料、先驗概率、特定的判別規(guī)則所計算出來的概率。它是對先驗概率修正后

18、的結(jié)果。 8、舉例說明你在工作中如何應(yīng)用主成分分析和因子分析（因主成分分析有什么什么缺點，可用因子分析什么什么旋轉(zhuǎn)）答：主成分分析：將多個變量通過線性變換以選出較少個數(shù)重要變量的一種多元統(tǒng)計分析方法。在分析問題的時候，往往提出很多有關(guān)的變量來描述一個事物，在宏觀經(jīng)濟研究領(lǐng)域中，表述國家基本經(jīng)濟面貌的時有很多指標(biāo)，如人口、國土面積、公路里程、GDP、財政收入等等。在對人的描述的時候，有身高、體重、學(xué)歷、年齡、工作等多項可直接測量的指標(biāo)。眾多的指標(biāo)中，有很多是相互關(guān)聯(lián)的，不能清晰的反應(yīng)數(shù)據(jù)問題，人們希望能將這些指標(biāo)進行高度概括，用有限的指標(biāo)精煉的概括，清晰地反應(yīng)數(shù)據(jù)全貌。將原有變量重新組合成

19、幾個相互無關(guān)的新變量，同時根據(jù)實際從中選出較少的變量盡可能多地反映原有變量統(tǒng)計信息，在數(shù)學(xué)上也叫做降維處理。當(dāng)我們展開區(qū)域競爭力研究的時候，可以利用主成分分析法。首先要根據(jù)區(qū)域競爭力選擇適合的指標(biāo)體系，以綜合競爭力開展的研究的指標(biāo)體系如：國內(nèi)生產(chǎn)總值（GDP）、第三產(chǎn)業(yè)比重、工業(yè)占第二產(chǎn)業(yè)比重、郵電業(yè)務(wù)總量、用電量、全社會固定資產(chǎn)投資、外商直接投資、科學(xué)研究等。取得31個?。ㄊ?、自治區(qū)）的數(shù)據(jù)。對原始指標(biāo)數(shù)據(jù)的標(biāo)準(zhǔn)化采集p 維隨機向量x = (X1,X2,.,Xp)T)，31個樣品xi = (xi1,xi2,.,xip)T ，i=1,2, (31) 由于指標(biāo)間量綱不同，將數(shù)據(jù)進行標(biāo)準(zhǔn)化操作

20、。求的相關(guān)系數(shù)矩陣R的特征方程及p個特征根，及特征向量。將標(biāo)準(zhǔn)化的指標(biāo)量轉(zhuǎn)化成主成分，并根據(jù)特征根的大小確定主成分貢獻率，將前n個主成分累計貢獻率超過85%對各個樣本的權(quán)系數(shù)重新組合，計算各個樣本在n個主成分上的得分，根據(jù)得分將不同地區(qū)劃成不同的組合，這樣就可以將原有因指標(biāo)眾多而無法分清的地區(qū)間區(qū)別，可以通過有限個主成分將各地區(qū)區(qū)分出來，將競爭力相近的地區(qū)主成分得分基本靠近，幾何做圖的意義是，在主軸上的各樣本點分別集中在各自的主軸附近。進一步分析各個主軸的經(jīng)濟學(xué)含義。完成主成分分析。因子分析：它的目的在于研究原始變量的內(nèi)部關(guān)系，通過尋找變量的共同因素來簡化和分析變量中存在的復(fù)雜關(guān)系。它把每個

21、變量分解為兩部分因素，一部分是由這些變量內(nèi)含的共同因素所構(gòu)成，即所謂公共因素部分，另一部分是每個變量各種獨有的因素，即所謂獨特因素或單一因素部分。仍然沿用對地區(qū)競爭力分析的案例，由于根據(jù)主成分分析得到的n個主成分，將多個指標(biāo)投影到少量的主成分之上，簡化了數(shù)據(jù)結(jié)構(gòu)，但仍然無法明確主成分的含義，也無法明確指標(biāo)間的關(guān)系。這樣利用因子分析，將各個變量中的公共因子找到，也就是造成地區(qū)間競爭力不同的的共性因素，同時找到各地區(qū)不同的獨特因素。首先對各省數(shù)據(jù)進行標(biāo)準(zhǔn)化處理。根據(jù)正交因子模型：X=+A*F+，其中F為X的公共因子，為X的特殊因子，A為因子載荷矩陣。根據(jù)標(biāo)準(zhǔn)化數(shù)據(jù)計算協(xié)方差陣，并且求的其特征根和標(biāo)準(zhǔn)化特征向量，確定m 個方差累積貢獻率達到85%以上的公因子個數(shù)。由于公因子解不唯一，為了取得更好對公因子的經(jīng)濟學(xué)解釋，對公因子進行方差最大的正交旋轉(zhuǎn)，將各列載荷向0或1兩極方向分化，將大大有利于對公因子進行解釋。本案例中，得到2個公因子，gdp等指標(biāo)在第一公因子上的載荷比較高，可以將第一公因子解釋為經(jīng)濟層面的硬件因素，而教育投入、科研投入等指標(biāo)在第

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

多元統(tǒng)計分析思考題答案

文檔簡介

溫馨提示

最新文檔

評論

多元統(tǒng)計分析思考題答案

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔