多元統(tǒng)計分析方法在學(xué)生成績評價中的應(yīng)用_第1頁
多元統(tǒng)計分析方法在學(xué)生成績評價中的應(yīng)用_第2頁
多元統(tǒng)計分析方法在學(xué)生成績評價中的應(yīng)用_第3頁
多元統(tǒng)計分析方法在學(xué)生成績評價中的應(yīng)用_第4頁
多元統(tǒng)計分析方法在學(xué)生成績評價中的應(yīng)用_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

XX建筑大學(xué)課程設(shè)計〔論文〕./XX建筑大學(xué)課程設(shè)計<論文>專業(yè)統(tǒng)計學(xué)班級統(tǒng)計三班XXxxxxxx學(xué)號1120xxxxxxx課題多元統(tǒng)計分析方法在學(xué)生成績評價中的應(yīng)用指導(dǎo)教師xxxxx20xx6月30日多元統(tǒng)計分析方法在學(xué)生成績評價中的應(yīng)用摘要多元統(tǒng)計分析是統(tǒng)計學(xué)中迅速發(fā)展起來的一個重要分支,已經(jīng)被廣泛地應(yīng)用到經(jīng)濟、金融、醫(yī)藥、衛(wèi)生等領(lǐng)域,而其在教育教學(xué)中的應(yīng)用仍處于起步階段,卻已被證實效果良好。學(xué)生成績評價的含義,通常是指學(xué)校根據(jù)一定的標準,即以教學(xué)大綱、教學(xué)中的準則為標準,對教學(xué)過程中學(xué)生所產(chǎn)生或者即將產(chǎn)生的思想、學(xué)業(yè)、行動和個性等方面的變化,或者變化的發(fā)展趨勢,做出恰如其人的估價。本文研究以多元統(tǒng)計分析為基本的理論基礎(chǔ),研究主成分分析方法和因子分析方法以與之間的密切聯(lián)系,對學(xué)生成績進行因子分析與主成分分析,同時指出因子分析方法在選取因子時的相應(yīng)規(guī)則以與因子分析在學(xué)生的綜合素質(zhì)評價中的應(yīng)用,即通過收集到的相關(guān)數(shù)據(jù),對學(xué)生的成績進行因子分析,進而對學(xué)生進行綜合評價以與大學(xué)期間課程設(shè)置的合理性和不同類型的學(xué)生的不同特征并對其就業(yè)進行具體指導(dǎo)。也闡述了用SPSS進行聚類分析時要注意的問題。對學(xué)生成績進行實證統(tǒng)計分析,并給出了綜合評價的有效方法。結(jié)論將對科學(xué)高效地開展學(xué)生成績綜合評定,深層次的挖掘?qū)W生的潛在能力,指導(dǎo)畢業(yè)生考研升學(xué)與就業(yè),開展教育教學(xué)研究,提高教學(xué)管理部門工作質(zhì)量、效率提有力支持,同時作為高校教師應(yīng)該掌握這種科學(xué)的管理方法,從多方面來指導(dǎo)自己的教育教學(xué)工作,掌握了多元統(tǒng)計分析方法具有切實可行的指導(dǎo)意義,能使高校教師的各項工作達到科學(xué)化水平。運用多元統(tǒng)計分析方法,它直接從實際出發(fā),以我院統(tǒng)計學(xué)學(xué)生4年主要課程的成績?yōu)閿?shù)據(jù)來源,考察分析數(shù)據(jù)的內(nèi)在聯(lián)系和特征,從中提取主要而準確的信息,能幫助我們正確認識事物客觀存在的統(tǒng)計規(guī)律。關(guān)鍵詞:學(xué)生成績;主成分;因子分析目錄學(xué)生成績評價的簡介1.1學(xué)生成績評價的現(xiàn)狀1.2學(xué)生成績評價的概念1.3學(xué)生成績評價的重要性1.4對學(xué)生成績評價的作用1.5研究現(xiàn)狀多元統(tǒng)計分析方法簡介2.1主成分分析簡介2.2聚類分析簡介實例分析3.1資料來源3.2主成分分析3.2.1spss操作步驟3.2.2主成分系數(shù)求解3.3聚類分析3.3.1spss操作步驟結(jié)論與展望參考文獻引言多元統(tǒng)計分析的理論是最近發(fā)展起來的理論學(xué)科,人們對它的研究還很不善有很多新的統(tǒng)計分析方法還沒有得到人們的重視,雖然有的統(tǒng)計方法在理論上得到認可,但是在實際應(yīng)用中不是很廣泛.多元統(tǒng)計分析在經(jīng)濟、金融、醫(yī)藥等領(lǐng)域應(yīng)用比較廣泛,但是在教育教學(xué)上的應(yīng)用卻受到了限制.尤其是一些普通教師沒有真正認識到它的有用性,這種想法是不可取的.多元統(tǒng)計分析在教育領(lǐng)域沒有得到很好的應(yīng)用,主要原因是進行教育教學(xué)研究的學(xué)者對統(tǒng)計理論掌握的不深,不知道統(tǒng)計結(jié)果在教育教學(xué)上說明什么;另一方面,對數(shù)據(jù)有一種恐懼感,尤其是對大量的原始數(shù)據(jù)不會處理;再就是對計算機的使用有一定的障礙,即不會使用統(tǒng)計軟件等.基于以上原因,本文就是想利用多元統(tǒng)計分析軟件一SPSS,對所涉與到的高等院校的各個領(lǐng)域進行探討,每個領(lǐng)域都要用到多元統(tǒng)計分析方法對數(shù)據(jù)進行處理,通過統(tǒng)計分析得到的結(jié)論去指導(dǎo)學(xué)生成績的評價,同時也給老師和職能部門進行決策提供理論依據(jù).本文旨在把多元統(tǒng)計分析在學(xué)生成績評價的應(yīng)用進行系統(tǒng)化、具體化,首先介紹多元統(tǒng)計分析的幾種常用的方法,在闡述方法的同時注重這些方法之間的密切聯(lián)系;進而說明這些方法在應(yīng)用時要注意的問題,尤其是因子分析方法在應(yīng)用時涉與到因子個數(shù)的選取問題,本文結(jié)合實際例子來加以論證.其中通過對數(shù)據(jù)進行兩次統(tǒng)計分析結(jié)說明因子分析在具體問題的處理上應(yīng)如何選取因子個數(shù)的問題.其次是根據(jù)大學(xué)生的各科成績利用因子分析方法來對大學(xué)生的綜合素質(zhì)進行評價,在評價的同時論證了高等師X院校在大學(xué)期間所開設(shè)的課程的合理性;利用因子分析的方法對大學(xué)生的成績進行分類,根據(jù)分類的結(jié)果對大學(xué)生的就業(yè)進行具體指導(dǎo)等等.這里主要是針對高校教學(xué)而言,利用多種多元統(tǒng)計分析方法對數(shù)據(jù)進行不同的分析,根據(jù)不同的分析結(jié)果可以指導(dǎo)高校教師做很多細致的工作.本文在教育教學(xué)上有非常好的應(yīng)用價值,給高校教師對學(xué)生的成績進行綜合評價提供了一種科學(xué)、合理的方法.高校教師掌握了這種評價方法,使自己的教育教學(xué)工作更加具有科學(xué)性、合理性和針對性.。第1章學(xué)生成績評價的簡介1.1學(xué)生成績評價的現(xiàn)狀校教育的宗旨是為國家培養(yǎng)高素質(zhì)的人才,學(xué)生成績的評定要有一定的質(zhì)量要求,需要定期考核學(xué)生在德、智、體諸方面的發(fā)展與進步。它是教育領(lǐng)域必須解決的一個問題,一直受到社會學(xué)家、心理學(xué)家和教育研究者的關(guān)注,是當今世界教育十大變革內(nèi)容之一,嚴重影響兒童、年輕人、特別是在校學(xué)生的成長。全面的學(xué)生成績評定系統(tǒng)可以促進同學(xué)們在生理、心理、文化等方面的進步,提高學(xué)習(xí)效率,可以培養(yǎng)他們積極的學(xué)習(xí)心態(tài),樹立正確的世界觀、人生觀、價值觀、道德觀。其評價結(jié)果既能反饋教師的教學(xué)效果,起到診斷、調(diào)節(jié)和強化的作用;又能反饋學(xué)生的學(xué)業(yè)進展,起到激發(fā)學(xué)習(xí)積極性,增強自信心,萌發(fā)學(xué)習(xí)成功的感受等效應(yīng),促使學(xué)生整體素質(zhì)的提高。反之,如果學(xué)生成績評定系統(tǒng)落后或不全面,必將影響學(xué)生的學(xué)習(xí)生活,影響身心健康全面地發(fā)展。目前在高等學(xué)校教學(xué)管理中,學(xué)生考試成績是評價教學(xué)質(zhì)量的重要指標之一。然后一般情況下,教學(xué)管理部門進行學(xué)生成績統(tǒng)計無外乎計算總分、平均分、與格率、優(yōu)秀率等,然后通過總分或平均分對學(xué)生進行排名。這種評價方法簡便易行,指標能夠在一定程度上反映出教師的教學(xué)水平和學(xué)生的學(xué)習(xí)狀況;但是,其不全面性和主觀性顯而易見。而且在高校日常學(xué)生管理中,評定各類獎學(xué)金、保送研究生、向用人單位推薦優(yōu)秀畢業(yè)生等等,都需要從各方面評價學(xué)生成績。如果僅僅以學(xué)生成績的總分或平均分作為依據(jù),已經(jīng)遠遠不能適應(yīng)當今社會的需要。探索出科學(xué)高效的成績綜合評價方法就顯得尤為重要?,F(xiàn)在高等學(xué)校中比較常見的用于評價學(xué)生獎學(xué)金的獲得與否,常常僅僅根據(jù)學(xué)生成績的好壞<平均積點分>來評定并定等級,這樣做的一個弊端就是把成績的好壞作為衡量學(xué)生綜合素質(zhì)的唯一指標,而高校里的其它評優(yōu)都以此為標準,結(jié)果造成這樣一個事實:大學(xué)里只要成績好就行。然而,大學(xué)里影響學(xué)生綜合素質(zhì)的因素不僅僅這些,還有諸如:英語四六級、國家計算機、等級考試、數(shù)學(xué)建模競賽、課外學(xué)術(shù)活動、發(fā)表論文、全國大學(xué)生英語競賽、數(shù)學(xué)競賽等反映學(xué)生智育水平的指標;熱愛集體、樂于助人、積極參與活動、不遲到、不早退等體現(xiàn)學(xué)生個人生禍作風(fēng)的指標;積極向上,銳意進取,自強,自立等體現(xiàn)學(xué)生個人思想作風(fēng)的指標等等,而如果要考慮學(xué)生這些方面的表現(xiàn)比較常見的方法則是根據(jù)下文給出的學(xué)生的綜合測評分來定等級,但目前很多學(xué)者認為已有的這兩種方法都帶有一定的局限性,都不能公正公平的評價大學(xué)生的綜合素質(zhì),因為平均積點分高低反映的僅僅是學(xué)生學(xué)習(xí)成績的好壞,僅僅是學(xué)生學(xué)習(xí)刻苦的程度,對于大學(xué)生來說,僅僅成績好是不夠的,更重要的是要具備良好的思想道德品質(zhì),而綜合測評總分的計算方法是學(xué)生自評互評,班級考評和班主任考評的加權(quán)平均加上德育和智育分,它反映的是班級所有同學(xué)對該生的綜合評價,涉與到該生的為人,性格,成績等各方面的因素,但是帶有一定的主觀性。1.2學(xué)生成績評價的概念在學(xué)校教育中,考試與教學(xué)是不可分割的,考試本身也是一種教學(xué)活動。學(xué)生對待學(xué)習(xí),既有一定的自覺性,也存在一定的惰性。沒有考試的教學(xué)很難保證穩(wěn)定、正常的教學(xué)秩序和水平的提高,就是不完整的教學(xué)。各級各類學(xué)校重視使用考試手段來檢測和監(jiān)控教育質(zhì)量、規(guī)X和引導(dǎo)教師的教學(xué)行為,對督促學(xué)生積極努力地學(xué)習(xí)、培養(yǎng)他們分析問題和解決問題的能力有著非常重要的作用。因此考試成績即學(xué)生的原始成績是最能體現(xiàn)學(xué)生學(xué)習(xí)情況的有力因素。學(xué)生成績評價從狹義是指對一個學(xué)生在某一階段<一學(xué)期或某一學(xué)年>的原始成績進行等級式的劃分。從廣義上指德智體綜合測評,體現(xiàn)出知識教育與素質(zhì)教育的內(nèi)在有機聯(lián)系。顯然,成績評價具有評估、定位和引導(dǎo)等作用。所謂的評估作用,就是通過對學(xué)生進行各種各樣的量化考核,獲得成績,從而得知學(xué)生在校學(xué)習(xí)的好壞程度。當然,在一定程度上也是對有關(guān)教職員工的教學(xué)和管理水平的評價。成績評估的定位作用,是指借助對學(xué)生的成績評估,反映出學(xué)校的辦學(xué)條件、辦學(xué)狀態(tài)、辦學(xué)效果、人才培養(yǎng)質(zhì)量與模式等。成績評估的引導(dǎo)作用,是指通過對學(xué)生進行考核,引導(dǎo)學(xué)生掌握怎樣的知識結(jié)構(gòu)和向什么方向發(fā)展。因此,從表面上來著,學(xué)生的成績考核是針對學(xué)生而言的,實質(zhì)上它具有雙重性,應(yīng)引起全體師生的重視。成績評價是手段,好好學(xué)習(xí)是目的。而對于階段性的評價,比如我們可以從期中階段的成績,經(jīng)過分析評價得到一些對期末階段甚至以后都有用的信息。1.3學(xué)生成績評價的重要性作為一個高等院校,它的根本任務(wù)是通過教學(xué)和教育工作來培養(yǎng)高層次人才,所以教學(xué)工作始終是學(xué)校的中心工作。高等教育的重點和關(guān)鍵是提高整個教育質(zhì)量,而學(xué)生成績恰是評估教學(xué)質(zhì)量的重要依據(jù),也是學(xué)生是否掌握好所學(xué)知識的重要憑證。所以對學(xué)生成績進行分析評價有著重要的意義,并可以把獲取的信息反饋到教學(xué)研究工作中去。只有很好地利用了這些信息,才能準確的了解整個教學(xué)工作,并有效的提高教學(xué)質(zhì)量。因此對考試結(jié)果的數(shù)據(jù)進行挖掘的意義是非常大的,可以科學(xué)的評價教學(xué)質(zhì)量,挖掘隱藏在學(xué)生考試成績中的有用的信息,并統(tǒng)計分析評價結(jié)果,得出一組相對考評的數(shù)據(jù),針對薄弱的學(xué)科做出相應(yīng)的策略,從而提高學(xué)生的總體成績,為提高教學(xué)質(zhì)量提供重要的依據(jù)。1.4對學(xué)生成績評價的作用考試成績是對學(xué)生學(xué)業(yè)的檢查和評定,是從一個側(cè)面對學(xué)校培養(yǎng)專門人才的質(zhì)量檢驗,通過對學(xué)生的學(xué)習(xí)成績進行分析處理,可以與時得到學(xué)生的評價結(jié)果,對學(xué)生出現(xiàn)的某些學(xué)科成績偏低,與時做出補救的措施。成績作為考試的結(jié)果,不僅是對學(xué)生學(xué)業(yè)和教師教學(xué)效果的檢查和評定,進而激勵學(xué)生學(xué)習(xí)與教師工作;更是一種信息,具有反饋于教學(xué)活動、服務(wù)于教育決策、為教育科研提供資料等作用。通過對考試成績的正確分析,對學(xué)生成績進行聚類挖掘,找出某些學(xué)生共同特征,分析某些學(xué)生相對薄弱的學(xué)科成績,引起學(xué)生和老師針對性的加強,更科學(xué)的提高學(xué)生的學(xué)習(xí)成績。所以教學(xué)部門對考試成績進行聚類挖掘和統(tǒng)計分析是不可缺少的,且是非常必要的。根據(jù)以上的介紹,可以總結(jié)出考試成績具有以下幾項主要功能:a.確定學(xué)生的學(xué)業(yè)成就在一個群體中所處的相對位置與確定學(xué)生達到的學(xué)業(yè)水平與教育目標所規(guī)定的學(xué)業(yè)標準之間的差距;b.為教學(xué)管理提供信息和依據(jù);c.為教學(xué)工作提供反饋信息。1.5研究現(xiàn)狀多元統(tǒng)計分析己廣泛地應(yīng)用到社會科學(xué)和自然科學(xué)的許多領(lǐng)域中。特別是在經(jīng)濟、金融、醫(yī)藥等領(lǐng)域應(yīng)用比較廣泛,但是關(guān)于多元統(tǒng)計分析在高校教學(xué)中的應(yīng)用,前人作了很多工作.但是他們所闡述的都是具體針對某一方面的應(yīng)用,只解決了某一方面的問題,在利用多元統(tǒng)計方法上也受到了某種局限性,大部分文獻所利用的多元統(tǒng)計方法都是單一的,沒有多種方法結(jié)合起來應(yīng)用,使得在研究過程中得出的結(jié)論說理性不強;在進行統(tǒng)計分析時所利用的統(tǒng)計軟件版本比較老,給分析帶來了限制,如果用最新版本的軟件可能得到更多的統(tǒng)計信息;文獻中所得到的分析結(jié)果沒有得到很好的解釋和說明.另外,文獻中出現(xiàn)了兩個極端,一但是在教育教學(xué)上的應(yīng)用卻受到了一定的限制。尤其是一些普通高校教師在教學(xué)管理上很少應(yīng)用,以至于影響了他們的工作效率。利用社會科學(xué)統(tǒng)計軟件包一SPSS,對高等師X院校教師所涉與到的各個領(lǐng)域進行探討,能使高校教師的教學(xué)工作有的放矢。成績作為考試的結(jié)果,不僅是對學(xué)生學(xué)業(yè)和教師教學(xué)效果的檢驗和評定,具有激勵學(xué)生學(xué)習(xí)與教師工作,更是一種信息,具有反饋教學(xué)活動、服務(wù)于教育決策、為教育科研提供資料等作用。為充分發(fā)揮考試的效能,綜合評價考試質(zhì)量,與時反饋教學(xué)效果,溝通教學(xué)信息,教學(xué)部門對考試成績進行統(tǒng)計分析和總結(jié)是非常必要的。學(xué)生的個性特征和群體分類特征是學(xué)生管理工作中非常重要的信息,尤其是畢業(yè)生,需要對他們做出綜合評價,以向用人單位提供學(xué)生的各方面特征信息。目前,對學(xué)生綜合評價的一般模型主要有平均分模型、平均學(xué)分積模型等。另外,多元統(tǒng)計分析中的主成分分析、因子分析等也是很好的綜合評價方法,但大多數(shù)大學(xué)或院系都是用前兩種模型即平均成績、平均學(xué)分積模型作為評價學(xué)生的定量依據(jù)。用這兩種方法比較簡單,但有缺點,掩蓋了學(xué)生的個性,不能反映學(xué)生各方面的特點,也反映不出學(xué)生的專業(yè)能力,對學(xué)生作全面的綜合評價來說不是很理想。因此,本文著重突出因子分析方法,力求通過成績給學(xué)生一個相對完美的評價。目前對大學(xué)生成績評定方法的研究取得了很大的進展,主要成果有:比例制、考查制、學(xué)分制、德育考評制度等。大學(xué)生四年學(xué)習(xí)成績是大學(xué)四年學(xué)習(xí)生活的記錄,這些記錄基本反映了該生四年的學(xué)習(xí)情況,但在高校學(xué)生管理中,經(jīng)常需要從各方面評價學(xué)生的成績,如評獎學(xué)金、向用人單位推薦分配學(xué)生等,都需要從各方面評價學(xué)生成績,多元統(tǒng)計分析方法已有應(yīng)用。多元統(tǒng)計分析方法簡介多元統(tǒng)計分析是從經(jīng)典統(tǒng)計學(xué)中發(fā)展起來的一個分支,是一種綜合分析方法,它能夠在多個對象和多個指標互相關(guān)聯(lián)的情況下分析它們的統(tǒng)計規(guī)律,很適合農(nóng)業(yè)科學(xué)研究的特點。主要內(nèi)容包括多元正態(tài)分布與其抽樣分布、多元正態(tài)總體的均值向量和協(xié)方差陣的假設(shè)檢驗、多元方差分析、直線回歸與相關(guān)、多元線性回歸與相關(guān)<Ⅰ>和<Ⅱ>、主成分分析與因子分析、判別分析與聚類分析、Shannon信息量與其應(yīng)用。簡稱多元分析。多元統(tǒng)計方法可以應(yīng)用于學(xué)生成績評價的方法很多,本文主要介紹其中的主成分分析和聚類分析兩種方法。2.1主成分分析主成分分析是利用降維的思想,在損失少量信息的前提下,把多個指標轉(zhuǎn)化為少數(shù)幾個綜合指標的多元統(tǒng)計方法。通常把轉(zhuǎn)化得到的綜合指標稱為主成分,其中每個主成分都是原始變量的線性組合,且各個主成分之間互不相關(guān),使得主成分比原始變量具有某些更優(yōu)越的性能。在實際問題研究中,為了全面、系統(tǒng)地分析問題,通常要考慮影響該問題的多方面的因素,稱這些因素為指標。因為每個指標都在不同程度上反映了所研究問題的某些信息,并且指標之間彼此可能會有一定的相關(guān)性,因而原始指標所反映的信息會彼此有一定程度的重復(fù)。在統(tǒng)計分析多指標問題時,往往因為指標太多而增加了問題研究的復(fù)雜程度,因此在現(xiàn)實問題研究中,希望能通過較少的指標反映較多的信息量。主成分分析通過降維可以簡化指標,使問題變的相對簡單,降低了問題的分析難度,對研究實際問題有著重要意義。主成分分析的基本思想是:將原來的指標做線性組合,依次按照方差最大選取前幾個最能反映原來指標的綜合指標,分別定義為第一主成分、第二主成分、第三主成分……。這些主成分間不僅不相關(guān),而且方差依次遞減。雖然這樣做會損失一些信息,但由于它使我們抓住了主要矛盾,并從原始數(shù)據(jù)中進一步提取了某些新的信息,因而在實際問題研究中得益比損失大,這種既減少了變量的數(shù)目又抓住了主要矛盾的做法有利于問題的分析和處理。在對某一事物進行實證研究時,為了更全面、準確地反映事物特征與其發(fā)展規(guī)律,人們往往要考慮與其有關(guān)系的多個指標,這些指標在多元統(tǒng)計中也稱為變量。這樣就產(chǎn)生了如下問題:一方面人們?yōu)榱吮苊膺z漏重要的信息而考慮盡可能多的指標,另一方面考慮指標的增多而增加了問題的復(fù)雜性,同時由于各指標均是對同一事物的反映,不可避免地千萬信息的大量重疊,這種信息的重疊有時甚至?xí)⑹挛锏恼嬲卣髋c內(nèi)在規(guī)律?;谏鲜鰡栴},人們就希望在宣研究中波與的變量較少,而得到的信息量雙較多。主成分分析法就是把給定的一組相關(guān)指標通過線性變換轉(zhuǎn)成另一組不相關(guān)的指標,轉(zhuǎn)換后的新指標按照方差遞減的順序依次排列。但在變換中保持指標的總方差不變,使得變換后的第一指標具有最大的方差,稱之為第一主成分,第二指標的方差次大,并且和第一指標不相關(guān),稱為第二主成分。依次類推,有i個指標就有i個主成分。2.2聚類分析聚類分析將個體或?qū)ο蠓诸?使得同一類中的對象之間的相似性比與其他類的對象的相似性更強。其目的在于使類間對象的同質(zhì)性最大化和類與類間對象的異質(zhì)性最大化。聚類分析不公可以用來對樣品進行分類,也可以用來對變量進行分類。對樣品的分類常稱為Q型聚類分析,對變量的分類常稱為R型聚類分析。2.2.1聚類分析的方法〔系統(tǒng)聚類分析〕系統(tǒng)聚類法是先將n個元素看成n類,然后將性質(zhì)最接近〔或相似程度最大〕的兩類合成一個新類,得到n-1類。再從中找出最接近的兩類合成一類,得到n-2類。如此重復(fù),最后使所有元素都在一類中。其主要的方法有:1最短距離法2最長距離法3重心法4類平均法5離差平方和法〔Ward法〕2.2.2聚類分析的步驟1分析所需要研究的問題,確定聚類分析所需要的多元變量;2選擇對樣品聚類還是對指標聚類;3選擇合適的聚類方法;4用該聚類方法進行聚類分析。實例分析3.1資料來源以某校數(shù)理學(xué)院本科統(tǒng)計三班36名學(xué)生的三年的21門必修課的考試成績?yōu)榛举Y料,對學(xué)生的成績進行綜合評價.因為選修課的成績不影響學(xué)生成績的綜合評價。各科成績在進行因子分析之前SPSS會自動對原始變量進行標準化;各科成績變量用相應(yīng)的符號表示如下:表1課程名稱與編號表X1高數(shù)X8間序X15運籌學(xué)X2數(shù)學(xué)分析X9經(jīng)濟統(tǒng)計X16數(shù)據(jù)庫程序設(shè)計X3大學(xué)英語X10風(fēng)險管理與保險X17統(tǒng)計預(yù)測與決策X4計算機基礎(chǔ)X11利息理論X18計量經(jīng)濟學(xué)X5馬克思主義基本原理X12概率論X19貨幣銀行學(xué)X6毛中特X13常微分方程IIX20國際金融X7數(shù)理金融X14數(shù)理統(tǒng)計X21國際貿(mào)易理論與實務(wù)3.2主成分分析首先,將原數(shù)據(jù)進行標準化得到:表2標準化原始數(shù)據(jù)表3.2.1spss操作步驟將數(shù)據(jù)導(dǎo)入SPSS中,依次點選Analyze->DateReduction->Factor進入FactorAnalysis對話框。點擊descriptives按鈕,在彈出的對話框中,在correlationmatrix中選擇coefficients?;氐皆瓕υ捒螯c擊右側(cè)的OK,即可得到圖3圖3TotalVarianceExplained由輸出結(jié)果圖3看出,前8個主成分y1,y2,y3,y4,y5,y6,y7,y8的方差和占全部方差的比例為85.789%,即基本上保留了原來的指標的信息,這樣由原來的21個轉(zhuǎn)化為8個新指標,起到了降維的作用。SPSS軟件得到因子載荷矩陣如圖所示:圖4因子載荷矩陣3.2.2主成分系數(shù)求解對SPSS的因子分析模塊運行結(jié)果輸出的ComponentMatrix的第i列的每個元素分別除以第i個特征根的平方根,就得到主成分分析的第i個主成分的系數(shù),如圖表見表5。表5主成分系數(shù)表主成分1主成分2主成分3主成分4主成分5主成分6主成分7主成分810.0292590.008928-0.060790.019098-0.060880.1042890.003005-0.0432420.037874-0.026640.015408-0.01090.030609-0.01088-0.0435-0.081653-0.00340.000586-0.005730.212967-0.03099-0.074170.07573-0.093594-0.01404-0.017880.000786-0.039220.055769-0.001480.2575560.1002350.0245450.00676-0.004940.042295-0.09109-0.069150.263057-0.07876-0.024370.030570.1191670.058307-0.00971-0.00744-0.03865-0.0426870.043579-0.05925-0.00439-0.03692-0.05037-0.051420.0121010.1872038-0.013040.0679620.111012-0.00260.034191-0.11018-0.0062-0.0661490.004628-0.073080.193347-0.07228-0.030220.028334-0.037130.01853410-0.0018-0.00916-0.00693-0.05854-0.065850.30734-0.022320.028288110.00858-0.010890.036838-0.05333-0.025230.085572-0.155080.174298120.0031860.0723580.016678-0.108790.051569-0.04687-0.029120.080344130.0245590.0272450.054944-0.043290.123174-0.1535-0.18071-0.0902914-0.000370.131101-0.098080.033583-0.050430.0066750.0866-0.05519150.047017-0.08345-0.050270.019296-0.0360.0868020.109345-0.0297216-0.00509-0.04851-0.030280.0109940.286337-0.0574-0.02630.04270717-0.011830.005351-0.032060.0086530.001007-0.06610.0786550.37738218-0.00833-0.01772-0.051720.1855550.032693-0.00111-0.035270.026488190.007580.006668-0.00061-0.025980.154936-0.032240.017167-0.0694220-0.03670.17185-0.007460.02046-0.100130.049862-0.05420.07570221-0.01082-0.018930.0121340.038980.1002850.179858-0.03399-0.17466+……-0.01082=0.008928-0.02664+0.000586-0.01788+……-0.08165-0.06079+0.015408-0.00573+0.000786+……+0.0121340.019098-0.0109+0.212967-0.03922+……0.03898………………0.003005-0.0435+0.07573+0.257556+……-0.03399-0.04324-0.08165-0.09359+0.10023+……-0.17466其中,、、、……表示對原始變量標準化后的變量。在用樣本主成分得分進行排序的問題,目前常用的方法是利用主成分做線性組合,并以每個主成分的方差貢獻率作為權(quán)數(shù)構(gòu)造一個綜合評價函數(shù):,依據(jù)計算出的F值大小進行排序或分類劃級。由于可算得值分別為:=0.0409其主成分的得分結(jié)果見表:圖6主成分結(jié)果匯總3.3聚類分析3.3.1spss操作步驟:將原數(shù)據(jù)進行標準化,在菜單的選項中選擇Analyze—>Classify—>Hierarchicalcluster<系統(tǒng)聚類法>。在系統(tǒng)聚類法中,選擇Cases選項,對樣品進行聚類。在Statistics選項中選擇AgglomerationSchedule,聚類方法選擇Whthin-grouplinkage<組內(nèi)聯(lián)結(jié)法>,計算距離選擇平方歐氏距離,輸出樹狀聚類圖7。圖7樹狀聚類圖從輸出結(jié)果圖7即樹狀聚類圖中可以由分類個數(shù)得到分類情況。如果選擇的分類數(shù)為三,則從距離大概為18的地方往下切,得到分兩類的結(jié)果,如果分四類的話,則從距離大概為17的地方往下切,得到分三類的結(jié)果,如果選擇分為五類,則從且分類結(jié)果從16下切即可如下表8。表8聚類結(jié)果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論