應(yīng)用多元統(tǒng)計(jì)分析北大版第一章課件_第1頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析北大版第一章課件_第2頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析北大版第一章課件_第3頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析北大版第一章課件_第4頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析北大版第一章課件_第5頁(yè)
已閱讀5頁(yè),還剩71頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

應(yīng)用多元統(tǒng)計(jì)分析

1應(yīng)用多元統(tǒng)計(jì)分析1

課程介紹

多元統(tǒng)計(jì)分析(簡(jiǎn)稱(chēng)多元分析)是統(tǒng)計(jì)學(xué)的一個(gè)重要分支.它是應(yīng)用數(shù)理統(tǒng)計(jì)學(xué)來(lái)研究多變量(多指標(biāo))問(wèn)題的理論和方法;它是一元統(tǒng)計(jì)學(xué)的推廣和發(fā)展.多元統(tǒng)計(jì)分析是一門(mén)具有很強(qiáng)應(yīng)用性的課程;它在自然科學(xué)和社會(huì)科學(xué)等各個(gè)領(lǐng)域中得到廣泛的應(yīng)用;它包括了很多非常有用的數(shù)據(jù)處理方法.2課程介紹多元統(tǒng)計(jì)分析(簡(jiǎn)稱(chēng)多元分析)第一章緒論第二章多元正態(tài)分布及參數(shù)的估計(jì)第三章多元正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)第四章回歸分析--第五章判別分析第六章聚類(lèi)分析第七章主成分分析第八章因子分析第九章對(duì)應(yīng)分析方法第十章典型相關(guān)分析第十一章偏最小二乘回歸分析本課程的內(nèi)容多變量分析(數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)化)分類(lèi)方法兩組變量的相關(guān)分析基礎(chǔ)理論兩組變量的相依分析3第一章緒論本課程的內(nèi)容多變量分析(數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)化)分類(lèi)方普通高等教育”十一五”國(guó)家級(jí)教材北京大學(xué)數(shù)學(xué)教學(xué)系列叢書(shū)本科生數(shù)學(xué)基礎(chǔ)課教材

應(yīng)用多元統(tǒng)計(jì)分析(北京大學(xué)出版社,高惠璇,2006.10)使用的教材4普通高等教育”十一五”國(guó)家級(jí)教材使用的教材41.實(shí)用多元統(tǒng)計(jì)分析(方開(kāi)泰,1989,見(jiàn)參考文獻(xiàn)[1])2.多元統(tǒng)計(jì)分析引論(張堯庭,方開(kāi)泰,2003,見(jiàn)[2])3.實(shí)用多元統(tǒng)計(jì)分析(王學(xué)仁,1990,見(jiàn)[6])4.應(yīng)用多元分析(王學(xué)民,1999,見(jiàn)[8])5.實(shí)用統(tǒng)計(jì)方法與SAS系統(tǒng)(高惠璇,2001,見(jiàn)[3])6.多元統(tǒng)計(jì)分析(于秀林,1999,見(jiàn)[9])7.多元統(tǒng)計(jì)方法(周光亞,1988,見(jiàn)[28])8.多元分析(英.M.肯德?tīng)?1983,見(jiàn)[15])9.SAS系統(tǒng)使用手冊(cè)等資料(1994-1998,見(jiàn)[17]-[21])參考書(shū)(一)51.實(shí)用多元統(tǒng)計(jì)分析(方開(kāi)泰,1989,見(jiàn)參考文獻(xiàn)[1])(1)AnIntroductiontoMultivariateStatisticalAnalysis

(Anderson1984,見(jiàn)[22])參考書(shū)(二)(2)AppliedMultivariateStatisticalAnalysis(RichardA.JohnsonandDeanW.Wichern4thed1998)

中譯本:實(shí)用多元統(tǒng)計(jì)分析(陸璇譯2001,見(jiàn)[5])

(3)LinearStatisticalInferenceandItsApplications(C.R.Rao1973)中譯本:線(xiàn)性統(tǒng)計(jì)推斷及其應(yīng)用(C.R.勞1987,見(jiàn)[25])6(1)AnIntroductiontoMu

教學(xué)方式:

授課與實(shí)際例題相結(jié)合.本課程的特點(diǎn)與教學(xué)方式

本課程的特點(diǎn)是將常用的多元分析方法的介紹與在計(jì)算機(jī)上實(shí)現(xiàn)這些方法的軟件緊密地結(jié)合起來(lái),不僅介紹每種多元分析方法的實(shí)際背景、統(tǒng)計(jì)思想、統(tǒng)計(jì)模型、數(shù)學(xué)原理和解題的思路,并結(jié)合實(shí)例介紹應(yīng)用統(tǒng)計(jì)軟件(SAS系統(tǒng))解決問(wèn)題的步驟和計(jì)算結(jié)果的分析。7教學(xué)方式:授課與實(shí)際例題相結(jié)合.本課程的特點(diǎn)與教學(xué)

第一章緒論

§1.1引言

在實(shí)際問(wèn)題中,很多隨機(jī)現(xiàn)象涉及到的變量不止一個(gè),而經(jīng)常是多個(gè)變量,而且這些變量間又存在一定的聯(lián)系。我們常常需要處理多個(gè)變量的觀(guān)測(cè)數(shù)據(jù)。例如考察學(xué)生的學(xué)習(xí)情況時(shí),就需了解學(xué)生在幾個(gè)主要科目的考試成績(jī)。

下表給出從中學(xué)某年級(jí)隨機(jī)抽取的12名學(xué)生中5門(mén)主要課程期末考試成績(jī)。8第一章緒論

§1.1引第一章緒論

§1.1引言序號(hào)政治語(yǔ)文外語(yǔ)數(shù)學(xué)物理

199949310010029988969997310098819610049388889996510091729678690788275977757388978989384836888987736076841095829062391176724367781285755034379第一章緒論

§1.1引言序號(hào)政治語(yǔ)第一章緒論

§1.1引言--多元分析的研究對(duì)象和內(nèi)容

上表提供的數(shù)據(jù),如果用一元統(tǒng)計(jì)方法,勢(shì)必要把多門(mén)課程分開(kāi)分析,每次分析處理一門(mén)課的成績(jī)。這樣處理,由于忽視了課程之間可能存在的相關(guān)性,因此,一般說(shuō)來(lái),丟失信息太多。分析的結(jié)果不能客觀(guān)全面地反映某年級(jí)學(xué)生的學(xué)習(xí)情況。本課程要討論的多元分析方法,它同時(shí)對(duì)多門(mén)課程成績(jī)進(jìn)行分析。這樣的分析對(duì)這些課程之間的相互關(guān)系、相互依賴(lài)性等都能提供有用的信息。10第一章緒論

§1.1引言--多元分析的研究對(duì)第一章緒論

§1.1引言--多元分析的研究對(duì)象和內(nèi)容

由于大量實(shí)際問(wèn)題都涉及到多個(gè)變量,這些變量又是隨機(jī)變化,如學(xué)生的學(xué)習(xí)成績(jī)隨著被抽取學(xué)生的不同成績(jī)也有變化(我們往往需要依據(jù)它們來(lái)推斷全年級(jí)的學(xué)習(xí)情況)。所以要討論多維隨機(jī)向量的統(tǒng)計(jì)規(guī)律性。

多元統(tǒng)計(jì)分析就是討論多維隨機(jī)向量的理論和統(tǒng)計(jì)方法的總稱(chēng)。

多元統(tǒng)計(jì)分析研究

的對(duì)象就是多維隨機(jī)向量.11第一章緒論

§1.1引言--多元分析的研究對(duì)第一章緒論

§1.1引言--多元分析的研究對(duì)象和內(nèi)容

研究的內(nèi)容既包括一元統(tǒng)計(jì)學(xué)中某些方法的直接推廣,也包括多個(gè)隨機(jī)變量特有的一些問(wèn)題。多元統(tǒng)計(jì)分析是一類(lèi)范圍很廣的理論和方法。

企圖用三言?xún)烧Z(yǔ)來(lái)下一個(gè)嚴(yán)格的定義是困難的.12第一章緒論

§1.1引言--多元分析的研究對(duì)第一章緒論

§1.1引言--多元分析的研究對(duì)象和內(nèi)容就以學(xué)生成績(jī)?yōu)槔?,我們可以研究很多?wèn)題:用各科成績(jī)的總和作為綜合指標(biāo)來(lái)比較學(xué)生學(xué)習(xí)成績(jī)的好壞(如成績(jī)好的與成績(jī)差的,又如文科成績(jī)好的與理科成績(jī)好的);研究各科成績(jī)之間的關(guān)系(如物理與數(shù)學(xué)成績(jī)的關(guān)系,文科成績(jī)與理科成績(jī)的關(guān)系);……等等。所有這些都屬于多元統(tǒng)計(jì)分析的研究?jī)?nèi)容。

13第一章緒論

§1.1引言--多元分析的研究對(duì)第一章緒論

§1.1引言--多元分析的研究對(duì)象和內(nèi)容

綜上所述,多元分析以p個(gè)變量的n次觀(guān)測(cè)數(shù)據(jù)組成的數(shù)據(jù)矩陣

x11

x12…x1p

x21

x22…x2p….….….….xn1

xn2…xnpX=為依據(jù)。根據(jù)實(shí)際問(wèn)題的需要,給出種種方法。英國(guó)著名統(tǒng)計(jì)學(xué)家M.肯德?tīng)枺∕.G.Kendall)在《多元分析》一書(shū)中把多元分析所研究的內(nèi)容和方法概括為以下幾個(gè)方面:14第一章緒論

§1.1引言--多元分析的研究對(duì)第一章緒論

§1.1引言--多元分析的研究對(duì)象和內(nèi)容

1.簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu)(降維問(wèn)題)

例如通過(guò)變量變換等方法使相互依賴(lài)的變量變成互不相關(guān)的;或把高維空間的數(shù)據(jù)投影到低維空間,使問(wèn)題得到簡(jiǎn)化而損失的信息又不太多.主成分分析,因子分析,對(duì)應(yīng)分析等多元統(tǒng)計(jì)方法就是這樣的一類(lèi)方法。2.分類(lèi)與判別(歸類(lèi)問(wèn)題)

對(duì)所考查的對(duì)象(樣品點(diǎn)或變量)按相似程度進(jìn)行分類(lèi)(或歸類(lèi))。聚類(lèi)分析和判別分析等方法是解決這類(lèi)問(wèn)題的統(tǒng)計(jì)方法。15第一章緒論

§1.1引言--多元分析的研究對(duì)第一章緒論

§1.1引言--多元分析的研究對(duì)象和內(nèi)容

3.變量間的相互聯(lián)系(1)相互依賴(lài)關(guān)系:分析一個(gè)或幾個(gè)變量的變化是否依賴(lài)于另一些變量的變化?如果是,建立變量間的定量關(guān)系式,并用于預(yù)測(cè)或控制---回歸分析.(2)變量間的相互關(guān)系:分析兩組變量間的相互關(guān)系---典型相關(guān)分析等.(3)兩組變量間的相互依賴(lài)關(guān)系---偏最小二乘回歸分析.16第一章緒論

§1.1引言--多元分析的研究對(duì)

第一章緒論

§1.1引言--多元分析的研究對(duì)象和內(nèi)容

5.多元統(tǒng)計(jì)分析的理論基礎(chǔ)

包括多維隨機(jī)向量及多維正態(tài)隨機(jī)向量,及由此定義的各種多元統(tǒng)計(jì)量,推導(dǎo)它們的分布并研究其性質(zhì),研究它們的抽樣分布理論。這些不僅是統(tǒng)計(jì)估計(jì)和假設(shè)檢驗(yàn)的基礎(chǔ),也是多元統(tǒng)計(jì)分析的理論基礎(chǔ)。

4.多元數(shù)據(jù)的統(tǒng)計(jì)推斷

參數(shù)估計(jì)和假設(shè)檢驗(yàn)問(wèn)題.特別是多元正態(tài)分布的均值向量和協(xié)差陣的估計(jì)和假設(shè)檢驗(yàn)等問(wèn)題。17第一章緒論

§1.1引言--多元分析的研究第一章緒論

§1.1引言--多元分析的發(fā)展歷史

多元統(tǒng)計(jì)分析起源于二十世紀(jì)初,1928年Wishart發(fā)表論文《多元正態(tài)總體樣本協(xié)方差陣的精確分布》,可以說(shuō)是多元分析的開(kāi)端.之后R.A.Fisher、H.Hotelling、S.N.Roy、許寶錄等人作了一系列奠基的工作,使多元統(tǒng)計(jì)分析在理論上得到迅速的發(fā)展,在許多領(lǐng)域中也有了實(shí)際應(yīng)用.由于用統(tǒng)計(jì)方法解決實(shí)際問(wèn)題時(shí)需要的計(jì)算量很大,使其發(fā)展受到影響,甚至停滯了相當(dāng)長(zhǎng)的時(shí)間.18第一章緒論

§1.1引言--多元分析的發(fā)展歷史第一章緒論

§1.1引言--多元分析的的發(fā)展歷史

二十世紀(jì)50年代中期,隨著電子計(jì)算機(jī)的出現(xiàn)和發(fā)展,使得多元統(tǒng)計(jì)分析在地質(zhì)、氣象、醫(yī)學(xué)、社會(huì)學(xué)等方面得到廣泛的應(yīng)用.60年代通過(guò)應(yīng)用和實(shí)踐又完善和發(fā)展了理論,由于新理論、新方法的不斷出現(xiàn)又促使它的應(yīng)用范圍更加擴(kuò)大.多元統(tǒng)計(jì)的方法在我國(guó)至70年代初期才受到各個(gè)領(lǐng)域的極大關(guān)注,近30多年來(lái)我國(guó)在多元統(tǒng)計(jì)方法的理論研究和應(yīng)用上也取得了很多顯著成績(jī),有些研究工作已達(dá)到國(guó)際水平,并已形成一支科技隊(duì)伍,活躍在各條戰(zhàn)線(xiàn)上.19第一章緒論

§1.1引言--多元分析的的發(fā)展歷第一章

緒論

§1.2

多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--教育學(xué)

多元統(tǒng)計(jì)分析是解決實(shí)際問(wèn)題有效的數(shù)據(jù)處理方法。隨著電子計(jì)算機(jī)使用的日益普及,多元統(tǒng)計(jì)方法已廣泛地應(yīng)用于自然科學(xué),社會(huì)科學(xué)的各個(gè)方面。以下我們列舉多元分析的一些應(yīng)用領(lǐng)域。從中可看到多元分析應(yīng)用的廣度和深度。1.教育學(xué)

n個(gè)考生報(bào)考北大概率統(tǒng)計(jì)系.每個(gè)考生參加7門(mén)課(語(yǔ)文、數(shù)學(xué)、政治、外語(yǔ)、物理、化學(xué)、生物)的考試,各門(mén)課成績(jī)記為Yj1,Yj2,…,Yj7。又每個(gè)考生在高中學(xué)習(xí)期間,m門(mén)主要課程成績(jī)?yōu)閄j1,Xj2,…,Xjm(j=1,2,…,n

)。經(jīng)對(duì)這大量的資料作統(tǒng)計(jì)分析,我們能夠得出:

20第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--教育學(xué)

(1)高考成績(jī)和高中學(xué)習(xí)期間成績(jī)的關(guān)系,即給出兩組變量線(xiàn)性組合間的關(guān)系,從而可由考生在高中期間的學(xué)習(xí)成績(jī)來(lái)預(yù)報(bào)高考的綜合成績(jī)或某科目的成績(jī).

(2)給出考生成績(jī)次序排隊(duì)的最佳方案(最佳組合).總分可以體現(xiàn)一個(gè)考生成績(jī)好壞,但對(duì)報(bào)考概率統(tǒng)計(jì)系的學(xué)生,按總分從高到低的順序錄取并不是最合適的.應(yīng)按適當(dāng)?shù)臋?quán)數(shù)加權(quán)求和.如數(shù)學(xué)、物理、外語(yǔ)的權(quán)數(shù)相對(duì)高些.

21第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--教育學(xué)

(3)利用n個(gè)學(xué)生在高中學(xué)習(xí)期間m門(mén)主科的考試成績(jī),可對(duì)學(xué)生進(jìn)行分類(lèi),如按文、理科成績(jī)分類(lèi),按總成績(jī)分類(lèi)等。若準(zhǔn)備給優(yōu)秀學(xué)生發(fā)獎(jiǎng),那么一等獎(jiǎng)、二等獎(jiǎng)的比例應(yīng)該是多少?應(yīng)用多元統(tǒng)計(jì)分析的方法可以給出公平合理地確定。22第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用

我在擔(dān)任學(xué)生班主任期間,經(jīng)常會(huì)遇到學(xué)校下達(dá)的評(píng)選三好生,評(píng)選學(xué)習(xí)獎(jiǎng)等任務(wù).另還有評(píng)選各種獎(jiǎng)學(xué)金的工作;推薦研究生的工作都要求班主任提出意見(jiàn).

如何利用全班學(xué)生在校幾年中主要課程的學(xué)習(xí)成績(jī)及各方面的表現(xiàn)更科學(xué),更合理地進(jìn)行評(píng)選?應(yīng)用多元統(tǒng)計(jì)分析中的主成分方法可以給出公平合理地確定.23教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用我教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用

比如全班有40名學(xué)生,本科生四年中主要課程包括基礎(chǔ)課,專(zhuān)業(yè)基礎(chǔ)課,本專(zhuān)業(yè)的限選課,設(shè)共有12門(mén)課.從教務(wù)可以得到全班40名學(xué)生這12門(mén)課的成績(jī),組成的40行12列的數(shù)據(jù)陣X就是我們的原始數(shù)據(jù).

(1)全班學(xué)生綜合成績(jī)的排序

評(píng)選三好生,評(píng)選學(xué)習(xí)獎(jiǎng),推薦研究生的工作首先都要了解全班學(xué)生的學(xué)習(xí)情況.24教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用比如教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用

12門(mén)課的成績(jī)可看成12個(gè)變量,這是多指標(biāo)(變量)系統(tǒng)的排序評(píng)估問(wèn)題。這類(lèi)問(wèn)題在實(shí)際工作中經(jīng)常會(huì)迂到,比如對(duì)某類(lèi)企業(yè)的經(jīng)濟(jì)效益進(jìn)行評(píng)估比較,影響企業(yè)經(jīng)濟(jì)效益的指標(biāo)有很多,如何更科學(xué)、更客觀(guān)地將一個(gè)多指標(biāo)問(wèn)題綜合為單個(gè)綜合變量的形式.

主成分分析方法為樣品排序或多指標(biāo)系統(tǒng)評(píng)估提供可行的方法.

25教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用1教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用

這里把12門(mén)課的成績(jī)看成12個(gè)變量,這些變量是相關(guān)的,有的相關(guān)性強(qiáng)些,有的相關(guān)性一般些。用主成分分析方法從12個(gè)相關(guān)的變量中可以綜合得出幾個(gè)互不相關(guān)的主成分--它們是原始變量的線(xiàn)性組合。其中第一主成分綜合原始變量的信息最多(一般在70%以上),我們就用第一主成分(即單個(gè)綜合指標(biāo))替代原來(lái)的12個(gè)變量;然后計(jì)算第一主成分的得分并進(jìn)行排序。26教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用這教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用最簡(jiǎn)單最直觀(guān)地綜合變量就是12門(mén)課的成績(jī)總和。但這個(gè)最簡(jiǎn)單的綜合變量并不是最科學(xué)地代表12門(mén)課綜合成績(jī)的指標(biāo),而用主成分分析得出的第一主成分(原始變量的線(xiàn)性組合)Z1是最科學(xué)地代表12門(mén)課綜合成績(jī)的指標(biāo)。比如Z1是12個(gè)變量的線(xiàn)性組合,且系數(shù)都是正數(shù),數(shù)值有大有小。顯然數(shù)值大的變量對(duì)綜合指標(biāo)(主成分)的貢獻(xiàn)大;數(shù)值小的變量對(duì)綜合指標(biāo)(主成分)的貢獻(xiàn)小。27教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用最教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用

12個(gè)原始變量(課程)提供的信息各為多少?用什么量來(lái)表達(dá)?最經(jīng)典的方法是用變量的方差Var(Xi)為多少來(lái)表達(dá)。

如果某課程全班學(xué)生的成績(jī)都差不多,比如都是80分左右,則這門(mén)課程在學(xué)生成績(jī)的排序中不起什么作用。這反映在原始變量的線(xiàn)性組合Z1(第一主成分)上該變量對(duì)應(yīng)的系數(shù)會(huì)很?。ㄈ?.1025).

如果另一門(mén)課程全班學(xué)生的成績(jī)相差很大,有的100分,有的只有30多分,則這門(mén)課程在學(xué)生成績(jī)的排序中起的作用很大。這反映在原始變量的線(xiàn)性組合Z1(第一主成分)上該變量對(duì)應(yīng)的系數(shù)會(huì)很大(比如0.4525).28教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用

接著把每個(gè)學(xué)生12門(mén)課程的成績(jī)代入第一主成分Z1中,計(jì)算出每個(gè)學(xué)生第一主成分Z1的得分值,然后按從大到小的次序?qū)θ鄬W(xué)生的第一主成分Z1的得分值進(jìn)行排序。這個(gè)次序作為全班學(xué)生在大學(xué)本科4年中綜合學(xué)習(xí)成績(jī)的順序是更合理更科學(xué)的。

推薦研究生時(shí)可以根據(jù)這個(gè)次序來(lái)依次推薦;評(píng)選綜合學(xué)習(xí)獎(jiǎng)時(shí)也可以根據(jù)這個(gè)次序來(lái)評(píng)選;評(píng)選三好生時(shí)這個(gè)次序也是很有力的依據(jù)。29教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用接教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用

(2)全班學(xué)生加權(quán)綜合成績(jī)的排序

因12門(mén)課程(變量)所得的學(xué)分不同,學(xué)分的多少反映該課程的重要性,在(1)中進(jìn)行排序時(shí)沒(méi)有考慮課程的重要性。由學(xué)分的多少對(duì)變量的重要程度分別賦于不同的權(quán)數(shù).學(xué)分多權(quán)數(shù)大些,學(xué)分少權(quán)數(shù)小些。即設(shè)Xj為第j個(gè)變量(課程)的40名學(xué)生的成績(jī)(觀(guān)測(cè)向量),令

30教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用其中Xj*表示第j門(mén)課程的40名學(xué)生的加權(quán)成績(jī)(觀(guān)測(cè)向量),可取其中N表示12門(mén)課程的總學(xué)分?jǐn)?shù)(如N=50),nj表示第j門(mén)課程的學(xué)分?jǐn)?shù)(如n1=6).

某課程若所得的學(xué)分多(即該課程重要),因乘上的權(quán)數(shù)大,則該門(mén)課程的加權(quán)成績(jī)變大.由此得出的新綜合指標(biāo)(第一主成分)Z1*在該變量上的系數(shù)也會(huì)加大,該變量對(duì)第一主成分Z1*的得分貢獻(xiàn)加大.31教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用其中Xj*教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用把12門(mén)課程的成績(jī)代入第一主成分Z1*中,計(jì)算出每個(gè)學(xué)生第一主成分Z1

*的得分值,然后按從大到小的次序?qū)θ鄬W(xué)生的第一主成分Z1*的得分值進(jìn)行排序。這個(gè)次序可作為全班學(xué)生在大學(xué)本科4年中加權(quán)綜合學(xué)習(xí)成績(jī)的順序。

加權(quán)綜合學(xué)習(xí)成績(jī)的順序與(1)中沒(méi)有加權(quán)的綜合學(xué)習(xí)成績(jī)的順序可能會(huì)稍有些差別.加權(quán)綜合學(xué)習(xí)成績(jī)的順序也許比沒(méi)加權(quán)得出的順序還更合理更科學(xué)的。32教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用把12教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用

同樣地,推薦研究生時(shí)可以根據(jù)這個(gè)更科學(xué)的次序來(lái)依次推薦;評(píng)選綜合學(xué)習(xí)獎(jiǎng)時(shí)也可以根據(jù)這個(gè)更科學(xué)的次序來(lái)評(píng)選;評(píng)選三好生時(shí)這個(gè)更科學(xué)的次序也是很有力的依據(jù)。

33教育學(xué)--

主成分分析在學(xué)生學(xué)習(xí)成績(jī)排序中的應(yīng)用同

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域

2.醫(yī)學(xué)

3.氣象學(xué)

(請(qǐng)參閱教材《應(yīng)用多元統(tǒng)計(jì)分析》P5)34第一章緒論

§1.2多元統(tǒng)

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--醫(yī)學(xué)

2.醫(yī)學(xué)

隨機(jī)抽取300名患有抑郁癥的病人,按照測(cè)量到的指標(biāo),可以將他們分為幾種類(lèi)型---聚類(lèi)問(wèn)題.醫(yī)生對(duì)病人的診斷是靠對(duì)病人觀(guān)測(cè)若干癥狀來(lái)綜合評(píng)定。如一個(gè)人發(fā)高燒,醫(yī)生根據(jù)他的體溫高低、白血球數(shù)目及其它癥狀來(lái)判斷他是得感冒、肺炎還是其它。再如某人發(fā)現(xiàn)腹部有腫瘤,醫(yī)生根據(jù)腫瘤的大小、生長(zhǎng)的速度、邊界是否清楚,質(zhì)硬或軟等癥狀來(lái)判斷腫瘤是良性或惡性---判別問(wèn)題.35第一章緒論

§1.2多元統(tǒng)

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--醫(yī)學(xué)

為了判斷更為準(zhǔn)確可靠,事先應(yīng)有一批經(jīng)專(zhuān)家確診或手術(shù)后經(jīng)病理化驗(yàn)確診的病例資料,根據(jù)這批資料利用多元統(tǒng)計(jì)方法建立診斷的準(zhǔn)則(即專(zhuān)家系統(tǒng))。對(duì)來(lái)就診的病人,按專(zhuān)家系統(tǒng)的要求,觀(guān)測(cè)若干項(xiàng)指標(biāo)后,根據(jù)診斷準(zhǔn)則,即可作出診斷。

36第一章緒論

§1.2多元

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--氣象學(xué)

3.氣象學(xué)

全國(guó)各地建立了很多氣象站,在不同時(shí)間各氣象站都記錄了降雨量、氣溫、氣壓、濕度、風(fēng)速、風(fēng)向等氣象指標(biāo)資料。對(duì)這些資料作統(tǒng)計(jì)分析,可以得出:(1)指標(biāo)間的關(guān)系,如降雨與前一天的氣溫、氣壓、濕度等的關(guān)系,利用該關(guān)系可對(duì)降雨的可能性作預(yù)報(bào)。(2)不同地點(diǎn)、氣象指標(biāo)的關(guān)系。如某地有氣象臺(tái)站,長(zhǎng)期記錄各氣象指標(biāo)的資料。今計(jì)劃在臺(tái)站附近建一大型化工廠(chǎng);廠(chǎng)區(qū)氣象條件是我們關(guān)心的,重建臺(tái)站又不可能。采用的辦法是先在廠(chǎng)區(qū)臨時(shí)建個(gè)觀(guān)測(cè)站,與臺(tái)站同時(shí)測(cè)定氣象指標(biāo)。然后利用這些資料用多元統(tǒng)計(jì)分析方法建立二地氣象指標(biāo)的關(guān)系。以達(dá)到今后可由氣象臺(tái)站的氣象資料來(lái)預(yù)報(bào)廠(chǎng)區(qū)的氣象情況。37第一章緒論

§1.2多元

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--環(huán)境科學(xué)

4.環(huán)境科學(xué)

(1)大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系

湖南岳陽(yáng)化工總廠(chǎng)建廠(chǎng)前沒(méi)有進(jìn)行環(huán)境評(píng)估(因建在文化大革命期間).工廠(chǎng)投產(chǎn)幾年后,發(fā)現(xiàn)污染嚴(yán)重,如很多職工有明顯肝大的癥狀,到底“肝大”是大氣污染造成的,還是其它(如水污染)?故決定進(jìn)行環(huán)境評(píng)估。具體工作有:

①定時(shí)定點(diǎn)測(cè)量大氣中多種污染氣體的濃度,同時(shí)測(cè)量氣象條件;38第一章緒論

§1.2多元環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系

②現(xiàn)場(chǎng)試驗(yàn),如施放大量的海軍煙霧彈作為示蹤物,了解其擴(kuò)散情況,記錄其軌跡。③調(diào)查并統(tǒng)計(jì)了大量的職工體檢資料;④風(fēng)洞模擬試驗(yàn)。

現(xiàn)場(chǎng)觀(guān)測(cè)試驗(yàn)共用了二個(gè)多月的時(shí)間,調(diào)用了很多的人力和物力,收集了大量的資料。我們(多元分析組)參加其中的數(shù)據(jù)處理工作,使用了多元統(tǒng)計(jì)分析的多種方法進(jìn)行數(shù)據(jù)分析處理。

以下是其中的部分工作:39環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系②現(xiàn)場(chǎng)環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系

(一)大氣污染的地區(qū)分類(lèi)

為了了解某大型化工廠(chǎng)對(duì)環(huán)境的污染程度,在廠(chǎng)區(qū)及鄰近地區(qū)有代表性的選25個(gè)監(jiān)測(cè)點(diǎn)(如廠(chǎng)區(qū),生活區(qū),醫(yī)院,學(xué)?!?,每天定時(shí)(2點(diǎn),8點(diǎn),14點(diǎn),20點(diǎn))同時(shí)抽取大氣樣品,測(cè)定其中6種污染氣體(二氧化硫,硫化氫,碳4,…)的濃度,前后4天共16次數(shù)據(jù),對(duì)每個(gè)監(jiān)測(cè)點(diǎn),計(jì)算每種污染氣體16次實(shí)測(cè)值的平均值,得25行6列的數(shù)據(jù)陣X,以下由數(shù)據(jù)陣X出發(fā),進(jìn)行分析處理.40環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系(一)大環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系

用統(tǒng)計(jì)分析方法分析處理這些資料.具體地說(shuō),使用了系統(tǒng)聚類(lèi)分析方法,主成分分析方法,因子分析方法等等.不同的統(tǒng)計(jì)方法分類(lèi)的結(jié)果不完全一致,經(jīng)綜合匯總后,把25個(gè)取樣點(diǎn)按污染情況分為5類(lèi),如分為極嚴(yán)重污染,很?chē)?yán)重污染,嚴(yán)重污染,一般污染和較輕污染五大類(lèi).

41環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系用環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系

若使用對(duì)應(yīng)分析方法,不僅可得出分類(lèi)結(jié)果,還可給出有污染的每一類(lèi)主要的污染氣體(元素).這些分類(lèi)結(jié)果將為今后監(jiān)測(cè)點(diǎn)的布局提供既合理又經(jīng)濟(jì)的方案.如果在25個(gè)監(jiān)測(cè)點(diǎn)以外的其它地方也同時(shí)定點(diǎn)測(cè)量了6種污染氣體的濃度,則由以上的分類(lèi)結(jié)果用判別歸類(lèi)的方法還可給出該地區(qū)的污染分類(lèi).42環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系若使用環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系

(二)職工體檢資料的統(tǒng)計(jì)分析

在23個(gè)監(jiān)測(cè)點(diǎn)附近各隨機(jī)地抽取40人的體驗(yàn)資料,共920人.考查的指標(biāo)(因變量)有:

Y1-78年肝大數(shù)量;Y2-78年的白血球;

Y3-78年血收縮壓;Y4-78年血舒張壓;

Y5至Y8為79年同Y1至Y4的指標(biāo);

Y-78年到79年的肝增大數(shù)量;

43環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系(二)職工環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系

影響這些指標(biāo)的因素(自變量)有:

X1-年齡;X2-工齡;

X3-性別;X4-所在地區(qū)的污染類(lèi)別.我們的目的是找出職工肝大與所在地區(qū)的污染程度是否關(guān)系很顯著.1)用方差分析檢驗(yàn)不同類(lèi)別的污染地區(qū)一年之間肝增大量(Y)是否有顯著性差異?這是個(gè)單因素的方差分析模型,因變量(指標(biāo))為Y,因素為定性(屬性)變量X4.44環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系影響這些指環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系

問(wèn)題可化為假設(shè)檢驗(yàn)問(wèn)題:假設(shè)即假設(shè)5類(lèi)地區(qū)職工中肝的平均增大數(shù)量相等.用920人的觀(guān)測(cè)數(shù)據(jù)來(lái)檢驗(yàn)這個(gè)假設(shè)是否成立.

分析計(jì)算的結(jié)果在=0.01的水平上否定這個(gè)假設(shè).這表明五類(lèi)不同地區(qū)的平均肝增大數(shù)量有顯著性差異.

類(lèi)似地可以把性別(X1)作為因素,檢驗(yàn)?zāi)信毠て骄卧龃髷?shù)量是否有顯著差異.結(jié)果是沒(méi)有明顯差異.45環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系問(wèn)題環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系

這說(shuō)明職工肝大主要是由大氣污染引起的.與性別(或年齡,工齡)無(wú)關(guān),也不是由有些人所說(shuō)是由于水質(zhì)不好引起的.

2)用回歸分析方法建立Y(肝增大數(shù)量)與X1,X2,X3,X4的相關(guān)關(guān)系式.因?yàn)閄3和X4為定性(屬性)變量,建立模型之前先把這兩個(gè)變量數(shù)量化.

X3=0表示女性,X3=1表示男性.46環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系這環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系

由以上討論的大氣污染地區(qū)的分類(lèi)結(jié)果知該地區(qū)的污染情況可分為五類(lèi).引入極嚴(yán)重很?chē)?yán)重嚴(yán)重一般較輕47環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系由以上討環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系

用逐步回歸分析方法計(jì)算得:第1,2,3類(lèi)是污染嚴(yán)重的地區(qū),在這三類(lèi)地區(qū)內(nèi),故

Y=0.4611說(shuō)明住在污染嚴(yán)重地區(qū)的職工于78年至79年間肝平均增大0.4611(厘米);48環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系用逐步回環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系住在第4類(lèi)地區(qū)()的職工,這一年間肝平均增大數(shù)量為

0.4611-0.3486=0.1125;而住在第5類(lèi)地區(qū)()的職工,在這一年間肝平均增大數(shù)量為

0.4611-0.2969=0.1642.總之,以上分析結(jié)果表明,肝大是由大氣污染引起的,與年齡,工齡,性別無(wú)顯著關(guān)系.

其它指標(biāo)的分析結(jié)果這里省略了.

49環(huán)境科學(xué)-

大氣環(huán)境污染的評(píng)估及與職工健康的關(guān)系住在第

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--環(huán)境科學(xué)

4.環(huán)境科學(xué)

(2)許多學(xué)者研究了洛杉磯地區(qū)大氣中污染物質(zhì)的濃度。在較長(zhǎng)的一段時(shí)間內(nèi),每天定時(shí)測(cè)定與污染有關(guān)的幾個(gè)指標(biāo)值。用多元統(tǒng)計(jì)檢驗(yàn)的方法首先判斷洛杉磯地區(qū)空氣污染程度在一周內(nèi)是固定不變或周末與平時(shí)有顯著差異。其次對(duì)這龐雜的觀(guān)測(cè)數(shù)據(jù)用一種易解釋的方法加以歸納化簡(jiǎn)。(3)研究多種污染氣體(CO,CO2,SO2)的濃度與污染源的排放量和氣象因子(風(fēng)向,風(fēng)速,溫度,濕度等)之間的相互關(guān)系.50第一章緒論

§1.2多元

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域

5.地質(zhì)學(xué)

6.考古學(xué)7.服裝工業(yè)--服裝的定型分類(lèi)問(wèn)題8.經(jīng)濟(jì)學(xué)(1)—(4)

9.農(nóng)業(yè)(請(qǐng)參閱教材《應(yīng)用多元統(tǒng)計(jì)分析》P6-7)51第一章緒論

§1.2多元

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--地質(zhì)學(xué)

5.地質(zhì)學(xué)

隨著電子計(jì)算機(jī)的普及以及地質(zhì)科學(xué)向定量化發(fā)展,地質(zhì)學(xué)和數(shù)學(xué)(主要是多元統(tǒng)計(jì)方法)結(jié)合起來(lái)產(chǎn)生了邊緣學(xué)科--數(shù)學(xué)地質(zhì),多元分析是其主要內(nèi)容之一。王學(xué)仁在《地質(zhì)數(shù)據(jù)的多變量統(tǒng)計(jì)分析》一書(shū)中介紹了多元分析方法及在地質(zhì)學(xué)中的應(yīng)用。應(yīng)用多元統(tǒng)計(jì)方法處理各種地質(zhì)觀(guān)測(cè)數(shù)據(jù),對(duì)成礦規(guī)律的評(píng)價(jià),礦產(chǎn)預(yù)測(cè)、構(gòu)造解釋推斷、勘探工程布署等等都得出了一些定量的依據(jù),獲得了一些找礦信息。52第一章緒論

§1.2多元

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--考古學(xué)

6.考古學(xué)

(1)考古學(xué)家根據(jù)一群墳?zāi)怪械呐阍崞罚ㄌ貏e是陶磁和珠寶),利用它們?cè)谑綐雍脱b飾上的差別,把它們按時(shí)間順序排列起來(lái)。

(2)考古學(xué)家對(duì)挖掘出來(lái)的人頭蓋骨可測(cè)得多種數(shù)據(jù)(如高,寬等),利用頭蓋骨的數(shù)據(jù)來(lái)判斷所屬的種族,或判別性別是男或是女。并研究最佳的測(cè)量法以及最少的測(cè)量數(shù)目。(3)考古學(xué)家根據(jù)挖掘出的動(dòng)物牙齒的有關(guān)測(cè)試指標(biāo),判別它是屬于哪類(lèi)動(dòng)物牙齒,是哪一個(gè)時(shí)代的。53第一章緒論

§1.2多元

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--服裝工業(yè)

7.服裝工業(yè)--服裝的定型分類(lèi)問(wèn)題

一個(gè)服裝公司希望生產(chǎn)足夠多的成衣以適應(yīng)大多數(shù)顧客的要求,而且使不合身的和賣(mài)不出去的服裝盡量少。這樣不盡可滿(mǎn)足社會(huì)需要且公司也才可能賺錢(qián)。為此目的,首先在各地做抽樣調(diào)查,對(duì)被調(diào)查人測(cè)量身體幾十個(gè)部位的尺寸,然后對(duì)龐大的調(diào)查資料用多元統(tǒng)計(jì)方法分析處理,確定一種服裝究竟要有幾種型號(hào),每種型號(hào)服裝的比例是多少,由身體的那幾個(gè)主要部位的尺寸決定。54第一章緒論

§1.2多元

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--經(jīng)濟(jì)學(xué)

8.經(jīng)濟(jì)學(xué)

(1)構(gòu)造中國(guó)國(guó)民收入的生產(chǎn)、分配與最終使用的計(jì)量經(jīng)濟(jì)模型。例如根據(jù)我國(guó)1952年~1981年財(cái)政收入與國(guó)民收入、工農(nóng)業(yè)總產(chǎn)值、人口、就業(yè)人口、固定投資等因素有關(guān),用回歸方法建立預(yù)測(cè)模型,用予對(duì)今后的財(cái)政收入作預(yù)測(cè)。(2)在商業(yè)經(jīng)濟(jì)中,常常需要將很復(fù)雜的數(shù)據(jù)綜合成商業(yè)指數(shù)形式,如物價(jià)指數(shù)、貨幣工資比、生活費(fèi)用指數(shù)、商業(yè)活動(dòng)指數(shù)等,用主成分分析可以從多個(gè)變量中構(gòu)造出所需的商業(yè)指數(shù)。55第一章緒論

§1.2多元

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--經(jīng)濟(jì)學(xué)8.經(jīng)濟(jì)學(xué)

(3)為了研究不同地區(qū)農(nóng)民收支的分布規(guī)律,抽樣調(diào)查了全國(guó)28個(gè)省市自治區(qū)的農(nóng)民生活消費(fèi)支出情況,如食品、衣著、燃料、住房、生活用品、文化生活等的消費(fèi)。用聚類(lèi)分析方法對(duì)28個(gè)地區(qū)分類(lèi),根據(jù)分類(lèi)結(jié)果還可進(jìn)一步研究各類(lèi)地區(qū)農(nóng)民的生活水平、富裕程度、以便進(jìn)一步研究經(jīng)濟(jì)發(fā)展對(duì)策。(4)在經(jīng)濟(jì)學(xué)中,根據(jù)人均國(guó)民收入、人均工農(nóng)業(yè)產(chǎn)值、人均消費(fèi)水平等多種指標(biāo)來(lái)判定一個(gè)國(guó)家的經(jīng)濟(jì)發(fā)展程度所屬類(lèi)型。

56第一章緒論

§1.2多元統(tǒng)第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--農(nóng)業(yè)

9.農(nóng)業(yè)

(1)有n個(gè)不同地區(qū),每個(gè)地區(qū)記錄多種農(nóng)作物的收獲量,用多元統(tǒng)計(jì)方法對(duì)各個(gè)地區(qū)的總生產(chǎn)效率進(jìn)行比較,并對(duì)不同的農(nóng)業(yè)區(qū)域進(jìn)行分類(lèi)。(2)為了節(jié)省能源,對(duì)某地農(nóng)用的手扶拖拉機(jī)的能源消耗進(jìn)行抽樣調(diào)查。調(diào)查的內(nèi)容為拖拉機(jī)在田間,運(yùn)輸、排灌、加工等作業(yè)時(shí)的燃油耗,在冊(cè)月數(shù)、年平均更變零件數(shù)及平均燃油耗。通過(guò)對(duì)調(diào)查資料作統(tǒng)計(jì)分析,達(dá)到對(duì)拖拉機(jī)的平均燃油耗作預(yù)測(cè)并對(duì)拖拉機(jī)進(jìn)行分類(lèi),劃分淘汰類(lèi)、大修類(lèi)、小修類(lèi)和繼續(xù)使用類(lèi)。57第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域-

第一章緒論

§1.2

多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--社會(huì)科學(xué)

10.社會(huì)科學(xué)

青少年犯罪問(wèn)題是一個(gè)很大的社會(huì)問(wèn)題。對(duì)待青少年犯罪,我們采取“以防為主、防重干治”的原則。要預(yù)防犯罪,除了加強(qiáng)經(jīng)常性的教育外,還必然提出預(yù)測(cè)犯罪的問(wèn)題。如能對(duì)青少年犯罪心理和行為傾向性在犯罪行為發(fā)生之前便預(yù)測(cè)到,爭(zhēng)取把它消滅在萌芽狀態(tài),才能做到實(shí)際預(yù)防。

58第一章緒論

§1.2多元

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--社會(huì)科學(xué)

為此目的,1981~1982年中央教育科學(xué)研究所等幾個(gè)單位協(xié)作進(jìn)行了調(diào)查研究工作,調(diào)查對(duì)象為一般中學(xué)生及工讀學(xué)校、少管所、勞教農(nóng)場(chǎng)、和勞改農(nóng)場(chǎng)的青少年。59第一章緒論

§1.2多元統(tǒng)社會(huì)科學(xué)-

青少年犯罪的防治與預(yù)測(cè)

具體地說(shuō),使用逐步判別分析方法.利用所調(diào)查的二大方面內(nèi)容:心理因素(如物質(zhì)追求感、隔離感、無(wú)目的感、團(tuán)伙義氣感…)和外部因素(如性別、家庭平均收入、每月零花錢(qián)、住宅面積…)共25項(xiàng)指標(biāo).這些指標(biāo)中有些是屬性指標(biāo),如性別、物質(zhì)追求感等,用于建立判別式之前,先把它們數(shù)量化.60社會(huì)科學(xué)-

青少年犯罪的防治與預(yù)測(cè)具體地說(shuō),使用逐步判社會(huì)科學(xué)-

青少年犯罪的防治與預(yù)測(cè)性別Sex為0表示女,為1表示男;

若調(diào)查表中的物質(zhì)追求感有三種選擇:很強(qiáng),一般和弱,那么可用二個(gè)變量V1,V2來(lái)表示:(V1,V2)=(1,0)表示很強(qiáng),(V1,V2)=(0,1)表示一般,(V1,V2)=(0,0)表示弱.其它的屬性指標(biāo)類(lèi)似處理.

61社會(huì)科學(xué)-

青少年犯罪的防治與預(yù)測(cè)性別Sex為0表示女社會(huì)科學(xué)-

青少年犯罪的防治與預(yù)測(cè)把被調(diào)查的青少年分為幾類(lèi)(根據(jù)所犯罪行),利用調(diào)查資料來(lái)逐步篩選出區(qū)分這幾個(gè)類(lèi)的指標(biāo),然后用這幾個(gè)指標(biāo)建立判別式,并用所得到的判別式對(duì)這些青少年進(jìn)行歸類(lèi),檢驗(yàn)判別式的有效性.

將來(lái)就是要應(yīng)用由這批調(diào)查資料所得的判別式對(duì)另一些青少年進(jìn)行歸類(lèi),及早發(fā)現(xiàn)有問(wèn)題的青少年.

62社會(huì)科學(xué)-

青少年犯罪的防治與預(yù)測(cè)把被調(diào)查的青少年分為社會(huì)科學(xué)-

青少年犯罪的防治與預(yù)測(cè)如果只把青少年分為正常和有問(wèn)題兩類(lèi),那么判別的效果是很滿(mǎn)意的.

如果有問(wèn)題的這一類(lèi)又細(xì)分為:小偷,打架斗毆,流氓,殺人等類(lèi),所建立的判別式的效果就很不理想了,如把打架斗毆被判為小偷,而小偷被判為流氓等等.但是好人,壞人基本上是分清了.

也就是有問(wèn)題的青少年還是可以預(yù)測(cè)出來(lái)的.

63社會(huì)科學(xué)-

青少年犯罪的防治與預(yù)測(cè)如果只把青少年分為正

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--文學(xué)

11.文學(xué)

自從二十世紀(jì)30年代末英國(guó)著名的統(tǒng)計(jì)學(xué)家Yule把統(tǒng)計(jì)方法引入到文學(xué)詞匯的研究以來(lái),這個(gè)領(lǐng)域已經(jīng)取得不少進(jìn)展,最有名的是Mosteller與Wallace在60年代初對(duì)美國(guó)立國(guó)三大歷史文獻(xiàn)之一的《聯(lián)邦主義者》文集的研究.

64第一章緒論

§1.2多元統(tǒng)

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--文學(xué)

在1985,1986年我國(guó)復(fù)旦大學(xué)統(tǒng)計(jì)運(yùn)籌系的李賢平教授對(duì)我國(guó)的名著《紅樓夢(mèng)》的著作權(quán)進(jìn)行研究.使用的統(tǒng)計(jì)方法主要是多元分析.先選定數(shù)十個(gè)與情節(jié)無(wú)關(guān)的虛詞(如:了,嗎,嘛,喱,呢,么,…等)作為變量,把《紅樓夢(mèng)》一書(shū)中的120回作為120個(gè)樣品,統(tǒng)計(jì)每一回(即樣品)選定的這些虛詞(即變量)出現(xiàn)的頻數(shù).由此得到的120行m列的數(shù)據(jù)陣作為分析的依據(jù).65第一章緒論

§1.2多元統(tǒng)

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--文學(xué)

在《紅樓夢(mèng)》的著作權(quán)的研究中使用較多的方法是聚類(lèi)分析,主成分分析,典型相關(guān)分析等方法,由輸出的大量圖形可以看出:(1)前80回和后40回截然地分為兩類(lèi);(2)第67回落入后40回的這一類(lèi)中;(3)前80回廣泛散布,并有若于規(guī)律;(4)后40回依回目的先后可分為幾類(lèi).66第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--文學(xué)

由以上分析結(jié)果可以證實(shí):(1)前80回和后40回不是出于同一個(gè)人的手筆;(2)前80回是否為曹雪芹所寫(xiě)?通過(guò)用曹雪芹的另一著作,做類(lèi)似的分析,結(jié)果證實(shí)了用詞手法完全相同,斷定為曹雪芹一人手筆;(3)而后40回是否為高鶚寫(xiě)的?結(jié)論推翻了后40回是高鶚一人所寫(xiě).后40回的成書(shū)比較復(fù)雜,既有殘稿也有外人筆墨,不是高鶚一人所續(xù).67第一章緒論

§1.2多元

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--文學(xué)

以上這些論證在紅學(xué)界引起轟動(dòng).他們用多元統(tǒng)計(jì)分析方法提出了關(guān)于《紅樓夢(mèng)》作者和成書(shū)過(guò)程的新學(xué)說(shuō).

李賢平教授他們又把這類(lèi)方法用于其他作家和作品,結(jié)果證明統(tǒng)計(jì)方法的分辯能力是很強(qiáng)的.

68第一章緒論

§1.2多元統(tǒng)

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--文學(xué)

從有關(guān)資料中我還看到:1980年美國(guó)華人教授陳先生也用類(lèi)似的統(tǒng)計(jì)方法研究了《紅樓夢(mèng)》的作者.當(dāng)時(shí)把前80回和后40回分開(kāi)成為二部分,又另取《英雄兒女》一書(shū).考慮的用詞有名詞,形容詞和虛詞等.計(jì)算這三部分的相關(guān)系數(shù),得出前80回和后40回的相關(guān)系數(shù)為0.7以上,而與《英雄兒女》的相關(guān)系數(shù)只有0.3.從而得出結(jié)論認(rèn)為前80回和后40回的作者為同一人.69第一章緒論

§1.2多元統(tǒng)

第一章緒論

§1.2多元統(tǒng)計(jì)分析的應(yīng)用領(lǐng)域--其他

12.其他

體育科研軍事科學(xué)生物學(xué)心理學(xué)生態(tài)學(xué)保險(xiǎn)科學(xué)火警預(yù)報(bào)地震預(yù)報(bào)

中醫(yī)陰陽(yáng)學(xué)說(shuō)研究

林業(yè)科學(xué)…….70第一章緒論

§1.2多元統(tǒng)

第一章緒論

§1.3多元統(tǒng)計(jì)數(shù)據(jù)的圖表示法

圖形有助于對(duì)所研究的數(shù)據(jù)的直觀(guān)了解,一維或二維數(shù)據(jù)的圖形容易得到,三維圖形雖也可以畫(huà)出,但并不方便.三維以上圖形如何表示?許多統(tǒng)計(jì)學(xué)家給出了多維數(shù)據(jù)的圖示方法,但這方面的研究還處于不成熟狀態(tài),目前尚未有公認(rèn)的方法.下面介紹幾種國(guó)際上近幾十年來(lái)出現(xiàn)的方法,其中有一些依賴(lài)人工容易實(shí)現(xiàn),但是有一些要是沒(méi)有計(jì)算機(jī)的幫助,恐怕較難實(shí)現(xiàn).設(shè)變量個(gè)數(shù)為p,觀(guān)測(cè)次數(shù)為n,第k次觀(guān)測(cè)值記為

X(k)=(xk1

xk2…xkp)

(k=1,2,…,n)

71第一章緒論

§1.3

第一章緒論

§1.3多元統(tǒng)計(jì)數(shù)據(jù)的圖表示法--輪廓圖

輪廓圖的作圖步驟為:

(1)作直角坐標(biāo)系,橫坐標(biāo)?。饌€(gè)點(diǎn)表示p個(gè)變量.(2)對(duì)給定的一次觀(guān)測(cè)值,在p個(gè)點(diǎn)上的縱坐標(biāo)(即高度)和它對(duì)應(yīng)的變量取值成正比.(3)連接p個(gè)高度的頂點(diǎn)得一折線(xiàn).則一次觀(guān)測(cè)值的輪廓為一條多角折線(xiàn)形.

n次觀(guān)測(cè)值可畫(huà)出n條折線(xiàn),構(gòu)成輪廓圖.

72第一章緒論

§1.3

第一章緒論

§1.3多元統(tǒng)計(jì)數(shù)據(jù)的圖表示法--輪廓圖

表1.1中12個(gè)學(xué)生學(xué)習(xí)成績(jī)的輪廓圖如下:政治語(yǔ)文外語(yǔ)數(shù)學(xué)物理10073第一章緒論

§1.3

第一章緒論

§1.3多元統(tǒng)計(jì)數(shù)據(jù)的圖表示法--輪廓圖

由輪廓圖可直觀(guān)看出,哪幾個(gè)學(xué)生成績(jī)相似,哪些屬優(yōu)秀、哪些中等、哪些較差,對(duì)幾門(mén)課程可直觀(guān)地看成績(jī)的好壞,分散情況等等.這種圖形在聚類(lèi)分析中頗有幫助.

74第一章緒論

§1.3

第一章緒論

§1.3多元統(tǒng)計(jì)數(shù)據(jù)的圖表示法--雷達(dá)圖

雷達(dá)圖的作圖步驟是:

(1)作一圓,并把圓周分為p等分.(2)連接圓心和各分點(diǎn),把這p條半徑依次定義為各變量的坐標(biāo)軸,并標(biāo)以適當(dāng)?shù)目潭?(3)對(duì)給定的一次觀(guān)測(cè)值,把p個(gè)變量值分別點(diǎn)在相應(yīng)的坐標(biāo)軸上,然后連接成一個(gè)p邊形.n次觀(guān)測(cè)值可畫(huà)出n個(gè)p邊形.75第一章緒論

§1.3

第一章緒論

§1.3多元統(tǒng)計(jì)數(shù)據(jù)的圖表示法--雷達(dá)圖

政治語(yǔ)文外語(yǔ)數(shù)學(xué)物理12176第一章緒論

§1.3

第一章緒論

§1.3多元統(tǒng)計(jì)數(shù)據(jù)的圖表示法--雷達(dá)圖

這種圖形既象雷達(dá)熒光屏上看到的圖象,也象個(gè)蜘蛛網(wǎng).因此有人稱(chēng)為雷達(dá)圖,也有人稱(chēng)為蜘蛛圖.以上圖形中畫(huà)出表1.1中第一

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論