版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
SPSS統(tǒng)計分析基礎(chǔ)教程主講人:彭超SPSS統(tǒng)計分析基礎(chǔ)教程主講人:彭超1課程目的應(yīng)用統(tǒng)計學(xué)理解統(tǒng)計數(shù)據(jù)分析主要方法的基本理論掌握基本統(tǒng)計方法在實踐中的應(yīng)用能熟練運用SPSS軟件實現(xiàn)數(shù)據(jù)分析建立起獨立運用統(tǒng)計方法解決實際問題的基礎(chǔ)能力課程目的應(yīng)用統(tǒng)計學(xué)2參考書目:1、《統(tǒng)計學(xué):從數(shù)據(jù)到結(jié)論》(第2版)吳喜之著,中國統(tǒng)計出版社,2006。2、《統(tǒng)計分析與SPSS的應(yīng)用》,薛薇編著,中國人民大學(xué)出版社,2001。3、《SPSS統(tǒng)計分析教程》,李志輝等主編,電子工業(yè)出版社,2003。4、《社會統(tǒng)計方法——SPSS軟件應(yīng)用》,郭志剛主編,中國人民大學(xué)出版社,1999。參考書目:1、《統(tǒng)計學(xué):從數(shù)據(jù)到結(jié)論》(第2版)吳喜之著,中3第一章一些基本概念第一章一些基本概念4什么是統(tǒng)計呢?報表?數(shù)字?你覺得你們需要統(tǒng)計嗎?為什么?SPSS統(tǒng)計分析基礎(chǔ)教程課件5§1.1統(tǒng)計是什么?統(tǒng)計是人類思維的一個歸納過程站在一個路口,看到每過去20輛小轎車時,也有100輛自行車通過而且平均每10個轎車載有12個人于是,你認(rèn)為小汽車和自行車在這個路口的運載能力為24:100這是一個典型的統(tǒng)計思維過程§1.1統(tǒng)計是什么?統(tǒng)計是人類思維的一個歸納過程6§1.1統(tǒng)計是什么?一般來說,統(tǒng)計先從現(xiàn)實世界收集數(shù)據(jù)(信息),如經(jīng)濟(jì)增長然后,根據(jù)數(shù)據(jù)作出判斷,稱為模型模型是從數(shù)據(jù)產(chǎn)生的模型也需要根據(jù)新的信息來改進(jìn)不存在完美的模型模型的最終結(jié)局都是被更能夠說明現(xiàn)實世界的新模型所取代§1.1統(tǒng)計是什么?一般來說,統(tǒng)計先從現(xiàn)實世界收集數(shù)據(jù)(信7§1.1統(tǒng)計是什么?比如說,經(jīng)濟(jì)生產(chǎn)的模型§1.1統(tǒng)計是什么?比如說,經(jīng)濟(jì)生產(chǎn)的模型8統(tǒng)計學(xué)可以應(yīng)用于幾乎所有的領(lǐng)域:精算,農(nóng)業(yè),動物學(xué),人類學(xué),考古學(xué),審計學(xué),晶體學(xué),人口統(tǒng)計學(xué),牙醫(yī)學(xué),生態(tài)學(xué),經(jīng)濟(jì)計量學(xué),教育學(xué),選舉預(yù)測和策劃,工程,流行病學(xué),金融,水產(chǎn)漁業(yè)研究,遺傳學(xué),地理學(xué),地質(zhì)學(xué),歷史研究,人類遺傳學(xué),水文學(xué),工業(yè),法律,語言學(xué),文學(xué),勞動力計劃,管理科學(xué),市場營銷學(xué),醫(yī)學(xué)診斷,氣象學(xué),軍事科學(xué),核材料安全管理,眼科學(xué),制藥學(xué),物理學(xué),政治學(xué),心理學(xué),心理物理學(xué),質(zhì)量控制,宗教研究,社會學(xué),調(diào)查抽樣,分類學(xué),氣象改善,博彩等。統(tǒng)計學(xué)可以應(yīng)用于幾乎所有的領(lǐng)域:精算,農(nóng)業(yè),動物學(xué),人類學(xué),9§1.1統(tǒng)計是什么?一句話,統(tǒng)計學(xué)(statistics)是用以收集數(shù)據(jù),分析數(shù)據(jù)和由數(shù)據(jù)得出結(jié)論的一組概念、原則和方法。§1.1統(tǒng)計是什么?一句話,10以歸納為主要思維方式的統(tǒng)計不是以演繹為主的數(shù)學(xué)統(tǒng)計可應(yīng)用于各個不同學(xué)科,在有些學(xué)科已經(jīng)有其特有的方法和特點;如生物統(tǒng)計(biostatistics)、經(jīng)濟(jì)計量學(xué)(econometrics)以及目前很熱門的生物信息(bioinformation)和數(shù)據(jù)挖掘(DataMining)的方法主體都是統(tǒng)計。以歸納為主要思維方式的統(tǒng)計不是以演繹為主的數(shù)學(xué)11你想過下面的問題嗎?當(dāng)你買了一臺電視時,被告知三年內(nèi)可以免費保修。你想過廠家憑什么這樣說嗎?說多了,廠家會損失;說少了,會失去競爭,也是損失。到底這個保修期是怎樣決定的呢?大學(xué)排名是一個非常敏感的問題。不同的機構(gòu)得出不同的結(jié)果;各自都說自己是客觀、公正和有道理的。到底如何理解這些不同的結(jié)果呢?你想過下面的問題嗎?當(dāng)你買了一臺電視時,被告知三年內(nèi)可以免費12你想過下面的問題嗎?任何公司都有一個信用問題。當(dāng)然,在這些公司試圖得到貸款時并沒有不還貸的不良記錄。如何根據(jù)它們的財務(wù)和商業(yè)資料來判斷一個公司的信用等級呢?我國東部和西部的概念是一個比較籠統(tǒng)的概念。如何能夠根據(jù)需要,選擇一些指標(biāo)來把各省,或各市縣甚至村進(jìn)行分類呢?疾病傳播時,如何能夠通過感染者入院前后的各種因素得到一個疾病傳染方式的模型呢?你想過下面的問題嗎?任何公司都有一個信用問題。當(dāng)然,在這些公13你想過下面的問題嗎?如何通過大眾調(diào)查來得到性別、年齡、職業(yè)、收入等各種因素與公眾對某項事物(比如商品或政策)的態(tài)度的關(guān)系呢?一個從來沒有研究過紅樓夢的統(tǒng)計學(xué)家如何根據(jù)比較寫作習(xí)慣得出紅樓夢從哪一段開始就不是曹雪芹的手筆了呢?如何才能夠客觀地得到某個電視節(jié)目的收視率,以確定廣告的價格是否合理呢?你想過下面的問題嗎?如何通過大眾調(diào)查來得到性別、年齡、職業(yè)、14你如何理解下面說法?“明天降水概率為40%”“我冬天去新加坡度假的概率為10%”“該節(jié)目收視率是30%”“調(diào)查結(jié)果表明20%的觀眾喜歡某節(jié)目”“抽樣調(diào)查結(jié)果的誤差為±3%”“支持率的95%置信區(qū)間為(25%,30%)”“某學(xué)校排名第一”“某縣是貧困縣”你如何理解下面說法?“明天降水概率為40%”15你如何理解下面說法?“某國的綜合競爭力排名第43位”“該國家屬于發(fā)展中國家”“該藥品療效99%”“該國貧富差距大”“這個縣收入比那個縣高”“該結(jié)果統(tǒng)計顯著”“消費價格指數(shù)為120%”“他的血壓已經(jīng)正常了”你如何理解下面說法?“某國的綜合競爭力排名第43位”16可以想象出的統(tǒng)計應(yīng)用例子如何確定觀眾/聽眾是否忠實于某節(jié)目(專欄)如何對電視節(jié)目排名次什么因素影響一個節(jié)目的收視率如何按照各種不同環(huán)境估計某商店的顧客人數(shù)如何按照各種指標(biāo)評價雇員如何把地區(qū)(市縣鎮(zhèn)等)按照各種指標(biāo)分類如何確定紅樓夢第幾回不是曹雪芹所寫如何確定一個產(chǎn)品的可靠性如何進(jìn)行偏差較少的民意調(diào)查如何根據(jù)一些財務(wù)數(shù)據(jù)發(fā)現(xiàn)漏稅的嫌疑單位?可以想象出的統(tǒng)計應(yīng)用例子如何確定觀眾/聽眾是否忠實于某節(jié)目(17你相信統(tǒng)計結(jié)果嗎?數(shù)據(jù)可以有誤或作假統(tǒng)計方法(有意或無意)使用不當(dāng)可以誤導(dǎo)。有低級誤導(dǎo)和高級誤導(dǎo)。常識判斷和直覺是重要的你相信統(tǒng)計結(jié)果嗎?數(shù)據(jù)可以有誤或作假18關(guān)于美國選舉的兩個例子(1)誰會在1936選舉中獲勝?AlfLondon還是
F.D.R.(羅斯福)?LiteraryDigest
(文摘)送出一千萬份問卷(返回二百四十萬份)后,預(yù)測London會贏.而Gallop(蓋洛普)只問了5000人說
Roosevelt(羅斯福)會贏.最后羅斯福和蓋洛普都贏了.文摘倒閉了.關(guān)于美國選舉的兩個例子(1)誰會在1936選舉中獲勝?Al19誰會在1948選舉中獲勝?ThomasDewey還是HarryTruman(杜魯門)?Crossley,Gallop(蓋洛普),Roper所有都預(yù)測Dewey會贏(每個機構(gòu)用了5000個問卷).最后(包括蓋洛普)他們都輸了,而杜魯門贏了.關(guān)于美國選舉的兩個例子(2)誰會在1948選舉中獲勝?ThomasDewey還是H20統(tǒng)計的一些做法統(tǒng)計可以指導(dǎo)我們收集數(shù)據(jù).當(dāng)擁有來自一些變量(指標(biāo))的數(shù)據(jù)或記錄,但缺乏模型來描述這些變量之間關(guān)系的情況下,可用統(tǒng)計方法建立模型.在有了一定的模型時,統(tǒng)計可以確定手中數(shù)據(jù)是否令人信服地支持某種論點.模型也用來對未來進(jìn)行預(yù)測.統(tǒng)計直觀的圖表展示,可以使各個領(lǐng)域的專家容易理解統(tǒng)計的一些做法統(tǒng)計可以指導(dǎo)我們收集數(shù)據(jù).21中國統(tǒng)計的獨特歷史環(huán)境中國統(tǒng)計過去分為“統(tǒng)計學(xué)”(文科的列寧主義統(tǒng)計)和“數(shù)理統(tǒng)計”(數(shù)學(xué)類的國際意義上的統(tǒng)計)中國統(tǒng)計的獨特歷史環(huán)境中國統(tǒng)計過去分為“統(tǒng)計學(xué)”(文科的列寧22國內(nèi)一些學(xué)者把統(tǒng)計稱為是經(jīng)濟(jì)學(xué)科的一部分,則是中國特有的與前蘇聯(lián)關(guān)聯(lián)的國情所造成;讀者可以從《蘇聯(lián)大百科全書》的統(tǒng)計學(xué)條款得到答案。但前蘇聯(lián)的經(jīng)濟(jì)學(xué)中的統(tǒng)計學(xué)概念是其意識形態(tài)和計劃經(jīng)濟(jì)體系的產(chǎn)物,其模型多屬于小學(xué)數(shù)學(xué)水平,很難稱為數(shù)學(xué)模型。這與現(xiàn)代經(jīng)濟(jì)學(xué)所需要的大量的統(tǒng)計和數(shù)學(xué)形成鮮明對照.前蘇聯(lián)式的“統(tǒng)計學(xué)”不是目前國際流行意義上的統(tǒng)計學(xué)或統(tǒng)計學(xué)的分支。國內(nèi)一些學(xué)者把統(tǒng)計稱為是經(jīng)濟(jì)學(xué)科的一部分,則是中國特有的與前23統(tǒng)計的內(nèi)容和需要的知識數(shù)學(xué)的幾乎所有內(nèi)容(不一定事先知道需要什么)用計算機做統(tǒng)計計算其他(對象)領(lǐng)域的知識統(tǒng)計的內(nèi)容和需要的知識數(shù)學(xué)的幾乎所有內(nèi)容(不一定事先知道需要24統(tǒng)計和數(shù)學(xué)的區(qū)別數(shù)學(xué)思維是以演繹為主統(tǒng)計思維是以歸納為主,兼有演繹統(tǒng)計各領(lǐng)域利用幾乎所有存在的數(shù)學(xué)內(nèi)容.但統(tǒng)計本身的數(shù)學(xué)是為具體目標(biāo)服務(wù)的,自己一般不形成數(shù)學(xué)體系統(tǒng)計和數(shù)學(xué)的區(qū)別數(shù)學(xué)思維是以演繹為主25計算機的重要性由于統(tǒng)計和數(shù)據(jù)打交道,沒有計算機的發(fā)展統(tǒng)計就沒有前途.計算機和統(tǒng)計的發(fā)展相輔相成計算機的重要性由于統(tǒng)計和數(shù)據(jù)打交道,沒有計算機的發(fā)展統(tǒng)計就沒26§1.2現(xiàn)實中的隨機性和規(guī)律性從中學(xué)起,我們就知道自然科學(xué)的許多定律,例如物理中的牛頓三定律,物質(zhì)不滅定律以及化學(xué)中的各種定律等等。但是在許多領(lǐng)域,很難用如此確定的公式或論述來描述一些現(xiàn)象。比如,人的壽命是很難預(yù)先確定的。一個吸煙、喝酒、不鍛煉、而且一口長葷的人可能比一個很少得病、生活習(xí)慣良好的人活得長。因此,可以說,活得長短是有一定隨機性的(randomness)。這種隨機性可能和人的經(jīng)歷、基因、習(xí)慣等無數(shù)說不清的因素都有關(guān)系。§1.2現(xiàn)實中的隨機性和規(guī)律性從中學(xué)起,我們就知道自然科學(xué)的27現(xiàn)實中的隨機性和規(guī)律性但是從總體來說,我國公民的平均年齡卻是非常穩(wěn)定的。而且女性的平均年齡也穩(wěn)定地比男性高幾年。這就是規(guī)律性。一個人可能活過這個平均年齡,也可能活不到這個年齡,這是隨機的。但是總體來說,平均年齡的穩(wěn)定性,卻說明了隨機之中有規(guī)律性。這種規(guī)律就是統(tǒng)計規(guī)律?,F(xiàn)實中的隨機性和規(guī)律性但是從總體來說,我國公民的平均年齡卻是28概率和機會你可能經(jīng)常聽到概率(probability)這個名詞。例如在天氣預(yù)報中會提到降水概率。大家都明白,如果降水概率是百分之九十,那就很可能下雨;但如果是百分之十,就不大可能下雨。因此,從某種意義說來,概率描述了某件事情發(fā)生的機會。顯然,這種概率不可能超過百分之百,也不可能少于百分之零。換言之,概率是在0和1之間的一個數(shù),說明某事件發(fā)生的機會有多大。概率和機會你可能經(jīng)常聽到概率(probability)這個名29有些概率是無法精確推斷的比如你對別人說你下一個周末去公園的概率是百分之八十。但你無法精確說出為什么是百分之八十而不是百分之八十四或百分之七十八。其實你想說的是你很可能去,但又沒有完全肯定。實際上,到了周末,你或者去,或者不去;不可能有分身術(shù)把百分之八十的你放到公園,而其余的放在別處。有些概率是無法精確推斷的比如你對別人說你下一個周末去公園的概30有些概率是可以估計的比如擲骰子。只要沒有人在骰子上做手腳,你得到6點的概率應(yīng)該是六分之一。得到其他點的概率也是一樣。得到6的概率或者機會是可以知道的,但擲骰子的結(jié)果還只可能是六個數(shù)目之一。這個已知的規(guī)律就反映了規(guī)律性,而得到哪個結(jié)果則反映了隨機性。如果你擲1000次骰子,那么,大約有六分之一的可能會得到6;這也是隨機性呈現(xiàn)有規(guī)律的一個體現(xiàn)。有些概率是可以估計的比如擲骰子。只要沒有人在骰子上做手腳,你31§1.3變量和數(shù)據(jù)一節(jié)火車車廂有多少坐位是一個固定的數(shù)目,稱為常數(shù)(constant)或者常量。但是,開車后,坐在這節(jié)車廂的旅客有多少就沒準(zhǔn)了。這有隨機性。該車廂的乘客數(shù)為變量(variable)?!?.3變量和數(shù)據(jù)一節(jié)火車車廂有多少坐位是一個固定的數(shù)目,32§1.3變量和數(shù)據(jù)一個學(xué)校的注冊在校男女生比例是固定的,為常量但是,該校任意一群學(xué)生的男女生比例就不一定和全校的比例一樣了,它為變量(variable)。§1.3變量和數(shù)據(jù)一個學(xué)校的注冊在校男女生比例是固定的,為33§1.3變量和數(shù)據(jù)當(dāng)變量按照隨機規(guī)律所取的值是數(shù)量時該變量稱為定量變量或數(shù)量變量(quantitativevariable);因為是隨機的,也稱為隨機變量(randomvariable)。如身高體重,購買某商品的人數(shù)等等SPSS主要為Numeric§1.3變量和數(shù)據(jù)當(dāng)變量按照隨機規(guī)律所取的值是數(shù)量時該變量34§1.3變量和數(shù)據(jù)象性別,觀點之類的取非數(shù)量值的變量就稱為定性變量或?qū)傩宰兞炕蚍诸愖兞?qualitativevariable,或categoricalvariable)。這些定性變量也可以由定量變量來描述,如男女生的數(shù)目,持有某觀點的人數(shù)比例等等?!?.3變量和數(shù)據(jù)象性別,觀點之類的取非數(shù)量值的變量就稱為35§1.3變量和數(shù)據(jù)定性變量只有用數(shù)量來描述時,才有可能建立數(shù)學(xué)模型,并使用計算機來分析。數(shù)據(jù)中它們通常用啞元(dummyvariable)代表,比如性別用0、1代表,三種收入用0、1、2代表(或用字母代表)SPSS中沒有特別的變量,往往用數(shù)值表示§1.3變量和數(shù)據(jù)定性變量只有用數(shù)量來描述時,才有可能建立36§1.3變量和數(shù)據(jù)有了變量,何謂數(shù)據(jù)?不同機構(gòu)調(diào)查所得到的北京收入萬元以上市民的比例都不一樣,這是變量而這些調(diào)查產(chǎn)生一些數(shù)目,這些數(shù)目就是數(shù)據(jù)(data)數(shù)據(jù)是關(guān)于變量的觀測值。§1.3變量和數(shù)據(jù)有了變量,何謂數(shù)據(jù)?37§1.3變量和數(shù)據(jù)通過數(shù)據(jù)可驗證有關(guān)的理論或假定。比如通過抽樣調(diào)查驗證美國選民對共和黨候選人的支持率是否超過50%通過抽樣,可以檢驗?zāi)撑a(chǎn)品是否合格等等§1.3變量和數(shù)據(jù)通過數(shù)據(jù)可驗證有關(guān)的理論或假定。38§1.4變量之間的關(guān)系現(xiàn)實世界緊密聯(lián)系的人們想知道投資方式和經(jīng)濟(jì)效益之間的關(guān)系、旅客人數(shù)和經(jīng)濟(jì)發(fā)展之間的關(guān)系等等不討論變量之間的關(guān)系,就無從談起任何有深度的應(yīng)用,統(tǒng)計的基本概念就僅僅是擺設(shè)而已。§1.4變量之間的關(guān)系現(xiàn)實世界緊密聯(lián)系的39§1.4.1定量變量間的關(guān)系例1.1.廣告投入和銷售之間的關(guān)系。下表(數(shù)據(jù)ads.sav)顯示了某企業(yè)的廣告投入和銷售額之間的關(guān)系(萬元)?!?.4.1定量變量間的關(guān)系例1.1.廣告投入和銷售之間的40橫坐標(biāo)代表廣告投入,而縱坐標(biāo)代表銷售收入。看得出有何種關(guān)系嗎?橫坐標(biāo)代表廣告投入,而縱坐標(biāo)代表銷售收入。41§1.4.1定量變量間的關(guān)系能否從該數(shù)據(jù)回答下面問題:這兩個變量是否有關(guān)系?如果有,它們的關(guān)系是否顯著?這些關(guān)系是什么關(guān)系,能否用數(shù)學(xué)模型來描述?這個關(guān)系是否帶有普遍性?這個關(guān)系是不是因果關(guān)系?§1.4.1定量變量間的關(guān)系能否從該數(shù)據(jù)回答下面問題:42§1.4.1定量變量間的關(guān)系關(guān)于因果關(guān)系在可控制的試驗中,較容易找到因果關(guān)系;比如治療方式和療效的關(guān)系等但是,一般來說,變量之間有關(guān)系這個事實并不意味著一定存在明確的因果關(guān)系?!?.4.1定量變量間的關(guān)系關(guān)于因果關(guān)系43§1.4.1定量變量間的關(guān)系比如,北京GDP在一年中是快速增長的,而一個剛出生的巴拿馬嬰兒在這一年中的體重也是快速增長的如果畫出圖來,它們有類似線性的關(guān)系但它們顯然沒有因果關(guān)系§1.4.1定量變量間的關(guān)系比如,北京GDP在一年中是快速44§1.4.1定量變量間的關(guān)系只要有關(guān)系,即使不是因果關(guān)系也不妨礙人們利用這種關(guān)系來進(jìn)行推斷。比如利用公雞打鳴來預(yù)報太陽升起;雖然公雞打鳴絕對不是日出的原因(雖然打鳴發(fā)生在先)§1.4.1定量變量間的關(guān)系只要有關(guān)系,即使不是因果關(guān)系也45§1.4.1定量變量間的關(guān)系簡單的辦法(諸如畫圖)可以得到一些信息,但不一定能夠給出滿意的答案需要更多的工具和手段來進(jìn)行數(shù)值分析得到更加嚴(yán)格和精確的解答因此,需要繼續(xù)我們的課程§1.4.1定量變量間的關(guān)系簡單的辦法(諸如畫圖)可以得到46§1.4.2定性變量間的關(guān)系例1.2.下面是對123人進(jìn)行關(guān)于某項政策調(diào)查所得結(jié)果的一個簡單的三維表,它顯示了人們的收入和性別對該項政策的觀點。(table7.sav)。§1.4.2定性變量間的關(guān)系例1.2.下面是對123人進(jìn)行47計算機軟件所應(yīng)用的數(shù)據(jù)形式計算機軟件所應(yīng)用的數(shù)據(jù)形式48§1.4.2定性變量間的關(guān)系從這個數(shù)據(jù),希望可以看出收入、性別對觀點是否有影響及如何影響如果要得到更加精確的結(jié)論,就要進(jìn)行進(jìn)一步的分析和計算這是后面列聯(lián)表分析或多項分布對數(shù)線性模型的內(nèi)容§1.4.2定性變量間的關(guān)系從這個數(shù)據(jù),希望可以看出收入、49§1.4.3定性和定量變量間的混和關(guān)系有些數(shù)據(jù)不是僅有定性變量或僅有定量變量需要知道包括定性和定量兩種變量的一些變量之間的關(guān)系下面數(shù)據(jù)就包含兩種變量§1.4.3定性和定量變量間的混和關(guān)系有些數(shù)據(jù)不是僅有定性50Asthma.sav數(shù)據(jù)Asthma.sav數(shù)據(jù)51§1.4.3定性和定量變量間的混和關(guān)系該數(shù)據(jù)有2個定性變量(性別,污染程度)、一個定量變量(年齡)以及發(fā)生哮喘的人數(shù)我們希望知道哮喘和這三個變量之間的關(guān)系這將在Poisson對數(shù)線性模型中討論§1.4.3定性和定量變量間的混和關(guān)系該數(shù)據(jù)有2個定性變量52§1.5統(tǒng)計、計算機與統(tǒng)計軟件現(xiàn)代生活越來越離不開計算機了最初的計算機僅僅是為科學(xué)計算而設(shè)計和建造的。統(tǒng)計是大型計算機的最早用戶,現(xiàn)在仍然是數(shù)值計算的主要用戶§1.5統(tǒng)計、計算機與統(tǒng)計軟件現(xiàn)代生活越來越離不開計算機了53§1.5統(tǒng)計、計算機與統(tǒng)計軟件計算機的使用,從計算機語言到“傻瓜式”地點擊鼠標(biāo)輸出結(jié)果也從數(shù)字輸出到各種可以想象得到的形式。輸入數(shù)據(jù),點鼠標(biāo)做一些選項,就可得到漂亮結(jié)果但其中充滿了危險的陷阱§1.5統(tǒng)計、計算機與統(tǒng)計軟件計算機的使用,從計算機語言到54§1.5統(tǒng)計、計算機與統(tǒng)計軟件計算機無法識別你的統(tǒng)計方面的錯誤錯誤的方法、錯誤的數(shù)據(jù)形式都必然輸出錯誤的結(jié)果(雖然看上去可能很漂亮),得到大量垃圾另外,統(tǒng)計軟件輸出的結(jié)果太多、很難都理解§1.5統(tǒng)計、計算機與統(tǒng)計軟件計算機無法識別你的統(tǒng)計方面的55§1.5統(tǒng)計、計算機與統(tǒng)計軟件統(tǒng)計軟件的種類很多。書中僅介紹最常見的幾種。只要學(xué)會使用一種“傻瓜式”軟件或編程軟件,使用其他類似的軟件也不會困難;最多看看幫助和說明即可。學(xué)習(xí)軟件的最好方式是需要時在使用中學(xué)?!?.5統(tǒng)計、計算機與統(tǒng)計軟件統(tǒng)計軟件的種類很多。書中僅介56統(tǒng)計軟件SPSS:這是一個很受歡迎的統(tǒng)計軟件;它容易操作,輸出漂亮,功能齊全,價格合理。對于非統(tǒng)計工作者是很好的選擇。SAS:這是功能非常齊全的軟件;盡管價格不菲,許多公司還是因為其功能眾多和某些美國政府機構(gòu)認(rèn)可而使用。盡管現(xiàn)在已經(jīng)盡量“傻瓜化”,仍然需要一定的訓(xùn)練才可以進(jìn)入。對于基本統(tǒng)計課程則不那么方便。STATA:這是眾多統(tǒng)計軟件的后起之秀;它操作靈活、簡單、易學(xué)易用,同時具有數(shù)據(jù)管理軟件、統(tǒng)計分析軟件、繪圖軟件、矩陣計算軟件和程序語言的特點。占用計算機系統(tǒng)資源少,繪圖漂亮,對有簡單編程基礎(chǔ)者來講十分容易上手,有專門出版的專業(yè)刊物。以上三種軟件并稱為新的國際三大權(quán)威統(tǒng)計軟件統(tǒng)計軟件SPSS:這是一個很受歡迎的統(tǒng)計軟件;它容易操作,輸57統(tǒng)計軟件Excel:它嚴(yán)格說來并不是統(tǒng)計軟件,但作為數(shù)據(jù)表格軟件,必然有一定統(tǒng)計計算功能。而且凡是有MicrosoftOffice的計算機,基本上都裝有Excel。但要注意,有時在裝Office時沒有裝數(shù)據(jù)分析的功能,那就必須裝了才行。當(dāng)然,畫圖功能是都具備的。對于簡單分析,Excel還算方便,但隨著問題的深入,Excel就不那么“傻瓜”,需要使用函數(shù),甚至根本沒有相應(yīng)的方法了。多數(shù)專門一些的統(tǒng)計推斷問題還需要其他專門的統(tǒng)計軟件來處理。統(tǒng)計軟件Excel:它嚴(yán)格說來并不是統(tǒng)計軟件,但作為數(shù)據(jù)表格58統(tǒng)計軟件S-plus:這是統(tǒng)計學(xué)家喜愛的軟件。不僅由于其功能齊全,而且由于其強大的編程功能,使得研究人員可以編制自己的程序來實現(xiàn)自己的理論和方法。它也在進(jìn)行“傻瓜化”以爭取顧客。但仍然以編程方便為顧客所青睞。R軟件:這是一個免費的,由志愿者管理的軟件。其編程語言與S-plus所基于的S語言一樣,很方便。還有不斷加入的各個方向統(tǒng)計學(xué)家編寫的統(tǒng)計軟件包。同時從網(wǎng)上可以不斷更新和增加有關(guān)的軟件包和程序。這是發(fā)展最快的軟件,受到世界上統(tǒng)計師生的歡迎。是用戶量增加最快的統(tǒng)計軟件。對于一般非統(tǒng)計工作者來說,主要問題是它沒有“傻瓜化”。統(tǒng)計軟件S-plus:這是統(tǒng)計學(xué)家喜愛的軟件。不僅由于其功能59統(tǒng)計軟件Minitab:這個軟件是很方便的功能強大而又齊全的軟件,也已經(jīng)“傻瓜化”,在我國用的不如SPSS與SAS那么普遍。Statistica:也是功能強大而齊全的“傻瓜化”的軟件,在我國用的也不如SAS與SPSS那么普遍。Eviews:這是一個主要處理回歸和時間序列的軟件。GAUSS:這是一個很好用的統(tǒng)計軟件,許多搞經(jīng)濟(jì)的喜歡它。主要也是編程功能強大。目前在我國使用的人不多。FORTRAN:這是應(yīng)用于各個領(lǐng)域的歷史很長的非常優(yōu)秀的編程軟件,功能強大,也有一定的統(tǒng)計軟件包。計算速度比這里介紹的都快得多。但需要編程和編譯。操作不那么容易。MATLAB:這也是應(yīng)用于各個領(lǐng)域的以編程為主的軟件,在工程上應(yīng)用廣泛。編程類似于S和R。但是統(tǒng)計方法不多。統(tǒng)計軟件Minitab:這個軟件是很方便的功能強大而又齊全的60統(tǒng)計軟件當(dāng)然,還有其他的軟件,沒有必要一一羅列。其實,聰明的讀者只要學(xué)會使用一種“傻瓜式”軟件,使用其他的僅僅是舉一反三之勞;最多看看幫助和說明即可。如果只有英文幫助,那還可以順便提高你的英文閱讀能力。統(tǒng)計軟件當(dāng)然,還有其他的軟件,沒有必要一一羅列。其實,聰明的61想想看舉出你所知道的統(tǒng)計應(yīng)用例子。舉出日常生活中隨機性和規(guī)律性的例子。你使用過統(tǒng)計軟件或者利用過其他軟件中的統(tǒng)計功能嗎?你有什么經(jīng)驗和體會?想想看舉出你所知道的統(tǒng)計應(yīng)用例子。62演講完畢,謝謝觀看!演講完畢,謝謝觀看!63SPSS統(tǒng)計分析基礎(chǔ)教程主講人:彭超SPSS統(tǒng)計分析基礎(chǔ)教程主講人:彭超64課程目的應(yīng)用統(tǒng)計學(xué)理解統(tǒng)計數(shù)據(jù)分析主要方法的基本理論掌握基本統(tǒng)計方法在實踐中的應(yīng)用能熟練運用SPSS軟件實現(xiàn)數(shù)據(jù)分析建立起獨立運用統(tǒng)計方法解決實際問題的基礎(chǔ)能力課程目的應(yīng)用統(tǒng)計學(xué)65參考書目:1、《統(tǒng)計學(xué):從數(shù)據(jù)到結(jié)論》(第2版)吳喜之著,中國統(tǒng)計出版社,2006。2、《統(tǒng)計分析與SPSS的應(yīng)用》,薛薇編著,中國人民大學(xué)出版社,2001。3、《SPSS統(tǒng)計分析教程》,李志輝等主編,電子工業(yè)出版社,2003。4、《社會統(tǒng)計方法——SPSS軟件應(yīng)用》,郭志剛主編,中國人民大學(xué)出版社,1999。參考書目:1、《統(tǒng)計學(xué):從數(shù)據(jù)到結(jié)論》(第2版)吳喜之著,中66第一章一些基本概念第一章一些基本概念67什么是統(tǒng)計呢?報表?數(shù)字?你覺得你們需要統(tǒng)計嗎?為什么?SPSS統(tǒng)計分析基礎(chǔ)教程課件68§1.1統(tǒng)計是什么?統(tǒng)計是人類思維的一個歸納過程站在一個路口,看到每過去20輛小轎車時,也有100輛自行車通過而且平均每10個轎車載有12個人于是,你認(rèn)為小汽車和自行車在這個路口的運載能力為24:100這是一個典型的統(tǒng)計思維過程§1.1統(tǒng)計是什么?統(tǒng)計是人類思維的一個歸納過程69§1.1統(tǒng)計是什么?一般來說,統(tǒng)計先從現(xiàn)實世界收集數(shù)據(jù)(信息),如經(jīng)濟(jì)增長然后,根據(jù)數(shù)據(jù)作出判斷,稱為模型模型是從數(shù)據(jù)產(chǎn)生的模型也需要根據(jù)新的信息來改進(jìn)不存在完美的模型模型的最終結(jié)局都是被更能夠說明現(xiàn)實世界的新模型所取代§1.1統(tǒng)計是什么?一般來說,統(tǒng)計先從現(xiàn)實世界收集數(shù)據(jù)(信70§1.1統(tǒng)計是什么?比如說,經(jīng)濟(jì)生產(chǎn)的模型§1.1統(tǒng)計是什么?比如說,經(jīng)濟(jì)生產(chǎn)的模型71統(tǒng)計學(xué)可以應(yīng)用于幾乎所有的領(lǐng)域:精算,農(nóng)業(yè),動物學(xué),人類學(xué),考古學(xué),審計學(xué),晶體學(xué),人口統(tǒng)計學(xué),牙醫(yī)學(xué),生態(tài)學(xué),經(jīng)濟(jì)計量學(xué),教育學(xué),選舉預(yù)測和策劃,工程,流行病學(xué),金融,水產(chǎn)漁業(yè)研究,遺傳學(xué),地理學(xué),地質(zhì)學(xué),歷史研究,人類遺傳學(xué),水文學(xué),工業(yè),法律,語言學(xué),文學(xué),勞動力計劃,管理科學(xué),市場營銷學(xué),醫(yī)學(xué)診斷,氣象學(xué),軍事科學(xué),核材料安全管理,眼科學(xué),制藥學(xué),物理學(xué),政治學(xué),心理學(xué),心理物理學(xué),質(zhì)量控制,宗教研究,社會學(xué),調(diào)查抽樣,分類學(xué),氣象改善,博彩等。統(tǒng)計學(xué)可以應(yīng)用于幾乎所有的領(lǐng)域:精算,農(nóng)業(yè),動物學(xué),人類學(xué),72§1.1統(tǒng)計是什么?一句話,統(tǒng)計學(xué)(statistics)是用以收集數(shù)據(jù),分析數(shù)據(jù)和由數(shù)據(jù)得出結(jié)論的一組概念、原則和方法?!?.1統(tǒng)計是什么?一句話,73以歸納為主要思維方式的統(tǒng)計不是以演繹為主的數(shù)學(xué)統(tǒng)計可應(yīng)用于各個不同學(xué)科,在有些學(xué)科已經(jīng)有其特有的方法和特點;如生物統(tǒng)計(biostatistics)、經(jīng)濟(jì)計量學(xué)(econometrics)以及目前很熱門的生物信息(bioinformation)和數(shù)據(jù)挖掘(DataMining)的方法主體都是統(tǒng)計。以歸納為主要思維方式的統(tǒng)計不是以演繹為主的數(shù)學(xué)74你想過下面的問題嗎?當(dāng)你買了一臺電視時,被告知三年內(nèi)可以免費保修。你想過廠家憑什么這樣說嗎?說多了,廠家會損失;說少了,會失去競爭,也是損失。到底這個保修期是怎樣決定的呢?大學(xué)排名是一個非常敏感的問題。不同的機構(gòu)得出不同的結(jié)果;各自都說自己是客觀、公正和有道理的。到底如何理解這些不同的結(jié)果呢?你想過下面的問題嗎?當(dāng)你買了一臺電視時,被告知三年內(nèi)可以免費75你想過下面的問題嗎?任何公司都有一個信用問題。當(dāng)然,在這些公司試圖得到貸款時并沒有不還貸的不良記錄。如何根據(jù)它們的財務(wù)和商業(yè)資料來判斷一個公司的信用等級呢?我國東部和西部的概念是一個比較籠統(tǒng)的概念。如何能夠根據(jù)需要,選擇一些指標(biāo)來把各省,或各市縣甚至村進(jìn)行分類呢?疾病傳播時,如何能夠通過感染者入院前后的各種因素得到一個疾病傳染方式的模型呢?你想過下面的問題嗎?任何公司都有一個信用問題。當(dāng)然,在這些公76你想過下面的問題嗎?如何通過大眾調(diào)查來得到性別、年齡、職業(yè)、收入等各種因素與公眾對某項事物(比如商品或政策)的態(tài)度的關(guān)系呢?一個從來沒有研究過紅樓夢的統(tǒng)計學(xué)家如何根據(jù)比較寫作習(xí)慣得出紅樓夢從哪一段開始就不是曹雪芹的手筆了呢?如何才能夠客觀地得到某個電視節(jié)目的收視率,以確定廣告的價格是否合理呢?你想過下面的問題嗎?如何通過大眾調(diào)查來得到性別、年齡、職業(yè)、77你如何理解下面說法?“明天降水概率為40%”“我冬天去新加坡度假的概率為10%”“該節(jié)目收視率是30%”“調(diào)查結(jié)果表明20%的觀眾喜歡某節(jié)目”“抽樣調(diào)查結(jié)果的誤差為±3%”“支持率的95%置信區(qū)間為(25%,30%)”“某學(xué)校排名第一”“某縣是貧困縣”你如何理解下面說法?“明天降水概率為40%”78你如何理解下面說法?“某國的綜合競爭力排名第43位”“該國家屬于發(fā)展中國家”“該藥品療效99%”“該國貧富差距大”“這個縣收入比那個縣高”“該結(jié)果統(tǒng)計顯著”“消費價格指數(shù)為120%”“他的血壓已經(jīng)正常了”你如何理解下面說法?“某國的綜合競爭力排名第43位”79可以想象出的統(tǒng)計應(yīng)用例子如何確定觀眾/聽眾是否忠實于某節(jié)目(專欄)如何對電視節(jié)目排名次什么因素影響一個節(jié)目的收視率如何按照各種不同環(huán)境估計某商店的顧客人數(shù)如何按照各種指標(biāo)評價雇員如何把地區(qū)(市縣鎮(zhèn)等)按照各種指標(biāo)分類如何確定紅樓夢第幾回不是曹雪芹所寫如何確定一個產(chǎn)品的可靠性如何進(jìn)行偏差較少的民意調(diào)查如何根據(jù)一些財務(wù)數(shù)據(jù)發(fā)現(xiàn)漏稅的嫌疑單位?可以想象出的統(tǒng)計應(yīng)用例子如何確定觀眾/聽眾是否忠實于某節(jié)目(80你相信統(tǒng)計結(jié)果嗎?數(shù)據(jù)可以有誤或作假統(tǒng)計方法(有意或無意)使用不當(dāng)可以誤導(dǎo)。有低級誤導(dǎo)和高級誤導(dǎo)。常識判斷和直覺是重要的你相信統(tǒng)計結(jié)果嗎?數(shù)據(jù)可以有誤或作假81關(guān)于美國選舉的兩個例子(1)誰會在1936選舉中獲勝?AlfLondon還是
F.D.R.(羅斯福)?LiteraryDigest
(文摘)送出一千萬份問卷(返回二百四十萬份)后,預(yù)測London會贏.而Gallop(蓋洛普)只問了5000人說
Roosevelt(羅斯福)會贏.最后羅斯福和蓋洛普都贏了.文摘倒閉了.關(guān)于美國選舉的兩個例子(1)誰會在1936選舉中獲勝?Al82誰會在1948選舉中獲勝?ThomasDewey還是HarryTruman(杜魯門)?Crossley,Gallop(蓋洛普),Roper所有都預(yù)測Dewey會贏(每個機構(gòu)用了5000個問卷).最后(包括蓋洛普)他們都輸了,而杜魯門贏了.關(guān)于美國選舉的兩個例子(2)誰會在1948選舉中獲勝?ThomasDewey還是H83統(tǒng)計的一些做法統(tǒng)計可以指導(dǎo)我們收集數(shù)據(jù).當(dāng)擁有來自一些變量(指標(biāo))的數(shù)據(jù)或記錄,但缺乏模型來描述這些變量之間關(guān)系的情況下,可用統(tǒng)計方法建立模型.在有了一定的模型時,統(tǒng)計可以確定手中數(shù)據(jù)是否令人信服地支持某種論點.模型也用來對未來進(jìn)行預(yù)測.統(tǒng)計直觀的圖表展示,可以使各個領(lǐng)域的專家容易理解統(tǒng)計的一些做法統(tǒng)計可以指導(dǎo)我們收集數(shù)據(jù).84中國統(tǒng)計的獨特歷史環(huán)境中國統(tǒng)計過去分為“統(tǒng)計學(xué)”(文科的列寧主義統(tǒng)計)和“數(shù)理統(tǒng)計”(數(shù)學(xué)類的國際意義上的統(tǒng)計)中國統(tǒng)計的獨特歷史環(huán)境中國統(tǒng)計過去分為“統(tǒng)計學(xué)”(文科的列寧85國內(nèi)一些學(xué)者把統(tǒng)計稱為是經(jīng)濟(jì)學(xué)科的一部分,則是中國特有的與前蘇聯(lián)關(guān)聯(lián)的國情所造成;讀者可以從《蘇聯(lián)大百科全書》的統(tǒng)計學(xué)條款得到答案。但前蘇聯(lián)的經(jīng)濟(jì)學(xué)中的統(tǒng)計學(xué)概念是其意識形態(tài)和計劃經(jīng)濟(jì)體系的產(chǎn)物,其模型多屬于小學(xué)數(shù)學(xué)水平,很難稱為數(shù)學(xué)模型。這與現(xiàn)代經(jīng)濟(jì)學(xué)所需要的大量的統(tǒng)計和數(shù)學(xué)形成鮮明對照.前蘇聯(lián)式的“統(tǒng)計學(xué)”不是目前國際流行意義上的統(tǒng)計學(xué)或統(tǒng)計學(xué)的分支。國內(nèi)一些學(xué)者把統(tǒng)計稱為是經(jīng)濟(jì)學(xué)科的一部分,則是中國特有的與前86統(tǒng)計的內(nèi)容和需要的知識數(shù)學(xué)的幾乎所有內(nèi)容(不一定事先知道需要什么)用計算機做統(tǒng)計計算其他(對象)領(lǐng)域的知識統(tǒng)計的內(nèi)容和需要的知識數(shù)學(xué)的幾乎所有內(nèi)容(不一定事先知道需要87統(tǒng)計和數(shù)學(xué)的區(qū)別數(shù)學(xué)思維是以演繹為主統(tǒng)計思維是以歸納為主,兼有演繹統(tǒng)計各領(lǐng)域利用幾乎所有存在的數(shù)學(xué)內(nèi)容.但統(tǒng)計本身的數(shù)學(xué)是為具體目標(biāo)服務(wù)的,自己一般不形成數(shù)學(xué)體系統(tǒng)計和數(shù)學(xué)的區(qū)別數(shù)學(xué)思維是以演繹為主88計算機的重要性由于統(tǒng)計和數(shù)據(jù)打交道,沒有計算機的發(fā)展統(tǒng)計就沒有前途.計算機和統(tǒng)計的發(fā)展相輔相成計算機的重要性由于統(tǒng)計和數(shù)據(jù)打交道,沒有計算機的發(fā)展統(tǒng)計就沒89§1.2現(xiàn)實中的隨機性和規(guī)律性從中學(xué)起,我們就知道自然科學(xué)的許多定律,例如物理中的牛頓三定律,物質(zhì)不滅定律以及化學(xué)中的各種定律等等。但是在許多領(lǐng)域,很難用如此確定的公式或論述來描述一些現(xiàn)象。比如,人的壽命是很難預(yù)先確定的。一個吸煙、喝酒、不鍛煉、而且一口長葷的人可能比一個很少得病、生活習(xí)慣良好的人活得長。因此,可以說,活得長短是有一定隨機性的(randomness)。這種隨機性可能和人的經(jīng)歷、基因、習(xí)慣等無數(shù)說不清的因素都有關(guān)系?!?.2現(xiàn)實中的隨機性和規(guī)律性從中學(xué)起,我們就知道自然科學(xué)的90現(xiàn)實中的隨機性和規(guī)律性但是從總體來說,我國公民的平均年齡卻是非常穩(wěn)定的。而且女性的平均年齡也穩(wěn)定地比男性高幾年。這就是規(guī)律性。一個人可能活過這個平均年齡,也可能活不到這個年齡,這是隨機的。但是總體來說,平均年齡的穩(wěn)定性,卻說明了隨機之中有規(guī)律性。這種規(guī)律就是統(tǒng)計規(guī)律。現(xiàn)實中的隨機性和規(guī)律性但是從總體來說,我國公民的平均年齡卻是91概率和機會你可能經(jīng)常聽到概率(probability)這個名詞。例如在天氣預(yù)報中會提到降水概率。大家都明白,如果降水概率是百分之九十,那就很可能下雨;但如果是百分之十,就不大可能下雨。因此,從某種意義說來,概率描述了某件事情發(fā)生的機會。顯然,這種概率不可能超過百分之百,也不可能少于百分之零。換言之,概率是在0和1之間的一個數(shù),說明某事件發(fā)生的機會有多大。概率和機會你可能經(jīng)常聽到概率(probability)這個名92有些概率是無法精確推斷的比如你對別人說你下一個周末去公園的概率是百分之八十。但你無法精確說出為什么是百分之八十而不是百分之八十四或百分之七十八。其實你想說的是你很可能去,但又沒有完全肯定。實際上,到了周末,你或者去,或者不去;不可能有分身術(shù)把百分之八十的你放到公園,而其余的放在別處。有些概率是無法精確推斷的比如你對別人說你下一個周末去公園的概93有些概率是可以估計的比如擲骰子。只要沒有人在骰子上做手腳,你得到6點的概率應(yīng)該是六分之一。得到其他點的概率也是一樣。得到6的概率或者機會是可以知道的,但擲骰子的結(jié)果還只可能是六個數(shù)目之一。這個已知的規(guī)律就反映了規(guī)律性,而得到哪個結(jié)果則反映了隨機性。如果你擲1000次骰子,那么,大約有六分之一的可能會得到6;這也是隨機性呈現(xiàn)有規(guī)律的一個體現(xiàn)。有些概率是可以估計的比如擲骰子。只要沒有人在骰子上做手腳,你94§1.3變量和數(shù)據(jù)一節(jié)火車車廂有多少坐位是一個固定的數(shù)目,稱為常數(shù)(constant)或者常量。但是,開車后,坐在這節(jié)車廂的旅客有多少就沒準(zhǔn)了。這有隨機性。該車廂的乘客數(shù)為變量(variable)?!?.3變量和數(shù)據(jù)一節(jié)火車車廂有多少坐位是一個固定的數(shù)目,95§1.3變量和數(shù)據(jù)一個學(xué)校的注冊在校男女生比例是固定的,為常量但是,該校任意一群學(xué)生的男女生比例就不一定和全校的比例一樣了,它為變量(variable)?!?.3變量和數(shù)據(jù)一個學(xué)校的注冊在校男女生比例是固定的,為96§1.3變量和數(shù)據(jù)當(dāng)變量按照隨機規(guī)律所取的值是數(shù)量時該變量稱為定量變量或數(shù)量變量(quantitativevariable);因為是隨機的,也稱為隨機變量(randomvariable)。如身高體重,購買某商品的人數(shù)等等SPSS主要為Numeric§1.3變量和數(shù)據(jù)當(dāng)變量按照隨機規(guī)律所取的值是數(shù)量時該變量97§1.3變量和數(shù)據(jù)象性別,觀點之類的取非數(shù)量值的變量就稱為定性變量或?qū)傩宰兞炕蚍诸愖兞?qualitativevariable,或categoricalvariable)。這些定性變量也可以由定量變量來描述,如男女生的數(shù)目,持有某觀點的人數(shù)比例等等?!?.3變量和數(shù)據(jù)象性別,觀點之類的取非數(shù)量值的變量就稱為98§1.3變量和數(shù)據(jù)定性變量只有用數(shù)量來描述時,才有可能建立數(shù)學(xué)模型,并使用計算機來分析。數(shù)據(jù)中它們通常用啞元(dummyvariable)代表,比如性別用0、1代表,三種收入用0、1、2代表(或用字母代表)SPSS中沒有特別的變量,往往用數(shù)值表示§1.3變量和數(shù)據(jù)定性變量只有用數(shù)量來描述時,才有可能建立99§1.3變量和數(shù)據(jù)有了變量,何謂數(shù)據(jù)?不同機構(gòu)調(diào)查所得到的北京收入萬元以上市民的比例都不一樣,這是變量而這些調(diào)查產(chǎn)生一些數(shù)目,這些數(shù)目就是數(shù)據(jù)(data)數(shù)據(jù)是關(guān)于變量的觀測值?!?.3變量和數(shù)據(jù)有了變量,何謂數(shù)據(jù)?100§1.3變量和數(shù)據(jù)通過數(shù)據(jù)可驗證有關(guān)的理論或假定。比如通過抽樣調(diào)查驗證美國選民對共和黨候選人的支持率是否超過50%通過抽樣,可以檢驗?zāi)撑a(chǎn)品是否合格等等§1.3變量和數(shù)據(jù)通過數(shù)據(jù)可驗證有關(guān)的理論或假定。101§1.4變量之間的關(guān)系現(xiàn)實世界緊密聯(lián)系的人們想知道投資方式和經(jīng)濟(jì)效益之間的關(guān)系、旅客人數(shù)和經(jīng)濟(jì)發(fā)展之間的關(guān)系等等不討論變量之間的關(guān)系,就無從談起任何有深度的應(yīng)用,統(tǒng)計的基本概念就僅僅是擺設(shè)而已。§1.4變量之間的關(guān)系現(xiàn)實世界緊密聯(lián)系的102§1.4.1定量變量間的關(guān)系例1.1.廣告投入和銷售之間的關(guān)系。下表(數(shù)據(jù)ads.sav)顯示了某企業(yè)的廣告投入和銷售額之間的關(guān)系(萬元)。§1.4.1定量變量間的關(guān)系例1.1.廣告投入和銷售之間的103橫坐標(biāo)代表廣告投入,而縱坐標(biāo)代表銷售收入??吹贸鲇泻畏N關(guān)系嗎?橫坐標(biāo)代表廣告投入,而縱坐標(biāo)代表銷售收入。104§1.4.1定量變量間的關(guān)系能否從該數(shù)據(jù)回答下面問題:這兩個變量是否有關(guān)系?如果有,它們的關(guān)系是否顯著?這些關(guān)系是什么關(guān)系,能否用數(shù)學(xué)模型來描述?這個關(guān)系是否帶有普遍性?這個關(guān)系是不是因果關(guān)系?§1.4.1定量變量間的關(guān)系能否從該數(shù)據(jù)回答下面問題:105§1.4.1定量變量間的關(guān)系關(guān)于因果關(guān)系在可控制的試驗中,較容易找到因果關(guān)系;比如治療方式和療效的關(guān)系等但是,一般來說,變量之間有關(guān)系這個事實并不意味著一定存在明確的因果關(guān)系。§1.4.1定量變量間的關(guān)系關(guān)于因果關(guān)系106§1.4.1定量變量間的關(guān)系比如,北京GDP在一年中是快速增長的,而一個剛出生的巴拿馬嬰兒在這一年中的體重也是快速增長的如果畫出圖來,它們有類似線性的關(guān)系但它們顯然沒有因果關(guān)系§1.4.1定量變量間的關(guān)系比如,北京GDP在一年中是快速107§1.4.1定量變量間的關(guān)系只要有關(guān)系,即使不是因果關(guān)系也不妨礙人們利用這種關(guān)系來進(jìn)行推斷。比如利用公雞打鳴來預(yù)報太陽升起;雖然公雞打鳴絕對不是日出的原因(雖然打鳴發(fā)生在先)§1.4.1定量變量間的關(guān)系只要有關(guān)系,即使不是因果關(guān)系也108§1.4.1定量變量間的關(guān)系簡單的辦法(諸如畫圖)可以得到一些信息,但不一定能夠給出滿意的答案需要更多的工具和手段來進(jìn)行數(shù)值分析得到更加嚴(yán)格和精確的解答因此,需要繼續(xù)我們的課程§1.4.1定量變量間的關(guān)系簡單的辦法(諸如畫圖)可以得到109§1.4.2定性變量間的關(guān)系例1.2.下面是對123人進(jìn)行關(guān)于某項政策調(diào)查所得結(jié)果的一個簡單的三維表,它顯示了人們的收入和性別對該項政策的觀點。(table7.sav)?!?.4.2定性變量間的關(guān)系例1.2.下面是對123人進(jìn)行110計算機軟件所應(yīng)用的數(shù)據(jù)形式計算機軟件所應(yīng)用的數(shù)據(jù)形式111§1.4.2定性變量間的關(guān)系從這個數(shù)據(jù),希望可以看出收入、性別對觀點是否有影響及如何影響如果要得到更加精確的結(jié)論,就要進(jìn)行進(jìn)一步的分析和計算這是后面列聯(lián)表分析或多項分布對數(shù)線性模型的內(nèi)容§1.4.2定性變量間的關(guān)系從這個數(shù)據(jù),希望可以看出收入、112§1.4.3定性和定量變量間的混和關(guān)系有些數(shù)據(jù)不是僅有定性變量或僅有定量變量需要知道包括定性和定量兩種變量的一些變量之間的關(guān)系下面數(shù)據(jù)就包含兩種變量§1.4.3定性和定量變量間的混和關(guān)系有些數(shù)據(jù)不是僅有定性113Asthma.sav數(shù)據(jù)Asthma.sav數(shù)據(jù)114§1.4.3定性和定量變量間的混和關(guān)系該數(shù)據(jù)有2個定性變量(性別,污染程度)、一個定量變量(年齡)以及發(fā)生哮喘的人數(shù)我們希望知道哮喘和這三個變量之間的關(guān)系這將在Poisson對數(shù)線性模型中討論§1.4.3定性和定量變量間的混和關(guān)系該數(shù)據(jù)有2個定性變量115§1.5統(tǒng)計、計算機與統(tǒng)計軟件現(xiàn)代生活越來越離不開計算機了最初的計算機僅僅是為科學(xué)計算而設(shè)計和建造的。統(tǒng)計是大型計算機的最早用戶,現(xiàn)在仍然是數(shù)值計算的主要用戶§1.5統(tǒng)計、計算機與統(tǒng)計軟件現(xiàn)代生活越來越離不開計算機了116§1.5統(tǒng)計、計算機與統(tǒng)計軟件計算機的使用,從計算機語言到“傻瓜式”地點擊鼠標(biāo)輸出結(jié)果也從數(shù)字輸出到各種可以想象得到的形式。輸入數(shù)據(jù),點鼠標(biāo)做一些選項,就可得到漂亮結(jié)果但其中充滿了危險的陷阱
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年渦輪螺槳發(fā)動機項目建議書
- 2025建設(shè)項目工程總承包合同書示范文本
- 2025正規(guī)企業(yè)勞動合同范例
- 瑜伽館石材裝修施工合同
- 軟件公司水地暖安裝協(xié)議
- 物流配送服務(wù)協(xié)議
- 宗教場所安全防護(hù)欄施工合同
- 2025交通標(biāo)線施工合同
- 電網(wǎng)改造項目招投標(biāo)文件范本
- 留學(xué)合同書范本
- “雄鷹杯”全國小動物醫(yī)師技能大賽考試題庫(660題)
- 2024年國家公務(wù)員考試《申論》真題(地市級)及答案解析
- 2024-2030年中國游艇產(chǎn)業(yè)發(fā)展?fàn)顩r規(guī)劃分析報告權(quán)威版
- 學(xué)前兒童家庭與社區(qū)教育學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 網(wǎng)絡(luò)安全產(chǎn)品質(zhì)保與售后方案
- 2024-2025學(xué)年河北省高三上學(xué)期省級聯(lián)測政治試題及答案
- 貴州省貴陽市2023-2024學(xué)年高一上學(xué)期期末考試 物理 含解析
- 幼兒園班級管理中的沖突解決策略研究
- 【7上英YL】蕪湖市2023-2024學(xué)年七年級上學(xué)期英語期中素質(zhì)教育評估試卷
- 2024年度中國鈉離子電池報告
- 2024年問政山東拆遷協(xié)議書模板
評論
0/150
提交評論