《統(tǒng)計(jì)數(shù)據(jù)分析基礎(chǔ)教程(第二版)》第1章 概述_第1頁(yè)
《統(tǒng)計(jì)數(shù)據(jù)分析基礎(chǔ)教程(第二版)》第1章 概述_第2頁(yè)
《統(tǒng)計(jì)數(shù)據(jù)分析基礎(chǔ)教程(第二版)》第1章 概述_第3頁(yè)
《統(tǒng)計(jì)數(shù)據(jù)分析基礎(chǔ)教程(第二版)》第1章 概述_第4頁(yè)
《統(tǒng)計(jì)數(shù)據(jù)分析基礎(chǔ)教程(第二版)》第1章 概述_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)數(shù)據(jù)分析基礎(chǔ)教程(第二版)

―基于SPSS20和Excel2010的調(diào)查數(shù)據(jù)分析第1章概述本章內(nèi)容1.1什么是統(tǒng)計(jì)1.2統(tǒng)計(jì)、計(jì)算機(jī)與統(tǒng)計(jì)軟件1.3為何要使用Excel來(lái)學(xué)習(xí)統(tǒng)計(jì)1.4變量及其分類(lèi)1.5數(shù)據(jù)的收集附錄Excel“數(shù)據(jù)分析”工具1.1什么是統(tǒng)計(jì)你想過(guò)下面的問(wèn)題嗎?(1)當(dāng)你買(mǎi)了一臺(tái)電視,被告知三年內(nèi)可以免費(fèi)保修時(shí),你想過(guò)廠家憑什么這樣說(shuō)嗎?說(shuō)多了,廠家會(huì)損失;說(shuō)少了,會(huì)失去競(jìng)爭(zhēng),也是損失。到底這個(gè)保修期是怎樣決定的呢?(2)在同一年級(jí)中,同一門(mén)統(tǒng)計(jì)學(xué)的課程可能由一些不同的教師講授。教師講課方式當(dāng)然不一樣,考試題目也不一定相同。那么如何比較不同班級(jí)的統(tǒng)計(jì)學(xué)成績(jī)呢?(3)大學(xué)排名是一個(gè)非常敏感的問(wèn)題。不同的機(jī)構(gòu)會(huì)得出不同的結(jié)果,各自都說(shuō)自己是客觀、公正和有道理的。到底如何理解這些不同的結(jié)果呢?(4)如何通過(guò)大眾調(diào)查來(lái)得到性別、年齡、職業(yè)、收入等各種因素與公眾對(duì)某件事物(比如商品或政策)的態(tài)度的關(guān)系呢?(5)如何才能夠客觀地得知某個(gè)電視節(jié)目的收視率,以確定廣告的價(jià)格是否合理呢?1.1什么是統(tǒng)計(jì)統(tǒng)計(jì)學(xué)應(yīng)用領(lǐng)域:社會(huì)學(xué)、新聞?wù){(diào)查精算、農(nóng)業(yè)、動(dòng)物學(xué)、人類(lèi)學(xué)、考古學(xué)、審計(jì)學(xué)、人口統(tǒng)計(jì)學(xué)、牙醫(yī)學(xué)、生態(tài)學(xué)、計(jì)量經(jīng)濟(jì)學(xué)、教育學(xué)、選舉預(yù)測(cè)和策劃、工程、流行病學(xué)、金融、水產(chǎn)漁業(yè)研究、遺傳學(xué)、地理學(xué)、地質(zhì)學(xué)、歷史研究、人類(lèi)遺傳學(xué)、水文學(xué)、工業(yè)、法律、語(yǔ)言學(xué)、文學(xué)、勞動(dòng)力計(jì)劃、管理科學(xué)、市場(chǎng)營(yíng)銷(xiāo)學(xué)、醫(yī)學(xué)診斷、氣象學(xué)、軍事科學(xué)、眼科學(xué)、制藥學(xué)、物理學(xué)、政治學(xué)、心理學(xué)、心理物理學(xué)、質(zhì)量控制、宗教研究、分類(lèi)學(xué)、氣象改善、博彩等。當(dāng)然,大家用不著也不可能理解所有的統(tǒng)計(jì)應(yīng)用,只要能夠解決自己身邊的統(tǒng)計(jì)問(wèn)題就足夠了。1.1什么是統(tǒng)計(jì)統(tǒng)計(jì)學(xué)(Statistics)是用以收集數(shù)據(jù)、分析數(shù)據(jù)并進(jìn)而由數(shù)據(jù)得出結(jié)論的一組概念、原則和方法。因而有學(xué)者也將統(tǒng)計(jì)學(xué)稱(chēng)為統(tǒng)計(jì)方法(StatisticalMethod)。比如,要得到某電視節(jié)目的收視率,可能首先要在該節(jié)目播出時(shí),利用電話(huà)對(duì)看電視的人進(jìn)行采訪,同時(shí)問(wèn)他們?cè)谟^看什么節(jié)目。在得到了被采訪的看電視的總?cè)藬?shù)和其中觀看該節(jié)目的人數(shù)之后,就有可能得到這部分觀眾中觀看該節(jié)目的比例,即大致的收視率了。之后還要經(jīng)過(guò)統(tǒng)計(jì)分析,評(píng)估這個(gè)收視率的可信度和代表性等。顯然,這是一個(gè)收集數(shù)據(jù),然后通過(guò)分析數(shù)據(jù)得到結(jié)論的簡(jiǎn)單例子。

1.2 統(tǒng)計(jì)、計(jì)算機(jī)與統(tǒng)計(jì)軟件現(xiàn)代生活越來(lái)越離不開(kāi)計(jì)算機(jī)了。最早使用計(jì)算機(jī)的統(tǒng)計(jì)當(dāng)然更離不開(kāi)計(jì)算機(jī)了。計(jì)算機(jī)的使用,也從過(guò)去必須學(xué)會(huì)計(jì)算機(jī)語(yǔ)言發(fā)展到只需要“傻瓜式”地點(diǎn)擊鼠標(biāo);結(jié)果也從單純的數(shù)字輸出發(fā)展到包括漂亮的表格和圖形在內(nèi)的各種形式。統(tǒng)計(jì)軟件的發(fā)展,也使得統(tǒng)計(jì)從統(tǒng)計(jì)學(xué)家的圈內(nèi)游戲變成了大眾的游戲。只要輸入你的數(shù)據(jù),點(diǎn)幾下鼠標(biāo),做一些選項(xiàng),馬上就得到令人驚嘆的漂亮結(jié)果了。應(yīng)該特別留神,明白自己是在干什么,不要在得到一堆毫無(wú)意義的垃圾之后還沾沾自喜。1.2 統(tǒng)計(jì)、計(jì)算機(jī)與統(tǒng)計(jì)軟件SPSS:這是一個(gè)很受歡迎的統(tǒng)計(jì)軟件。它操作容易,輸出漂亮,功能齊全,價(jià)格合理。它也有自己的程序語(yǔ)言,但基本上已經(jīng)“傻瓜化”。對(duì)于非專(zhuān)業(yè)統(tǒng)計(jì)工作者,它是很好的選擇。Excel:嚴(yán)格說(shuō)來(lái),Excel并不是統(tǒng)計(jì)軟件,但作為數(shù)據(jù)表格軟件,必然有一定的統(tǒng)計(jì)計(jì)算功能。而且凡是安裝了MicrosoftOffice的計(jì)算機(jī),基本上都裝有Excel。但要注意,有時(shí)在安裝Office時(shí)沒(méi)有安裝(加載)“數(shù)據(jù)分析”的功能,那就必須裝(加載)了才行。當(dāng)然,畫(huà)圖功能是已經(jīng)具備了的。對(duì)于簡(jiǎn)單分析,Excel還算方便,但隨著問(wèn)題的深入,Excel就不那么“傻瓜”了。SAS:這是一款功能非常齊全的軟件。盡管價(jià)格相當(dāng)不菲,但許多公司,特別是美國(guó)制藥公司都在使用,這多半因?yàn)槠涔δ鼙姸嗪湍承┟绹?guó)政府機(jī)構(gòu)一些人的偏愛(ài)。盡管現(xiàn)在已經(jīng)盡量“傻瓜化”,但仍然需要一定的訓(xùn)練才可以使用。也可以用它編程計(jì)算,但對(duì)于基本統(tǒng)計(jì)課程則不那么方便。學(xué)習(xí)軟件的最好方式是需要時(shí)在使用中學(xué)。1.3為何要使用Excel來(lái)學(xué)習(xí)統(tǒng)計(jì)由于微軟的Office已相當(dāng)普及,并且廣泛地應(yīng)用于工商企業(yè)及個(gè)人使用領(lǐng)域,要想在一臺(tái)個(gè)人計(jì)算機(jī)上找到Excel,要比找到SPSS或SAS軟件容易得多,而且Excel具有易學(xué)易懂的特性。雖然Excel并沒(méi)有被歸類(lèi)為統(tǒng)計(jì)軟件,并且其與統(tǒng)計(jì)有關(guān)的函數(shù)和“數(shù)據(jù)分析”功能是絕對(duì)無(wú)法與SPSS或SAS統(tǒng)計(jì)軟件相提并論的,但對(duì)絕大多數(shù)人而言已經(jīng)足夠了。生活在“信息時(shí)代”中的人們比以前任何時(shí)候都更頻繁地與數(shù)據(jù)打交道,Excel就是為現(xiàn)代人進(jìn)行數(shù)據(jù)處理而定制的一個(gè)工具。無(wú)論是在科學(xué)研究、醫(yī)療教育、商業(yè)活動(dòng)還是家庭生活中,Excel都能滿(mǎn)足大多數(shù)人的數(shù)據(jù)處理需求。Excel擁有強(qiáng)大的計(jì)算、分析、傳遞和共享功能,可以幫助用戶(hù)將繁雜的數(shù)據(jù)轉(zhuǎn)化為有用的信息。偉人說(shuō)“實(shí)踐出真知”,在Excel中,不但實(shí)踐出真知,而且實(shí)踐出技巧。1.4 變量及其分類(lèi)變量(Variable)是用來(lái)描述總體中成員的某一特性。在搜集數(shù)據(jù)的過(guò)程中,需要搜集各類(lèi)的變量。例如,性別、年齡、職業(yè)、教育程度、收入等人口統(tǒng)計(jì)變量。又如,為了預(yù)測(cè)明年的銷(xiāo)售量,所搜集到的數(shù)據(jù)如廣告費(fèi)、人事費(fèi)、銷(xiāo)售人員數(shù)等,也都是一種變量。在現(xiàn)實(shí)生活或自然界中的一些現(xiàn)象,通常都不是單一變量可以描述得很清楚的。例如,要描述某一個(gè)人,僅使用性別變量,說(shuō)他(或她)是男性(或是女性),肯定是無(wú)法說(shuō)明白的。但隨著變量(例如年齡、膚色、頭發(fā)、身高、體重、種族等)的增加,可以逐漸描述得更清楚一些。1.4 變量及其分類(lèi)定性變量(QualitativeVariable)也稱(chēng)離散變量或分類(lèi)變量。例如,使用的手機(jī)品牌、學(xué)生所在的學(xué)院、就讀的班級(jí)、宗教信仰、參加的社團(tuán)、喜好的運(yùn)動(dòng)、最常飲用的飲料類(lèi)別、最喜歡的歌手、最喜歡的影星、民族、黨派,均屬定性變量(分類(lèi)變量)。分類(lèi)變量的觀測(cè)結(jié)果稱(chēng)為分類(lèi)數(shù)據(jù)。如性別:男[1]、女[2]。定序變量:如果類(lèi)別具有一定的順序,這樣的變量也稱(chēng)為有序變量(RankVariable)或有序分類(lèi)變量。相應(yīng)的觀測(cè)結(jié)果稱(chēng)為有序數(shù)據(jù)。例如,成績(jī):優(yōu)[5]、良[4]、中[3]、及格[2]、不及格[1];文化程度:小學(xué)[1]、中學(xué)[2]、大學(xué)[3]、研究生[4];職稱(chēng):教授[4]、副教授[3]、講師[2]、助教[1];評(píng)價(jià):非常重要[5]、重要[4]、一般[3]、不重要[2]、非常不重要[1];態(tài)度:贊成[3]、中立[2]、反對(duì)[1]。定量變量(QuantitativeVariable)也稱(chēng)數(shù)值型變量。例如,成績(jī)、年齡、收入、國(guó)民生產(chǎn)總值、體重、身高、智力、溫度等均屬定量變量。定量變量的觀測(cè)結(jié)果稱(chēng)為定量數(shù)據(jù)或數(shù)值型數(shù)據(jù)。在實(shí)際應(yīng)用中,變量類(lèi)型一般只分為定性變量(分類(lèi)變量)和定量變量(數(shù)值型變量)兩大類(lèi)。1.5數(shù)據(jù)的收集(怎樣得到數(shù)據(jù))每天翻開(kāi)報(bào)紙或打開(kāi)電視,就可以看到各種數(shù)據(jù),比如高速公路通車(chē)?yán)锍獭⒐善毙星?、外匯牌價(jià)、房?jī)r(jià)、流行病的有關(guān)數(shù)據(jù)。當(dāng)然還有國(guó)家統(tǒng)計(jì)局定期發(fā)布的各種國(guó)家經(jīng)濟(jì)數(shù)據(jù)、海關(guān)發(fā)布的進(jìn)出口貿(mào)易數(shù)據(jù)等。從這些數(shù)據(jù)中,各有關(guān)方面可以提取對(duì)自己有用的信息。顯然,這些間接得到的數(shù)據(jù)都是二手?jǐn)?shù)據(jù)。獲得第一手?jǐn)?shù)據(jù)并不像得到二手?jǐn)?shù)據(jù)那么輕松。某些企業(yè)每年至少要花三四千萬(wàn)元來(lái)收集和分析數(shù)據(jù)。他們調(diào)查其產(chǎn)品目前在市場(chǎng)中的狀況和地位,并確定其競(jìng)爭(zhēng)對(duì)手的態(tài)勢(shì)。他們調(diào)查不同地區(qū)、不同階層的民眾對(duì)其產(chǎn)品的認(rèn)知程度和購(gòu)買(mǎi)意愿,以改進(jìn)產(chǎn)品或推出新品種以爭(zhēng)取新顧客。他們還收集各地方的經(jīng)濟(jì)、交通等信息,以決定如何保住現(xiàn)有市場(chǎng)和開(kāi)發(fā)新市場(chǎng)。市場(chǎng)信息數(shù)據(jù)對(duì)企業(yè)是至關(guān)重要的,他們很舍得在這方面花錢(qián)。因?yàn)檫@是企業(yè)生存所必需的,絕不是可有可無(wú)的。1.5數(shù)據(jù)的收集(個(gè)體、總體和樣本)要想了解北京市民對(duì)建設(shè)北京交通設(shè)施是以包括軌道運(yùn)輸在內(nèi)的公共交通工具為主還是以小汽車(chē)為主的觀點(diǎn),需要進(jìn)行調(diào)查。調(diào)查對(duì)象是所有北京市民,調(diào)查目的是希望知道市民中對(duì)這個(gè)問(wèn)題的不同看法各自占有的比例。顯然,不可能去問(wèn)所有的北京市民,而只能夠問(wèn)一部分,并且根據(jù)這一部分的觀點(diǎn)來(lái)理解整個(gè)北京市民的總體觀點(diǎn)。在這個(gè)例子中,單個(gè)北京市民稱(chēng)為調(diào)查的對(duì)象;而他們的觀點(diǎn)稱(chēng)為(這個(gè)調(diào)查問(wèn)題的)個(gè)體;而稱(chēng)所有北京市民對(duì)這個(gè)問(wèn)題的觀點(diǎn)為一個(gè)總體,總體是包含所有要研究的個(gè)體的集合;而調(diào)查時(shí)問(wèn)到的那部分市民的觀點(diǎn)(也就是部分個(gè)體)稱(chēng)為該總體的一個(gè)樣本,是總體中選出的一部分。當(dāng)然,也有可能試圖調(diào)查所有的人,那叫普查(Census),比如人口普查。有人喜歡把作為調(diào)查對(duì)象的北京市民稱(chēng)為個(gè)體,但每個(gè)市民還有其他諸如身高、體重、教育程度等無(wú)數(shù)特征,這些都不是我們調(diào)查的目的。因此,為了強(qiáng)調(diào)我們調(diào)查的目的,市民的觀點(diǎn)才應(yīng)稱(chēng)為個(gè)體。1.5數(shù)據(jù)的收集(個(gè)體、總體和樣本)在抽取樣本時(shí),如果總體中的每一個(gè)個(gè)體都有同等機(jī)會(huì)被選到樣本中,這種抽樣稱(chēng)為簡(jiǎn)單隨機(jī)抽樣(例子P42),而這樣得到的樣本則稱(chēng)為隨機(jī)樣本。隨機(jī)抽樣就像從一鍋攪勻的八寶粥中舀出一勺,其中各種成分的比例應(yīng)該和鍋里的比例大致一樣。大小為N的總體中產(chǎn)生樣本量為n的隨機(jī)樣本的一個(gè)常用的方法是利用隨機(jī)數(shù)。其步驟為:(1)先把總體的所有個(gè)體編號(hào);(2)然后產(chǎn)生n個(gè)1到N之間的隨機(jī)數(shù);(3)與如此產(chǎn)生的隨機(jī)數(shù)中的數(shù)目相同的個(gè)體則形成了樣本量為n的簡(jiǎn)單隨機(jī)樣本。在廣泛使用計(jì)算機(jī)的今天,為了方便,很多實(shí)際工作者應(yīng)用計(jì)算機(jī)所產(chǎn)生的偽隨機(jī)數(shù)來(lái)代替真正的隨機(jī)數(shù)。在實(shí)踐中,得到隨機(jī)樣本并不容易,很多搞調(diào)查的人就采取簡(jiǎn)單的辦法:方便樣本。具體實(shí)現(xiàn)方法:參見(jiàn)實(shí)驗(yàn)1.3、實(shí)驗(yàn)1.4和實(shí)驗(yàn)1.51.5數(shù)據(jù)的收集( 收集數(shù)據(jù)時(shí)的誤差)假定在某一職業(yè)人群中女性占的比例為60%。如果在這個(gè)人群中抽取一些隨機(jī)樣本,這些隨機(jī)樣本中女性的比例并不一定剛好是60%,可能稍微多些或稍微少些。這是很正常的,因?yàn)闃颖镜奶卣鞑灰欢ê涂傮w完全一樣。這種差異不是錯(cuò)誤,而是必然會(huì)出現(xiàn)的抽樣誤差。在抽樣調(diào)查中,一些人因?yàn)榉N種原因沒(méi)有對(duì)調(diào)查做出反應(yīng)(或回答),這種誤差稱(chēng)為未響應(yīng)誤差。而另有一些人因?yàn)楦鞣N原因回答時(shí)并沒(méi)有真實(shí)反映他們的觀點(diǎn),這稱(chēng)為響應(yīng)誤差。和抽樣誤差不一樣,未響應(yīng)誤差和響應(yīng)誤差都會(huì)影響對(duì)真實(shí)世界的了解,應(yīng)該在設(shè)計(jì)調(diào)查方案時(shí)盡量避免。1.5數(shù)據(jù)的收集

(抽樣調(diào)查以及一些常用的方法)抽樣調(diào)查(SampleSurvey)的領(lǐng)域涉及如何用有效的方式得到樣本數(shù)據(jù)。最常用的問(wèn)卷調(diào)查方式,包括通過(guò)郵件報(bào)刊等手段調(diào)查、電話(huà)調(diào)查和面對(duì)面調(diào)查等。這些調(diào)查方式都利用了問(wèn)卷(questionnaire),而問(wèn)卷的設(shè)計(jì)則很有學(xué)問(wèn)。它涉及如何用詞、問(wèn)題的次序以及問(wèn)題的選擇和組合等。這涉及心理學(xué)、社會(huì)學(xué)等知識(shí)。抽樣調(diào)查設(shè)計(jì)的目的之一是確保樣本對(duì)總體的代表性,以保證后續(xù)推斷的可靠性。概率抽樣方法:系統(tǒng)抽樣(系統(tǒng)隨機(jī)抽樣的例子P42)、分層抽樣、整群抽樣、多級(jí)抽樣。非概率抽樣方法:目的抽樣、方便抽樣、判斷抽樣、定額抽樣、雪球抽樣、自我選擇。附錄Excel“數(shù)據(jù)分析”工具(P10)1.Excel數(shù)據(jù)分析工具(1)工作表函數(shù)與數(shù)據(jù)分析工具的區(qū)別(2)數(shù)據(jù)分析工具的內(nèi)容“數(shù)據(jù)”選項(xiàng)卡-->“分析”組-->“數(shù)據(jù)分析”2.在Excel2010中激活“分析工具庫(kù)”加載項(xiàng)第一步:?jiǎn)螕簟疚募窟x項(xiàng)卡,在彈出的列表中單擊【選項(xiàng)】命令,這時(shí)將出現(xiàn)【Excel選項(xiàng)】對(duì)話(huà)框;第二步:在【Excel選項(xiàng)】對(duì)話(huà)框中,單擊【加載項(xiàng)】命令,在右側(cè)【管理】下拉列表中選定【Exce1加載項(xiàng)】,單擊【轉(zhuǎn)到】按鈕,打開(kāi)【加載宏】對(duì)話(huà)框;第三步:在【加載宏】對(duì)話(huà)框中,勾選【分析工具庫(kù)】選項(xiàng),單擊【確定】按鈕。實(shí)驗(yàn)指導(dǎo)實(shí)驗(yàn)1.1使用Excel的RAND隨機(jī)數(shù)函數(shù)

產(chǎn)生隨機(jī)數(shù)表實(shí)驗(yàn)1.2使用Excel的“隨機(jī)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論