管理統(tǒng)計(jì)學(xué)課件:第2章 數(shù)據(jù)的收集與整理_第1頁(yè)
管理統(tǒng)計(jì)學(xué)課件:第2章 數(shù)據(jù)的收集與整理_第2頁(yè)
管理統(tǒng)計(jì)學(xué)課件:第2章 數(shù)據(jù)的收集與整理_第3頁(yè)
管理統(tǒng)計(jì)學(xué)課件:第2章 數(shù)據(jù)的收集與整理_第4頁(yè)
管理統(tǒng)計(jì)學(xué)課件:第2章 數(shù)據(jù)的收集與整理_第5頁(yè)
已閱讀5頁(yè),還剩214頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、本章概要第一節(jié) 統(tǒng)計(jì)數(shù)據(jù)的收集第二節(jié)問(wèn)卷設(shè)計(jì)第三節(jié) 統(tǒng)計(jì)數(shù)據(jù)的整理第四節(jié) SPSS基礎(chǔ)第一節(jié) 統(tǒng)計(jì)數(shù)據(jù)的收集1. 收集數(shù)據(jù)的重要性 2. 統(tǒng)計(jì)數(shù)據(jù)的類型和計(jì)量3. 統(tǒng)計(jì)數(shù)據(jù)的來(lái)源4. 統(tǒng)計(jì)數(shù)據(jù)的誤差5. 統(tǒng)計(jì)調(diào)查的步驟1. 統(tǒng)計(jì)數(shù)據(jù)收集的意義數(shù)據(jù)是統(tǒng)計(jì)學(xué)研究的原材料。原材料的好壞決定了統(tǒng)計(jì)分析的效果。2. 統(tǒng)計(jì)數(shù)據(jù)的計(jì)量與類型例 以下是關(guān)于職業(yè)調(diào)查的幾道問(wèn)題1.您的職業(yè)是什么? A.程序猿 B.小編 C.boss D.以賣萌為生2.你對(duì)自己職業(yè)的收入滿意嗎? A.很滿意 B.較為滿意 C.一般 D.不滿意 E.很不滿意3.你工作城市的平均氣溫是 度。 4.您每個(gè)月的到手收入是 元。2. 統(tǒng)計(jì)數(shù)

2、據(jù)的類型以及計(jì)量方式定類尺度、定序尺度、定距尺度、定比尺度2. 統(tǒng)計(jì)數(shù)據(jù)的計(jì)量與類型定類數(shù)據(jù)將數(shù)字作為現(xiàn)象總體中不同類別或不同組別的代碼。這是最低層次的尺度。如性別:男,女定序數(shù)據(jù)按照特征等級(jí)進(jìn)行排序,數(shù)據(jù)之間有大小之分,但沒(méi)有大多少的概念。 優(yōu)、良、中、差2. 統(tǒng)計(jì)數(shù)據(jù)的計(jì)量與類型定距數(shù)據(jù)(間隔數(shù)據(jù))不僅可以用數(shù)值表示現(xiàn)象類(組)別的不同和順序大小的差異,而且可以用確切的數(shù)值反映現(xiàn)象之間在量方面的差別。數(shù)據(jù)之間可做加減,不能做乘除,只有相對(duì)大小。如:攝氏度定比數(shù)據(jù)(比例數(shù)據(jù))不僅有確定的間距,而且有自然確定絕對(duì)的零點(diǎn)。數(shù)據(jù)之間可做加減,也可做乘除,既有相對(duì)大小,又有絕對(duì)大小。2. 統(tǒng)計(jì)數(shù)據(jù)的

3、計(jì)量與類型問(wèn)題,下面數(shù)據(jù)按照計(jì)量方式?性別體重速度溫度兄弟姐妹個(gè)數(shù)成績(jī):A,B,C,D按照數(shù)據(jù)的時(shí)間特征劃分統(tǒng)計(jì)數(shù)據(jù)橫截面數(shù)據(jù)(時(shí)間固定)在同一時(shí)間,不同統(tǒng)計(jì)單位相同統(tǒng)計(jì)指標(biāo)組成的數(shù)據(jù)。時(shí)間序列數(shù)據(jù)(事物,現(xiàn)象固定)在不同時(shí)間,同一事物、現(xiàn)象歲時(shí)間的變化狀況。 3、面板數(shù)據(jù)(橫截面數(shù)據(jù)與時(shí)間序列數(shù)據(jù))3.統(tǒng)計(jì)數(shù)據(jù)的來(lái)源數(shù)據(jù)來(lái)源二手?jǐn)?shù)據(jù)原始數(shù)據(jù)公司內(nèi)部信息專門(mén)機(jī)構(gòu)獲取政府機(jī)構(gòu)提供觀察法實(shí)驗(yàn)法報(bào)告法詢問(wèn)法4.統(tǒng)計(jì)數(shù)據(jù)的誤差(自己看ppt,課下自學(xué))調(diào)查的偏差來(lái)自許多方面,分為兩類:抽樣誤差和非抽樣誤差抽樣誤差由抽樣隨機(jī)性造成,只存在于概率抽樣中。非抽樣誤差覆蓋誤差測(cè)量誤差處理誤差無(wú)反應(yīng)誤差4.統(tǒng)計(jì)

4、數(shù)據(jù)的誤差1.覆蓋誤差:指由于在抽樣框或樣本中出現(xiàn)了涵蓋不全、過(guò)度涵蓋、重復(fù)以及錯(cuò)誤的分類而導(dǎo)致估計(jì)的偏倚。2.測(cè)量誤差:指對(duì)一個(gè)問(wèn)題所做的記錄與它的真值不同,可能是由于被調(diào)查者和調(diào)查者對(duì)問(wèn)題的誤解、收集數(shù)據(jù)方式不同或測(cè)量工具而造成的。道德誤差調(diào)查人員缺乏業(yè)務(wù)培訓(xùn)或職業(yè)道德被調(diào)查者誤差理解有誤,有意欺瞞3.處理誤差:可能發(fā)生在數(shù)據(jù)編碼、數(shù)據(jù)錄入、審核及插補(bǔ)等步驟中。4.統(tǒng)計(jì)數(shù)據(jù)的誤差4.無(wú)反應(yīng)誤差在抽樣調(diào)查中,我們希望能取得所要求的全部樣本單位的數(shù)據(jù)或特征記錄,但在實(shí)踐中,常有部分單位的調(diào)查結(jié)果會(huì)因多種原因而出現(xiàn)空缺,即常稱的無(wú)反應(yīng)現(xiàn)象。調(diào)查中無(wú)反應(yīng)的原因 (1)調(diào)查對(duì)象聯(lián)絡(luò)不上,已經(jīng)搬走 (

5、2)被調(diào)查者不能勝任或無(wú)能力 (3)調(diào)查期間人不在 (4)拒絕合作 (5)丟失調(diào)查表4.統(tǒng)計(jì)數(shù)據(jù)的誤差案例Literary Digest雜志自第一次世界大戰(zhàn)以來(lái)一直進(jìn)行總統(tǒng)預(yù)測(cè),而且每次都預(yù)測(cè)準(zhǔn)了。 1936年美國(guó)總統(tǒng)選舉前,Literary Digest雜志發(fā)出了1000萬(wàn)張調(diào)查問(wèn)卷。回收到240萬(wàn)張,預(yù)測(cè)共和黨候選人蘭登(London)和民主黨候選人羅斯福(Roosevelt)的得票比例是57:43,預(yù)測(cè)是根據(jù)240萬(wàn)張的民意調(diào)查回單作出的。但實(shí)際選舉結(jié)果是羅斯福贏得了這場(chǎng)選舉,他與蘭登得票比例是62 :38。4.統(tǒng)計(jì)數(shù)據(jù)的誤差分析出現(xiàn)預(yù)測(cè)錯(cuò)誤的原因:第一.選取樣本的方式不是隨機(jī)的,它主要

6、是從電話號(hào)碼簿和各種俱樂(lè)部會(huì)員名冊(cè)上去選取的,這些人大多是有錢(qián)人,他們支持共和黨候選人蘭登;第二. 有760萬(wàn)張問(wèn)卷無(wú)反應(yīng),在沒(méi)有寄回的人中支持共和黨和支持民主黨人的比例一般與寄回來(lái)的240萬(wàn)答卷中的支持比例不一樣,例如該雜志向芝加哥地區(qū)三分之一的登記選民發(fā)了調(diào)查問(wèn)卷,有20%的被詢問(wèn)者作了回答,其中一半以上支持蘭登,但實(shí)際選舉的結(jié)果是在芝加哥地區(qū)是2 : 1有利于羅斯福。4.統(tǒng)計(jì)數(shù)據(jù)的誤差由于無(wú)反應(yīng)(等于改變了原先隨機(jī)抽取的樣本)而造成的偏差叫“無(wú)反應(yīng)偏差”。在調(diào)查中我們要盡量減少這種偏差。為解決無(wú)反應(yīng)問(wèn)題,常用的處理方法有:多次調(diào)查對(duì)調(diào)查結(jié)果進(jìn)行估算在無(wú)回答者中抽取隨機(jī)子樣本調(diào)查對(duì)無(wú)回答者

7、的替代總體(學(xué)生)樣本框架(電話簿里的學(xué)生)計(jì)劃選取樣本(選定的學(xué)生)實(shí)際的樣本覆蓋面誤差抽樣誤差不回答和度量誤差4.統(tǒng)計(jì)數(shù)據(jù)的誤差5.統(tǒng)計(jì)調(diào)查的步驟1.明確調(diào)查目的(根據(jù)目的確定獲得數(shù)據(jù)方法)探測(cè)性調(diào)研(揭示現(xiàn)象)夏士蓮綠茶洗發(fā)水受消費(fèi)者青睞嗎?適合的調(diào)查方式:對(duì)目標(biāo)顧客進(jìn)行抽樣調(diào)查 描述性調(diào)研(定量描述)某家電商場(chǎng)在周日的人流量是多少?適合的調(diào)查方式:觀察法因果性調(diào)研(測(cè)試因果關(guān)系)假如將某一款產(chǎn)品降價(jià)10,會(huì)不會(huì)有大量消費(fèi)者購(gòu)買(mǎi)?消費(fèi)者的數(shù)量能增加多少?適合的調(diào)查方法:實(shí)驗(yàn)法5.統(tǒng)計(jì)調(diào)查的步驟2、確定調(diào)查對(duì)象和調(diào)查單位。調(diào)查對(duì)象:是指需要調(diào)查的現(xiàn)象總體,該總體是由許多性質(zhì)相同的調(diào)查單位組

8、成的。調(diào)查單位:是指所要調(diào)查的具體單位。報(bào)告單位:報(bào)告單位亦稱填報(bào)單位,它是負(fù)責(zé)向上報(bào)告調(diào)查內(nèi)容、提交統(tǒng)計(jì)資料的單位。調(diào)查單位與報(bào)告單位,有時(shí)是一致的,有時(shí)不一致。3、確定調(diào)查項(xiàng)目。調(diào)查項(xiàng)目就是調(diào)查中所要登記的調(diào)查單位的特征,即調(diào)查單位所承擔(dān)的基本標(biāo)志,它由一系列定性數(shù)據(jù)和定數(shù)量所構(gòu)成。5.統(tǒng)計(jì)調(diào)查的步驟4、調(diào)查表格和問(wèn)卷的設(shè)計(jì)。調(diào)查表:將各個(gè)調(diào)查項(xiàng)目按照一定的順序排列在一定的表格上,就構(gòu)成了調(diào)查表。問(wèn)卷調(diào)查:根據(jù)調(diào)查目的,在調(diào)查對(duì)象中隨機(jī)選擇或有意識(shí)地確定調(diào)查單位,以書(shū)面文字或表格形式了解被調(diào)查者的意見(jiàn),調(diào)查者自愿、自由地回答問(wèn)卷中所提出的問(wèn)題。5、確定調(diào)查時(shí)間。 統(tǒng)計(jì)調(diào)查時(shí)間包括二種涵義,

9、即調(diào)查時(shí)間和調(diào)查期限。調(diào)查時(shí)間:是指調(diào)查資料所屬的時(shí)間。調(diào)查期限:是進(jìn)行調(diào)查工作的時(shí)限,包括搜集資料和報(bào)送資料的工作所需的時(shí)間。5.統(tǒng)計(jì)調(diào)查的步驟6 、調(diào)查的計(jì)劃實(shí)施7 、加工數(shù)據(jù)8 、分析數(shù)據(jù)9 、解釋發(fā)現(xiàn)10 、報(bào)告結(jié)果第二節(jié)問(wèn)卷設(shè)計(jì)問(wèn)卷設(shè)計(jì) 什么是問(wèn)卷問(wèn)卷(Questionnaires)是社會(huì)調(diào)查中用來(lái)收集資料的一種工具,一種類似于體溫表、測(cè)力器、磅秤、米尺那樣的工具。與這些工具不同的是,問(wèn)卷在形式上是一份精心設(shè)計(jì)的問(wèn)題表格,而其用途則是用來(lái)測(cè)量人們的行為、態(tài)度和社會(huì)特征的,它所收集的則是有關(guān)社會(huì)現(xiàn)象和人們社會(huì)行為的各種資料。問(wèn)卷的一般結(jié)構(gòu)(l)封面信,即一封致被調(diào)查者的短信。它的作用在

10、于向被調(diào)查者介紹和說(shuō)明調(diào)查的目的,調(diào)查單位或調(diào)查者的身份、調(diào)查的大概內(nèi)容、調(diào)查對(duì)象的選取方法和對(duì)結(jié)果保密的措施等。首先,要說(shuō)明調(diào)查者的身份,即說(shuō)明“我是誰(shuí)”。其次,要說(shuō)明調(diào)查的大致內(nèi)容,即“調(diào)查什么”。最后,要說(shuō)明調(diào)查對(duì)象的選取方法和對(duì)調(diào)查結(jié)果保密的措施。另外,還應(yīng)該明確地說(shuō)明“ 本次調(diào)查不用填寫(xiě)姓名和單位,答案無(wú)對(duì)錯(cuò)之分,請(qǐng)你不必有任何顧慮”。在信的結(jié)尾處,一定要真誠(chéng)地感謝被調(diào)查者的合作與幫助等。指導(dǎo)語(yǔ)即用來(lái)指導(dǎo)被調(diào)查者填答問(wèn)卷的各種解釋和說(shuō)明,其作用和儀器的使用說(shuō)明相似。有些問(wèn)卷的填答方法比較簡(jiǎn)單,指導(dǎo)語(yǔ)很少,常常只在封面信中用一兩句話說(shuō)明即可。有些指導(dǎo)語(yǔ)則集中在封面信之后,并標(biāo)有“填表說(shuō)

11、明”的標(biāo)題,其作用是對(duì)填表的方法、要求、注意事項(xiàng)等作一個(gè)總的說(shuō)明。另外,有些指導(dǎo)語(yǔ)則分散在某些較復(fù)雜的調(diào)查問(wèn)題后,對(duì)填答要求、方式和方法進(jìn)行說(shuō)明。(2)指導(dǎo)語(yǔ)(1)請(qǐng)?jiān)诿恳粋€(gè)問(wèn)題后適合自己情況的答案號(hào)碼上劃圈,或者在處填上適當(dāng)?shù)膬?nèi)容。(2)若無(wú)特殊說(shuō)明,每一個(gè)問(wèn)題只能選擇一個(gè)答案。(3)填寫(xiě)問(wèn)卷時(shí),請(qǐng)不要與他人商量。填表說(shuō)明是問(wèn)卷的主體,也是問(wèn)卷設(shè)計(jì)的主要內(nèi)容。問(wèn)卷中的問(wèn)題從形式上看,可分為:開(kāi)放式問(wèn)題封閉式問(wèn)題(3)問(wèn)題及答案編碼其他資料(4)編碼及其他資料問(wèn)卷的分類二、 問(wèn)卷設(shè)計(jì)的原則明確問(wèn)卷設(shè)計(jì)的出發(fā)點(diǎn)為了讓回答者吐真言。不僅要考慮研究者的需要,還要多為回答者著想。問(wèn)卷語(yǔ)言通俗易懂。不要

12、誘導(dǎo)被調(diào)查者。多使用簡(jiǎn)單句型。盡量降低調(diào)查的敏感性。問(wèn)題要科學(xué)排序:由易到難;先封閉問(wèn)題再開(kāi)放式問(wèn)題;邏輯性。明確阻礙問(wèn)卷調(diào)查的各種因素(1)主觀上的障礙。即被調(diào)查者因在心理上和思想上對(duì)問(wèn)卷產(chǎn)生的各種不良反應(yīng)所形成的障礙。 (2)客觀上的障礙。即由被調(diào)查者自身的能力、條件等方面的限制所形成的障礙。明確與問(wèn)卷設(shè)計(jì)緊密相連的各種因素(l)調(diào)查的目的(2)調(diào)查的內(nèi)容(問(wèn)題分解)(3)問(wèn)卷的分析方式(多考慮一下后期)。問(wèn)卷設(shè)計(jì)資料的分析方式,分析方式對(duì)問(wèn)卷有著不同的要求。除上述各種因素外,當(dāng)然還不能忽視調(diào)查經(jīng)費(fèi)多少、調(diào)查人員多少、調(diào)查時(shí)間長(zhǎng)短等對(duì)問(wèn)卷設(shè)計(jì)工作的限制。三、 問(wèn)卷設(shè)計(jì)的步驟探索性工作先摸摸

13、底,熟悉和了解一些基本的情況探索工作:與各種對(duì)象交談,并留心觀察他們的特征、行為和態(tài)度。根據(jù)前期探索情況設(shè)計(jì)問(wèn)題。 設(shè)計(jì)問(wèn)卷初稿第一步(匯總問(wèn)題)第二步(問(wèn)題分類)第三步(問(wèn)題順序)第四步(聯(lián)成整體)第五步(優(yōu)化問(wèn)題)最后(形成初稿)試用試用問(wèn)卷的具體做法是,將問(wèn)卷初稿打印若干份,然后采取非隨機(jī)抽樣的方法選取一個(gè)小樣本,用這些問(wèn)卷初稿對(duì)他們進(jìn)行調(diào)查。最后認(rèn)真檢查和分析成調(diào)查的結(jié)果,從中發(fā)現(xiàn)問(wèn)題和缺陷并進(jìn)行修改。試用過(guò)程中要注意看以下幾個(gè)指標(biāo)。 回收率 有效回收率,即扣除各種廢卷后的回收率 填寫(xiě)錯(cuò)誤。(答非所問(wèn);填答方式錯(cuò)誤) 填答不完全。修改定稿并印制四、 問(wèn)卷設(shè)計(jì)的具體方法問(wèn)題的形式常見(jiàn)考試

14、題型?常見(jiàn)考試題型難以回答和處理的題型=問(wèn)卷的題型問(wèn)題的形式填空題選擇題(單項(xiàng)選擇題(2選1,多選1);多項(xiàng)選擇題(限選幾個(gè),限選排序,多項(xiàng)任選題);矩陣式問(wèn)題(同類問(wèn)題集中在一起);問(wèn)題題)問(wèn)題的形式(1)填空式。 即在問(wèn)題后劃一短橫線,讓回答者直接在空自處填寫(xiě)。填空式一般用于那些對(duì)回答者來(lái)說(shuō)既容易回答,又容易填寫(xiě)的問(wèn)題,通常只需填寫(xiě)數(shù)字。例1 請(qǐng)問(wèn)您家有幾口人? 口例2 您的年齡有多大? 周歲例3 您有幾個(gè)孩子? 個(gè)例4 您每天上班在路上需要多少時(shí)間 分鐘(2)二項(xiàng)選擇。即問(wèn)題的答案只有是和不是(或其他肯定形式和否定形式)兩種,回答者根據(jù)已有的情況選擇其一。這種形式的問(wèn)題有兩種不同的情形。

15、一是問(wèn)題所能列舉答案本身就只有兩種可能的類別。另一種是在詢問(wèn)人們的態(tài)度或看法時(shí)進(jìn)行的兩極區(qū)分,例5 您是共青團(tuán)員嗎? 是 不是例6 您是否住在本市? 是 不是例7 您家有電視機(jī)嗎? 有 沒(méi)有例8 您是否同意民主選舉廠長(zhǎng)? 同意 不同意例9 您是否同意“主觀為自己,客觀為他人”的說(shuō)法? 同意 不同意(3)多項(xiàng)單選式。即給出的答案至少在兩個(gè)以上,回答者根據(jù)自己的情況選擇其中一個(gè)作為回答。其答案特別適合于進(jìn)行頻數(shù)統(tǒng)計(jì)和交互分析。在設(shè)計(jì)上,這種問(wèn)題形式的關(guān)鍵之處是要保證答案的窮盡性和互斥性。在具體表達(dá)方式上,多項(xiàng)單選式又有幾種不同的類型。例10 您的文化程度是: (請(qǐng)?jiān)诤螘r(shí)答案號(hào)碼上打 )(1) 小學(xué)

16、以下 (2)初中 (3)高中或中專 (4)大專以上例11 您的婚姻狀況是: (請(qǐng)?jiān)诤线m答案的方框中打 )(1)未婚 (2)已婚 (3)離婚 (4) 喪偶 (5) 其他例12 您最喜歡看哪一類電視節(jié)目?(請(qǐng)?jiān)诤线m的答案后的括號(hào)里打)(1)新聞節(jié)目 ( ) (2)電視劇 ( ) (3)體育節(jié)目 ( ) (4)廣告節(jié)目 ( ) (5)其他(請(qǐng)寫(xiě)明) ( )(4)多項(xiàng)限選式。與多項(xiàng)選一式有所不同的是,我們可以在所列舉的多個(gè)答案中,要求回答者根據(jù)自己的情況從中選擇若干個(gè)。比如將例12 改成多項(xiàng)限選式,變?yōu)槔?3 。例14 也是多項(xiàng)限選式的一個(gè)例子。例13 您最喜歡看哪些電視節(jié)目?(請(qǐng)從下列答案中選擇三項(xiàng)

17、在括號(hào)打)新聞節(jié)目( ) 電視劇( ) 體育節(jié)目( )廣告節(jié)目( ) 教育節(jié)目( ) 歌舞節(jié)目( )少兒節(jié)目( ) 其他節(jié)目(請(qǐng)寫(xiě)明)( )例14 您生育孩子的主要?jiǎng)訖C(jī)是什么?(請(qǐng)從下列答案中選擇三項(xiàng)在括號(hào)內(nèi)打)傳宗接代( )完善人生( ) 增加夫妻感情( ) 養(yǎng)兒防老( ) 擴(kuò)大家族勢(shì)力( )體驗(yàn)做父母的樂(lè)趣( ) 增加勞動(dòng)力( ) 沒(méi)考慮過(guò)( ) 其他(請(qǐng)寫(xiě)明)( ) 多項(xiàng)限選式的優(yōu)點(diǎn)是,在有些情況下它比多項(xiàng)選一的方式更能反映被調(diào)查者的實(shí)際情況。因此在很多方面人們實(shí)際上是存在著不止一種選擇的,但另一方面,我們卻無(wú)法從這種形式的問(wèn)題回答中看出被調(diào)查者選擇的順序。(5)多項(xiàng)排序式。這種方式可以

18、說(shuō)是針對(duì)多項(xiàng)限選式的不足而出現(xiàn)的一種問(wèn)題類型。在一定程度上可以看成是多項(xiàng)單選式和多項(xiàng)限選式的一種結(jié)合。它一方面要求被調(diào)查者在所給出的多個(gè)答案中選擇兩個(gè)以上(但有限)的答案,另一方面又要求被調(diào)查者對(duì)他所選擇的這些答案進(jìn)行排序,比如例15 。 例15 您認(rèn)為作為一名企業(yè)領(lǐng)導(dǎo)最重要的3條素質(zhì)是什么?(請(qǐng)將答案填入下表)第一重要第二重要第三重要大公無(wú)私 堅(jiān)持原則 敢想敢干 以身作則 團(tuán)結(jié)群眾 業(yè)務(wù)熟悉 思想敏捷 文化程度高 其他(請(qǐng)寫(xiě)明)-多項(xiàng)任選式。多項(xiàng)任選式則是在所提供的答案中,被調(diào)查者可以任意選擇各種不同數(shù)目答案的一種問(wèn)題形式。比如例16 需要注意的是,這種形式的問(wèn)題實(shí)際上已不再是“一個(gè)”問(wèn)題了

19、。它在某種意義上已經(jīng)變成了“多個(gè)”類似的問(wèn)題。即針對(duì)每一個(gè)具體答案而提出的多個(gè)問(wèn)題。因此,在對(duì)問(wèn)題進(jìn)行編碼的時(shí)候,不能像多項(xiàng)選一式那樣只給一個(gè)碼,而是要將每一個(gè)答案都看成是一個(gè)變量,都給一個(gè)編碼。這樣,此例中的“變量”就有9個(gè),編碼時(shí)也就要給9個(gè)號(hào)碼。 例16 在以下各種家用物品中,您家有哪些?(請(qǐng)?jiān)谀矣械奈锲反鸢干洗颍?)彩色電視機(jī) (2)錄像機(jī) (3)影碟機(jī) (4) 空調(diào)器 (5)洗衣機(jī) (6)電冰箱 (7)計(jì)算機(jī) (8)微波爐 (9)電話 (7)矩陣式。即一種將同類型的若干個(gè)問(wèn)題集中在一起,構(gòu)成一個(gè)問(wèn)題的表達(dá)方式。比如例17。 這種矩陣式的優(yōu)點(diǎn)是節(jié)省問(wèn)卷的篇幅,同時(shí)由于同類問(wèn)題集中在

20、一起回答方式也相同,因此也節(jié)省了回答者閱讀和填寫(xiě)的時(shí)間。但要注意的是,一定要對(duì)這樣的問(wèn)題給出專門(mén)的填寫(xiě)說(shuō)明或填答指導(dǎo),以免有的回答者不會(huì)填寫(xiě)。例17 你覺(jué)的下列現(xiàn)象在你們學(xué)校是否嚴(yán)重?(請(qǐng)?jiān)诿恳恍羞m當(dāng)?shù)姆娇騼?nèi)打) 很嚴(yán)重 比較嚴(yán)重 不太嚴(yán)重 不嚴(yán)重 不知道(1)遲到 (2)早退 (3)請(qǐng)假 (4)曠課 (8)表格式。表格式其實(shí)是矩陣式的一種變體,其特點(diǎn)和形式都與矩陣式十分相似。 表格式的問(wèn)題除了具有矩陣式的特點(diǎn)外,還顯得更為整齊、醒目。但應(yīng)當(dāng)注意的是,這兩種形式雖然具有簡(jiǎn)單集中的優(yōu)點(diǎn),但也容易使人產(chǎn)生呆板、單調(diào)的感覺(jué),在一份問(wèn)卷中這兩種形式的問(wèn)題不宜用得太多。例18 你覺(jué)的下列現(xiàn)象在你們學(xué)校是

21、否嚴(yán)重?(請(qǐng)?jiān)诿恳恍羞m當(dāng)?shù)母裰写颍┖車?yán)重 比較嚴(yán)重 不太嚴(yán)重不嚴(yán)重不知道遲到早退請(qǐng)假曠課答案的設(shè)計(jì)例19 您的性別(請(qǐng)選一項(xiàng)打)(1)男 (2) 女例20 你最喜歡看哪類電視節(jié)目?(請(qǐng)?jiān)诤线m的答案號(hào)碼上打)(1)新聞節(jié)目 (2) 體育節(jié)目 (3)電視劇(4) 教學(xué)節(jié)目答案要有窮盡性和互斥性。所謂答案的窮盡性,指的是答案包括了所有可能的情況。 所謂答案的互斥性,指的是答案互相之間不能交叉重疊或相互 包含例19和20是否滿足答案設(shè)計(jì)的兩個(gè)原則?請(qǐng)?jiān)u價(jià)一下例21.例21 您的職業(yè)是什么?(請(qǐng)?jiān)诤线m答案號(hào)碼上打 )(1) 工人 (2) 農(nóng)民 (3)干部 (4)商業(yè)人員 (5)醫(yī)生 (6)售貨員 (7)

22、專業(yè)人員 (8)教師 (9)其他相倚問(wèn)題所謂相倚問(wèn)題,指的是在前后兩個(gè)(或多個(gè))相連的問(wèn)題中,被調(diào)查者是否應(yīng)當(dāng)回答后一個(gè)(或后幾個(gè))問(wèn)題,要由他對(duì)前一個(gè)問(wèn)題的回答結(jié)果來(lái)決定。前一個(gè)問(wèn)題稱作“過(guò)濾性問(wèn)題”,后一個(gè)問(wèn)題則稱作“相倚問(wèn)題”。例22 你是個(gè)體經(jīng)營(yíng)者嗎?(1)是 請(qǐng)問(wèn)你是哪一年開(kāi)始從事個(gè)體經(jīng)營(yíng)的?19年。 一般情況下,你每天工作多長(zhǎng)時(shí)間?小時(shí)。(2)不是例23 你有孩子嗎?(1) 有 請(qǐng)問(wèn)你有幾個(gè)孩子?個(gè)。 你最小的孩子上學(xué)了嗎? (1) 上了 他在上哪級(jí)學(xué)校?1 小學(xué) 2 中學(xué)(中專) 3 大學(xué) (2)沒(méi)上(2) 沒(méi)有例24 請(qǐng)問(wèn)你的婚姻情況(1)未婚 請(qǐng)?zhí)^(guò)2-8,直接從問(wèn)題9回答(

23、2)已婚(3)離婚(4)喪偶五、 問(wèn)卷設(shè)計(jì)中的常見(jiàn)錯(cuò)誤概念抽象1 概念抽象 例25 從總體上看,你認(rèn)為我國(guó)的政治體制如何?(請(qǐng)?jiān)诤线m答案號(hào)碼上打)(1)基本合理 (2)存在一些弊端()存在嚴(yán)重弊端()不了解 例26 請(qǐng)問(wèn)你們家屬于下列哪一類家庭?(請(qǐng)?jiān)诤线m答案號(hào)碼打)(1) 核心家庭 (2)主干家庭 (3) 單身家庭 (4) 聯(lián)合家庭 問(wèn)題含糊2問(wèn)題含糊所謂問(wèn)題含糊,指的是問(wèn)題的含義不清楚、不明確,或者問(wèn)題有歧義。這種問(wèn)題有些是由于設(shè)計(jì)者對(duì)所提問(wèn)題的目的和用意不明確造成的,有些則是由于問(wèn)題的語(yǔ)言表達(dá)不當(dāng)或?qū)?wèn)題的用語(yǔ)推敲不夠造成的。例27 你認(rèn)為我們國(guó)家現(xiàn)在最需要(請(qǐng)?jiān)诤线m答案號(hào)碼上打)(1)

24、全面迅速的改變 (2) 全面緩慢的改變(3)部分迅速的改變 (4) 部分緩慢的改變例28 有人說(shuō),“文革”前青年人對(duì)老年人很尊重,現(xiàn)在青年人越來(lái)越不尊重老年人了。你認(rèn)為這種變化發(fā)展得請(qǐng)?jiān)诤线m答案號(hào)碼上打 )(1) 太快了 (2)比較快 (3) 比較慢 (4) 太慢了問(wèn)題帶有傾向性3 問(wèn)題帶傾向性例29 你認(rèn)為全國(guó)職工的平均工資水平是否應(yīng)當(dāng)提高呢?(請(qǐng)?jiān)诤线m答案號(hào)碼上打)(1) 工資偏低,應(yīng)當(dāng)大幅度提高 (2) 應(yīng)當(dāng)小幅度增加(3)雖然偏低,但為了國(guó)家經(jīng)濟(jì)建設(shè),可以暫時(shí)不增加(4)和勞動(dòng)生產(chǎn)率相比,工資不算低,不應(yīng)該增加例30 有人認(rèn)為,制度改革的結(jié)果最終將有利于國(guó)家經(jīng)濟(jì)繁榮。你的看法:(請(qǐng)?jiān)?

25、合適答案號(hào)碼上打)(1)同意 (2)不同意 (3)不知道4.問(wèn)題的提法不妥例32 你現(xiàn)在的實(shí)際文化程度相當(dāng)于(請(qǐng)?jiān)诤线m答案號(hào)碼上打)(1)小學(xué) (2) 初中 (3)高中或中專 (4)大學(xué)例31 請(qǐng)你判斷下列說(shuō)是否正確(請(qǐng)?jiān)诤线m的格中打)正確錯(cuò)誤不知道打和罵是家庭教育不可缺少的方式問(wèn)題有多重含義5問(wèn)題有多重含義例33 實(shí)行責(zé)任制以來(lái),你覺(jué)得你家里人的文化水平及生產(chǎn)技術(shù)能否滿足生產(chǎn)需要?(請(qǐng)?jiān)诤线m答案號(hào)碼上打)(1) 能 (2) 不能 (3) 不知道問(wèn)題與答案不協(xié)調(diào)6問(wèn)題與答案不協(xié)調(diào)在封閉式問(wèn)題中,問(wèn)題和答案是一個(gè)不可分割的整體,二者之間必須相互協(xié)調(diào),密切配合。簡(jiǎn)單地說(shuō),就是提什么問(wèn)題,就準(zhǔn)備什么

26、答案,而不能形成“答非所問(wèn)”的情況。例35 你認(rèn)為你是否有調(diào)離的可能? (請(qǐng)?jiān)诤线m答案號(hào)碼上打)(1)十分困難 (2)比較困難 (3)不太困難 (4)十分容易 例36 你最喜歡看哪一類報(bào)刊? (請(qǐng)?jiān)诤线m答案號(hào)碼上打)經(jīng)??从袝r(shí)看很少看時(shí)事政治科普常識(shí)人物傳記體育娛樂(lè)很顯然,問(wèn)題與答案不協(xié)調(diào):?jiǎn)栴}問(wèn)的是報(bào)刊的類別,而答案則是每一類報(bào)刊的閱讀頻率,因此,應(yīng)該將答案改為:“ 時(shí)事政治; 科普常識(shí); 人物傳記; 體育娛樂(lè)”。如果想要了解每一類報(bào)刊的閱讀情況,那么就必須將問(wèn)題改為:“你對(duì)下列報(bào)刊的閱讀情況如何? 六、 問(wèn)卷的發(fā)放與回收如何提高問(wèn)卷的回收率七、 如何提高問(wèn)卷設(shè)計(jì)的質(zhì)量高質(zhì)量問(wèn)卷的標(biāo)準(zhǔn)(l)

27、具有較高的信度和效度。 (2)適合研究的目的和內(nèi)容。 (3)適合調(diào)查對(duì)象。 (4)問(wèn)題少而精。在某種意義上,一份高質(zhì)量的問(wèn)卷應(yīng)該具備法律條款那樣的性質(zhì):清楚、明確、適合于所有對(duì)象。學(xué)習(xí)問(wèn)卷設(shè)計(jì)不能只從書(shū)本上學(xué),還要從設(shè)計(jì)調(diào)查問(wèn)卷的實(shí)踐中學(xué)。要提高設(shè)計(jì)問(wèn)卷的水平,除了掌握上述有關(guān)知識(shí)外,還要在以下3 個(gè)方面打下堅(jiān)實(shí)的基礎(chǔ)。一是語(yǔ)文知識(shí)水平。二是社會(huì)調(diào)查研究方法的知識(shí)。三是社會(huì)生活知識(shí)。如何設(shè)計(jì)高標(biāo)準(zhǔn)的問(wèn)卷第三節(jié) 統(tǒng)計(jì)數(shù)據(jù)的整理3.1 數(shù)據(jù)的表示3.2 統(tǒng)計(jì)數(shù)據(jù)的分布特征3.1 數(shù)據(jù)的表示3.1.1 列表表示3.1.2 圖示法統(tǒng)計(jì)表類型將變量所取值按時(shí)間順序排列序列表分類表按數(shù)值分類定性分布頻數(shù)分

28、布時(shí)間序列表地域序列將變量所取值按地域排列按性質(zhì)分類3.1.1 列表表示(統(tǒng)計(jì)表)時(shí)間序列表的例子:統(tǒng)計(jì)表定性分布: 首先建立一個(gè)元素的類別系統(tǒng),使得各類互相排斥,而且是完備的,使被觀測(cè)的各元素能既不重復(fù)又無(wú)遺漏地分到各類中去。 然后記錄分到同類中的元素個(gè)數(shù),或?qū)⑼愔懈髟氐挠^測(cè)值加以歸并,這樣得到定性分布。 元素分類觀測(cè)值記錄與歸并定性分布統(tǒng)計(jì)表定性分布的例子:統(tǒng)計(jì)表頻數(shù)分布: 按變量所取的值進(jìn)行分類,于是資料中每個(gè)觀測(cè)值都分到相應(yīng)類中去。記錄各類中觀測(cè)值出現(xiàn)的次數(shù),制成頻數(shù)分布表。確定組數(shù)k找出xmin與xmax計(jì)算組距h確定每組上下限將相應(yīng)數(shù)據(jù)歸并到各組Xmin 最小值,xmax 最大

29、值統(tǒng)計(jì)表分?jǐn)?shù) 計(jì) 數(shù) 人數(shù)(f) 404915059正正146069正正正正正正正正正正正557079正正正正正正正正正正正588089正正正正正正正正正正529099正正正171001093 總數(shù) 200 在所屬組的記錄欄做一記號(hào),按照我國(guó)習(xí)慣,用寫(xiě)“正”字方法,英文書(shū)使用“#”符號(hào) 表2-4 某校200個(gè)學(xué)生高等數(shù)學(xué)考試成績(jī)統(tǒng)計(jì)表表2-5 某校200個(gè)學(xué)生高等數(shù)學(xué)考試成績(jī)的頻數(shù)分布表分?jǐn)?shù) 人數(shù)(f) 分?jǐn)?shù) 人數(shù)(f) 4045176812546510828742525712889310586329949911646928100105 3 7075 39總 數(shù) 200 統(tǒng)計(jì)表統(tǒng)計(jì)表表2-5與

30、表2-6的對(duì)比表2-5中組距等于6,頻數(shù)分布的規(guī)則性,仍然可以維持,同時(shí)細(xì)節(jié)的損失也可減輕表2-6中的組距等于2,各組頻數(shù)分布就變得很不規(guī)則了。由此可見(jiàn),組數(shù)的確定應(yīng)適當(dāng),亦不宜太多統(tǒng)計(jì)表累積頻數(shù)(Cumulative Frequency):由第一組起至第i組止各頻數(shù)之和稱為第i組的累積頻數(shù),記為Fi,即:頻率(Percent Frequency):就是頻數(shù)除以總數(shù)n:fi/n,經(jīng)常以百分?jǐn)?shù)表示。累計(jì)頻數(shù)與頻率統(tǒng)計(jì)表頻數(shù)表的例子統(tǒng)計(jì)表數(shù)據(jù)的處理步驟1.首先把數(shù)據(jù)按從小到大的順序排列起來(lái)。 當(dāng)數(shù)據(jù)太多時(shí),可以用莖葉法排隊(duì) 2.確定數(shù)據(jù)的最大值和最小值,求出極差。 3.確定組數(shù)和組距。 4.確定組

31、限和組中值。 5.分別計(jì)算各組區(qū)間內(nèi)的頻數(shù)及頻率。 6.列出頻數(shù)和頻率分布表。例1 觀察每10分鐘進(jìn)入某超市的人數(shù),144個(gè)數(shù)據(jù)如下:23,23,35, 7, 29, 3,15,20,30,18,23,32,34,40,17, 25,30,33,51,37,43,52,67,34,20,26,46,68,79,82,57,61,96,75,59,64, 77,99,87,48,58,95,96,68,46,73,57,39,45,28,24,35,43,25, 27,30,42,30,22,18,21,26,21, 8,19,15, 24,12, 8, 8, 6, 8, 20, 8,25, 2

32、9, 26,36,26,28,36,22,41,37,30,50,28,35, 24,36, 50,44,48,38,47,55,30,44,50,40,47,83,75,64,66,75,83,90, 87,59,63,78,75,86,86,77,64,70,65,69,56,55,42,47,33,36, 34,29,33,25,16,30,22,18,9,14,16,20, 26,10, 18, 9, 7, 8,枝葉圖枝葉頻數(shù)073888 68899 7812158789 52684 60813233903 50684 57216 14059 66828 49520 631350240

33、 37495 00667 05680 3643025403686 53214 87407 2717512798 70050 96513678148 46345 911795735 5857010827337 6679695605進(jìn)入超市人數(shù) Stem-and-Leaf Plot Frequency Stem & Leaf 1.00 0 . 3 11.00 0 . 67788888899 3.00 1 . 024 10.00 1 . 5566788889 16.00 2 . 0000011222333444 16.00 2 . 5555666667888999 14.00 3 . 0000000

34、2333444 11.00 3 . 55566667789 9.00 4 . 001223344 8.00 4 . 56677788 4.00 5 . 0012 8.00 5 . 55677899 5.00 6 . 13444 6.00 6 . 567889 2.00 7 . 03 8.00 7 . 55557789 3.00 8 . 233 4.00 8 . 6677 1.00 9 . 0 4.00 9 . 5669 Stem width: 10.00 Each leaf: 1 case(s)莖葉圖 用于直接描述未分組原始數(shù)據(jù)的探索性分析描述數(shù)據(jù)分布形狀,如數(shù)據(jù)是否集中,是否有極端值等 由莖

35、、葉、每個(gè)莖對(duì)應(yīng)葉的個(gè)數(shù)、莖的寬度這四元素組成莖葉圖把每一項(xiàng)觀察分解為莖值和葉值莖值確定組別葉值確定頻數(shù) (計(jì)數(shù))Xi列出頻數(shù)和頻率分布表組組頻數(shù)組頻率【0,10)120.083333【10,20)130.090278【20,30)310.215278【30,40)250.173611【40,50)170.118056【50,60)130.090278【60,70)110.076389【70,80)100.069444【80,90)70.048611【90,100)50.034722合計(jì)1441.0000003.1.2 圖示法統(tǒng)計(jì)圖通過(guò)點(diǎn)的位置、線段升降、直條的長(zhǎng)短或面積大小來(lái)表現(xiàn)事物的數(shù)量關(guān)

36、系,使用統(tǒng)計(jì)圖代替冗長(zhǎng)的文字?jǐn)⑹?,可以大大提升統(tǒng)計(jì)報(bào)告的可讀性,達(dá)到賞心悅目、事半功倍的效果。3.1.2 圖示法常用的統(tǒng)計(jì)圖有:條形圖(Bar Chart) 線圖(Line Chart)餅分圖(Pie Chart) 直方圖(Histogram) 箱式圖(Boxplot) 高低圖(High-Low) 散點(diǎn)圖(Scatter Plot) 序列圖(Sequence) 3.1.2 圖示法一.條形圖 條形圖是最初級(jí)類型的統(tǒng)計(jì)圖,常用于描述離散型數(shù)據(jù)的情況,它是用寬度相等而高度為頻數(shù)(率)的線段或狹條形表示的。例 某市2004年人才求職人員學(xué)歷分布資料如下: 編號(hào)學(xué)歷人數(shù)1博士802碩士5603本科280

37、04大專22005中專13006其他7803.1.2 圖示法3.1.2 圖示法二.線圖3.1.2 圖示法三.餅分圖 當(dāng)數(shù)據(jù)是分類數(shù)據(jù)時(shí),餅分圖是有用的。餅分圖常常用來(lái)表示各成分在總體中所占的百分比。只適用于單選問(wèn)題。例 決定某產(chǎn)品價(jià)格的因素很多,它們?cè)诳們r(jià)格中所占百分比如下表所示:因素原材料工資利潤(rùn)稅收其他總計(jì)百分比552510821003.1.2 圖示法3.1.2 圖示法四.直方圖 以每組的上下限為底,以頻率/底寬為高所構(gòu)成的圖形為直方圖。直方圖中矩形的面積之和為1。3.1.2 圖示法由60處地點(diǎn)100元價(jià)值貨物的年底價(jià)值作直方圖3.1.2 圖示法五.箱式圖箱式圖顯示數(shù)據(jù)的分布。例:組成住宅

38、房地產(chǎn)樣本的25種銷售價(jià)格(百美元)為: 660 595 1060 500 630 899 1295 749 820 843 710 950 720 575 760 1090 770 682 1016 650 425 367 1480 945 1120 3.1.2 圖示法箱線圖用于直接描述未分組原始數(shù)據(jù)的探索性分析描述數(shù)據(jù)的分布形狀,如數(shù)據(jù)是否集中,是否有極端值等可以比較多組數(shù)據(jù)分布特征圖中包含五個(gè)點(diǎn)組成:樣本數(shù)據(jù)的最小值、下四分位數(shù)、中位數(shù)、上四分位數(shù)、最大值 箱線圖奇異值最大值最小值中位數(shù)大于1.5倍四分位數(shù)間距四分位數(shù)間距范圍箱線圖中間的黑粗線為中位數(shù)方框?yàn)樗姆治婚g距的范圍離方框上/下界

39、的距離超過(guò)四分位數(shù)間距1.5倍的為離群值,以 “O” 表示;超過(guò)3倍的則為極值,用“*”表示。3.1.2圖示法六.高-低圖 股票、商品、貨幣及其他市場(chǎng)數(shù)據(jù)每周、每日、甚至每時(shí)的波動(dòng)都相當(dāng)大,為了圖示長(zhǎng)期變動(dòng)趨勢(shì),同時(shí)又能知道短期的變化,必須采用相應(yīng)的專用圖形工具來(lái)分析。高-低圖就是為此而設(shè)計(jì)的。3.1.2 圖示法例:長(zhǎng)虹在2004年9月1324日兩周間的股價(jià)資料如下:日期最高價(jià)最低價(jià)收盤(pán)價(jià)135.655.455.54145.735.545.65156.005.625.96166.105.966.04176.185.896.18206.356.136.34216.356.146.16226.27

40、6.006.06236.185.956.16246.306.066.063.1.2 圖示法3.1.2 圖示法七.散點(diǎn)圖例:觀察家庭月收入與月支出之間的關(guān)系,隨機(jī)抽取10個(gè)家庭作調(diào)查得如下數(shù)據(jù):收入(x)支出(y)收入(x)支出(y)6005401500890450450100080070060090075085075075066012508503604203.1.2 圖示法3.1.2 圖示法八.序列圖時(shí)間序列圖的繪制是以橫軸代表時(shí)間,以縱軸代表所研究的數(shù)據(jù)記錄。例6 一個(gè)發(fā)展中國(guó)家的經(jīng)濟(jì)活力有如下的15年記錄:年活力年活力153853254951355105045511485541243653

41、1340753143815353.1.2 圖示法3.2 統(tǒng)計(jì)數(shù)據(jù)的分布特征3.2.1 刻畫(huà)數(shù)據(jù)集中程度的特征量3.2.2 刻畫(huà)數(shù)據(jù)離散程度的特征量3.2.3 分布的偏度和峰度指標(biāo)(分布形狀)數(shù)據(jù)的特征和度量對(duì)于描述統(tǒng)計(jì)中的測(cè)度,主要可以分為三個(gè)方面來(lái)描述:一是數(shù)據(jù)的集中趨勢(shì),反映各數(shù)據(jù)向其中心值靠攏或聚焦的程度;二是分布的離散程度,反映各數(shù)據(jù)遠(yuǎn)離其中心值的趨勢(shì);三是數(shù)據(jù)分布的形狀,即數(shù)據(jù)分布的偏態(tài)和峰度。數(shù)據(jù)的特征和度量數(shù)據(jù)的特征和度量集中趨勢(shì)算術(shù)平均數(shù)調(diào)和平均數(shù)幾何平均數(shù)中位數(shù)眾數(shù)百分位數(shù)四分位數(shù)離散趨勢(shì)極差四分位距平均差方差與標(biāo)準(zhǔn)差標(biāo)準(zhǔn)分?jǐn)?shù)離散系數(shù)分布形狀偏態(tài)測(cè)度峰態(tài)測(cè)度3.2.1 刻畫(huà)數(shù)

42、據(jù)集中程度的特征量集中趨勢(shì)(General tendency)是指分布的定位,它是表明一組統(tǒng)計(jì)數(shù)據(jù)所具有的一般水平。對(duì)集中趨勢(shì)進(jìn)行測(cè)度也就是尋找數(shù)據(jù)一般水平的代表值或中心值。平均指標(biāo)反映同類現(xiàn)象的一般水平,是總體內(nèi)各單位參差不齊的標(biāo)志值的代表值,也是對(duì)變量分布集中趨勢(shì)的測(cè)定。數(shù)據(jù)集中區(qū)變量x對(duì)集中趨勢(shì)的度量有數(shù)值平均數(shù)和位置平均數(shù)之分。 數(shù)值平均數(shù)就是對(duì)所有各項(xiàng)數(shù)據(jù)計(jì)算的平均數(shù)。因此它能夠概括反映所有各項(xiàng)數(shù)據(jù)的平均水平。常用的數(shù)值平均數(shù)有算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)。位置平均數(shù)是根據(jù)數(shù)據(jù)集中處于特殊位置的個(gè)別單位或部分單位的數(shù)據(jù)來(lái)確定的代表值,因此數(shù)據(jù)集中某些數(shù)據(jù)的變動(dòng),不一定會(huì)影響到位

43、置平均數(shù)的水平,盡管如此,位置平均數(shù)對(duì)于整個(gè)數(shù)據(jù)集仍具有非常直觀的代表性。常用的位置平均數(shù)有眾數(shù)、中位數(shù)和其他分位數(shù)等。一、數(shù)值平均數(shù) 數(shù)值平均數(shù)又稱均值(Mean),是根據(jù)統(tǒng)計(jì)資料的數(shù)值計(jì)算而得到,在統(tǒng)計(jì)學(xué)中具有重要的作用和地位,是度量集中趨勢(shì)的最主要的指標(biāo)之一。平均的對(duì)象可理解為變量 ,平均數(shù)可記為 。 (一)算術(shù)平均數(shù) 1簡(jiǎn)單算術(shù)平均數(shù)簡(jiǎn)單算術(shù)平均數(shù)是根據(jù)原始數(shù)據(jù)直接計(jì)算均值。一般地,設(shè)一組數(shù)據(jù)為,其簡(jiǎn)單算術(shù)平均數(shù)計(jì)算的一般公式可表達(dá)為 : (一)算術(shù)平均數(shù)例如:為了研究目前大學(xué)中班級(jí)學(xué)生人數(shù)的情況,從北京某大學(xué)抽樣五個(gè)班級(jí),其學(xué)生人數(shù)分別為:46,54,42,46,32。我們使用, 分

44、別表示該五個(gè)數(shù)據(jù),計(jì)算其均值,可以寫(xiě)成: (一)算術(shù)平均數(shù)2加權(quán)算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)計(jì)算的所依靠的數(shù)據(jù)是經(jīng)過(guò)一定整理的,即是根據(jù)一定規(guī)則分組的。可分為(1)由數(shù)列計(jì)算加權(quán)算術(shù)平均數(shù)(2)根據(jù)組距計(jì)算加權(quán)算術(shù)平均數(shù) (一)算術(shù)平均數(shù)(1)由數(shù)列計(jì)算加權(quán)算術(shù)平均數(shù)由單項(xiàng)變量數(shù)列計(jì)算加權(quán)算術(shù)平均數(shù)的基礎(chǔ)是要先將數(shù)據(jù)進(jìn)行分組,即將n個(gè)數(shù)據(jù)按變量值(xi)進(jìn)行分組,并統(tǒng)計(jì)在各個(gè)變量取值出現(xiàn)的次數(shù),或稱為頻數(shù)( fi )。其加權(quán)算術(shù)平均數(shù)的計(jì)算公式如下: (一)算術(shù)平均數(shù)設(shè)某班級(jí)10名同學(xué)的年齡分別為:18,19,17,18,17,18,19,18,18,19。則根據(jù)簡(jiǎn)單平均數(shù)的公式,我們可計(jì)算得到該

45、班10名同學(xué)的平均年齡: (一)算術(shù)平均數(shù)年齡(歲)人數(shù) 人數(shù)比重 1722/10 (0.2)1866/10 (0.6)1922/10 (0.2)合計(jì)1013個(gè)銷售科的人員預(yù)測(cè)明年對(duì)本廠產(chǎn)品需求量,三人經(jīng)驗(yàn)不一樣,因此預(yù)測(cè)量不一樣,經(jīng)驗(yàn)豐富的在預(yù)測(cè)量中占的份額大一點(diǎn),設(shè)三人權(quán)的比例為4 : 2 : 1,預(yù)測(cè)量分別為900,1000,1200,求平均預(yù)測(cè)量。(一)算術(shù)平均數(shù)(2)根據(jù)組距計(jì)算加權(quán)算術(shù)平均數(shù) 選擇適當(dāng)?shù)慕M距來(lái)對(duì)數(shù)據(jù)進(jìn)行分組,再求加權(quán)平均數(shù)往往就簡(jiǎn)單、容易許多。根據(jù)組距計(jì)算加權(quán)平均數(shù)的方法與上面所述的數(shù)列加權(quán)平均數(shù)方法基本相同,只需以各組的組中值來(lái)代替相應(yīng)的x值即可 (二)調(diào)和平均數(shù)

46、 調(diào)和平均數(shù)(Harmonic mean)是均值的另一種重要表示形式,由于它是根據(jù)變量值倒數(shù)計(jì)算的,也叫倒數(shù)平均數(shù),一般用字母表示 Hm。根據(jù)所給資料情況的不同,調(diào)和平均數(shù)可分為:簡(jiǎn)單調(diào)和平均數(shù)和加權(quán)調(diào)和平均數(shù)兩種。(二)調(diào)和平均數(shù)1簡(jiǎn)單調(diào)和平均數(shù) (二)調(diào)和平均數(shù)2加權(quán)調(diào)和平均數(shù)用公式表示為: 由此可以看出,當(dāng)權(quán)重mi相等時(shí),則加權(quán)調(diào)和平均數(shù)則轉(zhuǎn)換為簡(jiǎn)單調(diào)和平均數(shù)。 (三)幾何平均數(shù)例 我國(guó)19982002年我國(guó)鋼鐵產(chǎn)量的發(fā)展速度(以上年為基期)分別為:106.1%、107.5%、103.4%、108%和120.3%,求平均發(fā)展速度。幾何平均數(shù)(Geometric mean)是個(gè)變量值連乘積

47、的次方根,常用字母G表示。它是平均指標(biāo)的另一種計(jì)算形式。幾何平均數(shù)是計(jì)算平均比率和平均速度最適用的一種方法。根據(jù)掌握的數(shù)據(jù)資料不同,幾何平均數(shù)可分為簡(jiǎn)單幾何平均數(shù)和加權(quán)幾何平均數(shù)兩種。(三)幾何平均數(shù)1簡(jiǎn)單幾何平均數(shù)假定有n個(gè)變量值x1,x2,xn,則簡(jiǎn)單幾何平均數(shù)的基本計(jì)算公式為: 例 我國(guó)19982002年我國(guó)鋼鐵產(chǎn)量的發(fā)展速度(以上年為基期)分別為:106.1%、107.5%、103.4%、108%和120.3%,求平均發(fā)展速度。(三)幾何平均數(shù)2加權(quán)幾何平均數(shù)當(dāng)掌握的數(shù)據(jù)資料為分組資料,且各個(gè)變量值出現(xiàn)的次數(shù)不相同時(shí),應(yīng)用加權(quán)方法計(jì)算幾何平均數(shù)。加權(quán)幾何平均數(shù)的公式為: 二、位置平均數(shù)

48、 數(shù)值平均數(shù)是根據(jù)所提供資料的具體數(shù)值計(jì)算而得到,和我們通常觀念中的平均含義比較接近,但結(jié)果受極端值的影響而不能真是地反應(yīng)改組資料的整體集中趨勢(shì),在這種情況下,一般可以考慮用位置中位數(shù)取代算術(shù)中位數(shù)來(lái)對(duì)數(shù)據(jù)的集中趨勢(shì)進(jìn)行描述。常用的位置平均數(shù)有:中位數(shù)、眾數(shù)、分位數(shù)。 (一)中位數(shù) 中位數(shù)(Median)是度量數(shù)據(jù)集中趨勢(shì)的另一重要測(cè)度,它是一組數(shù)據(jù)按數(shù)值的大小從小到大排序后,處于中點(diǎn)位置上的變量值。通常用表示Me。定義表明,中位數(shù)就是將某變量的全部數(shù)據(jù)均等地分為兩半的那個(gè)變量值。其中,一半數(shù)值小于中位數(shù),另一半數(shù)值大于中位數(shù)。中位數(shù)是一個(gè)位置代表值,因此它不受極端變量值影響。 (一)中位數(shù)1

49、根據(jù)未分組數(shù)據(jù)確定中位數(shù)對(duì)于未分組的數(shù)據(jù),確定其中位數(shù)的具體步驟為:(1)將變量按變量值大小從小到大進(jìn)行排列。(2)確定中位數(shù)的位置,即中點(diǎn)位置。一般的,設(shè)一組數(shù)據(jù)的個(gè)數(shù)為n ,則中點(diǎn)的位置為(n1)/2 。(3)確定中位數(shù)。(一)中位數(shù)如果觀測(cè)值的數(shù)目n為奇數(shù),則(n1)/2為整數(shù),該位置上所對(duì)應(yīng)的變量即為所求的中位數(shù)如果觀測(cè)值的數(shù)目n為偶數(shù),則 (n1)/2為非整數(shù),則取位于中間位置的兩個(gè)變量值的算術(shù)平均數(shù)作為中位數(shù)。 (一)中位數(shù)2根據(jù)單項(xiàng)數(shù)列確定中位數(shù)根據(jù)單項(xiàng)數(shù)列資料確定中位數(shù)與根據(jù)未分組資料確定中位數(shù)方法基本一致。具體步驟為:(1)計(jì)算各組的累計(jì)次數(shù)(或頻數(shù))(2)確定中位數(shù)的位置(

50、3)確定中位數(shù)。中位數(shù)所在組的變量值即為中位數(shù)。(一)中位數(shù)3根據(jù)組距數(shù)列確定中位數(shù)如果我們掌握的資料是分組后得到的組距數(shù)列,則確定中位數(shù)的步驟為:(1)確定中位數(shù)的位置 。(2)計(jì)算累計(jì)次數(shù),據(jù)以找出中位數(shù)所在的組。(3)利用以下公式,確定中位數(shù)的近似值 (一)中位數(shù) 求比例:250-240/(345-240)=0.095 分割中位數(shù)組的組距(1400-1100)0.095=28.5下限公式 加下限,即 Me=1100+28.5=1128.5(元)例:某市500戶居民人均月收入數(shù)據(jù)如下,計(jì)算其中位數(shù)。分組 500 800 1100 1400 1700 2000 頻數(shù) 40 90 110 10

51、5 70 50 35累計(jì)頻數(shù) 40 130 240 345 415 465 500中位數(shù)位置:500/2=250中位數(shù)的特點(diǎn):(1)不受極端值的影響。(2)具有計(jì)算簡(jiǎn)便,意義明顯的優(yōu)點(diǎn)。其適用的數(shù)據(jù)類型比數(shù)值平均數(shù)的范圍寬。(3)沒(méi)有利用數(shù)據(jù)中的所有信息。(二)眾數(shù)眾數(shù)(Mode)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個(gè)變量值,通常用MO表示。如果在一個(gè)總體當(dāng)中,各變量值皆不相同,或各個(gè)變量值出現(xiàn)的次數(shù)皆相同,則沒(méi)有眾數(shù)。如果在一個(gè)總體中,有兩個(gè)標(biāo)志值出現(xiàn)的次數(shù)都最多,稱為雙眾數(shù)。只有在總體單位比較多、變量值又有明顯集中趨勢(shì)的條件下確定的眾數(shù),才能代表總體的一般水平;在總體單位較少,或雖多但無(wú)明顯集中趨

52、勢(shì)的條件下,眾數(shù)的確定是沒(méi)有意義的。眾數(shù)的確定方法要根據(jù)給定資料的具體情況而定。(二)眾數(shù)1未分組資料或單項(xiàng)數(shù)列資料眾數(shù)觀察給定的數(shù)據(jù),某個(gè)變量出現(xiàn)次數(shù)最多,則該變量即為所求眾數(shù)。這樣的方法確定比較容易,不需要計(jì)算。85 95 75 85 65 85 75 (二)眾數(shù)2根據(jù)組距變量數(shù)量確定眾數(shù)對(duì)于列表分組的數(shù)據(jù),首先要確定眾數(shù)所在的組,然后通過(guò)公式計(jì)算眾數(shù)的近似值。 計(jì)算公式為:(下限公式) mo=I+i(fm-fm-1)/(fm-fm+1+fm-fm-1) 其中:I表示眾數(shù)所在區(qū)間的下限值 i表示眾數(shù)所在區(qū)間的組距 fm表示眾數(shù)所在區(qū)間的組頻數(shù) fm+1表示眾數(shù)所在區(qū)間的后一個(gè)區(qū)間的組頻數(shù)

53、fm-1表示眾數(shù)所在區(qū)間的前一個(gè)區(qū)間的組頻數(shù)分組 500 800 1100 1400 1700 1的任意數(shù).經(jīng)驗(yàn)表明,不管分布狀態(tài)如何,按照著名的“切貝舍夫定理”,至少有 75% 的數(shù)據(jù)位于 ,89的數(shù)據(jù)位于 ;當(dāng)一組數(shù)據(jù)對(duì)稱分布時(shí),大約有68的數(shù)據(jù)在范圍內(nèi) ;大約有95的數(shù)據(jù)在的范圍內(nèi) ;而在的范圍內(nèi)大約有98的數(shù)據(jù) 。 100個(gè)同學(xué)的英語(yǔ)平均成績(jī)是70分,標(biāo)準(zhǔn)差是5分,則有多少同學(xué)的成績(jī)?cè)?0-80分之間58-82分之間K分別是2和2.4,則:至少有75個(gè)同學(xué)的分?jǐn)?shù)在60-80分之間至少有82個(gè)同學(xué)的分?jǐn)?shù)58-82分之間(二)離散系數(shù) 離散系數(shù)(Coefficient of variati

54、on)通常是就標(biāo)準(zhǔn)差來(lái)計(jì)算的,因此,也稱為標(biāo)準(zhǔn)差系數(shù).反映數(shù)列離散趨勢(shì)的相對(duì)程度,是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其對(duì)應(yīng)的平均數(shù)之比,是測(cè)度數(shù)據(jù)離散程度的相對(duì)指標(biāo),其計(jì)算公式如下: 離散系數(shù)的作用主要用于比較不同總體或樣本數(shù)據(jù)的離散程度。離散系數(shù)大的說(shuō)明數(shù)據(jù)的離散程度也就大,離散系數(shù)小的說(shuō)明數(shù)據(jù)的離散程度也就小。 3.2.3 分布的偏度和峰度指標(biāo)數(shù)據(jù)的特征和度量集中趨勢(shì)算術(shù)平均數(shù)調(diào)和平均數(shù)幾何平均數(shù)中位數(shù)眾數(shù)百分位數(shù)四分位數(shù)離中趨勢(shì)極差四分位距平均差方差與標(biāo)準(zhǔn)差標(biāo)準(zhǔn)分?jǐn)?shù)離散系數(shù)分布形狀偏態(tài)測(cè)度峰態(tài)測(cè)度一、分布偏態(tài)測(cè)度 偏態(tài)(Skewness)是對(duì)分布偏斜方向和程度的測(cè)度,是次數(shù)分配的非對(duì)稱程度。它與平均數(shù)

55、和標(biāo)準(zhǔn)差一樣,是反映次數(shù)分布特征的又一重要指標(biāo)。 一、分布偏態(tài)測(cè)度 偏態(tài)通常分為兩種:右偏(或正偏)左偏(或負(fù)偏)。它們是與對(duì)稱的正態(tài)分布相比較而言的。 一、分布偏態(tài)測(cè)度統(tǒng)計(jì)分析中測(cè)定偏態(tài)系數(shù)的方法很多,一般采用如下公式: 一、分布偏態(tài)測(cè)度從上式可以看到,它是離差三次方的平均數(shù)再除以標(biāo)準(zhǔn)差的三次方。當(dāng)分布對(duì)稱時(shí),離差三次方后正負(fù)離差可以相互抵消,因而分子等于0,則=0;當(dāng)分布不對(duì)稱時(shí),正負(fù)離差不能抵消,就形成了正與負(fù)的偏態(tài)系數(shù)。當(dāng)為正值時(shí),表示正偏離差值較大,可以判斷為正偏或右偏;反之,為負(fù)值時(shí),表示負(fù)偏離差值較大,可以判斷為負(fù)偏或左偏。偏態(tài)系數(shù)的數(shù)值一般在0與3之間,越接近0,分布的偏斜度越

56、?。辉浇咏?,分布的偏斜度越大。二、分布峰態(tài)測(cè)度 峰度(Kurtosis)是分布集中趨勢(shì)高峰的形狀,指次數(shù)分配曲線頂端的尖峭程度。在變量數(shù)列的分布特征中,常常將數(shù)分配曲線與正態(tài)曲線相比較,判斷是尖頂還是平頂及其尖頂或平頂?shù)某潭?。峰度通常分為三種:正態(tài)峰度、尖頂峰度與平頂峰度。二、分布峰態(tài)測(cè)度 測(cè)度峰度運(yùn)用四階中心動(dòng)差與標(biāo)準(zhǔn)差的四次方對(duì)比,以此來(lái)判斷各分布曲線峰度的尖平程度。公式如下: 二、分布峰態(tài)測(cè)度 峰度系數(shù)是統(tǒng)計(jì)中描述次數(shù)分布狀態(tài)的又一個(gè)重要特征值,用以測(cè)定鄰近數(shù)值周圍變量值分布的集中或分散程度。正態(tài)分布的峰度系數(shù)為3,當(dāng)3時(shí)為尖峰分布,當(dāng)3時(shí)為平頂分布。 二、分布峰態(tài)測(cè)度 正態(tài)2.4 S

57、PSS基礎(chǔ)2.4.1 SPSS軟件的基本操作環(huán)境2.4.2 SPSS數(shù)據(jù)文件2.4.3 SPSS數(shù)據(jù)的統(tǒng)計(jì)整理2.4.1 SPSS軟件的基本操作環(huán)境(1) SPSS軟件的啟動(dòng)開(kāi)始程序SPSS Inc SPSS 16.0 Data Editor window 啟動(dòng)操作對(duì)話框Run the tutorial 運(yùn)行SPSS教程 Type in data 在數(shù)據(jù)編輯窗口直接輸入數(shù)據(jù) Run an existing query 使用已經(jīng)定義的SQL數(shù)據(jù)源 Create new query using Database Capture Windows 使用數(shù)據(jù)庫(kù)向?qū)?chuàng)立一個(gè)新的SQL數(shù)據(jù) Open an

58、existing data sourse 使用已有的內(nèi)部數(shù)據(jù) Open another type of file 使用已有的外部數(shù)據(jù) Dont show this dialog in the future 以后啟動(dòng)SPSS不再顯示該對(duì)話框 進(jìn)入數(shù)據(jù)編輯窗口直接輸入數(shù)據(jù) SPSS啟動(dòng)界面(2) SPSS軟件的基本窗口數(shù)據(jù)編輯窗口/SPSS Data EditorSPSS以電子表格形式創(chuàng)建、編輯、瀏覽數(shù)據(jù)文件(*.sav)的主程序窗口結(jié)果輸出窗口/SPSS Viewer在對(duì)數(shù)據(jù)編輯窗口中的數(shù)據(jù)執(zhí)行完相應(yīng)的操作時(shí),系統(tǒng)會(huì)自動(dòng)打開(kāi)結(jié)果輸出窗口,用來(lái)顯示和管理SPSS統(tǒng)計(jì)分析結(jié)果、圖表及各種警告和錯(cuò)誤信

59、息編程窗口/SPSS Syntax Editor用戶可以在此窗口中編寫(xiě)、調(diào)試和運(yùn)行SPSS程序 數(shù)據(jù)編輯窗口標(biāo)題欄菜單欄工具欄Variables變量名欄數(shù)據(jù)輸入欄當(dāng)前數(shù)據(jù)欄CasesElements系統(tǒng)狀態(tài)顯示區(qū)窗口切換標(biāo)簽數(shù)據(jù)編輯區(qū)數(shù)據(jù)視圖變量視圖視窗控制按鈕 目錄區(qū)內(nèi)容區(qū)標(biāo)題欄菜單欄工具欄系統(tǒng)狀態(tài)顯示區(qū)分析結(jié)果顯示區(qū)結(jié)果輸出窗口視窗控制按鈕 標(biāo)題欄菜單欄工具欄系統(tǒng)狀態(tài)顯示區(qū)編程窗口編程區(qū)視窗控制按鈕 (3) SPSS軟件的退出在菜單欄中依次點(diǎn)選 FileExit回答系統(tǒng)提出的有關(guān)是否需要存儲(chǔ)原始數(shù)據(jù)、計(jì)算結(jié)果和SPSS命令之后,即退到Windows的程序管理器中單擊視窗控制按鈕 雙擊標(biāo)題欄

60、圖標(biāo)右鍵單擊標(biāo)題欄圖標(biāo)下拉菜單關(guān)閉AltF42.4.2 SPSS數(shù)據(jù)文件在數(shù)據(jù)編輯窗口下編輯的文件可供SPSS進(jìn)行統(tǒng)計(jì)分析,形成SPSS數(shù)據(jù)文件SPSS數(shù)據(jù)文件存盤(pán)的擴(kuò)展名為*.savFile Save直接存盤(pán)形成*.sav文件File Save as可指定路徑、文件名、格式(包括數(shù)據(jù)庫(kù)文件、ASCII文件、Excel文件)File New打開(kāi)數(shù)據(jù)編輯器建立一個(gè)新的數(shù)據(jù)文件File Open打開(kāi)一個(gè)已經(jīng)存在的數(shù)據(jù)文件File Print打印數(shù)據(jù)文件(1)SPSS數(shù)據(jù)文件的建立第一步:?jiǎn)?dòng)SPSS軟件,在啟動(dòng)對(duì)話框中選擇“Type in data” ,打開(kāi)數(shù)據(jù)編輯窗口若數(shù)據(jù)編輯窗口中已有數(shù)據(jù)而又

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論