資料整理與分析_第1頁
資料整理與分析_第2頁
資料整理與分析_第3頁
資料整理與分析_第4頁
資料整理與分析_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第九章

資料的整理與分析

中國礦業(yè)大學管理學院學習目標理解數(shù)據(jù)控制和檢測的重要性掌握數(shù)據(jù)錄入的過程及其方法學習將調查數(shù)據(jù)表格化的方法學會建立和解釋交叉列表(橫列表)掌握統(tǒng)計分析的基本技巧一、資料整理確認和編輯編碼數(shù)據(jù)錄入數(shù)據(jù)清理1.確認確認的目的是盡可能確保每份問卷都是有效問卷。有效是指訪談是否按適當?shù)姆绞竭M行,訪問員有沒有作假。確認被調查者是否真正接受了調查?被調查者是否符合抽樣條件?確認調查是否按要求的方式進行?確認調查是完整?其他方面的問題。2、編輯:現(xiàn)場編輯現(xiàn)場編輯(fieldediting)就是初步編輯,其主要任務是發(fā)現(xiàn)資料出非常明顯的遺漏和錯誤,幫助控制和管理實地調查隊伍,應在問卷實施后盡快執(zhí)行,以便問卷能在調查員解散之前得到校正。1問卷填寫是否完整,有無漏答的問題2檢查每份問卷是否按規(guī)定填寫,字跡是否

清楚。3相關問題是否產(chǎn)生矛盾,不一致的現(xiàn)象,

“其他”選項說明是否填寫清楚4開放式問題是否都有詳細的文字記錄5若發(fā)現(xiàn)問卷漏答、矛盾、不合邏輯的問題

超過5題,該份問卷應該作廢。2、編輯:辦公室編輯辦公室編輯(in-houseediting)現(xiàn)場編輯的工作最后歸結到復查和訪問上,辦公室的編輯工作最后歸結到對查出的問題如何處理上。主要問題:不完整答卷:①大面積無回答;②個別問題無回答;③相當多的問卷對同一個問題無回答。明顯的錯誤答案:指那些前后不一致的答案,或答非所問的答案。3.編碼編碼是對一個問題的不同回答進行分組和確定數(shù)字代碼的過程。大多數(shù)問卷中的大多數(shù)問題是封閉式問題,并且已經(jīng)預先編碼。

開放式和半開放式問題的編碼列出答案合并答案設置編碼輸入如編碼

你為什么最喜歡喝彭城啤酒?

1口感好2比較清淡3我喜歡這種口味4大家都喝這種品牌5市場上這種啤酒最暢銷6不知道7朋友們都喝這種啤酒8價格便宜9因為它是新品牌10它是徐州人自己的啤酒11它的口味不如別的啤酒重12平時在商店購買方便13沒什么特殊的理由14我無所謂15大多數(shù)人都喝它16說不出來17我喜歡彭城啤酒這個品牌答案歸類要點回答項分好的數(shù)字編碼喜歡這種口味1,2,3,11

1價格因素8

2從眾因素4,5,7,15

3購買方便12

4不知道6,13,14,16

5區(qū)域因素10

6品牌喜好9,17

74.數(shù)據(jù)錄入與清理數(shù)據(jù)錄入:p239對錄入數(shù)據(jù)的審核二、應用于市場調研的統(tǒng)計分析類型描述分析Descriptiveanalysis推理分析Inferentialanalysis差別分析

Differencesanalysis聯(lián)合分析Associativeanalysis預測分析Predictiveanalysis描述分析DescriptiveanalysisCertainmeasuressuchasthemean,mode,standarddeviationorrangeareformofdescriptiveanalysis作用數(shù)據(jù)抽象與減縮方法次數(shù)分布,算術平均數(shù),中位數(shù),眾數(shù),標準差與全距(極差)推理分析Inferentialanalysis作用確定總體參數(shù),進行假設檢驗例估計總體數(shù)值方法參數(shù)估計,假設檢驗,顯著差異檢驗差別分析

Differencesanalysis作用確定兩組間所存在的差異是否顯著例一個樣本中的兩個均值之間的差異是否顯著方法差異檢驗,方差分析聯(lián)合分析Associativeanalysis作用確定現(xiàn)象間的關系例確定兩個變量間是否存在相互關系,如顧客滿意度與企業(yè)形象方法相關分析方法,交叉表

預測分析Predictiveanalysis作用基于統(tǒng)計模型的預測例根據(jù)一個變量的數(shù)值來預測另一個變量的數(shù)值方法時間數(shù)列分析,回歸分析1.頻數(shù)分布有時營銷調研人員需要了解有關單個變量的信息本品牌的使用者中有多少稱得上是品牌忠誠者?有多少個顧客對新產(chǎn)品很熟悉?多少比較熟悉?有多少顧客對飯菜的口味滿意?多少不滿意?頻數(shù)分布:了解對一個變量選擇不同取值的調查對象數(shù)量。對一個變量的頻數(shù)分布會產(chǎn)生頻數(shù)、百分比、累積百分比幾個數(shù)據(jù)。頻數(shù)分布作用:有助于明確未回答者的多少,同時也能顯示不合格答案的多少;可以檢驗奇異值和極端值;根據(jù)頻數(shù)分布可以劃出各種統(tǒng)計圖形。頻數(shù)分布頻數(shù)分布所想購買的戶型頻數(shù)百分比有效百分比累積百分比一室一廳一衛(wèi)32.132.192.19兩室一廳一衛(wèi)3927.6628.4730.66兩室兩廳一衛(wèi)128.518.7639.42兩室兩廳兩衛(wèi)96.386.5745.99三室一廳一衛(wèi)3222.7023.3669.34三室一廳兩衛(wèi)1510.6410.9580.29三室兩廳一衛(wèi)42.842.9283.21三室兩廳兩衛(wèi)107.097.3090.51四室兩廳兩衛(wèi)10.710.7391.24措層21.421.4692.70越層21.421.4694.16其他85.675.84100.00Total13797.16100.00Missing42.84Total141100.00

頻數(shù)分布2.描述性統(tǒng)計分析

集中趨勢統(tǒng)計指標均值/平均數(shù)(mean)眾數(shù)(mode)中位數(shù)(median)離散程度指標全距/極差(range)方差(variance)和標準差(standarddeviation)平均數(shù)反映總體分布的集中趨勢;反映總體現(xiàn)象的共性特征;是總體分布的重要數(shù)量特征值;平均數(shù)的局限性一個身高180的不會游泳的人想涉水過河,已知河的平均深度為1米,此人是否過河?為什么?某人想購買一臺冰箱,現(xiàn)有如下信息:

冰箱品牌AB平均使用年限1010最多使用年限2012最少使用年限28陳述總平均平均值差別有無錄象機是必需品4.65.64.11.6目前錄象機價格太貴5.34.16.1-1.9國產(chǎn)錄象機質量尚可3.94.23.70.5樣本大小500185315例:人們對與錄象機有關的問題的看法眾數(shù)M眾數(shù)是出現(xiàn)最頻繁的數(shù)值,是分布中的高峰。無眾數(shù)

數(shù)據(jù): 10.3 4.9 8.9 11.7 6.3 7.7一個眾數(shù)

數(shù)據(jù): 6.3 4.9 8.9 6.3 4.9

4.9一個以上的眾數(shù)

數(shù)據(jù): 21 28

28 41 43

43中位數(shù)中位數(shù)是指把所有數(shù)據(jù)按照升序或降序排列后居中的數(shù)值。如果數(shù)據(jù)為奇數(shù)項,中位數(shù)是中間位置的數(shù)值如果數(shù)據(jù)為偶數(shù)項,中位數(shù)是中間位置兩個數(shù)值的平均數(shù)中位數(shù)數(shù)據(jù):10.3 4.9 8.9 11.7 6.3 7.7順序:4.9 6.3 7.7

8.9 10.3 11.7位置:1 2 3

4 5 6當總體單位數(shù)n為奇數(shù)時當總體單位數(shù)n為偶數(shù)時小故事:騙人的“平均數(shù)”M:吉斯莫先生有一個小工廠,生產(chǎn)超級小玩意兒。M:管理人員由吉斯莫先生、他的弟弟、六個親戚組成。工作人員由5個領工和10個工人組成。工廠經(jīng)營得很順利,現(xiàn)在需要一個新工人。M:現(xiàn)在吉斯莫先生正在接見薩姆,談工作問題。吉斯莫:我們這里報酬不錯。平均薪金是每周300元。你在學徒期間每周得75元,不過很快就可以加工資。騙人的“平均數(shù)”M:薩姆工作了幾天之后,要求見廠長。薩姆;你欺騙我!我已經(jīng)找其他工人核對過了,沒有一個人的工資超過每周100元。平均工資怎么可能是一周300元呢?吉斯莫:啊,薩姆,不要激動。平均工資是300元。我要向你證明這一點。吉斯莫:這是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六個親戚每人得250元,五個領工每人得200元,10個工人每人100元??偣彩敲恐?900元,付給23個人,對吧?騙人的“平均數(shù)”薩姆:對,對,對!你是對的,平均工資是每周300元??赡氵€是蒙騙了我。吉斯莫;我不同意!你實在是不明白。我已經(jīng)把工資列了個表,并告訴了你,工資的中位數(shù)是200元,可這不是平均工資,而是中等工資。薩姆:每周100元又是怎么回事呢?吉斯莫:那稱為眾數(shù),是大多數(shù)人掙的工資。吉斯莫:老弟,你的問題是出在你不懂平均數(shù)、中位數(shù)和眾數(shù)之間的區(qū)別。薩姆:好,現(xiàn)在我可懂了。我……我辭職!離散程度指標:①全距測量的是數(shù)據(jù)的分散程度,就是樣本中最大值與最小值之差。全距直接到奇異值的影響反映標志值的變動范圍全距計算簡便,易于理解,應用普遍。全距的計算:全距=最大標志值-最小標志值離散程度指標:②標準差標準差是各單位標志值與其平均數(shù)的離差平方的算術平均數(shù)的平方根,它表示每個標志值與平均數(shù)的平均距離。例子教育程度均值中位數(shù)眾數(shù)方差全距初中1.151.001.000.492.00高中/技校1.231.001.000.582.00中專1.481.001.001.044.00大專1.791.001.001.525.00大學本科或以上2.051.001.001.905.00Total1.471.001.001.165.00各種統(tǒng)計數(shù)量適用的情況尺度類別尺度順序尺度等距尺度與比率尺度集中趨勢眾數(shù)中位數(shù)均值離散趨勢頻率或百分比分布累計百分率分布標準差,全距3.橫列表(交叉列表)分析需要研究的問題:品牌忠誠者中有多少是男性?對新產(chǎn)品的熟悉程度與年齡和教育水平有關嗎?產(chǎn)品的擁有狀況與收入的高低有關嗎?產(chǎn)品的使用量與對戶外活動的興趣有關嗎?3.橫列表(交叉列表)分析1)橫列表分析的意義:

橫列表分析就是同時將兩個或兩個以上的變量,按照一定的順序排列在一張表中,從中分析變量間的關系,得出科學的結論橫列表分析及其結果很容易接受和理解;許多市場研究項目的數(shù)據(jù)處理分析可以依賴其得到解決;通過一系列的橫列表分析,可以深入分析和認識復雜的事物或現(xiàn)象;清楚明確的解釋能使調研結果很快成為經(jīng)營管理措施的有力依據(jù);橫列表中變量(因素)的選擇例:某保險公司對影響保險戶開車事故率的因素進行調查,并對各種因素進行橫列表分析。有無事故百分比%有39無61樣本量(人)17800有無事故男女有4434無5666樣本量(人)9320848039%的保險戶在開車時出現(xiàn)過事故。男性在開車時出現(xiàn)事故的百分比高于女性。距離事故男(%)女(%)>1萬KM≤1萬KM>1萬KM≤1萬KM有49275027無51735073樣本量(人)7170215024306050事故率與駕駛距離成正比而與性別無關。選擇和確定橫列表分析中的變量,包括其內容和數(shù)量,應根據(jù)調研項目的特征而異。

橫列表使用成功取決于研究者選擇關鍵變量以及根據(jù)這些因素組成橫列表的能力。在簡單的事實收集研究中,要考慮的因素已在調研要求中明確列出,只不過把資料按需要的形式組合。例:家庭收入水平與攝像機的擁有率。在描述性研究中,研究者有較大的自由度來選擇因素,表中所需因素取決于委托人的要求和研究者直觀的探索。在探索性研究中,可憑直覺選擇所有的用于橫列表的因素。例:影

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論