第五章市場調(diào)查數(shù)據(jù)處理_第1頁
第五章市場調(diào)查數(shù)據(jù)處理_第2頁
第五章市場調(diào)查數(shù)據(jù)處理_第3頁
第五章市場調(diào)查數(shù)據(jù)處理_第4頁
第五章市場調(diào)查數(shù)據(jù)處理_第5頁
已閱讀5頁,還剩105頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第五章

市場調(diào)查數(shù)據(jù)處理第一頁,共110頁。第一頁,共110頁。第五章市場調(diào)查數(shù)據(jù)處理第一節(jié)市場調(diào)查數(shù)據(jù)審核

第二節(jié)市場調(diào)查資料整理

第二頁,共110頁。第二頁,共110頁。教學(xué)目標知識目標:理解市場調(diào)查資料審核、整理的意義、內(nèi)容和方法;掌握市場調(diào)查數(shù)據(jù)的排序、分類匯總、分組分析、集中與離中趨勢分析以及用Excel制作統(tǒng)計圖的方法和技術(shù)。能力目標:能夠根據(jù)基層企事單位管理和決策要求,對市場調(diào)查數(shù)據(jù)進行基本整理和分析。第三頁,共110頁。第三頁,共110頁。

調(diào)查能否出成果和成果質(zhì)量高低,很大程度取決于這個階段的工作。第四頁,共110頁。第四頁,共110頁。

第一節(jié)市場調(diào)查數(shù)據(jù)審核

一、市場調(diào)查資料審核的意義和步驟市場調(diào)查資料審核是對調(diào)查獲取的各種資料(原始資料和次級資料)進行審查和核實。它對于獲取有效信息,提高市場調(diào)查質(zhì)量,具體極其重要的意義。(一)意義

1、有利于克服邏輯、登記和計算等方面的錯誤,保證信息的一致性、客觀性和有效性;

2、有利于提高工作效率,避免重復(fù)勞動;

3、有利于提高信息資料的質(zhì)量。

第五頁,共110頁。第五頁,共110頁。(二)步驟1)對原始資料進行審核、訂正。2)編碼。3)數(shù)據(jù)的錄入。4)數(shù)據(jù)的清潔。5)統(tǒng)計預(yù)處理。6)分組與匯總。第六頁,共110頁。第六頁,共110頁。補充:調(diào)查問卷的回收與審核(一)調(diào)查問卷的回收1)與資料收集工作相配合,掌握每天完成的問卷數(shù)和接收的問卷數(shù)。2)在完成的問卷后面記錄下問卷完成的日期和接收的日期,以便有必要時在分析過程中對先接收的資料和后接收的資料作比較。第七頁,共110頁。第七頁,共110頁。3)多個項目同時實施時,必須清楚地記錄下交付實施的項目數(shù)、仍在實施的項目數(shù)、已經(jīng)完成并返回的項目數(shù)。4)每一份返回的問卷都要記錄一個唯一的、有順序的識別號碼,作為原始的文件。第八頁,共110頁。第八頁,共110頁。5)在進行資料的核對、事后的編碼、資料的錄入等工作時,必須按識別的號碼,準確地記錄清楚是誰拿著哪些原始文件(返回的問卷)。6)要讓所有參與資料整理工作的人員都知道,他們不僅負有保證工作質(zhì)量的責(zé)任,還負有保證不丟失任何原始文件的責(zé)任。第九頁,共110頁。第九頁,共110頁。(二)問卷資料處理的步驟

調(diào)查問卷審核調(diào)查問卷校訂調(diào)查問卷編碼調(diào)查問卷錄入加權(quán)處理缺失值的處理變量交換數(shù)據(jù)凈化統(tǒng)計分析第十頁,共110頁。第十頁,共110頁?!锶蝿?wù)描述某校的一個調(diào)研項目小組,在該校的萬名在校大學(xué)生群體中,隨機發(fā)放《大學(xué)生消費問題調(diào)查問卷》500份,對大學(xué)生的月消費水平、支出類別及金額、生活資金及來源、社會兼職及目的、家庭收入、自我評價等問題,進行問卷訪談。之后,對問卷進行了回收。對這些回收的問卷,這個項目小組應(yīng)該怎樣處理?第十一頁,共110頁。第十一頁,共110頁。任務(wù)要點第二步第三步第一步確認數(shù)據(jù)資料;

對數(shù)據(jù)進行編碼和錄入;

對數(shù)據(jù)進行初步分析。第十二頁,共110頁。第十二頁,共110頁。任務(wù)一確認數(shù)據(jù)資料

1調(diào)查問卷的回收與登記2調(diào)查問卷的審核3處置有問題問卷

第十三頁,共110頁。第十三頁,共110頁。一般事先需要專門設(shè)計登記表格,具體內(nèi)容有:一二三四調(diào)查地區(qū)及編號,調(diào)查員姓名及編號;調(diào)查實施的時間,問卷交付的日期;問卷編號;實發(fā)問卷數(shù)、上交問卷數(shù)、未答或拒答問卷數(shù)、丟失問卷數(shù)等。第十四頁,共110頁。第十四頁,共110頁。一致性審核及時性審核準確性審核完整性審核

二、調(diào)查問卷的審核二、調(diào)查數(shù)據(jù)審核的內(nèi)容

第十五頁,共110頁。第十五頁,共110頁。

三、市場調(diào)查資料審核的方法調(diào)查資料審查方法主要有經(jīng)驗判斷、邏輯檢查和計算核對等方法。

(一)經(jīng)驗判斷

(二)邏輯檢查

(三)計算核對

第十六頁,共110頁。第十六頁,共110頁。

(1)經(jīng)驗判斷即根據(jù)已有經(jīng)驗,判斷數(shù)據(jù)的真實、準確。例如,如果被調(diào)查者的年齡填為141歲,根據(jù)經(jīng)驗判斷,年齡填寫肯定有誤。又如,某小雜貨店營業(yè)面積500平方米,根據(jù)經(jīng)驗,一個小雜貨店這樣的營業(yè)面積肯定與事實不符。2.審核的主要方法第十七頁,共110頁。第十七頁,共110頁。

(2)邏輯檢查即根據(jù)調(diào)查項目之間的內(nèi)在聯(lián)系和實際情況,對數(shù)據(jù)進行邏輯判斷,看是否有不合情理或前后矛盾的情況。例如,某被調(diào)查者的年齡填寫13歲,而婚姻狀況卻填“已婚”,其中必有一項是錯誤的。又如某消費者前面說“不知道”某調(diào)味品,后面卻說“每天都在使用”,顯然前后矛盾。第十八頁,共110頁。第十八頁,共110頁。

(3)計算審核它是對數(shù)據(jù)資料的計算技術(shù)和有關(guān)指標之間的相互關(guān)系進行審查,主要審查各數(shù)字在計算方法和計算結(jié)果上有無錯誤。第十九頁,共110頁。第十九頁,共110頁。l)實地審核又稱初步審核、現(xiàn)場審核,一般包括調(diào)查員審核和督導(dǎo)審核。2)中心辦公室審核這一階段的審核工作應(yīng)在資料搜集工作全部結(jié)束后立即開始。3.審核的階段第二十頁,共110頁。第二十頁,共110頁。1)收核查問卷(又稱一審)(1)查實此人是否真正接受了調(diào)查。(2)查實受訪者是否符合過濾條件。(3)查實調(diào)查是否按規(guī)定的方式進行的。(4)查實問卷回答內(nèi)容是否完整。(5)核查其他方面的問題。4.審核的基本步驟第二十一頁,共110頁。第二十一頁,共110頁。

2)編輯檢查(又稱二審)(1)訪員是否沒問某些問題,或者沒有記錄某些問題的答案。(2)訪員是否遵循了規(guī)定的跳問路線。(3)開放式問題的答案是否真實合理。第二十二頁,共110頁。第二十二頁,共110頁。市場調(diào)查資料審核時應(yīng)注意的問題

(一)審核要邊調(diào)查邊進行為了防止因調(diào)查結(jié)束后審核而造成發(fā)現(xiàn)問題全部返工的局面,應(yīng)將資料審核工作貫穿整個調(diào)查過程,做到邊調(diào)查邊審核。

(二)審核要以準確性為重點準確性是信息資料的生命線,是調(diào)查質(zhì)量的體現(xiàn),也是資料審核的重點。

(三)審核要貫穿調(diào)查工作始終資料審核必須伴隨著調(diào)查的每個步驟。其中,主要是調(diào)查項目的登記、各調(diào)查單位資料的匯總上報和調(diào)查資料的全面匯總。調(diào)查登記人員負責(zé)調(diào)查項目信息的審核,各調(diào)查單位調(diào)查負責(zé)人負責(zé)本單位資料的全面審核,調(diào)查工作中心辦公室負責(zé)全面調(diào)查資料的審核。

第二十三頁,共110頁。第二十三頁,共110頁。四、處置有問題問卷

返回現(xiàn)場重新調(diào)查視為缺失數(shù)據(jù)放棄不用第二十四頁,共110頁。第二十四頁,共110頁。缺失數(shù)據(jù)的處理

對于缺省數(shù)據(jù),常用的處理方法是填充法。具體有以下幾種形式:

1.均值法。指用樣本中對某回答項目的相關(guān)數(shù)據(jù)計算平均值得到的數(shù)據(jù)填充缺省值。

2.均值加上隨機項。此隨機項從殘差的分布中獲的。

3.從回歸模型中得到預(yù)測值作為缺省值。

4.從回歸模型中得到預(yù)測值加上隨機項作為缺省值。此外,對于少量確實無法通過填充法進行缺省數(shù)據(jù)處理的項目,則可以采用剔除法,即將缺省的數(shù)據(jù)信息剔除掉。第二十五頁,共110頁。第二十五頁,共110頁。編碼

編碼、錄入數(shù)據(jù)員錄入數(shù)據(jù)

任務(wù)二編碼、錄入數(shù)據(jù)員第二十六頁,共110頁。第二十六頁,共110頁。問卷的代碼

編碼設(shè)計變量的定義

任務(wù)二編碼、錄入數(shù)據(jù)員第二十七頁,共110頁。第二十七頁,共110頁。編碼設(shè)計的分類后設(shè)計編碼

前設(shè)計編碼數(shù)字型開放題結(jié)構(gòu)式問卷中的封閉題任務(wù)二編碼、錄入數(shù)據(jù)員一是閱讀所有問卷對該問題的回答;另一種方法是抽取部分問卷。技術(shù)要點方法第二十八頁,共110頁。第二十八頁,共110頁。后設(shè)計編碼讓所有的編碼員都在同一地點,使用同一編碼本進行工作。提供編碼員一份空白的“參照問卷”。提供編碼指南,說明什么時候以及怎樣設(shè)立一個新的代碼或合并答案。設(shè)立較多、較窄的類別要優(yōu)于設(shè)立較少、較寬的類別。提供每一個需要事后編碼的項目一份編碼表或編碼名單。對每一個項目做一份編碼本,內(nèi)含一頁或幾張單頁。技術(shù)要點保持編碼冊的整潔和清晰。第二十九頁,共110頁。第二十九頁,共110頁。(二)編碼的形式1.編碼設(shè)計的內(nèi)容

1、編碼表

1)問卷的代碼、變量的定義(名稱、類型、所占字節(jié)、對應(yīng)問題等)

2)取值的定義(范圍、對應(yīng)含義等)將這些內(nèi)容列成表格形式,稱為編碼表

第三十頁,共110頁。第三十頁,共110頁。第三十一頁,共110頁。第三十一頁,共110頁。2.事前編碼1)請問您家有沒有電腦?①□有②□沒有2)請問您家的電腦是什么牌子?①□聯(lián)想②□康柏③□IBM④□同創(chuàng)⑤□HP⑥□其他(請注明)3)請問您家的電腦買多久了?①□最近半年②□一年③□二年④□三年以上第三十二頁,共110頁。第三十二頁,共110頁。3.事后編碼3、事后編碼

事后編碼指的是研究者在調(diào)查已經(jīng)實施,、問題已經(jīng)作答之后,給予每一個變量和可能答案一個數(shù)字代碼或符號。第三十三頁,共110頁。第三十三頁,共110頁。通常需要事后編碼的有:1)封閉式問答題的“其他”項2)開放式問答題3)無結(jié)構(gòu)問卷第三十四頁,共110頁。第三十四頁,共110頁。(三)編碼的基本方法

1.封閉題的編碼設(shè)計

1)對單選題只需規(guī)定一個變量,取值為選項號

例如:

Q18請問您最近一年內(nèi)買過mp3嗎?()1.買過2.沒買過

變量名--V18,屬于數(shù)字型變量,變量所占字節(jié)數(shù)為1,變量取值范圍為1,2或9,其中1表示買過,2表示沒買過,9表示該題無回答。

第三十五頁,共110頁。第三十五頁,共110頁。2)對多選題需規(guī)定多個變量對變量與取值的定義一般有兩種做法:一種方法是將各個可能回答的答案選項都設(shè)為一個0-1指示變量,如被調(diào)查者選擇了該答案,此變量的值為1,否則為0。第三十六頁,共110頁。第三十六頁,共110頁。

Q17請問您隨身帶的mp3主要來源是什么?()1.自己購買2.別人送的

3.向朋友/同事/親戚借4.其他第三十七頁,共110頁。第三十七頁,共110頁。

另一種做法是-----

將變量定義為所選題號,變量值為選項號,變量排列順序即為選擇答案的順序。第三十八頁,共110頁。第三十八頁,共110頁。3)排序題的編碼設(shè)計

第一種方法:變量個數(shù)即選項個數(shù),按照選項排列順序,分別定義各變量為對應(yīng)選項所排次序號,取值即為次序號。第三十九頁,共110頁。第三十九頁,共110頁。例如:Q12請您根據(jù)信任程度由大到小對下列廣告排序(按重要程度排序)1.電視廣告

2.報紙廣告

3.廣播廣告

4.雜志廣告

5.路牌廣告第四十頁,共110頁。第四十頁,共110頁。另一種方法:變量個數(shù)即要求排序項數(shù),依照次序號排列順序,分別定義各變量為各次字號對應(yīng)的選項項數(shù),取值即為選項號。第四十一頁,共110頁。第四十一頁,共110頁。Q12請問下列廣告中,您最信任哪個廣告?()其次呢?()再次呢?()1.電視廣告

2.報紙廣告

3.廣播廣告

4.雜志廣告

5.路牌廣告第四十二頁,共110頁。第四十二頁,共110頁。4)數(shù)字型開放題的編碼設(shè)計對直接回答數(shù)字的問題,變量取值即為該數(shù)字。例如,直接詢問被調(diào)查者的年齡,設(shè)計編碼時取變量名為NL,所占字節(jié)為2(因為調(diào)查對象要求在20-60歲之間),小數(shù)點位為0,變量取值即為年齡,單位為“歲”,取值范圍為20-60或99(99表示該題缺失)。第四十三頁,共110頁。第四十三頁,共110頁。問卷編號001-5001.被訪問對象性別:①□男②□女2.請問您的年齡是:

周歲3.請問您的最高學(xué)歷是:①□小學(xué)及小學(xué)以下②□初中③□高中(含中專)④□大學(xué)??脾荨醮髮W(xué)本科⑥□研究生或研究生以上4.請問您的個人月平均收入大約在:①□500元以下②□500-1000元③□1000-1500元④□1500-2000元⑤□2000-2500元⑥□2500元以上例:第四十四頁,共110頁。第四十四頁,共110頁。5.對下面的說法您的意見如何?請按照您的贊同程度圈選答案。非常贊同贊同無所謂不贊同很不贊同①我覺得公司的管理很混亂54321②我們的老板很有人情味54321③呆在這個公司我覺得郁悶54321④我對這份工作很珍惜54321……第四十五頁,共110頁。第四十五頁,共110頁。2.開放式問題的編碼

對于開放式問題的編碼,編碼員首先要將回答者的答案瀏覽一遍,列出所有的可能答案,然后定義這些答案的變量名稱和變量表值,再對每一個回答者進行分類。第四十六頁,共110頁。第四十六頁,共110頁。

開放式問題的合并與編碼回答類別描述表5-7中的回答分類的數(shù)字編碼質(zhì)量好l,4,51外形美觀22價格便宜33體積小64名牌7,8,95不知道10,11,126第四十七頁,共110頁。第四十七頁,共110頁?!澳鸀槭裁催x擇那個品牌的電腦?”12個樣本的回答為:(1)質(zhì)量好(2)外形美觀(3)價格適中(4)耐用(5)高科技 (6)體積?。?)是名牌(8)大家都買這個牌子(9)經(jīng)常在廣告中見到(10)說不清(11)我不知道(12)沒有什么特別的原因

例:第四十八頁,共110頁。第四十八頁,共110頁。3.編碼手冊將事前編碼和事后編碼所用的編碼本合并為一個編碼本,即為編碼手冊.第四十九頁,共110頁。第四十九頁,共110頁。(四)實踐中的編碼技巧

(1).實踐中容易導(dǎo)致編碼誤差的因素主要有:1)被調(diào)查者的回答可能不完整、含糊,難以確認其含義,對這類答案無法編碼。2)編碼表有問題,例如答案類別相互交叉,或缺少重要的答案類別,令編碼人員無法準確歸類。3)編碼人員對語句的理解有誤,編碼錯誤,產(chǎn)生誤差。4)編碼人員疏忽大意,造成漏碼、錯碼,不僅耽誤時間,浪費人力,還可能嚴重破壞數(shù)據(jù)質(zhì)量。第五十頁,共110頁。第五十頁,共110頁。(2).可采取相應(yīng)的措施1)設(shè)計問卷時,答題說明盡量詳細一些。2)編碼人員在遇到模棱兩可的問題時,不能憑猜測編碼,最好詢問督導(dǎo)。3)盡量保證編碼表的質(zhì)量,避免由于編碼表引起的編碼誤差。4)在編碼表中找不到對應(yīng)答案時,可以將答案編入“其他”項做好編碼人員的選擇、培訓(xùn)、監(jiān)督、審核工作第五十一頁,共110頁。第五十一頁,共110頁。第二節(jié)市場調(diào)查資料整理

資料整理的內(nèi)容主要有排序、分類(組)、匯總、計算頻數(shù)和頻率,制作統(tǒng)計表、統(tǒng)計圖等。一、數(shù)據(jù)的排序與分類匯總(一)排序排序是按照某個或某些指標的一定順序?qū)?shù)據(jù)進行重新排列。(二)分類匯總分類匯總就是對某個排序指標及相關(guān)指標進行計數(shù)、求和、計算平均值等。(三)利用Excel進行數(shù)據(jù)排序與分類匯總第五十二頁,共110頁。第五十二頁,共110頁。注:資料整理的方法1、行列選擇與數(shù)據(jù)輸入2、匯編、制表和繪圖

第五十三頁,共110頁。第五十三頁,共110頁。例如,某商業(yè)零售企業(yè)為了了解顧客對本企業(yè)經(jīng)營服務(wù)質(zhì)量的看法,在一天內(nèi)隨機訪問了40名顧客,請他們對企業(yè)的滿意程度打分(分值從10到100,分為10個檔次),得到表5.1資料,試據(jù)表中資料用Excel進行排序和分類匯總。1.數(shù)據(jù)排序(1)打開Excel電子表,錄入調(diào)查數(shù)據(jù),將該數(shù)據(jù)表命名為“消費者數(shù)據(jù)調(diào)查表”,如圖5.1所示。第五十四頁,共110頁。第五十四頁,共110頁。

圖5.1消費者調(diào)查數(shù)據(jù)表第五十五頁,共110頁。第五十五頁,共110頁。

(2)利用鼠標選定單元格A1:B41區(qū)域。(3)在菜單中選擇“數(shù)據(jù)”中的“排序”選項,彈出圖5.2所示的“排序”對話框。圖5.2數(shù)據(jù)排序?qū)υ捒虻谖迨?,?10頁。第五十六頁,共110頁。(4)在排序?qū)υ捒蛑?,選擇“主要關(guān)鍵字”列表中的“分值”作為排序關(guān)鍵字,并選擇按“遞增”排序。由于所選數(shù)據(jù)中已經(jīng)包括標題,所以在“當前數(shù)據(jù)清單”中選擇“有標題行”,然后單擊“確定”按鈕,即可得到排序結(jié)果(見圖5.3)。圖5.3消費評分排序表第五十七頁,共110頁。第五十七頁,共110頁。2.數(shù)據(jù)分類匯總在數(shù)據(jù)排序基礎(chǔ)上,只須在“數(shù)據(jù)”菜單中選擇“分類匯總”選項,Excel便會自動生成分組顯示的數(shù)據(jù)清單。(1)在數(shù)據(jù)排序的基礎(chǔ)上,選定需要分類匯總的數(shù)據(jù)區(qū)域,本例為A1:B41,然后選擇“數(shù)據(jù)”菜單中的“分類匯總”選項,這時出現(xiàn)如下“分類匯總”對話框(見圖5.4)。(2)在“分類字段”的下拉菜單中選擇要進行分類的列標題,在“匯總方式”下拉列表中選擇進行匯總的方式。本例中選擇按“分值”進行分類,選擇按“計數(shù)”進行匯總。單擊“確定”便得到分類匯總的結(jié)果(見圖5.5)。第五十八頁,共110頁。第五十八頁,共110頁。圖5.4數(shù)據(jù)“分類匯總”對話框

第五十九頁,共110頁。第五十九頁,共110頁。對數(shù)據(jù)分類匯總以后,可以觀察到給企業(yè)打各種分數(shù)的被調(diào)查者有多少人,給某一相同分數(shù)的被調(diào)查者的編號各是多少等。如本例中,給20分的只有1名被調(diào)查者,他的編號是10;給30分的有6人,他們的編號是1、12、18、20、27、30;給40分的有11人;……;給80分的有3人。第六十頁,共110頁。第六十頁,共110頁。圖5.5數(shù)據(jù)分類匯總結(jié)果

第六十一頁,共110頁。第六十一頁,共110頁。二、數(shù)據(jù)的分組分析

(一)數(shù)據(jù)分組分析的一般問題要正確認識統(tǒng)計數(shù)據(jù)所反映的客觀對象的本質(zhì)特征和發(fā)展規(guī)律,必須根據(jù)研究目的要求,同時考慮現(xiàn)象所處歷史條件和經(jīng)濟條件,選擇最能反映現(xiàn)象本質(zhì)特征的標志,對研究對象進行分組。分組標志有數(shù)量標志和品質(zhì)標志兩種。按品質(zhì)標志分組有簡單和復(fù)雜兩種情況。對于簡單的品質(zhì)分組,分組標志一經(jīng)選定,研究對象可分為多少組,總體中的各個單位應(yīng)歸并于哪一組,都是十分清楚的。對于復(fù)雜的品質(zhì)分組,一般由國家統(tǒng)計部門制定統(tǒng)計的分類目錄,所有分類研究都以國家統(tǒng)一分類目錄為依據(jù)。按數(shù)量標志分組最重要的是要通過數(shù)量分組去區(qū)分事物的質(zhì)量差別,標志水平不同的組,具有不同的品質(zhì)(質(zhì)量)特征。同時,按數(shù)量標志分組還要注意不重復(fù)、不遺漏,特別要注意反映事物本來的分布特征。第六十二頁,共110頁。第六十二頁,共110頁。

(二)Excel數(shù)據(jù)透視表在分組整理中的應(yīng)用在統(tǒng)計數(shù)據(jù)分組整理中,常應(yīng)用Excel數(shù)據(jù)透視表編制單向表和交叉表。圖5.6數(shù)據(jù)透視表向?qū)?3步驟之1第六十三頁,共110頁。第六十三頁,共110頁。1.單項表單向表即單變量表格,它只研究按某一個標志分組后,總體的分布情況。例如,利用消費者對企業(yè)滿意程度調(diào)查資料(表5.1)建立的Excel工作表(見圖5.1),可作如下進一步的分組分析。(1)打開消費者對企業(yè)滿意程度調(diào)查資料工作表(見圖5.1);(2)單擊“數(shù)據(jù)”菜單中的“數(shù)據(jù)透視表和圖表報告”選項,Excel彈出“數(shù)據(jù)透視向?qū)В巢襟E之1”對話框(見圖5.6);(3)選擇“數(shù)據(jù)列表或數(shù)據(jù)庫”作為數(shù)據(jù)源,選擇“數(shù)據(jù)透視表”作為報表類型。單擊“下一步”,彈出“數(shù)據(jù)透視向?qū)В?步驟之2”對話框(見圖5.7);第六十四頁,共110頁。第六十四頁,共110頁。圖5.7數(shù)據(jù)透視表向?qū)?3步驟之2

(4)選定數(shù)據(jù)覆蓋區(qū)域,即在圖5.7“選定區(qū)域(R)”輸入框中輸入“$A$1:$C$41”,單擊“下一步”,彈出“數(shù)據(jù)透視向?qū)В巢襟E之3”對話框(見圖5.8);第六十五頁,共110頁。第六十五頁,共110頁。

圖5.8數(shù)據(jù)透視向?qū)В巢襟E之3第六十六頁,共110頁。第六十六頁,共110頁。(5)在圖5.8選擇現(xiàn)有工作表,并將數(shù)據(jù)透視表確定在D1單元格中,即在圖5.8輸入框中輸入“$D$1”;在圖5.8中可通過“布局”調(diào)整工作表的版面,通過“選項”確定頁面上的各種設(shè)置。圖5.9數(shù)據(jù)透視向?qū)В季?/p>

第六十七頁,共110頁。第六十七頁,共110頁。(6)單擊“布局”彈出圖5.9所示對話框,選擇右邊的“分值”字段,并將它拖到左邊的“行”區(qū);再選擇“分值”字段,將其拖到“數(shù)據(jù)”區(qū)域中,顯示為“求和項:分值”,以便進行數(shù)據(jù)匯總。(7)雙擊數(shù)據(jù)區(qū)域中的“求和項:分值”字段,打開“數(shù)據(jù)透視表字段”對話框(見圖5.10),在“匯總方式”列表中選擇“計數(shù)”。

圖5.10數(shù)據(jù)透視表字段

第六十八頁,共110頁。第六十八頁,共110頁。(8)單擊右側(cè)“選項”,Excel彈出選擇數(shù)據(jù)顯示方式行序框。在“數(shù)據(jù)顯示方式”下拉選項中選擇“占同列數(shù)據(jù)總和的百分比”,單擊“確定”,則版式調(diào)整完畢。再單擊“確定”,回到數(shù)據(jù)透視表步驟3(見圖5.11)。圖5.11選擇數(shù)據(jù)顯示方式

第六十九頁,共110頁。第六十九頁,共110頁。(9)單擊數(shù)據(jù)透視表步驟3中的“完成”,消費者打分單向表便制作完成(見圖5.12)。圖5.12消費者滿意程度單向表第七十頁,共110頁。第七十頁,共110頁。2.交叉表交叉表用于表示兩個品質(zhì)變量之間的關(guān)系,在市場研究用于可用于市場細分、市場機會等方面的分析。例如,上述某企業(yè)管理部門希望根據(jù)調(diào)查結(jié)果資料,確認不同性別的用戶對企業(yè)滿意程度打分的分值是否存在差別?,F(xiàn)用交叉表作如下分析。

(1)打開消費者滿意程度調(diào)查數(shù)據(jù)表(見圖5.1);

(2)從“數(shù)據(jù)”菜單中選擇“數(shù)據(jù)透視表和圖表報告”選項,得到“數(shù)據(jù)透視對話框”,在對話框中選擇“數(shù)據(jù)列表或數(shù)據(jù)庫”與“數(shù)據(jù)透視表”,單擊“下一步”;第七十一頁,共110頁。第七十一頁,共110頁。(3)在如圖5.7所示向?qū)Р襟E2對話框中,確定數(shù)據(jù)區(qū)域A1:D41,單擊“下一步”;

(4)在圖5.8所示向?qū)Р襟E3對話框中,確定數(shù)據(jù)透視表位置,將其位置調(diào)整到“H1”單元格。然后單擊“布局”,打開布局對話框;

(5)將對話框右邊的“分值”字段拖到左邊的“行”區(qū)作為分組變量,再將右邊的“性別”字段拖到“列”區(qū),作為交叉分析的變量,最后將右邊的“性別”字段拖到“數(shù)據(jù)”區(qū)域中,并選擇“計數(shù)”。若想以百分比的形式顯示,則應(yīng)雙擊數(shù)據(jù)區(qū)域中的“計數(shù)項:性別”,此時彈出“數(shù)據(jù)透視表字段”最后單擊“確定”,又回到“布局”對話框,如圖5.13所示。第七十二頁,共110頁。第七十二頁,共110頁。圖5.13消費者調(diào)查數(shù)據(jù)透視表布局對話模型(6)單擊“確定”回到第3步,要注意數(shù)據(jù)透視表的位置定在單元格G1,最后單擊“完成”,得到圖5.14所示交叉表。第七十三頁,共110頁。第七十三頁,共110頁。圖5.14消費者評分分值與性別交叉分組表第五章市場調(diào)查數(shù)據(jù)數(shù)據(jù)處理交叉表分析表明,消費者對企業(yè)滿意程度評分存在性別差異,男消費者的滿意程度低于女消費者。66%以上的女消費者對該企業(yè)的滿意程度在50%及以上(打分在50及以上),而有62%的男消費者對該企業(yè)的滿意程度在50%以下(打分在40及以下)。第七十四頁,共110頁。第七十四頁,共110頁。

(三)數(shù)據(jù)的頻數(shù)分布1.頻數(shù)分布的概念在統(tǒng)計分組的基礎(chǔ)上,將總體的所有單位按組歸類整理,并按一定順序排列,形成總體中各個單位在各組間的分布,稱為頻數(shù)分布。通過頻數(shù)分布,可以研究大量現(xiàn)象的統(tǒng)計規(guī)律性??傮w各組頻數(shù)(次數(shù))占總頻數(shù)(總次數(shù))比率,稱為頻率。頻數(shù)分布表可以表明各組在總體中出現(xiàn)的次數(shù)或比重,從而描述總體的內(nèi)部結(jié)構(gòu),揭示總體的關(guān)鍵因素或本質(zhì)特征。第七十五頁,共110頁。第七十五頁,共110頁。2.累計頻數(shù)分布按數(shù)量標志分組所形成的頻數(shù)分布,稱為變量數(shù)列。將變量數(shù)列各組的次數(shù)和比率依次累加所形成的分布稱為累計頻數(shù)分布。累計頻數(shù)分布可以說明,總體中在某一標志值上(或下)的總體單位數(shù)(或稱次數(shù))有多少或占多大比重。累計次數(shù)有向上累計和向下累計兩種計算方法。向上累計就是由變量值低的組向變量值高的組依次累計各組次數(shù),其結(jié)果表明各組上限以下的次數(shù)或比率有多少。向下累計就是由標志值高的組向標志值低的組依次累計各組次數(shù),其結(jié)果表明各組下限以上的次數(shù)和比率是多少。第七十六頁,共110頁。第七十六頁,共110頁。

3.變量頻數(shù)分布的編制

調(diào)查數(shù)據(jù)按數(shù)量標志分組以后,形成總體單位在各組的分配,將這種分配結(jié)果按各組標志值大小順序排列便形成變量頻數(shù)分布(或稱變量數(shù)列)。

變量數(shù)列有單項數(shù)列和組距數(shù)列兩種。單項數(shù)列就是各組標志值都是用一個數(shù)值表現(xiàn)的數(shù)列。當變量是離散型的,且變量值項數(shù)較少,變動范圍較小,可編制單項數(shù)列。如果變量是連續(xù)型的,或雖是離散變量,但其變動范圍較大,變量值項數(shù)也較多,就必須編制組距數(shù)列。組距數(shù)列的編制大致有以下幾個步驟:第七十七頁,共110頁。第七十七頁,共110頁。首先,將原始數(shù)據(jù)按大小順序排列,并確定最大值、最小值和全距。其次,確定組數(shù)和組距。一般來說,組數(shù)在5~15之內(nèi),資料項數(shù)較多時,組數(shù)可多一些,資料項數(shù)較少時,組數(shù)可少一些。確定組距時既要考慮能夠反映研究對象的本質(zhì)特征,又要便于整理加工。能反映事物的本質(zhì)特征,就是要求性質(zhì)相同或相近的單位應(yīng)盡可能歸并在一個組或相鄰幾個組中,而不能將總體分布的集中趨勢分散化。便于加工整理是指編制變量數(shù)列時,在能反映研究對象特征的前提下,應(yīng)盡可能使用等距分組,組距最好是5的倍數(shù)。組距兩端的數(shù)值稱為組限,其中較大的稱為上限,較小的稱為下限。確定組限時要注意,最小組的下限要小于或等于最小的變量值,最大組的上限要大于或等于最大的變量值。第七十八頁,共110頁。第七十八頁,共110頁。

(四)分組分析案例與Excel軟件處理例如,某學(xué)院會計專業(yè)45名學(xué)生第二學(xué)期統(tǒng)計學(xué)考試成績?nèi)绫?.2所示,試用Excel進行分析分析。操作步驟如下:1.打開Excel電子表,輸入表5.2資料(見圖5.6);圖5.6學(xué)生統(tǒng)計學(xué)成績表第七十九頁,共110頁。第七十九頁,共110頁。2.在單元格C1中輸入“分組上限”,在區(qū)域C2:C6中輸入分組上限59、69、79、89、99;3.在C7與D7的組合單元中輸入“成績匯總分布”;4.在區(qū)域C8:C12中,輸入組距0-60、60-70、70-80、80-90、90-100;5.選擇單元格區(qū)域D8:D12作為結(jié)果輸出區(qū)域,并輸入公式“=FREQUENCY(B2:B46,C2:C6)”;6.按CTRL+SHIFT+ENTER,得到圖5.7所示結(jié)果。第八十頁,共110頁。第八十頁,共110頁。 圖5.7某學(xué)院學(xué)生成績分組表第八十一頁,共110頁。第八十一頁,共110頁。三、數(shù)據(jù)的集中趨勢與離中趨勢分析市場調(diào)查數(shù)據(jù)研究中,常常需要計算數(shù)據(jù)的集中趨勢指標和離中趨勢,以反映現(xiàn)象發(fā)展的一般水平和差異程度。(一)數(shù)據(jù)集中趨勢分析1.數(shù)據(jù)集中趨勢的測定集中趨勢是指研究總體中各單位某一數(shù)量標志值向某一中心值靠攏的傾向。研究集中趨勢也就是尋找總體各單位某一標志值一般水平的代表值或中心值。數(shù)據(jù)集中趨勢的測定有平均數(shù)、眾數(shù)、中位數(shù)等方法。第五章市場調(diào)查數(shù)據(jù)處理第八十二頁,共110頁。第八十二頁,共110頁。數(shù)據(jù)的集中趨勢分析指標

均值

眾數(shù)

二中位數(shù)

三一第八十三頁,共110頁。第八十三頁,共110頁。

均值(平均值,平均數(shù)Mean)表示某變量所有取值的集中趨勢或平均水平。包括簡單算術(shù)平均和加權(quán)算術(shù)平均。算術(shù)平均值加權(quán)平均值第八十四頁,共110頁。第八十四頁,共110頁。如某教學(xué)班50名學(xué)生某次考試成績?nèi)缦卤恚ㄒ姳?.3)所示,則其算術(shù)平均數(shù)為:加權(quán)算術(shù)平均數(shù)=(分)第八十五頁,共110頁。第八十五頁,共110頁。案例:調(diào)查泰山游客的滿意度,從六個方面入手(吃、住、行、游、購、娛),用5點量表來測量,其中,1=非常不滿意,5=非常滿意。某游客在吃、住、行、游、購、娛六方面打分分別為:5,4,4,4,2,1,計算該游客的滿意度的算術(shù)平均值和加權(quán)平均值1.算術(shù)平均值:x=(5+4+4+4+2+1)÷6=3.672.加權(quán)平均值(1)確立各個指標的權(quán)數(shù):假設(shè):吃=0.15、?。?.15、行=0.1、游=0.3、購=0.1、娛=0.1(2)加權(quán)平均值:

x=(5×0.15+4×0.15+4×0.1+4×0.3+2×0.1+1×0.1)=3.25第八十六頁,共110頁。第八十六頁,共110頁。眾數(shù)(Mode)眾數(shù)(Mode)是總體中出現(xiàn)次數(shù)最多單位的標志值無眾數(shù)

原始數(shù)據(jù):10591268一個眾數(shù)

原始數(shù)據(jù):65

9855多于一個眾數(shù)

原始數(shù)據(jù):252828

364242第八十七頁,共110頁。第八十七頁,共110頁。

中位數(shù)是將研究總體中各單位的標志值按大小順序排列,處于中間位子的標志值。如某小組5個學(xué)生月生活消費額按大小順序排列為300、350、390、420、450,390即為這5個學(xué)生月生活消費額的中位數(shù)。顯然,中位數(shù)也是反映現(xiàn)象一般水平的重要指標。第八十八頁,共110頁。第八十八頁,共110頁。

【例】:9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:

1234

5

6789中位數(shù)=1080第八十九頁,共110頁。第八十九頁,共110頁。2.數(shù)據(jù)集中趨勢分析案例及Excel軟件處理仍以某學(xué)院學(xué)生考試成績資料(見表5.2)為例,利用Excel進行集中趨勢分析。操作步驟如下:(1)打開Excel電子表,在A1與B1聯(lián)合單元格內(nèi)輸入“45名學(xué)生統(tǒng)計學(xué)成績”,A2單元格輸入“學(xué)號”,B2單元格輸入“成績”;(2)在A3:A46和B3:B46輸入學(xué)號和統(tǒng)計學(xué)成績;第九十頁,共110頁。第九十頁,共110頁。

(3)單擊[工具]菜單,選擇“數(shù)據(jù)分析”命令,彈出“數(shù)據(jù)分析”對話框(見圖5.8),選中“描述統(tǒng)計”后單擊“確定”彈出描述統(tǒng)計對話框(見圖5.9);圖5.8第九十一頁,共110頁。第九十一頁,共110頁。圖5.9第九十二頁,共110頁。第九十二頁,共110頁。(4)在“描述統(tǒng)計”對話框的“輸入?yún)^(qū)域”后的輸入框中,輸入B2:B47;分組方式選中“逐列”;在“標志位于第一行”前的復(fù)選框中打“√”,表示選中。(5)在“描述統(tǒng)計”對話框中,選中“輸出區(qū)域”,并在其后的輸入框中輸入單元格D1。(6)在“描述統(tǒng)計”對話框中,選中“匯總統(tǒng)計”;選中“平均置信度”,并輸入95;再選中“第K大值”和“第K小值”,并分別輸入數(shù)字“1”。輸入完成后,單擊“確定”,得到如圖5.10所示的結(jié)果。第九十三頁,共110頁。第九十三頁,共110頁。在圖5.10的計算結(jié)果中,平均數(shù)是74.62分,標準差為2.15,眾數(shù)和中位數(shù)均為75分,最高分是98分,最低分是30分。圖5.10

第九十四頁,共110頁。第九十四頁,共110頁。

(二)數(shù)據(jù)離中趨勢分析離中趨勢是指總體各單位標志值遠離中心值的程度。它反映了總體各單位標志值平均離差的程度和平均數(shù)代表性的大小。反映現(xiàn)象離中趨勢的指標主要有全距、平均差、標準差和變異系數(shù)(常用指標是標準差系數(shù))等。

全距又稱極差,它是總體各單位標志值中的最大值與最小值之差,它反映了總體各單位標志值的變動范圍。在產(chǎn)品質(zhì)量檢驗和控制中常用該指標,如極差控制圖。

平均差是總體各單位標志值與總體平均數(shù)離差絕對值的算術(shù)平均數(shù),它準確反映了總體各單位標志值的平均離差程度。但由于它使用絕對值符號,計算較復(fù)雜,故使用不方便。志值與總體平均數(shù)離差平方平均數(shù)的算術(shù)平方根。由于它

標準差又稱均方根差,它是總體各單位標便于在大規(guī)模運算中使用,因此人們常用它作為反映離差的標準指標。第九十五頁,共110頁。第九十五頁,共110頁。數(shù)據(jù)的離散程度分析指標極差平均差

方差、標準差和離散系數(shù)第九十六頁,共110頁。第九十六頁,共110頁。標準差又稱均方根差,它是總體各單位標志值與總體平均數(shù)離差平方平均數(shù)的算術(shù)平方根。由于它便于在大規(guī)模運算中使用,因此人們常用它作為反映離差的標準指標,故稱標準差。根據(jù)這一定義,若用代表各單位標志值,代表各組單位數(shù),代表總體單位數(shù),代表總體平均數(shù),代表標準差,其計算公式可表述如下:標準差=(簡單式)標準差=(加權(quán)式)

第九十七頁,共110頁。第九十七頁,共110頁。變異系數(shù)是變異指標與平均數(shù)之比,它反映總體各單位某種標志值平均離差的相對程度。當比較兩總體平均指標代表大小,總體各單位標志變異程度大小時,如果比較對象的性質(zhì)不同或兩總體規(guī)模大小不同,因而不可比時,必須使用變異變異系數(shù)(主要是使用標準差系數(shù))。標準差系數(shù)()的算式為:上述變異指標都是從下面反映現(xiàn)象離差程度的,即指標數(shù)值的大小,直接說明總體各單位平均離差(或稱離散)程度的大小。第九十八頁,共110頁。第九十八頁,共110頁。例如,市場抽樣調(diào)查獲得A地區(qū)居民年消費支出資料如表5.4所示,并知B地區(qū)居民平均年消費支出5千元,標準差為2千元。問哪個地區(qū)居民年平均消費支出額離差程度大。

第九十九頁,共110頁。第九十九頁,共110頁。解:1.求地區(qū)居民消費支出額的平均數(shù)、標準差和標準差系數(shù)A地區(qū)居民年平均消費支出額(千元)A地區(qū)居民年平均消費支出標準差(千元)A地區(qū)居民年平均消費支出標準差系數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論