




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、市場調(diào)查中的數(shù)據(jù)分析 本講內(nèi)容本講內(nèi)容了解數(shù)據(jù)準(zhǔn)備的含義;掌握數(shù)據(jù)準(zhǔn)備的步驟和操作方法;了解常見的數(shù)據(jù)分析技術(shù)分類方法;掌握數(shù)據(jù)描述主要指標(biāo)含義和方法;掌握列聯(lián)表、方差分析的應(yīng)用;理解因子分析、聚類分析和判別分析的聯(lián)系和分析方法。第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 學(xué)習(xí)導(dǎo)航學(xué)習(xí)導(dǎo)航數(shù)據(jù)準(zhǔn)備列聯(lián)表分析方差分析分析技術(shù)分類與數(shù)據(jù)描述數(shù)據(jù)分析技術(shù)數(shù)據(jù)準(zhǔn)備的步驟聚類分析判別分析分析技術(shù)分類數(shù)據(jù)描述因子分析數(shù)據(jù)準(zhǔn)備物理檢查 數(shù)據(jù)編碼 數(shù)據(jù)錄入 數(shù)據(jù)清理 數(shù)據(jù)轉(zhuǎn)換 數(shù)據(jù)保存集中趨勢分析 頻數(shù)分析離散趨勢分析 數(shù)據(jù)分布定義問題 構(gòu)造相關(guān)矩陣提取因子 因子命名 判斷模型擬合情況擬定分析方案 選擇距離指標(biāo)確定族群數(shù)目
2、 族群解釋和命名定義問題 選擇判別方法 估計(jì)判別函數(shù)系數(shù)及其顯著性運(yùn)用判別函數(shù)進(jìn)行判別估算判別的有效性第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)準(zhǔn)備的含義數(shù)據(jù)準(zhǔn)備的含義數(shù)據(jù)分析包含兩個(gè)基本工作步驟:數(shù)據(jù)準(zhǔn)備和數(shù)據(jù)分析。數(shù)據(jù)準(zhǔn)備:是對(duì)收集來的原始數(shù)據(jù)進(jìn)行一列處理,形成數(shù)據(jù)分析所需的標(biāo)準(zhǔn)數(shù)據(jù)表的過程。數(shù)據(jù)分析:是運(yùn)用一定的分析方法對(duì)數(shù)據(jù)進(jìn)行處理,使其顯示出解決管理決策問題和營銷研究問題所需信息的過程。數(shù)據(jù)準(zhǔn)備一般包括問卷的物理檢查、編碼、錄入、清理、轉(zhuǎn)換、保存等步驟。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)準(zhǔn)備的步驟數(shù)據(jù)準(zhǔn)備的步驟物理檢查 數(shù)據(jù)編碼 數(shù)據(jù)錄入 數(shù)據(jù)清理 數(shù)據(jù)轉(zhuǎn)換 數(shù)據(jù)保存第第8講講 數(shù)據(jù)分析數(shù)
3、據(jù)分析 物理檢查物理檢查檢查的內(nèi)容包括:問卷是否填寫完整;是否存在規(guī)律性回答是否存在沒有按要求回答,并盡可能了解其中的原因。 問卷不完整的處理方法:數(shù)據(jù)缺失較少,直接保留記錄,按記錄的實(shí)際情況進(jìn)入分析,所缺數(shù)據(jù)按缺失值處理;當(dāng)樣本量較小時(shí),缺失值又十分重要,根據(jù)問卷作業(yè)證明記載信息進(jìn)行回訪,盡可能補(bǔ)上缺失值;當(dāng)樣本量較大時(shí),問卷的缺失值較多,采用直接丟棄整份問卷或部分?jǐn)?shù)據(jù)。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)編碼數(shù)據(jù)編碼矩陣式原則:是針對(duì)整體數(shù)據(jù)編排格式而言的,即最終數(shù)據(jù)表必須是一張由若干行和若干列組成的矩陣式數(shù)據(jù)表格。 排他性原則:在一定范圍內(nèi),一個(gè)編碼只能對(duì)應(yīng)一個(gè)變量或答案,每個(gè)答案包括沒
4、有作答、無法作答等情況都有一個(gè)代碼與之對(duì)應(yīng),不能存在相互交叉。需要強(qiáng)調(diào)的是,當(dāng)一個(gè)變量的答案是多選時(shí),對(duì)于每一種答案應(yīng)采用一個(gè)代碼進(jìn)行列示,對(duì)受訪者沒有選中留意:應(yīng)區(qū)別沒有回答的代碼的答案分配一個(gè)統(tǒng)一的代碼。 【例】您的性別是:男 女 這一問題的編碼應(yīng)包括: 變量:性別,或gend性別 答案:0女;1男;2沒有回答 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 編碼的另外兩種情況編碼的另外兩種情況一是多維編碼,或稱復(fù)合編碼,即一個(gè)編碼包含的信息是多維的,如同身份證號(hào)碼包含省份、城市、生日、性別等信息一樣。多維編碼一般僅僅用于標(biāo)識(shí)定類變量,不利于統(tǒng)計(jì)分析,應(yīng)謹(jǐn)慎使用;二是定性資料編碼。定性資料的編碼絕非輕而易舉
5、,研究人員除了解編碼原則以外,還必須對(duì)手頭資料的研究目的有一定理解,更重要的是對(duì)文字信息的洞察力。研究者應(yīng)首先建立起一套編碼單位,對(duì)文本最好是電子文本進(jìn)行手工編碼,再進(jìn)行計(jì)算機(jī)分析。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)錄入數(shù)據(jù)錄入如果通過電腦輔助電話訪談CATI或電腦輔助人員訪談CAPI收集數(shù)據(jù),研究者可以直接得到電子版數(shù)據(jù)表。對(duì)于非電腦輔助調(diào)查,研究者需要通過一定的手段將數(shù)據(jù)轉(zhuǎn)錄為電子表格。手工鍵盤錄入應(yīng)采用二次錄入,通過兩次錄入的結(jié)果對(duì)比檢查有無差異,或者抽取部分問卷錄入結(jié)果進(jìn)行核查,核查比例一般不低于25%。第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)清理數(shù)據(jù)清理數(shù)據(jù)清理的任務(wù)包括檢查數(shù)據(jù)的一致性
6、和處理缺失值。一致性檢查包括三項(xiàng)基本工作:第一,檢查有無超出編碼定義范圍的數(shù)據(jù)存在;第二,檢查有無答案的邏輯矛盾;第三,檢查有無兩行或多行數(shù)據(jù)完全一致或絕大部分一致。 缺失值處理方法一般有:用均值代替;用估計(jì)值代替;整例刪除;結(jié)對(duì)刪除。第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)轉(zhuǎn)換重新編碼:出于受訪者便利或事先無法預(yù)計(jì)等原因,問卷設(shè)計(jì)中的某些數(shù)據(jù)可能需要進(jìn)行反向編碼、重新分組編碼等操作。反向編碼就是將原有編碼進(jìn)行反向替代。 數(shù)據(jù)編輯單變量重新標(biāo)度。如指數(shù)形式或?qū)?shù)形式等;變量組合運(yùn)算。可能需對(duì)多個(gè)變量進(jìn)行四則運(yùn)算等;量綱轉(zhuǎn)換。對(duì)不同變量的定量值進(jìn)行可比性處理;賦權(quán)。在必要時(shí)可能對(duì)不同的問卷進(jìn)行
7、賦權(quán),增加特定目標(biāo)受訪者對(duì)最終結(jié)果的影響力。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)保存應(yīng)注意以下幾點(diǎn):第一,多份實(shí)時(shí)備份,手工輸入數(shù)據(jù)文件被破壞帶來的物質(zhì)和精神損失是巨大的;第二,保存格式通用,因?yàn)閿?shù)據(jù)表可能供分析員在不同的軟件上使用,保存格式通用可以省去很多麻煩,節(jié)約大量的時(shí)間;第三,數(shù)據(jù)表需編號(hào),數(shù)據(jù)表編號(hào)最好采用文字加數(shù)字的方法,便于識(shí)別數(shù)據(jù)內(nèi)容和狀態(tài),這一點(diǎn)對(duì)于大規(guī)模數(shù)據(jù)分析十分重要。第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)分析技術(shù)分類數(shù)據(jù)分析技術(shù)分類依據(jù)測量尺度不同,數(shù)據(jù)分析技術(shù)被分為非測量型數(shù)據(jù)技術(shù)nonmetric和測量型數(shù)據(jù)技術(shù)metric),非測量型數(shù)據(jù)包括定類尺度和
8、定序尺度,它們?cè)诒举|(zhì)上主要反映事物的分類,沒有真正的測量含義;測量型數(shù)據(jù)包括定距尺度和定比尺度,它們都能夠測量變量的值。依據(jù)統(tǒng)計(jì)技術(shù)屬性,數(shù)據(jù)分析技術(shù)被分為因果技術(shù)dependence technique和相依技術(shù)interdependence technique),因果技術(shù)適用于一個(gè)或多個(gè)變量作為因變量,其他變量作為自變量的情況;相依技術(shù)適用于變量沒有自變量和因變量之分,只是測試變量之間的相關(guān)性或個(gè)體之間變量的相似程度。按分析變量數(shù)量的不同,數(shù)據(jù)分析技術(shù)被分為單元統(tǒng)計(jì)技術(shù)univariate technique和多元統(tǒng)計(jì)技術(shù)multivariate technique)。單元分析技術(shù)適用于單
9、個(gè)元素分析,單元素的衡量指標(biāo)或多或少;多元統(tǒng)計(jì)技術(shù)適用于分析多個(gè)元素之間的關(guān)系,或多個(gè)元素同時(shí)對(duì)某一個(gè)因素的影響。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)描述技術(shù)數(shù)據(jù)描述技術(shù)集中趨勢:用來反映數(shù)據(jù)的一般水平,常用的指標(biāo)有平均值、中位數(shù)和眾數(shù)等;離散趨勢:主要用來反映數(shù)據(jù)之間的差異程度,常用的指標(biāo)有方差、標(biāo)準(zhǔn)差、全距、最大值和最小值。頻數(shù)分析:利于研究者初步觀察一些統(tǒng)計(jì)規(guī)律。數(shù)據(jù)分布:統(tǒng)計(jì)分析中,通常要假設(shè)樣本的分布屬于正態(tài)分布,因此要用偏度和峰度兩個(gè)指標(biāo)來檢查樣本是否符合正態(tài)分布。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 描述統(tǒng)計(jì)分析案例描述統(tǒng)計(jì)分析案例某保險(xiǎn)公司有20個(gè)保險(xiǎn)銷售分公司,各公司2019年取得
10、的銷售業(yè)績單位:萬元如下,對(duì)銷售業(yè)績進(jìn)行描述分析。 公司編號(hào)公司編號(hào) 銷售業(yè)績銷售業(yè)績 公司編號(hào)公司編號(hào) 銷售業(yè)績銷售業(yè)績 公司編號(hào)公司編號(hào) 銷售業(yè)績銷售業(yè)績 公司編號(hào)公司編號(hào) 銷售業(yè)績銷售業(yè)績1265.36315.311403.616318.52286.17570.112265.517326.03340.48512.013356.618373.24410.89422.114632.619350.45418.210305.015521.420421.8第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 銷售業(yè)績的描述性分析銷售業(yè)績的描述性分析變量全距最小值最大值銷售業(yè)績367.3265.3632.6樣本量均值標(biāo)準(zhǔn)差
11、方差20390.745101.610510324.691第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 聯(lián)列表技術(shù)聯(lián)列表技術(shù)列聯(lián)表的本質(zhì):是兩個(gè)或兩個(gè)以上變量的交叉頻數(shù)分布表,它既可以幫助研究者初步描述和判斷變量之間的關(guān)系,也可以用構(gòu)造卡方統(tǒng)計(jì)量來檢驗(yàn)變量的關(guān)系。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 列聯(lián)表分析實(shí)例列聯(lián)表分析實(shí)例例:顧客對(duì)產(chǎn)品屬性重要性評(píng)價(jià)的最終答案如下,那么不同年齡受訪者的評(píng)價(jià)是否具有顯著的差別? 年齡段年齡段重要性重要性評(píng)價(jià)評(píng)價(jià)年齡年齡合計(jì)合計(jì)25周歲周歲2534周歲周歲3544周歲周歲4559周歲周歲60周歲周歲彩電品牌12226121547922024111157318239305341830
12、73058合計(jì)7810339225247第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 列聯(lián)表的分析結(jié)果列聯(lián)表的分析結(jié)果統(tǒng)計(jì)量統(tǒng)計(jì)量檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量值統(tǒng)計(jì)量值自由度自由度雙側(cè)雙側(cè)近似概率近似概率Pearson卡方(Pearson Chi-Square)24.28312.019對(duì)數(shù)似然比方法計(jì)算的卡方(Likelihood Ratio)25.15012.014線性相關(guān)的卡方(Linear-by-Linear Association)8.1751.004有效樣本量247 列聯(lián)表分析在SPSS中的實(shí)現(xiàn):點(diǎn)擊AnalyzeDescriptive StatiticsCrosstabs,選中“彩電品牌到Row(s),“年齡到
13、“Columns)”,點(diǎn)擊下方【statistics】,選中“Chi-square”,依次點(diǎn)擊【continue】【ok】,結(jié)果如下: 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 方差分析方差分析方差分析通常用于某一個(gè)或多個(gè)變量在兩組或兩組以上的組別之間的均值是否存在顯著差異,各組別的均值大小如何。方差分析通常假設(shè)各組均值相等,如F統(tǒng)計(jì)量拒絕原假設(shè),我們就認(rèn)為某變量在各組別之間存在顯著差異,企業(yè)應(yīng)采取不同的策略。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 因子分析因子分析因子分析是一種用于數(shù)據(jù)簡化和降維的多元統(tǒng)計(jì)分析方法。面對(duì)眾多內(nèi)在相關(guān)的變量,因子分析試圖使用少數(shù)幾個(gè)隨機(jī)變量來描述眾多變量所體現(xiàn)的一種基本結(jié)構(gòu),從而將
14、數(shù)據(jù)維度降至一個(gè)可以掌握的水平。因子分析是解決多重共線性問題的有效手段,能夠有效探索變量之間的內(nèi)在結(jié)構(gòu)。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 聚類分析聚類分析 聚類分析:就是實(shí)現(xiàn)分類的一種多元統(tǒng)計(jì)方法,聚類分析:就是實(shí)現(xiàn)分類的一種多元統(tǒng)計(jì)方法,它根據(jù)聚類變量將受訪者分成相對(duì)同質(zhì)的族群。它根據(jù)聚類變量將受訪者分成相對(duì)同質(zhì)的族群。與因子分析不同,聚類分析通過將具有同質(zhì)性的與因子分析不同,聚類分析通過將具有同質(zhì)性的受訪者個(gè)體聚為較少數(shù)量的族群來減少個(gè)體數(shù)量,受訪者個(gè)體聚為較少數(shù)量的族群來減少個(gè)體數(shù)量,即個(gè)體數(shù)量并不變化,而因子分析通過減少變量即個(gè)體數(shù)量并不變化,而因子分析通過減少變量的數(shù)量來達(dá)到降維目的。的數(shù)量來達(dá)到降維目的。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 判別分析判別分析判別分析:是在已有的觀察數(shù)據(jù)及其所屬類別信息的基礎(chǔ)上,建立判別式,然后對(duì)未知的數(shù)據(jù)進(jìn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年常州工程職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測試近5年常考版參考題庫含答案解析
- 2025年山東商務(wù)職業(yè)學(xué)院高職單招高職單招英語2016-2024歷年頻考點(diǎn)試題含答案解析
- icl相關(guān)知識(shí)課件
- 2025年寧夏職業(yè)技術(shù)學(xué)院高職單招(數(shù)學(xué))歷年真題考點(diǎn)含答案解析
- 2025年北京市順義區(qū)高三一模數(shù)學(xué)試卷(含答案解析)
- 血友病的護(hù)理
- 腦血栓的診斷
- AFP防治知識(shí)培訓(xùn)課件
- 護(hù)理文化與護(hù)士
- 2019交通安全課件
- 消化內(nèi)鏡進(jìn)修總結(jié)匯報(bào)
- 山東省臨沂市河?xùn)|區(qū)2023-2024學(xué)年七年級(jí)下學(xué)期期中測試歷史試題
- 江蘇省昆山、太倉、常熟、張家港市2023-2024學(xué)年下學(xué)期七年級(jí)數(shù)學(xué)期中試題
- 生物地球化學(xué)性疾病試題
- 休閑與旅游農(nóng)業(yè)課件
- 感覺障礙護(hù)理課件
- 體育運(yùn)動(dòng)員參賽健康狀況證明模板
- 教師的挑戰(zhàn):寧靜的課堂革命
- 菲亞特博悅說明書
- 空調(diào)維保服務(wù)方案(技術(shù)方案)
- 高空發(fā)光字安裝應(yīng)急預(yù)案
評(píng)論
0/150
提交評(píng)論