利用SPSS分析調查問卷數據_第1頁
利用SPSS分析調查問卷數據_第2頁
利用SPSS分析調查問卷數據_第3頁
利用SPSS分析調查問卷數據_第4頁
利用SPSS分析調查問卷數據_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

調查問卷的整理與錄入

2021/5/91一、問卷的整理二、問卷的錄入三、問卷的分析2021/5/92問卷整理程序審

核編碼數據處理圖表制作錄入分組第一節(jié)問卷的整理程序2021/5/93審核分為兩個層面

實地審核

一般方式:

復查和回訪

資料審核

主要內容包括:資料的時效性—準資料的完整性—缺資料的正確性—誤

1、審核2021/5/94調查資料審核的主要內容(1)完備性(2)完整性(3)正確性(4)時效性(5)真?zhèn)涡?021/5/951、完備性即檢查收回的問卷或調查表的份數是否齊全,是否達到了調查方案設計的樣本量的要求。如果調查問卷或調查表份數不夠,應查明原因,采取補救措施,如重新拜訪或更換調查對象。2021/5/962、完整性即檢查審核問卷或調查表填答的項目是否完整。不完整的答卷有三種情形:(1)大面積的無回答,或者相當多的問題無回答,對此應作廢卷處理;(2)個別問題無回答,應視為有效調查問卷,所留空白待后續(xù)工作采取補救措施,或將它直接歸入“暫未決定”、“其他答案”的類別中;(3)有相當多的調查問卷對同一問題無回答,仍作為有效調查問卷,對此項提問可作刪除處理。2021/5/973、準確性即檢查問卷或調查表中的項目是否存在填答錯誤,一般也有三種情形:(1)邏輯性錯誤,表現為某些答案明顯地不符合事實,或者前后不一致。對這類錯誤能夠用電話核實的可進行更正,無法核實的按“不詳值”對待;(2)答非所問的答案,一旦發(fā)現應通過電話詢問進行糾正,或按“不詳值”對待;(3)乏興回答的錯誤,如所有問題都選擇同一固定編號答案,或者一筆帶過若干個問題。如這種乏興回答僅屬個別問卷,應徹底拋棄,如這類回答的問卷有一定的數目,且集中出現在同一類問題群上,應把這些問卷作為一個獨立的子樣本看待,在資料分析時給予適當的注意。2021/5/984、時效性主要是對調查問卷或調查表的訪問時間、有關數據的時間屬性進行檢查,以評價調查數據是否符合時效性的要求。一般地,訪問員應在規(guī)定的時間內完成所有樣本單位的訪問,如延遲了訪問,則應作出不同情況的處理:如延遲訪問對調查結果沒有什么影響,則問卷仍是合格的;若延遲訪問影響到數據的時間屬性不一致時,則應廢棄這樣的調查表或問卷。2021/5/995、真?zhèn)涡灾饕菍φ{查表或問卷的真實性進行檢驗,評價訪問員是否存在偽造問卷或調查表的行為。一般采用抽樣檢查的方法進行核實,即從回收的全部問卷或調查表中隨機抽取一部分,然后用電話或派人上門與被調查者聯系,核實訪問員是否到訪,以及訪問的時間、地點等。如果發(fā)現問卷或調查表是偽造的,應作廢棄處理,并要派員重訪。2021/5/910調查資料審核的主要方法

經驗判斷法

例如:如果被調查者年齡填寫為132歲,根據經驗判斷,其填寫肯定有誤。邏輯檢查法例如:某消費者在前面說“不知道”某調味品,后面卻說“每天都在使用”,顯然前后矛盾。計算審核法例如:在家庭收支結構中,家庭總收入遠小于總支出和儲蓄之和,那肯定有錯。2021/5/911

案例

錯誤的數據不如沒有數據

國內一家知名的電視機生產企業(yè),2004年初設立了20多人的市場研究部門,開展了同樣的調研問卷,完全相同結構的抽樣,兩組數據結論卻差異巨大。正是因為這次調查,部門被注銷、人員被全部裁減。問題:列舉您會選擇的電視機品牌?其中一組的結論是:有15%的消費者選擇本企業(yè)的電視機;另一組的得出的結論卻是:36%的消費者表示本企業(yè)的產品將成為其購買的首選。巨大的差異讓公司高層非常惱火,為什么完全相同的調查抽樣,會有如此矛盾的結果呢?公司決定聘請專業(yè)的調研公司來進行調研診斷,找出問題的真相。2021/5/912普瑞辛格的執(zhí)行小組受聘和參與調查執(zhí)行的訪問員進行交流,并很快提交了簡短的診斷結論:第二組在進行調查執(zhí)行過程中存在誤導行為。調研期間,第二組的成員佩帶了公司統一發(fā)放的領帶,而在領帶上有本公司的標志,其標志足以讓被訪問者猜測出調研的主辦方;其次,第二組在調查過程中,把選項的記錄板(無提示問題)向被訪問者出示,而本企業(yè)的名字處在侯選題板的第一位。以上兩個細節(jié),向被訪問者泄露了調研的主辦方信息,影響了消費者的客觀選擇。這家企業(yè)的老總訓斥調研部門的主管:“如果按照你的數據,我要增加一倍的生產計劃,最后的損失恐怕不止千萬?!?021/5/913問題:本案例對你有何啟示?分析提示:市場調查是直接指導營銷實踐的大事,對錯是非可以得到市場驗證,只是人們往往忽視了市場調查本身帶來的風險。一句“錯誤的數據不如沒有數據”,包含了眾多中國企業(yè)家對數據的恐慌和無奈。2021/5/914缺失數據的處理1)無效問卷2)不滿意的問卷3)不滿意問卷的處理方法2021/5/9151)無效問卷(1)回答不完全(2)調查對象不符合要求(3)答案選擇高度一致(4)截止日期后收回的問卷2021/5/9162)不滿意的問卷

(1)模糊不清(2)前后不一致或有明顯錯誤的(3)模棱兩可(4)不符合作答要求2021/5/9173)不滿意問卷的處理方法

(1)重新調查(2)填充

①找一個中間值代替②用一個邏輯答案代替③刪除處理(3)空缺2021/5/918

文字資料

分組

2、分組

數字資料2021/5/919一、文字資料的分類對于調研問卷中的開放式問題,很多回答都是文字資料,對于這些文字資料我們需要根據其資料的性質、內容或特征把相異的資料挑出來,把相同或相近的資料歸為一類,這樣才能進行后期的數據分析。(1)窮舉原則。窮舉即不遺漏,就是說分類時每一條資料都要有歸屬。分類的結果必須將所有的總類全部包括進去,沒有遺漏。(2)相斥原則。相斥即不重復,就是說在一種分組中每一條資料只能歸屬為一類中,而不能既歸于這類又歸于那類,以至于在不同類別中重復出現。即類與類要相互排斥。2021/5/920對開放式問題的答案整理程序:1、集中所有同一個開放式問題的全部文字性答案,通過閱讀、思考和分析,把握被調查者的思想認識。2、將被調查者的全部文字性答案,按照其思想認識不同歸納為若干類型,并計算各種類型出現的頻數后,制成全部答案分布表。3、對全部答案分布表中的答案進行挑選歸并,確定可以接受的分組數。一般來說,在符合調研項目的前提下,保留頻數多的答案,然后把頻數很少的答案盡可能歸并成含義相近的幾組,應根據調研的目的和答案類型的多少而確定,一般來說應控制在10組之內。4、為確定的分組,選擇正式的描述詞匯或短語。不同組別的描述詞匯或短語應體現質的差別,力求中肯、精煉、概括。5、根據分類歸納的結果,制成正式的答案分布表。2021/5/921例:在一項關于居民空調購買行為的調研問卷中,設置了“你對靜音空調這個產品概念有何看法?”的開放式問項,通過對被調查者的回答分類歸納如下:被調查者對“靜音空調”的看法分布看法分類答案人數比重(%)符合環(huán)保要求32518.25符合發(fā)展趨勢28614.30符合消費需求31615.8希望盡快推出1989.9有可能實現31215.6不可能實現35017.5難以評價21310.65合計2000100.002021/5/922二、數字資料的分組

對于問卷中的數字資料大多數在設計問卷時已經分好組了,如問卷中的封閉式問題。但是,開放式問題如“您購買的小靈通價格是()元”,那么,我們在問卷調查完之后就還要對數字資料進行分組。數字資料有在問卷設計的時候就分組的,也有調查結束后再分組的,不管怎樣,數字資料分組的原理都是一樣的,我們都需要按照一定的步驟進行。2021/5/923數字資料分組的步驟1、分組標志的選擇數據資料分組的關鍵是選擇分組標志。分組標志是說明總體特征的名稱,可以分為品質標志和數量標志。定性:

品質標志表示事物的質的特征,是不能用數值直接表示的屬性,如人的性別、民族等。定量:

數量標志表示事物的量的特征,是可以用數值直接表示的,如人的年齡、收入等。分組標志就是分組的依據或標準,分組標志一經選定,各組的性質界限和數量界限也就確定了。2021/5/9242、組數和組距的確定(1)組數和組距如何確定。當全距確定時,組距大則組數小,組距小則組數多。如果分組過多,組距必小,則不易觀察數列分布的規(guī)律性。如果分組過少,組距必大,會使組中值缺乏代表性。各組組中值應對本組有良好的代表性。組距的確定一般可以請專家或以經驗法確定。組數一般常分為10~15組。調查的數據資料最大值減去最小值,就是全距。

組距=全距÷組數2021/5/925

確定組距應遵循下列3個原則:①必須把原始資料全部變量值都包括在所分組內,不能有任何遺漏;②組距盡可能取整數,不要小數;③各組的組距盡可能相等,少用不等距分組,因為等距分組便于后階段的分析。2021/5/926按照經驗確定組數觀測值數目組數少于504~750~2007~9200~5009~10500~100010~111000~500011~135000~5000013~17多于5000017~202021/5/927(2)組距應否相等。為了便于分析研究原則上次數分布中各組的組距應相等,即盡量編制等距數列。(3)組距的位置如何確定。為便于分析研究,一般采用整齊而慣用的數字為組限。特別是習慣于采用5或10的倍數表示組限。每組的最大值為組的上限,每組的最小值為組的下限。劃分組限時,各組頻數的計量不能重復,每一總體單位只能計數1次。恰好重疊在組限上的變量值一般歸入下限的1組,即遵循“上限不在內”原則。2021/5/928(4)組限如何表示。組限的表示應以變量值本身的性質而定。如果是間斷數列,且數值變動范圍小,則可以把每個變量值為一組,叫單項式分組,見表5-1。如果是連續(xù)數列,且數值變動范圍較大,可將變量值劃分為幾個區(qū)間,每個區(qū)間為一組,叫組距式分組,見表5-2。5-15-22021/5/929第二節(jié)基于epidata的問卷錄入2021/5/9302021/5/9312021/5/9322021/5/9331、將word格式中的問卷拷貝到epidata中,注意格式的調整;2、有一些題目(尤其是多選題)無法確定格式,或者不便于后面分析的,就拆分成單選題,如第9題;2、在每一個選項后面輸入“字段編輯器”,選擇本題答案的格式,如數字、文本、日期、其他;2021/5/9342021/5/9352021/5/9361、生成rec文件;2、建立chk文件:chk文件是對每一個輸入的答案進行限制,防止在紙質版轉換為電子版時出現常識性的錯誤。2021/5/9372021/5/938

開始數據錄入

注意事項:1、如果前面有chk文件,則有一些答案填寫的限制,比如填寫的數字范圍的限制、是否需要跳轉、是否是必填項等等2、可以錄入多份問卷,當一份錄完以后,保存,就可以直接錄入第二份問卷,每一份問卷會在左下角顯示。2021/5/9392021/5/940其他功能1、縱向追加記錄/橫向合并功能2、數據一致性檢驗:雙錄入時Epdidata教程2021/5/941第三節(jié)問卷資料的分析2021/5/942(一)基礎數據分析通過頻數分布、表列、圖表對整理后的調查資料進行一些基本的數據分析,使之能清晰明了地反映調查總體屬性的分布態(tài)勢和相互關系,有助于后續(xù)分析和預測2021/5/9431.頻數分布調查有關單個變量的信息了解對一個變量選擇不同取值的調查對象的數量不同取值的出現頻率以百分比形式展現3.您通常喝什么類型的酒?白酒【】葡萄酒【】香檳酒【】啤酒【】其他【】2021/5/944通常飲用酒類的頻數分度變量值標簽變量值頻數百分比有效百分比累計百分比白酒11020.020.820.8葡萄酒2816.016.737.5香檳酒324.04.241.7啤酒42754.056.297.9其他512.02.1100缺省924.0缺省合計50100100集中趨勢指標差異性指標分布形態(tài)指標2021/5/945①集中趨勢指標用于描述分布的中心包括:均值(平均數)、中位數、眾數均值即平均數,是最常用的統計量數據應具有一定的集中趨勢,大部分答案應分布在均值附近算術平均:加權平均:均值出現最頻繁的數值,表示分布中的高峰眾數2021/5/946所有數據按升序或降序排列后位置居中的數值若樣本數為偶數,則中位數為居中的兩個數值的均值中位數是定序數據的集中趨勢指標中位數中位數比平均數更能反映大眾的真實情況【小笑話】如果比爾·蓋茨和十幾個窮光蛋在一個房間里,這個房間里十幾個人的平均收入就都超過億元。這是因為比爾·蓋茨和窮光蛋的收入差距過大,導致平均數值缺乏實際參考意義。但如果用中位數來衡量,中位數為0,就知道這房間里起碼有一半人是窮光蛋2021/5/947②差異性指標用于描述樣本值偏離分布中心的趨勢包括:極差(全距)、方差或標準差、變異系數反映數據的分散程度,即樣本最大值與最小值之差可結合中位數評價樣本值的代表性,受奇異值影響公式:全距=Xmax-Xmin極差2021/5/948離差:樣本值和均值之差方差:離均差平方的均值標準差:方差的平方根方差或標準差越大,說明數據點分布越分散,數據間差異越大方差和標準差標準差與平均數的比值如果兩組數據的度量單位和平均數相同,可用標準差來比較兩組數據的離散程度;如果度量單位和平均數不同,就只能用變異系數比較變異系數2021/5/949③分布形狀指標了解數據分布的形態(tài)包括:偏度、峰度數據分布可能是對稱的,也可能不對稱對稱分布中,位于中心兩側的數據值一樣多,均值、中位數、眾數相等,對于均值的正負偏差相等;非對稱分布則不等偏度指中心一側的均值偏差趨勢比另一側大偏度測量頻數分布曲線相對平滑或突起程度的指標正態(tài)分布峰度為0,峰度為正,曲線比正態(tài)分布突出,反之平緩峰度2021/5/9502.表列單向表列交叉表列只計數一個變量的不同數值出現次數的,稱為單向表列離散型變量,或變量數值較少、變動幅度不大且總體單位數不多的情況適合編制單相表列同時計數兩個或多個變量的不同數值聯合出現次數的,稱為交叉表列綜合分析相互聯系的多個變量之間的變動關系市場調查中最頻繁、最廣泛的方法之一2021/5/951①雙向交叉表列復雜交叉表列的基礎,描述當有兩個變量同時產生影響作用時,頻數分布的狀況,也稱列聯表經營年限與業(yè)務增長之間的關系表業(yè)務增長經營年限行總計小于5年5~10年10年以上速度慢453455134速度快525327132列總計978782266經營年限小于5年和5~10年之間的企業(yè)經營業(yè)務的增長速度快于經營年限超過10年的企業(yè)2021/5/952按經營年限計算的經營業(yè)務增長速度業(yè)務增長經營年限小于5年5~10年10年以上速度慢46.4%39.1%67.1%速度快53.6%60.9%32.9%列總計100%100%100%經營年限小于5年的企業(yè)中的53.6%和經營年限在5~10年的企業(yè)中的60.9%增長速度快,而10年以上的企業(yè)中只有32.9%增長速度快,說明當經營年限超過一定界限時,經營業(yè)務的增長速度反而可能下降計算百分數可以按列計算,也可以按行計算原則:以自變量為基準計算百分數上表中經營年限為自變量,增長速度為因變量,以自變量為基準就是按列計算2021/5/953如果按行計算,可得下表。表中顯示,增長速度慢的企業(yè)中有33.5%經營少于10年,25.4%經營了5~10年,41.0%經營了10年以上,說明增長慢使企業(yè)經營了很長時間,這種結果沒有實際意義按經營業(yè)務增長速度計算的經營年限業(yè)務增長經營年限行總計小于5年5~10年10年以上速度慢33.6%25.4%41.0%100%速度快39.4%40.1%20.5%100%2021/5/954②三向交叉表列在雙向交叉表列中添加第三個變量婚姻狀態(tài)與時裝購買狀況婚姻現狀已婚未婚時裝購買狀況高31%52%低69%48%列總計100%100%被調查總數700300自變量:婚姻狀況,因變量:時裝購買狀況結論:未婚者比已婚者購買更多的時裝2021/5/955婚姻狀態(tài)、性別與時裝購買狀況性別男性女性婚姻現狀已婚未婚已婚未婚時裝購買狀況高35%40%25%60%低65%60%75%40%列總計100%100%100%100%被調查總數400120300180自變量:性別、婚姻狀況,因變量:時裝購買狀況結論:婚姻狀況對時裝購買的作用更多的表現在女性身上,男性中已婚和未婚者購買時裝的差異不大2021/5/956加入第三個變量后,原雙向交叉表列分析的結果可能會:更精確地反映原有兩個變量之間的聯系可能發(fā)現原雙向表列顯示的兩者之間的關系是假的可能使原雙變量之間不相關的結論變?yōu)榇嬖谀承╆P系可能顯示原有聯系沒有改變性別與駕車事故比率調查事項男性女性從未出過事故56%68%至少有一次事故44%32%被調查總數70806950男性比女性更容易出事故?2021/5/957性別、駕駛里程與駕車事故比率調查事項男性駕駛英里數女性駕駛英里數大于10000小于10000大于10000小于10000從未出過事故48%75%48%75%至少有一次事故52%25%52%25%被調查總數5010207019155035事故發(fā)生率多少與駕駛里程有關,與性別無關,前一張表中之所以男性事故比率高于女性,是因為男性的駕駛里程普遍多余女性2021/5/9583.圖表統計圖是以圓點的多少、直線的長短、曲線的起伏、條形長短、柱狀高低、圓餅面積等圖形來陳示調研數據統計圖的制作:手工制作和計算機制作統計圖的種類:折線圖、條形圖、直方圖、圓面圖、餅圖、環(huán)行圖、動態(tài)曲線圖、散點圖等2021/5/959①折線圖2021/5/960②直方圖2021/5/961③條形圖2021/5/962④餅圖2021/5/9637.5.2、非數量資料與定性分析返回常用的定性分析方法

定性分析的概念和原則

定性分析是對不能量化的現象進行系統化的理性認識的分析,理論依據是哲學觀點、邏輯判斷及推理,其結論是對事物的本質、趨勢和規(guī)律的性質方便的認識。1、歸納分析法2、演繹分析法3、比較分析法4、結構分析法2021/5/964定量分析方法定量分析:是從事物數量方面的特征入手,運用一定的數據處理技術進行數量分析,從而挖掘出數量中所含的事物本身的特性及其規(guī)律性的分析方法。定量分析包括:(1)描述性統計分析:統計分組、集中趨勢分析、離散程度分析、相對程度分析、指數分析。(2)推斷性統計分析:參數估計、假設檢驗、回歸分析等(3)不確定分析方法——模糊分析返

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論