GB/T 43389-2023 市場、民意和社會調(diào)查 數(shù)據(jù)分析方法(正式版)_第1頁
GB/T 43389-2023 市場、民意和社會調(diào)查 數(shù)據(jù)分析方法(正式版)_第2頁
GB/T 43389-2023 市場、民意和社會調(diào)查 數(shù)據(jù)分析方法(正式版)_第3頁
GB/T 43389-2023 市場、民意和社會調(diào)查 數(shù)據(jù)分析方法(正式版)_第4頁
GB/T 43389-2023 市場、民意和社會調(diào)查 數(shù)據(jù)分析方法(正式版)_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

ICS03.100.20國家標(biāo)準(zhǔn)化管理委員會國家市場監(jiān)督管理總局發(fā)布國家標(biāo)準(zhǔn)化管理委員會GB/T43389—2023 I 3術(shù)語和定義 4調(diào)查數(shù)據(jù)預(yù)處理 24.2一致性檢查 24.3缺失值處理 24.4異常值診斷與處理 34.5變量轉(zhuǎn)換 34.6量表轉(zhuǎn)換 35調(diào)查數(shù)據(jù)的分析方法 5.2描述統(tǒng)計(jì)分析 35.3推論統(tǒng)計(jì)分析 35.4應(yīng)用示例 3參考文獻(xiàn) 6IGB/T43389—2023本文件按GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起草。請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識別專利的責(zé)任。本文件由全國市場、民意和社會調(diào)查標(biāo)準(zhǔn)化技術(shù)委員會(SAC/TC320)提出并歸口。產(chǎn)品與工程標(biāo)準(zhǔn)化協(xié)會、吉林省格遠(yuǎn)市場調(diào)研咨詢有限公司、山東及時(shí)雨建材科技有限公司、廣東省江公司。1GB/T43389—20232規(guī)范性引用文件本文件沒有規(guī)范性引用文件。3.13.23.33.43.53.6樣本sample從總體中抽取的抽樣單元構(gòu)成的集合。統(tǒng)計(jì)量statistic由隨機(jī)變量完全確定的函數(shù)。有序樣本中處于中間位置的數(shù)值。算術(shù)平均值arithmeticmean一組數(shù)據(jù)之和除以數(shù)據(jù)的總個(gè)數(shù)所得的值。2GB/T43389—20233.7一組數(shù)據(jù)中每個(gè)數(shù)據(jù)值與該組數(shù)據(jù)的算術(shù)平均數(shù)之差的平方和除以樣本數(shù)據(jù)的總個(gè)數(shù)減1所得的值。3.8樣本方差的非負(fù)平方根。3.93.10用事件或者觀測值發(fā)生的總數(shù)目除以頻數(shù)所得的值。3.11賦予事件閉區(qū)間[0,1]中的一個(gè)實(shí)數(shù)3.12定性數(shù)據(jù)qualitativedata定性變量的觀測結(jié)果。注:可分為分類數(shù)據(jù)和定序數(shù)據(jù)。3.13定量變量的取值結(jié)果。4調(diào)查數(shù)據(jù)預(yù)處理缺失值處理方法包括但不限于以下幾個(gè)方面。b)插補(bǔ)缺失值:如果缺失值的比例較大或?qū)φw數(shù)據(jù)影響較大,可以使用插補(bǔ)方法填充缺失值。3GB/T43389—2023c)使用特殊值填充:對于某些特定的缺失值,可以使用特殊值(如0或一1)進(jìn)行填充,表示該值缺失。d)使用插值方法填充:對于時(shí)間序列數(shù)據(jù)或空間數(shù)據(jù),可以使用插值方法(如線性插值、樣條插e)使用機(jī)器學(xué)習(xí)算法預(yù)測填充:對于缺失值較多的情況,可使用機(jī)器學(xué)習(xí)算法(如隨機(jī)森林、支持向量機(jī)等)進(jìn)行預(yù)測填充。4.4異常值診斷與處理低異常值權(quán)數(shù)、插補(bǔ)法等處理異常值。4.5變量轉(zhuǎn)換根據(jù)數(shù)據(jù)分析的需要,在分析之前宜對現(xiàn)有的變量進(jìn)行一定的修改或生成新的變量,可采用變量重新定義、變量轉(zhuǎn)換、定類變量轉(zhuǎn)換為0-1變量等方法。4.6量表轉(zhuǎn)換為保證數(shù)據(jù)的可比性,便于進(jìn)行數(shù)據(jù)分析,某些場景下需要做一些量表的轉(zhuǎn)換,可采用規(guī)格化變換等方法。5調(diào)查數(shù)據(jù)的分析方法市場、民意和社會調(diào)查數(shù)據(jù)分析方法可分為描述統(tǒng)計(jì)分析和推論統(tǒng)計(jì)分析。5.2描述統(tǒng)計(jì)分析將數(shù)據(jù)以表格、圖形或數(shù)值形式表現(xiàn)出來,著重于對數(shù)量水平或其他特征的描述,可通過某具體指標(biāo)反映某一方面的特征,也能通過若干變量描述它們的相互關(guān)系,其結(jié)果重在數(shù)量描述,但不具有推斷性質(zhì)。5.3推論統(tǒng)計(jì)分析示原因以及檢驗(yàn)理論等。5.4應(yīng)用示例描述性統(tǒng)計(jì)分析適用于能收集到定量數(shù)據(jù)的幾乎所有領(lǐng)域,它能為市場、民意和社會調(diào)查提供多方面的信息分析。推論統(tǒng)計(jì)分析使用樣本數(shù)據(jù)來進(jìn)行推斷,并從中得出關(guān)于總體的結(jié)論,有助于在數(shù)據(jù)不夠豐富的條件下為市場、民意和社會調(diào)查分析提供更多的支持。如表1所示。4GB/T43389—2023表1調(diào)查數(shù)據(jù)分析方法示例類型基本性質(zhì)應(yīng)用案例適用的分析方法單變量統(tǒng)計(jì)方法多變量統(tǒng)計(jì)方法定性數(shù)據(jù)表明對象或其類別的數(shù)字性別、品牌、商店等比例、眾數(shù)等二項(xiàng)式檢驗(yàn)等表示對象的相對位置,但不能表示差異大小的數(shù)字偏好排序、在市場中的位次、社會分層等比例、眾數(shù)、中位數(shù)等順序相關(guān)系數(shù)、弗里德曼檢驗(yàn)、方差分析等定量數(shù)據(jù)可以分類、排序、比較對象間的差異態(tài)度、年齡、收入、成本、銷售量、市場份額等中位數(shù)、全距、均值等相關(guān)系數(shù)、t檢驗(yàn)、方差分析、回歸、因子分析、結(jié)構(gòu)方程、結(jié)合分析等5.4.2描述性統(tǒng)計(jì)分析示例計(jì)算數(shù)據(jù)集中數(shù)值的平均值,可用于了解數(shù)據(jù)的中心趨勢。例如,計(jì)算一組學(xué)生的考試成績平均計(jì)算數(shù)據(jù)集中數(shù)值的中間值,可用于了解數(shù)據(jù)的中心位置。例如,計(jì)算一組員工的薪資中位數(shù),以了解工資分布的中間水平。測量數(shù)據(jù)集中數(shù)值的離散程度,反映數(shù)據(jù)的變異程度。例如,在市場調(diào)研中,計(jì)算產(chǎn)品銷售量的標(biāo)準(zhǔn)差可以評估銷售數(shù)據(jù)的波動性。將數(shù)據(jù)分組并計(jì)算每個(gè)組別中的觀察頻數(shù),用于了解數(shù)據(jù)的分布情況。例如,制作一個(gè)年齡組別的頻數(shù)分布表,以了解調(diào)查樣本的年齡分布情況。計(jì)算數(shù)據(jù)在總體中的百分比,用于描述某個(gè)類別在整體中的相對比例。例如,計(jì)算產(chǎn)品市場份額的百分比,以衡量產(chǎn)品在市場上的占有率。確定數(shù)據(jù)集中的最大和最小數(shù)值差值,以了解數(shù)據(jù)的范圍。例如,計(jì)算某地區(qū)氣溫?cái)?shù)據(jù)的最高和最低值差值,以描述氣候的變化情況。計(jì)算數(shù)據(jù)集中特定百分比處的數(shù)值,可用于了解數(shù)據(jù)集的分位數(shù)分布。例如,計(jì)算一組學(xué)生的分?jǐn)?shù)5GB/T43389—2023在75%百分位數(shù)處的值,以確定高分學(xué)生的水平。用于比較同一組觀察值在不同條件下的均值差異是否顯著。例如,通過配對t檢驗(yàn)來評估某種治療方法前后患者血壓的變化。用于比較數(shù)據(jù)集的分布或中位數(shù)等非參數(shù)統(tǒng)計(jì)量的差異是否顯著。例如,使用非參數(shù)檢驗(yàn)比較兩組樣本的中位數(shù)差異。在進(jìn)行多組比較時(shí),采用修正方法來控制因多次比較而產(chǎn)生的錯誤率。例如,在進(jìn)行多個(gè)廣告渠道的效果比較時(shí),使用多重比較方法進(jìn)行比較。在進(jìn)行方差分析時(shí),考慮一個(gè)或多個(gè)協(xié)變量對因變量的影響。例如,在比較不同教育水平學(xué)生的成績時(shí)控制年齡的影響。用于建立自變量和因變量之間的非線性關(guān)系模型。例如,使用非線性回歸分析來擬合一組企業(yè)發(fā)用于分析時(shí)間

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論