深圳市場調(diào)查:調(diào)查問卷的數(shù)據(jù)分析-上書房信息咨詢(完整版)實用資料_第1頁
深圳市場調(diào)查:調(diào)查問卷的數(shù)據(jù)分析-上書房信息咨詢(完整版)實用資料_第2頁
深圳市場調(diào)查:調(diào)查問卷的數(shù)據(jù)分析-上書房信息咨詢(完整版)實用資料_第3頁
深圳市場調(diào)查:調(diào)查問卷的數(shù)據(jù)分析-上書房信息咨詢(完整版)實用資料_第4頁
深圳市場調(diào)查:調(diào)查問卷的數(shù)據(jù)分析-上書房信息咨詢(完整版)實用資料_第5頁
已閱讀5頁,還剩66頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

深圳市場調(diào)查:調(diào)查問卷的數(shù)據(jù)分析-上書房信息咨詢(完整版)實用資料(可以直接使用,可編輯完整版實用資料,歡迎下載)

深圳市場調(diào)查:調(diào)查問卷的數(shù)據(jù)分析-上書房信息咨詢(完整版)實用資料(可以直接使用,可編輯完整版實用資料,歡迎下載)深圳市場調(diào)查:調(diào)查問卷的數(shù)據(jù)分析1、數(shù)據(jù)初步處理雖然現(xiàn)有很多調(diào)查網(wǎng)站支持數(shù)據(jù)分析,快速的生成各種圖表,有的還能直接生成一份報告,但我還是建議從數(shù)據(jù)的明細入手,根據(jù)一些指標刪除部分不合理的數(shù)據(jù)再進行分析??晒﹨⒖嫉闹笜?填答時長,IP,用戶基本信息,調(diào)查表內(nèi)的控制題目等。填答時長填答時長是個比較常用的篩選指標,但是由于問卷內(nèi)容彼此差異較大,制定篩選的標準似乎難以統(tǒng)一,有的是通過作圖(spss箱形圖,也可以通過修剪平均數(shù)的做法(例如去掉頭尾5%的部分。IP目前很多調(diào)查表網(wǎng)站可以收集IP地址,這也是有獎調(diào)查活動中了解用戶是否重復參與的一個途徑,當然不排除動態(tài)IP或者網(wǎng)吧填寫的可能,所以使用要慎重。在設計網(wǎng)站時就控制一臺電腦/一個IP只能填答一次。用戶基本信息有些調(diào)查中會搜集用戶的基本信息,如網(wǎng)站賬號或等,這些指標也可以用于判斷是否重復參與答題。調(diào)查表內(nèi)的控制題目這個主要通過題目之間的前后邏輯進行判斷,舉個例子,如用戶在“xx滿意度”題目中滿意度給分很高,但是在隨后“對xx的評價”中評價很低的話,那么答卷質(zhì)量就可能存在問題,想要通過題目控制調(diào)查表質(zhì)量需要在設計調(diào)查表時就進行深入的思考和準備。當然,篩選標準不限于以上幾種,具體的要依照調(diào)查表自身特點,不妨多個篩選指標組合使用。2、統(tǒng)計分析方法調(diào)查表結果分析所使用的方法往往是和調(diào)查表的設計有關,比如“您是否愿意推薦xx”,如果選項設置為“是/否”就得到一個二分變量,而設置成里克特量表形式就可以得到推薦意愿度的數(shù)值,相應的統(tǒng)計分析方法也會有所不同。除了統(tǒng)計分析每一題目的答復情況,對一些題目進行交叉分析,相關分析,或差異檢驗也可以幫我們更多了解數(shù)據(jù)背后的信息。調(diào)查表的結構也會影響統(tǒng)計方法的使用,特別是需要進行深入統(tǒng)計分析,探明各個指標之間關系的時候。如我曾調(diào)查過用戶對商城信任度的評價,經(jīng)過資料搜集,編制了服務,產(chǎn)品,,網(wǎng)站設計,付款安全性等幾個指標的題目,收集數(shù)據(jù)后對這些指標進行了因素分析(采用了主成分分析法,kmo和巴勒特球形檢驗都顯示適合因素分析,結果顯示提取出了一個因素,解釋變異78%,是否就可以表明商城的信任度就是由調(diào)查表中的那些指標組成呢,是否就得到了信任度模型呢?答案是否定的,以上僅僅是建立模型的探索性因素分析部分,如果真的需要建立信任度模型還需要驗證性因素分析部分(結構方程模型,可以用AMOS實現(xiàn)。如果需要采用調(diào)查表的方法建立模型,僅僅使用因素分析進行降維是不夠的,降維和建立模型還差的很遠。模型是否成立就與當初設計調(diào)查表時思考深度和實際工作需要有關。另外,目前本人對一些開放性的意見/建議類題目的分析還沒有很有效的方法,只能逐條查看,將涉及到的問題分類匯總,但是這樣比較耗時,待改進。關于多選題的分析方法,已經(jīng)有文章進行了深入分析,有興趣可以查看調(diào)研問卷中多選題的分析方法探討3、形成分析報告分析報告往往是呈現(xiàn)給業(yè)務部門的同事看的,所以最好是以更直觀的方式呈現(xiàn),采用有說服力的圖表,輕分析過程,著重結論和意見建議部分,最好能點出每條結論對應的相關業(yè)務部門,在指出問題的時候也盡量給出建議。摘要:本文簡述了數(shù)據(jù)挖掘技術的基本概念、產(chǎn)生和發(fā)展的基礎以及在現(xiàn)實生活中所發(fā)揮的巨大作用。同時還就數(shù)據(jù)挖掘技術在全國廣播監(jiān)測網(wǎng)的應用做了初步的探索和嘗試。關鍵詞:數(shù)據(jù)挖掘廣播電視監(jiān)測決策支持0引言隨著廣播電視監(jiān)測網(wǎng)建設規(guī)模的不斷擴大和運行時間的不斷增加,廣播電視監(jiān)測網(wǎng)數(shù)據(jù)庫積累的各種監(jiān)測數(shù)據(jù)也越來越多。激增的數(shù)據(jù)背后隱藏著許多重要的知識和信息,而目前的數(shù)據(jù)庫系統(tǒng)可以高效地實現(xiàn)數(shù)據(jù)的錄入、查詢、統(tǒng)計等功能,但無法發(fā)現(xiàn)數(shù)據(jù)中存在的關系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預測未來的發(fā)展趨勢。如何運用數(shù)據(jù)挖掘這一新興技術從大量的監(jiān)測數(shù)據(jù)中發(fā)現(xiàn)有意義和有價值的知識,并根據(jù)這些知識來指導我們?nèi)粘5谋O(jiān)測工作和維護工作,使我們的工作更有效率,成為廣播電視監(jiān)測領域里一個值得探索和研究的課題。1數(shù)據(jù)挖掘技術簡介1.1數(shù)據(jù)挖掘技術的基本概念數(shù)據(jù)挖掘(DataMining就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。這個定義包括好幾層含義:數(shù)據(jù)源必須是真實的、大量的、含噪聲的;發(fā)現(xiàn)的是用戶感興趣的知識;發(fā)現(xiàn)的知識要能夠易于被用戶理解,最好能用自然語言表達;并不要求發(fā)現(xiàn)放應用探索◎楊京國家廣電總局監(jiān)測數(shù)據(jù)處理中心之四海皆準的知識,換句話說發(fā)現(xiàn)的知識都是相對的,是有特定前提和約束條件,面向特定領域的。下面再簡單解釋一下知識的基本概念。從廣義上理解,數(shù)據(jù)、信息也是知識的表現(xiàn)形式,但是人們更把概念、規(guī)則、模式、規(guī)律和約束等看作知識。人們把數(shù)據(jù)看作是形成知識的源泉。而原始數(shù)據(jù)可以是結構化的,如關系數(shù)據(jù)庫中的數(shù)據(jù);也可以是半結構化的,如文本、圖形和圖像數(shù)據(jù);甚至是分布在網(wǎng)絡上的異構型數(shù)據(jù)。發(fā)現(xiàn)知識的方法可以是數(shù)學的,也可以是非數(shù)學的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)的知識可以被用于決策支持和過程控制等。因此,數(shù)據(jù)挖掘是一門交叉學科,它把人們對數(shù)據(jù)的應用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。數(shù)據(jù)挖掘所發(fā)現(xiàn)的知識最常見的有以下四類:1.廣義知識(Generalization:廣義知識指類別特征的概括性描述知識。根據(jù)數(shù)據(jù)的微觀特性發(fā)現(xiàn)其表征的、帶有普遍性的、較高層次概念的、中觀和宏觀的知識,反映同類事物共同性質(zhì),是對數(shù)據(jù)的概括、精煉和抽象。關聯(lián)知識(Association:它反映一個事件和其他事件之間依賴或關聯(lián)的知識。如果兩項或多項屬性之間存在關聯(lián),那么其中一項的屬性值就可以依據(jù)其他屬性值進行預測。2.分類知識(Classification&Clustering:它反映同類事物共同性質(zhì)的特征型知識和不同事物之間的差異型特征知識。最為典型的分類方法是基于決策樹的分類方法。3.預測型知識(Prediction:根據(jù)時間序列型數(shù)據(jù),由歷史的和當前的數(shù)據(jù)去推測未來的數(shù)據(jù),也可以認為是以時間為關鍵屬性的關聯(lián)知識。時間序列預測方法有經(jīng)典的統(tǒng)計方法、神經(jīng)網(wǎng)絡和機器學習等。4.偏差型知識(Deviation:此外,數(shù)據(jù)挖掘還可以發(fā)現(xiàn)其他類型的知識,如偏差型知識,它是對差異和極端特例的描述,揭示事物偏離常規(guī)的異?,F(xiàn)象,如標準類外的特例,數(shù)據(jù)聚類外的離群值等。1.2數(shù)據(jù)挖掘技術的基礎數(shù)據(jù)挖掘技術的三大基礎技術包括計算機硬件技術、大規(guī)模數(shù)據(jù)庫技術和數(shù)據(jù)挖掘算法。在過去數(shù)十年里,計算機硬件技術得到了迅猛的發(fā)展,包括單個CPU的處理能力大幅提升、內(nèi)存和磁盤存儲器價格的顯著降低、支持多個CPU的并行處理結構的巨大進步等。大型關系型數(shù)據(jù)庫及數(shù)據(jù)庫管理系統(tǒng)在各行各業(yè)的廣泛應用、最近10年來數(shù)據(jù)挖掘算法的不斷發(fā)展、成熟和穩(wěn)定。數(shù)據(jù)挖掘是利用了人工智能和統(tǒng)計分析這兩種技術致力于模式發(fā)現(xiàn)和預測。數(shù)據(jù)挖掘不是為了替代傳統(tǒng)的統(tǒng)計分析技術。相反,它是統(tǒng)計分析技術的延伸和擴展。大多數(shù)的統(tǒng)計分析技術都基于完善的數(shù)學理論和高超的技巧,預測的準確度還是令人滿意的,但對使用者的要求很高。而隨著計算機計算能力的不斷增強,我們有可能利用計算機強大的計算能力只通過相對簡單和固定的方法完成同樣的功能。一些新興的技術同樣在知識發(fā)現(xiàn)領域取得了很好的效果,如神經(jīng)元網(wǎng)絡和決策樹,在足夠多的數(shù)據(jù)和計算能力下,它們幾乎不用人的關照自動就能完成許多有價值的功能。數(shù)據(jù)挖掘就是利用了統(tǒng)計和人工智能技術的應用程序,它把這些高深復雜的技術封裝起來,使人們不用自己掌握這些技術也能完成同樣的功能,并且更專注于自己所要解決的問題。1.3數(shù)據(jù)挖掘和數(shù)據(jù)倉庫之間的關系數(shù)據(jù)挖掘與數(shù)據(jù)倉庫的發(fā)展有著密切的關系。數(shù)據(jù)倉庫的發(fā)展是促進數(shù)據(jù)挖掘越來越熱的原因之一。但是,數(shù)據(jù)倉庫并不是數(shù)據(jù)挖掘的先決條件,因為有很多數(shù)據(jù)挖掘可直接從操作數(shù)據(jù)源中挖掘信息。大部分情況下,數(shù)據(jù)挖掘都要先把數(shù)據(jù)從數(shù)據(jù)倉庫中拿到數(shù)據(jù)挖掘庫或數(shù)據(jù)集市中。從數(shù)據(jù)倉庫中直接得到進行數(shù)據(jù)挖掘的數(shù)據(jù)有許多好處。數(shù)據(jù)倉庫的數(shù)據(jù)清理和數(shù)據(jù)挖掘的數(shù)據(jù)清理差不多,如果數(shù)據(jù)在導入數(shù)據(jù)倉庫時已經(jīng)清理過,那很可能在做數(shù)據(jù)挖掘時就沒必要再清理一次了,而且所有的數(shù)據(jù)不一致的問題都已經(jīng)被你解決了(圖1。數(shù)據(jù)挖掘庫可能是你的數(shù)據(jù)倉庫的一個邏輯上的子集,而不一定非得是物理上單獨的數(shù)據(jù)庫。但如果你的數(shù)據(jù)倉庫的計算資源已經(jīng)很緊張,那你最好還是建立一個單獨的數(shù)據(jù)挖掘庫。當然為了數(shù)據(jù)挖掘你也不必非得建立一個數(shù)據(jù)倉庫,數(shù)據(jù)倉庫不是必需的。建立一個巨大的數(shù)據(jù)倉庫,把各個不同源的數(shù)據(jù)統(tǒng)一在一起,解決所有的數(shù)據(jù)沖突問題,然后把所有的數(shù)據(jù)導到一個數(shù)據(jù)倉庫內(nèi),是一項巨大的工程,可能要用幾年的時間花上百萬的錢才能完成。只是為了數(shù)據(jù)挖掘,你可以把一個或幾個事務數(shù)據(jù)庫導到一個只讀的數(shù)據(jù)庫中,就把它當作數(shù)據(jù)集市,然后在他上面進行數(shù)據(jù)挖掘(圖2。1.4數(shù)據(jù)挖掘和傳統(tǒng)數(shù)據(jù)分析的區(qū)別數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析如查詢、報表、聯(lián)機分析處理(OLAP是完全不同的工具,基于的技術也完全不同。傳統(tǒng)的查詢和報表工具是告訴你數(shù)據(jù)庫中都有什么,OLAP工具則更進一步告訴你下一步會怎么樣(Whatnext、和如果我采取這樣的措施又會怎么樣(Whatif。用戶首先建立一個假設,然后用OLAP工具檢索數(shù)據(jù)庫來驗證這個假設是否正確。聯(lián)機分析處理的過程是先建立一系列的假設,然后通過OLAP工具來證實或推翻這些假設來最終得到自己的結論。聯(lián)機分析處理過程在本質(zhì)上是一個演繹推理的過程。而數(shù)據(jù)挖掘和聯(lián)機分析處理的本質(zhì)區(qū)別在于不是用于驗證某個假定模式(模型的正確性,而是在數(shù)據(jù)庫中自己尋找模型。數(shù)據(jù)挖掘是在沒有明確假設的前提下去挖掘信息、發(fā)現(xiàn)知識。數(shù)據(jù)挖掘所得到的信息應具有先前未知的特征。所謂先前未知的信息是指該信息是預先未曾預料到的,既數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識,甚至是違背直覺的信息或知識,挖掘出的信息越是出乎意料,就可能越有價值。數(shù)據(jù)挖掘在本質(zhì)上是一個歸納的過程。數(shù)據(jù)挖掘和聯(lián)機分析處理具有一定的互補性。在利用數(shù)據(jù)挖掘出來的結論采取行動之前,你也許要驗證一下如果采取這樣的行動會給公司帶來什么樣的影響,那么聯(lián)機分析處理工具能回答你的這些問題。2數(shù)據(jù)挖掘技術在監(jiān)測數(shù)據(jù)分析中的應用探索全國廣播監(jiān)測網(wǎng)數(shù)據(jù)處理中心數(shù)據(jù)庫里保存著大量的數(shù)據(jù),其中包括各種基礎資源的數(shù)據(jù)如各類發(fā)射臺和發(fā)射機的基本信息、各種發(fā)射臺運行圖的數(shù)據(jù)、監(jiān)測臺的基本信息、監(jiān)測站點的基本信息等;各種監(jiān)測數(shù)據(jù)如指標收測數(shù)據(jù)、頻譜收測數(shù)據(jù)、由監(jiān)測站點上報的各種指標報警數(shù)據(jù)(設備報警數(shù)據(jù)等。隨著全國廣播監(jiān)測網(wǎng)規(guī)模的不斷擴大、運行時間的不斷增加,數(shù)據(jù)庫里保存的各種歷史數(shù)據(jù)也隨之不斷增多。對這些數(shù)據(jù)除了可以進行各種瀏覽和查詢操作,進行各種統(tǒng)計分析、生成各種統(tǒng)計報表和圖表以外,我們還可以利用功能強大的數(shù)據(jù)挖掘工具,發(fā)現(xiàn)隱藏在這些數(shù)據(jù)背后一些有意義和有價值的知識、規(guī)律和模型,然后用這些知識來指導我們的日常監(jiān)測和維護工作,使我們的工作更有針對性、效率更高。下面就數(shù)據(jù)挖掘在全國廣播監(jiān)測網(wǎng)中的應用做一些初步的探索和嘗試。2.1數(shù)據(jù)挖掘案例1在全國廣播監(jiān)測網(wǎng)里,各監(jiān)測臺每天都以日報的形式將它所監(jiān)測的中波臺的指標異態(tài)數(shù)據(jù)上報到數(shù)據(jù)處理中心的數(shù)據(jù)庫里。指標異態(tài)包括以下3種:停播、功率異態(tài)和調(diào)幅度異態(tài),其中停播是最嚴重的異態(tài)。異態(tài)數(shù)據(jù)主要包括以下字段:異態(tài)發(fā)生日期、發(fā)生異態(tài)的中波臺名稱、異態(tài)現(xiàn)象、異態(tài)起止時間和異態(tài)原因等。根據(jù)數(shù)據(jù)挖掘技術里的時間序列預測方法,我們可以根據(jù)歷史和當前的停播異態(tài)數(shù)據(jù)去推測未來的停播異態(tài)數(shù)據(jù)。具體地說,我們可以根據(jù)最近一段時間(如1個月或3個月里所有中波臺發(fā)生停播的情況預測出在未來一段時間(如1個月里哪些發(fā)射臺發(fā)生停播的可能性最大、哪些發(fā)射臺發(fā)生停播的時間可能最長等。舉個例子:假設在最近的三個月里,中波臺A、B、C分別發(fā)生了10次、9次和8次停播,停播次數(shù)在所有中波臺里排名前三,造成停播的主要原因是機器故障。而中波臺D、E、F雖然只分別發(fā)生了1、2和3次停播,但停播時間分別達到10、20和30小時,在所有中波臺里停播時間排名前三,造成停播的主要原因是外電因素。根據(jù)這些歷史數(shù)據(jù),運用數(shù)據(jù)挖掘技術里的時間序列預測方法,我們可以得出這樣的結果:在未來的1個月里,中波臺A、B、C發(fā)生停播的可能性最大,而中波臺D、E、F發(fā)生停播的時間可能最長。當然,這些預測結果是否準確有待進一步地測試和驗證。我們可以采用另外一些數(shù)據(jù)(如前6個月的數(shù)據(jù)對預測結果進行測試。而對預測結果的驗證則需要通過未來1個月里實際發(fā)生的停播情況來進行。假設預測結果準確,我們可以對最有可能發(fā)生停播的中波臺A、B、C或發(fā)生停播時間可能最長的中波臺D、E、F,采取針對性的措施(對中波臺A、B、C加強機器檢修工作,對中波臺D、E、F加強備用電源或發(fā)電機。這樣做的好處是我們可以集中力量預防重點發(fā)射臺(而不是所有發(fā)射臺的停播問題,避免平均使用力量,爭取用最少的投入得到最好的效果,減少停播發(fā)生的次數(shù)和時間,提高整體播出效果。2.2數(shù)據(jù)挖掘案例2對監(jiān)測站點的設備報警數(shù)據(jù)進行挖掘,發(fā)現(xiàn)數(shù)據(jù)背后隱藏的一些有用的知識。通常監(jiān)測站點的設備報警數(shù)據(jù)由各監(jiān)測臺每天以設備異態(tài)日報的形式上報到數(shù)據(jù)處理中心數(shù)據(jù)庫。設備報警數(shù)據(jù)主要包括以下字段:發(fā)生故障的監(jiān)測站點名稱、故障現(xiàn)象、故障起止時間、故障原因等。通過運用數(shù)據(jù)挖掘技術里發(fā)現(xiàn)廣義知識的算法,對最近一段時間所有的設備報警數(shù)據(jù)進行挖掘,我們可以發(fā)現(xiàn)經(jīng)常發(fā)生設備故障的監(jiān)測站點具有的某些共同特征或共性。例如發(fā)現(xiàn)經(jīng)常發(fā)生設備故障的監(jiān)測站點的設備大部分由A公司制造,這一發(fā)現(xiàn)說明A公司生產(chǎn)的監(jiān)測站點設備質(zhì)量較差、根據(jù)發(fā)現(xiàn)的知識我們可以敦促A公司采取措施進一步改善其產(chǎn)品的質(zhì)量。此外我們還可以發(fā)現(xiàn),經(jīng)常發(fā)生UPS報警同時故障原因又是外電?;蛲怆婋妷翰环€(wěn)的監(jiān)測站點都集中在某幾個省份,這說明這幾個省份的電力系統(tǒng)在運行過程中經(jīng)常出現(xiàn)停電或電壓不穩(wěn)的情況,根據(jù)發(fā)現(xiàn)的知識我們可以向當?shù)仉娏ο到y(tǒng)反映這些情況,希望停電或電壓不穩(wěn)的情況能夠得到改善。3結束語通過上面的數(shù)據(jù)挖掘案例可以看到:運用數(shù)據(jù)挖掘技術我們可以從大量的廣播電視監(jiān)測數(shù)據(jù)中發(fā)現(xiàn)很多有意義、有價值的知識。這些知識可以使我們?nèi)粘5谋O(jiān)測工作和維護工作更有針對性,效率更高。數(shù)據(jù)挖掘技術在廣播電視監(jiān)測領域里的應有前景非常廣闊、大有可為。矩陣數(shù)據(jù)分析法(MatrixDataAnalysisChart),它是新的質(zhì)量管理七種工具之一。矩陣圖上各元素間的關系如果能用數(shù)據(jù)定量化表示,就能更準確地整理和分析結果。這種可以用數(shù)據(jù)表示的矩陣圖法,叫做矩陣數(shù)據(jù)分析法。在QC新七種工具中,數(shù)據(jù)矩陣分析法是唯一種利用數(shù)據(jù)分析問題的方法,但其結果仍要以圖形表示。數(shù)據(jù)矩陣分析法的主要方法為主成分分析法(Principalcomponentanalysis),利用此法可從原始數(shù)據(jù)獲得許多有益的情報。主成分分析法是一種將多個變量化為少數(shù)綜合變量的一種多元統(tǒng)計方法。矩陣數(shù)據(jù)分析法,與矩陣圖法類似。它區(qū)別于矩陣圖法的是:不是在矩陣圖上填符號,而是填數(shù)據(jù),形成一個分析數(shù)據(jù)的矩陣。它是一種定量分析問題的方法。目前,在日本尚廣泛應用,只是作為一種“儲備工具”提出來的。應用這種方法,往往需求借助電子計算機來求解。[編輯]矩陣數(shù)據(jù)分析法的原理在矩陣圖的基礎上,把各個因素分別放在行和列,然后在行和列的交叉點中用數(shù)量來描述這些因素之間的對比,再進行數(shù)量計算,定量分析,確定哪些因素相對比較重要的。[編輯]矩陣數(shù)據(jù)分析法的應用時機當我們進行顧客調(diào)查、產(chǎn)品設計或者其他各種方案選擇,做決策的時候,往往需要確定對幾種因素加以考慮,然后,針對這些因素要權衡其重要性,加以排隊,得出加權系數(shù)。譬如,我們在做產(chǎn)品設計之前,向顧客調(diào)查對產(chǎn)品的要求。利用這個方法就能確定哪些因素是臨界質(zhì)量特性。[編輯]和其他工具結合使用1.可以利用親和圖(affinitydiagram)把這些要求歸納成幾個主要的方面。然后,利用這里介紹進行成對對比,再匯總統(tǒng)計,定量給每個方面進行重要性排隊。2.過程決策圖執(zhí)行時確定哪個決策合適時可以采用。3.質(zhì)量功能展開。兩者有差別的。本辦法是各個因素之間的相互對比,確定重要程度;而質(zhì)量功能展開可以利用這個方法的結果。用來確定具體產(chǎn)品或者某個特性的重要程度。當然,還有其他各種方法可以采用,但是,這種方法的好處之一是可以利用電子表格軟件來進行。[編輯]如何使用矩陣數(shù)據(jù)分析法下面通過例子來介紹如何進行矩陣數(shù)據(jù)分析法。1、確定需要分析的各個方面。我們通過親和圖得到以下幾個方面,需要確定它們相對的重要程度:易于控制、易于使用、網(wǎng)絡性能、和其他軟件可以兼容、便于維護。2、組成數(shù)據(jù)矩陣。用Excel或者手工做。把這些因素分別輸入表格的行和列,如表所示。3、確定對比分數(shù)。自己和自己對比的地方都打0分。以“行”為基礎,逐個和“列”對比,確定分數(shù)?!靶小北取傲小敝匾?,給正分。分數(shù)范圍從9到1分。打1分表示兩個重要性相當。譬如,第2行“易于控制”分別和C列“易于使用”比較,重要一些,打4分。和D列“網(wǎng)絡性能”比較,相當,打1分?!绻靶小睕]有“列””重要,給反過來重要分數(shù)的倒數(shù)。譬如,第3行的“易于使用”和B列的“易于控制”前面已經(jīng)對比過了。前面是4分,現(xiàn)在取倒數(shù),1/4=0.25。有D列“網(wǎng)絡性能”比,沒有“網(wǎng)絡性能”重要,反過來,“網(wǎng)絡性能”比“易于使用”重要,打5分?,F(xiàn)在取倒數(shù),就是0.20。實際上,做的時候可以圍繞以0組成的對角線對稱填寫對比的結果就可以了。表1:矩陣數(shù)據(jù)分析法ABCDEFGH1易控制易使用網(wǎng)絡性能軟件兼容便于維護總分權重%2易于控制04131926.23易于使用0.2500.200.330.251.033.04網(wǎng)絡性能150331234.95軟件兼容0.3330.3300.33411.66便于維護140.33308.3324.2總分之和34.374、加總分。按照“行”把分數(shù)加起來。在G列內(nèi)得到各行的“總分”。5、算權重分。把各行的“總分”加起來,得到“總分之和”。再把每行“總分”除以“總分之和”得到H列每個“行”的權重分數(shù)。權重分數(shù)愈大,說明這個方面最重要,“網(wǎng)絡性能”34.9分。其次是“易于控制”26.2分。[編輯]矩陣數(shù)據(jù)分析法案例分析[編輯]案例一:矩陣數(shù)據(jù)分析法在軟件項目中的應用軟件缺陷的產(chǎn)生是由多方面的因素造成的,缺陷數(shù)據(jù)反映了開發(fā)過程中多個因素相互作用的對應關系。在實施了多個軟件項目的開發(fā)以后,已經(jīng)積累了一定數(shù)量的歷史缺陷數(shù)據(jù),我們?nèi)绾卫眠@些數(shù)據(jù)找到開發(fā)過程中容易產(chǎn)生質(zhì)量問題的環(huán)節(jié)和因素呢?如果只是粗略地看歷史統(tǒng)計數(shù)據(jù),是很難看出各項目之間及項目的生命周期各階段的缺陷率的差異的。我們可以用這些歷史數(shù)據(jù)來設計一個矩陣,用矩陣數(shù)據(jù)分析法就能求出多個項目的各個階段產(chǎn)生缺陷率的高低,找到產(chǎn)生缺陷的關鍵因素,這樣可以幫助了解引入的缺陷,從而對新開發(fā)的項目會引入的缺陷數(shù)做出一個相當合理的預測,達到控制缺陷率,提高軟件質(zhì)量的目的。隨著實施的軟件項目數(shù)量的增加,收集到的缺陷數(shù)據(jù)越來越多,生成的矩陣越大,對未來缺陷率預測和控制的準確性也就越高,軟件整體質(zhì)量呈螺旋式穩(wěn)步上升。下面通過一個例子來說明矩陣數(shù)據(jù)分析法在軟件缺陷管理中的具體應用。為了確定軟件缺陷主要出現(xiàn)在項目生命周期六個階段中的哪幾個階段,我們對n個開發(fā)項目進行統(tǒng)計,每個項目計算六個階段的缺陷密度,為了驗證結果重復性,又將這n個項目分為Ⅰ、Ⅱ兩組,每組n/2個項目,然后對數(shù)據(jù)求均值、標準差、相關系數(shù)、特征值、特征向量,得出三個主成分,也就確定了項目生命周期中出現(xiàn)大部分缺陷的幾個階段,為改進項目薄弱環(huán)節(jié)提供依據(jù)。詳細步驟如下:①將以往軟件項目積累的歷史缺陷數(shù)據(jù)進行分類、統(tǒng)計列表。各項目在生命周期各階段的歷史缺陷率數(shù)據(jù)見表3。②根據(jù)表3數(shù)據(jù)計算均值、標準差和相關系數(shù),計算結果見表4。③根據(jù)相關系數(shù)矩陣(表4求特征值、特征向量和貢獻率。由于計算量很大,方程的計算用計算機完成。計算結果見表5。④分析計算結果。貢獻率代表主成分的影響程度,數(shù)值越大代表性越大,特征向量表示項目與該主成分的關系。從表5可看到,第一、二、三主成分的貢獻率達90.4%,已代表所有變量的絕大部分,也就是說在項目開發(fā)過程中,軟件缺陷主要出現(xiàn)在項目生命周期的需求、構架和設計階段。這樣由上述的主成分分析,找到了容易出現(xiàn)軟件缺陷問題的階段,在以后的改進過程中把注意力集中到特征值大的方面來,就可以有效地控制、預防軟件缺陷問題。如何用數(shù)據(jù)分析市場調(diào)查?一、為什么要做市場調(diào)研?調(diào)研的目的是什么?在做市場調(diào)研前,必須有一個自己的調(diào)研思路:我們要調(diào)研的對象;需要收集的數(shù)據(jù);需要達到的效果等。只有有了明確的目標,才能獲得更加有效的數(shù)據(jù):通過調(diào)研了解市場需求、確定目標用戶、確定產(chǎn)品核心,為了更好的制訂MRD;提高產(chǎn)品的銷售決策質(zhì)量、解決存在于產(chǎn)品銷售中的問題或?qū)ふ覚C會等而系統(tǒng)地、客觀地識別、收集、分析和傳播營銷信息,及時掌握一手資源;驗證我們定的目標客戶是不是我們想要的,目標用戶想要什么樣的產(chǎn)品或服務;了解我們能不能滿足目標用戶的需求并且樂于滿足目標用戶的需求;找準產(chǎn)品機會缺口,然后衡量各種因素,制定產(chǎn)品戰(zhàn)略線路;調(diào)研到最后,目標越明確,需求確明確,也就會覺得,產(chǎn)品越難做,難以打開市場等;對于全新的產(chǎn)品,調(diào)研前PM必須先自己有一個思路,然后通過調(diào)研去驗證自己的想法的可行性。二、市場調(diào)研的方式方法有哪些?怎樣確定調(diào)研的維度?問卷調(diào)查、用戶AB測試、焦點訪談、田野調(diào)研、用戶訪談、用戶日志、入戶觀察、網(wǎng)上有獎調(diào)查;做人物角色分析:設置用戶場景、用戶角色進行模擬分析;調(diào)研的維度主要從戰(zhàn)略層、范圍層、結構層、框架層、視覺層來展開(不同的產(chǎn)品從不同的層次來確定調(diào)研的維度。三、如何整理市場調(diào)研的數(shù)據(jù)?對收集到的調(diào)研數(shù)據(jù),我們需要整理出那些有效的數(shù)據(jù),對于無效數(shù)據(jù)果斷丟棄。對有效數(shù)據(jù)進行細致的處理、分析。通過市場調(diào)研,我們可能已經(jīng)收集了不少的數(shù)據(jù),這些數(shù)據(jù)都是用戶最直接的對產(chǎn)品的某種需求的體現(xiàn)。作為產(chǎn)品經(jīng)理,我們視這些數(shù)據(jù)為寶貝,我們需要將這些數(shù)據(jù)進行整理,讓他們變?yōu)檎鋵?。那我們該如何整理?可以從以下4點入手:將規(guī)范的數(shù)據(jù)按照維度整理、錄入,然后進行建模;不規(guī)范的數(shù)據(jù),必須得自己先通過一些定性的處理,讓它變得規(guī)范,然后再用工具進行分析;封閉性的問題,設置選項歸類即可。開放性的問題,建議還是先錄下來,然后再頭腦風暴整理出有用的東西;定性的,焦點訪談和深訪,都可以錄音,在事后可以形成訪談記錄;焦點訪談的過程中,可以以卡片的形式或者其他的形式讓用戶做選擇題,可以獲取少量的有數(shù)據(jù)性的東西,其他的更多的是觀點、方向性的,這個需要在整理訪談記錄的時候根據(jù)問題來歸納整理;深度訪談的數(shù)據(jù)整理,建立很多個用戶模型,強行量化這些數(shù)據(jù)。這個方法比較有效,特別在做人群研究的時候。四、如何書寫市場調(diào)研報告?對整理后的數(shù)據(jù),我們最終需要形成書面的市場調(diào)研文檔報告,對市場調(diào)研的數(shù)據(jù)分析后進行的說明總結,用圖表或圖形的形式最直觀呈現(xiàn);分析用戶當前現(xiàn)狀,用戶對產(chǎn)品的需求點;報告的組成有研究背景、研究目的、研究方法、研究結論等相關內(nèi)容;根據(jù)調(diào)研的時候的思路,將報告逐一完善,將數(shù)據(jù)分析的結論圖表化,得出自己的結論總結出趨勢和規(guī)律。五、數(shù)據(jù)分析的方式方法有哪些?1、數(shù)據(jù)分析需要掌握數(shù)據(jù)統(tǒng)計軟件和數(shù)據(jù)分析工具;2、數(shù)據(jù)分析的主要方法有:1對比分析法將兩個或兩個以上的數(shù)據(jù)進行對比分析,分析其中的差異,從而揭示這些事物發(fā)展變化的規(guī)律和情況。對比分為橫向?qū)Ρ群涂v向?qū)Ρ取?結構分析法被分析研究總體內(nèi)各部分與總體之間進行對比分析的方法,即總體內(nèi)各部分所占的指標。3交叉分析法同時將兩個有一定聯(lián)系的變量及其值交叉排列在一張表內(nèi),使各變量值成為不同變量的交叉點,一般采用二維交叉表進行分析。4分組分析法按照數(shù)據(jù)特征,將數(shù)據(jù)進行分組進行分析的方法。除了以上的4點,其他還有比如漏斗圖分析法、杜邦分析法、矩陣關聯(lián)分析法等等。數(shù)據(jù)分析的方法有很多種,在進行數(shù)據(jù)分析的時候,選擇有效的數(shù)據(jù)分析方法,能達到事半功倍的效果。六、數(shù)據(jù)分析報告如何指導產(chǎn)品經(jīng)理進行產(chǎn)品設計?根據(jù)調(diào)研結論確定產(chǎn)品核心功能。把數(shù)據(jù)分析的結果加入到整個迭代設計的過程中加速產(chǎn)品的迭代更新。評估解決方案的可行性,根據(jù)實施的結果再去評估解決方案是否真的可行?是否還需要再改進,依此類推。通過數(shù)據(jù)進行分析,得出用戶的行為規(guī)律,為產(chǎn)品提供支撐。日常的運營分析,及時發(fā)現(xiàn)產(chǎn)品問題。產(chǎn)品后期設定一系列的運營指標進行運營監(jiān)控,然后反饋產(chǎn)品迭代(指標主要包括:①、用戶的反饋、②、產(chǎn)品的BUG、③、市場的反映、④、產(chǎn)品未來的發(fā)展方向、⑤、點擊率、留存率等等。講師介紹從修理工、服務顧問做起,從業(yè)經(jīng)驗17年先后出版發(fā)表如下書籍和文章:《汽車維修企業(yè)質(zhì)量管理》、《客戶關系管理》、《如何建立企業(yè)文化》、《汽車維修企業(yè)人力資源管理》、《ISO9000在汽車維修企業(yè)中的重要性》、《汽車銷售》、《汽車維修技術》等先后培訓策劃企業(yè):豐田、慶鈴、金龍、雷諾、上海強生、鈴木、奧迪、上海通用、中華轎車、大眾、日產(chǎn)、奔馳、寶馬、馬自達、克萊斯勒、江淮瑞風、三菱、BOSCH、3M、YELLOWHAT、JEEP、柳汽風行、哈飛、吉利汽車、段海峰上汽商務車等,參訓人員近8000人。主要培訓主題:客戶服務流程、生產(chǎn)工位管理、生產(chǎn)安全規(guī)范管理、客戶關系管理、專業(yè)銷售管理、人力資源管理、團隊建設、創(chuàng)建學習型組織、備件管理等。課程說明課程名稱:《經(jīng)營數(shù)據(jù)分析&經(jīng)營規(guī)劃制定方法》課程目的:–通過培訓:?掌握企業(yè)經(jīng)營分析方法?掌握企業(yè)常用KPI指標?掌握企業(yè)計劃的制定方法和驗證目標的可行性?掌握企業(yè)服務營銷策略提升的方法授課形式:課堂宣講+案例分析+小組討論+經(jīng)驗交流課程目錄?經(jīng)營管理與KPI考核?目標管理與年度計劃制定?計劃的執(zhí)行與完成66企業(yè)的困惑動力協(xié)調(diào)效率持續(xù)改革接班制度信息化落實對比人員流失經(jīng)營分析7經(jīng)營管理的目的1樹立標準化的運營管理機制,體現(xiàn)品牌的管理效益2使企業(yè)致力于提升運營水平,贏得客戶滿意3為企業(yè)帶來更大的利潤,維持企業(yè)的成長發(fā)展若每天只關注車間維修及業(yè)務,則將突顯哪些管理上的問題?8服務盈利模式分析盈虧平衡分析金額盈利收入虧損成本費用Q(損益平衡點)9數(shù)量服務盈利模式分析維修工時收入開源+備件銷售收入盈利+非主營收入節(jié)流-成本10課程目錄?經(jīng)營管理與KPI考核?目標管理與年度計劃制定?計劃的執(zhí)行與完成1111企業(yè)常用KPI指標KPI全稱KeyPerformanceIndication,即關鍵業(yè)績指標,是通過對組織內(nèi)部某一流程的輸入端、輸出端的關鍵參數(shù)進行設置、取樣、計算、分析,衡量流程績效的一種目標式量化管理指標,是把企業(yè)的戰(zhàn)略目標分解為可運作的遠景目標的工具,是企業(yè)績效管理系統(tǒng)的基礎。KPI-企業(yè)管理的金鑰匙12企業(yè)常用KPI指標費用吸收率產(chǎn)能利用率客戶回站率客戶分類分析客戶關系收入分析基盤客戶回站率客單價工時效率流失率收入構成比進站臺次占有率服務收入占有率備件收入占有率A類:總指標B類:四個管理指標總經(jīng)理“管”的指標C類:九個經(jīng)營分析指標服務執(zhí)行——首保達成率、準時交車率、PDI執(zhí)行率服務效率——人均工位數(shù)、工時效率、維修產(chǎn)值料工比、服務顧問人均接車臺次、單工位效益、D類:提升生產(chǎn)工人維修單數(shù)、生產(chǎn)性工人人均銷售額、服務接車/維修峰值工位周轉(zhuǎn)率類指標備件管理——備件滿足率、備件周轉(zhuǎn)呆滯庫存、備件毛利率保修管理——保修合格率技術管理——返修率、一次修復率13服務經(jīng)理“用”的指標企業(yè)常用KPI指標經(jīng)營類管理類營業(yè)收入毛利率人均產(chǎn)值……工位周轉(zhuǎn)次數(shù)SA月均臺次配件毛利率配件周轉(zhuǎn)率配件滿足率工時占比……14企業(yè)經(jīng)營數(shù)據(jù)分析營業(yè)收入40000030000020000014243510000001月2月3月4月5月6月7月8月9月010月011月012月394949349457302713245686250211297141323089287828營業(yè)收入=進廠臺次×客單價151000002000003000004000005000001月2月3月4月5月6月7月8月9月10月11月12月機電、鈑噴收入分析表281131109937226357175146190485696002849652056491938532004006001月2月3月4月5月6月7月8月9月10月11月12月機電、鈑噴進廠臺次分析41221835034037844845140640100019人均產(chǎn)值=營業(yè)收入/全體員工數(shù)量2月3月4月5月6月7月8月9月10月11月12月人均產(chǎn)值1234249129765819083409585120501042292850000.001月2月3月4月5月6月7月8月9月10月11月12月月度毛利率0.640.630.680.630.620.650.610.700.66討論:通過上述圖表,該企業(yè)可能存在什么問題?20040060080010001月2月3月4月5月6月7月8月9月10月11月12月機電客單價682504647515504155632507483000機電客單價=機電營業(yè)收入/機電臺次鈑噴客單價=鈑噴營業(yè)收入/鈑噴臺次1月2月3月4月5月6月7月8月9月10月11月12月鈑噴客單價19508091269214982240114032241785000討論:機電和鈑噴客單價多少合理?客單價高是好事嗎?如何提高客單價?0.002月3月4月5月6月7月8月9月10月11月12月機電工時占比0.640.320.350.330.260.310.33SA月人均臺次=月車輛進廠數(shù)量/SA數(shù)量601202102403001月2月3月4月5月6月7月8月9月10月11月12月SA人均臺次199120177184185182205192186000機電工位周轉(zhuǎn)=月維修車輛總臺次÷(月工作日數(shù)×維修工位數(shù)×100%0.001.002.003.004.005.001月2月3月4月5月6月7月8月9月10月11月12月機電工位周轉(zhuǎn)2.221.251.881.892.032.492.422.182.23工位周轉(zhuǎn)=月維修車輛總臺次÷(月工作日數(shù)×維修工位數(shù)×100%0.000.100.200.301月2月3月4月5月6月7月8月9月10月11月12月鈑噴工位周轉(zhuǎn)0.200.110.140.130.130.030.080.110.18討論:機電和鈑噴工位周轉(zhuǎn)多少合理?工位周轉(zhuǎn)只是跟與員工的工作效率有關嗎?如何提高工位周轉(zhuǎn)?0.002月3月4月5月6月7月8月9月10月11月12月配件毛利率0.220.330.070.300.260.260.340.290.25庫存周轉(zhuǎn)率=月度出庫配件成本÷(期初庫存+期末庫存÷2×100%庫存滿足率=實際提供的物料數(shù)量/全部需求的物料總量0.000.100.200.301月2月3月4月5月6月7月8月9月10月11月12月庫存周轉(zhuǎn)率0.130.070.120.100.120.090.120.110.130.00企業(yè)經(jīng)營數(shù)據(jù)分析討論:如何提高配件周轉(zhuǎn)率和配件滿足?呆滯庫存如何處理?笛威好參謀課程目錄?經(jīng)營管理與KPI考核?目標管理與年度計劃制定?計劃的執(zhí)行與完成目標管理管理周期:為了達成目標,在做出決定之前,要對每條在決策過程中加以利用的信息進行精確監(jiān)控及充分考慮,一旦決定了一個行動過程并開始執(zhí)行,其結果必須要的改變。這個“計劃-執(zhí)行-檢驗-行動”的過程被稱作管理周期經(jīng)營目標的設定售后服務經(jīng)營目標值(售后服務營收、售后服務利潤、客戶滿意度)年度目標(服務、配件)我們?nèi)粘S心男╆P鍵的KPI需要進行日、周、月、季的分解?36經(jīng)營目標的設定項目經(jīng)營收入(元)維修臺次(臺)工時收入(元)配件收入(元)配件毛利(元)總體毛利(元)機電收入(元)機電臺次(臺)鈑噴收入(元)鈑噴臺次(臺)371月2月3月4月5月6月7月8月9月10月11月12月合計平均經(jīng)營目標的設定項目天數(shù)(天)經(jīng)營收入(元)維修臺次(臺)工時收入(元)配件收入(元)配件毛利(元)總體毛利(元)機電收入(元)機電臺次(臺)鈑噴收入(元)鈑噴臺次(臺)38第一周第二周第三周第四周第五周合計經(jīng)營目標設定的參考要素外部經(jīng)營環(huán)境分析內(nèi)部經(jīng)營環(huán)境分析企業(yè)歷史數(shù)據(jù)分析?上年度營業(yè)數(shù)據(jù)?本年度企業(yè)計劃及執(zhí)行情況?客戶保有量分析?上年度維修臺次及結構?平均客單價?維修保養(yǎng)毛利率?配件銷售收入及毛利率?客戶平均接觸率?客戶平均流失率?服務站成本構成39經(jīng)營目標的設定小組討論并現(xiàn)場制作2021年度營業(yè)計劃:1、設定你企業(yè)的全年經(jīng)營目標(年度營業(yè)收入);2、把年度經(jīng)營目標(營業(yè)收入)分解到每個月;3、設定總的工時占比,計算工時收入和配件收入;4、設定配件毛利率,計算毛利。5、設定機電和鈑噴營業(yè)收入比例,計算機電收入和鈑噴收入;6、設定機電客單價和鈑噴客單價,計算進廠臺次。40注意:?機電客單價、鈑噴客單價;?機電工位周轉(zhuǎn)、鈑噴工位周轉(zhuǎn);?配件毛利率;?人均產(chǎn)值;?SA接待能力……服務/配件KPI與目標績效監(jiān)控績效監(jiān)控經(jīng)營目標(服務/配件KPI指標告示公布績效情況相應改善對策營業(yè)額、利潤、滿意度分日、周、月進行目標績效比較月度目標與績效比較告知員工部門監(jiān)控KPI,尋求相應改善對策經(jīng)營目標屬于量化值,各個KPI有助于經(jīng)營目標的實現(xiàn)。部門主管應為各道工序的每位員工設立目標,并定期審查,及時處理解決。設定KPI目標并制定活動計劃課程目錄?經(jīng)營管理與KPI考核?目標管理與年度計劃制定?計劃的執(zhí)行與完成?2021年員工工資要增加嗎??2021年房租漲了嗎??2021年其他的運營成本會增加嗎?2021年2021年2021年營業(yè)收入=進廠臺次×客單價競爭的關注點20002、價格1、產(chǎn)品服務質(zhì)量/保障3、溝通4、促銷5、服務/環(huán)境客戶滿意6、增值服務服務營銷策略常規(guī)性策略:-專業(yè)的維修服務-常規(guī)性診斷-常規(guī)性維修質(zhì)量保證-制造廠維修手冊的資料溝通-結算及時準確-產(chǎn)品質(zhì)量過關-專業(yè)的接待態(tài)度-熱情有禮貌,適當?shù)膬x容儀表差異性策略:-專業(yè)的維修服務-專家現(xiàn)場診斷-使用專業(yè)診斷儀器來演示問題所在-超長時間質(zhì)量保證承諾-提供信用卡刷卡服務-有選擇性產(chǎn)品聯(lián)盟合作法提供更好的保障和保證-專業(yè)的接待態(tài)度-分工種統(tǒng)一著裝-行動干脆利落-態(tài)度真誠謙遜1、產(chǎn)品/服務的質(zhì)量和保障服務營銷策略第二十章數(shù)據(jù)分析一、主要內(nèi)容平均數(shù)、中位數(shù)、眾數(shù)比較1、聯(lián)系:平均數(shù)、中位數(shù)和眾數(shù)都可以作為一組數(shù)據(jù)的代表,是描述一組數(shù)據(jù)集中趨勢的量,平均數(shù)是應用較多的一種量。實際問題中求得的平均數(shù)、眾數(shù)、中位數(shù)應帶上相應的單位。2、區(qū)別:①平均數(shù)計算要用到所有數(shù)據(jù),它能充分利用所有的數(shù)據(jù)信息,任何一個數(shù)據(jù)的變動都會相應引起平均數(shù)的變動,并且它受極端值的影響較大;②中位數(shù)僅與數(shù)據(jù)的排列位置有關,某些數(shù)據(jù)的移動對中位數(shù)沒有影響,中位數(shù)可能出現(xiàn)在所給數(shù)據(jù)中也可能不在所給的數(shù)據(jù)中,當一組數(shù)據(jù)中的個別數(shù)據(jù)變動較大時,可用中位數(shù)描述其趨勢;③眾數(shù)是當一組數(shù)據(jù)中某一數(shù)據(jù)重復出現(xiàn)較多時,人們往往關心的一個量,眾數(shù)不受極端值的影響,它是它的一個優(yōu)勢?!飿O差:一組數(shù)據(jù)中最大數(shù)據(jù)與最小數(shù)據(jù)的差。極差是最簡單的一種度量數(shù)據(jù)波動情況的量,但只能反映數(shù)據(jù)的波動范圍,不能衡量每個數(shù)據(jù)的變化情況,而且受極端值的影響較大.※各數(shù)據(jù)與平均數(shù)的差的平方的平均數(shù)叫做這批數(shù)據(jù)的方差。公式為:方差越小,波動越小。方差越大,波動越大。知識網(wǎng)絡:數(shù)據(jù)的代表數(shù)據(jù)的代表數(shù)據(jù)的波動平均數(shù)中位數(shù)眾數(shù)極差方差用樣本估計總體用樣本平均數(shù)估計總體平均數(shù)用樣本方差估計總體方差二、例題詳解1.某同學進行社會調(diào)查,隨機抽查某地區(qū)20個家庭的收入情況,并繪制了統(tǒng)計圖請根據(jù)統(tǒng)計圖給出的信息回答:填寫下表年收入(萬元)0.60.91.01.11.21.31.49.7家庭戶數(shù)

這20個家庭的年平均收入為_______萬元。(2).數(shù)據(jù)中的中位數(shù)是_______萬元,眾數(shù)是_______萬元。2、某公司招聘職員,對甲、乙兩位候選人進行了面試和筆試,面試包括形體和口才,筆試中包括專業(yè)水平和創(chuàng)新能力考察,他們的成績(百分制)如下表候選人面試筆試形體口才專業(yè)水平創(chuàng)新能力甲86909692乙92889593(1)若公司根據(jù)經(jīng)營性質(zhì)和崗位要求認為:形體、口才、專業(yè)水平、創(chuàng)新能力按照5:5:4:6的比確定,請計算甲、乙兩人各自的平均成績,看看誰將被錄???解:(1)∴乙將被錄取。(2)若公司根據(jù)經(jīng)營性質(zhì)和崗位要求認為:面試成績中形體占5%,口才占30%,筆試成績中專業(yè)水平點35%,創(chuàng)新能力點30%,那么你認為該公司會錄取誰?解:(2)∴甲將被錄取。(1)(2)的結果不一樣說明了什么?在加權平均數(shù)中,由于權的不同,導致了結果的相異3.當今,青少年視力水平下降已引起社會的關注,為了了解某校3000名學生的視力情況,從中抽取了一部分學生進行了一次抽樣調(diào)查,利用所得的數(shù)據(jù)繪制的直方圖(長方形的高表示該組人數(shù))如下:(1)本次抽樣抽查共抽測了多少名學生?(2)參加抽測的學生的視力的眾數(shù)在什么范圍內(nèi)?(3)若視力為4.9,5.0,5.1及以上為正常,試估計該校視力正常的人數(shù)約為多少?x(x(視力)3.95y(人數(shù))4.254.554.855.155.45解:(1)30+50+40+20+10=150(人)(2)4.25~4.55(3)4.某農(nóng)民幾年前承包了甲、乙兩片荒山,各栽種了100棵蜜橘,成活98%?,F(xiàn)已掛果,經(jīng)濟效益初步顯現(xiàn),為了分析經(jīng)營情況,他從甲山隨意采摘了3棵樹上的蜜橘,稱得質(zhì)量分別為25,18,20千克;他從乙山上采摘了4棵樹上的蜜橘,稱得質(zhì)量分別是21,24,19,20千克,組成一個樣本,問:(1)樣本容量是多少?(2)樣本平均數(shù)是多少?并估算出甲、乙兩山蜜橘的總產(chǎn)量?(3)甲、乙兩山哪個山上蜜橘長勢較整齊?解(1)樣本容量為3+4=7;(2)總產(chǎn)量為:21×200×98%=4116(千克)(3)所以乙山上橘子長勢比較整齊。5、在一次數(shù)學測驗中,八年級(1)班兩個組的12名學生的成績?nèi)缦拢▎挝唬悍郑┮唤M:1099783946572879659857884二組:9881587495100617380945796試對這兩個小組的數(shù)學考試成績作出比較和分析。解:一組的平均分x=84.08分,中位數(shù)為84.5分,方差S2=184.58;二組的平均分x=80.58分,中位數(shù)為77分,方差S2=238.08;因此,從平均分可看出一組整體成績較好;從中位數(shù)可以看出一組整體成績靠前;從方差可以看出一組同學成績差距不大,因而一組學生成績各方面都較好。6、在某旅游景區(qū)上山的一條小路上,有一些斷斷續(xù)續(xù)的臺階,如圖所示,是其中的甲、乙臺階的示意圖,請你用學過的統(tǒng)計知識回答下列問題:15151616141415151118171019甲路段乙路段(1)兩段臺階路有哪些相同點和不同點?解:相同點:兩段臺階的平均高度相同;不同點:兩段臺階的中位數(shù)、方差和極差不同。(2)哪段臺階路走起來更舒服?為什么?解:甲臺階走起來更舒服些,因為它的臺階高度的方差小。(3)為方便游客行走,需要重新整修上山的小路,對于這兩段臺階,在臺階數(shù)不變的情況下,請你提出合理的整修建議。解:使每個臺階的高度均為15cm,使得方差為0。三、牛刀小試第一類考題:在“一列數(shù)據(jù)”中求1.(09臺州)數(shù)據(jù)1,2,2,3,5的眾數(shù)是。2.(09杭州)數(shù)據(jù)23,22,25,23,27,25,23中的中位數(shù)是,方差是(精確到0.1)。3.(09重慶)數(shù)據(jù)2,-1,3,5,6,5中眾數(shù)和極差分別是()A.5和7B.6和7C.4.(09湖州)某商場用加權平均數(shù)來確定什錦糖的單價。由單價為15元/千克的甲種糖果10千克,單價為12元/千克的乙種糖果20千克,單價為10元/千克的丙種糖果30千克混合而成的什錦糖果的單價應定為()A.11元/千克B.11.5元/千克C.12元/千克D.12.5元/千克第二類考題:在“統(tǒng)計表”中求1.(09黃岡)為了比較市場上甲、乙兩種電子鐘每日走時誤差的情況,從這兩種電子鐘中,各隨機抽取10臺進行測試,兩種電子鐘走時誤差的數(shù)據(jù)如下:編號類型一二三四五六七八九十甲1-3-442-22-1-12乙4-3-12-21-22-21(1)計算甲、乙兩種電子鐘走時誤差的平均數(shù);(2)技術甲、乙兩種電子鐘走時誤差的方差;(3)根據(jù)經(jīng)驗,走時穩(wěn)定性較好的電子鐘質(zhì)量更優(yōu),若兩種類型的電子鐘價格相同,請問:你買哪種電子鐘?為什么?2.(09成都)為了解某小區(qū)居民的日用電量情況,居住在該小區(qū)的一名同學隨機抽查了15戶家庭的日用電量,結果如下表:日用電量(度)567810戶數(shù)25431則關于這15戶家庭的日用電量,下列說法錯誤的是()A.眾數(shù)為6度B.平均數(shù)為6.8度C.極差為5度D.中位數(shù)為6度補充:若這個小區(qū)共有900戶家庭,則該小區(qū)的日用電量大約度。3.(09河北)在一周內(nèi),小明堅持每天3次自測體溫,測量結果如下表:體溫(℃)36.136.136.336.436.536.636.7次數(shù)2346312則這些體溫的中位數(shù)是℃。第三類考題:在“統(tǒng)計圖”中求1.(08天津)下圖是交警在一個路口統(tǒng)計的某個時段來往車輛的車速情況(單位:千米/小時)。請分別計算這些車輛行駛速度的平均數(shù)、中位數(shù)、眾數(shù)(精確到0.1)。2.(08沈陽)在學校組織的“喜迎奧運、知榮明恥、文明出行”的知識競賽中,每班參加比賽的人數(shù)相同,成績分為A、B、C、D四等,其中相應的得分分別記為100分、90分、80分、70分,現(xiàn)將一班、二班的成績整理成統(tǒng)計圖:一班競賽成績統(tǒng)計圖二班競賽成績統(tǒng)計圖請你根據(jù)以上提供的信息解決下列問題:(1)此次競賽中二班成績在C級以上(包括C級)的人數(shù)為;(2)請將表格填充完整:平均數(shù)(分)中位數(shù)(分)眾數(shù)(分)一班87.690二班87.6100(3)請從下列不同角度對這次競賽成績的結果進行分析:①從平均數(shù)和中位數(shù)角度來比較兩班的成績;②從平均數(shù)和眾數(shù)角度來比較兩班的成績;③從B級以上(包括B級)的人數(shù)來比較兩班的成績;3.(08云南)倉洱中學九年級進行了五次體育模擬測試,甲同學的測試成績?nèi)绫?,乙同學的測試成績?nèi)缯劬€圖所示:次數(shù)一二三四五分數(shù)4647484950(1)根據(jù)甲、乙兩位同學五次體育模擬測試的成績填寫下表:中位數(shù)平均數(shù)方差甲482乙48(2)甲、乙兩位同學在五次體育模擬測試中,誰的成績較為穩(wěn)定?4.(09麗水)如圖,是若干名學生1分鐘跳繩次數(shù)的頻數(shù)分布直方圖,請解答:(1)共人參加跳繩,最后一組頻率是;(2)小麗按以下方法估算跳繩次數(shù)的平均數(shù):(135+145+155+165+175)÷5=155,請問小麗的方法是否正確?若不正確,請寫出正確算式;(3)若跳繩次數(shù)的中位數(shù)是160次,則至少有多少人的次數(shù)等于160次?◆考點3.綜合類問題1.(09義烏)2021年5月,義烏市各學校舉行“班班有歌聲”活動,某校聘請了10位老師和10位學生擔任比賽評委,某班得分情況見圖(表)。(1)補全頻數(shù)分布直方圖,并標上相應的頻數(shù);(2)學生評委記分的中位數(shù)是分;(3)計分辦法規(guī)定:老師、學生評委的計分各去掉一個最高分和一個最低分,分別計算平均分,并且按老師、學生各占60%、40%的方法計算最后得分。已知某班最后得分為94.4分,求統(tǒng)計表中x的值。老師評委計分統(tǒng)計表評委序號12345678910計分94969391x9291989693學生評委計分折線統(tǒng)計圖師生評委計分頻數(shù)分布直方圖2.(09山東)某中學對全校學生60秒跳繩次數(shù)進行統(tǒng)計,全校平均次數(shù)是100次。某班體育委員統(tǒng)計了全班50名學生60秒跳繩的成績,列出頻數(shù)分布直方圖:(1)該班60秒跳繩的平均次數(shù)至少是多少?是否超過全校平均水平?(2)該班一個學生說:“我的跳繩成績在我班是中位數(shù)”,請你給出該生跳繩成績的所在范圍。3.(09山西)根據(jù)山西省統(tǒng)計信息網(wǎng)公布的數(shù)據(jù),繪制了山西省2004—2021固定和移動年末用戶條形統(tǒng)計圖如下:(1)填空:2004—2021年移動年末用戶的極差是萬戶,固定年末用戶的中位數(shù)是萬戶;(2)你還能從圖中獲取哪些信息?請寫出兩條。4.(09衡陽)甲、乙兩人在相同條件下各射靶5次,成績?nèi)鐖D:甲乙(1)請你根據(jù)圖中數(shù)據(jù)填寫下表:姓名平均數(shù)中位數(shù)眾數(shù)方差甲6乙6環(huán)2.8(2)從平均數(shù)和方差相結合看,分析誰的成績好一些?5.(09)為迎接國慶60周年,某校舉行“祖國成長我成長”為主題的圖片制作比賽,賽后整理參賽同學的成績,并制作成圖表如下:分數(shù)段頻數(shù)頻率60≤x<70300.1570≤x<80m0.4580≤x<9060n90≤x<100200.1(1)表中m=,n=;(2)補全頻數(shù)分布直方圖;(3)比賽成績的中位數(shù)落在哪個分數(shù)段?(4)若比賽成績80以上(含80分)可以獲獎,則獲獎率是多少?6.(09烏魯木齊)某中學組織全校4000名學生進行了民族團結知識競賽,為了解本次知識競賽的成績分布情況,從中抽取了部分學生的成績,并繪制了頻數(shù)分布表和頻數(shù)分別直方圖。分組頻數(shù)頻率50.5~60.50.0560.5~70.570.5~80.58080.5~90.50.2690.5~100.51480.37合計1請根據(jù)以上提供的信息,解答下列問題:(1)補全頻數(shù)分布表;(2)補全頻數(shù)分布直方圖;(3)上述學生成績的中位數(shù)落在哪一組范圍內(nèi)?(4)學校將對成績在90.5~100.5分之間的學生進行獎勵,請估計全校4000名學生中約有多少名獲獎?7.(09青海)美國NBA職業(yè)籃球賽的火箭隊和湖人隊在本賽季已進行了5場比賽,將比賽成績進行統(tǒng)計后,繪制成統(tǒng)計圖,請回答以下問題:火箭隊、湖人隊比賽成績條形圖(1)請在右上圖中畫出折線表示兩隊這5場比賽成績的變化情況;(2)已知火箭隊5場比賽的平均得分為90分,求湖人隊5場比賽的平均得分;(3)分別求兩隊成績的極差;(4)從平均得分、折線走勢、獲勝場次、極差四個方面進行分析,預測下一場哪隊更有可能取得好成績?8.(09呼和浩特)某商場服裝部為了調(diào)動營業(yè)員積極性,決定實行目標管理,即確定一個月銷售目標,根據(jù)目標完成情況對營業(yè)員進行適當獎懲。為了確定一個適當目標,商場統(tǒng)計了每個營業(yè)員在某月的銷售額,整理得到統(tǒng)計圖:(1)月銷售額在哪個值的人數(shù)最多?中間的月銷售額是多少?平均的月銷售額是多少?(2)如果想讓一半左右的營業(yè)員都能達到目標,你認為月銷售額定為多少合適?摘要:本文簡述了數(shù)據(jù)挖掘技術的基本概念、產(chǎn)生和發(fā)展的基礎以及在現(xiàn)實生活中所發(fā)揮的巨大作用。同時還就數(shù)據(jù)挖掘技術在全國廣播監(jiān)測網(wǎng)的應用做了初步的探索和嘗試。關鍵詞:數(shù)據(jù)挖掘廣播電視監(jiān)測決策支持0引言隨著廣播電視監(jiān)測網(wǎng)建設規(guī)模的不斷擴大和運行時間的不斷增加,廣播電視監(jiān)測網(wǎng)數(shù)據(jù)庫積累的各種監(jiān)測數(shù)據(jù)也越來越多。激增的數(shù)據(jù)背后隱藏著許多重要的知識和信息,而目前的數(shù)據(jù)庫系統(tǒng)可以高效地實現(xiàn)數(shù)據(jù)的錄入、查詢、統(tǒng)計等功能,但無法發(fā)現(xiàn)數(shù)據(jù)中存在的關系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預測未來的發(fā)展趨勢。如何運用數(shù)據(jù)挖掘這一新興技術從大量的監(jiān)測數(shù)據(jù)中發(fā)現(xiàn)有意義和有價值的知識,并根據(jù)這些知識來指導我們?nèi)粘5谋O(jiān)測工作和維護工作,使我們的工作更有效率,成為廣播電視監(jiān)測領域里一個值得探索和研究的課題。1數(shù)據(jù)挖掘技術簡介1.1數(shù)據(jù)挖掘技術的基本概念數(shù)據(jù)挖掘(DataMining就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。這個定義包括好幾層含義:數(shù)據(jù)源必須是真實的、大量的、含噪聲的;發(fā)現(xiàn)的是用戶感興趣的知識;發(fā)現(xiàn)的知識要能夠易于被用戶理解,最好能用自然語言表達;并不要求發(fā)現(xiàn)放應用探索◎楊京國家廣電總局監(jiān)測數(shù)據(jù)處理中心之四海皆準的知識,換句話說發(fā)現(xiàn)的知識都是相對的,是有特定前提和約束條件,面向特定領域的。下面再簡單解釋一下知識的基本概念。從廣義上理解,數(shù)據(jù)、信息也是知識的表現(xiàn)形式,但是人們更把概念、規(guī)則、模式、規(guī)律和約束等看作知識。人們把數(shù)據(jù)看作是形成知識的源泉。而原始數(shù)據(jù)可以是結構化的,如關系數(shù)據(jù)庫中的數(shù)據(jù);也可以是半結構化的,如文本、圖形和圖像數(shù)據(jù);甚至是分布在網(wǎng)絡上的異構型數(shù)據(jù)。發(fā)現(xiàn)知識的方法可以是數(shù)學的,也可以是非數(shù)學的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)的知識可以被用于決策支持和過程控制等。因此,數(shù)據(jù)挖掘是一門交叉學科,它把人們對數(shù)據(jù)的應用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。數(shù)據(jù)挖掘所發(fā)現(xiàn)的知識最常見的有以下四類:1.廣義知識(Generalization:廣義知識指類別特征的概括性描述知識。根據(jù)數(shù)據(jù)的微觀特性發(fā)現(xiàn)其表征的、帶有普遍性的、較高層次概念的、中觀和宏觀的知識,反映同類事物共同性質(zhì),是對數(shù)據(jù)的概括、精煉和抽象。關聯(lián)知識(Association:它反映一個事件和其他事件之間依賴或關聯(lián)的知識。如果兩項或多項屬性之間存在關聯(lián),那么其中一項的屬性值就可以依據(jù)其他屬性值進行預測。2.分類知識(Classification&Clustering:它反映同類事物共同性質(zhì)的特征型知識和不同事物之間的差異型特征知識。最為典型的分類方法是基于決策樹的分類方法。3.預測型知識(Prediction:根據(jù)時間序列型數(shù)據(jù),由歷史的和當前的數(shù)據(jù)去推測未來的數(shù)據(jù),也可以認為是以時間為關鍵屬性的關聯(lián)知識。時間序列預測方法有經(jīng)典的統(tǒng)計方法、神經(jīng)網(wǎng)絡和機器學習等。4.偏差型知識(Deviation:此外,數(shù)據(jù)挖掘還可以發(fā)現(xiàn)其他類型的知識,如偏差型知識,它是對差異和極端特例的描述,揭示事物偏離常規(guī)的異?,F(xiàn)象,如標準類外的特例,數(shù)據(jù)聚類外的離群值等。1.2數(shù)據(jù)挖掘技術的基礎數(shù)據(jù)挖掘技術的三大基礎技術包括計算機硬件技術、大規(guī)模數(shù)據(jù)庫技術和數(shù)據(jù)挖掘算法。在過去數(shù)十年里,計算機硬件技術得到了迅猛的發(fā)展,包括單個CPU的處理能力大幅提升、內(nèi)存和磁盤存儲器價格的顯著降低、支持多個CPU的并行處理結構的巨大進步等。大型關系型數(shù)據(jù)庫及數(shù)據(jù)庫管理系統(tǒng)在各行各業(yè)的廣泛應用、最近10年來數(shù)據(jù)挖掘算法的不斷發(fā)展、成熟和穩(wěn)定。數(shù)據(jù)挖掘是利用了人工智能和統(tǒng)計分析這兩種技術致力于模式發(fā)現(xiàn)和預測。數(shù)據(jù)挖掘不是為了替代傳統(tǒng)的統(tǒng)計分析技術。相反,它是統(tǒng)計分析技術的延伸和擴展。大多數(shù)的統(tǒng)計分析技術都基于完善的數(shù)學理論和高超的技巧,預測的準確度還是令人滿意的,但對使用者的要求很高。而隨著計算機計算能力的不斷增強,我們有可能利用計算機強大的計算能力只通過相對簡單和固定的方法完成同樣的功能。一些新興的技術同樣在知識發(fā)現(xiàn)領域取得了很好的效果,如神經(jīng)元網(wǎng)絡和決策樹,在足夠多的數(shù)據(jù)和計算能力下,它們幾乎不用人的關照自動就能完成許多有價值的功能。數(shù)據(jù)挖掘就是利用了統(tǒng)計和人工智能技術的應用程序,它把這些高深復雜的技術封裝起來,使人們不用自己掌握這些技術也能完成同樣的功能,并且更專注于自己所要解決的問題。1.3數(shù)據(jù)挖掘和數(shù)據(jù)倉庫之間的關系數(shù)據(jù)挖掘與數(shù)據(jù)倉庫的發(fā)展有著密切的關系。數(shù)據(jù)倉庫的發(fā)展是促進數(shù)據(jù)挖掘越來越熱的原因之一。但是,數(shù)據(jù)倉庫并不是數(shù)據(jù)挖掘的先決條件,因為有很多數(shù)據(jù)挖掘可直接從操作數(shù)據(jù)源中挖掘信息。大部分情況下,數(shù)據(jù)挖掘都要先把數(shù)據(jù)從數(shù)據(jù)倉庫中拿到數(shù)據(jù)挖掘庫或數(shù)據(jù)集市中。從數(shù)據(jù)倉庫中直接得到進行數(shù)據(jù)挖掘的數(shù)據(jù)有許多好處。數(shù)據(jù)倉庫的數(shù)據(jù)清理和數(shù)據(jù)挖掘的數(shù)據(jù)清理差不多,如果數(shù)據(jù)在導入數(shù)據(jù)倉庫時已經(jīng)清理過,那很可能在做數(shù)據(jù)挖掘時就沒必要再清理一次了,而且所有的數(shù)據(jù)不一致的問題都已經(jīng)被你解決了(圖1。數(shù)據(jù)挖掘庫可能是你的數(shù)據(jù)倉庫的一個邏輯上的子集,而不一定非得是物理上單獨的數(shù)據(jù)庫。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論