




已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
手機用戶的異網(wǎng)高端識別模型摘要我們首先利用軟件對用戶資料表中的數(shù)據(jù)進行了分析,發(fā)現(xiàn)了數(shù)據(jù)中的一些聯(lián)系,但由于數(shù)據(jù)量太大,最終我們決定用隨機抽樣分析的方法來挑選數(shù)據(jù)。最后用型聚類分析和單因子分析的方法來解決問題。對于問題一:首先,我們運用SPSS對附表一中所有數(shù)據(jù)進行了綜合處理,得出其各項指標的平均水平,如月消費情況等等。之后,考慮到數(shù)據(jù)量過大,我們選擇通過多次不放回抽樣的方法來進行數(shù)據(jù)的其他收集工作。我們選用套餐資費,月均消費額,通話費三項作為主要指標,然后采用型聚類分析利用SPSS直接聚成了三類,選出了屬于高端用戶的那一類進行分析,列出了具體判別準則,但由于過于模糊,我們又將主要的指標客觀賦權,將定性指標定量化。最終給出了本網(wǎng)高端用戶的判別準則,然后我們根據(jù)上網(wǎng)查找資料和自己的理解給出了本網(wǎng)的營銷優(yōu)先級,即1、提高通話質量的前提下適當降低資費,2、對老客戶給予更多的優(yōu)惠活動,3、采用更優(yōu)惠的分層套餐結構,讓客戶真正體驗到實惠等等。對于問題二:首先我們通過對本網(wǎng)用戶的月消費信息進行了分析,在假設本網(wǎng)與異網(wǎng)月消費額相當?shù)那闆r下得到了異網(wǎng)用戶的月均消費金額。然后我們通過對模型一得出的本網(wǎng)高端用戶的數(shù)據(jù)進行綜合分析,利用單因子分析的方法,統(tǒng)計出異網(wǎng)聯(lián)通用戶與本網(wǎng)用戶通話頻率,在綜合本網(wǎng)高端用戶判別準則近似得出了異網(wǎng)高端手機用戶的判別準則。關鍵字:抽樣分析Q型聚類分析單因子分析一、 問題重述科技的進步帶來了通信技術的快速發(fā)展,并且隨著移動通信、互聯(lián)網(wǎng)業(yè)務的迅速發(fā)展,手機已經(jīng)從生活奢侈品變成了生活日用品,是人們?nèi)粘I钪胁豢扇鄙俚囊徊糠帧H藗冸S時隨地使用手機打電話、發(fā)短信、上網(wǎng),而用戶的這些行為以及其個人基本信息均在運營商中有所記錄。因此,分析手機用戶的消費傾向及其價值觀、社會認可度的傾向對于研究人們的手機消費心理有很大的作用。 與本網(wǎng)高端手機用戶相同,異網(wǎng)高端手機用戶在消費力度,通話量、以及手機交往圈(與之有通信行為的所有手機用戶構成其手機交往圈)大小等方面均遠高于整體平均水平。高端用戶往往更關注信號強度和通話質量,追求個性化服務。他們往往是企業(yè)的骨干、是家庭的核心,對電信業(yè)務發(fā)展有著重要意義,其手機交往圈中多數(shù)也是高端手機用戶,相互之間產(chǎn)生重要影響。 請根據(jù)附件數(shù)據(jù)完成以下任務: 1、 研究本網(wǎng)手機用戶行為特征,給出本網(wǎng)高端手機用戶的判別準則以及營銷優(yōu)先級。 2、 估算異網(wǎng)手機用戶的月均消費金額,研究異網(wǎng)手機用戶行為特征,并給出異網(wǎng)高端手機用戶判別準則以及營銷優(yōu)先級。 3、 評估本網(wǎng)、異網(wǎng)高端手機用戶的判別準則是否合理以及異網(wǎng)手機用戶月均消費金額的估算是否準確,有哪些需要改進的地方,改進方法是什么,還需要什么信息?4、 自行收集手機號碼,研究手機號碼的靚號分級工作,給出分級標準并評估其合理性。二、問題分析 由題意知,其目的是建立一種模型用于篩選異網(wǎng)高端用戶。但考慮到本題數(shù)據(jù)量比較大,我們采用了多次隨機不放回抽樣取平均值的的方法。我們首先分別對本網(wǎng)的個人信息表中隨機篩選出的三組數(shù)據(jù)中的套餐檔次、月消費金額、流量費、市話費、長途費、漫游費、通話費、增值費、短信費、上網(wǎng)流量以及上網(wǎng)時長做了基本的統(tǒng)計(包括求極大值、極小值、均值、標準差和方差),然后把得出的數(shù)據(jù)的分析結果互相做了對比,發(fā)現(xiàn)數(shù)據(jù)基本吻合,所以我們的抽樣還算成功。對于本網(wǎng)手機高端用戶,我們首先對本網(wǎng)個人信息表中的所有數(shù)據(jù)運用SPSS進行統(tǒng)計分析,得出本網(wǎng)用戶的月平均消費情況。之后,我們在通過分析以上相關因素的前提下,通過聚類將本網(wǎng)中的手機高端用戶篩選出來,然后多次隨機抽選出50名手機高端用戶,仔細認真的分析了他們的個人信息,發(fā)現(xiàn)了本網(wǎng)手機高端用戶的一些明顯的共有特性,如套餐費,月消費,以及通話費均高于一般用戶的平均水平,我們便按照這些特性的標準制定出了本網(wǎng)手機高端用戶的判別準則。之后,我們又對我們所做的判別準則做了改進,將判別準則的定性指標做了定量化的處理,利用客觀賦權中的均方差法對選出出來的三個指標(套餐檔次、消費金額、通話費)進行了賦權,然后可根據(jù)賦權的結果對一個手機號碼進行一個評分,根據(jù)所得分來判別該號碼屬于高端用戶的隸屬度。再詳細分析本網(wǎng)用戶的個人信息表,通過上網(wǎng)查資料,給出了本網(wǎng)高端用戶的營銷優(yōu)先級。最后通過本網(wǎng)手機高端用戶在本網(wǎng)所有用戶中所占的比例和單因子分析的方法,再有假設利用異網(wǎng)手機在二月份的通話頻率,最終確定出異網(wǎng)手機高端用戶。最后,通過隨機篩選出的本網(wǎng)10名手機高端用戶,用SPSS從通話記錄表中篩選出他們在二月份的全部通話記錄并進行分析,最終確定異網(wǎng)高端手機用戶的判別準則。三、模型的假設1、假設所給的數(shù)據(jù)都是準確的。2、假設異網(wǎng)用戶的套餐資費標準與本網(wǎng)的相當。3、假設異網(wǎng)的手機高端用戶和本網(wǎng)的手機高端用戶在總的用戶中的比例是相當?shù)摹?、假設手機用戶可分為高端、中端、低端三種。5、假設每個號碼每月打電話次數(shù)和接電話次數(shù)大致相當。四、符號說明V2 本網(wǎng)手機用戶的城鄉(xiāng)標識V4 本網(wǎng)手機用戶的性別V5 本網(wǎng)手機用戶的年齡V6 本網(wǎng)手機用戶的等級V10 本網(wǎng)手機用戶的號碼辦理日期V11 是否3G用戶V12 是否VIP用戶V13 本網(wǎng)用戶的套餐類型(元)V14 本網(wǎng)用戶消費金額(元) V15 本網(wǎng)用戶當月上網(wǎng)流量費(元) V16 本網(wǎng)用戶當月市話語音費用(元) V17 本網(wǎng)手機用戶號碼長途語音費用(元) V18 本網(wǎng)手機用戶漫游語音費用(元) V19 本網(wǎng)手機用戶號碼語音費用(元) V20 本網(wǎng)手機用戶增值費用(元) V21 本網(wǎng)手機用戶短信費用(元) V24 本網(wǎng)手機用戶當月上網(wǎng)流量(M) V25 本網(wǎng)手機用戶當月上網(wǎng)時長(分鐘)五、模型的建立及求解首先,我們用對本網(wǎng)的個人用戶信息表中的相關數(shù)據(jù)進行了分析,其中分析了相關數(shù)據(jù)的極大值、極小值、均值、方差、標準差,得到結果如下圖:描述統(tǒng)計量N極小值極大值均值標準差方差V133761750899115.5948.5632358.377V14382779-360.007660.6739.626949.216842422.298V15382779-200.001000.005.269119.93548397.424V16382779-134.30907.9715.039519.91288396.523V17382779.00878.418.509917.95058322.223V18382779.00681.942.873311.31604128.053V19382779-86.721308.4126.422634.340421179.264V20382779.007418.00.283313.41839180.053V21382779-.10442.133.35028.3766170.168V24382779.00159911.8379.54861141.800561303708.530V25382779.00816.3732.421879.998816399.809有效的 N (列表狀態(tài))376175我們通過分析這張表中的數(shù)據(jù),很容易就發(fā)現(xiàn),相關數(shù)據(jù)的差值波動都比較大,通過分析他們的均值、最大值、最小值、方差,發(fā)現(xiàn)他們可以作為我們分析本網(wǎng)高端用戶的一些依據(jù)。對這些數(shù)據(jù)的分析,我們采用型聚類分析的方法。聚類分析的基本思想:我們所研究的樣品(網(wǎng)點)或指標(變量)之間存在程度不同的相似性(親疏關系以樣品間距離衡量)。于是根據(jù)一批樣品的多個觀測指標,具體找出一些能夠度量樣品或指標之間相似程度的統(tǒng)計量,以這些統(tǒng)計量為劃分類型的依據(jù)。把一些相似程度較大的樣品(或指標)聚合為一類,把另外一些彼此之間相似程度較大的樣品(或指標)又聚合為另一類,直到把所有的樣品(或指標)聚合完畢,這就是分類的基本思想 Q型聚類分析的優(yōu)點是:1、可以綜合利用多個變量的信息對樣本進行分類;2、分類結果是直觀的,聚類譜系圖非常清楚地表現(xiàn)其數(shù)值分類結果;3、聚類分析所得到的結果比傳統(tǒng)分類方法更細致、全面、合理。數(shù)據(jù)標準化:在實際問題中,不同的數(shù)據(jù)一般有不同的量綱,為了使不同的量綱也能進行比較,通常需要對數(shù)據(jù)做適當?shù)淖儞Q。但是,即使這樣,得到的數(shù)據(jù)也不一定在區(qū)間上。因此,這里說的數(shù)據(jù)標準化,就是要根據(jù)模糊矩陣的要求,將數(shù)據(jù)壓縮到區(qū)間上。我們采用以下變換方式:平移極差變換 ,顯然有,而且也消除了量綱的影響。其中:其中表示第個分類對象的第個指標的原始數(shù)據(jù)。識別本網(wǎng)高端用戶模型首先我們從個人信息資料表中通過隨機不放回抽樣的辦法抽出1%的數(shù)據(jù),數(shù)據(jù)分析結果如下表: 描述統(tǒng)計量N極小值極大值均值標準差方差V1336630399115.3848.5202354.220V143719-29.80836.7039.296745.091642033.256V153719-66.00836.705.569322.91507525.100V163719-47.07202.2615.183219.77025390.863V173719.00193.338.027515.74393247.871V183719.00208.322.803710.12559102.528V193719-41.20309.8526.014331.889321016.929V203719.0084.67.22292.629476.914V213719.00127.303.36078.2247567.647V243719.0061945.9395.85291265.032701600307.732V253719.00717.0233.509679.741776358.750有效的 N (列表狀態(tài))3663 我們將這張表中的相關數(shù)據(jù)同上張表做了比較,發(fā)現(xiàn)數(shù)據(jù)吻合程度較高,說明我們的抽樣還是成功的,我們以供選擇三次抽樣求平均值的辦法,由于篇幅限制,后兩張表見附件。對選出來的數(shù)據(jù)我們進行了Q型聚類分析,將他們分成了三類,結果如下圖:我們依照上面辦法做了三次抽樣,平均其結果,以達到較高的準確率。然后,我們從篩選出的本網(wǎng)高端用戶中有隨機篩選出50名高端手機用戶,對他們的個人信息又做了更加細致的研究,如此反復三次,求平均值。其中一組信息如下:統(tǒng)計量V2V4V5V6V10V11V12N有效50504750505050缺失0030000V2頻率百分比有效百分比累積百分比有效-11530.030.030.002958.058.088.0124.04.092.0248.08.0100.0合計50100.0100.0V4頻率百分比有效百分比累積百分比有效 36.06.06.0F1734.034.040.0M3060.060.0100.0合計50100.0100.0V5頻率百分比有效百分比累積百分比有效1912.02.12.12212.02.14.32324.04.38.52424.04.312.82524.04.317.02636.06.423.427612.012.836.22912.02.138.33024.04.342.63124.04.346.83224.04.351.13336.06.457.43412.02.159.63512.02.161.73624.04.366.03812.02.168.13924.04.372.34012.02.174.54112.02.176.64324.04.380.94512.02.183.04712.02.185.14812.02.187.25012.02.189.45212.02.191.55524.04.395.75812.02.197.96712.02.1100.0合計4794.0100.0缺失系統(tǒng)36.0合計50100.0V6頻率百分比有效百分比累積百分比有效-11428.028.028.0224.04.032.032652.052.084.04816.016.0100.0合計50100.0100.0V11頻率百分比有效百分比累積百分比有效03876.076.076.011224.024.0100.0合計50100.0100.0V12頻率百分比有效百分比累積百分比有效-11428.028.028.0224.04.032.032652.052.084.04816.016.0100.0合計50100.0100.0最后,我們對初級篩選出的本網(wǎng)高端用戶進行了具體分析,發(fā)現(xiàn)他們的年齡大部分都在25歲以上,其中35歲以上的占大多數(shù);手機號碼辦理平均年限在2年以上;70%的高端用戶戶口在市區(qū);3G用戶和VIP用戶比例也遠遠高于非高端用戶。其它相關變量未發(fā)現(xiàn)有直接關系。經(jīng)過以上分析總結,我們給出的本網(wǎng)手機高端用戶最初的基本判別準則為:1、 消費級別在月平均120元以上。其中,通話費在月平均79元以上。套餐級別在月平均137元以上2、 戶口在市區(qū)。3、 手機號碼使用年限平均在2年以上。4、 平均年齡在35歲以上。5、 3G用戶和VIP用戶可以優(yōu)先考慮。(說明:以第一第二條為主要指標)之后我們又對其中的對高端用戶影響較大的變量進行了分析,最后發(fā)現(xiàn)其中的套餐檔次、消費金額、通話費對本網(wǎng)手機高端用戶判別的影響較大,故對這三個指標采用了客觀賦權的辦法,最終完成了將定性指標定量化。客觀賦權:均方差法記第j項指標的樣本均值與樣本均方差為則取第j項指標的權重系數(shù)為由上式我們求得套餐檔次的權重系數(shù)X1=38.66%;消費金額的權重系數(shù)X2=35.93%;通話費的權重系數(shù)X3=25.41%。號碼得分公式X=X1*V13+X2*V14+X3*V15最后,我們利用matlab算出了我們隨機挑選的50名本網(wǎng)手機高端用戶的各自得分,所得信息如下表:最大值最小值平均值174.8261.334108.25554所以我們可以認為,如果一個號碼得分超過最小值,我們便可以認為這個手機號碼的主人就是手機高端用戶;如果一個號碼得分小于這個值,我們可以利用公式Y=X/61.334*100%來求出這個手機號碼屬于高端用戶的隸屬度。關于營銷優(yōu)先級,我們在網(wǎng)上得到的定義是:由于不同級別的客戶對不同的套餐感興趣,所以網(wǎng)絡運營商根據(jù)不同級別客戶的喜好,而推出具有針對性的優(yōu)惠套餐。而對于本網(wǎng)的高端客戶來講,我們認為應當給出的營銷優(yōu)先級為:1 在提高通話質量的前提下適當降低資費2 對使用一定年限的手機號碼給予一定的優(yōu)惠3 優(yōu)化分層套餐結構,讓不同消費階層的人感到實惠。異網(wǎng)高端識別關于異網(wǎng)高端用戶平均月消費金額,我們假設異網(wǎng)的資費標準同本網(wǎng)的資費標準大致相當,所以得出,異網(wǎng)月平均消費金額大約為40元。對于異網(wǎng)高端識別這個模型,因為異網(wǎng)還有聯(lián)通,移動等其他多個運營商,我們以聯(lián)通用戶為例。我們用SPSS軟件對用戶的通話清單表做了處理,把標識為聯(lián)通的手機號碼提取了出來,然后用SPSS軟件統(tǒng)計出了他們在二月份被叫的頻率。但由于數(shù)據(jù)量巨大,我們只選取其中的部分數(shù)據(jù)進行統(tǒng)計分析。我們在對隨機抽取其中的1%、2%、3%、4%的數(shù)據(jù)進行分析以后發(fā)現(xiàn)通話頻率隨著抽取數(shù)據(jù)的增多不斷加大,所以,我們可以認為如果把全部數(shù)據(jù)都進行分析的話,將會有部分用戶的通話頻率非常高,而我們就認為這部分用戶為異網(wǎng)高端用戶。結果如下表統(tǒng)計量V3N有效189326缺失0由于另一部分數(shù)據(jù)量較大,故不再附最后我們由模型1 可以得到本網(wǎng)高端用戶在本網(wǎng)所有用戶中所占的比例大約為10.2%,然后按照這個比例我們就可以利用單因子分析法,通過聯(lián)通用戶的被叫的頻率來確定聯(lián)通用戶中的手機高端用戶。關于判別準則的給出,我們從本網(wǎng)高端用戶中隨機篩選出10名高端用戶,把他們二月份的通話記錄從通話記錄表中調了出來,分析了他們的通話頻率,分析結果如下表:通話頻率分析表最大值最小值平均值458127289由于假設打電話和接電話的次數(shù)大致相當,所以,我們可以認為每月的通話頻率大于127次的號碼都為高端用戶,小于127次的可利用公式H(高端用戶隸屬度)=Z(通話頻率)/127求出。而對于手機號碼的靚號分級工作,我們的思路是從全部的手機號碼的高端用戶中確定,但具體的手機號碼收集工作,由于我們能力和相關知識有限,故暫時不再考慮。六、模型評價與改進方向對模型的評價,對于本網(wǎng)識別高端用戶的模型,由于我們采用抽樣分析的辦法,所以還存在隨機性的誤差,誤差大小不好把握。但可以通過多次試驗求平均值的辦法來盡量減小誤差。而對于判別準則的給出,由于我們?nèi)狈@方面的相關知識而采用上網(wǎng)查資料和我們對數(shù)據(jù)的分析相結合的辦法,通過我們的理解給出,缺乏官方的權威,具有一定的局限性。改進措施可以將更多定性指標定量化,例如,城鄉(xiāng)戶口,年齡等等,再次可以通過加強與相關工作人員的聯(lián)系,從他們哪兒得到相關信息和定義,由此,可以給出較為準確的判別準則。對于異網(wǎng)的月均消費金額,由于我們?nèi)鄙傧嚓P
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 總結藥劑學2024年考試試題及答案
- 系統(tǒng)規(guī)劃與管理師考試提高自信心方法試題及答案
- 少兒多動癥測試題及答案
- 系統(tǒng)架構設計師考試職業(yè)定位與實踐路線試題及答案
- 民航運維測試題及答案
- 心理咨詢中的內(nèi)在動機與外在激勵關系試題及答案
- 新版護士資格考試知識點試題及答案
- 二上語文試題及答案
- 直播合作協(xié)議書合同二零二五年
- 慢性病用藥管理策略試題及答案
- 冠狀動脈粥樣硬化性心臟病-28
- 藥用氧化鎂項目營銷計劃書
- 任務1 混合動力汽車轉向系統(tǒng)典型構造與檢修
- 三維地籍解決方案白皮書
- 住院患者VTE相關評估量表課件
- 高中物理選修二第一章《安培力與洛倫茲力》測試題(含答案解析)
- 江蘇省徐州市睢寧縣2023-2024學年七年級下學期期中考試數(shù)學試卷(含答案)
- 中職護理專業(yè)護理服務質量評價體系研究
- 小學生衛(wèi)生知識健康教育精課件
- 新目標英語初三英語總復習資料講義
- 體育館鋼結構工程馬道施工方案
評論
0/150
提交評論