《新媒體數(shù)據(jù)分析與應(yīng)用》 課件全套 第1-10章 緒論、新媒體數(shù)據(jù)分析指標 -網(wǎng)絡(luò)輿情數(shù)據(jù)分析_第1頁
《新媒體數(shù)據(jù)分析與應(yīng)用》 課件全套 第1-10章 緒論、新媒體數(shù)據(jù)分析指標 -網(wǎng)絡(luò)輿情數(shù)據(jù)分析_第2頁
《新媒體數(shù)據(jù)分析與應(yīng)用》 課件全套 第1-10章 緒論、新媒體數(shù)據(jù)分析指標 -網(wǎng)絡(luò)輿情數(shù)據(jù)分析_第3頁
《新媒體數(shù)據(jù)分析與應(yīng)用》 課件全套 第1-10章 緒論、新媒體數(shù)據(jù)分析指標 -網(wǎng)絡(luò)輿情數(shù)據(jù)分析_第4頁
《新媒體數(shù)據(jù)分析與應(yīng)用》 課件全套 第1-10章 緒論、新媒體數(shù)據(jù)分析指標 -網(wǎng)絡(luò)輿情數(shù)據(jù)分析_第5頁
已閱讀5頁,還剩450頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

新媒體數(shù)據(jù)分析與應(yīng)用第1章:緒論Chapter1:Introduction.本章提綱CONTENTS數(shù)據(jù)分析的相關(guān)知識KnowledgeofDataAnalysis01新媒體與新媒體數(shù)據(jù)NewMediaandNewMediaData02新媒體數(shù)據(jù)分析的過程NewMediaDataAnalysisProcess0301Netflix利用了大數(shù)據(jù)分析,使其成為全球數(shù)一數(shù)二的網(wǎng)絡(luò)流媒體視頻平臺,由此可見,數(shù)據(jù)分析是非常有意義且商業(yè)價值很高的。本節(jié)從數(shù)據(jù)分析的相關(guān)基礎(chǔ)知識入手,介紹了數(shù)據(jù)分析的基本概念。數(shù)據(jù)分析的相關(guān)知識第1章:緒論CAB數(shù)據(jù)數(shù)據(jù)(或稱資料),是關(guān)于事件的一組離散、客觀的事實描述,是構(gòu)成信息和知識的原始材料,是載荷或記錄信息的按一定規(guī)則排列組合的物理符號。數(shù)據(jù)的表現(xiàn)形式有圖形、圖像、視頻、聲音、文字、數(shù)字、字符和符號等。知識知識是“與經(jīng)驗、上下文、解釋和思考結(jié)合在一起的信息。它是一種可以隨時幫助人們決策與行動的高價值信息”。知識可以分為顯性知識和隱性知識。顯性知識或已編碼的知識是指一種用正式的、系統(tǒng)化的語言傳輸?shù)闹R;隱性知識擁有個人化的特征,這使得隱性知識很難正規(guī)化和傳播。信息“信息”的英文是“information”,它來源于拉丁文,原意是解釋、陳述。《辭海》中“信息”的解釋為客觀存在的消息、情況、情報等。雖然現(xiàn)在已很少用“情報”這個術(shù)語,但information在近代歷史上解釋為情報非常合適。在中國,高等學(xué)校的信息學(xué)專業(yè)、信息管理與信息系統(tǒng)專業(yè)是從早期的情報學(xué)專業(yè)衍生而來的。1.1.1數(shù)據(jù)、知識與信息第1章:緒論1.1.2數(shù)據(jù)分析的定義與作用數(shù)據(jù)分析是檢查、清理、轉(zhuǎn)換和建模數(shù)據(jù)的過程,其目的是發(fā)現(xiàn)有用的信息,提供結(jié)論并支持決策。數(shù)據(jù)分析包含多個方面、多種方法和以各種名稱命名的多種技術(shù),并且用于不同的業(yè)務(wù)、科學(xué)和社會科學(xué)領(lǐng)域。在當今的商業(yè)世界中,數(shù)據(jù)分析在使決策更加科學(xué)、幫助企業(yè)更有效地運營方面發(fā)揮著重要作用。數(shù)據(jù)分析運用適當?shù)慕y(tǒng)計分析方法對收集來的大量數(shù)據(jù)進行分析,將它們加以匯總和理解并消化,以求最大化地開發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)分析是為了提取有用的信息和形成結(jié)論,從而對數(shù)據(jù)加以詳細研究和概括總結(jié)的過程。

數(shù)據(jù)分析的數(shù)學(xué)基礎(chǔ)在20世紀早期就已確立,但直到計算機的出現(xiàn)才使實際操作成為可能,并使數(shù)據(jù)分析得以推廣。數(shù)據(jù)分析是數(shù)學(xué)與計算機科學(xué)相結(jié)合的產(chǎn)物。

請在這里開始你的表演現(xiàn)狀分析原因分析預(yù)測分析數(shù)據(jù)分析可以揭示企業(yè)的整體情況,并通過完成各種指標來衡量運行狀況,從而顯示整體情況是好是壞,表現(xiàn)如何。在企業(yè)運營中,數(shù)據(jù)分析可以顯示業(yè)務(wù)的組成和運行情況,在關(guān)注業(yè)務(wù)發(fā)展和變化的同時,對企業(yè)的業(yè)務(wù)狀態(tài)有更深入的了解。針對某一事件,在對相關(guān)的數(shù)據(jù)進行分析后,數(shù)據(jù)分析可以揭示該事件發(fā)生的原因。在企業(yè)運營中,對現(xiàn)狀進行分析之后,人們對公司的運營有了基本的了解,但是不知道哪些地方運營得好,哪些地方運營得差,它們差異是什么,運營好壞的原因是什么。這時,人們就需要進行數(shù)據(jù)分析,以進一步明確業(yè)務(wù)變更的具體原因。數(shù)據(jù)分析能夠綜合目前已經(jīng)有的信息和數(shù)據(jù),通過一定的技術(shù)手段預(yù)測未來的情況。在企業(yè)運營中,了解該企業(yè)運營的現(xiàn)狀后,人們有時需要對企業(yè)的未來發(fā)展趨勢做出預(yù)測,為企業(yè)制定業(yè)務(wù)目標,并提供有效的戰(zhàn)略參考和決策依據(jù),以確保企業(yè)的持續(xù)健康發(fā)展,此時,就需要對已有數(shù)據(jù)進行分析。1.1.3數(shù)據(jù)分析的意義第1章:緒論1.1.4數(shù)據(jù)分析的價值1.改進優(yōu)化業(yè)務(wù)改進優(yōu)化業(yè)務(wù)就是讓業(yè)務(wù)變得更好,對企業(yè)而言主要體現(xiàn)在以下兩個方面第一方面是對企業(yè)用戶體驗的改進,優(yōu)化原有業(yè)務(wù)流程,為用戶提供更好的用戶體驗。例如,早些年QQ游戲大廳對玩家進入游戲的流程再造,將原有的游戲進入登錄的環(huán)節(jié)從4個變更為3個。第二方面體現(xiàn)在對企業(yè)資源的合理化分配利用上,更合理地優(yōu)化配置企業(yè)資源,進而達到效益最大化的目的。例如,企業(yè)日常運營中的廣告投放及內(nèi)部廣告資源分配優(yōu)化等就屬于此范疇,一方面利用精準化廣告投放,提高廣告投放效率;另一方面根據(jù)廣告引流客戶量的大小做好企業(yè)資源分配,進而提高用戶體驗,提升用戶留存率。2.發(fā)現(xiàn)業(yè)務(wù)機會發(fā)現(xiàn)業(yè)務(wù)機會主要是利用數(shù)據(jù)查找發(fā)現(xiàn)人們思維上的盲點,進而發(fā)現(xiàn)新的業(yè)務(wù)機會。例如,游戲企業(yè)常在游戲中埋點分析玩家的游戲操作行為數(shù)據(jù)及關(guān)鍵節(jié)點進程數(shù)據(jù),以達到控制游戲進度和難易度的目的,而在這個過程中可能發(fā)現(xiàn)新的業(yè)務(wù)機會,進而擴展出譬如游戲安全操作標準及游戲安全產(chǎn)品之類的新業(yè)務(wù)滲透點。第1章:緒論1.1.4數(shù)據(jù)分析的價值3.創(chuàng)造新的商業(yè)價值創(chuàng)造新的商業(yè)價值主要是在數(shù)據(jù)價值的基礎(chǔ)上形成新的商業(yè)模式,將數(shù)據(jù)價值直接轉(zhuǎn)化為金錢模式。例如,之前比較火的個人征信業(yè)務(wù)就屬于此類。騰訊、阿里巴巴等企業(yè)在其擁有廣泛用戶數(shù)據(jù)的基礎(chǔ)上,分別成立了騰訊征信、芝麻信用等新的業(yè)務(wù)關(guān)聯(lián)企業(yè),而這些征信企業(yè)又衍生出相關(guān)的“刷臉”業(yè)務(wù),并將其擴展到租車、租房等領(lǐng)域。4.監(jiān)視預(yù)警企業(yè)運營狀態(tài)數(shù)據(jù)分析在企業(yè)運營過程中還發(fā)揮著“醫(yī)生”的作用,一方面提供對企業(yè)日常運營活動的體檢服務(wù),對在業(yè)務(wù)運營過程中可能會出現(xiàn)的問題進行預(yù)警,將問題消滅在萌芽狀態(tài),防患于未然。例如,在企業(yè)業(yè)務(wù)擴充過程中,對投資合并對象的背景和發(fā)展歷史等情況的盡職調(diào)查就屬于此類。另一方面,數(shù)據(jù)分析還提供企業(yè)日常運營過程中的“巡診就診”服務(wù),找出企業(yè)日常運營中的問題,揭露過去和預(yù)測未來。02在新媒體領(lǐng)域中,數(shù)據(jù)分析也有非常獨特的價值。與普通的數(shù)據(jù)分析不同,新媒體領(lǐng)域中的數(shù)據(jù)和數(shù)據(jù)分析有其自身的特點。本節(jié)介紹了新媒體的概念、特征和發(fā)展趨勢,以及新媒體數(shù)據(jù)的概念、特征和分析過程。新媒體與新媒體數(shù)據(jù)1.2.1新媒體概念和特征新媒體的概念第1章:緒論新媒體的概念最先出自加拿大媒介研究學(xué)家馬歇爾·麥克盧漢在1959年的全美高等教育學(xué)會會議中發(fā)表的題為“電子革命:新媒體的革命影響”演講。麥克盧漢認為,媒體即信息,當社會靠集體行動開發(fā)出一種新媒介(如印刷術(shù)、電報、照片和廣播)時,它就贏得了表達新信息的權(quán)利。很顯然,麥克盧漢所指的“新媒體”主要是相對印刷術(shù)而言的,具體是指廣播,所以它并不是人們現(xiàn)在所熟知的新媒體的概念。所以說,新媒體的“新”是一個相對的概念?,F(xiàn)在口口相傳的“新媒體”概念出自于20世紀60年代的美國。美國哥倫比亞廣播電視網(wǎng)絡(luò)技術(shù)研究所所長戈爾德馬克在發(fā)表的一份關(guān)于開發(fā)電子錄像商品的計劃中提出了“NewMedia”(新媒體)這個概念。1969年,美國傳播政策總統(tǒng)特委會主席羅斯托在提交給時任美國總統(tǒng)尼克松的報告中,也多次使用了“NewMedia”這個概念。那時,新媒體更多是指電子媒體中的創(chuàng)新性應(yīng)用。1.2.1新媒體概念和特征新媒體的特征第1章:緒論迎合人們休閑娛樂、學(xué)習(xí)時間“碎片化”的需求。

隨著社會發(fā)展的高速化,加之生活節(jié)奏的高速化,人們很難抽出集中的時間來娛樂、學(xué)習(xí)與消遣。新媒體的出現(xiàn)正好迎合了這種“碎片化”時間消費的趨勢。這種迎合體現(xiàn)在幾個方面:首先,新媒體打破了地域的限制,使信息的傳播超越了地理條件的制約,無論是城市還是鄉(xiāng)村,信息伴隨著各種媒介出現(xiàn)在大眾面前,使得在信息面前“人人平等”的局面出現(xiàn)。其次,新媒體打破了時間的限制,人們可以隨時隨地獲取信息。伴隨著無限網(wǎng)絡(luò)的普及,這種趨勢會更加明顯,借助于客戶終端的多樣化,受眾人群可以借助形式多樣的新媒體實現(xiàn)“碎片化”的時間消費。1.2.1新媒體概念和特征新媒體的特征第1章:緒論滿足隨時隨地互動性表達、娛樂與信息需要。

傳統(tǒng)的報紙、廣播、電視等傳播方式是“中心化”,是一對多的圓錐形傳播。但是新媒體完全“去中心化”,實現(xiàn)點對點、面對面的傳播。這樣就有利于受眾針對不同的信息進行自我化、個性化的“評頭論足”。同時,受眾還可以借助各種客戶端實現(xiàn)遠程視頻、遠程圖片的交流,使交流的形式更具多元化、多樣化。這些優(yōu)勢是傳統(tǒng)媒體不能具備的,也是傳統(tǒng)媒體“望塵莫及”的。1.2.1新媒體概念和特征新媒體的特征第1章:緒論人們使用新媒體的目的性與選擇的主動性更強。

如果人們要在傳統(tǒng)媒體上發(fā)表意見,往往需要付出比較高的代價,這種代價有經(jīng)濟實力方面的,有社會地位方面的,還有個人水平方面的,沒有一定的代價是無法進入傳統(tǒng)媒體的視野的。新媒體技術(shù)的發(fā)展徹底改變了受眾這種被動接受、傳播信息的局面。隨著以互聯(lián)網(wǎng)為主的新媒體等手段的發(fā)展,受眾可以借助各種形式的“話筒”發(fā)表自己的個性化的語言,現(xiàn)在比較流行的形式有論壇、微博、微信、郵箱等。這些新穎的信息傳播工具的出現(xiàn)給受眾帶來了極大的便利性,受眾可以持各種觀點進行交流、探討。1.2.1新媒體概念和特征新媒體的特征第1章:緒論新媒體的使用使市場細分更加充分,內(nèi)容選擇更具個性化。

新媒體已經(jīng)對傳統(tǒng)媒體的所有方面進行了全面的融合,新媒體應(yīng)用日益廣泛。即時通訊早已由文字聊天發(fā)展到了語音聊天、視頻聊天;博客也已經(jīng)發(fā)展到利用語音甚至圖像傳播信息;手機媒體更是有一種融合所有傳統(tǒng)媒體的勢頭。新媒體多種多樣的載體、媒介形式能夠很好地供使用者更替使用,同時使網(wǎng)絡(luò)資料不斷更新和擴充。新媒體將圖形、文字、聲音、動畫等融為一體,提供點對點的信息傳播服務(wù),每個人都可以用一個私有的可信賴的傳播載體,而信息傳播者針對不同的受眾提供個性化的服務(wù)。在傳播形式上,新媒體具有很強的直觀性、形象性和娛樂性。1.2.1新媒體概念和特征我國新媒體的發(fā)展趨勢第1章:緒論新基建帶動數(shù)字經(jīng)濟迎來全面提速提質(zhì)階段。直播和短視頻仍處于黃金發(fā)展賽道。“5G+”加速產(chǎn)業(yè)互聯(lián)網(wǎng)變局。互聯(lián)網(wǎng)巨頭積極布局超級App生態(tài)。微傳播價值與媒體融合價值回歸本質(zhì)?!岸浣?jīng)濟”迸發(fā)市場發(fā)展活力。網(wǎng)絡(luò)文化呈“破圈化”發(fā)展趨勢。數(shù)字社會治理共同體建設(shè)不斷推進。1.2.2新媒體數(shù)據(jù)的分類、特征和分析過程新媒體數(shù)據(jù)的分類第1章:緒論數(shù)值型數(shù)據(jù)數(shù)值型數(shù)據(jù)主要由數(shù)字組成。通過對大量數(shù)字進行統(tǒng)計與分析,可以總結(jié)并評估營銷效果。常見的數(shù)值型數(shù)據(jù)包括閱讀量數(shù)據(jù)(見圖1-2)、粉絲數(shù)據(jù)、網(wǎng)店銷售數(shù)據(jù)、網(wǎng)站瀏覽數(shù)據(jù)、活動參與數(shù)據(jù)等。

1.2.2新媒體數(shù)據(jù)的分類、特征和分析過程新媒體數(shù)據(jù)的分類第1章:緒論圖文型數(shù)據(jù)圖文型數(shù)據(jù)不是由數(shù)字構(gòu)成的,而是由文字或圖片等形式構(gòu)成的。圖文型數(shù)據(jù)主要通過問卷調(diào)查、結(jié)構(gòu)化比較、分析匯總等形式獲得,其研究目的不是評估量化的數(shù)據(jù)結(jié)果,而是找到運營方向。常見的圖文型數(shù)據(jù)包括網(wǎng)站結(jié)構(gòu)分類(在線學(xué)習(xí)網(wǎng)站結(jié)構(gòu)分類見圖1-3)、賬號粉絲分類、同行微信公眾號自定義菜單歸類、消費者反饋、多平臺矩陣分布等。1.2.2新媒體數(shù)據(jù)的分類、特征和分析過程新媒體數(shù)據(jù)的特征第1章:緒論及時性

新媒體傳播的速度非常快,新媒體數(shù)據(jù)表現(xiàn)出明顯的即時性特征,網(wǎng)民通過手機、電腦或其他智能終端能夠快速發(fā)布數(shù)據(jù)和及時接收數(shù)據(jù)。打破了傳統(tǒng)媒體定時傳播的規(guī)律,可以把數(shù)據(jù)無時間限制和無地域限制地進行傳播。1.2.2新媒體數(shù)據(jù)的分類、特征和分析過程新媒體數(shù)據(jù)的特征第1章:緒論

新媒體與傳統(tǒng)媒體相比具有超強的交互性。傳統(tǒng)媒體是單向傳播,不管是廣播、電視還是報紙都是單向傳送數(shù)據(jù)的,媒體處于強勢地位,決定著受眾接受什么樣的數(shù)據(jù),用戶很難進行數(shù)據(jù)反饋,其交互性很差。在新媒體環(huán)境下,數(shù)據(jù)的傳輸是雙向的,甚至是多向的。同時,以微博、博客等為代表的新媒體技術(shù),也從根本上改變了用戶的受眾角色,公眾既可以是數(shù)據(jù)的接收者,又可以是數(shù)據(jù)的發(fā)送者;既可以是數(shù)據(jù)的制作者,又可以是數(shù)據(jù)的傳播者。交互性1.2.2新媒體數(shù)據(jù)的分類、特征和分析過程新媒體數(shù)據(jù)的特征第1章:緒論

新媒體利用通信衛(wèi)星和全球聯(lián)網(wǎng)的網(wǎng)絡(luò)進行數(shù)據(jù)傳輸,完全打破了有線網(wǎng)絡(luò)的限制和國家等行政區(qū)劃及地理區(qū)域的限制,可以在地球上的任何角落和世界相連。特別是手機新媒體發(fā)送數(shù)據(jù)時間短、接收數(shù)據(jù)速度快、受制約因素少,幾乎不受任何時間和地域的限制,在移動互聯(lián)網(wǎng)絡(luò)覆蓋的全球任何地方、任何時間都可以搜索數(shù)據(jù)、查閱數(shù)據(jù)、發(fā)布數(shù)據(jù),這是報刊、廣播、電視等傳統(tǒng)媒體無法啟及的高度。新媒體的跨時空性1.2.2新媒體數(shù)據(jù)的分類、特征和分析過程新媒體數(shù)據(jù)的特征第1章:緒論新媒體的失真性

微博、微信、博客、QQ、論壇等作為新媒體的重要數(shù)據(jù)傳播工具,它可以為每個人提供自己的客戶終端。以手機微博、微信、微視頻等新媒體作為傳播媒介,可以隨時隨地發(fā)布自己的位置、狀態(tài)、心情和所見所聞,同時由于互聯(lián)網(wǎng)為用戶提供了虛擬的空間,用戶可以匿名登陸,廣大用戶可以自由地表達自己的觀點、發(fā)布消息、傳達資訊,可以就自己關(guān)心的話題留言、發(fā)帖、評論、投票,上傳統(tǒng)媒體不能說的內(nèi)容在新媒體可以輕松實現(xiàn)。雖然匿名登陸的特性可以更好地保護公眾隱私,在最大程度上實現(xiàn)言論自由,但也導(dǎo)致虛假數(shù)據(jù)泛濫,通過新媒體傳播出來的數(shù)據(jù)可信度不高等問題,數(shù)據(jù)的真實性遭到公眾的質(zhì)疑。

03互聯(lián)網(wǎng)每天都有大量的數(shù)據(jù)產(chǎn)生,新媒體運營團隊每天都會遇到粉絲數(shù)據(jù)、流量數(shù)據(jù)、轉(zhuǎn)化數(shù)據(jù)、下載數(shù)據(jù)等。如果將所有數(shù)據(jù)都進行統(tǒng)計與分析,會嚴重影響工作效率,同時導(dǎo)致大量的資源浪費。因此,人們必須有目的、有方法地分析與挖掘數(shù)據(jù),使數(shù)據(jù)展現(xiàn)出真正的價值。新媒體數(shù)據(jù)分析的過程01明確分析目的和思路在獲取數(shù)據(jù)之前,首先需要根據(jù)數(shù)據(jù)分析的目的篩選出需要采集的目標數(shù)據(jù),這是確保整個數(shù)據(jù)分析過程合理有效的首要條件第1章:緒論02數(shù)據(jù)收集確定好目標數(shù)據(jù)以后,依據(jù)確定的目標數(shù)據(jù)列表對目標數(shù)據(jù)進行有效采集。根據(jù)數(shù)據(jù)采集的難易程度,可以將數(shù)據(jù)采集分為數(shù)據(jù)實時采集和數(shù)據(jù)抽樣采集。03數(shù)據(jù)處理數(shù)據(jù)處理是指對收集到的數(shù)據(jù)進行加工、整理,以便開展數(shù)據(jù)分析,它是數(shù)據(jù)分析前必不可少的階段。04數(shù)據(jù)分析數(shù)據(jù)分析是指通過數(shù)據(jù)分析手段、方法和技巧對準備好的數(shù)據(jù)進行探索、分析,從中發(fā)現(xiàn)因果關(guān)系、內(nèi)部聯(lián)系和業(yè)務(wù)規(guī)律,并提供決策參考。05數(shù)據(jù)展現(xiàn)數(shù)據(jù)展現(xiàn)也可稱數(shù)據(jù)可視化。在一般情況下,數(shù)據(jù)分析的結(jié)果都是通過圖表等方式來展現(xiàn)的。借助數(shù)據(jù)展現(xiàn)手段,能更直觀地讓數(shù)據(jù)分析師表述想要展現(xiàn)的信息、觀點和建議。06數(shù)據(jù)分析報告最后階段就是撰寫數(shù)據(jù)分析報告,這是對整個數(shù)據(jù)分析成果的匯總和呈現(xiàn)。通過分析報告,把數(shù)據(jù)分析的目的、過程、結(jié)果及方案完整地呈現(xiàn)出來,為商業(yè)目的提供參考。本章小結(jié)第1章:緒論本章通過介紹數(shù)據(jù)、知識和信息的定義來引入數(shù)據(jù)分析的概念。數(shù)據(jù)是事實或觀察的結(jié)果,是對客觀事物的邏輯歸納,是用于表示客觀事物的未經(jīng)加工的原始素材。知識是闡述了數(shù)據(jù)分析的定義和作用。數(shù)據(jù)分析是檢查、清理、轉(zhuǎn)換和建模數(shù)據(jù)的過程,其目的是發(fā)現(xiàn)有用的信息,提供結(jié)論并支持決策。通過數(shù)據(jù)分析,我們能夠進行現(xiàn)狀分析、原因分析和預(yù)測分析。新媒體數(shù)據(jù)分析主要由五個步驟組成:明確分析目的和思路、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)和數(shù)據(jù)分析報告。本章內(nèi)容結(jié)束!Endofthischapter!新媒體數(shù)據(jù)分析與應(yīng)用新媒體數(shù)據(jù)分析與應(yīng)用第2章:新媒體數(shù)據(jù)分析指標Chapter2:NewMediaDataAnalysisIndex本章提綱CONTENTS新媒體數(shù)據(jù)指標體系01數(shù)據(jù)運營維度02用戶增長維度——以微信公眾號為例03用戶屬性與互動度——以微信公眾號為例04圖文維度——以微信公眾號為例05用戶互動維度——以微信公眾號為例0601用數(shù)據(jù)分析來實現(xiàn)新媒體運營工作的日常優(yōu)化和迭代,其前提是搭建指標體系,做好數(shù)據(jù)采集和監(jiān)控工作,其中第一步就是梳理業(yè)務(wù)流程,搭建影響關(guān)鍵指標的數(shù)據(jù)模型。新媒體數(shù)據(jù)指標體系第2章:新媒體數(shù)據(jù)分析指標轉(zhuǎn)化指標轉(zhuǎn)化次數(shù)傳播指標K因子、邀請率、邀請接受率、傳播周期拉新指標瀏覽量、下載量、新增用戶、獲取成本等活躍指標活躍用戶數(shù)、活躍率、在線時長、啟動次數(shù)、頁面瀏覽量等留存指標留存率、留存系數(shù)、留存存活率等Acquisition拉新用戶Activation活躍用戶Retention留存用戶Revenue獲取收入Refer傳播第2章:新媒體數(shù)據(jù)分析指標2.1新媒體數(shù)據(jù)指標體系2.1.1拉新指標

拉新指標是獲取新用戶時最重要的指標。拉新的過程主要為:新媒體運營人員進行渠道投放后,用戶接觸到產(chǎn)品后進行下載,最終注冊成為新用戶。(1)瀏覽量。

瀏覽量也稱曝光量,是指產(chǎn)品的推廣信息在社交媒體、搜索引擎、應(yīng)用商店等渠道中被多少用戶看到。與瀏覽量相對應(yīng)的是單擊量,單擊量與瀏覽量之比稱為單擊通過率CTR(CTR=單擊量/瀏覽量),很多廣告平臺會用CTR來評估廣告質(zhì)量。(2)下載量。

下載量指的是某個產(chǎn)品的下載次數(shù),是衡量拉新效果的結(jié)果指標。(3)新增用戶。

新增用戶是指下載并成功注冊的用戶。單純下載下來并不意味著就是新用戶,如果沒有注冊,那么只能算是一個無效用戶。對于新用戶的界定,每個產(chǎn)品是不一樣的,大部分的產(chǎn)品是用戶注冊了App就被定義為新用戶。(4)獲取成本。

獲取新用戶必然是要花費一定成本的,而這是最容易被忽略的。目前常見的成本的計算方式有CPM(CostPerMill,千次曝光成本,每展現(xiàn)給1000個人所花費的成本)、CPC(CostPerClick,單次單擊成本,每單擊一次所花費的成本)、CPA(CostPerAction,單次獲客成本,每獲取一個新用戶所花費的成本)。第2章:新媒體數(shù)據(jù)分析指標2.1新媒體數(shù)據(jù)指標體系2.1.2活躍指標當獲取了新用戶后,接下來關(guān)心這些新用戶是否在使用產(chǎn)品,以及他們是否活躍的問題。(1)活躍用戶數(shù)。

活躍用戶數(shù)所查看的指標主要是DAU(DailyActiveUser,每日活躍用戶數(shù)),指的是在24小時內(nèi)活躍用戶的總量。與其對應(yīng)的還有WAU(WeeklyActiveUser)、MAU(MonthlyActiveUser)等。(2)活躍率。

活躍用戶數(shù)衡量的是產(chǎn)品的市場體量,而活躍率衡量的則是產(chǎn)品的健康。(3)在線時長。

通過在線時長可以分析出用戶的粘性。但需要注意的是,不同產(chǎn)品類型的訪問時長不同,社交類產(chǎn)品的用戶在線時長通常會長于工具類產(chǎn)品的用戶在線時長,內(nèi)容平臺類產(chǎn)品的用戶在線時長通常會長于金融理財類產(chǎn)品的用戶在線時長等。(4)啟動次數(shù)。

啟動次數(shù)體現(xiàn)了用戶的使用頻率。用戶的日均啟動次數(shù)越多,說明用戶對產(chǎn)品的依賴性越高,活躍度也就越好。(5)頁面瀏覽量。

頁面瀏覽量主要分為PV和UV兩個指標。PV(PageView)是頁面瀏覽量,UV(UniqueVisitor)是一定時間內(nèi)訪問網(wǎng)頁的人數(shù),用戶在網(wǎng)頁的一次訪問請求可以看作1個PV,用戶看了10個網(wǎng)頁,則PV為10。

第2章:新媒體數(shù)據(jù)分析指標2.1新媒體數(shù)據(jù)指標體系2.1.3留存指標留存指的是在一批新增用戶中,在指定的時間段內(nèi)沒有卸載App的用戶。新增、卸載、留存的關(guān)系可用如下關(guān)系式表達:新增=卸載+留存(1)留存率。

留存率表示留存的好壞,常用的留存率指標有:24小時留存率、次日留存率、7日留存率、15日留存率、30日留存率。

24小時留存率表示:一批新增用戶中,從首次打開示例App的時刻算起,24小時過后,依然能被數(shù)據(jù)統(tǒng)計平臺統(tǒng)計到用戶數(shù)量占據(jù)新增用戶數(shù)量的百分比。例如,第一天的新增用戶為100個人,這100個人里面,在安裝了24小時之后,還能被統(tǒng)計平臺統(tǒng)計到30個人,那么這批新增用戶的24小時留存率為30%。次日留存率則表示:第一天的新增用戶中,在第二天依然能被數(shù)據(jù)統(tǒng)計平臺統(tǒng)計到的用戶。例如,第一天的新增用戶為100個人,如果過了第一天24點,還剩下50個人,那么次日留存率為50%。第2章:新媒體數(shù)據(jù)分析指標2.1新媒體數(shù)據(jù)指標體系2.1.3留存指標(2)留存系數(shù)。

留存系數(shù)指的是對已有App的留存率進行積分運算,得到一個比較穩(wěn)定的積分公式。有了留存系數(shù),人們只需要知道第一天的留存率,就能大概預(yù)測出未來幾天示例App的留存情況。

右圖是某產(chǎn)品留存率示意圖。

第2章:新媒體數(shù)據(jù)分析指標2.1新媒體數(shù)據(jù)指標體系2.1.3留存指標(3)留存存活率。

留存存活率指的是一批新增用戶中,留存的用戶中的(這里特指沒有卸載的用戶)活躍用戶的占比,留存存活率主要用于衡量示例App的存活能力。

簡單來說,每款A(yù)pp都希望被用戶一直使用,但是,現(xiàn)在手機對于App的管理越來越嚴苛,一旦示例App放入后臺,那么其存活的可能性就變得極低。在這種情況下,如何保證App的存活率就成了一件十分頭疼的事情。留存存活率可用如下公式表示:留存存活率=活躍÷(新增-卸載)

第2章:新媒體數(shù)據(jù)分析指標2.1新媒體數(shù)據(jù)指標體系2.1.4轉(zhuǎn)化指標(1)轉(zhuǎn)化次數(shù)。

轉(zhuǎn)化次數(shù)是指訪客到達轉(zhuǎn)化目標網(wǎng)頁或指完成了站長所期望完成動作的次數(shù),比如撥打了熱線電話組件,或者點開了咨詢按鈕組件。(2)轉(zhuǎn)化率。

轉(zhuǎn)化率是指用戶進行了相應(yīng)的行動的訪問次數(shù)與總訪問次數(shù)的比率,這里所指的相應(yīng)的行動可以是用戶購買、用戶登錄、用戶注冊、用戶訂閱、用戶下載等一系列用戶行為。轉(zhuǎn)化率的計算公式為:轉(zhuǎn)化率=轉(zhuǎn)化次數(shù)÷訪問次數(shù)以用戶登錄為例,如果每十次訪問中,就有一個登錄網(wǎng)站,那么此網(wǎng)站的登錄轉(zhuǎn)化率就為10%,通常網(wǎng)站轉(zhuǎn)化率的數(shù)據(jù)可以通過日志文件和流量統(tǒng)計分析系統(tǒng)獲得。轉(zhuǎn)化率的數(shù)值越高,說明越多的訪次完成了網(wǎng)站運營人員希望訪客進行的操作。

第2章:新媒體數(shù)據(jù)分析指標2.1新媒體數(shù)據(jù)指標體系2.1.5傳播指標(1)K因子。K因子也被稱為病毒系數(shù),用來衡量推薦的效果,即一個發(fā)起推薦的用戶可以帶來多少新用戶。K因子的計算公式:K因子=發(fā)起邀請的用戶數(shù)×轉(zhuǎn)化率

例如,發(fā)起邀請的用戶數(shù)為3,轉(zhuǎn)化率為30%,則K=3×0.3=0.9,也就是說一個發(fā)起邀請的用戶最終可以帶來0.9個用戶。(2)邀請率和邀請接受率。

邀請率是指收到邀請信息的用戶數(shù)占全部用戶的百分比,而邀請接受率是成功接受邀請的用戶數(shù)占收到邀請信息的用戶數(shù)的百分比,計算公式為:邀請率=邀請次數(shù)÷總用戶數(shù)邀請接受率=接受次數(shù)÷邀請次數(shù)(3)傳播周期。

傳播周期是指用戶完成從傳播到轉(zhuǎn)化新用戶所需要的時間,一般用來衡量傳播的速度。

02數(shù)據(jù)運營維度用戶數(shù)據(jù)用戶數(shù)據(jù)是反應(yīng)用戶屬性和用戶相關(guān)的數(shù)據(jù)圖文數(shù)據(jù)新媒體平臺自帶的圖文數(shù)據(jù)通常被稱為基礎(chǔ)圖文指標,這是運營人員必看的數(shù)據(jù)。競品數(shù)據(jù)競品就是競爭對手的產(chǎn)品。競品數(shù)據(jù)就是競爭對手產(chǎn)品的相關(guān)數(shù)據(jù)。行業(yè)數(shù)據(jù)不同的行業(yè)往往有不同的數(shù)據(jù)指標。行業(yè)數(shù)據(jù)能幫助運營人員了解市場格局和行業(yè)變化,制訂適宜的運營策略。第2章:新媒體數(shù)據(jù)分析指標第2章:新媒體數(shù)據(jù)分析指標2.2數(shù)據(jù)運營維度2.2.1用戶數(shù)據(jù)用戶數(shù)據(jù)是反應(yīng)用戶屬性和用戶相關(guān)的數(shù)據(jù)。雖然用戶數(shù)據(jù)定義很簡潔,但其并不簡單,用戶數(shù)據(jù)包含及可深挖的內(nèi)容很多。從小的方面來講,用戶數(shù)據(jù)包含日活和月活等,再大的方面包含從用戶畫像、用戶屬性、用戶層級到用戶心理、用戶行為習(xí)慣等。這一切都需要有用戶數(shù)據(jù)的支持。當然,根據(jù)產(chǎn)品特性的不同,人們要了解用戶的深度和側(cè)重點都有所不同,例如電商更側(cè)重于用戶的喜好、年齡及購買力等,金融類更側(cè)重于用戶的信用、工作信息、財務(wù)信息等。2.2.2圖文數(shù)據(jù)新媒體平臺自帶的圖文數(shù)據(jù)通常被稱為基礎(chǔ)圖文指標,這是運營人員必看的數(shù)據(jù)。例如,通過它們,運營人員可以知道每篇公眾號圖文的送達人數(shù)、閱讀人數(shù)、轉(zhuǎn)發(fā)人數(shù)。以微信公眾號為例,公眾號基礎(chǔ)圖文指標主要包含單篇圖文閱讀數(shù)據(jù)、單篇圖文傳播數(shù)據(jù)和多篇圖文閱讀數(shù)據(jù)。第2章:新媒體數(shù)據(jù)分析指標2.2數(shù)據(jù)運營維度2.2.3競品數(shù)據(jù)競品就是競爭對手的產(chǎn)品。競品數(shù)據(jù)就是競爭對手產(chǎn)品的相關(guān)數(shù)據(jù)。競品分析基于“如何更好地滿足用戶需求”,通過對比自家產(chǎn)品和競爭產(chǎn)品在各個維度上的指標,明確自身的優(yōu)勢、劣勢、機會和威脅,為產(chǎn)品設(shè)計、運營活動、戰(zhàn)略規(guī)劃等提供市場參考和行動建議。競品數(shù)據(jù)主要包含以下幾個方面的內(nèi)容。(1)企業(yè)信息。

企業(yè)信息指的是競爭對手的公司技術(shù)、市場、產(chǎn)品、運營團隊規(guī)模、核心目標、產(chǎn)品定位和行業(yè)品牌影響力,實際季度年度盈利數(shù)值,各條產(chǎn)品線資金重點投入信息,占據(jù)公司主盈利的產(chǎn)品線等。(2)產(chǎn)品信息。

產(chǎn)品信息指的是競品版本發(fā)布的情況,產(chǎn)品功能細分和對比,產(chǎn)品的穩(wěn)定性、易用性、用戶體驗交互、視覺設(shè)計實力、技術(shù)實現(xiàn)框架優(yōu)劣勢等。(3)運營信息。

運營信息指的是競品用戶群體覆蓋及市場占有率,競品運營策略、盈利模式等。在新媒體運營過程中,除了分析自身數(shù)據(jù),對競品的數(shù)據(jù)觀測和分析也是一項很重要的工作。做好競品數(shù)據(jù)分析可以更客觀地評估自身運營狀況,也可以從中發(fā)現(xiàn)新的機會。

第2章:新媒體數(shù)據(jù)分析指標2.2數(shù)據(jù)運營維度2.2.4行業(yè)數(shù)據(jù)不同的行業(yè)往往有不同的數(shù)據(jù)指標。(1)互聯(lián)網(wǎng)行業(yè)。互聯(lián)網(wǎng)行業(yè)主要按照產(chǎn)品生命周期來劃分,在拉新階段有成本指標、策略指標等;在活躍階段需要關(guān)注周期性的活躍用戶數(shù)、產(chǎn)品使用時長等指標;在留存階段,如何讓用戶持續(xù)活躍、提高用戶粘性,或者將已經(jīng)流失的老用戶重新召回成使用用戶,所以留存率、流失率和召回率是這個階段需要重點關(guān)注的;在轉(zhuǎn)化階段,用戶開始貢獻商業(yè)價值,不同產(chǎn)品的轉(zhuǎn)化目標不同;最后在傳播階段需要關(guān)注老用戶傳播推薦產(chǎn)品、帶來新用戶的過程。(2)在線教育行業(yè)。在線教育行業(yè)的分析指標在流程上可以按照:拉新獲課—付費—續(xù)費復(fù)購的過程來分析,其重點在于提高轉(zhuǎn)化率,降低投產(chǎn)比,同時對學(xué)員、課程進行分析,打造出符合用戶需求,受用戶歡迎的課程產(chǎn)品與組合。(3)零售行業(yè)。零售行業(yè)主要分為三個方面:人、貨和場。這里的人指的是兩個方面,一是企業(yè)員工,二是消費者。在這個消費者掌握主動權(quán)的時代,想要做好零售,除了加強員工管理,提升人員效率,更重要的是提高消費者忠誠度。貨就是指商品,商品數(shù)據(jù)分析的核心就是圍繞進銷存展開的,其重點就是對商品結(jié)構(gòu)的分析和商品消化跟進分析。場就是消費場景,所有連接消費者和商品的終端,就是場,例如線下門店、線上的購物網(wǎng)站、APP、小程序等。03用戶增長維度——以微信公眾號為例第2章:新媒體數(shù)據(jù)分析指標2.3用戶增長維度—以微信公眾號為例以微信公眾平臺為例,可以在微信公眾號后臺查看昨天的關(guān)注人數(shù)變化,以及與前天、7天前、30天前的關(guān)注人數(shù)進行對比,體現(xiàn)為日、周、月的百分比變化,如圖所示。對運營人員來說,其優(yōu)先需要關(guān)注的指標是“新關(guān)注人數(shù)”,它是賬號拉新能力的體現(xiàn)。如果某天發(fā)現(xiàn)“新關(guān)注人數(shù)”相比平時的數(shù)據(jù)有明顯上升,要么說明上一篇文章內(nèi)容受到用戶的歡迎,要么說明某項推廣起作用了,這樣就可以多準備一些與之相關(guān)的內(nèi)容。2.3.1核心數(shù)據(jù)指標第2章:新媒體數(shù)據(jù)分析指標2.3用戶增長維度—以微信公眾號為例除了查看當前數(shù)據(jù),運營人員還可以針對新關(guān)注人數(shù)、取消關(guān)注人數(shù)、凈增關(guān)注人數(shù)、累積關(guān)注人數(shù)進行趨勢分析。在微信公眾號后臺,趨勢分析可選擇的時間周期為7天、14天、30天或365天之內(nèi)某個時間段的關(guān)注人數(shù)變化,圖所示為某微信公眾號2020-10-21至2020-11-19的新關(guān)注人數(shù)變化。2.3.2關(guān)鍵指標趨勢圖第2章:新媒體數(shù)據(jù)分析指標2.3用戶增長維度—以微信公眾號為例如果要將上個月與這個月用戶的增長情況進行對比分析,則可以選擇按時間進行單月的數(shù)據(jù)對比分析,如右圖所示。如果對比后發(fā)現(xiàn)自己的賬號“漲粉”數(shù)比上個月同期的“漲粉”數(shù)少,那就需要尋找原因。2.3.2關(guān)鍵指標趨勢圖第2章:新媒體數(shù)據(jù)分析指標2.3.3新增關(guān)注來源分析新增關(guān)注來源是大部分數(shù)據(jù)分析人員很容易忽略的數(shù)據(jù),它的研究價值在于了解目前哪個推廣方式的效果更好搜一搜如果有40%的關(guān)注量來自公眾號搜索,則說明這類公眾號已經(jīng)有一定的品牌知名度,定位也相對垂直,或者是在廣告宣傳方面做得比較到位。掃描二維碼這是十分常見的關(guān)注方式,用戶通過掃描二維碼關(guān)注主要分為線上和線下兩種場景。圖文頁右上角菜單用戶在閱讀文章的界面,選擇右上角菜單中的“查看公眾號”,即可進入公眾號主頁進行關(guān)注。圖文頁內(nèi)公眾號名稱用戶通過文章標題下方的藍色字體進行關(guān)注也是一種較為常見的關(guān)注方式,很多公眾號也會在文章開頭提示用戶通過此方式來關(guān)注公眾號。名片分享名片分享一般是用戶主動將公眾號推薦給朋友或分享到群,如果通過這個方式帶來了新增用戶,則說明公眾號質(zhì)量很不錯。支付后關(guān)注用戶通過支付后關(guān)注的公眾號必須認證過,并且開通了微信支付功能。用戶通過微信付款后會默認關(guān)注該公眾號。04用戶屬性與互動維度——以微信公眾號為例很多新媒體平臺的數(shù)據(jù)分析后臺會包括用戶屬性數(shù)據(jù)。用戶屬性數(shù)據(jù)是指對用戶按照性別、年齡、城市等不同屬性進行劃分,通過了解用戶屬性,運營人員可以更有針對性地、更好地為用戶提供內(nèi)容和服務(wù)。第2章:新媒體數(shù)據(jù)分析指標人口特征人口特征包括性別分布、年齡分布和地區(qū)分布等。運營人員可以根據(jù)這些數(shù)據(jù)對文章的風(fēng)格進行調(diào)整。例如,在中年男性用戶占比較大的情況下,通常不適合討論與美妝、時尚相關(guān)的話題,或者也不適合使用可愛的語言風(fēng)格。下圖分別為某平臺粉絲管理中心的粉絲性別、粉絲年齡分布。第2章:新媒體數(shù)據(jù)分析指標地域歸屬這塊數(shù)據(jù)的參考價值較大,運營人員可以非常清晰地知道自己的關(guān)注用戶在各個城市的分布情況,依據(jù)此數(shù)據(jù)可以做一些關(guān)鍵的決策。右圖是微信公眾號關(guān)注用戶?。ㄖ陛犑校┘壏植急?。訪問設(shè)備同樣的標題和封面在不同訪問設(shè)備上顯示的效果是不一樣的。例如,某個公眾號通過公眾號機型終端分布,發(fā)現(xiàn)使用蘋果設(shè)備的用戶最多,那么整個圖文的排版、封面尺寸的選擇、標題的長度都需要優(yōu)先調(diào)整到蘋果設(shè)備用戶閱讀體驗最滿意的狀態(tài)。下圖微信公眾號關(guān)注用戶終端分布。05圖文維度——以微信公眾號為例新媒體平臺上每一篇圖文內(nèi)容的數(shù)據(jù)情況稱為基礎(chǔ)圖文指標,這是新媒體運營中必須參考的數(shù)據(jù)。通過它們,運營人員可以知道每篇圖文的送達人數(shù)、閱讀人數(shù)、轉(zhuǎn)發(fā)人數(shù)等。第2章:新媒體數(shù)據(jù)分析指標2.5.1單篇圖文數(shù)據(jù)單篇圖文數(shù)據(jù)分析是對單次推送的圖文數(shù)據(jù)進行分析的,如下圖所示。對于已群發(fā)的內(nèi)容,新媒體數(shù)據(jù)運營人員可以看到群發(fā)后7天的基礎(chǔ)數(shù)據(jù)。閱讀次數(shù):單擊圖文頁去重人數(shù),包括非粉絲,具體閱讀來源包括公眾號會話、朋友圈、好友轉(zhuǎn)發(fā)、歷史消息等。分享次數(shù):轉(zhuǎn)發(fā)或分享至好友、朋友圈、微博的去重用戶數(shù),包括非粉絲的分享。第2章:新媒體數(shù)據(jù)分析指標2.5.1單篇圖文數(shù)據(jù)單擊單篇內(nèi)容右側(cè)的“詳情”,還可以查看送達轉(zhuǎn)化、分享轉(zhuǎn)化、數(shù)據(jù)趨勢、閱讀完成情況及用戶頭像。(1)送達轉(zhuǎn)化。送達轉(zhuǎn)化俗稱“打開率”,其公式為:送達轉(zhuǎn)化=公眾號消息閱讀次數(shù)÷送達人數(shù)(2)分享轉(zhuǎn)化。分享轉(zhuǎn)化包含兩個:一個是首次分享次數(shù)與公眾號消息閱讀次數(shù)之比,這個數(shù)值代表了這篇文章的首次分享率;另一個是分享產(chǎn)生的閱讀次數(shù)與總分享次數(shù)之比,這數(shù)值體現(xiàn)了用戶分享帶來了多少閱讀量,其中閱讀來源包括好友會話、群聊、朋友圈、朋友在看等。第2章:新媒體數(shù)據(jù)分析指標2.5.1單篇圖文數(shù)據(jù)單擊單篇內(nèi)容右側(cè)的“詳情”,還可以查看送達轉(zhuǎn)化、分享轉(zhuǎn)化、數(shù)據(jù)趨勢、閱讀完成情況及用戶頭像。(3)數(shù)據(jù)趨勢。數(shù)據(jù)趨勢包括該文章在不同傳播渠道中的圖文閱讀情況(閱讀的人數(shù)和次數(shù))和圖文分享情況(轉(zhuǎn)發(fā)或分享到好友會話、群聊、朋友圈及選擇朋友在看的人數(shù)及次數(shù))(4)閱讀完成情況。在單篇文章的閱讀完成情況里,文章被分為20等份,每5%為一個錨點,可以看到用戶在每個錨點位置的跳出比例(5)用戶畫像。用戶畫像包括性別分布、年齡分布和地域分布,可以對照賬號的用戶畫像來查看第2章:新媒體數(shù)據(jù)分析指標2.5.1單篇圖文數(shù)據(jù)單擊單篇內(nèi)容右側(cè)的“詳情”,還可以查看送達轉(zhuǎn)化、分享轉(zhuǎn)化、數(shù)據(jù)趨勢、閱讀完成情況及用戶頭像。(3)數(shù)據(jù)趨勢。數(shù)據(jù)趨勢包括該文章在不同傳播渠道中的圖文閱讀情況(閱讀的人數(shù)和次數(shù))和圖文分享情況(轉(zhuǎn)發(fā)或分享到好友會話、群聊、朋友圈及選擇朋友在看的人數(shù)及次數(shù))(4)閱讀完成情況。在單篇文章的閱讀完成情況里,文章被分為20等份,每5%為一個錨點,可以看到用戶在每個錨點位置的跳出比例(5)用戶畫像。用戶畫像包括性別分布、年齡分布和地域分布,可以對照賬號的用戶畫像來查看第2章:新媒體數(shù)據(jù)分析指標2.5.2全部圖文數(shù)據(jù)全部圖文數(shù)據(jù)是對公眾號整體內(nèi)容質(zhì)量的分析,是指該公眾號發(fā)出去的所閱圖文在某時間段的閱讀數(shù)據(jù)的總和。全部圖文數(shù)據(jù)主要包含4個核心數(shù)據(jù)段:圖文閱讀次數(shù)、原文閱讀次數(shù)、分享轉(zhuǎn)發(fā)次數(shù)、微信收藏人數(shù)。(1)圖文閱讀次數(shù):所有圖文在某個時間段的閱讀次數(shù)。(2)原文閱讀次數(shù):用戶單擊一篇文章左下角“閱讀原文”的次數(shù),這個數(shù)據(jù)很考驗用戶的黏性,以及本篇文章的內(nèi)容質(zhì)量。(3)分享轉(zhuǎn)發(fā)次數(shù):所有圖文在某個時間段的分享次數(shù)。(4)微信收藏人數(shù):所有圖文在某個時間段的收藏人數(shù)(去重且包括非粉絲)。06用戶互動維度——以微信公眾號為例用戶互動數(shù)據(jù)是指用戶對內(nèi)容的點贊、留言等互動情況,是衡量用戶黏性的重要數(shù)據(jù)。以微信公眾號為例,用戶常見的操作行為包括兩類,一類是基于某篇圖文的留言、點贊、贊賞,另一類是基于公眾號收到的用戶消息。第2章:新媒體數(shù)據(jù)分析指標2.6.1留言點贊運營人員可以用留言或點贊與閱讀量的比值來衡量用戶對該篇文章的互動情況,該比值越高,用戶對該篇文章互動越明顯。通過橫向比較不同文章之間的留言點贊情況,運營人員可以得知哪些內(nèi)容是用戶愿意發(fā)表意見的,哪些內(nèi)容是用戶不太感興趣的。對于互動效果好的內(nèi)容類型,運營人員可以多策劃這方面的文章,來提升用戶黏性。2.6.2用戶消息運營人員為了引導(dǎo)用戶互動和關(guān)注,經(jīng)常會策劃一些送福利的活動,例如,在微信公眾號中運營人員常用的方法是設(shè)置關(guān)鍵詞自動回復(fù),如果用戶想要知道這次活動的參與情況,就必須關(guān)注公眾號消息數(shù)據(jù)指標。在微信公眾平臺和統(tǒng)計消息分析,可查看用戶在公眾號的互動情況。通過選擇小時報、日報、周報或月報,運營人員可以查看相應(yīng)時間內(nèi)的消息發(fā)送人數(shù)、消息發(fā)送次數(shù)及人均發(fā)送次數(shù)。本章小結(jié)本章從新媒體數(shù)據(jù)分析指標方面,系統(tǒng)的闡述了新媒體數(shù)據(jù)指標體系和用戶運營唯獨的各項數(shù)據(jù)指標。我們在做新媒體數(shù)據(jù)分析和新媒體運營工作前,搭建好所需要的指標體系非常重要,這不僅對后續(xù)數(shù)據(jù)處理和統(tǒng)計提供了標準,也為數(shù)據(jù)評價搭建了評價指標。對于新媒體數(shù)據(jù)運營,需要查看如下幾個緯度的數(shù)據(jù):用戶數(shù)據(jù)、圖文數(shù)據(jù)、競品數(shù)據(jù)、行業(yè)數(shù)據(jù)。第2章:新媒體數(shù)據(jù)分析指標本章內(nèi)容結(jié)束!Endofthischapter!新媒體數(shù)據(jù)分析與應(yīng)用新媒體數(shù)據(jù)分析與應(yīng)用第3章:新媒體數(shù)據(jù)的準備本章提綱CONTENTS新媒體的數(shù)據(jù)來源01理解數(shù)據(jù)023.1新媒體的數(shù)據(jù)來源第3章:新媒體的數(shù)據(jù)來源

3.1.1新媒體數(shù)據(jù)類型朋友圈一般指的是微信上的一個社交功能,用戶可以通過朋友圈發(fā)表文字和圖片,同時可通過其他軟件將文章或音樂分享到朋友圈。用戶可以對好友新發(fā)布的內(nèi)容或照片進行“評論”或“點贊”,其他用戶只能看到相同好友的評論或點贊。用此作為主要推廣平臺的新媒體團隊,也可借助新媒體的東風(fēng),拓寬了他們的營銷思路,借助“社群運營+朋友圈運營”的雙重新模式來進行品牌的宣傳、產(chǎn)品的推廣、知名度的提升、營銷利潤的增加。右圖是微商借助朋友圈出售產(chǎn)品的截圖。1.微信朋友圈數(shù)據(jù)第3章:新媒體的數(shù)據(jù)來源

3.1.1新媒體數(shù)據(jù)類型與朋友圈數(shù)據(jù)相對應(yīng)的是微信公眾號數(shù)據(jù),該數(shù)據(jù)對微信公眾號的運營與產(chǎn)品、品牌下一步的發(fā)展都有很強的借鑒分析作用。利用公眾號平臺進行自媒體活動,簡單來說就是進行一對多的媒體行為活動。通過變換風(fēng)格內(nèi)容并分析閱讀數(shù)據(jù),運營人員可以分析出粉絲的閱讀喜好與偏好;通過分析后臺粉絲數(shù)量的增減,運營人員可以分析前一階段的宣傳與推廣,是否真的起到了積極正面的作用。微信公眾號數(shù)據(jù)自身自有的計算渠道,運營人員能夠很直觀地了解當天的運營狀況,包含新增重視數(shù)、撤銷重視數(shù)、單篇文章閱覽量、悉數(shù)圖文閱覽量,甚至還能夠挑選時間階段進行計算。右圖是某商家利用公眾號來出售產(chǎn)品的真實截圖,圖中公眾號名稱和認證地址略去。2.微信公眾號數(shù)據(jù)第3章:新媒體的數(shù)據(jù)來源

3.1.1新媒體數(shù)據(jù)類型微博是指一種基于用戶關(guān)系信息分享、傳播及獲取通過關(guān)注機制分享簡短實時信息的廣播式的社交媒體和網(wǎng)絡(luò)平臺,允許用戶通過Web、Mail、App、IM、SMS及PC、手機等多種終端接入,以文字、圖片、視頻等多媒體形式,實現(xiàn)信息的即時分享、傳播互動。微博作為新型社交媒體的代表,在現(xiàn)代社會尤其是年輕人中,起到了極強的輿論影響作用。微博熱搜榜(見右圖)更是可以左右部分輿論的風(fēng)向。事實上,微博作為一種社交平臺,免費向大眾開放。無論是個人還是企業(yè)都能夠在微博后臺檢查詳細的微博數(shù)據(jù),其具體方式是登錄網(wǎng)頁版微博后,單擊“管理中心”,進入“數(shù)據(jù)助手,了解當前的微博數(shù)據(jù)。作為運營人員,最常關(guān)注的微博數(shù)據(jù)有閱覽數(shù)、閱覽量、視頻播放量、粉絲來源和粉絲新增及取關(guān)數(shù)等。3.微博數(shù)據(jù)第3章:新媒體的數(shù)據(jù)來源

3.1.1新媒體數(shù)據(jù)類型今日頭條是北京字節(jié)跳動科技有限公司開發(fā)的一款基于數(shù)據(jù)挖掘的推薦引擎產(chǎn)品,為用戶推薦信息、提供連接人與信息服務(wù)的產(chǎn)品。今日頭條基于個性化推薦引擎技術(shù),根據(jù)每個用戶的興趣、位置等多個維度進行個性化推薦,推薦內(nèi)容不僅包括狹義上的新聞,還包括音樂、電影、游戲、購物等資訊。根據(jù)用戶的社交行為、閱讀行為、地理位置、職業(yè)、年齡等挖掘出興趣。通過分析用戶的社交行為,今日頭條的推薦系統(tǒng)可以在5秒內(nèi)計算出用戶興趣;再通過分析用戶行為,用戶每次操作后,10秒內(nèi)更新用戶模型。作為一種新興的內(nèi)容平臺,今日頭條的后臺具有更加強大的數(shù)據(jù)統(tǒng)計功能。新媒體運營人員及相關(guān)產(chǎn)業(yè)的人,可以借助今日頭條的相關(guān)數(shù)據(jù),對雙標題效果(見右圖)、內(nèi)容、推薦、閱讀、評論進行相關(guān)分析。4.今日頭條數(shù)據(jù)第3章:新媒體的數(shù)據(jù)來源

3.1.1新媒體數(shù)據(jù)類型抖音同樣作為字節(jié)跳動的主打產(chǎn)品,與今日頭條的推薦信息有所區(qū)別,今日頭條推薦狹義上的新聞,還包括音樂、電影、游戲、購物等資訊,而抖音則以短視頻為主,是一個面向全年齡的音樂短視頻社交平臺。根據(jù)對抖音平臺及其經(jīng)營模式的相關(guān)分析,需要關(guān)注的數(shù)據(jù)主要來自以下幾個方面(見右圖):粉絲數(shù)量、點贊互動數(shù)據(jù)、粉絲的年齡性別、個人認證情況等進行多維度數(shù)據(jù)查找篩選。可根據(jù)已知的商品關(guān)鍵詞及商品鏈接、品牌等關(guān)鍵詞進行查找相關(guān)帶貨達人。可查看帶貨達人的視頻帶貨銷量數(shù)據(jù)。5.抖音數(shù)據(jù)第3章:新媒體的數(shù)據(jù)來源

3.1.2網(wǎng)站數(shù)據(jù)網(wǎng)站數(shù)據(jù)分析(見右圖)是通過觀察、調(diào)查、實驗、測量等方式,通過數(shù)據(jù)的顯示形式把網(wǎng)站各方面的情況反映出來,使運營人員更加了解網(wǎng)站的運營情況,便于調(diào)整網(wǎng)站的運營策略。網(wǎng)站數(shù)據(jù)分析是圍繞顧客進行的,公司不同部門需要的數(shù)據(jù)不一樣:市場部門想知道哪些廣告能帶來有價值的客戶;編輯部門想知道用戶喜歡哪些文章;采購部門了解用戶經(jīng)常購買哪些產(chǎn)品等。第3章:新媒體的數(shù)據(jù)來源

3.1.2網(wǎng)站數(shù)據(jù)對虛擬空間商來說,網(wǎng)站流量是指用戶在訪問網(wǎng)站過程中產(chǎn)生的數(shù)據(jù)量大小。網(wǎng)站流量統(tǒng)計的主要指標包括以下幾個方面。獨立訪問者數(shù)量(UniqueVisitors)。重復(fù)訪問者數(shù)量(RepeatVisitors)。頁面瀏覽數(shù)(PageViews)。每個訪問者的頁面瀏覽數(shù)(PageViewsperuser)。某些具體文件/頁面的統(tǒng)計指標,例如頁面顯示次數(shù)、文件下載次數(shù)等。1.網(wǎng)站流量跳出率指用戶通過搜索關(guān)鍵詞來到網(wǎng)站,僅瀏覽了一個頁面就離開的訪問次數(shù)與所有訪問次數(shù)的百分比。觀察關(guān)鍵詞的跳出率就可以得知用戶對網(wǎng)站內(nèi)容的認可,或者說網(wǎng)站是否對用戶有吸引力。跳出率的計算公式如下:跳出率=訪問一個頁面后離開網(wǎng)站的次數(shù)/總訪問次數(shù)2.跳出率第3章:新媒體的數(shù)據(jù)來源

3.1.2網(wǎng)站數(shù)據(jù)“來路”就是用戶通過什么地址鏈接目標網(wǎng)站。例如,某某網(wǎng)頁上有一個鏈接,其鏈接到了網(wǎng)頁上。當訪客單擊網(wǎng)頁上的鏈接,鏈接到了目標網(wǎng)頁上,則該網(wǎng)站的來路就是鏈接。最常見的幾種網(wǎng)站來路如下圖所示。3.網(wǎng)站來路第3章:新媒體的數(shù)據(jù)來源

3.1.2網(wǎng)站數(shù)據(jù)網(wǎng)站訪問深度就是用戶在瀏覽某個網(wǎng)站的過程中瀏覽的該網(wǎng)站的頁數(shù)。如果用戶一次性瀏覽的該網(wǎng)站的頁數(shù)多,那么基本上可以認定,該網(wǎng)站有用戶感興趣的東西。用戶訪問網(wǎng)站的深度用數(shù)據(jù)可以理解為網(wǎng)站平均訪問的頁面數(shù),就是PV和UV的比值,這個比值越大,用戶體驗度越好,網(wǎng)站的粘性也越高。在自媒體時代,提高網(wǎng)站的訪問深度,可以從以下兩個方面著手:首先,要不斷調(diào)整網(wǎng)站的排版與布局,迎合當今時代的審美需要。網(wǎng)站的結(jié)構(gòu)應(yīng)當適應(yīng)該網(wǎng)站的主題,盡可能簡單明了,將預(yù)定的功能設(shè)置明確,迎合簡單明了的時代主題。其次,對網(wǎng)站的內(nèi)容也要進行不斷調(diào)整。網(wǎng)站的設(shè)計與板塊處理,作為一種外在因素,只能暫時吸引用戶,若想真正留住用戶,將其變成潛在客戶或留住原有客戶,還需要有用的信息,用戶可以獲得自己想要的東西。

4.訪問深度第3章:新媒體的數(shù)據(jù)來源

3.1.3爬蟲工具

網(wǎng)絡(luò)爬蟲又稱網(wǎng)頁蜘蛛、網(wǎng)絡(luò)機器人、網(wǎng)頁追逐者,是一種按照一定的規(guī)則自動地抓取互聯(lián)網(wǎng)信息的程序或腳本。

在新媒體時代,各種信息爆炸式增長。隨著網(wǎng)絡(luò)的迅速發(fā)展,互聯(lián)網(wǎng)成為大量信息的載體,如何有效地提取并利用這些信息成為一個巨大的挑戰(zhàn)。搜索引擎作為輔助人們檢索信息的工具,成為用戶訪問互聯(lián)網(wǎng)的入口和指南。但是,通用搜索引擎也存在著一定的局限性。針對搜索引擎的問題與不足,通過爬蟲軟件,一些看似微不足道的數(shù)據(jù)在收集、整理、提取、分析之后會產(chǎn)生巨大的裨益。

第3章:新媒體的數(shù)據(jù)來源

3.1.3爬蟲工具垂直搜索是指將搜索范圍細分至某一專業(yè)領(lǐng)域,針對初次獲取的網(wǎng)頁信息進行更深層次的整合,最終形成“純度”更高的專業(yè)領(lǐng)域信息。以采購招標信息為主的網(wǎng)站,例如中國采摘網(wǎng)、劍魚,其數(shù)據(jù)就是利用爬蟲從網(wǎng)上的上萬家企事業(yè)單位爬取來的,再經(jīng)過技術(shù)整合后發(fā)布到網(wǎng)站上提供服務(wù)。經(jīng)過這樣的操作,即使一個新開發(fā)的網(wǎng)站,通過數(shù)據(jù)采集技術(shù)也可以很輕松地填滿所有內(nèi)容,讓其能夠正常運營。1.行業(yè)垂直搜索——招標信息平臺大數(shù)據(jù)在個人金融授信的方面起著重要作用。結(jié)合新媒體的背景,利用爬蟲技術(shù)獲取個人消費信息,進行整合分析,為個人消費提供指南。2.金融消費——個人金融授信在信息社會,比別人先一步掌握信息的人是市場的贏家,傳統(tǒng)模式的人工處理顯然是低效率的。借助爬蟲技術(shù),商家在入駐某網(wǎng)站后,系統(tǒng)能自動抓取廠商工單,售后管理變得簡單高效。在新媒體平臺的輔助下,后臺管理員可以及時獲取用戶的閱覽、購買信息,及時處理各項訂單。3.信息鏈接互聯(lián)第3章:新媒體的數(shù)據(jù)來源

3.1.4數(shù)據(jù)收集中常見的問題與解決方案新媒體時代的信息爆炸,帶來了巨大的信息量,反倒讓信息收集者不知道選取哪些有用的信息。數(shù)據(jù)收集是一件非常煩瑣的事情,一旦出現(xiàn)失誤,就會浪費大量的時間和精力。收集數(shù)據(jù)時,如果不知道從何處下手,則可以從數(shù)據(jù)使用者的角度出發(fā),把握數(shù)據(jù)分析的切入點。1.不知從何處下手在新媒體的背景下,過量的信息同樣帶來一個問題,那就是收集的信息可能是無用的,并不能滿足當前的目標要求。然而在大量的信息中查找有效信息,是無法避免的,因而在一定的范圍內(nèi)查找有用信息,要具有針對性。雖然信息的種類多種多樣,信息的來源也是多種多樣的,但是只要找到了有針對性的問題,就可以找到自己所需要的信息。2.收集的信息無用同樣,在新媒體這個大數(shù)據(jù)時代,人們獲取信息的渠道增多,獲取的信息量也增多,但是在這個信息時代,想要在巨量的信息中將自己所需要的信息完全提取,也不是一件容易的事,沒有將所需要的信息完全采集,就導(dǎo)致數(shù)據(jù)分析結(jié)論不夠真實,缺乏證據(jù)。3.收集的信息不全面3.2理解數(shù)據(jù)第3章:新媒體的數(shù)據(jù)來源

3.2.1字段與記錄數(shù)據(jù)包含字段與記錄,可以從數(shù)據(jù)分析的角度來理解字段和記錄的概念。字段是事物或現(xiàn)象的某種特征。如圖中的“月份”“總篇數(shù)”等都是字段,字段在統(tǒng)計學(xué)中稱為變量。記錄是事物或現(xiàn)象的具體表現(xiàn)。如圖中的“總篇數(shù)”可以是130或131等,記錄也稱數(shù)據(jù)或變量值。第3章:新媒體的數(shù)據(jù)來源

3.2.2數(shù)據(jù)類型數(shù)據(jù)還有一個基本的屬性就是數(shù)據(jù)類型,不同軟件中定義的數(shù)據(jù)類型不太一致,但是數(shù)字、文字和日期型是最常用的三類數(shù)據(jù)類型。在Excel中有很多數(shù)據(jù)類型,想要查看具體的數(shù)據(jù)類型,可在Excel中的任意一個單元格單擊鼠標右鍵,在彈出的快捷菜單中選擇“設(shè)置單元格格式”選項,彈出一個對話框,如下圖所示。在這個對話框中,可以看到不同的數(shù)據(jù)類型,如數(shù)值、文本、日期、貨幣、會計專用、時間、百分比、分數(shù)、科學(xué)記數(shù)、特殊等。第3章:新媒體的數(shù)據(jù)來源

3.2.2數(shù)據(jù)類型雖然Excel中有這么多數(shù)據(jù)類型,但最終都可以歸結(jié)為以下兩大類。字符型數(shù)據(jù):字符型數(shù)據(jù)是不具有計算能力的文字數(shù)據(jù)類型。它包括中文字符、英文字符、數(shù)字字符(非數(shù)值型)等。例如,成績表中的“姓名”變量為字符型數(shù)據(jù)。數(shù)值型數(shù)據(jù):數(shù)值型數(shù)據(jù)是直接使用自然數(shù)或度量單位進行計量的數(shù)值數(shù)據(jù)。如,成績表中的“編號”“成績”就是數(shù)值型數(shù)據(jù),這類數(shù)據(jù)可以直接用算術(shù)方法進行匯總和分析,這一點是區(qū)分數(shù)據(jù)是否屬于數(shù)值型數(shù)據(jù)的重要依據(jù)。第3章:新媒體的數(shù)據(jù)來源

3.2.3數(shù)據(jù)表數(shù)據(jù)表由字段、記錄構(gòu)成,滿足一定的數(shù)據(jù)類型。數(shù)據(jù)分析需要的數(shù)據(jù)表,在設(shè)計時的具體要求如下。(1)數(shù)據(jù)表由標題行和數(shù)據(jù)部分組成。(2)第一行是表的列標題(字段名),列標題不能重復(fù)。(3)第二行起是數(shù)據(jù)部分,數(shù)據(jù)部分的每一行數(shù)據(jù)稱為一個記錄,并且數(shù)據(jù)部分不允許出現(xiàn)空白行和空白列。(4)數(shù)據(jù)表中不能存在合并單元格。(5)數(shù)據(jù)表與其他數(shù)據(jù)之間應(yīng)該留出至少一個空白行和空白列。1.數(shù)據(jù)表設(shè)計要求第3章:新媒體的數(shù)據(jù)來源

3.2.3數(shù)據(jù)表數(shù)據(jù)表由表名、表中的字段和表的記錄三個部分組成。設(shè)計數(shù)據(jù)表結(jié)構(gòu)就是定義數(shù)據(jù)表文件名,確定數(shù)據(jù)表包含哪些字段,各字段的字段名、字段類型及寬度,并將這些數(shù)據(jù)輸入計算機中。在建立表之前都必須設(shè)計表結(jié)構(gòu),表結(jié)構(gòu)描述了一個表的框架。設(shè)計表結(jié)構(gòu)實際上就是定義組成一個表的字段個數(shù),以及每個字段的名稱、數(shù)據(jù)類型和長度等信息。設(shè)計表的結(jié)構(gòu)要求如下。(1)確定表名。表名要確保唯一性,表的名稱要與用途相符,簡略、直觀、見名知意。(2)確定字段名稱。

字段名長度小于64個字符。字段名可以包括字母、漢字、數(shù)字、空格和其他字符。字段名不可以包括句號(。)、感嘆號(!)、方括號([])和頓號(、)。字段名不可以以先導(dǎo)空格開頭。(3)確定字段類型。以微軟提供的Access辦公軟件為例,它提供了10種數(shù)據(jù)類型,以滿足字段的不同需要。(4)確定字段屬性。例如字段大小、格式、默認值、必填字段、有效性規(guī)則、有效性文本和索引等。(5)確定表中唯一能識別記錄的主關(guān)鍵詞段,即主鍵。1.數(shù)據(jù)表結(jié)構(gòu)本章小結(jié)在本章中,我們了解了新媒體數(shù)據(jù)的來源。新媒體的數(shù)據(jù)類型包括微信朋友圈數(shù)據(jù)、微信公眾號數(shù)據(jù)、微博數(shù)據(jù)、今日頭題數(shù)據(jù)以及抖音數(shù)據(jù)。也了解了網(wǎng)站數(shù)據(jù)的一些專有名詞,包括網(wǎng)站流量、跳出率、網(wǎng)站來源、訪問深度。同時,我們在數(shù)據(jù)搜集中會遇到很多問題,包括不知道怎么下手,收集的數(shù)據(jù)無用或者不全面,對數(shù)據(jù)類型不理解等等,我們這章中都做了具體的介紹,并給出了一些相對應(yīng)的解決方案。第3章:新媒體的數(shù)據(jù)來源本章內(nèi)容結(jié)束!Endofthischapter!新媒體數(shù)據(jù)分析與應(yīng)用新媒體數(shù)據(jù)分析與應(yīng)用第4章:新媒體數(shù)據(jù)的處理本章提綱CONTENTS數(shù)據(jù)清洗01數(shù)據(jù)加工024.1數(shù)據(jù)清洗第4章:新媒體數(shù)據(jù)的處理4.1數(shù)據(jù)清洗數(shù)據(jù)清洗指的是對數(shù)據(jù)進行重新檢查,發(fā)現(xiàn)其中常見的錯誤,其目的主要在于刪除重復(fù)信息、糾正存在的錯誤,提高數(shù)據(jù)分析的準確性。數(shù)據(jù)清洗的基本流程是先檢查數(shù)據(jù)中可能存在的錯誤,包括檢查數(shù)據(jù)與元數(shù)據(jù)的一致性,處理重復(fù)值和缺失值等。因為從數(shù)據(jù)庫中收集來的數(shù)據(jù)是從多個業(yè)務(wù)系統(tǒng)中抽取而來的,其中包含歷史數(shù)據(jù),這樣就避免不了有的數(shù)據(jù)是錯誤數(shù)據(jù)、有的數(shù)據(jù)之間有沖突,這些錯誤的或有沖突的數(shù)據(jù)顯然是人們不想要的。數(shù)據(jù)清洗就是把這類數(shù)據(jù)清洗掉,過濾不符合要求的數(shù)據(jù),具體而言就是將多余的重復(fù)的數(shù)據(jù)篩選清除,將確實的數(shù)據(jù)補充完整,將錯誤的數(shù)據(jù)糾正或刪除。對清洗后的數(shù)據(jù)進行數(shù)據(jù)分析,能夠得到較為準確的結(jié)論,從而能夠為管理決策提供支持。第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——自定義需要處理的數(shù)據(jù)表

首先,在Excel中自定義一個帶有重復(fù)數(shù)據(jù)和缺失數(shù)據(jù)的數(shù)據(jù)表,如下圖所示。圖中數(shù)據(jù)表的第二列含有缺失數(shù)據(jù),第三列含有重復(fù)數(shù)據(jù)。圖4-1第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——識別重復(fù)數(shù)據(jù)在處理重復(fù)數(shù)據(jù)之前,需要先對數(shù)據(jù)表中的重復(fù)數(shù)據(jù)進行識別,尤其是當數(shù)據(jù)量特別大的時候,這一步尤為重要。在Excel中共有四種識別重復(fù)數(shù)據(jù)的方法。countif函數(shù)的作用是對區(qū)域中滿足單個指定條件的單元格進行計數(shù),其基本格式為countif(range,criteria),range表示想要計算的單元格范圍,criteria表示計算條件,其形式可以為數(shù)字、表達式或文本。如圖4-1中所示,在D2單元格中輸入函數(shù)表達式:=COUNTIF(C1:C4,C1),然后拖動單元格右下角的“+”號至D5單元格,顯示結(jié)果如圖4-2所示。1.函數(shù)法(使用countif函數(shù))圖4-2第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——識別重復(fù)數(shù)據(jù)在Excel中也可以直接使用功能導(dǎo)航區(qū)域的篩選功能直接篩選出非重復(fù)值,首先選擇數(shù)據(jù)單元格區(qū)域,然后選擇“數(shù)據(jù)”選項卡,找到“高級”對話框。在彈出的對話框中選擇“將篩選結(jié)果復(fù)制到其他位置”選項,復(fù)制到單元格,同時勾選“選擇不重復(fù)的記錄”復(fù)選框,單擊“確定”按鈕。2.高級篩選法結(jié)果:第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——識別重復(fù)數(shù)據(jù)使用條件格式法的突出顯示重復(fù)值的功能也可將重復(fù)值顯示出來?!伴_始”選項卡下依選擇“條件格式”→“突出顯示單元格規(guī)則”→“重復(fù)值”,在彈出的對話框中單擊“確定”按鈕。3.條件格式法重復(fù)值將顯示為淺紅填充色的深紅色文本利用條件格式法處理重復(fù)值的步驟第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——識別重復(fù)數(shù)據(jù)數(shù)據(jù)透視表法的原理類似于函數(shù)法,通過計算數(shù)據(jù)重復(fù)的頻次,出現(xiàn)2次及以上就說明該數(shù)據(jù)屬于重復(fù)項。其操作過程具體如下,在E1單元格單擊“插入”選項卡,選擇“數(shù)據(jù)透視表”選項,如下圖:4.數(shù)據(jù)透視表法利用數(shù)據(jù)透視表法處理重復(fù)值的步驟一第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——識別重復(fù)數(shù)據(jù)在彈出的對話框中,選擇要分析的區(qū)域為C1:C5,選擇放置數(shù)據(jù)透視表的位置為E1,單擊“確定”按鈕,如下圖。單擊生成的數(shù)據(jù)透視表,在右方“數(shù)據(jù)透視表字段”中勾選“收益(萬元)”選項,再將“收益(萬元)”選項拖動到“數(shù)值”區(qū)域,最后單擊“數(shù)值”下拉按鈕,在彈出的下拉列表中選擇“值字段設(shè)置”為“計數(shù)”,其結(jié)果如下圖所示。4.數(shù)據(jù)透視表法彈出“創(chuàng)建數(shù)據(jù)透視表”對話框利用數(shù)據(jù)透視表法處理重復(fù)值的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——刪除重復(fù)數(shù)據(jù)利用上述四種方法中的任意一種即可查看數(shù)據(jù)中的重復(fù)數(shù)據(jù),之后便可采取刪除重復(fù)數(shù)據(jù)的操作。在Excel中刪除重復(fù)數(shù)據(jù)的具體操作如下:首先選擇所要處理的單元區(qū)域,在上方導(dǎo)航窗口選擇“數(shù)據(jù)”選項卡,在“數(shù)據(jù)工具”組中選擇“刪除重復(fù)項”選項。

刪除重復(fù)數(shù)據(jù)的步驟一第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——刪除重復(fù)數(shù)據(jù)在彈出的對話框中選擇“擴展選定區(qū)域”→“刪除重復(fù)項”→只勾選“列”→“確定”,最后Excel將彈出提示對話框,提示有多少重復(fù)值被刪除,有多少唯一值被保留。刪除重復(fù)數(shù)據(jù)的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.1.2缺失數(shù)據(jù)的處理缺失數(shù)據(jù)是指數(shù)據(jù)中某個或某些屬性的值存在缺失或不完整。缺失值產(chǎn)生的原因多種多樣,例如,由于數(shù)據(jù)收集或保存時造成的數(shù)據(jù)缺失,人的主觀失誤、歷史局限或有意隱瞞造成的數(shù)據(jù)缺失等。1.概念識別缺失數(shù)據(jù)的具體操作如下:選定需要處理的區(qū)域,單擊“開始”選項卡,單擊“編輯”組中的“查找和選擇”下拉按鈕在彈出的下拉菜單中單擊“定位條件”命令,在彈出的對話框中選擇“空值”單選按鈕。2.識別單擊“定位條件”命令

第4章:新媒體數(shù)據(jù)的處理

4.1.2缺失數(shù)據(jù)的處理在彈出的對話框中選擇“空值”單選按鈕,如圖所示。最終結(jié)果如右圖所示,所有含有空值的單元格均被顯示出來。選擇“空值”單選按鈕識別缺失數(shù)據(jù)的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.1.2缺失數(shù)據(jù)的處理(1)填充法保持單元格數(shù)據(jù)區(qū)域中所有空值的選中狀態(tài),按“=”鍵,再按“↑”鍵,最后按“Ctrl+Enter”快捷鍵,即可將所有空值都填充為所在組對應(yīng)的第一個單元中的值。3.處理利用填充法處理缺失數(shù)據(jù)的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.1.2缺失數(shù)據(jù)的處理(2)查找替換法當缺失值以某種特殊標識出現(xiàn)時,可以采用查找替換的方式進行處理,除了單擊“查找和替換”選項卡,還可以使用快捷鍵進行查找和替換??旖萱I“Ctrl+H”可實現(xiàn)替換功能,快捷鍵“Ctrl+F”可實現(xiàn)查找功能。首先對原始的數(shù)據(jù)進行修改,在一列的缺失值位置全部輸入“#NA”,表示缺失值。按下“Ctrl+F”快捷鍵進行查找,在彈出的對話框中輸入“#NA”進行查找,單擊“查找全部”按鈕,其結(jié)果如圖所示。3.處理利用查找法查看缺失數(shù)據(jù)的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.1.2缺失數(shù)據(jù)的處理查看完缺失數(shù)據(jù)后,按下“Ctrl+H”快捷鍵進行替換,在對應(yīng)的文本框內(nèi)輸入內(nèi)容,將缺失值“#NA”替換為“50”,單擊“全部替換”按鈕,如圖所示。3.處理利用替換法替換缺失數(shù)據(jù)的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理4.1.3檢查數(shù)據(jù)的錯誤在實際的數(shù)據(jù)分析中,數(shù)據(jù)還可能存在其他類型的錯誤,并不是只有重復(fù)數(shù)據(jù)和缺失數(shù)據(jù)。在Excel中可以使用“數(shù)據(jù)有效性”來進行錯誤數(shù)據(jù)的檢查,數(shù)據(jù)有效性中存在多種檢查的規(guī)則。下面以一個簡單的例子來說明。利用4.1.2節(jié)中查找替換法的原始數(shù)據(jù),檢查是否存在缺失值及大于4的整數(shù)。選定A和B兩列作為需要檢查的區(qū)域,單擊上方導(dǎo)航欄中的“數(shù)據(jù)”選項卡,單擊“數(shù)據(jù)有效性”命令,在彈出的下拉菜單中選擇“數(shù)據(jù)有效性”選項,如下圖所示。選擇“數(shù)據(jù)有效性”選項第4章:新媒體數(shù)據(jù)的處理4.1.3檢查數(shù)據(jù)的錯誤彈出“數(shù)據(jù)有效性”對話框中,在“允許”下拉列表中選擇“整數(shù)”,在“數(shù)值”下拉列表中選擇“小于或等于”,在“最大值”文本框中輸入40,同時取消勾選“忽略空值”,單擊確定,如下圖所示?!皵?shù)據(jù)有效性”對話框第4章:新媒體數(shù)據(jù)的處理4.1.3檢查數(shù)據(jù)的錯誤設(shè)定完數(shù)據(jù)有效性檢查的規(guī)則后,再單擊“圈釋無效數(shù)據(jù)”命令,即可篩選出不在有效性規(guī)則內(nèi)的數(shù)據(jù),其結(jié)果如下圖所示。利用數(shù)據(jù)有效性檢查數(shù)據(jù)的結(jié)果圖4.2數(shù)據(jù)加工在一般情況下,數(shù)據(jù)經(jīng)過清洗后,依然無法滿足數(shù)據(jù)分析需求,還要經(jīng)過進一步的加工處理,最終形成簡潔、規(guī)范、清晰的樣本數(shù)據(jù),這個過程通常包括數(shù)據(jù)抽取、數(shù)據(jù)計算、數(shù)據(jù)分組和數(shù)據(jù)轉(zhuǎn)換。第4章:新媒體數(shù)據(jù)的處理

4.2.1數(shù)據(jù)抽取字段拆分是指為了截取某一字段中的部分信息,將該字段拆分成兩個或多個字段。例如,身份證號碼中包含地區(qū)編碼和出生年月日信息。首先隨機輸入5個身份證號碼,如下圖所示。(注意:在輸入此部分數(shù)據(jù)前,要先清除數(shù)據(jù)有效性規(guī)則,否則可能會報錯)1.字段拆分對數(shù)據(jù)庫中現(xiàn)有的字段進行整合加工,以形成分析所需要的新的字段,即為數(shù)據(jù)抽取。它包括字段拆分和隨機抽樣。隨機輸入5個虛擬身份證號碼數(shù)據(jù)表第4章:新媒體數(shù)據(jù)的處理

4.2.1數(shù)據(jù)抽取使用MID函數(shù)分別提取前6位地區(qū)編碼,第7位到第10位是出生年份,第11到14位為出生日期。MID函數(shù)的格式是MID(text,start_num,num_chars),text是指需要抽取的文本字符串,start_num是指定字符串的開始位置,num_chars是指定提取的字符數(shù)量。因此,在B2單元格輸入函數(shù)公式:=MID(A2,1,6)表示對A2單元格中的文本字符串,從第1個位置開始,抽取6個數(shù)字,即為地區(qū)編碼。同樣在C2單元格輸入函數(shù)公式:=MID(A2,7,4)表示出生年份,在D2單元格輸入函數(shù)公式:=MID(A2,11,4)表示出生日期。最后在各列拖動右下角的“+”號,套用函數(shù)格式,將各列分別命名為“地區(qū)編碼”、“出生年份”和“出生日期”,結(jié)果如下圖所示。利用MID函數(shù)進行字段拆分的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.2.1數(shù)據(jù)抽取隨機抽樣是按照隨機的原則,也就是保證總體中每個樣本都有同等的機會被抽中。在對海量級數(shù)據(jù)進行計算時,如果要對所有數(shù)據(jù)進行計算,往往難度較大,因此對數(shù)據(jù)進行隨機抽樣就很有必要。首先新建一個空白表,在A1單元格輸入公式:=RAND(),即生成一個范圍[0,1]的服從均勻分布的隨機數(shù),套用格式至A25單元格,即生成25個隨機數(shù),如右圖所示。2.隨機抽樣利用RAND函數(shù)生成25個隨機數(shù)第4章:新媒體數(shù)據(jù)的處理

4.2.1數(shù)據(jù)抽取首先加載“數(shù)據(jù)分析工具”,依次單擊上方導(dǎo)航欄的“文件”→“選項”→“加載項”,選擇“分析工具庫”選項,單擊對話框下方“轉(zhuǎn)到”按鈕,如右圖所示。2.隨機抽樣加載“數(shù)據(jù)分析工具”第4章:新媒體數(shù)據(jù)的處理

4.2.1數(shù)據(jù)抽取然后勾選“分析工具庫”復(fù)選框,單擊“確定”按鈕,在導(dǎo)航欄“數(shù)據(jù)”選項卡下就會出現(xiàn)“數(shù)據(jù)分析”選項,如右圖所示。2.隨機抽樣利用數(shù)據(jù)分析工具進行隨機抽樣的步驟一第4章:新媒體數(shù)據(jù)的處理

4.2.1數(shù)據(jù)抽取單擊“數(shù)據(jù)分析”選項,在彈出的對話框中選擇“抽樣”分析工具,“輸入?yún)^(qū)域”選擇A1:A25,“隨機樣本數(shù)”選擇10,“輸出區(qū)域”選擇B1:B10,單擊“確定”按鈕,如右圖所示。2.隨機抽樣“抽樣”對話框第4章:新媒體數(shù)據(jù)的處理

4.2.1數(shù)據(jù)抽取結(jié)果如圖所示,成功隨機抽取10個樣本。需要注意的是,由于使用的是隨機數(shù),每次單擊時隨機數(shù)都會發(fā)生變化,故圖中數(shù)據(jù)會不一致,但這不影響常規(guī)數(shù)據(jù)的隨機抽樣。2.隨機抽樣利用數(shù)據(jù)分析工具進行隨機抽樣的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.2.2數(shù)據(jù)計算有時候源數(shù)據(jù)并不能滿足需求,因此需要對獲取的數(shù)據(jù)源進行簡單計算,得到想要的數(shù)據(jù),以便更好地進行數(shù)據(jù)分析。例如有一組銷售數(shù)據(jù),需要分別計算各產(chǎn)品的銷售額和總計的銷售額,利用簡單的函數(shù)計算即可完成。原始的銷售數(shù)據(jù)表第4章:新媒體數(shù)據(jù)的處理

4.2.2數(shù)據(jù)計算首先,在D2單元格輸入公式:=B2*C2,套用格式至D4,獲得各個產(chǎn)品對應(yīng)的銷售額。然后在B5單元格輸入公式:=SUM(B2:B4),套用格式至D5,得到總銷量和總銷售額,結(jié)果如下圖所示。利用函數(shù)進行簡單計算的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.2.2數(shù)據(jù)計算當然,也可以利用導(dǎo)航欄“開始”選項卡下面的“編輯”選項,選擇“自動求和”等函數(shù)進行計算,如下圖所示。利用“編輯”選項進行簡單計算第4章:新媒體數(shù)據(jù)的處理

4.2.3數(shù)據(jù)分組數(shù)據(jù)分組是按照數(shù)據(jù)分析的目的,將原始的數(shù)據(jù)源按照一定的規(guī)則劃分成不同的組別,分組后的數(shù)據(jù)包含某個范圍的數(shù)據(jù),便于實現(xiàn)數(shù)據(jù)分析的目的。在Excel中可以使用IF函數(shù)進行數(shù)據(jù)分組的操作。IF函數(shù)是一個邏輯判斷函數(shù),IF函數(shù)可對數(shù)值大小進行判斷,并賦予相應(yīng)的分組標簽。IF函數(shù)可表示為IF(logical_test,[value_if_true],[value_if_false]),其中l(wèi)ogical_test是條件表達式,即邏輯判斷條件,當條件滿足時返回value_if_true,當條件不滿足時返回value_if_false。首先,生成20個年齡數(shù)據(jù),然后在輸出單元格中輸入公式:=IF(A2<50,“(0,50)”,“[50,+∞”)),最后在輸出區(qū)域套用格式,輸出結(jié)果如右圖所示。利用IF函數(shù)進行簡單分組的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.2.3數(shù)據(jù)分組當想要分成多個組時,只需要在IF函數(shù)中嵌套IF函數(shù),例如,在圖4-31中的C2單元格中輸入公式:=IF(A2<30,“(0,30)”,IF(A2<45,“[30,45)”,“[45,+∞”)),將年齡分組成三個組,其結(jié)果如下圖所示。利用IF函數(shù)進行多個分組的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理4.2.4數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)加工的最后一個部分就是數(shù)據(jù)轉(zhuǎn)換,在數(shù)據(jù)分析時,獲取的元數(shù)據(jù)有時候是文本,可能就無法進行計算。此時就需要對數(shù)據(jù)進行轉(zhuǎn)換,轉(zhuǎn)換成能夠處理的數(shù)據(jù)類型。常用的數(shù)據(jù)轉(zhuǎn)換主要有數(shù)據(jù)表轉(zhuǎn)置和數(shù)據(jù)類型轉(zhuǎn)換。1.概念將簡單信息表進行轉(zhuǎn)置,選定需要轉(zhuǎn)置的輸入?yún)^(qū)域并右擊,在彈出的快捷菜單中單擊“復(fù)制”命令。選定想要輸

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論