




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
XXXX大學(xué)教案第一章新媒體數(shù)據(jù)新聞概述建立目標(biāo)任務(wù)明確重難點課程導(dǎo)入,激發(fā)學(xué)習(xí)興趣。講授法,建立學(xué)習(xí)內(nèi)容的總體印象。啟發(fā)式教學(xué),引導(dǎo)學(xué)生初步了解數(shù)據(jù)新聞相關(guān)知識案例分析法對比分析法講授提問,引導(dǎo)總結(jié)數(shù)據(jù)新聞的生產(chǎn)流程。布置作業(yè)、鞏固知識,進(jìn)行形成性評價。教學(xué)反思一、課時安排:課時(理論講授4課時,實踐2課時)二、教學(xué)課型:理論、實踐課三、教學(xué)目標(biāo):(1)初步了解新媒體數(shù)據(jù)新聞。(2)了解新媒體數(shù)據(jù)新聞的發(fā)展。(3)了解新媒體數(shù)據(jù)新聞的生成流程。(4)了解新媒體數(shù)據(jù)新聞典型案例。四、教學(xué)重點難點:(1)新媒體數(shù)據(jù)新聞的發(fā)展。(2)新媒體數(shù)據(jù)新聞的生成流程。五、教學(xué)方法:多媒體教學(xué)(講授法、實驗法)六、教學(xué)過程與內(nèi)容:課程導(dǎo)入:新媒體數(shù)據(jù)新聞產(chǎn)生的背景和存在價值。本章概述:新媒體產(chǎn)生的海量數(shù)據(jù)和逐漸成熟的數(shù)據(jù)處理分析技術(shù)使得一種整合各種媒介優(yōu)點、符合信息時代需求的新聞形態(tài)得以誕生——數(shù)據(jù)新聞。本章將對新媒體數(shù)據(jù)新聞的相關(guān)概念進(jìn)行介紹、分析國內(nèi)外數(shù)據(jù)新聞發(fā)展的歷程,并且簡述新媒體數(shù)據(jù)新聞的生產(chǎn)流程。最后將以國內(nèi)外典型數(shù)據(jù)新聞為例,總結(jié)優(yōu)秀新媒體數(shù)據(jù)新聞作品的特征。從基礎(chǔ)理論出發(fā),以實際案例加強(qiáng)對新媒體數(shù)據(jù)新聞的理解。第一節(jié)新媒體數(shù)據(jù)新聞簡介(一)新媒體數(shù)據(jù)新聞的概念與特征1.新媒體數(shù)據(jù)新聞的概念“新媒體”主要指基于數(shù)字技術(shù)、網(wǎng)絡(luò)技術(shù)及其他現(xiàn)代信息技術(shù)或通信技術(shù)的,具有互動性、融合性的媒介形態(tài)和平臺。在現(xiàn)階段,新媒體主要包括網(wǎng)絡(luò)媒體、手機(jī)媒體及其兩者融合形成的移動互聯(lián)網(wǎng),以及其他具有互動性的數(shù)字媒體形式。數(shù)據(jù)新聞,又稱“數(shù)據(jù)驅(qū)動新聞”,是基于數(shù)據(jù)信息的采集、分析、呈現(xiàn)的新聞工作方式。從狹義上看,數(shù)據(jù)新聞是建立在數(shù)據(jù)抓取、數(shù)據(jù)挖掘、數(shù)據(jù)統(tǒng)計和分析基礎(chǔ)上,最終以可視化的方式呈現(xiàn)出來的一種新型新聞報道方式。從廣義上看,數(shù)據(jù)新聞代表著新聞業(yè)未來的發(fā)展方向,是新聞學(xué)在大數(shù)據(jù)時代的研究新領(lǐng)域。2.新媒體數(shù)據(jù)新聞的特征(1)以海量數(shù)據(jù)為核心驅(qū)動力;(2)以數(shù)據(jù)分析處理技術(shù)為基礎(chǔ);(3)以數(shù)據(jù)可視化呈現(xiàn)為報道方式;(4)以移動端為主要傳播渠道;(5)以服務(wù)公眾利益為報道指向。(二)新媒體數(shù)據(jù)新聞的產(chǎn)生背景1.大數(shù)據(jù)時代的到來數(shù)據(jù)新聞是大數(shù)據(jù)時代新聞界為不斷適應(yīng)媒體環(huán)境變化進(jìn)而產(chǎn)生的一種新型新聞生產(chǎn)模式。2.相關(guān)技術(shù)的發(fā)展成熟新媒體數(shù)據(jù)新聞涉及大數(shù)據(jù)獲取、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)可視化等多方面的技術(shù)。數(shù)字技術(shù)、云計算技術(shù)、智能技術(shù)等新技術(shù)的發(fā)展為數(shù)據(jù)新聞產(chǎn)生提供了技術(shù)性條件?;ヂ?lián)網(wǎng)開源軟件市場的成熟也為數(shù)據(jù)新聞的發(fā)展提供了技術(shù)支持。3.全球“開放數(shù)據(jù)”運(yùn)動的興起向公眾公開的政府?dāng)?shù)據(jù)為媒體制作數(shù)據(jù)新聞提供了重要的內(nèi)容來源。4.新媒體發(fā)展需求新媒體時代信息爆炸、用戶“淺閱讀”等現(xiàn)象的出現(xiàn)對新聞提出了新的要求。數(shù)據(jù)新聞的出現(xiàn)符合媒體信息服務(wù)的本質(zhì),也順應(yīng)了新媒體時代的信息傳播規(guī)律(三)新媒體數(shù)據(jù)新聞的分類1.大數(shù)據(jù)型與小數(shù)據(jù)型2.自采數(shù)據(jù)型與非自采數(shù)據(jù)型3.事件選題型與話題選題型4.調(diào)查型與常規(guī)型(四)新媒體數(shù)據(jù)新聞的價值1.增強(qiáng)新聞報導(dǎo)的深度性和宏觀性2.增強(qiáng)新聞讀寫的交互性能3.促進(jìn)傳統(tǒng)媒體與新媒體的融合第二節(jié)新媒體數(shù)據(jù)新聞的發(fā)展(一)國外新媒體數(shù)據(jù)新聞的發(fā)展1.業(yè)界對新媒體數(shù)據(jù)新聞的嘗試與探索早在19世紀(jì),國外新聞業(yè)就開始運(yùn)用量化數(shù)據(jù)進(jìn)行報道,《衛(wèi)報》1821年的創(chuàng)刊號上的一篇調(diào)查未成年教育系統(tǒng)的報道就被視為該報最早的數(shù)據(jù)新聞。不過這只是初步嘗試,此種報道方式在當(dāng)時并未形成規(guī)模。2007年,美國《紐約時報》建立了一個記者加程序員的團(tuán)隊,即現(xiàn)在的“互動新聞技術(shù)部”。這個團(tuán)隊在《紐約時報》網(wǎng)站上為總統(tǒng)選舉、奧運(yùn)會等重大新聞制作推出了大量動態(tài)、互動的信息圖表,每一張圖表都由大量數(shù)據(jù)作支撐。《紐約時報》網(wǎng)站為此專門開辟了板塊,匯總此類報道。2009年,《衛(wèi)報》網(wǎng)站開設(shè)“數(shù)據(jù)商店”版塊,下分“大數(shù)據(jù)”、“數(shù)據(jù)新聞”、“數(shù)據(jù)博客”等細(xì)分頻道。2013年,《紐約時報》制作的“雪崩”題材新聞報道獲獎,引發(fā)全球傳媒界對數(shù)據(jù)新聞這一新型報道形態(tài)的關(guān)注。2.學(xué)界對新媒體數(shù)據(jù)新聞的研究(1)數(shù)據(jù)新聞理論研究目前,國外關(guān)于數(shù)據(jù)新聞的研究多從兩個角度切入。一是從技術(shù)層面進(jìn)行分析,探討數(shù)據(jù)新聞的制作和呈現(xiàn)方式,其中最具代表性的著作為歐美一線資深記者共同編撰的《數(shù)據(jù)新聞手冊》(TheDataJournalismHandbook);二是從新聞學(xué)角度入手,側(cè)重數(shù)據(jù)新聞的優(yōu)勢分析、現(xiàn)狀調(diào)查、問題探討、發(fā)展建議等,采用的方法主要是深度訪談法、參與觀察法及問卷調(diào)查。(2)數(shù)據(jù)新聞教育發(fā)展由英國數(shù)據(jù)新聞實踐推動的英國數(shù)據(jù)新聞教育具有引領(lǐng)作用。目前英國的數(shù)據(jù)新聞類課程主要分三種類型:第一種是介紹型課程,如“數(shù)據(jù)報道概論”“數(shù)據(jù)系統(tǒng)概念與基礎(chǔ)”等;第二種是數(shù)據(jù)新聞技能類課程,如“數(shù)據(jù)可視化”“數(shù)字交互設(shè)計”“高級數(shù)據(jù)與編程”等;第三種是數(shù)據(jù)新聞應(yīng)用型課程,如“城市復(fù)原力,災(zāi)害和數(shù)據(jù)”“文化遺產(chǎn)可視化應(yīng)用”等。美國是數(shù)據(jù)新聞教育學(xué)術(shù)機(jī)構(gòu)發(fā)展最為成熟的國家。(“美國知名高校數(shù)據(jù)新聞?wù)n程開設(shè)情況”見教材)(二)國內(nèi)新媒體數(shù)據(jù)新聞的發(fā)展1.業(yè)界對新媒體數(shù)據(jù)新聞的嘗試與探索自2011年起,國內(nèi)四大門戶網(wǎng)站搜狐、網(wǎng)易、騰訊、新浪緊跟國外數(shù)據(jù)新聞實踐步伐相繼推出數(shù)據(jù)新聞專欄:“數(shù)字之道”“數(shù)讀”“數(shù)據(jù)控”“圖解天下”,拉開數(shù)據(jù)新聞本土化實踐序幕。2013年10月,財新傳媒率先成立了財新數(shù)據(jù)可視化實驗室,推出數(shù)據(jù)新聞專欄“數(shù)字說”。2014年1月,中央電視臺《晚間新聞》推出“據(jù)”說系列報道,開啟了國內(nèi)電視媒體的數(shù)據(jù)新聞實踐之路。2015年中國數(shù)據(jù)新聞大賽開始舉辦,該比賽旨在通過比賽打通學(xué)界與業(yè)界的壁壘,為全國培養(yǎng)新媒體人才助力,促進(jìn)國內(nèi)數(shù)據(jù)新聞的發(fā)展,目前已經(jīng)逐漸成為一項具有規(guī)模的全國性賽事。2.學(xué)界對新媒體數(shù)據(jù)新聞的研究(1)數(shù)據(jù)新聞理論研究20世紀(jì)80、90年代,國內(nèi)學(xué)界開始關(guān)注數(shù)據(jù)新聞。國內(nèi)最早關(guān)于“數(shù)據(jù)新聞”、“計算機(jī)輔助報道”等概念的研究可追溯到卜衛(wèi)于1998年的發(fā)表論文,該文介紹了計算機(jī)輔助新聞報道的相關(guān)問題,呼吁業(yè)界應(yīng)具有計算機(jī)報道的意識。數(shù)據(jù)新聞在隨后的許多年里并未引起國內(nèi)學(xué)者的重視,直到2012年“大數(shù)據(jù)”概念在國內(nèi)的悄然興起,無論學(xué)界還是業(yè)界,都對“數(shù)據(jù)新聞”更加關(guān)注。2011年,國內(nèi)業(yè)界的數(shù)據(jù)新聞實踐開始起步,此時學(xué)界對數(shù)據(jù)新聞的研究多集中于對概念的界定與探討,多屬于介紹性的研究。自2015年開始,隨著數(shù)據(jù)新聞被普遍當(dāng)作新聞業(yè)新的希望與未來,被國內(nèi)的諸多傳統(tǒng)媒體實踐與應(yīng)用,學(xué)界對數(shù)據(jù)新聞的研究也更加深入與多元。(2)數(shù)據(jù)新聞教育發(fā)展2015年,中國傳媒大學(xué)新聞學(xué)專業(yè)(數(shù)據(jù)新聞報道方向)設(shè)立,自2016年起,該專業(yè)實行自主招生。這是中國內(nèi)地第一個設(shè)置數(shù)據(jù)新聞專業(yè)方向的大學(xué)。中國知名高校數(shù)據(jù)新聞?wù)n程主要分為兩類。第一類是數(shù)據(jù)新聞概況類課程,主要涵蓋國內(nèi)外數(shù)據(jù)新聞發(fā)展、各類媒體的實踐情況及其采制的原則和流程等;第二類是數(shù)據(jù)新聞技能類課程,如“可視化技術(shù)”、“R語言與數(shù)據(jù)可視化”、“GooSeeker網(wǎng)頁抓取工具”、“Python語言”、“SPSS數(shù)據(jù)分析”等課程??傮w而言,中國數(shù)據(jù)新聞教育的課程設(shè)置偏重技能培養(yǎng)?!安糠种袊咝?shù)據(jù)新聞?wù)n程與專業(yè)設(shè)置”見教材。(三)新媒體數(shù)據(jù)新聞未來發(fā)展趨勢1.增強(qiáng)數(shù)據(jù)素養(yǎng),提升數(shù)據(jù)驅(qū)動能力2.重視數(shù)據(jù)倫理,加強(qiáng)數(shù)據(jù)內(nèi)容監(jiān)管3.注重媒介融合,整合報道傳播渠道4.加強(qiáng)理論建構(gòu),創(chuàng)新人才培養(yǎng)模式第三節(jié)新媒體數(shù)據(jù)新聞的生產(chǎn)流程(一)選題與策劃1.新媒體數(shù)據(jù)新聞的選題數(shù)據(jù)新聞的選題及其價值判斷可通過選題的新聞性和價值性兩個方面來完成。選題的新聞性:與社會現(xiàn)狀、重大問題等具有現(xiàn)實意義的熱點緊密聯(lián)系,使選題建立在正確反映社會現(xiàn)實的基礎(chǔ)上;具有時效性,選題的時效性在很大程度上影響著讀者的閱讀興趣。選題的價值性:能通過數(shù)據(jù)對現(xiàn)象的反映,推動社會向前發(fā)展;揭露數(shù)據(jù)背后折射出的社會問題,并能夠發(fā)人深省,具有深遠(yuǎn)意義。2.新媒體數(shù)據(jù)新聞的策劃既包括對擬選定題目具體新聞內(nèi)容框架的設(shè)計,也包括該項目實施的具體分工、時間規(guī)劃、資源統(tǒng)籌等具體實踐層面的事務(wù)。設(shè)計數(shù)據(jù)新聞的框架結(jié)構(gòu)是一個優(yōu)秀數(shù)據(jù)新聞作品的前提。數(shù)據(jù)新聞的框架設(shè)計重點在于內(nèi)容模塊的規(guī)劃。組建一個具備新聞采編、數(shù)據(jù)處理、美工設(shè)計、媒體運(yùn)營能力的人才團(tuán)隊是數(shù)據(jù)新聞制作的關(guān)鍵。(二)數(shù)據(jù)獲取、預(yù)處理與分析1.原始數(shù)據(jù)的獲取與采集新媒體數(shù)據(jù)來源:網(wǎng)絡(luò)數(shù)據(jù)庫大數(shù)據(jù)、網(wǎng)絡(luò)社交大數(shù)據(jù)、網(wǎng)絡(luò)行為日志大數(shù)據(jù)和網(wǎng)絡(luò)輿情大數(shù)據(jù)等。數(shù)據(jù)獲取方式:國家統(tǒng)計部門就有大量可靠的公開數(shù)據(jù)資源,可以通過官方網(wǎng)站查詢下載;互聯(lián)網(wǎng)部門及專題網(wǎng)站數(shù)據(jù)有大量專題數(shù)據(jù)。中央網(wǎng)信辦、國家網(wǎng)信辦、中國互聯(lián)網(wǎng)信息中心等提供的數(shù)據(jù)屬于互聯(lián)網(wǎng)官方部門數(shù)據(jù),中國互聯(lián)網(wǎng)協(xié)會、中國互聯(lián)網(wǎng)金融研究會等提供的數(shù)據(jù)為互聯(lián)網(wǎng)行業(yè)部門數(shù)據(jù);系統(tǒng)日志采集是較為直接可靠的數(shù)據(jù)獲取方式,許多公司的業(yè)務(wù)平臺每天都會產(chǎn)生大量的日志數(shù)據(jù)。系統(tǒng)日志數(shù)據(jù)可以通過第三方平臺獲取,如CNZZ數(shù)據(jù)專家網(wǎng)站;Web數(shù)據(jù)抓取能夠快速、批量地從網(wǎng)站上提取信息。Web數(shù)據(jù)抓取程序模擬瀏覽器的行為,能將可以在瀏覽器上顯示的任何數(shù)據(jù)提取出來。八爪魚采集器是比較容易上手的Web數(shù)據(jù)抓取軟件之一。2.數(shù)據(jù)的預(yù)處理與加工數(shù)據(jù)的預(yù)處理:一般所獲得的原始新媒體數(shù)據(jù)會存在數(shù)據(jù)被篡改、不完整、重復(fù)等數(shù)據(jù)異常情況,即存在臟數(shù)據(jù),并不能直接使用。因此,對所獲得原始數(shù)據(jù)需要通過數(shù)據(jù)清洗、集成、變換、規(guī)約等步驟對數(shù)據(jù)進(jìn)行預(yù)處理。數(shù)據(jù)的加工:完成數(shù)據(jù)預(yù)處理之后就可以正式進(jìn)入數(shù)據(jù)的加工,包括數(shù)據(jù)合并、數(shù)據(jù)修正、公式計算等多種方式。數(shù)據(jù)預(yù)處理與加工都是基礎(chǔ)步驟,主要是為后續(xù)數(shù)據(jù)分析和可視化服務(wù)。3.數(shù)據(jù)的分析數(shù)據(jù)的分析是數(shù)據(jù)新聞生產(chǎn)的核心步驟。通??梢杂肊xcel、SPSS、Python、R語言、Tableau等工具進(jìn)行數(shù)據(jù)分析。按照難度和數(shù)據(jù)探索程度,數(shù)據(jù)分析可分為描述性分析、探索性分析、驗證性分析三種類型。數(shù)據(jù)的描述性分析包括對平均值、中位數(shù)、眾數(shù)、方差、標(biāo)準(zhǔn)差等進(jìn)行計算,以及基于此的對比分析、交叉分析等。目前,大量的數(shù)據(jù)新聞作品都是圍繞對數(shù)據(jù)的描述性分析而展開。探索性數(shù)據(jù)分析和驗證性數(shù)據(jù)分析屬于高級數(shù)據(jù)分析,包括相關(guān)分析、因子分析、回歸分析等內(nèi)容,側(cè)重于驗證已有假設(shè)的真?zhèn)?、在?shù)據(jù)中發(fā)現(xiàn)新的特征,以及對未來進(jìn)行預(yù)測。(三)數(shù)據(jù)可視化與敘事1.新媒體數(shù)據(jù)可視化數(shù)據(jù)可視化是指通過圖形、圖表以及動畫等手段直觀、生動、形象地展示數(shù)據(jù)的形式。數(shù)據(jù)可視化的主要目的在于借助圖形化的手段,清晰有效地傳達(dá)與溝通信息??偟膩碚f,數(shù)據(jù)可視化的意義可分為三點:更快獲取數(shù)據(jù)、獲取更多數(shù)據(jù)、更深理解數(shù)據(jù)。數(shù)據(jù)可視化分為靜態(tài)與動態(tài)兩類,其中靜態(tài)類型以信息圖表為代表,動態(tài)類型又可按照是否有交互操作分為動畫視頻與交互圖表兩類。2.新媒體數(shù)據(jù)新聞可視化敘事可視化敘事相比傳統(tǒng)的文本新聞敘事更能向受眾呈現(xiàn)新聞事件內(nèi)在的邏輯聯(lián)系和關(guān)聯(lián)程度,更具有時空穿透力和感染力。(四)數(shù)據(jù)新聞制作與發(fā)布1.新媒體數(shù)據(jù)新聞的制作數(shù)據(jù)新聞制作是整合文字、圖表、視頻、音頻等元素,使其成為敘事完整、風(fēng)格統(tǒng)一的數(shù)字化新聞作品的過程。GoogleFusionTables、TableauPublic、DataMarket、ManyEyes是目前常見的可用來制作數(shù)據(jù)新聞的軟件。國內(nèi)的iH5、易企秀等網(wǎng)站也常被用來制作、發(fā)布數(shù)據(jù)新聞。除此之外,還有很多功能更加細(xì)化的軟件,如專門制作時間類作品的Dipity、用于文本可視化即標(biāo)簽云的Wordle等。2.新媒體數(shù)據(jù)新聞的集成發(fā)布數(shù)據(jù)新聞作品制作完成后可通過移動端和PC端集成發(fā)布。iH5、易企秀發(fā)布平臺以H5制作見長,這也就決定了這類平臺發(fā)布的數(shù)據(jù)新聞作品是更適用于手機(jī)的移動端模式,讀者通過滑動或翻動界面獲取數(shù)據(jù),通過動態(tài)交互圖表、視頻等了解詳情,交互感比PC端更強(qiáng)。相較于移動端,數(shù)據(jù)新聞在PC端傳播過程中用戶粘度較低,且PC端數(shù)據(jù)新聞以媒體轉(zhuǎn)發(fā)為主,與普通用戶互動較少。在大數(shù)據(jù)時代,要想做好數(shù)據(jù)新聞報道,需要新聞從業(yè)者與時俱進(jìn),積極學(xué)習(xí)新興技術(shù)與技能,加強(qiáng)互動傳播;完善交互式設(shè)計,提升多維鏈?zhǔn)絺鞑V度;深度追蹤熱點問題,引發(fā)多級點傳播;把握關(guān)鍵節(jié)點位置,拓展傳播網(wǎng)絡(luò)。第四節(jié)新媒體數(shù)據(jù)新聞典型案例(一)國外典型案例分析2012年《紐約時報》推出的大型新聞報道作品《雪崩》(SnowFall)在上線一周的時間內(nèi)獲得了350萬的點閱率。這篇報道主要講述了2012年2月份發(fā)生在美國華盛頓州卡斯凱德山區(qū)的雪崩造成的滑雪愛好者罹難的事件,報道在當(dāng)時的不少創(chuàng)新之舉引領(lǐng)了一股數(shù)據(jù)新聞浪潮,成為傳統(tǒng)新聞向融合新聞發(fā)展的一個標(biāo)志性報道。(二)國內(nèi)典型案例分析在2018年全球數(shù)據(jù)新聞獎中,財新網(wǎng)作為唯一的中國大陸媒體入圍,擊敗來自BBC、彭博、英國衛(wèi)報等媒體的11個團(tuán)隊,獲得“最佳大型數(shù)據(jù)新聞團(tuán)隊”獎。例:財新網(wǎng)的數(shù)據(jù)新聞作品《博物館里的國家寶藏》。(三)數(shù)據(jù)新聞作品傳播渠道1.網(wǎng)站數(shù)據(jù)新聞專欄網(wǎng)站的數(shù)據(jù)新聞可分為兩類,第一類是大型綜合性門戶網(wǎng)站,如網(wǎng)易“數(shù)讀”欄目、騰訊“數(shù)據(jù)控”欄目、新浪“圖解天下”欄目、搜狐“數(shù)字之道”欄目;第二類是專業(yè)性質(zhì)的新媒體平臺,如財新網(wǎng),它是專注于原創(chuàng)財經(jīng)的新媒體,于2011年開設(shè)了“數(shù)字說”這一數(shù)據(jù)新聞欄目。2.互聯(lián)網(wǎng)新媒體平臺互聯(lián)網(wǎng)新媒體平臺如微博、微信公眾號、今日頭條,憑借其堅實的用戶基礎(chǔ)和強(qiáng)大的裂變傳播能力在數(shù)據(jù)新聞的傳播中占據(jù)了重要作用。大部分傳統(tǒng)媒體或網(wǎng)站平臺如新華網(wǎng)、人民網(wǎng)等都會利用自己的微博和微信賬號進(jìn)行數(shù)據(jù)新聞的發(fā)布。如《中國科學(xué)報》同時在科學(xué)網(wǎng)、《中國科學(xué)報》微博客戶端和《中國科學(xué)報》微信公眾號發(fā)布數(shù)據(jù)新聞。3.數(shù)據(jù)新聞領(lǐng)域權(quán)威大賽目前在國際上認(rèn)可度較高的專業(yè)數(shù)據(jù)新聞大賽是“全球數(shù)據(jù)新聞獎”,設(shè)立于2012年。由谷歌贊助,全球編輯網(wǎng)絡(luò)和歐洲新聞中心聯(lián)合創(chuàng)立。凱度信息之美獎也是數(shù)據(jù)新聞領(lǐng)域的一個重要獎項,該獎項主要用于評估新聞作品的主題與可視化形式之間的適應(yīng)程度,評選信息與數(shù)據(jù)可視化方面的優(yōu)秀作品?!爸袊鴶?shù)據(jù)新聞大賽”是國內(nèi)數(shù)據(jù)新聞領(lǐng)域較為專業(yè)的賽事。(四)優(yōu)秀數(shù)據(jù)新聞作品特點及問題規(guī)避1.優(yōu)秀數(shù)據(jù)新聞作品特點(1)多維度視角(2)故事化新聞敘事(3)重視交互設(shè)計(4)數(shù)據(jù)來源豐富2.數(shù)據(jù)新聞作品問題規(guī)避(1)簡潔易懂重視傳播“少即是多,數(shù)據(jù)可視化價值在于要將信息高效地傳輸給讀者”(2)注重敘述手段巧用垂直空間“對于可視化作品而言,垂直空間才是黃金資源”(3)適當(dāng)交互避免冗余“可視化交互新聞響應(yīng)的速度勝于形式”(4)給出結(jié)論重在分析“對于可視化作品而言,垂直空間才是黃金資源”(5)注重實效避免過期一般來說,與圖文新聞相比,數(shù)據(jù)可視化新聞的生產(chǎn)過程要復(fù)雜不少,生產(chǎn)周期也相應(yīng)變長。但在當(dāng)今社會,熱點的轉(zhuǎn)換異常迅捷,各領(lǐng)風(fēng)騷兩三天而已。但不少媒體沒能認(rèn)識到數(shù)據(jù)可視化報道的“周期性”問題,只管耕耘,不問收獲,最終是事倍功半,效果不彰。思考與練習(xí):(1)什么是新媒體數(shù)據(jù)新聞?新媒體數(shù)據(jù)新聞有哪些特征和價值?(2)列舉國內(nèi)新聞網(wǎng)站的數(shù)據(jù)新聞欄目,并總結(jié)其各自的特色。(3)闡述新媒體數(shù)據(jù)新聞的生產(chǎn)流程。(4)根據(jù)典型數(shù)據(jù)新聞案例,簡述優(yōu)秀數(shù)據(jù)新聞作品的特點及應(yīng)規(guī)避的問題。教學(xué)反思:(1)教學(xué)成功之處:(2)教學(xué)不足之處:(3)學(xué)生獲得知識和創(chuàng)新(知識掌握、技能獲取、價值觀理念樹立):(4)改進(jìn)措施和方案:XXXX大學(xué)教案第二章新媒體數(shù)據(jù)新聞選題與策劃建立目標(biāo)任務(wù)明確重難點課程導(dǎo)入,激發(fā)學(xué)習(xí)興趣。講授法,建立學(xué)習(xí)內(nèi)容的總體印象。理論講授講授,案例演示講授,操作演示。講授,案例演示布置作業(yè)、鞏固知識,進(jìn)行形成性評價。教學(xué)反思一、課時安排:課時(理論講授6課時,實踐4課時)二、教學(xué)課型:理論、實踐課三、教學(xué)目標(biāo):(1)了解新媒體數(shù)據(jù)新聞選題原則與分類。(2)掌握如何發(fā)現(xiàn)與選擇新媒體數(shù)據(jù)新聞選題。(3)掌握新媒體數(shù)據(jù)新聞選題報道策劃。(4)熟悉新媒體數(shù)據(jù)新聞選題與策劃應(yīng)用。四、教學(xué)重點難點:(1)發(fā)現(xiàn)與選擇數(shù)據(jù)新聞選題。(2)新媒體數(shù)據(jù)新聞選題報道策劃。(3)新媒體數(shù)據(jù)新聞選題與策劃應(yīng)用。五、教學(xué)方法:多媒體教學(xué)(講授法、實驗法)六、教學(xué)過程與內(nèi)容:課程導(dǎo)入:新媒體數(shù)據(jù)新聞的選題意義和原則。本章概述:選題是新媒體數(shù)據(jù)新聞生產(chǎn)活動的重要環(huán)節(jié),也是初始環(huán)節(jié)。數(shù)據(jù)新聞工作者確立新聞選題之后,還要進(jìn)行新聞報道策劃。與傳統(tǒng)新聞報道策劃不同,數(shù)據(jù)新聞報道策劃要使得數(shù)據(jù)新聞符合新聞、深度報道的基本結(jié)構(gòu)和模式,又要符合新媒體平臺及工具呈現(xiàn)的模式,同時還要符合新媒體時代用戶的閱讀模式。本章將對新媒體數(shù)據(jù)新聞選題的意義、原則和分類進(jìn)行詳細(xì)介紹,對發(fā)現(xiàn)和選擇數(shù)據(jù)新聞選題具體說明,并從報道策劃對數(shù)據(jù)新聞的重要意義、報道策劃的關(guān)鍵以及重點三個方面對數(shù)據(jù)新聞報道策劃進(jìn)行說明。第一節(jié)選題原則與分類新媒體數(shù)據(jù)新聞選題及意義1.新媒體數(shù)據(jù)新聞選題在整個新聞生產(chǎn)過程中,新聞的選題是眾多新聞生產(chǎn)環(huán)節(jié)中極為關(guān)鍵的一環(huán),是新聞報道的前提。新聞選題即報道對象或內(nèi)容的選擇,簡單地說就是媒體的報道內(nèi)容,它是整個新聞生產(chǎn)活動過程的起點,也是整個新聞生產(chǎn)流程中最基礎(chǔ)、最重要的環(huán)節(jié),選題的內(nèi)容和質(zhì)量對整個新聞生產(chǎn)活動具有重要的影響。新媒體數(shù)據(jù)新聞選題即可理解為選擇有價值的、能夠進(jìn)行數(shù)據(jù)可視化敘事和表達(dá)的新聞報道主題的過程。2.選題對于新媒體數(shù)據(jù)新聞的意義(1)給予正確方向,使主題更加鮮明(2)提高新聞質(zhì)量,更好滿足受眾(3)引導(dǎo)輿論,實現(xiàn)“社會公器”職能(二)新媒體數(shù)據(jù)新聞選題的原則1.價值性原則新聞價值的十個要素。2.時效性原則新媒體數(shù)據(jù)新聞選題理應(yīng)遵循時效性的原則,盡可能的去選擇那些正在發(fā)生的或者即將發(fā)生的報道內(nèi)容和對象,選擇那些生活中比較新、比較熱門的話題。3.創(chuàng)新性原則堅持創(chuàng)新性原則,打破常規(guī),選擇那些視角新穎的新聞選題,選擇那些別人還未報道過的新鮮題材。4.群眾性原則貼近群眾、貼近生活、貼近實際。5.可及性原則考慮當(dāng)前的技術(shù)是否能夠獲取某個選題所需要的數(shù)據(jù),是否能夠?qū)⑺@取的數(shù)據(jù)進(jìn)行可視化呈現(xiàn),以及是否支撐某個新聞選題向新媒體數(shù)據(jù)新聞的轉(zhuǎn)化等。新媒體數(shù)據(jù)新聞選題的分類1.時事類時事類數(shù)據(jù)新聞選題主要是涉及當(dāng)前社會生活中新近發(fā)生的或正在發(fā)生的事實,一般是發(fā)生在社會生活中與人們關(guān)系密切、對人們的生活有著重大影響或者能夠引起人們廣泛關(guān)注的事實。時事類數(shù)據(jù)新聞選題所對應(yīng)的數(shù)據(jù)新聞為時事類數(shù)據(jù)新聞。眾多的數(shù)據(jù)新聞網(wǎng)站也專門設(shè)置了時事類新聞版塊,比如澎拜新聞美數(shù)課就專門設(shè)置了時事類數(shù)據(jù)新聞版塊,并在版塊中設(shè)置了抗疫、澎湃國際以及浦江頭條等多個欄目。例:澎湃新聞美數(shù)課的時事類數(shù)據(jù)新聞作品,以《中國人到底每天睡多久?》。2.財經(jīng)類財經(jīng)類數(shù)據(jù)新聞選題主要涉及的是財政、經(jīng)濟(jì)和金融等方面的內(nèi)容,這類選題對應(yīng)的則是財經(jīng)類數(shù)據(jù)新聞,澎湃新聞美數(shù)課和網(wǎng)易數(shù)讀都有相應(yīng)的版塊設(shè)置。近年來,也誕生了許多優(yōu)秀的財經(jīng)類數(shù)據(jù)新聞作品。例:網(wǎng)易數(shù)讀數(shù)據(jù)新聞作品《貸款難:46%需融資小微企業(yè)獲銀行貸款》。3.社會生活類社會生活類數(shù)據(jù)新聞選題主要涉及的是與大眾生活相關(guān)的社會事件和社會問題等等,這類選題對應(yīng)的是社會生活類數(shù)據(jù)新聞。因為它和人們的日常生活關(guān)系比較密切,而受到社會大眾的廣泛關(guān)注。例:新華網(wǎng)數(shù)據(jù)新聞所制作的《家宴·人間至味是團(tuán)圓》數(shù)據(jù)新聞就是一篇極為經(jīng)典且優(yōu)秀的社會生活類數(shù)據(jù)新聞作品。4.文化科普類文化科普類新媒體數(shù)據(jù)新聞選題主要涉及的是有關(guān)科學(xué)文化知識等方面的內(nèi)容,這類選題相對應(yīng)的是文化科普類數(shù)據(jù)新聞。澎湃新聞美數(shù)課的“思想”欄目、新華網(wǎng)數(shù)據(jù)新聞的“人文說”“漲知識”和“健康解碼”等都屬于文化科普類數(shù)據(jù)新聞。例:新華網(wǎng)數(shù)據(jù)新聞作品《40年實現(xiàn)碳中和我們的底氣在哪》就是一篇優(yōu)秀的文化科普類數(shù)據(jù)新聞作品。第二節(jié)發(fā)現(xiàn)與選擇選題(一)培養(yǎng)“新聞鼻”“新聞眼”,增強(qiáng)新聞敏感“新聞鼻”“新聞眼”就是一種“新聞嗅覺”,指的是新聞工作者對于新聞的敏感性,它是新聞工作者發(fā)現(xiàn)新聞的一種重要能力、必不可少的素質(zhì)。新聞工作者要時刻保持這種新聞敏感,這種新聞敏感可能會在逛街時、購物時或者在生活的某個場景下,就迸發(fā)出一個新鮮有趣的新聞選題。有了這種新聞敏感,新聞工作者也更容易在紛繁的新聞事實中發(fā)現(xiàn)具有新聞價值的事實和更容易引起受眾興趣的內(nèi)容,從中選擇合適的數(shù)據(jù)新聞選題,進(jìn)而去完成整個新媒體數(shù)據(jù)新聞的編輯和制作。(二)善于提取和抓住優(yōu)秀選題1.在微博、微信、抖音等新媒體平臺中發(fā)現(xiàn)與選擇選題新媒體背景下,人人都是新聞的制造者和傳播者,而在微博、微信、抖音這些用戶參與度極高的新媒體平臺上,更是匯集了多元且豐富的內(nèi)容信息,而這也為新聞工作者進(jìn)行數(shù)據(jù)新聞選題提供了極為及時和全面的新聞事實來源。新聞工作者要深入這些用戶使用率高的新媒體,去瀏覽這些新媒體中的大量新聞和內(nèi)容,去選擇那些備受關(guān)注的新聞事實,從新聞熱點中善于發(fā)現(xiàn)和提取優(yōu)秀的新聞選題。以微博熱搜為例,在微博平臺上分別設(shè)立了熱搜榜、要聞榜以及同城榜,這些都為新聞工作者發(fā)現(xiàn)和選擇數(shù)據(jù)新聞選題提供了重要線索。微信朋友圈也是獲得數(shù)據(jù)新聞選題靈感的一條重要途徑,因為新聞工作者自身的社交網(wǎng)絡(luò)和社會資源也是發(fā)現(xiàn)數(shù)據(jù)新聞選題的重要方式和來源。朋友身份越是多重,朋友圈關(guān)系網(wǎng)越是復(fù)雜,其中所包含的觀點和意見也就越是豐富,看待問題的角度就越是多元。2.在相關(guān)媒體的報道中發(fā)現(xiàn)與選擇選題新聞工作者可以在工作之余去瀏覽分析其他一些相關(guān)媒體的報道內(nèi)容和材料,從中去發(fā)現(xiàn)和選擇自己的數(shù)據(jù)新聞選題。不要以為其他媒體報道過的新聞內(nèi)容就沒有價值,就放棄這方面的題材進(jìn)行報道,同時這也并不意味著新聞工作者要去抄襲別人的新聞內(nèi)容,而是利用其他媒體的新聞報道內(nèi)容和信息進(jìn)行二度開發(fā)式的數(shù)據(jù)新聞制作,可以是就其他新聞報道內(nèi)容進(jìn)行深度分析并進(jìn)行可視化呈現(xiàn),也可以是就相關(guān)數(shù)據(jù)新聞報道題材進(jìn)行深度挖掘等等。(三)善于觀察并從不同領(lǐng)域發(fā)現(xiàn)優(yōu)秀選題1.在重大活動中發(fā)現(xiàn)與選擇選題各種體育比賽、文化娛樂活動和黨政機(jī)關(guān)及各類會議,也是發(fā)現(xiàn)數(shù)據(jù)新聞選題的一條重要途徑,時事報道和新聞業(yè)界尤其注重這一方式。各種各樣的體育比賽和文化娛樂活動本身往往就備受觀眾矚目,再加上在各種文體活動中的體育明星、娛樂明星本身的吸引力和話題度,就會使得比賽或活動中充滿大量的新聞線索,細(xì)心的新聞工作者便可從中找到合適的新聞選題。以2020年芒果TV推出的女團(tuán)成長綜藝節(jié)目《乘風(fēng)破浪的姐姐》為例,節(jié)目還未播出,便因參加節(jié)目的嘉賓本身的熱度和話題度引起了大眾廣泛的關(guān)注。例:網(wǎng)易數(shù)讀數(shù)據(jù)新聞作品《乘風(fēng)破浪的姐姐,誰才是頂流》。2.從社會生活中發(fā)現(xiàn)與選擇選題新聞工作者應(yīng)該深入基層,從社會生活中去發(fā)現(xiàn)優(yōu)秀的新聞選題,去發(fā)現(xiàn)能夠反映重大社會問題、能夠切實解決人民群眾困難以及能夠給人民群眾生活帶來積極意義的優(yōu)秀新聞選題。例:網(wǎng)易數(shù)讀數(shù)據(jù)新聞作品《中國精神衛(wèi)生資源:床位不足、醫(yī)生少》。第三節(jié)選題報道策劃(一)新媒體數(shù)據(jù)新聞報道策劃的必要性1.首先,新聞報道策劃是確保新媒體數(shù)據(jù)新聞生產(chǎn)制作工作順利進(jìn)行的保證,前期的報道策劃能夠為數(shù)據(jù)新聞后續(xù)工作的開展提供正確方向和有力支持。2.其次,只有具有個性和特色的報道才能吸引受眾的眼球,而個性化的數(shù)據(jù)新聞報道離不開報道策劃。3.最后,在新媒體時代,信息的傳播方式、受眾的閱讀接收方式以及新聞報道平臺和呈現(xiàn)方式都發(fā)生了極大的變化,通過報道策劃,新媒體數(shù)據(jù)新聞的生產(chǎn)制作工作才能夠順利地進(jìn)行。(二)新媒體數(shù)據(jù)新聞報道策劃的關(guān)鍵1.新媒體數(shù)據(jù)新聞要符合新聞、深度報道的基本結(jié)構(gòu)和模式新媒體數(shù)據(jù)新聞要符合新聞的基本要求和結(jié)構(gòu):首先,新媒體數(shù)據(jù)新聞也要選取真實、新鮮的事實進(jìn)行報道其次,新聞的基本結(jié)構(gòu)為:標(biāo)題、導(dǎo)語、主體、背景、結(jié)語。數(shù)據(jù)新聞報道亦要符合這個基本模式,而不能只有數(shù)據(jù)的可視化呈現(xiàn)。新媒體數(shù)據(jù)新聞還要符合深度報道的模式:確定新聞選題之后,要針對性地選擇著眼點,通過報道策劃,根據(jù)數(shù)據(jù)獲取、處理、分析和可視化呈現(xiàn)去對事件的起因、經(jīng)過和發(fā)展進(jìn)行深入挖掘,并對其進(jìn)行追蹤。2.新媒體數(shù)據(jù)新聞要符合平臺及工具呈現(xiàn)的模式新媒體數(shù)據(jù)新聞既要考慮到發(fā)布平臺的呈現(xiàn)方式,也要考慮到現(xiàn)有數(shù)據(jù)處理工具是否支持所需數(shù)據(jù)的相關(guān)處理。比如,數(shù)據(jù)新聞制作過程中經(jīng)常使用到的工具:可將數(shù)據(jù)轉(zhuǎn)化為圖表的工具GoogleChartTools,可清除無效數(shù)據(jù)的工具GoogleRefine,可將將Excel數(shù)據(jù)轉(zhuǎn)換為Web文件的工具M(jìn)r.DataConverter,可以將大量數(shù)據(jù)過濾成自己所需數(shù)據(jù)的工具GoogleFusionTables,以及數(shù)據(jù)新聞制作與發(fā)布的平臺工具iH5、Wix、易企秀等等。3.新媒體數(shù)據(jù)新聞要符合新媒體時代用戶的閱讀模式一方面,在圖文結(jié)構(gòu)和信息圖表的可視化呈現(xiàn)上,要使得數(shù)據(jù)新聞作品符合用戶的視覺習(xí)慣;另一方面,數(shù)據(jù)新聞制作也要考慮到新媒體時代智能終端廣泛使用背景下用戶對新聞的閱讀習(xí)慣。以新華網(wǎng)數(shù)據(jù)新聞為例,其數(shù)據(jù)新聞作品就設(shè)置了PC交互和手機(jī)交互兩種形式,分別滿足計算機(jī)端和手機(jī)端兩種不同使用習(xí)慣的用戶。例:PC端數(shù)據(jù)新聞作品《人類與珠穆朗瑪峰》。手機(jī)端數(shù)據(jù)新聞作品《天使的日歷》。(三)新媒體數(shù)據(jù)新聞報道框架策劃1.結(jié)構(gòu)和邏輯策劃報道結(jié)構(gòu)和邏輯,主要指的是報道內(nèi)容之間的組合排列關(guān)系。常見的報道結(jié)構(gòu)有線型結(jié)構(gòu)、放射型結(jié)構(gòu)、收束型結(jié)構(gòu)和網(wǎng)狀結(jié)構(gòu)四種。從時間的延續(xù)來看,新聞報道的線型結(jié)構(gòu)呈現(xiàn)出單向性的、直線型的發(fā)展軌跡,放射型結(jié)構(gòu)呈現(xiàn)出由線到面的放射狀的特點,收束型結(jié)構(gòu)呈現(xiàn)出由面到線或到點的特點,而網(wǎng)狀結(jié)構(gòu)則呈現(xiàn)出或追蹤、或拓展等相互烘托、交錯遞進(jìn)的特點。新媒體數(shù)據(jù)新聞報道要采用什么樣的報道方式需要進(jìn)行提前策劃。2.表達(dá)主題策劃為了更好地去表達(dá)數(shù)據(jù)新聞主題,主題策劃也要遵循一些規(guī)律:首先,數(shù)據(jù)新聞主題表達(dá)要有鮮明的傾向性,需要讓受眾感知到該數(shù)據(jù)新聞作品的立場和態(tài)度;其次,數(shù)據(jù)新聞主題表達(dá)要反映事物的本質(zhì)規(guī)律,幫助受眾認(rèn)識到事物之間的關(guān)系和深刻內(nèi)涵;最后,數(shù)據(jù)新聞主題還要具有創(chuàng)新性,能夠吸引新形勢、新背景下受眾的注意力。3.圖文結(jié)合策劃在數(shù)據(jù)新聞報道中,什么時候采用文字表達(dá),什么時候運(yùn)用圖表進(jìn)行可視化呈現(xiàn),以及文字和可視化圖表如何進(jìn)行搭配和結(jié)合,都需要對數(shù)據(jù)新聞報道進(jìn)行圖文策劃。例:新華網(wǎng)數(shù)據(jù)新聞。第四節(jié)選題與策劃應(yīng)用(一)確定數(shù)據(jù)新聞選題在具體選題時,可以由表及里、以小見大,更為關(guān)注當(dāng)代人的生存現(xiàn)狀,關(guān)注社會熱點及社會發(fā)展存在的問題,如健康、就業(yè)、社會保障、交通出行等。見數(shù)據(jù)新聞《中國城鎮(zhèn)化的單身困境》。(二)規(guī)劃內(nèi)容板塊內(nèi)容板塊規(guī)劃是做好數(shù)據(jù)新聞敘事的關(guān)鍵,也是講好新聞故事的關(guān)鍵。內(nèi)容板塊確定既要前后具有邏輯性,又要層層深入,以便更清晰地表達(dá)主題。見數(shù)據(jù)新聞《中國城鎮(zhèn)化的單身困境》。思考與練習(xí):(1)簡述新媒體數(shù)據(jù)新聞選題的意義及原則。(2)簡述新媒體數(shù)據(jù)新聞選題的分類。(3)簡述如何發(fā)現(xiàn)并選擇優(yōu)秀的新媒體數(shù)據(jù)新聞選題。(4)簡述如何對新媒體數(shù)據(jù)新聞報道進(jìn)行策劃。教學(xué)反思:(1)教學(xué)成功之處:(2)教學(xué)不足之處:(3)學(xué)生獲得知識和創(chuàng)新(知識掌握、技能獲取、價值觀理念樹立):(4)改進(jìn)措施和方案:XXXX大學(xué)教案第三章新媒體數(shù)據(jù)獲取建立目標(biāo)任務(wù)明確重難點課程導(dǎo)入,激發(fā)學(xué)習(xí)興趣。講授法,建立學(xué)習(xí)內(nèi)容的總體印象。理論講授講授,案例演示講授,操作演示。演示八爪魚的操作,指導(dǎo)學(xué)生練習(xí)利用八爪魚進(jìn)行數(shù)據(jù)抓取。注意:本書是對V7版本的介紹,可以指導(dǎo)學(xué)生對最新V8版本的操作。課堂實驗:指導(dǎo)學(xué)生對李佳琦抖音賬號數(shù)據(jù)進(jìn)行分析。課堂實驗:指導(dǎo)學(xué)生利用飛瓜數(shù)據(jù)、抖音工具箱、已有統(tǒng)計報告進(jìn)行數(shù)據(jù)分析。布置作業(yè)、鞏固知識,進(jìn)行形成性評價。教學(xué)反思一、課時安排:課時(理論講授6課時,實踐4課時)二、教學(xué)課型:理論、實踐課三、教學(xué)目標(biāo):(1)了解新媒體數(shù)據(jù)需求及目標(biāo)識別。(2)熟悉新媒體數(shù)據(jù)來源。(3)掌握新媒體數(shù)據(jù)獲取方式。(4)掌握新媒體數(shù)據(jù)獲取的應(yīng)用。四、教學(xué)重點難點:(1)新媒體數(shù)據(jù)來源。(2)新媒體數(shù)據(jù)獲取方式。(3)新媒體數(shù)據(jù)獲取的應(yīng)用。五、教學(xué)方法:多媒體教學(xué)(講授法、實驗法)六、教學(xué)過程與內(nèi)容:課程導(dǎo)入:常見新媒體數(shù)據(jù)產(chǎn)生及來源領(lǐng)域。本章概述:本章從新媒體數(shù)據(jù)需求及目標(biāo)識別、新媒體數(shù)據(jù)來源和新媒體數(shù)據(jù)獲取方式三個方面概述新媒體數(shù)據(jù)的獲取。為了更好地理解與運(yùn)用,第四節(jié)以“分析網(wǎng)紅李佳琦抖音賬號運(yùn)營情況”和數(shù)據(jù)新聞“中國城鎮(zhèn)化的單身困境”為例,詳細(xì)介紹了如何將以上方法應(yīng)用到實踐中。目的是將理論方法、操作技術(shù)與具體實踐相結(jié)合,能夠更好地實現(xiàn)新媒體數(shù)據(jù)獲取。第一節(jié)新媒體數(shù)據(jù)需求及目標(biāo)識別數(shù)據(jù)分析面臨的主要挑戰(zhàn)不僅有技術(shù)問題,還包括方向和組織領(lǐng)導(dǎo)的問題。因此,提出問題、明確需求、確定目標(biāo)才能為接下來一系列的數(shù)據(jù)獲取、分析、可視化等做好準(zhǔn)備。針對不同的需求,我們要組合不同的數(shù)據(jù)進(jìn)行分析,從多角度考慮設(shè)計。如分析宏觀背景,可以從年代變化、地區(qū)差異、政府政策等方面搜集數(shù)據(jù);分析微觀事件,可以從媒體關(guān)注、網(wǎng)民討論、時間節(jié)點、擴(kuò)散路徑等方面搜集數(shù)據(jù)。第二節(jié)新媒體數(shù)據(jù)的來源(一)網(wǎng)絡(luò)數(shù)據(jù)庫大數(shù)據(jù)網(wǎng)絡(luò)數(shù)據(jù)庫大數(shù)據(jù)主要是指基于傳統(tǒng)數(shù)據(jù)庫對新媒體內(nèi)容及相關(guān)信息進(jìn)行存儲的數(shù)據(jù),如新聞內(nèi)容數(shù)據(jù)、網(wǎng)絡(luò)服務(wù)資源數(shù)據(jù)、消費(fèi)者數(shù)據(jù)、用戶行為數(shù)據(jù)、庫存數(shù)據(jù)、賬目數(shù)據(jù)等。(二)網(wǎng)絡(luò)社交大數(shù)據(jù)網(wǎng)絡(luò)社交大數(shù)據(jù)主要是指用戶參與和使用新媒體社交平臺、系統(tǒng)、軟件產(chǎn)生的數(shù)據(jù),具有雜亂、異構(gòu)等特點。目前以“三微一端”(微博、微信、微視頻及新聞客戶端)為代表的新媒體平臺產(chǎn)生的數(shù)據(jù)是網(wǎng)絡(luò)社交大數(shù)據(jù)的重點。新媒體平臺后臺數(shù)據(jù)大都能支持下載,以Excel文件方式導(dǎo)出到本地,供進(jìn)一步分析應(yīng)用。這些數(shù)據(jù)對運(yùn)營者了解平臺運(yùn)營情況、提升運(yùn)營質(zhì)量具有重要意義。(三)網(wǎng)絡(luò)行為日志大數(shù)據(jù)網(wǎng)絡(luò)行為日志大數(shù)據(jù)主要是指新媒體設(shè)備、傳感器等產(chǎn)生的數(shù)據(jù),包括人為交易記錄、瀏覽訪問記錄等數(shù)據(jù),通常為結(jié)構(gòu)化數(shù)據(jù)。(四)網(wǎng)絡(luò)輿情大數(shù)據(jù)網(wǎng)絡(luò)輿情大數(shù)據(jù)主要是指基于某熱點話題或事件,大量用戶通過新媒體方式參與而產(chǎn)生的數(shù)據(jù),通常通過人工或智能系統(tǒng)進(jìn)行獲取。第三節(jié)新媒體數(shù)據(jù)的獲取方式(一)政府統(tǒng)計部門在我國,政府統(tǒng)計部門包括國家統(tǒng)計局、省級統(tǒng)計局、市級統(tǒng)計局和區(qū)縣級統(tǒng)計局,這些統(tǒng)計部門分別對不同層次、不同區(qū)域、不同范圍的各類數(shù)據(jù)進(jìn)行了詳細(xì)的統(tǒng)計。例:國家統(tǒng)計局?jǐn)?shù)據(jù)獲取。(二)互聯(lián)網(wǎng)部門及專題網(wǎng)站數(shù)據(jù)互聯(lián)網(wǎng)部門及專題網(wǎng)站數(shù)據(jù)主要由互聯(lián)網(wǎng)官方部門和互聯(lián)網(wǎng)行業(yè)部門數(shù)據(jù)組成。諸如中央和國家網(wǎng)信辦、中國互聯(lián)網(wǎng)信息中心等提供的數(shù)據(jù)可歸屬為互聯(lián)網(wǎng)官方部門數(shù)據(jù),而像中國互聯(lián)網(wǎng)協(xié)會、中國互聯(lián)網(wǎng)金融研究會等提供的數(shù)據(jù)可歸屬為互聯(lián)網(wǎng)行業(yè)部門數(shù)據(jù)。例:中國互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計報告。(三)系統(tǒng)日志采集日志數(shù)據(jù)的收集通常通過日志收集系統(tǒng)自動完成,日志收集系統(tǒng)要做的事情就是實時收集業(yè)務(wù)日志數(shù)據(jù)供離線和在線的分析系統(tǒng)使用。高可用性、高可靠性和可擴(kuò)展性是日志收集系統(tǒng)所具有的基本特征。系統(tǒng)日志數(shù)據(jù)可以通過第三方平臺獲取,如CNZZ數(shù)據(jù)專家網(wǎng)站??梢詭椭y(tǒng)計某一網(wǎng)站的瀏覽次數(shù)、訪客人數(shù)、訪問數(shù)據(jù)等。例:利用友盟+平臺獲取日志數(shù)據(jù)。(四)Web數(shù)據(jù)抓取Web數(shù)據(jù)抓取即通常所稱的網(wǎng)絡(luò)爬蟲,指的是根據(jù)相關(guān)的主題或關(guān)鍵詞批量、快速從網(wǎng)站及新媒體平臺上提取信息的一種計算機(jī)軟件技術(shù)。Web數(shù)據(jù)抓取程序模擬瀏覽器的行為,能夠提取瀏覽器上顯示的任何數(shù)據(jù),因此也稱為屏幕抓取。Web數(shù)據(jù)抓取的最終目的是將非結(jié)構(gòu)化的信息從大量的網(wǎng)頁中抽取出來以結(jié)構(gòu)化的方式存儲。Web數(shù)據(jù)抓取通常需要利用計算機(jī)程序設(shè)計語言進(jìn)行程序編寫,而且針對不同的需求和不同的抓取對象,程序的編寫也有所差異,因而對于普通的用戶來說具有較大的難度。而工具的應(yīng)用為這一功能的實現(xiàn)提供了巨大的便利,也大大降低了操作的難度。例:以八爪魚采集器為例,詳細(xì)介紹Web數(shù)據(jù)抓取的操作。八爪魚采集數(shù)據(jù)有簡易采集和自定義采集兩種模式,簡易采集簡單易操作,門檻低,無基礎(chǔ)也可使用。自定義采集可以滿足個性化需求,適合對八爪魚有一定了解、掌握八爪魚各項功能的用戶。第四節(jié)新媒體數(shù)據(jù)獲取應(yīng)用(一)“分析網(wǎng)紅李佳琦抖音賬號運(yùn)營情況”數(shù)據(jù)獲取1.確定分析方向李佳琦于2018年12月相繼開通抖音、小紅書、快手等社交賬號,迅速以其專業(yè)、富有個性的推薦方式成為最能帶貨的主播之一。截至2019年10月,李佳琦抖音賬號估值為53305011元,其抖音賬號極具分析價值。首先,分析運(yùn)營質(zhì)量,關(guān)注其總粉絲數(shù)、獲贊數(shù),單條視頻播放量、轉(zhuǎn)贊評數(shù)等;其次,分析營銷效果,這是此賬號分析中比較特殊的一點,因為李佳琦作為美妝博主、帶貨達(dá)人,對其帶貨能力的分析對于廣告投放等具有重要意義;再次,分析整體環(huán)境背景,如網(wǎng)民數(shù)、抖音使用人數(shù)、平均消費(fèi)水平等,便于后期進(jìn)行信息獲取。值得注意的一點是,正式進(jìn)行數(shù)據(jù)處理和分析時,此階段搜集到的數(shù)據(jù)也許并不會全部被用到,但還是要盡可能多地找到相關(guān)數(shù)據(jù),以提供更多的分析依據(jù)。2.獲取數(shù)據(jù)方法(1)第三方平臺——飛瓜數(shù)據(jù)飛瓜數(shù)據(jù)作為分析短視頻的專業(yè)工具,擁有豐富的數(shù)據(jù)資源和強(qiáng)大的數(shù)據(jù)分析能力。此案例中需要的賬號總體數(shù)據(jù)、商品推廣數(shù)據(jù)、作品數(shù)據(jù)、粉絲數(shù)據(jù)(包括新增粉絲數(shù)、粉絲年齡分布、粉絲性別分布、粉絲地域分布)和實時數(shù)據(jù)都可以在飛瓜平臺的數(shù)據(jù)監(jiān)測功能中獲取。對于獲取的數(shù)據(jù),可以將其整理在Excel表格中,供后續(xù)使用。(2)Web抓取數(shù)據(jù)——抖音工具箱抖音評論數(shù)據(jù)對衡量李佳琦賬號視頻效果與熱度具有重要參考意義,但抖音評論無法大批量復(fù)制,因此需要利用工具進(jìn)行抓取。在此使用抖音工具箱進(jìn)行評論數(shù)據(jù)的抓取。(3)互聯(lián)網(wǎng)部門及行業(yè)網(wǎng)站網(wǎng)民規(guī)模、網(wǎng)民屬性、短視頻用戶規(guī)模等數(shù)據(jù)可以從相關(guān)統(tǒng)計部門、互聯(lián)網(wǎng)部門及行業(yè)網(wǎng)站獲得,為了后續(xù)處理方便,最好將獲取的數(shù)據(jù)整理在Excel表格中。此案例中需要的背景數(shù)據(jù)主要來自中國互聯(lián)網(wǎng)信息中心發(fā)布的《第44次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》。(二)數(shù)據(jù)新聞“中國城鎮(zhèn)化的單身困境”數(shù)據(jù)獲取1.明確數(shù)據(jù)需求新聞選題和內(nèi)容板塊確定,即明確了數(shù)據(jù)新聞的方向,數(shù)據(jù)新聞中相應(yīng)的數(shù)據(jù)需求也得到明確。見數(shù)據(jù)新聞《中國城鎮(zhèn)化的單身困境》。2.收集獲取數(shù)據(jù)包括國家統(tǒng)計部門數(shù)據(jù)、互聯(lián)網(wǎng)部門及行業(yè)數(shù)據(jù)、Web抓取數(shù)據(jù)、系統(tǒng)日志采集數(shù)據(jù)。見數(shù)據(jù)新聞《中國城鎮(zhèn)化的單身困境》。思考與練習(xí):(1)簡述新媒體數(shù)據(jù)的來源渠道。(2)簡述常用的新媒體數(shù)據(jù)獲取的方式。(3)分別利用八爪魚工具和飛瓜數(shù)據(jù)工具對網(wǎng)站平臺和短視頻平臺進(jìn)行數(shù)據(jù)抓取。教學(xué)反思:(1)教學(xué)成功之處:(2)教學(xué)不足之處:(3)學(xué)生獲得知識和創(chuàng)新(知識掌握、技能獲取、價值觀理念樹立):(4)改進(jìn)措施和方案:XXXX大學(xué)教案第四章新媒體數(shù)據(jù)預(yù)處理建立目標(biāo)任務(wù)明確重難點課程導(dǎo)入,激發(fā)學(xué)習(xí)興趣。講授法,建立學(xué)習(xí)內(nèi)容的總體印象。講授,演示數(shù)據(jù)完整性、字段完整性案例。參考教材講授、演示利用python進(jìn)行缺失值處理。參考教材講授、演示利用Excel進(jìn)行重復(fù)值處理。結(jié)合圖示講解箱形圖原理。結(jié)合教材實例講解數(shù)據(jù)變換的五種途徑。結(jié)合教材實例講解數(shù)據(jù)規(guī)約的三種方法。課堂實驗:參考教材指導(dǎo)學(xué)生對數(shù)據(jù)預(yù)處理進(jìn)行操作實驗。布置作業(yè)、鞏固知識,進(jìn)行形成性評價。教學(xué)反思一、課時安排:課時(理論講授6課時,實踐4課時)二、教學(xué)課型:理論、實踐課三、教學(xué)目標(biāo):(1)了解新媒體數(shù)據(jù)可用性鑒別指標(biāo)。(2)掌握新媒體數(shù)據(jù)預(yù)處理方法。(3)掌握新媒體數(shù)據(jù)預(yù)處理應(yīng)用。四、教學(xué)重點難點:(1)新媒體數(shù)據(jù)預(yù)處理方法(重點在于利用python進(jìn)行數(shù)據(jù)預(yù)處理)。(2)新媒體數(shù)據(jù)預(yù)處理應(yīng)用。五、教學(xué)方法:多媒體教學(xué)(講授法、實驗法)六、教學(xué)過程與內(nèi)容:課程導(dǎo)入:新媒體數(shù)據(jù)分析面臨的不規(guī)范性問題以及預(yù)處理價值的體現(xiàn)。本章概述:數(shù)據(jù)預(yù)處理(DataPreprocessing)是指在主要的處理和分析以前對數(shù)據(jù)進(jìn)行的一些必要的加工整理,主要目標(biāo)是清理異常值、糾正錯誤數(shù)據(jù)、統(tǒng)一數(shù)據(jù)格式等。本章首先介紹新媒體數(shù)據(jù)可用性鑒別指標(biāo),分別是數(shù)據(jù)真實性、數(shù)據(jù)完整性和數(shù)據(jù)價值性鑒別;其次,介紹數(shù)據(jù)預(yù)處理的四種基本方法,分別是數(shù)據(jù)清洗(缺失值處理、重復(fù)值處理和異常值發(fā)現(xiàn))、數(shù)據(jù)集成(實體識別、冗余和數(shù)據(jù)值沖突問題)、數(shù)據(jù)變換(平滑、聚集、數(shù)據(jù)概化、規(guī)范化和屬性構(gòu)造)以及數(shù)據(jù)規(guī)約(數(shù)據(jù)立方體聚集、維規(guī)約和數(shù)值規(guī)約);最后,以某旅游APP的酒店客戶信息數(shù)據(jù)為例,介紹數(shù)據(jù)預(yù)處理在新媒體領(lǐng)域的實際應(yīng)用。第一節(jié)新媒體數(shù)據(jù)可用性鑒別指標(biāo)(一)數(shù)據(jù)真實性鑒別1.數(shù)據(jù)來源真實數(shù)據(jù)來源真實是保證數(shù)據(jù)真實的首要條件。數(shù)據(jù)來源整體可以分為官方和其他渠道(包括行業(yè)數(shù)據(jù)、抓取數(shù)據(jù)和問卷數(shù)據(jù)等)兩種。一般來說,官方統(tǒng)計的數(shù)據(jù)相對權(quán)威,能夠保障真實性,其他渠道獲取的數(shù)據(jù)更要認(rèn)真進(jìn)行鑒別,防止因利益、主觀傾向等因素造成的不真實。2.數(shù)據(jù)細(xì)節(jié)真實失之毫厘,差之千里,統(tǒng)計數(shù)據(jù)中某個參數(shù)的不準(zhǔn)確,都有可能導(dǎo)致結(jié)果出現(xiàn)極大偏差,因此,對數(shù)據(jù)細(xì)節(jié)進(jìn)行核實,是保證數(shù)據(jù)真實準(zhǔn)確的重要手段。如網(wǎng)絡(luò)問卷調(diào)查中,設(shè)置每個IP地址只能回答一次;紙質(zhì)問卷調(diào)查中,多次核查錄入數(shù)據(jù)以避免失誤。(二)數(shù)據(jù)完整性鑒別1.記錄是否完整根據(jù)關(guān)系型數(shù)據(jù)庫相關(guān)概念,可以把數(shù)據(jù)表中的每一行叫做一個“記錄”。每一個記錄包含該行中的所有信息,就像在通訊錄數(shù)據(jù)庫中某個人全部的信息,但記錄在數(shù)據(jù)庫中并沒有專門的記錄名,常常用它所在的行數(shù)表示這是第幾個記錄。例:“記錄”圖示。2.字段是否完整字段是比記錄更小的單位,字段集合組成記錄,每個字段描述文獻(xiàn)的某一特征,即數(shù)據(jù)項,并有唯一的供計算機(jī)識別的字段標(biāo)識符。例:“字段”圖示。(三)數(shù)據(jù)價值性鑒別1.數(shù)據(jù)時效性分析數(shù)據(jù)是什么時間產(chǎn)生的,是否還適用于現(xiàn)在的情況是對數(shù)據(jù)進(jìn)行價值判斷時必須要考慮的問題,只有確定數(shù)據(jù)產(chǎn)生的時間,才能更好地確定數(shù)據(jù)的時效性和適用范圍。例如,要研究2019年青少年短視頻使用情況,10年前的相關(guān)數(shù)據(jù)顯然不能適用于當(dāng)前的研究,數(shù)據(jù)也就失去了它的價值。2.數(shù)據(jù)支持性分析數(shù)據(jù)能否有效支撐研究主題或觀點是數(shù)據(jù)價值判斷的一個重要方面,有些數(shù)據(jù)即使本身沒有任何問題,但它不能對主題起到幫助,因而在此主題下它就是沒有價值的。如了解中國青少年網(wǎng)絡(luò)使用情況,老年人網(wǎng)絡(luò)使用情況調(diào)查數(shù)據(jù)在這里是沒有價值的。3.數(shù)據(jù)全面性分析某些數(shù)據(jù)確實可以為主題服務(wù),但僅用這些數(shù)據(jù)不能充分說明問題,需要有更多的數(shù)據(jù)作為它的背景或者比較對象才能揭示主題。因此,全面結(jié)合特定主題下的相關(guān)數(shù)據(jù)才能最大程度發(fā)揮數(shù)據(jù)的價值。如研究婚姻狀況,僅有結(jié)婚率、離婚率數(shù)據(jù)是不夠的,需要結(jié)合適婚男女性別比、夫妻雙方收入情況、文化水平等多方面數(shù)據(jù)分析,才能體現(xiàn)相關(guān)意義,揭示研究主題。第二節(jié)新媒體數(shù)據(jù)預(yù)處理方法(一)數(shù)據(jù)清洗數(shù)據(jù)清洗(DataCleaning)是指發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識別的錯誤的最后一道程序,包括糾正不一致的數(shù)據(jù)、填補(bǔ)遺漏數(shù)據(jù)、消除異常數(shù)據(jù)以及平滑噪音數(shù)據(jù)等。與問卷審核不同,數(shù)據(jù)錄入后的清洗一般是由計算機(jī)而不是人工完成。進(jìn)行數(shù)據(jù)清洗的原因在于直接采集來的數(shù)據(jù)是“臟”的,主要體現(xiàn)在數(shù)據(jù)的不完整性、異常性、錯誤性以及冗余性。數(shù)據(jù)清洗常見方法操作包括以下幾方面:1.缺失值處理數(shù)據(jù)并不總是完整的。對于缺失值的處理,主要是通過推斷進(jìn)行填補(bǔ),大多數(shù)情況下缺失的值必須手工填入(即手工清洗)。2.重復(fù)值處理數(shù)據(jù)庫中屬性值相同的記錄被認(rèn)為是重復(fù)的記錄,通過判斷記錄間的屬性是否相等來檢測記錄是否相等,相等的記錄合并為一條記錄(即合并/清除)。本部分內(nèi)容將介紹運(yùn)用Excel刪除重復(fù)數(shù)據(jù)的三種方法。3.異常值發(fā)現(xiàn)數(shù)據(jù)清洗中的異常值常用畫箱形圖(Box-plot)這一方法發(fā)現(xiàn)。箱形圖又稱為盒須圖、盒式圖或箱線圖,是一種用作顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計圖,因形狀如箱子而得名。箱形圖的繪制方法是先找出一組數(shù)據(jù)的上邊緣、下邊緣、中位數(shù)和兩個四分位數(shù);然后連接兩個四分位數(shù)畫出箱體;再將上邊緣和下邊緣與箱體相連接,中位數(shù)在箱體中間。(二)數(shù)據(jù)集成數(shù)據(jù)集成(DataIntegration)主要指將多個數(shù)據(jù)源中的數(shù)據(jù)整合到一個一致的存儲中,解決數(shù)據(jù)的分布性和異構(gòu)性問題。其意義在于聯(lián)通“信息孤島”,共享信息。在企業(yè)數(shù)據(jù)集成領(lǐng)域,目前通常采用聯(lián)邦式、基于中間件模型和數(shù)據(jù)倉庫等方法構(gòu)建集成的系統(tǒng)。數(shù)據(jù)集成的關(guān)鍵是要建立統(tǒng)一的數(shù)據(jù)規(guī)范結(jié)構(gòu)。在數(shù)據(jù)集成中主要有以下三大問題需要解決:實體識別問題、冗余問題、數(shù)據(jù)值沖突問題。(三)數(shù)據(jù)變換數(shù)據(jù)變換是指對數(shù)據(jù)進(jìn)行規(guī)范化處理,將數(shù)據(jù)轉(zhuǎn)換或統(tǒng)一成適合挖掘的形式。數(shù)據(jù)變換包括平滑、聚集、數(shù)據(jù)概化、規(guī)范化和屬性構(gòu)造五種途徑。1.平滑平滑指去除噪聲、將連續(xù)的數(shù)據(jù)離散化、增加粒度。實現(xiàn)平滑主要有三種方法:分箱、聚類和回歸。2.聚集聚集主要指對數(shù)據(jù)進(jìn)行匯總,例如在Excel中可以通過SUM、COUNT等函數(shù)實現(xiàn)。應(yīng)用中如每班學(xué)生數(shù)可以進(jìn)行求和操作以獲得每專業(yè)或每學(xué)院學(xué)生總數(shù)。3.數(shù)據(jù)概化數(shù)據(jù)概化是指用更高層次、更抽象的概念來取代低層次或數(shù)據(jù)層的數(shù)據(jù)對象。例如,街道屬性就可以泛化到更高層次的概念——城市、國家;對于數(shù)值型的屬性,如年齡屬性(20歲、40歲、60歲),也可以映射到更高層次概念——年輕、中年和老年。4.規(guī)范化規(guī)范化是指將數(shù)據(jù)按比例進(jìn)行縮放,使之落入一個特定的區(qū)域,以消除數(shù)值型屬性因大小不一而造成挖掘結(jié)果的偏差。數(shù)據(jù)規(guī)范化的主要作用有兩個,一是去掉量綱,使得指標(biāo)之間具有可比性;二是將數(shù)據(jù)限制到一定區(qū)間,使得運(yùn)算更為便捷。規(guī)范化包括最小-最大規(guī)范化、零均值規(guī)范化和小數(shù)定標(biāo)規(guī)范化。5.屬性構(gòu)造屬性構(gòu)造是指利用已有屬性集構(gòu)造出新的屬性,并加入到現(xiàn)有屬性集合中以幫助挖掘更深層次的模式知識,提高挖掘結(jié)果準(zhǔn)確性。例如:根據(jù)寬、高屬性可以構(gòu)造一個新屬性——面積。(四)數(shù)據(jù)歸約數(shù)據(jù)歸約(Reduce)是指在盡可能保持?jǐn)?shù)據(jù)原貌的前提下,最大限度地精簡數(shù)據(jù)量(完成該任務(wù)的必要前提是理解挖掘任務(wù)和熟悉數(shù)據(jù)本身內(nèi)容,詳見本書第二章)。數(shù)據(jù)歸約得到的數(shù)據(jù)比原數(shù)據(jù)小得多,但可以產(chǎn)生與原數(shù)據(jù)相同或基本相同的分析結(jié)果,提高挖掘效率。常見的數(shù)據(jù)規(guī)約方法包括數(shù)據(jù)立方聚集、維歸約、數(shù)據(jù)壓縮和數(shù)值歸約等。1.數(shù)據(jù)立方體聚集數(shù)據(jù)立方體聚集指的是將n維數(shù)據(jù)聚集為n-1維數(shù)據(jù)立方體。其中,數(shù)據(jù)立方體是數(shù)據(jù)的多維建模和表示,由維(屬性)和事實(數(shù)據(jù))組成。2.維歸約維歸約指去掉無關(guān)的屬性,減少數(shù)據(jù)挖掘處理的數(shù)據(jù)量。維歸約的目標(biāo)是尋找出最小的屬性子集并確保新數(shù)據(jù)子集的概率分布盡可能接近原來數(shù)據(jù)集的概率分布。如挖掘網(wǎng)民是否愿意購買視頻軟件VIP的分類規(guī)則時,網(wǎng)民的電子郵箱很可能與挖掘任務(wù)無關(guān),應(yīng)該可以去掉。維歸約的重點是選擇相關(guān)屬性的子集,這里主要介紹三種方法:逐步向前選擇,逐步向后刪除和判定樹(決策樹)歸納。其中,逐步向前選擇和逐步向后刪除可以結(jié)合使用。3.數(shù)值歸約數(shù)值歸約指用較小的數(shù)據(jù)表示數(shù)據(jù),或采用較短的數(shù)據(jù)單位,或者用數(shù)據(jù)模型代表數(shù)據(jù),減少數(shù)據(jù)量。數(shù)值歸約常用的方法有直方圖、聚類、抽樣、參數(shù)回歸法、離散化與概念分層生成。第三節(jié)新媒體數(shù)據(jù)預(yù)處理應(yīng)用(一)“某旅游APP的酒店客戶信息”數(shù)據(jù)預(yù)處理本節(jié)內(nèi)容以某旅游APP的酒店客戶信息數(shù)據(jù)為例,介紹數(shù)據(jù)預(yù)處理在新媒體領(lǐng)域的實際應(yīng)用。1.數(shù)據(jù)源介紹抓取2012-03-31至2014-03-31兩年內(nèi)有入住記錄的所有客戶的詳細(xì)數(shù)據(jù),共計1279條。其中包含42個屬性。2.數(shù)據(jù)預(yù)處理(1)缺失值處理由于類別屬性類缺失值填充難度大,且原始數(shù)據(jù)量大,故對其所在記錄采取丟棄處理。(2)重復(fù)值處理以會員號作為每條記錄的唯一標(biāo)識,查詢會員號是否有重復(fù)值。(3)異常值處理用條件格式查找工作地城市和工作地所在省份中的異常值,對于無法識別的異常值進(jìn)行丟棄;對于可以修正的異常值,比如已知工作地所在城市,可以對工作地所在省份的異常數(shù)據(jù)修正。(4)數(shù)據(jù)概化將42個屬性概化為客戶基本信息、入住信息以及積分信息3大屬性,如下圖所示在Excel中對數(shù)據(jù)進(jìn)行有效分類。(5)聚集利用SUM求和函數(shù),根據(jù)第一年總?cè)胱∠M(fèi)和第二年總?cè)胱∠M(fèi)求出兩年總?cè)胱∠M(fèi),如下圖所示。(6)維規(guī)約由于原始數(shù)據(jù)中屬性太多,結(jié)合案例中數(shù)據(jù)預(yù)處理的三大目標(biāo),采用逐步向后刪除法,去掉與其不相關(guān)、弱相關(guān)或者冗余的屬性。(7)屬性構(gòu)造RFM模型是衡量客戶價值和客戶創(chuàng)利能力的重要工具和手段,其中R(Recency)代表最近一次消費(fèi),F(xiàn)(Frequency)代表消費(fèi)頻率,M(Monetary)代表消費(fèi)金額。(二)“中國城鎮(zhèn)化的單身困境”數(shù)據(jù)預(yù)處理本部分內(nèi)容將利用本章數(shù)據(jù)預(yù)處理方法對第三章中數(shù)據(jù)新聞案例“中國城鎮(zhèn)化的單身困境”收集獲取的數(shù)據(jù)進(jìn)行預(yù)處理。1.數(shù)據(jù)可用性鑒別首先,來自國家統(tǒng)計局、《中國統(tǒng)計年鑒》等的官方數(shù)據(jù)相對權(quán)威,而《人民日報》、百度指數(shù)和鳳凰網(wǎng)等數(shù)據(jù)權(quán)威性較弱,需要進(jìn)行交叉驗證。其次,在本數(shù)據(jù)新聞中,具備城鄉(xiāng)、性別、婚姻狀況、年齡等屬性的數(shù)據(jù)更具價值,能更好地發(fā)現(xiàn)問題,服務(wù)主題。再次,本數(shù)據(jù)新聞的主題是“中國城鎮(zhèn)化的單身困境”,僅靠婚姻狀況數(shù)據(jù)是難以說明城鎮(zhèn)化與單身的問題。因此,從數(shù)據(jù)的全面性出發(fā),各地的房價數(shù)據(jù)、彩禮數(shù)據(jù)和受教育數(shù)據(jù)等也具有重要價值。2.數(shù)據(jù)清洗(1)缺失值處理本數(shù)據(jù)新聞中的缺失值主要體現(xiàn)在媒體平臺對“大齡未婚男女”的評價方面,對于此類缺失數(shù)據(jù),只能將所在的整條記錄刪除。(2)重復(fù)值處理本數(shù)據(jù)新聞中的重復(fù)值主要體現(xiàn)在各地彩禮數(shù)據(jù)中,在收集到的人民日報和鳳凰網(wǎng)關(guān)于各地彩禮數(shù)據(jù)的報道中,發(fā)現(xiàn)某地區(qū)2017年的彩禮數(shù)據(jù)相同,予以合并。3.數(shù)據(jù)變換(1)聚集運(yùn)用Excel中的COUNTIF函數(shù),根據(jù)“發(fā)布時間”條件對各媒體各年度有關(guān)“城市大齡未婚女”和“農(nóng)村大齡未婚男”的報道次數(shù)求和。(2)數(shù)據(jù)概化為方便數(shù)據(jù)分析,本案例將年齡在28歲以上的單身女性概化為“大齡未婚女”,將年齡在30歲以上的單身男性概化為“大齡單身未婚男”。在此基礎(chǔ)上,加入城鄉(xiāng)維度的數(shù)據(jù),概化為“城市大齡未婚女”和“農(nóng)村大齡未婚男”兩大群體。此外,將工資性收入、生活用品及服務(wù)支出、交通通信支出、教育文化娛樂支出以及醫(yī)療保健支出等五項數(shù)據(jù)概化為資源數(shù)據(jù),從而比較城鄉(xiāng)資源的差距。(3)屬性構(gòu)造結(jié)合各地區(qū)未婚男和未婚女兩類數(shù)據(jù),根據(jù)“人口性別比=(男性人數(shù)÷女性人數(shù))×100%”的公式,構(gòu)造屬性“未婚人口性別比”。(4)維規(guī)約為分析其他因素對“城市大齡未婚女”和“農(nóng)村大齡未婚男”的影響,本案例從數(shù)據(jù)的完整性和時效性出發(fā),以2017年作為時間標(biāo)準(zhǔn),選取2017年的全國未婚男女人口數(shù)、城鎮(zhèn)未婚男女人口、農(nóng)村未婚男女人口、各地區(qū)未婚人數(shù)性別比、各年齡段性別比、城鄉(xiāng)資源差距數(shù)據(jù)、各地彩禮數(shù)據(jù)等,去掉其他時間段的無關(guān)數(shù)據(jù)屬性。思考與練習(xí):(1)簡述新媒體數(shù)據(jù)可用性鑒別的指標(biāo)。(2)簡述新媒體數(shù)據(jù)預(yù)處理包括哪些類別以及各類別的處理方法。(3)利用新媒體數(shù)據(jù)預(yù)處理的方法對本章應(yīng)用案例中的數(shù)據(jù)進(jìn)行預(yù)處理。教學(xué)反思:(1)教學(xué)成功之處:(2)教學(xué)不足之處:(3)學(xué)生獲得知識和創(chuàng)新(知識掌握、技能獲取、價值觀理念樹立):(4)改進(jìn)措施和方案:XXXX大學(xué)教案第五章新媒體數(shù)據(jù)分析建立目標(biāo)任務(wù)明確重難點課程導(dǎo)入,激發(fā)學(xué)習(xí)興趣。講授法,建立學(xué)習(xí)內(nèi)容的總體印象。講授法、案例分析法講授法、案例分析法講授法、案例分析法講授法,結(jié)合教材講解六種流量數(shù)據(jù)分析的內(nèi)涵。講授法,結(jié)合教材講解銷售分析的內(nèi)涵。講授法,結(jié)合教材講解內(nèi)容分析的特點及要點。講授法,結(jié)合教材講解執(zhí)行分析的內(nèi)涵。講授法、案例分析法講授法、演示法,講解六種相對數(shù)比較。講授法、演示法講授法、演示法講授法、演示法。引導(dǎo)學(xué)生利用手機(jī)掃描二維碼線上線下相結(jié)合詳細(xì)學(xué)習(xí)KANO模型。第(五)至(九)講授法、演示法課堂實驗:指導(dǎo)學(xué)生進(jìn)行相關(guān)性、貢獻(xiàn)度、平均、矩陣分析實驗。布置作業(yè)、鞏固知識,進(jìn)行形成性評價。教學(xué)反思一、課時安排:課時(理論講授7課時,實踐5課時)二、教學(xué)課型:理論、實踐課三、教學(xué)目標(biāo):(1)了解新媒體數(shù)據(jù)分析的作用。(2)熟悉新媒體數(shù)據(jù)分析的類別。(3)了解新媒體數(shù)據(jù)分析誤區(qū)的規(guī)避。(4)掌握新媒體數(shù)據(jù)分析的方法。(5)掌握新媒體數(shù)據(jù)分析的應(yīng)用。四、教學(xué)重點難點:(1)新媒體數(shù)據(jù)分析類別。(2)新媒體數(shù)據(jù)分析的方法。(3)新媒體數(shù)據(jù)分析的應(yīng)用。五、教學(xué)方法:多媒體教學(xué)(講授法、實驗法)六、教學(xué)過程與內(nèi)容:課程導(dǎo)入:新媒體數(shù)據(jù)分析在不同領(lǐng)域的需求和作用。本章概述:新媒體數(shù)據(jù)分析是指運(yùn)用適當(dāng)?shù)慕y(tǒng)計分析方法對收集來的大量新媒體數(shù)據(jù)進(jìn)行分析,將它們加以匯總理解,以求最大化地開發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。本章首先介紹了新媒體數(shù)據(jù)分析在新聞內(nèi)容創(chuàng)作、媒體運(yùn)營策略以及網(wǎng)絡(luò)輿情監(jiān)測三大領(lǐng)域的作用。其次,本章講解了新媒體數(shù)據(jù)分析的四大類別,分別是流量分析、銷售分析、內(nèi)容分析和執(zhí)行分析。再次,本章辨析了新媒體數(shù)據(jù)分析的三大誤區(qū),分別是要全部不要抽樣、要混雜不要精確、要相關(guān)不要因果。最后,本章以旅游APP的數(shù)據(jù)為例,綜合運(yùn)用了相關(guān)性分析法、貢獻(xiàn)度分析法、平均分析法以及矩陣分析法等四種分析方法,在實踐中領(lǐng)悟每種分析方法的適應(yīng)情境。第一節(jié)新媒體數(shù)據(jù)分析的作用(一)新聞內(nèi)容創(chuàng)作1.新聞選題創(chuàng)新傳統(tǒng)的新聞選題——記者依據(jù)傳統(tǒng)的新聞價值準(zhǔn)則進(jìn)行選擇;數(shù)據(jù)分析——挖掘以往人為發(fā)現(xiàn)不了的新穎選題角度和方向,從科學(xué)統(tǒng)計的視角提供新聞線索。2.內(nèi)容深度專業(yè)數(shù)據(jù)分析為專題新聞深度報道提供了豐富的數(shù)據(jù)來源和科學(xué)的數(shù)據(jù)支撐,這對于社會、財經(jīng)、體育、突發(fā)類自然災(zāi)害等新聞的報道有重要意義。在自媒體日益喧囂的今日,數(shù)據(jù)分析可以有效成為專業(yè)媒體的利刃和優(yōu)勢,幫助其向智庫媒體轉(zhuǎn)型。3.效果評估準(zhǔn)確主要分為兩大類:一是評估新聞的傳播效果和路徑,包括對新聞的閱讀量、轉(zhuǎn)發(fā)量、點贊量、評論量、傳播平臺等數(shù)據(jù)的分析;二是評估讀者特征,包括對讀者的年齡、性別、職業(yè)、興趣的分析。新聞工作者可根據(jù)準(zhǔn)確、及時的效果評估進(jìn)一步提升新聞制作水平,優(yōu)化傳播路徑,完成更加高質(zhì)量的新聞作品。(二)數(shù)據(jù)營銷推廣1.目標(biāo)用戶鎖定新媒體運(yùn)營者可以通過品牌官網(wǎng)、品牌公眾號等了解到用戶性別、地域、年齡、購物偏好、評價等數(shù)據(jù),有助于產(chǎn)品方鎖定自身用戶,獲取新用戶,維護(hù)老用戶。2.精準(zhǔn)場景推送隨著移動通訊、空間定位、大數(shù)據(jù)等多種信息技術(shù)的發(fā)展,基于位置的服務(wù)(LocationBasedServices,LBS)越來越多應(yīng)用到營銷領(lǐng)域,商家可以利用移動互聯(lián)網(wǎng)絡(luò)服務(wù)平臺獲取用戶位置相關(guān)信息,并對數(shù)據(jù)進(jìn)行更新和交互,從而為用戶提供相應(yīng)服務(wù)。例如,美團(tuán)可根據(jù)用戶位置推薦附近商家。3.營銷成本控制根據(jù)目標(biāo)用戶的常用App、支付方式、消費(fèi)金額等數(shù)據(jù),優(yōu)化廣告投放渠道,實現(xiàn)精準(zhǔn)營銷,節(jié)約推廣成本。4.營銷方案評估營銷方案執(zhí)行效果需要通過數(shù)據(jù)進(jìn)行評估。可以運(yùn)用逆向工程思維,通過最終完成數(shù)據(jù),反推出方案中目標(biāo)的可行性;也可以分析過程數(shù)據(jù),及時發(fā)現(xiàn)方案制定后在執(zhí)行過程中遇到的問題,作為下次營銷方案制定的參考。在評估營銷方案中常用到的數(shù)據(jù)包括目標(biāo)達(dá)成率、最終銷售額、過程異常數(shù)據(jù)以及失誤率等。(三)網(wǎng)絡(luò)輿情監(jiān)測1.展現(xiàn)輿情傳播路徑首先可以展現(xiàn)當(dāng)前輿情所處的爆發(fā)階段——潛伏期、爆發(fā)期、蔓延期、緩解期、反復(fù)期、消退期。其次,了解輿情事件的傳播渠道分布。最后,還可以預(yù)判輿情未來的傳播走勢,為進(jìn)一步的監(jiān)測應(yīng)對提供支撐。2.反映輿情話題熱度話題分析包括網(wǎng)民觀點和媒體觀點。數(shù)據(jù)分析可以幫助實現(xiàn)話題的關(guān)鍵詞分布情況以及話題傾向性分布情況。對輿情話題進(jìn)行聚類可以了解網(wǎng)民和媒體對該輿情事件的關(guān)注焦點。3.揭示網(wǎng)民情感態(tài)度隨著近年來事件本身和傳播環(huán)境的愈發(fā)復(fù)雜、輿論話語權(quán)的不斷分散,尤其是網(wǎng)民理性與感性的角力,網(wǎng)民的情感態(tài)度愈發(fā)復(fù)雜。因此,通過科學(xué)專業(yè)的媒體數(shù)據(jù)分析揭示網(wǎng)民復(fù)雜多樣的情感態(tài)度對網(wǎng)絡(luò)輿情監(jiān)測有著重要作用。第二節(jié)新媒體數(shù)據(jù)分析類別新媒體數(shù)據(jù)分析可按照以下標(biāo)準(zhǔn)分類:(1)按照數(shù)據(jù)呈現(xiàn)形式可以分為數(shù)值型和圖文型兩類。數(shù)值型數(shù)據(jù)多為結(jié)構(gòu)化數(shù)據(jù),主要由數(shù)字組成,比如閱讀量、粉絲量、網(wǎng)店的銷售數(shù)據(jù)、網(wǎng)站的瀏覽數(shù)據(jù)等。圖文型數(shù)據(jù)多為半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),例如網(wǎng)站欄目分類、賬號粉絲分類、消費(fèi)者反饋以及各種平臺的矩陣分布等。(2)按照數(shù)據(jù)分析功能可以分為流量分析、銷售分析、內(nèi)容分析以及執(zhí)行分析四大類。相比較于第一種分類方法,第二種分類方法充分考慮到新媒體數(shù)據(jù)的情境性與實用性,因此本書著重按照第二種分類方法介紹新媒體數(shù)據(jù)分析。(一)流量分析流量分析即網(wǎng)站或網(wǎng)店流量分析,通過對訪問量、訪問時間、跳出量、跳出率等流量數(shù)據(jù)進(jìn)行分析,可以評估網(wǎng)站運(yùn)營的基礎(chǔ)情況。隨著智能手機(jī)的普及,越來越多的網(wǎng)民開始利用手機(jī)打開網(wǎng)頁,因此現(xiàn)階段流量分析的重點是移動端流量數(shù)據(jù)分析,包括報名表單訪問量、H5訪問量、微網(wǎng)站流量、微網(wǎng)站跳出率等。1.訪問量(PV)訪問量(PageView,PV)即頁面瀏覽量,或點擊量,用戶每1次對網(wǎng)站中的每個網(wǎng)頁訪問均被記錄一次。2.UVUV(UniqueVisitor)即唯一身份訪問者(獨(dú)立訪客),是指通過互聯(lián)網(wǎng)訪問、瀏覽某個頁面的自然人。3.訪問時間訪問時間即停留時間,分為頁面停留時間和網(wǎng)站整體停留時間。4.跳出量跳出量即訪問某頁面后,不再訪問深層或其他相關(guān)頁面的用戶的數(shù)量。5.跳出率跳出率即用戶從某頁面退出的該頁面訪問數(shù)/進(jìn)入該頁面的訪問數(shù)百分比。6.交互率交互率即多少用戶進(jìn)行了交互行為,包括轉(zhuǎn)、贊、評等行為。(二)銷售分析銷售分析即對互聯(lián)網(wǎng)產(chǎn)生的下單數(shù)量、支付比例、二次購買比例等進(jìn)行分析,尋找當(dāng)前互聯(lián)網(wǎng)銷售的問題。需要強(qiáng)調(diào)的是,銷售分析不僅限于在網(wǎng)上消費(fèi),消費(fèi)者線上預(yù)定線下消費(fèi),即O2O(OnlinetoOffline)也可算作銷售分析的范疇。銷售分析包括整體銷售分析和區(qū)域銷售分析。(三)內(nèi)容分析1.內(nèi)容特點碎片化,豐富性,非線性。2.分析要點標(biāo)題,關(guān)鍵詞、標(biāo)簽,發(fā)布情況,超鏈接,評論,背景音樂。(四)執(zhí)行分析執(zhí)行分析即對團(tuán)隊成員的日常執(zhí)行工作與評估,包括文章撰寫速度、客服影響速率等。新媒體工作是否有效率,可以借助執(zhí)行數(shù)據(jù)進(jìn)行分析。第三節(jié)新媒體數(shù)據(jù)分析誤區(qū)規(guī)避(一)要全部不要抽樣19世紀(jì)以來,當(dāng)面臨大量數(shù)據(jù)時,社會都依賴于采樣分析。但是采樣分析是信息缺乏時代和信息流通受限制的模擬數(shù)據(jù)時代的產(chǎn)物。它本身存在許多固有的缺陷,其成功依賴于采樣的絕對隨機(jī)性,一旦采樣過程中存在任何偏見,分析結(jié)果就會相去甚遠(yuǎn)。以前我們通常把這看成是理所當(dāng)然的限制,但是現(xiàn)在廉價的存儲設(shè)備、高性能的運(yùn)算能力讓我們意識到,這其實是一種人為的限制。與局限在小數(shù)據(jù)范圍相比,“樣本=總體”讓我們看到了一些以前樣本無法揭示的細(xì)節(jié)信息。(二)要混雜不要精確1.數(shù)據(jù)類型的多樣性新媒體數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)三大類型。結(jié)構(gòu)化數(shù)據(jù)是指可以用關(guān)系型數(shù)據(jù)庫表示和存儲,表現(xiàn)為二維形式的數(shù)據(jù)。半結(jié)構(gòu)化數(shù)據(jù)是指不符合關(guān)系型數(shù)據(jù)庫或其他數(shù)據(jù)表的形式關(guān)聯(lián)起來的數(shù)據(jù)模型結(jié)構(gòu),但是包含相關(guān)標(biāo)記,用來分割語義元素以及對記錄和字段進(jìn)行分層。非結(jié)構(gòu)化數(shù)據(jù)就是沒有固定結(jié)構(gòu)的數(shù)據(jù)。2.數(shù)據(jù)的不精確性接受數(shù)據(jù)的不精確性是因為在大數(shù)據(jù)時代,我們關(guān)注的通常是趨勢和方向,在海量數(shù)據(jù)中,個別數(shù)據(jù)的不精確一般不會影響某種趨勢和方向。而且數(shù)據(jù)類型的多樣性有時決定了很難達(dá)到數(shù)據(jù)的精確性,比如對短視頻內(nèi)容的檢索和分析。(三)要相關(guān)不要因果所謂相關(guān)關(guān)系,其核心是指量化兩個數(shù)據(jù)值之間的數(shù)理關(guān)系,建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測是大數(shù)據(jù)的核心。相關(guān)關(guān)系強(qiáng)是指當(dāng)一個數(shù)據(jù)值增加時,另一個數(shù)據(jù)值很有可能也會隨之增加。第四節(jié)新媒體數(shù)據(jù)分析方法(一)對比分析法對比分析法是把客觀事物加以比較,以達(dá)到認(rèn)識事物的本質(zhì)和規(guī)律并做出正確評價的方法。對比分析法通常是把兩個相互聯(lián)系的指標(biāo)數(shù)據(jù)進(jìn)行比較,從數(shù)量上展示和說明研究對象規(guī)模的大小、水平的高低、速度的快慢以及各種關(guān)系是否協(xié)調(diào)。對比分析包括絕對數(shù)比較和相對數(shù)比較兩種形式。絕對數(shù)比較是利用絕對數(shù)進(jìn)行對比,從而尋找差異的一種方法。相對數(shù)比較包括結(jié)構(gòu)相對數(shù)、比例相對數(shù)、比較相對數(shù)、強(qiáng)度相對數(shù)、計劃完成程度相對數(shù)和動態(tài)相對數(shù)。(二)分組分析法分組分析法是指通過統(tǒng)計分組的計算和分析,來認(rèn)識所要分析對象的不同特征、不同性質(zhì)及相互關(guān)系。分組分析法是在分組的基礎(chǔ)上,對現(xiàn)象的內(nèi)部結(jié)構(gòu)或現(xiàn)象之間的依存關(guān)系從定性或定量的角度做進(jìn)一步分析研究,以便尋找事物發(fā)展的規(guī)律,正確地分析問題和解決問題。分組時必須遵循兩個原則:窮盡原則和互斥原則。所謂窮盡原則,就是使總體中的每一個單位都應(yīng)有組可歸,或者說各分組的空間足以容納總體所有的單位。所謂互斥原則,就是在特定的分組標(biāo)志下,總體中的任何一個單位只能歸屬于某一個組,不能同時或可能歸屬于幾個組。(三)平均分析法平均分析法就是用平均數(shù)來衡量總體在一定時間和地點條件下某數(shù)據(jù)的一般水平。平均數(shù)據(jù)比總量指標(biāo)更具說服力,更能幫助運(yùn)營者預(yù)測發(fā)展趨勢和規(guī)律。平均分析法包括數(shù)值平均數(shù)和位置平均數(shù),數(shù)值平均數(shù)又包括算術(shù)平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù),其中最常用的是算術(shù)平均值,即算術(shù)平均值=總體各數(shù)據(jù)的總和/數(shù)據(jù)個數(shù)。位置平均數(shù)又包括眾數(shù)和中位數(shù),眾數(shù)直觀地反映了總體的集中趨勢,中位數(shù)代表了現(xiàn)象的一般水平。(四)矩陣分析法矩陣分析法是一種定量分析數(shù)據(jù)的方法。它是指以數(shù)據(jù)兩個重要指標(biāo)作為分析依據(jù),并將這兩個指標(biāo)作為橫、縱坐標(biāo)軸,構(gòu)成四個象限,從而找出解決問題的方法,為運(yùn)營者提供數(shù)據(jù)參考。以經(jīng)典的KANO模型為例:以分析用戶需求對用戶滿意的影響為基礎(chǔ),體現(xiàn)了產(chǎn)品性能和用戶滿意之間的非線性關(guān)系。如圖所示,橫縱坐標(biāo)分別表示產(chǎn)品的功能具備程度和用戶的滿意度。(五)網(wǎng)絡(luò)分析法網(wǎng)絡(luò)分析法是一種分析處于同一網(wǎng)絡(luò)中的各個節(jié)點之間的互動以及各節(jié)點的權(quán)重關(guān)系的方法。新媒體時代的交互性和去中心化更加凸顯了網(wǎng)絡(luò)分析法的重要價值。本節(jié)內(nèi)容以Python中的Networkx包為基礎(chǔ),以人民日報發(fā)布的157則短視頻標(biāo)題文字為語料,介紹網(wǎng)絡(luò)分析法,舉例見教材P96-P100。(六)相關(guān)性分析法相關(guān)性分析是指分析連續(xù)變量之間線性相關(guān)程度的強(qiáng)弱,并用適當(dāng)?shù)慕y(tǒng)計指標(biāo)表示出來的過程。大數(shù)據(jù)時代,數(shù)據(jù)間的相關(guān)關(guān)系比因果關(guān)系更加重要。在媒體營銷中,可以通過比較兩個商品的相關(guān)關(guān)系強(qiáng)弱來選擇是否進(jìn)行組合銷售。(七)貢獻(xiàn)度分析法貢獻(xiàn)度分析又稱帕累托分析,它的原理是帕累托法則,又稱20/80定律。例如,對一個公司來講,80%的利潤常常來自于20%最暢銷的產(chǎn)品。而隨著互聯(lián)網(wǎng)的發(fā)展,長尾理論日益凸顯價值。它是指只要產(chǎn)品的存儲和流通的渠道足夠大,需求不旺或銷量不佳的產(chǎn)品所共同占據(jù)的市場份額可以和那些少數(shù)熱銷產(chǎn)品所占據(jù)的市場份額相匹敵甚至更大,即眾多小市場匯聚成可產(chǎn)生與主流相匹敵的市場能量。貢獻(xiàn)度分析的意義在于通過找到貢獻(xiàn)了80%利潤的產(chǎn)品界限,幫助公司運(yùn)營者區(qū)分熱銷產(chǎn)品和長尾商品,從而制定針對性的銷售策略。貢獻(xiàn)度分析的公式為:貢獻(xiàn)度=累積貢獻(xiàn)數(shù)/總數(shù)×100%。(八)周期性分析法周期性分析是探索某個變量是否隨著時間變化而呈現(xiàn)出來某種周期變化趨勢。按照時間尺度的標(biāo)準(zhǔn)劃分,較長的周期性趨勢有年度周期性趨勢、季節(jié)性周期性趨勢;相對較短的有月度周期性趨勢,周度周期性趨勢,甚至更短的天、小時周期性趨勢。(九)回歸分析法回歸分析是通過研究事物發(fā)展變化的因果關(guān)系來預(yù)測事物發(fā)展的趨勢,它是研究變量間相互關(guān)系的一種定量預(yù)測方法。可通過對大量數(shù)據(jù)的處理來確定因變量與某些自變量的相關(guān)關(guān)系,建立一個相關(guān)性較好的回歸方程(函數(shù)表達(dá)式),并加以外推,用于預(yù)測今后的因變量的變化的分析方法。根據(jù)因變量和自變量的個數(shù)分為:一元回歸分析和多元回歸分析;按照因變量的多少,可分為簡單回歸分析和多重回歸分析;根據(jù)因變量和自變量的函數(shù)表達(dá)式分為:線性回歸分析和非線性回歸分析。新媒體數(shù)據(jù)分析中,通過已有數(shù)據(jù)的分析進(jìn)行預(yù)測也是重要應(yīng)用之一,回歸分析法為新媒體數(shù)據(jù)預(yù)測分析提供了重要支持。目前很多軟件或平臺都能實現(xiàn)回歸分析,如Excel、SPSS、Tableau等,以下將對Excel和Tableau軟件中回歸分析的操作及預(yù)測的應(yīng)用進(jìn)行闡述。第五節(jié)新媒體數(shù)據(jù)分析應(yīng)用(一)“某旅游APP的酒店客戶信息”數(shù)據(jù)分析本節(jié)在將在上一章數(shù)據(jù)預(yù)處理實例的基礎(chǔ)上,繼續(xù)對該旅游APP的數(shù)據(jù)進(jìn)行分析。1.相關(guān)性分析計算總?cè)胱∠M(fèi)分別與年齡、總?cè)胱〈螖?shù)、最后一次入住時間至調(diào)查截止時間時長(天)、平均入住時間間隔(天)、總?cè)胱》e分、總其他積分、總精英積分、積分兌換次數(shù)、平均折扣率以及總累計積分的相關(guān)系數(shù),比較各因素影響總?cè)胱∠M(fèi)金額的強(qiáng)弱。2.貢獻(xiàn)度分析為確定精英客戶的范圍,將總?cè)胱∠M(fèi)進(jìn)行貢獻(xiàn)度分析,找出為該旅游APP酒店服務(wù)貢獻(xiàn)了80%金額的會員號。對總?cè)胱∠M(fèi)金額從大到小排列后,發(fā)現(xiàn)前244位會員貢獻(xiàn)了超過80%的金額。3.平均分析根據(jù)總?cè)胱∠M(fèi)和總?cè)胱〈螖?shù),計算平均入住消費(fèi),公式如下:平均入住消費(fèi)=總?cè)胱∠M(fèi)/總?cè)胱〈螖?shù)。4.矩陣分析以平均入住時間間隔和平均入住消費(fèi)(平均分析法求得)兩個重要指標(biāo)作為分析依據(jù),并將其作為橫、縱坐標(biāo)軸,構(gòu)成四個象限,分析客戶特征,得出四大客戶群體。(二)數(shù)據(jù)新聞“中國城鎮(zhèn)化的單身困境”數(shù)據(jù)分析本部分內(nèi)容將利用本章數(shù)據(jù)分析方法對第四章中數(shù)據(jù)新聞案例“中國城鎮(zhèn)化的單身困境”預(yù)處理的數(shù)據(jù)進(jìn)行分析,提純有價值的內(nèi)容,為新聞服務(wù)。1.數(shù)據(jù)分析過程(1)對比分析:本案例中主要采用了結(jié)構(gòu)相對數(shù)、比較相對數(shù)、動態(tài)相對數(shù)、強(qiáng)度相對數(shù)四種對比分析方法。(2)預(yù)測分析:在Excel中,通過對近年“各年齡人數(shù)及結(jié)構(gòu)性別比”按照“性別比”進(jìn)行降序排列,發(fā)現(xiàn)人口性別比呈現(xiàn)低齡化趨勢,預(yù)測未來中國的“大齡未婚男”問題可能加重。(3)詞頻分析:本案例運(yùn)用Python,對百度和微博平臺上有關(guān)“城市大齡未婚女”“農(nóng)村大齡未婚男”的內(nèi)容進(jìn)行詞頻統(tǒng)計。(4)文本情感分析:文本情感分析又稱意見挖掘、傾向性分析等,是對帶有情感色彩的主觀性文本進(jìn)行分析、處理、歸納和推理的過程。本案例中通過對百度和微博有關(guān)“城市大齡未婚女”“農(nóng)村大齡未婚男”的高頻詞匯進(jìn)行正向、中性、負(fù)向情感判別,揭示人們對城市剩女和農(nóng)村剩男的刻板印象和社會評價。2.數(shù)據(jù)分析結(jié)論通過數(shù)據(jù)數(shù)據(jù)分析,結(jié)合第二章中對數(shù)據(jù)新聞案例“中國城鎮(zhèn)化的單身困境”確定的內(nèi)容板塊,得出結(jié)論。思考與練習(xí):(1)簡述在新聞傳媒領(lǐng)域新媒體數(shù)據(jù)分析的作用和價值主要體現(xiàn)在哪些方面。(2)舉例說明并闡述新媒體數(shù)據(jù)分析的類別。(3)簡述新媒體數(shù)據(jù)分析的思維變革主要體現(xiàn)在哪些方面?(4)列舉新媒體數(shù)據(jù)分析的方法主要有哪些?(5)利用新媒體數(shù)據(jù)分析方法對本章應(yīng)用案例中的數(shù)據(jù)進(jìn)行分析。教學(xué)反思:(1)教學(xué)成功之處:(2)教學(xué)不足之處:(3)學(xué)生獲得知識和創(chuàng)新(知識掌握、技能獲取、價值觀理念樹立):(4)改進(jìn)措施:XXXX大學(xué)教案第六章新媒體數(shù)據(jù)可視化建立目標(biāo)任務(wù)明確重難點課程導(dǎo)入,激發(fā)學(xué)習(xí)興趣。講授法,建立學(xué)習(xí)內(nèi)容的總體印象。講授法、案例分析法講授法、案例分析法。引導(dǎo)學(xué)生探究式學(xué)習(xí),分析信息圖表、動畫視頻、交互圖表的特點。結(jié)合教材內(nèi)容,采用講授法、案例分析法。演示法、案例分析法、實驗法。通過操作演示各實例實現(xiàn)方法布置作業(yè)、鞏固知識,進(jìn)行形成性評價。教學(xué)反思一、課時安排:課時(理論講授7課時,實踐5課時)二、教學(xué)課型:理論、實踐課三、教學(xué)目標(biāo):(1)了解新媒體數(shù)據(jù)可視化的意義。(2)熟悉新媒體數(shù)據(jù)可視化的類型。(3)掌握新媒體數(shù)據(jù)可視化設(shè)計的要點。(4)掌握新媒體數(shù)據(jù)可視化的工具并掌握其應(yīng)用。四、教學(xué)重點難點:(1)新媒體數(shù)據(jù)可視化的類型(2)新媒體數(shù)據(jù)可視化工具及應(yīng)用。五、教學(xué)方法:多媒體教學(xué)(講授法、實驗法)六、教學(xué)過程與內(nèi)容:課程導(dǎo)入:新媒體領(lǐng)域可視化實例。本章概述:數(shù)據(jù)可視化(DataVisualization)是指通過圖形、圖表以及動畫等手段直觀、生動、形象地展示數(shù)據(jù)的形式。它有利于受眾更快獲取數(shù)據(jù)、獲取更多數(shù)據(jù)、更深理解數(shù)據(jù)。新媒體數(shù)據(jù)可視化是新媒體數(shù)據(jù)分析的重要環(huán)節(jié),能夠更好地支持新媒體數(shù)據(jù)應(yīng)用。本章將系統(tǒng)地闡述新媒體數(shù)據(jù)可視化的含義、必要性、類型、設(shè)計要點以及工具應(yīng)用等內(nèi)容;介紹新媒體數(shù)據(jù)可視化的設(shè)計要點,包括準(zhǔn)確化、扁平化與移動化;重點介紹四大數(shù)據(jù)可視化實踐案例,分別是利用鏑數(shù)平臺制作?;鶊D、利用Excel和Ps制作特色條形圖、利用datavrap制作動畫視頻以及利用iH5制作交互詞頻圖,幫助者在實際操作中掌握新媒體數(shù)據(jù)可視化的相關(guān)知識與技能。第一節(jié)新媒體數(shù)據(jù)可視化概述(一)什么是數(shù)據(jù)可視化數(shù)據(jù)可視化是指通過圖形、圖表以及動畫等手段直觀、生動、形象地展示數(shù)據(jù)的形式。它囊括了信息可視化、知識可視化、科學(xué)可視化以及視覺設(shè)計方面的進(jìn)步和發(fā)展,經(jīng)歷了圖形符號、數(shù)據(jù)圖形、多維信息的可視編碼、多維統(tǒng)計圖形以及交互可視化等階段。數(shù)據(jù)可視化的目的在于借助圖形化的手段,清晰有效地傳達(dá)與溝通信息。(二)數(shù)據(jù)可視化的意義數(shù)據(jù)可視化的意義總的來說分為三點:更快獲取數(shù)據(jù)、獲取更多數(shù)據(jù)、更深理解數(shù)據(jù)。1.快:提高信息獲取效率。例:南丁格爾玫瑰圖。2.多:增大信息表現(xiàn)容量。數(shù)據(jù)可視化能在一張圖里復(fù)下合多維數(shù)據(jù)。例:《“WhatChinaCounts?”|大數(shù)據(jù)解讀51份政府工作報告中的高頻詞。3.深:深度加工推理信息可視化因為能清晰地展示證據(jù),所以在支持上下文理解和數(shù)據(jù)推理方面有著獨(dú)到的作用,能夠引導(dǎo)用戶從可視化結(jié)果分析和推理出有效信息。例:專利藥為什么這么貴。第二節(jié)新媒體數(shù)據(jù)可視化類型數(shù)據(jù)可視化可按照以下標(biāo)準(zhǔn)分類:按照用戶
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度渣土運(yùn)輸與環(huán)保設(shè)施建設(shè)合同
- 2025年度文化遺址保護(hù)工程瓷磚修復(fù)與維護(hù)合同
- 二零二五年度幼兒園裝修工程合同書范本
- 2025年度合同擔(dān)保綠色金融合同
- 二零二五年度城市燃?xì)夤?yīng)與銷售服務(wù)合同4篇
- 2025年度智慧社區(qū)建設(shè)與管理合同范本
- 2025年度地磚行業(yè)供應(yīng)鏈金融服務(wù)合同
- 2025年度藝術(shù)品抵押貸款標(biāo)準(zhǔn)合同
- 塑料制品運(yùn)輸司機(jī)合同
- 貨運(yùn)車輛掛靠經(jīng)營合同
- 扶梯人行道檢驗驗收作業(yè)指導(dǎo)書
- GB/T 20308-2020產(chǎn)品幾何技術(shù)規(guī)范(GPS)矩陣模型
- 男孩女孩動起來健康運(yùn)動知識PPT模板
- 體育原理課件
- 鐵路道岔知識課件
- 自考公共關(guān)系學(xué)課件
- 森林害蟲防治方法課件
- 各種el34名膽電子管評測
- 超分子化學(xué)-杯芳烴課件
- 北郵工程數(shù)學(xué)期末試卷B卷
- 超長結(jié)構(gòu)及大體積混凝土專項施工方案
評論
0/150
提交評論