《數(shù)據(jù)可視化技術(shù)》 課件 03 分析電影評(píng)論評(píng)分、04 Matplotlib綜合運(yùn)用_第1頁(yè)
《數(shù)據(jù)可視化技術(shù)》 課件 03 分析電影評(píng)論評(píng)分、04 Matplotlib綜合運(yùn)用_第2頁(yè)
《數(shù)據(jù)可視化技術(shù)》 課件 03 分析電影評(píng)論評(píng)分、04 Matplotlib綜合運(yùn)用_第3頁(yè)
《數(shù)據(jù)可視化技術(shù)》 課件 03 分析電影評(píng)論評(píng)分、04 Matplotlib綜合運(yùn)用_第4頁(yè)
《數(shù)據(jù)可視化技術(shù)》 課件 03 分析電影評(píng)論評(píng)分、04 Matplotlib綜合運(yùn)用_第5頁(yè)
已閱讀5頁(yè),還剩28頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

單元3分析電影評(píng)論評(píng)分項(xiàng)目介紹項(xiàng)目一:影評(píng)數(shù)據(jù)分析與可視化本項(xiàng)目從某電影網(wǎng)站采集了電影《流浪地球》的部分評(píng)論數(shù)據(jù),包括城市、影評(píng)內(nèi)容、評(píng)分、評(píng)論時(shí)間、評(píng)論點(diǎn)贊數(shù)等,根據(jù)采集的數(shù)據(jù)對(duì)電影評(píng)論的數(shù)量、點(diǎn)贊數(shù)和評(píng)分三個(gè)方面進(jìn)行分析,完成數(shù)據(jù)分析可視化,給對(duì)科幻電影感興趣的觀影者、電影投資者提供一些參考。01準(zhǔn)備活動(dòng)點(diǎn)名、復(fù)習(xí)本次課學(xué)習(xí)內(nèi)容、學(xué)習(xí)目標(biāo)介紹學(xué)習(xí)內(nèi)容任務(wù)三分析電影評(píng)論評(píng)分本任務(wù)從評(píng)論評(píng)分與城市名稱、評(píng)分等級(jí)三個(gè)方面來(lái)分析電影評(píng)論評(píng)分。通過(guò)繪制面積圖、折線圖和詞云圖對(duì)電影評(píng)論評(píng)分情況進(jìn)行分布分析、對(duì)比分析,以便全面挖掘該電影的口碑、觀影熱度、觀眾對(duì)電影的理解等信息,為觀眾提供觀影參考任務(wù)分解:子任務(wù)1評(píng)論評(píng)分與城市的關(guān)系分析(面積圖)子任務(wù)2評(píng)論評(píng)分好評(píng)與差評(píng)的關(guān)鍵信息分析(詞云圖)學(xué)習(xí)目標(biāo)1、知識(shí)(1)掌握matplotlib面積圖的繪制方法(2)掌握jieba分詞

(3)掌握pandas統(tǒng)計(jì)詞頻的方法

(4)掌握matplotlib詞云的繪制方法2、技能(1)能使用jieba分詞處理文本(2)能使用matplotlib子庫(kù)plotlib根據(jù)數(shù)據(jù)繪制面積圖和詞云圖3、素養(yǎng)(1)嚴(yán)謹(jǐn)認(rèn)真、代碼規(guī)范;(2)數(shù)據(jù)安全、愛(ài)國(guó)精神;(3)信息檢索能力02發(fā)展活動(dòng)任務(wù)分析、任務(wù)資訊、任務(wù)實(shí)施子任務(wù)1評(píng)論評(píng)分與城市的關(guān)系分析(面積圖)任務(wù)分析:本任務(wù)需要使用Pandas從CommentInfo.csv文件中讀取數(shù)據(jù),根據(jù)評(píng)論評(píng)分字段scores和城市名稱字段citys數(shù)據(jù)統(tǒng)計(jì)出不同評(píng)分及對(duì)應(yīng)城市的評(píng)論數(shù)量。根據(jù)統(tǒng)計(jì)出的不同評(píng)分及對(duì)應(yīng)城市的評(píng)論數(shù)量,取出前五名城市的數(shù)據(jù),使用Matplotlib繪制折線圖和面積圖,要求橫軸為評(píng)分,縱軸為評(píng)論數(shù)量,顯示不同評(píng)分、不同城市的評(píng)論數(shù)據(jù)變化趨勢(shì)。1.面積圖任務(wù)資訊面積圖對(duì)軸和線之間的區(qū)域著色,不僅能夠強(qiáng)調(diào)峰和谷,還能夠強(qiáng)調(diào)高點(diǎn)和低點(diǎn)的持續(xù)時(shí)間。高點(diǎn)持續(xù)時(shí)間越長(zhǎng),線下面積越大。pyplot模塊可以使用fill_between()函數(shù)和stackplot()函數(shù)繪制面積圖。fill_between()函數(shù)語(yǔ)法格式如下:1.面積圖任務(wù)資訊stackplot()函數(shù)語(yǔ)法格式如下1.面積圖任務(wù)資訊示例:顯示A類產(chǎn)品2022年和2021年季度銷售情況,通過(guò)fill_between()函數(shù)繪制面積圖,代碼如下:以上代碼設(shè)置alpha為0.5(半透明),同時(shí)繪制了兩條折線圖,能顯示出面積圖的上邊緣,運(yùn)行結(jié)果如圖1-3-2所示1.面積圖任務(wù)資訊示例::顯示A類產(chǎn)品2022年和2021年季度銷售情況,通過(guò)stackplot()函數(shù)繪制堆疊面積圖,代碼如下:以上代碼繪制了一個(gè)堆疊面積圖,堆疊面積圖有兩個(gè)顏色的面積,分別對(duì)應(yīng)2022年和2021年的銷售情況,運(yùn)行結(jié)果如圖1-3-3所示。任務(wù)實(shí)施步驟:步驟1:初始工作。導(dǎo)入相關(guān)包,Pandas從CommentInfo.csv文件中讀取電影評(píng)論數(shù)據(jù),設(shè)置Matplotlib繪圖常用參數(shù)值。步驟2:統(tǒng)計(jì)不同評(píng)分各城市的評(píng)分?jǐn)?shù)量。根據(jù)處理評(píng)分字段scores和城市名稱字段citys數(shù)據(jù),統(tǒng)計(jì)不同評(píng)分及對(duì)應(yīng)城市的評(píng)分?jǐn)?shù)量,取出評(píng)論數(shù)量最多的五個(gè)城市的數(shù)據(jù)用于繪圖步驟3:繪制折線圖和面積圖。繪制5條折線圖和5個(gè)面積圖,橫軸為評(píng)分,縱軸為評(píng)論數(shù)量,顯示不同評(píng)分、不同城市的評(píng)論數(shù)據(jù)變化趨勢(shì)。子任務(wù)2評(píng)論評(píng)分好評(píng)與差評(píng)的關(guān)鍵信息分析任務(wù)分析:本任務(wù)需要使用Pandas從CommentInfo.csv文件中讀取數(shù)據(jù),根據(jù)評(píng)論評(píng)分字段scores,按照好評(píng)差評(píng)標(biāo)準(zhǔn)進(jìn)行分類。對(duì)分類的數(shù)據(jù)做jieba分詞后使用WordCloud()繪制好評(píng)和差評(píng)留言的詞云圖,顯示好評(píng)和差評(píng)關(guān)鍵字信息。1.詞云圖任務(wù)資訊詞云圖,也叫文字云,即對(duì)輸入的一段文字計(jì)算詞匯出現(xiàn)的頻率(詞頻),然后根據(jù)詞頻集中顯示高頻詞,簡(jiǎn)潔、直觀、高效。詞云圖使人們可以快速感知最突出的文字,迅速抓住重點(diǎn),了解主旨。制作詞云圖的方法有很多,可以借助第三方網(wǎng)站的在線詞云圖工具,也可以基于Python。這里使用WordCloud制作詞云圖,制作流程如下:1)準(zhǔn)備一段文字。2)使用jieba分詞。3)準(zhǔn)備停用詞。4)WordCloud生成詞云圖示例:簡(jiǎn)單分詞,代碼如下:1.詞云圖任務(wù)資訊示例:制作朱自清《春》的詞云圖1.詞云圖任務(wù)資訊修改示例:制作朱自清《春》的詞云圖任務(wù)實(shí)施步驟:步驟1:初始工作。導(dǎo)入相關(guān)包,設(shè)置Matplotlib繪圖常用參數(shù)值。步驟2:準(zhǔn)備停用詞。定義stop_words()函數(shù),讀取提供的停用詞文件數(shù)據(jù),按需求定義停用詞。步驟3:定義函數(shù)douban_word_cloud(data_after,title),繪制詞云圖,參數(shù)data_after表示生成詞云圖的文本數(shù)據(jù),參數(shù)title表示生成詞云圖的標(biāo)題步驟4:定義主函數(shù)run(),從文件CommentInfo.csv讀取數(shù)據(jù),根據(jù)評(píng)判標(biāo)準(zhǔn)(評(píng)分大于等于30的為好評(píng),評(píng)分小于30的為差評(píng))把電影評(píng)論分為好評(píng)和差評(píng),再分別調(diào)用步驟3定義的函數(shù)douban_word_cloud(data_after,title),繪制詞云圖步驟5:執(zhí)行主函數(shù)run()03整合活動(dòng)總結(jié)、知識(shí)點(diǎn)梳理學(xué)習(xí)總結(jié)布置作業(yè):進(jìn)一步完善任務(wù)。完成拓展題【拓展】拓展任務(wù)使用Matplotlib繪制豆瓣短評(píng)評(píng)分=50的評(píng)論留言的關(guān)鍵詞詞云信息圖?!稊?shù)據(jù)可視化技術(shù)》課題04Matplotlib綜合運(yùn)用前言本次課完成第一次單元測(cè)試:自選項(xiàng)目數(shù)據(jù)分析及可視化,各位同學(xué)將準(zhǔn)備好的課題,完成數(shù)據(jù)爬蟲,自選角度完成數(shù)據(jù)可視化。01準(zhǔn)備活動(dòng)點(diǎn)名、復(fù)習(xí)本次課學(xué)習(xí)內(nèi)容、學(xué)習(xí)目標(biāo)介紹學(xué)習(xí)內(nèi)容任務(wù):

自選項(xiàng)目數(shù)據(jù)分析及Matplotlib可視化

訪問(wèn)“湖南機(jī)電新聞”網(wǎng)站,完成數(shù)據(jù)爬取、處理分析和可視化學(xué)習(xí)目標(biāo)1、知識(shí)(1)掌握爬蟲流程和方法(2)掌握pandas庫(kù)的基本操作、數(shù)據(jù)處理基本的選取、統(tǒng)計(jì)等函數(shù)(3)掌握matplotlib庫(kù)繪制圖形的基本方法,以及基本圖的繪制方法2、技能(1)能爬取非結(jié)構(gòu)網(wǎng)頁(yè)(2)能使用beautifulsoup、、lxml(xpath)、re等庫(kù)從爬取的網(wǎng)頁(yè)中提取有用的數(shù)據(jù)

(3)能使用pandas庫(kù)讀取文本數(shù)據(jù),按照任務(wù)要求處理數(shù)據(jù)(4)能使用matplotlib子庫(kù)plotlib根據(jù)數(shù)據(jù)繪制基本圖3、素養(yǎng)(1)嚴(yán)謹(jǐn)認(rèn)真、代碼規(guī)范;(2)數(shù)據(jù)安全、愛(ài)國(guó)精神;(3)信息檢索能力02發(fā)展活動(dòng)任務(wù)分析、任務(wù)資訊、任務(wù)實(shí)施任務(wù)實(shí)施1、教師講解

本次課為第一次單元測(cè)試,各同學(xué)自選課題,完成數(shù)據(jù)爬取,分析,并自選角度完成數(shù)據(jù)可視化。2、明確任務(wù)(1)各同學(xué)自選課題,爬取數(shù)據(jù)(2)使用matplotlib完成自選角度的4個(gè)基本圖(折線圖、柱形圖、餅圖和詞云)。(3)對(duì)展示的圖進(jìn)行分析,寫出結(jié)論任務(wù)實(shí)施訪問(wèn)“湖南機(jī)電新聞”網(wǎng)站,完成數(shù)據(jù)爬取、處理分析和可視化:/about/xue-yuan-xin-wen-list-0.htm1、數(shù)據(jù)采集訪問(wèn)/about/xue-yuan-xin-wen-list-0.htm,使用Python采集學(xué)校新聞所有的新聞數(shù)據(jù)(要求至少采集50頁(yè)新聞數(shù)據(jù)),根據(jù)新聞詳細(xì)地址采集新聞的發(fā)布部門信息,信息包括:新聞標(biāo)題、發(fā)布時(shí)間、新聞詳細(xì)地址三列信息,相關(guān)信息采集下來(lái)后,保存為文件名“機(jī)電學(xué)校新聞.csv”任務(wù)實(shí)施2、數(shù)據(jù)處理和分析使用Python的pandas讀取“機(jī)電學(xué)校新聞.csv”文件,完成如下數(shù)據(jù)處理和分析操作:對(duì)數(shù)據(jù)進(jìn)行清洗,把“發(fā)布時(shí)間”的年月日分別提取出來(lái),單列成三列“年”、“月”、“日”,保存新聞標(biāo)題、年、月、日四列數(shù)據(jù)到“機(jī)電學(xué)校新聞_發(fā)布年月日.csv”文件。任務(wù)實(shí)施3、數(shù)據(jù)可視化根據(jù)題目需求使用Python讀取“機(jī)電學(xué)校新聞_發(fā)布年月日.csv”csv文件中的數(shù)據(jù),完成如下操作:(1)使用折線圖展示學(xué)校新聞2020年12月每日發(fā)布數(shù)量。(2)使用折線圖展示學(xué)校新聞2020年每月發(fā)布的數(shù)量。03整合活動(dòng)總結(jié)、知識(shí)點(diǎn)梳理學(xué)習(xí)總結(jié)通過(guò)本次課

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論