基于網(wǎng)絡(luò)爬蟲(chóng)的電影集成搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第1頁(yè)
基于網(wǎng)絡(luò)爬蟲(chóng)的電影集成搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第2頁(yè)
基于網(wǎng)絡(luò)爬蟲(chóng)的電影集成搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第3頁(yè)
基于網(wǎng)絡(luò)爬蟲(chóng)的電影集成搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第4頁(yè)
基于網(wǎng)絡(luò)爬蟲(chóng)的電影集成搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第5頁(yè)
已閱讀5頁(yè),還剩37頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

[14]。Movie_movie表movie_rate表movie_usertagprefer表movie_likecomment表movie_movie_collect表4.3算法設(shè)計(jì)算法方案及原理:協(xié)作過(guò)濾(CoefficientFilter)是目前推薦系統(tǒng)中廣泛使用的一類方法,其中包括:用戶協(xié)作過(guò)濾(UserCF)和物品協(xié)作過(guò)濾(ItemCF)。4.3.1相似度計(jì)算常用的相似度計(jì)算方法有以下幾種:(1)余弦相似度計(jì)算公式如式(2-1)所示:(2-1)(2)歐式距離計(jì)算公式如式(2-2)所示:(2-2)計(jì)算公式如式(2-3)所示:(2-3)(4)曼哈頓距離在平面上,坐標(biāo)(1x,1y)與坐標(biāo)(1y,2y)的曼哈頓距離為:(2-4)4.4網(wǎng)絡(luò)爬蟲(chóng)技術(shù)在互聯(lián)網(wǎng)大數(shù)據(jù)時(shí)代,我們受益于生活的便利和海量數(shù)據(jù)的快速增長(zhǎng),利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù),它能抓取相關(guān)內(nèi)容,并對(duì)其進(jìn)行過(guò)濾和分析,從而得到我們需要的信息。本項(xiàng)目的研究成果能夠?yàn)槿粘I罘?wù),旅游出行,金融投資,各類生產(chǎn)商品的市場(chǎng)需要等方面提供更為精確、高效的信息。代碼如下:5.系統(tǒng)的實(shí)現(xiàn)5.1注冊(cè)登錄模塊注冊(cè)時(shí)需要填寫(xiě)四個(gè)信息,分別是"昵稱"、"郵箱","密碼","確認(rèn)密碼",這些信息會(huì)在分別對(duì)應(yīng)的輸入框,還有一個(gè)"注冊(cè)"按鈕,一個(gè)“清除”按鈕。功能界面如下所示:5.1-1核心代碼:register.htmllogin.htmlresults.html5.2用戶瀏覽電影描述:在訪問(wèn)網(wǎng)頁(yè)的時(shí)候,其他頁(yè)面可以利用相同的頁(yè)面樣式并展示其他相關(guān)信息。在查看不同排列順序下的電影時(shí),在標(biāo)簽欄中可以根據(jù)標(biāo)簽分類來(lái)查看不同分類下的電影。有四種不同的排序方法可供選擇,分別是熱度、收藏、評(píng)分和時(shí)間,在滿足用戶需求的同時(shí)保持多樣性和靈活性。界面如下圖所示:5.3基于用戶的電影推薦功能在電影詳情面可以看見(jiàn)電影的相關(guān)信息,而在界面的下方會(huì)有根據(jù)物品和用戶推薦的電影,如下圖所示。圖5.3-1基于用戶推薦的電影列表核心代碼:views.py5.4用戶評(píng)分電影

圖5.4-1用戶評(píng)分功能展示圖5.4-2用戶我的評(píng)分展示例核心代碼:Movie.htmlmy_rate.htmlviews.py5.5用戶收藏電影用戶可以在電影詳細(xì)信息頁(yè)面上收藏或取消收藏電影,然后在個(gè)人資料頁(yè)面上點(diǎn)擊“我的收藏”來(lái)查看已收藏的電影,用戶的收藏行為表示用戶對(duì)該電影感興趣。

界面如下圖所示:圖5.5-1收藏功能展示例核心代碼:movie.htmlmycollect.htmlviews.py5.6用戶評(píng)論電影用戶可以在電影的詳細(xì)信息頁(yè)面上發(fā)表評(píng)論,評(píng)論提交后會(huì)顯示在該電影的詳細(xì)信息頁(yè)面底部,并可以在我的評(píng)論中查看已經(jīng)評(píng)論過(guò)的電影。界面如下圖所示:界面如下圖所示:圖5.6-1用戶評(píng)論功能展示例核心代碼:movie.htmlmy_comment.htmlviews.py5.7用戶修改個(gè)人信息用戶通過(guò)單擊“編輯”鍵,可以在“編輯”界面上對(duì)信息進(jìn)行修改。在修改的過(guò)程中,用戶可以修改自己的資料,如名字、性別、生日、聯(lián)系方式等。

用戶可以點(diǎn)擊保存按鈕,將個(gè)人信息的修改保存起來(lái)。

用戶可以通過(guò)點(diǎn)擊“取消”按鈕來(lái)放棄對(duì)編輯內(nèi)容所做的修改。

用戶在保存修改后,可以點(diǎn)擊提交按鈕來(lái)提交修改請(qǐng)求。

系統(tǒng)會(huì)對(duì)用戶提交的修改進(jìn)行確認(rèn),如果修改無(wú)誤,則會(huì)更新個(gè)人信息到系統(tǒng)中。需要注意的是,用戶可能需要提供一些必要的身份驗(yàn)證信息以確保修改的準(zhǔn)確性和安全性。界面如下圖所示:圖5.7-1用戶修改信息功能展示核心代碼:Personal.htmlviews.py5.8用戶搜索電影描述:用戶可在搜索欄搜索想看的電影,頁(yè)面將展示搜索結(jié)果。搜索結(jié)果將會(huì)以列表的形式展示,每個(gè)搜索結(jié)果都會(huì)包含電影的名稱、海報(bào)、評(píng)分和簡(jiǎn)介等基本信息。用戶可以點(diǎn)擊某個(gè)搜索結(jié)果,進(jìn)入電影的詳細(xì)頁(yè)面,了解更多關(guān)于電影的信息。在搜索結(jié)果頁(yè)面,用戶還可以使用篩選功能來(lái)縮小搜索范圍,例如按照電影類型、上映時(shí)間、演員等進(jìn)行篩選。此外,搜索結(jié)果頁(yè)面還會(huì)顯示一些相關(guān)推薦,幫助用戶發(fā)現(xiàn)更多他們可能感興趣的電影。用戶還可以對(duì)搜索結(jié)果進(jìn)行排序,根據(jù)評(píng)分、上映時(shí)間等因素進(jìn)行排序,以便更方便地找到他們想看的電影。用戶也可以在搜索欄中輸入導(dǎo)演、演員的名稱來(lái)搜索相關(guān)電影,頁(yè)面將會(huì)顯示與他們相關(guān)的電影結(jié)果。results.htmlviews.py5.9后臺(tái)管理模塊Django電影推薦系統(tǒng)能根據(jù)不同分類來(lái)獲得電影推薦。界面如下圖所示:圖5.9-1后臺(tái)管理登錄圖5.9-2后臺(tái)管理頁(yè)面展示核心代碼:5.10電影數(shù)據(jù)可視化模塊用于可視化電影數(shù)據(jù)的模塊包括評(píng)估和評(píng)估數(shù)量分析、導(dǎo)演符號(hào)云分析、電影時(shí)間線分析以及使用eCharts可視化技術(shù)創(chuàng)建的電影分類圖分析。用于可視化電影數(shù)據(jù)的模塊可以包含以下分析和圖形:分級(jí)和評(píng)分?jǐn)?shù)量分析:直方圖或餅圖可用于顯示不同電影分級(jí)的數(shù)量,折線圖或散點(diǎn)圖可用于在同一圖表中顯示不同分級(jí)的平均評(píng)分,以比較不同分級(jí)的數(shù)量和評(píng)分。Word云分析:可以使用WordCloud查看來(lái)自不同導(dǎo)演的評(píng)論。WordCloud中的單詞大小代表了導(dǎo)演的高評(píng)分和低評(píng)分。這可以幫助用戶快速了解哪些導(dǎo)演的電影評(píng)分最高。電影時(shí)間線:可以使用折線圖或餅圖來(lái)顯示電影數(shù)量隨時(shí)間的變化,而同一圖表中的折線圖和散點(diǎn)圖則用于顯示平均電影評(píng)分隨時(shí)間的推移,以觀察制作和評(píng)分隨時(shí)間推移的趨勢(shì)。電影分類圖分析:餅圖可以用來(lái)顯示不同電影類別占電影總數(shù)的比例,以了解每個(gè)類別的相對(duì)重要性,這可以幫助用戶了解哪些電影類別或多或少。圖1分類數(shù)量和評(píng)分的分析和導(dǎo)演評(píng)分詞云圖分析圖2電影年份曲線和電影分類占比圖分析6.系統(tǒng)測(cè)試 在將系統(tǒng)投入市場(chǎng)之前,必須進(jìn)行嚴(yán)格的系統(tǒng)測(cè)試。

需要對(duì)訪問(wèn)請(qǐng)求的延遲時(shí)間進(jìn)行主要測(cè)試,對(duì)于一些未知和危險(xiǎn)的問(wèn)題,必須進(jìn)行嚴(yán)格的測(cè)試與解決。6.1系統(tǒng)測(cè)試的重要性程序的系統(tǒng)測(cè)試應(yīng)該基于程序的指定功能、性能、代碼質(zhì)量和數(shù)據(jù)庫(kù)操作。6.2性能測(cè)試當(dāng)有海量用戶同時(shí)發(fā)起大規(guī)模請(qǐng)求時(shí),需要比較服務(wù)器的性能和響應(yīng)延遲問(wèn)題。我們可以進(jìn)行模擬測(cè)試,包括代碼測(cè)試、邏輯測(cè)試、接口測(cè)試以及數(shù)據(jù)庫(kù)優(yōu)化測(cè)試等方面。我們?yōu)榱舜_保測(cè)試的有效性和程序的安全性,主要進(jìn)行了系統(tǒng)功能測(cè)試和業(yè)務(wù)邏輯接口測(cè)試。經(jīng)過(guò)對(duì)項(xiàng)目的第一部分和第二部分進(jìn)行測(cè)試后,我們得出結(jié)論:該項(xiàng)目沒(méi)有任何潛在風(fēng)險(xiǎn)。6.3系統(tǒng)登錄測(cè)試測(cè)試編號(hào):a。目標(biāo)是檢驗(yàn)系統(tǒng)的登錄功能,驗(yàn)證系統(tǒng)在正確登錄時(shí)是否可以通過(guò)驗(yàn)證,并在錯(cuò)誤數(shù)據(jù)時(shí)攔截并返回頁(yè)面。用戶登錄前需要使用用戶名“aaaa”和初始密碼“00000”。方法:現(xiàn)場(chǎng)測(cè)試,試驗(yàn)箱表如表6-1所示。測(cè)試用例表,如表6-1所示。表6-1登錄模塊測(cè)試用例表6.4電影測(cè)試測(cè)試編號(hào):2。\t"/report/a55da2ee-27ad-44d0-b22b-5c305f1c1842/html/resultFrame"目的:?jiǎn)卧獪y(cè)試電影,測(cè)試電影頁(yè)面能否正常顯示,能否增刪改操作。測(cè)試用例表,如表6-2所示。表6-2電影測(cè)試用例表序號(hào)輸入預(yù)期結(jié)果實(shí)際結(jié)果測(cè)試結(jié)果ab添加電影A,并填寫(xiě)全部電影添加電影B,未填寫(xiě)全部電影提示添加成功提示添加失敗提示添加成功提示添加失敗通過(guò)通過(guò)6.5系統(tǒng)結(jié)構(gòu)簡(jiǎn)介測(cè)試測(cè)試編號(hào):3。測(cè)試頁(yè)面功能是否正常工作的目的是確保后臺(tái)管理頁(yè)面可訪問(wèn)。

方法:自檢試驗(yàn)箱表如表6-3所示測(cè)試用例表,如表6-3所示。表6-3系統(tǒng)簡(jiǎn)介測(cè)試用例表序號(hào)輸入預(yù)期結(jié)果實(shí)際結(jié)果測(cè)試結(jié)果12填寫(xiě)標(biāo)題名稱及內(nèi)容填寫(xiě)標(biāo)題名稱及內(nèi)容查看是否能上系統(tǒng)簡(jiǎn)介上傳后能否顯示在首頁(yè)可以上系統(tǒng)簡(jiǎn)介可以顯示在首頁(yè)通過(guò)通過(guò)7.結(jié)論這次的系統(tǒng)開(kāi)發(fā)選擇了廣泛應(yīng)用的Python語(yǔ)言,以確保系統(tǒng)運(yùn)行穩(wěn)定。

該系統(tǒng)分為兩部分:管理員和用戶。

這兩個(gè)部分緊密相連,關(guān)系獨(dú)特。最終成為影片數(shù)據(jù)爬取與數(shù)據(jù)分析的設(shè)計(jì)與實(shí)現(xiàn),它可以幫助用戶快速找到所需信息,避免了徒勞無(wú)功的的搜索過(guò)程,能夠?yàn)橛脩艄?jié)省時(shí)間、提供全面的視角,以便提高效率,當(dāng)然也還有很多需要改進(jìn)的地方,這些頁(yè)面不是由專業(yè)用戶界面設(shè)計(jì)的,也不像市場(chǎng)上的其他網(wǎng)站系統(tǒng)很漂亮。參考文獻(xiàn)[1] 韋力梅,蘇兵.Django框架下Python網(wǎng)站開(kāi)發(fā)過(guò)程綜述[J].電腦與電信,2019.[2] 李根.基于Django框架的生物信息網(wǎng)站建設(shè)[D].大連海事大學(xué),2018.[3] 夏亞麗,戴志濤.基于Django的O2O家庭酒店商務(wù)平臺(tái)[J].軟件,2019.[4] 薛耀偉.基于Django框架管理界面自動(dòng)生成模塊的設(shè)計(jì)與實(shí)現(xiàn)[D].哈爾濱工業(yè)大學(xué),2020.[5] 陳勇.基于Django框架的實(shí)時(shí)課堂投票系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].大連理工大學(xué),2021.[6] 周玥.基于Django框架的校園預(yù)約打印網(wǎng)站設(shè)計(jì)與實(shí)現(xiàn)[D].吉林大學(xué),2019.[7] 周吉波,孟利民. 基于Djangoweb框架的GPS車載管理系統(tǒng)網(wǎng)站的設(shè)計(jì)和實(shí)現(xiàn)[C].第二屆亞太地區(qū)信息論學(xué)術(shù)會(huì)議論文集,2019.[8] Li,Shenliang,Si,Zhanjun.InformationpublishingsystembasedontheframeworkofDjango[J].Lect.NotesElectr.Eng.2019.[9] Tiwari,Usha,Mehfuz,Shabana,Sharma,Satyam,Pandey,VinayakTriguna.DesignofPythonBasedLostandFoundWebsiteforCollegeCampus[J].Int.Con

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論