基于機(jī)器學(xué)習(xí)的批量網(wǎng)頁篡改檢測方法研究課件_第1頁
基于機(jī)器學(xué)習(xí)的批量網(wǎng)頁篡改檢測方法研究課件_第2頁
基于機(jī)器學(xué)習(xí)的批量網(wǎng)頁篡改檢測方法研究課件_第3頁
基于機(jī)器學(xué)習(xí)的批量網(wǎng)頁篡改檢測方法研究課件_第4頁
基于機(jī)器學(xué)習(xí)的批量網(wǎng)頁篡改檢測方法研究課件_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、報告人 xx基于機(jī)器學(xué)習(xí)的批量網(wǎng)頁篡改檢測方法研究1謝謝觀賞2019-8-23報告人 xx基于機(jī)器學(xué)習(xí)的批量網(wǎng)頁1謝謝觀賞2019目錄 Contents一、研究背景二、網(wǎng)頁篡改檢測方法三、性能分析及優(yōu)化四、總結(jié)2謝謝觀賞2019-8-23目錄 近年來,隨著互聯(lián)網(wǎng)的普及,網(wǎng)站已成為政府、學(xué)校、企業(yè)等組織機(jī)構(gòu)信息發(fā)布和傳播的重要途徑,網(wǎng)站安全成為網(wǎng)絡(luò)安全的重要領(lǐng)域。CNCERT監(jiān)測發(fā)現(xiàn),2015年我國境內(nèi)近2.5萬個網(wǎng)站被篡改高效、準(zhǔn)確、具有良好擴(kuò)展性的網(wǎng)頁篡改檢測方法是應(yīng)對網(wǎng)頁篡改問題的有效途徑。以北京大學(xué)所有注冊網(wǎng)站為研究對象,通過抓取網(wǎng)站首頁面的所有歷史信息,對抓取數(shù)據(jù)進(jìn)行分類建立對應(yīng)的檢測

2、規(guī)則,綜合判斷網(wǎng)頁是否存在篡改。一、研究背景 3謝謝觀賞2019-8-23近年來,隨著互聯(lián)網(wǎng)的普及,網(wǎng)站已成為政府、學(xué)校、企業(yè)等組織機(jī)二、網(wǎng)頁篡改檢測方法4謝謝觀賞2019-8-23二、網(wǎng)頁篡改檢測方法4謝謝觀賞2019-8-23二、網(wǎng)頁篡改檢測方法檢測器設(shè)計(jì);兩個重要的參數(shù):檢測數(shù)據(jù)集窗口大小;判別器閾值5謝謝觀賞2019-8-23二、網(wǎng)頁篡改檢測方法檢測器設(shè)計(jì);兩個重要的參數(shù):檢測數(shù)據(jù)集窗二、網(wǎng)頁篡改檢測方法6謝謝觀賞2019-8-23二、網(wǎng)頁篡改檢測方法6謝謝觀賞2019-8-23三、性能分析及優(yōu)化 使用根據(jù)真實(shí)的網(wǎng)頁篡改案例進(jìn)行設(shè)定的篡改集合進(jìn)行篡改實(shí)驗(yàn)確定參數(shù)。在實(shí)驗(yàn)中,以誤報率和漏

3、報率作為評測實(shí)驗(yàn)結(jié)果的指標(biāo)。在選定結(jié)果判別器閾值為2的情況下,不同檢測數(shù)據(jù)集窗口長度W下網(wǎng)頁篡改檢測的誤報率和漏報率如圖。7謝謝觀賞2019-8-23三、性能分析及優(yōu)化 使用根據(jù)真實(shí)的網(wǎng)頁篡改案例進(jìn)三、性能分析及優(yōu)化 在選定檢測數(shù)據(jù)集窗口為11的情況下,不同結(jié)果判別器閾值網(wǎng)頁篡改檢測的誤報率和漏報率如圖。最終本文選定的判別器閾值為2,檢測數(shù)據(jù)集窗口大小為11。8謝謝觀賞2019-8-23三、性能分析及優(yōu)化 在選定檢測數(shù)據(jù)集窗口為11的情三、性能分析及優(yōu)化 系統(tǒng)運(yùn)行時間分析,網(wǎng)頁抓取時間情況,網(wǎng)頁抓取、訓(xùn)練、檢測花費(fèi)時間分布,抓取平均耗時1.22s,訓(xùn)練平均耗時5.61s,檢測平均耗時1.24s

4、。9謝謝觀賞2019-8-23三、性能分析及優(yōu)化 系統(tǒng)運(yùn)行時間分析,網(wǎng)頁抓取時間三、性能分析及優(yōu)化可檢測網(wǎng)頁數(shù),系統(tǒng)對于檢測的網(wǎng)頁數(shù)僅僅受限于運(yùn)行環(huán)境的硬件影響,當(dāng)檢測網(wǎng)頁達(dá)到一定數(shù)量時,可以通過增加系統(tǒng)資源,甚至使用多臺機(jī)器進(jìn)行篡改檢測。檢測時間間隔,如何在發(fā)生篡改后及時地通過檢測發(fā)出報警,是篡改檢測一個非常關(guān)鍵性的因素,理論上某個網(wǎng)頁的檢測時間間隔只要大于該網(wǎng)頁的抓取時間和檢測時間之和即可,但是檢測間隔太小會造成系統(tǒng)資源的浪費(fèi),本文將檢測間隔設(shè)為30分鐘。檢測參數(shù)的定制化,可以為不同的網(wǎng)頁設(shè)定不同的檢測參數(shù),比如有些網(wǎng)頁動態(tài)更新比較頻繁,可以提高訓(xùn)練的頻率,比如在檢測若干次之后自發(fā)進(jìn)行一次

5、訓(xùn)練;靜態(tài)網(wǎng)站,可以適當(dāng)提高檢測頻率,將30分鐘縮短至20分鐘,甚至10分鐘。檢測器的調(diào)整,根據(jù)黑客常用的一些篡改手段,可以隨時修改或者增加系統(tǒng)的檢測器的數(shù)量以及各個檢測器的檢測特征。10謝謝觀賞2019-8-23三、性能分析及優(yōu)化可檢測網(wǎng)頁數(shù),系統(tǒng)對于檢測的網(wǎng)頁數(shù)僅僅受限四、總結(jié)提出了一種基于機(jī)器學(xué)習(xí)的批量網(wǎng)頁篡改檢測方法,不需要對網(wǎng)站服務(wù)器做任何形式的修改,只需提供網(wǎng)頁的URL,通過抓取網(wǎng)頁的相關(guān)資源,根據(jù)歷史信息進(jìn)行訓(xùn)練,最后綜合多個檢測器的檢測結(jié)果來判定網(wǎng)頁是否發(fā)生篡改。方法對于檢測的網(wǎng)頁在數(shù)量上沒有限制,檢測時間間隔可以根據(jù)需要在合理的范圍內(nèi)調(diào)整,經(jīng)過初步的實(shí)驗(yàn)驗(yàn)證,在檢測數(shù)據(jù)集窗口為11,判別器閾值為2的情況下誤報率為1.183%,漏報率為0.878%。11謝謝觀賞2019-8

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論