開題報告-基于程序切片的網(wǎng)頁過濾方法研究_第1頁
開題報告-基于程序切片的網(wǎng)頁過濾方法研究_第2頁
開題報告-基于程序切片的網(wǎng)頁過濾方法研究_第3頁
開題報告-基于程序切片的網(wǎng)頁過濾方法研究_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、南京郵電大學(xué)畢業(yè)設(shè)計(論文)開題報告題目 基于程序切片的網(wǎng)頁過濾方法研究學(xué)生姓名班級學(xué)號專業(yè)信息安全一、 對課題任務(wù)的學(xué)習(xí)與理解1. 課題產(chǎn)生背景互聯(lián)網(wǎng)的高速發(fā)展已經(jīng)使其成為世界上覆蓋面最廣、范圍最大、內(nèi)容最為豐富的資源庫。人們在充分享受信息共享所帶來的便利的同時,卻也飽受著大量“垃圾信息”的困擾。特別是對于廣大青少年學(xué)生,一些“有害信息”正在威脅著他們的身心健康。另外,企業(yè)員工的上網(wǎng)行為亟待規(guī)范。因此網(wǎng)頁過濾應(yīng)運而生。程序切片技術(shù)已經(jīng)發(fā)展成為一門成熟的技術(shù),并已應(yīng)用于軟件開發(fā)中的調(diào)試、測試和維護等階段中。所以我們要實現(xiàn)基于程序切片的網(wǎng)頁過濾方法的研究。2. 課題實現(xiàn)目標(biāo)本課題要求結(jié)合網(wǎng)頁腳本

2、語言(如Javascript、XML等)的程序切片相關(guān)技術(shù),研究并實現(xiàn)一種網(wǎng)頁過濾方法。成果形式:1 給出基于網(wǎng)頁腳本語言程序切片的網(wǎng)頁過濾方法;2 提交畢業(yè)設(shè)計報告及其相關(guān)電子文檔。二、 文獻(xiàn)調(diào)研綜述1. 程序切片概述程序切片技術(shù)是由Weiser在1979年首先提出的,他描述了一種使用程序依賴圖來實現(xiàn)過程內(nèi)切片的技術(shù)。此后,在他的基礎(chǔ)上又有許多人提出了不同的程序切片的定義和用于切片的算法,其中包括Horwitz提出的程序切片算法,他將程序依賴圖(PDG)擴展為系統(tǒng)依賴圖(SDG),解決了Weiser提出的算法中無法解決過程調(diào)用的問題;以及由Korel和Laski提出的動態(tài)切片的概念和Canf

3、ora提出的條件切片技術(shù)等等。程序切片技術(shù)的發(fā)展經(jīng)歷了從靜態(tài)到動態(tài),從前向到后向,從單一過程到多個過程,從面向過程的程序到面向?qū)ο蟮某绦?,從非分布式到分布式的程序的發(fā)展過程。隨著軟件開發(fā)技術(shù)的不斷進(jìn)步,程序切片技術(shù)也會隨之一同發(fā)展。顧名思義,程序切片就是指將一個程序中用戶所感興趣的代碼都抽取出來組成一個新的程序,這個新的程序就是源程序的切片,根據(jù)切片規(guī)則的不同,生成的切片也各不相同。程序切片可以用 S(V, N) 的形式表示,其中 V 表示程序中的某一個變量或是變量的集合,N 表示在程序中的某一個位置 ( 變量 V 所在的語句) 。S(V, N) 的含義是“一個程序切片是由程序中的一些語句所組

4、成的集合,這些語句可能會影響到在程序的某個位置 N 處所定義或引用的變量或變量的集合 V 的狀態(tài)”。S(V, N)是程序切片最基本的形態(tài),任何形式的程序切片都可以通過對這個標(biāo)準(zhǔn)進(jìn)行擴展而得到。2. 靜態(tài)程序切片和動態(tài)程序切片(1)靜態(tài)程序切片靜態(tài)程序切片是指在構(gòu)造程序切片的時候使用靜態(tài)的數(shù)據(jù)流和控制流的分析方法。從靜態(tài)程序切片的定義 S(V, N) , 我們可以看出使用這種切片標(biāo)準(zhǔn)分析程序的時候,變量 V 的當(dāng)前狀態(tài)是無關(guān)緊要的, 其值不會影響切片的結(jié)果。靜態(tài)切片所作的分析完全是依賴于程序的靜態(tài)信息。靜態(tài)切片方法需要對變量 V 所有的狀態(tài)進(jìn)行考慮,需要遍歷程序中相應(yīng)的所有軌跡,所以使用這種方法

5、分析程序時工作量會非常的大。因此,由于靜態(tài)切片技術(shù)的這些局限性,它主要應(yīng)用于程序理解和軟件維護領(lǐng)域。(2)動態(tài)程序切片動態(tài)程序切片技術(shù)使用的是動態(tài)的數(shù)據(jù)流和控制流分析方法, 它依賴與程序中某個變量的具體輸入, 其輸入的不同可能會導(dǎo)致切片結(jié)果的不同。靜態(tài)切片技術(shù)強調(diào)的是在可以遍歷到的所有軌跡中, 對程序中某一點的變量狀態(tài)造成影響的所有語句; 而動態(tài)切片技術(shù)則是強調(diào)程序在一次特定的執(zhí)行中, 會影響變量在程序中某一點的狀態(tài)的所有語句??梢钥闯觯?動態(tài)程序切片是相應(yīng)的靜態(tài)程序切片的一個子集, 因此使用動態(tài)程序切片時的工作量要比使用靜態(tài)程序切片的工作量來的小, 更適合使用于程序測試與調(diào)試等本身工作量就比

6、較大的工作中。動態(tài)循環(huán)切片是動態(tài)切片的一種, 它可以定義為: S(V, N, X, I)。它表示程序在輸入為 X 時, 會影響到變量 V 在第 I 次執(zhí)行語句 N 后的狀態(tài)的所有語句的集合。(3)條件切片條件切片技術(shù)是介于靜態(tài)切片技術(shù)與動態(tài)切片技術(shù)之間的一種切片技術(shù),它既不是僅僅局限與只對程序的靜態(tài)信息進(jìn)行分析,也不是僅僅局限于只依賴外部的輸入來獲得程序的信息。在構(gòu)造條件切片時, 只有那些滿足切片條件的語句才會被提取出來。條件切片的定義可以表示為 S(V, N, X, W) ,它表示當(dāng)輸入 X使得條件 W 為真的時候, 所有影響變量 V 在 N 處狀態(tài)的語句的集合。如果將程序中從滿足一個切片條

7、件的任何一個初始狀態(tài)出發(fā)都不可能觸發(fā)的語句除去,那么剩下的語句就是滿足這個條件的一個切片。3. XML文檔的程序切片技術(shù)XML(extensible Markup Language)可擴展標(biāo)記語言是一種可以用來創(chuàng)建自己標(biāo)記的標(biāo)記語言,XML是一種具有數(shù)據(jù)描述功能、高度結(jié)構(gòu)性以及可驗證性語言,XML數(shù)據(jù)是以純文本格式存儲的,提供一種與軟件和硬件無關(guān)的共享數(shù)據(jù)方法,因而成為目前應(yīng)用于保存數(shù)據(jù)最普遍的格式之一。一個XML文檔必須是格式正確的,即符合“XML基本語法”。DDT或XML模式可以規(guī)定文檔中存在的元素的類型、元素具有的屬性、在元素內(nèi)部子元素的層次結(jié)構(gòu)以及元素在整個文檔中出現(xiàn)的順序次數(shù)。通常在

8、應(yīng)用中會定義DTD(Document Type Definition)或者XML模式,使XML文檔符合規(guī)范,符合DTD或XML模式定義的文檔稱為有效文檔。用戶可以根據(jù)應(yīng)用來確定DTD或XML模式文檔規(guī)范,文檔規(guī)范是不同系統(tǒng)之間進(jìn)行數(shù)據(jù)交換的基礎(chǔ)。圖1切片規(guī)則樹對XML文檔進(jìn)行切片即從文檔中選取特定信息,而省略其他不相關(guān)內(nèi)容。切片文檔所使用的依賴圖,可利用文檔本身的樹型結(jié)構(gòu)特點。切片過程分為兩個階段:切片規(guī)則生成階段、切片文檔生成階段。切片規(guī)則生成階段是利用選擇節(jié)點逆向遍歷文檔樹,獲取切片規(guī)則樹路徑(規(guī)則樹即切片規(guī)則節(jié)點構(gòu)成的樹)。切片文檔生成階段是深度優(yōu)先遍歷規(guī)則樹,從文檔中獲取滿足條件的元素

9、信息,添加到新文檔中。通過對XML文檔的切片操作,用戶可以很快地從文檔信息量較大的復(fù)雜文檔中抽取出自己所感興趣的信息,根據(jù)切片規(guī)則不同獲取不同層次的信息。4. 基于程序切片的網(wǎng)頁過濾方法隨著網(wǎng)絡(luò)技術(shù)的不斷應(yīng)用,越來越多的企事業(yè)單位允許員工對因特網(wǎng)進(jìn)行內(nèi)容訪問。目前因特網(wǎng)魚龍混雜,存在著大量不健康或者反動的站點,有效的管理對因特網(wǎng)的訪問勢在必行。網(wǎng)頁過濾由此應(yīng)運而生。網(wǎng)頁過濾就是在網(wǎng)絡(luò)的不同地點部署訪問策略,通過一定的技術(shù)手段,根據(jù)對網(wǎng)頁內(nèi)容合法性的判斷來禁止用戶訪問不良內(nèi)容。家長不想讓孩子沉溺在網(wǎng)絡(luò)游戲當(dāng)中;老板不希望員工在上班時間瀏覽娛樂新聞;政府不允許任何人傳播瀏覽反動和色情信息,這些需求

10、都在網(wǎng)頁過濾的范疇之內(nèi)?,F(xiàn)在市場上已經(jīng)有不少網(wǎng)頁過濾功能的軟件,根據(jù)用戶數(shù)據(jù)的規(guī)模,主要分成個人應(yīng)用級和企業(yè)級兩類。(1)個人應(yīng)用級的網(wǎng)頁過濾軟件即在個人的終端上安裝軟件,或者嵌套于用戶的瀏覽器中。但是在個人的實際使用中,更多的用戶使用此類軟件過濾掉某類特定危害的網(wǎng)站,如釣魚網(wǎng)站和惡意網(wǎng)站,對于主動訪問不良網(wǎng)站的行為,這類軟件無能為力。而且隨著移動互聯(lián)網(wǎng)的高速發(fā)展,上網(wǎng)的終端越來越多樣化,很難在所有的移動終端上都安裝此類客戶端。廣大的互聯(lián)網(wǎng)用戶,也沒有主動安裝此類過濾軟件的意識。因此,個人應(yīng)用級的網(wǎng)絡(luò)過濾系統(tǒng)作用極為有限。(2)企業(yè)級的網(wǎng)頁過濾系統(tǒng)可以實現(xiàn)強制性的過濾,一般部署于企業(yè)的網(wǎng)關(guān)。但

11、是此類過濾系統(tǒng)一般都是和硬件綁定在一起,當(dāng)企業(yè)網(wǎng)內(nèi)用戶數(shù)量增加,此類系統(tǒng)無法進(jìn)行有效的擴展。而且過濾的用戶只限于企業(yè)的內(nèi)部用戶,對網(wǎng)絡(luò)環(huán)境的凈化作用也比較有限。而我們對程序切片和網(wǎng)頁過濾技術(shù)有了一定的了解后,就可以把xml文檔切片技術(shù)即網(wǎng)頁腳本語言的程序切片技術(shù)運用到網(wǎng)頁過濾中,從而研究基于程序切片的網(wǎng)頁過濾。通俗地講,過濾有兩種:只要感興趣的東西,其他刪除;去除不感興趣的,其他保留。而我們只需要利用切片技術(shù)來提取有用的或切除需過濾的就行了。主要參考文獻(xiàn):1李文豪.程序切片技術(shù)淺析J.電腦知識與技術(shù),2006(8):11-13.2張靜,林淑飛. XML文檔切片技術(shù)J.科學(xué)技術(shù)與工程,2007,

12、7(9).3王偉,陳平.程序切片技術(shù)綜述J.微電子學(xué)與計算機,2002(8):25-27.4王磊.基于程序切片的軟件測試研究D.河北工業(yè)大學(xué),2007.5錢巨,陶彬賢.Slithice:一個基于系統(tǒng)依賴圖的Java程序切片工具J.計算機工程與應(yīng)用,2014(2).6蔣文.一種網(wǎng)頁過濾系統(tǒng)設(shè)計與實現(xiàn)D.北京郵電大學(xué),2013.7劉輝.網(wǎng)頁信息過濾系統(tǒng)的研究與設(shè)計D.蘇州大學(xué),2009.8司德睿.基于文本內(nèi)容的網(wǎng)頁過濾技術(shù)研究D.蘭州大學(xué),2008.9劉沛旻.網(wǎng)頁過濾技術(shù)的比較研究D.上海交通大學(xué),2007.10Weiser M.Program slicing. IEEE Transactions on Software EngineeringJ,1984,16(5):498-509.11Binkley,D&K.B.Gallagher.Program slicing. Advances in ComputersJ,1996,43:1-50.三、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論