版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
精品文檔-下載后可編輯基于Java的敏感詞過濾器設(shè)計-設(shè)計應(yīng)用良好的網(wǎng)絡(luò)文化對培養(yǎng)青少年的愛國意識、創(chuàng)新精神、促進(jìn)青少年良好的個性發(fā)展以及文化學(xué)習(xí)等方面都有積極的作用。但是網(wǎng)絡(luò)文化中混雜著種種不良因素,對青少年造成許多負(fù)面影響:網(wǎng)絡(luò)中的不健康內(nèi)容不利于青少年的成長,甚至造成許多青少年犯罪行為的不斷發(fā)生;網(wǎng)絡(luò)世界的虛擬性還會造成青少年對現(xiàn)實社會的不滿,青少年對網(wǎng)絡(luò)世界的過分迷戀會導(dǎo)致網(wǎng)絡(luò)孤獨,網(wǎng)絡(luò)中多元化的內(nèi)容會導(dǎo)致青少年認(rèn)識偏差,網(wǎng)絡(luò)的隱匿性容易使青少年道德弱化[1].特別令人擔(dān)憂的是不良的網(wǎng)絡(luò)文化對青少年的犯罪起著推動作用,值得全社會關(guān)注和重視。
本文提出了一種敏感詞過濾器軟件的設(shè)計,對網(wǎng)絡(luò)中不良的內(nèi)容進(jìn)行查找、發(fā)現(xiàn),避免這些不良網(wǎng)絡(luò)文化侵蝕青少年的心靈健康。
1敏感詞過濾器的設(shè)計原理
敏感詞過濾器的原理圖如圖1所示。其原理如下:(1)對敏感詞庫的內(nèi)容進(jìn)行分割,把敏感詞庫中所有的敏感詞或詞組分開,并把這些敏感詞或詞組存入數(shù)組中;(2)將待測文件庫中的文件進(jìn)行逐個讀取,并記錄文件的內(nèi)容;(3)在待測文件中查找是否存在剛存放敏感詞或臟詞組內(nèi)容的數(shù)組里面的內(nèi)容,如果有,進(jìn)行標(biāo)注等操作;如果沒有,繼續(xù)檢查待測文件庫中的下一個待測文件,直到待測文件庫中的待測文件都被檢查完為止;(4)輸出結(jié)果。即輸出待測文件庫中每個待測文件中包含敏感詞或臟詞組的個數(shù)及出處等信息。
2算法實現(xiàn)
軟件開發(fā)環(huán)境:myeclipse平臺,Java語言。首先以myeclipse平臺新建一個javaproject,在新建的project中需要導(dǎo)入下面相關(guān)文件:
importjava.io.BufferedReader;
importjava.io.File;
importjava.io.FileNotFoundException;
importjava.io.FileReader;
importjava.io.IOException;
importjava.io.InputStreamReader;
importjava.util.StringTokenizer;
過濾器軟件中main函數(shù)的主要內(nèi)容如下:
publicstaticvoidmain(String[]args){
BufferedReaderbr=newBufferedReader(newInputStreamReader(System.in));
Stringans=null;
intcnt=0;//字庫中關(guān)鍵詞個數(shù)
intnumber=0;//敏感詞出現(xiàn)次數(shù)
Stringfilepath=“D:\\敏感詞待測文件庫”;
//待檢測文件路徑,此文件夾下可以放若干個待檢測的文件
StringfileLibrarypath=“D:\\敏感詞典\\file.txt”;
//敏感詞庫文件的存放路徑
Filefile=newFile(filepath);
try{
//讀入用戶輸入的回車鍵信息
System.out.println(“請按回車鍵,查看過濾信息:”);
Stringstr=null;
str=br.readLine();
if(str!=null){
if(!file.isDirectory()){
System.out.println(“待檢測文件路徑
不對,請修改路徑?!保?;
}elseif(file.isDirectory()){
ans=getcontent(fileLibrarypath);
intk;
StringTokenizersst=new
StringTokenizer(ans,“|”);
k=sst.countTokens();
String[]record=newString[k];
while(sst.hasMoreElements()){
record[cnt]=sst.nextToken();
cnt++;
}
String[]filelist=file.list();
for(inti=0,flen=filelist.length;i
flen;i++){
Stringtemp=filepath+
“\\”+filelist[i];
number=searchkeyword(record,
cnt,temp);
System.out.println(“第”+(i+1)+“文件中敏感詞出現(xiàn)的次數(shù):”+number);
//字庫中關(guān)鍵詞個數(shù)
}
}else{
//提示用戶按回車鍵
System.out.println(“你還沒有輸入回
車鍵信息”);
}
}
}catch(IOExceptione){
e.printStackTrace();
}
//輸出查詢結(jié)果
if(ans!=null){
System.out.println(“字庫中關(guān)鍵詞個數(shù):”+cnt);//字庫中關(guān)鍵詞個數(shù)
System.out.println(“敏感詞庫內(nèi)容如下:”+ans);
}else{
System.out.println(“沒有可以匹配的信息”);
//輸出敏感詞庫中的內(nèi)容
}
}
//得到指定路徑文件中的內(nèi)容
privatestaticStringgetcontent(Stringfilepath){
Stringall=“”;
Filefile=newFile(filepath);
try{
if(!file.isFile()){
System.out.println(“文件路徑不對,請修改路徑”);
}else{
Filereadfile=newFile(filepath);
BufferedReaderbr=newBufferedReader(newFileReader(readfile));
Stringss=br.readLine();
while(ss!=null){
all=all+ss;
//all中存放讀取的文件內(nèi)容信息
ss=br.readLine();
}
}
}catch(FileNotFoundExceptione){
e.printStackTrace();
}catch(IOExceptione){
e.printStackTrace();
}
returnall;
}
//在待測文件中匹配敏感詞出現(xiàn)的次數(shù)
privatestaticintsearchkeyword(String[]str,intcnt,Stringfilepath){
intnumber=0;
Strings=“”;
s=getcontent(filepath);
for(inti=0;icnt;i++){
if(s.indexOf(str[i])-1){
number++;
}
}
returnnumber;
}
至此,完成了敏感詞過濾器軟件代碼的編寫工作,接下來可以進(jìn)行run操作,即可以得到待測文件庫中的待測文件包含敏感詞次數(shù)及出處等相關(guān)信息的結(jié)果。
3實驗結(jié)果分析
敏感詞庫的存放路徑:D:\敏感詞典\file.txt;敏感詞庫文件中的內(nèi)容略。
待測文件庫的存放路徑:D:\敏感詞待測文件庫;文件庫中存放了三個文件,分別為:test1.txt、test2.txt、test3.txt.
運行該過濾器軟件后,得出的檢測結(jié)果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度跨境貿(mào)易專用全新抵押合同版本3篇
- 2025年度公廁智能廁所設(shè)備研發(fā)與生產(chǎn)承包施工合同范本3篇
- 二零二五年度股權(quán)眾籌合作協(xié)議范本3篇
- 二零二五年度典當(dāng)行業(yè)務(wù)培訓(xùn)與人才培養(yǎng)合同3篇
- 2025年度公司代個人繳納社保及補(bǔ)充養(yǎng)老保險服務(wù)協(xié)議3篇
- 二零二五年度虛擬現(xiàn)實體驗公司轉(zhuǎn)讓合同3篇
- 二零二五年度冷鏈物流中心冷庫租賃服務(wù)合同
- 二零二五年度寵物寄養(yǎng)寵物醫(yī)療一體化服務(wù)合同3篇
- 二零二五年度員工職務(wù)秘密及競業(yè)限制補(bǔ)充協(xié)議3篇
- 二零二五年度農(nóng)村土地流轉(zhuǎn)與農(nóng)業(yè)廢棄物資源化利用合作協(xié)議
- 大慶市2025屆高三年級第二次教學(xué)質(zhì)量檢測(二模)政治試卷(含答案)
- 2025年內(nèi)江資中縣融媒體中心招考聘用新媒體工作人員3人高頻重點提升(共500題)附帶答案詳解
- 裝修材料合同范例
- 【7地RJ期末】安徽省合肥市廬江縣2023-2024學(xué)年七年級上學(xué)期期末地理試題(含解析)
- 共用線路三方協(xié)議合同范例
- 戰(zhàn)略規(guī)劃的關(guān)鍵要點
- 社會工作服務(wù)質(zhì)量保障措施
- 冬季高空作業(yè)施工方案
- 山西云時代技術(shù)有限公司招聘筆試題目
- 課程思政專題培訓(xùn)
- 食品買賣合同范本
評論
0/150
提交評論