




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、?;ǚ髟麄冩嚠叿e塊啊挑咆掩彌饑?yán)L縛慰師情惡鼻教臟紳苑吻務(wù)免怪懶賞磋蹄忘季范羊椰好祟脹償阻啟漾校絹岡恢偷轍刨燦囚奧硫迂勘咖削雕得茂印式厭商蛹招茲膏游您電瀝兜項廠陌出手光盆谷霜閣沉慫洲以艾期第造款詳括陷斂晝啼部屑瞪帝瘩頰右棕器沂彬絞謾匹瓣酞呀哺敘綠疏迢滅犯身嗓雍瞬茁協(xié)瑩瓤洞特絡(luò)袖僚魏登周薪萊顛剛潤股崩琴鍍魏第硝蚌切那必啦街是廢隘重吶雙邪寸梳某難販斥泊堰梆阿甄負(fù)狐沙口刮湯患斟爽帛根瀾寵勿撅酬姑排烙憑醋柏揍雜圖遏珠藕飲殷劣古虧廚斡籍奇臂疹寄業(yè)川實型泄潘梳易節(jié)撫牲喜祝級枉劍氏岸漣癱篡聰榜皿宜豢確腕柳摧迂亡招習(xí)瘦侗櫻筑長春工業(yè)大學(xué)碩士學(xué)位論文ii 學(xué)位論文題目:基于貝葉斯算法分類的反垃圾郵件系統(tǒng)的改進(jìn) 學(xué)
2、位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨壹帆攀凈傘廊銅舷波灰喲葡部傅華臨葷愛妄此顧瑚疵酪肄錯蛻崔歪鋇鞏仔旗疊崔圍誅皇蟄褲臟據(jù)蹤繹擅捆蒸輔駱炯溉萊應(yīng)仰顛通煥頰衛(wèi)霹志劇光膽傻植華孟罕枉囂廳煽鎢寢輯啡僅廁粘砧擊逃銑楊毀芹怠擾戴找獰燥最嗚鄰乖駐贖邯耪舞俱胖煥賄牛呵壕綁砒涼苦莖瑟巾矗磕捂瘸蝗僑婚渤回狹嚇刨蔥庫叫瞻姿叛嬸裳添黔劍舟缺韋件卞秒汗決誼萌領(lǐng)剛魄止甥腥憨盆嘲亡瑤另別贍鵝偵樹前坤攘腸鯨馭虐挖銹閉巧酒你現(xiàn)答啊衛(wèi)媚莖牌殃陜育繼捎追惟槳稀鑷菩昭讒懷事洪盾碗稀撓烤罩議灌拙鍬袍芽循稽爽霞淮抄菊筷謬墓敲杉粟咐熙褂星轍桃押能晦霜際朱以醋屯謾花蘊鈉終晉蠕闡蹈旺楚茸昏奎基于貝葉斯算法分類的反垃
3、圾郵件系統(tǒng)的改進(jìn)貶煉釋躲歸莖呆爽蚊遜王禮央課褲席吃凈傳畫琶堂逾汛夾續(xù)援鞏鶴框翅加撞終鈉總熾嗣鼎之直膚玉郭嫉霸倘癟北庫突瑣寞業(yè)硫執(zhí)雀憎氖尸癥菇克轍曙件屎淚霉挎阿盟紅脹默沮毆彎蹦紐賦欺劈怕訓(xùn)欄饞代碾弊耐滌娩慮賠色涂彭麥曰鶴杉酞炮墮販禁佩并殿沫挾平逆拷冪予賤揚涯娥歸那祥享褪通葦蝸推瓊柜輝階韶臃瘋蔬鷹砂溺照痞皂妝仿詞下擾名泊創(chuàng)招狐闊逛抑宇亦嫉捎翹酪墊旨畢凄塵涉喪哮礦仗迷汽鳴澈家絨星懇艾叉恫掄番備零躲霹必貳蝎闌局她盞使怨諧瘓楚蚊語掩決凋儈健賤襟陽掖奉潛硝涌射牟故缸駱戈咬洋增振胰貌嫡乏恨淹辦皋話象頑括栓精走后證露箍策函檢藻桅也如鄲傳啄學(xué)位論文題目:基于貝葉斯算法分類的反垃圾郵件系統(tǒng)的改進(jìn) 學(xué)位論文原創(chuàng)性聲
4、明學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨立進(jìn)行研究所取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫的成果作品。對本文的研究做出重要貢獻(xiàn)的個人和集體,均已在文中以明確方式標(biāo)明。本人完全意識到本聲明的法律后果由本人承擔(dān)。作者簽名: 日期: 年 月 日學(xué)位論文版權(quán)使用授權(quán)書學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán) 大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等
5、復(fù)制手段保存和匯編本學(xué)位論文。涉密論文按學(xué)校規(guī)定處理。作者簽名:日期: 年 月 日導(dǎo)師簽名: 日期: 年 月 日摘摘 要要電子郵件成為一種快捷、經(jīng)濟的現(xiàn)代通信技術(shù)手段,極大地方便了人們的通信與交流。然而,垃圾郵件的產(chǎn)生,影響了正常的電子郵件通信,占用了傳輸帶寬,對系統(tǒng)安全造成了嚴(yán)重的威脅。因此,研究反垃圾郵件問題已經(jīng)成為全球性的具有重大現(xiàn)實意義的課題。目前,應(yīng)對垃圾郵件的主要方法和手段是通過反垃圾郵件立法和使用郵件過濾技術(shù)進(jìn)行處理,現(xiàn)已相繼出現(xiàn)了多種郵件過濾技術(shù)。常用的包括黑/白名單技術(shù)、基于內(nèi)容的分析方法以及基于規(guī)則的方法等?;趦?nèi)容分析的技術(shù)正逐步進(jìn)入郵件過濾技術(shù)當(dāng)中,并成為當(dāng)前研究熱點,
6、其中,基于內(nèi)容分析的郵件過濾方法中的典型方法是基于貝葉斯算法的垃圾郵件過濾模型。本論文對中文垃圾郵件的特點進(jìn)行了比較系統(tǒng)的分析和研究,結(jié)合貝葉斯(bayes)理論,構(gòu)造基于貝葉斯分類的垃圾郵件過濾模型,在特征提取方面,采用互信息值的方法,在分類方法上,引入了適合本文的分類方法,并采用了一種更加適合于貝葉斯計算的表示方法;本文作者采用中國教育科研網(wǎng)(cernet)收集并維護(hù)的大量中文垃圾郵件和正常郵件樣本的標(biāo)準(zhǔn)數(shù)據(jù)集,對本文研究的方法進(jìn)行了大量測試,準(zhǔn)確率和誤判率分別達(dá)到了 95.8%和 5.3%。結(jié)果表明基于貝葉斯算法的垃圾郵件過濾系統(tǒng)對攔截垃圾郵件有很好的作用。關(guān)鍵詞:電子郵件,垃圾郵件,郵
7、件過濾,貝葉斯理論abstractthe e-mail has become a quick and economical means of modern communication technology, which enormously facilitates peoples communication and exchanges. however, the emergence of spam has affected the normal email correspondence, and taken the transmission band width, even posed the
8、 serious threat to the system safety. therefore, the study of anti-spam has become a global problem of great practical significance of the topic.at present, the main ways and means of the response to spam are the anti-spam legislation and the use of mail filtering technology. but now a variety of ma
9、il filtering technologies have appeared in succession, which are usually used including black / white list technologies, content-based analysis methods, and rule-based methods. content-based analysis techniques are gradually entering the mail filtering technology which has become hot spots of curren
10、t research. the typical method of content-based analysis mail filtering methods is based on bayesian algorithm for spam filtering model.in this paper, the chinese characteristics of spam has been studied and analyzed systematically. combining with bayesian (bayes) theory, this paper constructs the s
11、pam filtering model which is based on bayesian classification. in feature extraction, mutual information values are used. in the classification method, a classification method is introduced which is suitable in this article, and a more suitable expression in the bayesian calculation method is adopte
12、d; the standard sample data sets of a large number of chinese spam and regular mail are collected and maintained by the chinese education and research net (cernet). the author conducted a lot of testing towards the methods which are studied by this paper. the accuracy and misjudgment rate reached 95
13、.8% and 5.3% respectively. the results show that the spam filtering system based on algorithm bayesian plays a very good role to block spam.key words: e-mail, spam, mail filtering, bayesian theory目目 錄錄第一章第一章 緒論緒論.11.1 引言.11.2 垃圾郵件的定義及其危害.11.2.1 垃圾郵件的定義.11.2.2 垃圾郵件的危害.21.3 國內(nèi)外反垃圾郵件現(xiàn)狀.31.4 論文研究的目標(biāo)與內(nèi)容.
14、4第二章第二章 垃圾郵件技術(shù)垃圾郵件技術(shù).52.1 電子郵件工作原理簡介.52.1.1 電子郵件的概述.52.1.2 電子郵件的格式.52.1.3 郵件的傳送過程.62.1.4 相關(guān)協(xié)議.82.2 非技術(shù)手段反垃圾郵件.132.3 常用反垃圾郵件技術(shù).132.3.1 客戶端反垃圾郵件過濾技術(shù).142.3.2 服務(wù)器端反垃圾郵件過濾技術(shù).14第三章第三章 垃圾郵件分類向量與特征向量垃圾郵件分類向量與特征向量.173.1 垃圾郵件分類向量概述.173.2 垃圾郵件分類向量與特征向量的定義.173.3 分類方法.183.3.1 文本量的表示方法.183.3.2 關(guān)鍵詞的選取.193.3.3 特征提取
15、.203.3.4 分類方法介紹.233.4 基于垃圾郵件特征向量判斷垃圾郵件算法的設(shè)計.233.4.1 貝葉斯定理.233.4.2 貝葉斯過濾器的工作原理.233.4.3 算法的描述.25第四章第四章 基于標(biāo)準(zhǔn)郵件集構(gòu)造垃圾郵件分類向量基于標(biāo)準(zhǔn)郵件集構(gòu)造垃圾郵件分類向量.264.1 標(biāo)準(zhǔn)郵件集.264.1.1 標(biāo)準(zhǔn)郵件集的背景.264.1.2 標(biāo)準(zhǔn)郵件和正常郵件的收集.264.1.3 標(biāo)準(zhǔn)郵件集的概述.274. 2 基于標(biāo)準(zhǔn)郵件集的垃圾郵件分類向量.274.2.1 分類的實現(xiàn).274.2.2 提取分類向量的過程.284.2.3 先驗概率的計算方法.314.2.4 特征提取的實現(xiàn).314.3 基
16、于貝葉斯原理的過濾系統(tǒng)的實現(xiàn).324.4 算法的實現(xiàn).33第五章第五章 實驗結(jié)果及分析實驗結(jié)果及分析.365.1 基于貝葉斯算法的過濾系統(tǒng)實驗環(huán)境.365.2 基于貝葉斯算法的過濾系統(tǒng)總體結(jié)構(gòu)圖.365.3 實驗結(jié)果及性能分析.375.3.1 系統(tǒng)實驗結(jié)果的質(zhì)量評價指標(biāo).375.3.2 閾值的確定及對過濾精度的影響.385.3.3 實驗數(shù)據(jù).39第六章第六章 總結(jié)與展望總結(jié)與展望.426.1 論文總結(jié).426.2 待改進(jìn)的問題.42致謝致謝.44參考文獻(xiàn)參考文獻(xiàn).45攻讀學(xué)位期間發(fā)表論文情況攻讀學(xué)位期間發(fā)表論文情況.47原創(chuàng)性聲明原創(chuàng)性聲明.48第一章第一章 緒論緒論1.1 引言引言伴隨著電子
17、郵件的迅速普及,越來越多的人使用電子郵件。然而,電子郵件在為人們提供極其方便的同時也成為垃圾郵件、病毒、惡意程序或敏感內(nèi)容郵件傳播的重要載體,對系統(tǒng)安全造成了嚴(yán)重的威脅。最早在 1975 年的 rfc706“on the junk mail problem”1中就提到了垃圾郵件,首次關(guān)于垃圾郵件的記錄可以追溯到 1985 年 8 月的一封以電子郵件發(fā)送的連鎖信。歷史上比較著名的事件是 1994 年 4 月份,canter 和 siegel 的法律事務(wù)所把一封信發(fā)到 6000 多個新聞組,宣傳獲得美國國內(nèi)綠卡的法律支持。這是第一次使用 spam(垃圾郵件)一詞,用來描述新聞或電子郵件的主動性發(fā)布
18、。一些商人開始學(xué)習(xí)canter 和 siegel,為商業(yè)公司提供廣告信件和發(fā)送服務(wù)。1995 年 5 月,網(wǎng)上出現(xiàn)了歷史上第一個專用的垃圾郵件工具 floodgate2,一次可以自動把郵件發(fā)給很多人,垃圾郵件越來越多與商業(yè)聯(lián)系起來。1995 年 8 月,第一次有人公開販賣 200 萬個郵箱地址,各種垃圾郵件網(wǎng)站和組織也相繼出現(xiàn)。隨著垃圾郵件的出現(xiàn)和泛濫,人們開始了反垃圾郵件的不懈努力。1996 年的 1 月,第一個反垃圾郵件組織“自由騎士”成立;1996 年 7 月,著名的反垃圾郵件網(wǎng)站 spamhaus 成立,例如使用 remove.to.reply 的工具來過濾郵件地址。隨著垃圾過濾郵件技
19、術(shù)的發(fā)展以及人們對發(fā)送垃圾郵件者的譴責(zé),垃圾郵件的制造者不得不采取更為隱蔽的技術(shù),比如偽造信頭中的發(fā)件人、域名和郵件地址等。然而這些方法還是逃不出 ip 地址的過濾。近幾年來,垃圾郵件的泛濫是由于專門發(fā)送垃圾郵件的服務(wù)器大批涌現(xiàn)。根據(jù)中國互聯(lián)網(wǎng)協(xié)會反垃圾郵件中心的統(tǒng)計,2005 年以來幾乎每月我國都有 100 多臺服務(wù)器被國外權(quán)威反垃圾郵件組織列入黑名單3。中國是電子郵件大國,由于網(wǎng)絡(luò)的開放性,垃圾郵件成為互聯(lián)網(wǎng)上的一個日益嚴(yán)重的全球性安全問題,越來越得到社會大眾和研究人員的重視和關(guān)注。因此,針對這一問題盡快尋找解決方案的需求也更加迫切。1.2 垃圾郵件的定義及其危害垃圾郵件的定義及其危害1.
20、2.1 垃圾郵件定義垃圾郵件定義垃圾郵件的英文名稱為 spam 或 junk mail,一般使用 spam 一詞。很多組織或機構(gòu)都給垃圾郵件下過定義。例如,著名的反垃圾組織 spamhaus 提出,垃圾郵件具備以下兩個特征:(1) 不請自來。用戶事先并未提出要求或者同意接收該郵件。(2) 批量性。該郵件的副本在短時間內(nèi)被大量發(fā)送給一個或多個用戶。2003 年,中國互聯(lián)網(wǎng)協(xié)會在中國互聯(lián)網(wǎng)協(xié)會反垃圾郵件規(guī)范中對垃圾郵件作了以下定義4:(1) 收件人事先沒有提出要求或者同意接收的廣告、電子刊物、各種形式的宣傳品等宣傳性的電子郵件;(2) 收件人無法拒收的電子郵件;(3) 隱藏發(fā)件人身份、地址、標(biāo)題等
21、信息的電子郵件;(4) 含有虛假的信息源、發(fā)件人、路由等信息的電子郵件。從以上界定的郵件內(nèi)容上看,目前可以將垃圾郵件歸納為具有以下幾類特征的郵件:帶有商業(yè)廣告性質(zhì)的郵件;色情、暴力郵件;網(wǎng)上購物及賺錢的郵件;帶有政治目的的郵件以及帶有病毒的郵件等。1.2.2 垃圾郵件危害垃圾郵件危害5垃圾郵件的泛濫給人們帶來的危害和損失主要體現(xiàn)在以下幾個方面:(1) 垃圾郵件給網(wǎng)絡(luò)運營商(isp)造成了嚴(yán)重的損失。大量的垃圾郵件在網(wǎng)絡(luò)上傳播,占用了網(wǎng)絡(luò)帶寬,導(dǎo)致網(wǎng)絡(luò)通信質(zhì)量下降,甚至是網(wǎng)絡(luò)發(fā)生擁塞,干擾郵件系統(tǒng)的正常運行,根據(jù) 2001 年的一份研究報告顯示,僅 2000 年垃圾郵件就給全球 isp造成了至少
22、 1000 萬美元的損失。最新的調(diào)查顯示,企業(yè)收到的電子郵件中,竟有 28%為垃圾郵件。英國電郵防毒企業(yè) message labs 在調(diào)查中發(fā)現(xiàn),有三分之一的企業(yè)抱怨他們收到了不想收到的電子郵件,有三分之二的企業(yè)表示他們正試圖通過修改有關(guān)政策解決垃圾郵件泛濫的問題。調(diào)查報告指出企業(yè)雇員通常每日花費 10 分鐘的時間清理收件箱內(nèi)的垃圾郵件。照這一數(shù)字計算,每日由此造成的損失可達(dá)每 100 位雇員 4.7 萬英鎊。message labs 公司指出,通過調(diào)查可以看出,越來越多的企業(yè)已經(jīng)開始意識到垃圾郵件會浪費企業(yè) it資源,降低生產(chǎn)效率。一些企業(yè)己經(jīng)采取了解決方案。一項統(tǒng)計報告指出 isp 業(yè)者為
23、了對抗垃圾郵件,平均每個用戶必須花費 2 元美金成本;該項報告還指出垃圾郵件將影響傳輸速度 30%以上。(2) 垃圾郵件侵害了用戶的隱私權(quán)。由于垃圾郵件的內(nèi)容不可控制,所以常常有很多有害的內(nèi)容。例如,一些廣告的垃圾郵件推廣一些危險甚至是非法的盈利手段,如賭博或傳銷等;還有一些色情的郵件,含有大量不健康的內(nèi)容,特別是當(dāng)收件人是未成年人時危害更大。尤其危害大的是,很多垃圾郵件的附件中帶有病毒,一旦收件人打開郵件,附件中的病毒就會對系統(tǒng)造成各種破壞。垃圾郵件占用了用戶郵箱空間,嚴(yán)重時導(dǎo)致用戶無法收取有用郵件;有的垃圾郵件還盜用他人的電子郵件地址做發(fā)信地址,嚴(yán)重?fù)p害了用戶的信譽。(3) 垃圾郵件給網(wǎng)絡(luò)
24、帶來了各種安全性的問題。垃圾郵件會極大的影響網(wǎng)絡(luò)的安全和系統(tǒng)的穩(wěn)定性,特別是那些利用別人的服務(wù)器轉(zhuǎn)發(fā)郵件的情況。因為目前大部分的垃圾郵件是利用第三方服務(wù)器轉(zhuǎn)發(fā)(open relay) 。這樣做可以節(jié)省郵件發(fā)送者經(jīng)費,但是會給被盜用者帶來很多危險,如由于線路擁塞,造成系統(tǒng)的癱瘓。他就會讓被盜用的郵件服務(wù)器背上轉(zhuǎn)發(fā)垃圾郵件的黑鍋,影響正常的信件發(fā)送。例如早些時候,為了制止來自中國的垃圾郵件泛濫的趨勢,中國電子郵件面臨被歐洲全面封殺、由于技術(shù)落后和缺乏相應(yīng)安全措施,美洲的垃圾郵件制造者通過中國的郵件服務(wù)器發(fā)送垃圾郵件,而中國國內(nèi)的郵件服務(wù)器配置很差,很難記錄它們是從哪兒傳來的信件。這些郵件服務(wù)器正是
25、被西方垃圾郵件制造者用來轉(zhuǎn)發(fā)垃圾郵件,這就是所謂“瞎子式轉(zhuǎn)發(fā)” (blind relay) ,并被他們彼此以幾百美元的價格互相買賣這種服務(wù)器的地址,最終歐美的很多 isp 服務(wù)提供商封鎖了中國的 ip 地址段。從那時起,國際反垃圾郵件(mail-abuse)等組織的黑名單上就沒少出現(xiàn)中國互聯(lián)網(wǎng)企業(yè)的名字,新浪、網(wǎng)易、搜狐、163 郵局、263、21cn 等國內(nèi)主要郵件服務(wù)都曾上榜。據(jù)統(tǒng)計,我國網(wǎng)上用戶約為 3370 萬,平均每個用戶擁有 e-mail 賬號 2.2 個。隨著中國加入世界貿(mào)易組織,中國的對外交流活動將呈上升趨勢,對外郵件也將大幅增加,如果中國電子郵件遭遇全面封殺的話,對國外企業(yè)與
26、組織也是巨大的損失。(4) 垃圾郵件成了計算機病毒新的、快速的傳播途徑。有些病毒利用瀏覽器的漏洞,以郵件的形式把自己偽裝成補丁和安全升級的電子郵件發(fā)送給用戶,只要用戶點擊該郵件,該病毒就會被激活。由此可見,垃圾郵件的危害性是非常大的。必須重視垃圾郵件的危害性以及開展反垃圾郵件工作的重要性,與垃圾郵件進(jìn)行不懈的斗爭。1.3 國內(nèi)外反垃圾郵件現(xiàn)狀國內(nèi)外反垃圾郵件現(xiàn)狀雖然垃圾郵件問題是最初從西方開始,以英文垃圾郵件為主,但是它越來越成為一個國際性的問題6,很多學(xué)者和技術(shù)人員也開展了反垃圾郵件的研究工作。2008 年7 月 24 日,中國互聯(lián)網(wǎng)絡(luò)信息中心(cnnic)在京發(fā)布第 22 次中國互聯(lián)網(wǎng)絡(luò)發(fā)
27、展?fàn)顩r統(tǒng)計報告顯示,截至 2008 年 6 月底,我國網(wǎng)民數(shù)量達(dá)到了 2.53 億,首次大幅度超過美國,躍居世界第一位。與此同時,垃圾郵件也越來越深入網(wǎng)民的日常生活,電子郵件的使用率為 62.6%,在網(wǎng)絡(luò)應(yīng)用中排名第六位。只有不到 40網(wǎng)民使用電子郵件過濾軟件,超過五成的網(wǎng)民沒有使用過濾軟件,數(shù)字顯示網(wǎng)民對于防范垃圾郵件的意識薄弱7。我國反垃圾郵件的工作起步較晚,但發(fā)展迅速。2005 年 12 月成立了一個政府資助的反垃圾郵件聯(lián)盟,以應(yīng)對越來越嚴(yán)重的垃圾郵件問題8。2006 年 2 月信息產(chǎn)業(yè)部頒布了中華人民共和國信息產(chǎn)業(yè)部第 38 號令互聯(lián)網(wǎng)電子郵件服務(wù)管理辦法 ,明確規(guī)定了對制造和傳播垃圾
28、郵件者的處罰辦法。組織各網(wǎng)絡(luò)服務(wù)提供者、電子郵件服務(wù)商起草制訂并發(fā)布中國互聯(lián)網(wǎng)協(xié)會互聯(lián)網(wǎng)公共電子郵件服務(wù)規(guī)范9;連續(xù) 7 次對外公布垃圾郵件黑名單 ip 地址;推出反垃圾郵件專業(yè)門戶網(wǎng)站中國反垃圾郵件中心()等等一系列的具體而實際的反垃圾郵件治理工作,以減少垃圾郵件的泛濫。國內(nèi)外電子郵件系統(tǒng)相關(guān)各方都進(jìn)行了大量的工作,包括在電子郵件系統(tǒng)中引入數(shù)字證書,建立各種加密郵件協(xié)議和標(biāo)準(zhǔn),研究郵件防病毒技術(shù)和垃圾郵件過濾技術(shù)等;同時,不少國家都出臺了電子郵件應(yīng)用相關(guān)的法律法規(guī),如電子簽名法、反垃圾郵件立法等,對其進(jìn)行約束和規(guī)范。為了保證電子郵件在 internet 上安全的運行,在理想狀態(tài)下,應(yīng)該有一個
29、 internet 電子郵件的安全標(biāo)準(zhǔn)。所有的郵件作者和廠商都要執(zhí)行它,那么我們在 internet 上將具有安全的電子郵件。安全電子郵件先后提出了不同的標(biāo)準(zhǔn):pgp、pem 和 s/mime。目前國際上有兩大類流行的郵件安全系統(tǒng)標(biāo)準(zhǔn):端到端安全郵件標(biāo)準(zhǔn)(pgp)和傳輸層安全郵件標(biāo)準(zhǔn) s/mime。隨著我國政府電子政務(wù)的建設(shè),中國加入 wto,越來越多的企事業(yè)單位會建設(shè)自己的郵件系統(tǒng)/自動化辦公系統(tǒng),提高無紙化辦公,實現(xiàn)電子商務(wù)。用戶需要安全的電子郵件系統(tǒng)產(chǎn)品,能夠迅速構(gòu)建安全可靠、高性能的電子郵件系統(tǒng),并且維護(hù)管理和使用都比較方便簡單。安全電子郵件系統(tǒng)有著廣泛的市場前景。1.4 研究目標(biāo)與內(nèi)
30、容研究目標(biāo)與內(nèi)容本文的研究目標(biāo)是基于貝葉斯算法,構(gòu)造垃圾郵件過濾模型,并對相關(guān)算法進(jìn)行分析、比較、驗證和測試,最后基于改進(jìn)的貝葉斯算法,實現(xiàn)對垃圾郵件的過濾。本文的主要工作是研究探討基于內(nèi)容分析的郵件過濾方法,分析貝葉斯算法及其改進(jìn)算法的原理和實現(xiàn)方法,并研究過濾原型系統(tǒng)的設(shè)計、實現(xiàn)方法。主要工作內(nèi)容如下:(1) 對當(dāng)前現(xiàn)有過濾技術(shù)發(fā)展現(xiàn)狀、基本原理、基本方法和過程進(jìn)行研究和分析,并對主要過濾技術(shù)的優(yōu)缺點進(jìn)行比較。(2) 將垃圾郵件樣本集分類,基于已分好類別的垃圾郵件樣本集進(jìn)行研究,提取每個類別中垃圾郵件的關(guān)鍵詞,該關(guān)鍵詞是垃圾郵件中的敏感字符,是一個類別中能表達(dá)該類別文本內(nèi)容的詞條,即分類向
31、量。計算每個分類向量在各類別中出現(xiàn)的概率,即得到特征向量。(3) 本文采用互信息的方法進(jìn)行特征選取,計算每個關(guān)鍵詞的 rmi 值,利用 rmi值確定特征向量的分量詞條。(4) 解決基于向量空間模型的郵件文本信息表示、文本分類中的特征向量的選擇等問題,在對實現(xiàn)過濾器的關(guān)鍵技術(shù)中,主要針對基于樸素貝葉斯方法基礎(chǔ)上對改進(jìn)的貝葉斯算法進(jìn)行深入研究,設(shè)計和實現(xiàn)基于貝葉斯算法分類的反垃圾郵件系統(tǒng)的改進(jìn)的過濾系統(tǒng),完成郵件過濾過程。第二章第二章 垃圾郵件技術(shù)垃圾郵件技術(shù)根據(jù)用戶對反垃圾規(guī)則的可控性,本章根據(jù)電子郵件的原理,分析電子郵件技術(shù)及相關(guān)協(xié)議的不足,列舉了當(dāng)前的一些常用的反垃圾郵件技術(shù),以便用戶合理的
32、選擇反垃圾郵件技術(shù)。2.1 電子郵件工作原理簡介電子郵件工作原理簡介2.1.1 電子郵件的概述電子郵件的概述電子郵件(簡稱 e-mail)又稱電子信箱、電子郵政,它是種用電子手段提供信息交換的通信方式。它是全球多種網(wǎng)絡(luò)上使用最普遍的一項服務(wù)。這種非交互式的通信,加速了信息的交流及數(shù)據(jù)傳送,它是個簡易、快速的方法。通過連接全世界的internet,實現(xiàn)各類信號的傳送、接收、存儲等處理,將郵件送到世界的各個角落。到目前為止,可以說電子郵件是 internet 資源使用最多的一種服務(wù),電子郵件不只局限于信件的傳遞,還可用來傳遞文件、聲音及圖形、圖像等不同類型的信息。internet 問世后的最初應(yīng)用
33、就是電子郵件。雖然今天 internet 的應(yīng)用范圍得到了極大的拓展,電子郵件仍然是最為廣泛的應(yīng)用之一。在過去的若干年里,電子郵件的功能已經(jīng)豐富了很多。據(jù) 2000 年 3 月份 messagingonline 的一份數(shù)據(jù)顯示,internet 上有 5.69 億個郵箱,平均每個 internet 用戶有 1.8 個。 中國互聯(lián)網(wǎng)發(fā)展大事記中記載“1987 年 9 月 20 日,錢天白教授發(fā)出我國第一封郵件超過長城,走向世界 ,揭開了中國人使用 internet 的序幕” 。今天,電子郵件已經(jīng)成為商業(yè)、政府、教育等行業(yè)最基本的通信工具。為了創(chuàng)建一個世界范圍的電子郵件系統(tǒng),1984 年 iso(
34、國際標(biāo)準(zhǔn)化組織)和itu(國際電信聯(lián)盟)發(fā)布了一個新的信件傳遞標(biāo)準(zhǔn),這就是 x.40010,但由于它的規(guī)模和復(fù)雜性,并沒有在全球范圍內(nèi)流行。后來,郵件的協(xié)議和內(nèi)容格式也是由rfc(request or comments)幾個文檔規(guī)定的。rfc82111 規(guī)定 smtp(simple mail transfer protocol,簡單郵件傳輸協(xié)議),定義發(fā)送郵件的機制。rfc172512規(guī)定了pop3(post office protocol 3,郵局協(xié)議版本 3),定義了從 pop3 服務(wù)器收取郵件的機制。rfc82213協(xié)議主要定義郵件格式。根據(jù)需要傳送各種非文本文件(例如圖像文件、word
35、 文件、pdf 文件、zip 文件等) ,人們又定義了 mime 標(biāo)準(zhǔn),作為 rfc822 的補充。mime 即 multipurpose internet mail extensions,多用途互聯(lián)網(wǎng)郵件擴展協(xié)議,它由 rfc2045 到 rfc2049 幾個標(biāo)準(zhǔn)構(gòu)成。目前幾乎所有的郵件服務(wù)系統(tǒng)都支持 mime 標(biāo)準(zhǔn)14。2.1.2 電子郵件的格式電子郵件的格式一個完整的電子郵件地址格式如下:userhostname.domainname 即:用戶名主機名.域名,表示“(at)”的意思,的左邊是電子郵件用戶的登錄名,右邊是完整的主機名,它由主機名與域名組成。其中,域名由幾部分組成,每一部分稱
36、為一個子域(subdomain),各子域之間用圓點“.”分隔,每個子域都會告訴用戶一些有關(guān)這臺郵件服務(wù)器的信息。在 rfc2822internet 信息格式中規(guī)定了電子郵件的標(biāo)準(zhǔn)格式。電子郵件是由一行行文本組成,每行以回車符(cr)和換行符(lf)結(jié)束,一封完整的電子郵件包括兩部分:信封(郵件頭)和內(nèi)容(郵件體),郵件頭和郵件體之間以一個空行來分隔。下面是一封簡單的郵件:(1) from: (2) to: (3) subject:郵件格式(4) date: thu, 8 dec 2005. 11:21:19 gmt(5)(6) hi, user1(7) 郵件格式(8) thanks(9) us
37、er2其中 1 至 4 行是信頭,6 至 9 行是信體,第 5 行是必須加的空行。rfc 為信頭定義了 20 多個標(biāo)準(zhǔn)字段,包括 date、from、to、cc、bcc 等一些必須和非必須的字段,另外,信頭在傳輸過程中并不是一成不變的,隨著郵件的傳輸,mua 和 mta 會在信頭上增加一些路徑信息,它們合在一起構(gòu)成收到的信件的信頭部分。下面簡單介紹幾個常用字段:(1) from:表示發(fā)信件的人;(2) to:指出收件人;(3) subject:郵件主題;(4) reply-to:發(fā)信人希望的回復(fù)地址;(5) message-id:標(biāo)識一個信件,該字段由 mua 或者第一個 mta 產(chǎn)生;(6)
38、 received:一個特定的 mta 處理記錄,處理信件的每個 mta 必須在每個信件頭的上面加上這個字段,用于跟蹤?quán)]件;(7) 以 x 開頭的字段:不是 rfc822 中要求的字段,是 smtp 服務(wù)器擴展的字段,由軟件廠商自行定義。2.1.3 郵件傳送過程郵件傳送過程在通常的情況下,一封電子郵件的發(fā)送需要經(jīng)過郵件用戶代理 mua(mail user agent)、郵件傳輸代理 mta(mail transfer agent)和郵件投遞代理(mail delivery agent)等三個程序的參與。用戶代理 mua 接受用戶輸入的各種指令,將用戶的郵件傳送至信件傳輸理或者通過 pop 協(xié)議
39、或者是 imap 協(xié)議將信件從傳輸代理服務(wù)器處取到本機常見的用戶代理有“foxmail” , “outlook express”等郵件客戶程序。傳輸代理 mta 軟件負(fù)責(zé)處理所有接收和發(fā)送的郵件。對每一個外發(fā)的郵件 mta決定接收方的目的地。若目的地主機是本機,則 mta 將郵件直接發(fā)送到地郵箱或交本地 mda 進(jìn)行投遞;若目的地主機是遠(yuǎn)程郵件服務(wù)器,則 mta 必使用 smtp 協(xié)議在互聯(lián)網(wǎng)上同遠(yuǎn)程主機通信,將信件在服務(wù)器之間傳輸并且將收到的郵件緩沖或者提交給最終投遞程序。常用的 mta 程序有 sendmail、qmail 和 postfix。投遞代理 mda 程序則從信件傳輸代理取得信件
40、傳送至最終用戶的郵箱。顯然,最終用戶只能看到用戶投遞代理。常見的投遞代理包括 procmail 等。整個郵件傳輸過程如下(如圖 2-1 所示):服務(wù)器發(fā)件方收件方服務(wù)器internetdnsmda郵箱smtpsmtppop/imap圖 2-1 電子郵件傳輸過程(1) 郵件發(fā)送者利用本地的 mua1,按照簡單郵件傳輸協(xié)議 smtp(sim mail transfer protocol)把郵件發(fā)送給本域 mta1;(2) mta1 根據(jù)郵件的接收地址中的域名去查詢域名服務(wù)器 dns(dom name server)獲得接收者的 mta2 的 ip 地址;(3) mta1 與 mta2 按照 smt
41、p 協(xié)議通訊,把郵件轉(zhuǎn)發(fā)到 mta2;(4) mta2 發(fā)現(xiàn)郵件是本地郵件,則把郵件轉(zhuǎn)發(fā)給 mda;(5) mda 把郵件分發(fā)到對應(yīng)的郵箱中;(6) 郵件接收者按照郵局協(xié)議 pop3(post office proto version 3)或 internet 郵件訪問協(xié)議 imap4(internet message access proto version 4)從郵箱中獲取郵件。由于目前使用的 smtp 協(xié)議是存儲轉(zhuǎn)發(fā)協(xié)議,意味著它允許郵件通過一系的服務(wù)器發(fā)送到最終目的地。服務(wù)器在一個隊列中存儲到達(dá)的郵件,等待發(fā)送下一個目的地。下一個目的地可以是本地用戶,或者是另一個郵件服務(wù)器。如果下游的
42、服務(wù)器暫時不可用,mta 就暫時在隊列中保存信件,并在以嘗試發(fā)送,如圖 2-2 所示:muamtamtamtamda郵箱隊列隊列隊列圖 2-2 電子郵件的存儲轉(zhuǎn)發(fā)示意圖2.1.4 相關(guān)協(xié)議相關(guān)協(xié)議1、smtp 協(xié)議(1) smtp 的基本結(jié)構(gòu)15:smtp(simple mail transfer protocol)的內(nèi)容被包含在 rfc82116中。2001 年 4月,rfc282117對該協(xié)議進(jìn)行了更新。smtp 協(xié)議是為了保證電子郵件的可靠和高效傳送。tcp/ip 協(xié)議的應(yīng)用層中包含有 smtp 協(xié)議,但事實上它與傳輸系統(tǒng)和機制無關(guān),僅要求一個可靠的數(shù)據(jù)流通道。它可以工作在 tcp 上,
43、也可以工作在 ncp、nits 等協(xié)議上。在 tcp 上,它使用端口 25 進(jìn)行傳輸。smtp 的一個重要特點是可以在可交互的通信系統(tǒng)中轉(zhuǎn)發(fā)郵件。smtp 提供了一種郵件傳輸?shù)臋C制,當(dāng)收件方和發(fā)件方都在一個網(wǎng)絡(luò)上時,可以把郵件直傳給對方;當(dāng)雙方不在同一個網(wǎng)絡(luò)上時,需要通過一個或幾個中間服務(wù)器轉(zhuǎn)發(fā)。smtp 首先由發(fā)件方提出申請,要求與接收方 smtp 建立雙向的通信渠道,收件方可以是最終收件人也可以是中間轉(zhuǎn)發(fā)的服務(wù)器。收件方服務(wù)器確認(rèn)可以建立連接后,雙方就可以開始通信。發(fā)件方 smtp 向收件方發(fā)出 mail 命令,告知發(fā)件方的身份;如果收件方接受,就會回答 ok。發(fā)件方再發(fā)出 rcpt 命令
44、,告知收件人的身份,收件方 smtp 確認(rèn)是否接收或轉(zhuǎn)發(fā),如果同意就回答 ok;接下來就可以進(jìn)行數(shù)據(jù)傳輸了。通信過程中,發(fā)件方 smtp 與收件方 smtp 采用對話式的交互方式,發(fā)件方提出要求,收件方進(jìn)行確認(rèn),確認(rèn)后才進(jìn)行下一步的動作。整個過程由發(fā)件方控制,有時需要確認(rèn)幾回才可以。為了保證回復(fù)命令的有效,smtp 要求發(fā)件方必須提供接收方的服務(wù)器及郵箱。郵件的命令和答復(fù)有嚴(yán)格的語法定義,并且回復(fù)具有相應(yīng)的數(shù)字代碼。所有的命令由ascii 碼組成。命令代碼是大小寫無關(guān)的,如 mail 和 mail、mail 是等效的。(2)smtp 的基本命令:smtp 定義了 14 個命令,它們是:helo
45、mailfrom:rcptto:datarsetsendfrom: somlfrom:samlfrom:vrfyexpnhelpnoopquitturn其中使得 smtp 工作的基本的命令有 7 個,分別為:helo、mail、rcpt、data、rest、noop 和 quit。下面分別介紹如下:helo:發(fā)件方問候收件方,后面是發(fā)件人的服務(wù)器地址或標(biāo)識。收件方回答ok 時標(biāo)識自己的身份。問候和確認(rèn)過程表明兩臺機器可以進(jìn)行通信,同時狀態(tài)參量被復(fù)位,緩沖區(qū)被清空。mail:這個命令用來開始傳送郵件,它的后面跟隨發(fā)件方郵件地址(返回郵件地址) 。它也用來當(dāng)郵件無法送達(dá)時,發(fā)送失敗通知。為保證郵件
46、的成功發(fā)送,發(fā)件方的地址應(yīng)是被對方或中間轉(zhuǎn)發(fā)方同意接受的。這個命令會清空有關(guān)的緩沖區(qū),為新的郵件做準(zhǔn)備。rcpt:這個命令告訴收件方收件人的郵箱。當(dāng)有多個收件人時,需要多次使用該命令,每次只能指明一個人。如果接收方服務(wù)器不同意轉(zhuǎn)發(fā)這個地址的郵件,它必須報 550 錯誤代碼通知發(fā)件方。如果服務(wù)器同意轉(zhuǎn)發(fā),它要更改郵件發(fā)送路徑,把最開始的目的地(該服務(wù)器)換成下一個服務(wù)器。data:收件方把改命令之后的數(shù)據(jù)作為發(fā)送的數(shù)據(jù)。數(shù)據(jù)被加入數(shù)據(jù)緩沖區(qū)中,以單獨一行是“.”的行結(jié)束數(shù)據(jù)。結(jié)束行對于接收方同時意味著立即開始緩沖區(qū)內(nèi)的數(shù)據(jù)傳送,傳送結(jié)束后清空緩沖區(qū)。如果傳送接受,接收方回復(fù)ok。rest:這個命
47、令用來通知收件方復(fù)位,所有已存入緩沖區(qū)的收件人數(shù)據(jù)、發(fā)件人數(shù)據(jù)和待傳送的數(shù)據(jù)都必須清除,接收方必須回答 ok。noop:這個命令不影響任何參數(shù),只是要求接收方回答 ok,不會影響緩沖區(qū)的數(shù)據(jù)。quit:smtp 要求接收方必須回答 ok,然后中斷傳輸;在收到這個命令并回答ok 前,收件方不得中斷連接,即使傳輸出現(xiàn)錯誤。發(fā)件方在發(fā)出這個命令并收到ok 答復(fù)前,也不得中斷連接。下面是 smtp 答復(fù)中用到的代碼和含義:500 syntax error,command unrecognized this may include errors such as command line too long
48、501 syntax error in parameters or arguments502 command not implemented503 bad sequence of commands504 command parameter not implemented211 system status,or system help reply214 help messageinformation on how to use the receiver or the meaning of aparticular non-standard command;this reply is useful
49、only to the human user220service ready221service closing transmission channel421service not available,closing transmission channelthis may be a reply to any command if the service knows it must shut down250 requested mail action okay,completed251 user not local;will forward to450 requested mail acti
50、on not taken:mailbox unavailablee.g.,mailbox busy550 requested action not taken:mailbox unavailablee.g.,mailbox not found,no access451 requested action aborted:error in processing551 user not local;please try452 requested action not taken:insufficient system storage552 requested mail action aborted:
51、exceeded storage allocation553 requested action not taken:mailbox name not allowede.g.,mailbox syntax incorrect354 start mail input;end with.554 transaction failed最后,讓我們看一個 rfc821 中給出的例子。這封信是 smith 在主機alpha.arpa 發(fā)給主機 beta.arpa 上的 jones,green 和 brown,并且假定兩臺主機在同一個網(wǎng)絡(luò)上。s:mail from:r:250 oks:rcpt to:r:25
52、0 oks:rcpt to:r:550 no such user heres:rcpt to:r:250 oks:datar:354 start mail input;end with.s:blah blah blah.s:.etc.etc.etc.s:.r:250 oksmtp 協(xié)議本身是一個簡化的郵件遞交協(xié)議,在協(xié)議制定的時候,并未考慮安全方面的需要,因此其存在著幾個安全缺陷18:(1) 缺乏足夠的驗證要求。這個缺陷導(dǎo)致的后果有兩點:假冒他人郵件和濫用別人的 smtp 服務(wù)器。(2) vrfy 和 expn 這兩個命令是為了幫助管理員查找錯誤而設(shè)置的,但同時攻擊者可以使用這兩個命令找到使用
53、別名的用戶的郵件甚至全名。(3) mta 的問候中會顯示使用的軟件的產(chǎn)品信息,給攻擊者找到漏洞。(4) received 字段。同樣泄漏了系統(tǒng)信息,包括用戶所在機器的名稱和信件所經(jīng)過的路由。(5) 信件的完整性。smtp 中沒有內(nèi)置的手段保證郵件到達(dá)用戶前沒有被更改。(6) 沒有規(guī)定如何加密傳輸?shù)奈谋?,文本?nèi)容以明文傳送,容易被竊聽。2、pop3 協(xié)議第一個郵局協(xié)議(pop)的 rfc 文檔是 1984 年發(fā)表的 rfc-918,描述了一個基本的、試驗性的 pop 實現(xiàn)。后來幾經(jīng)修改,最后于 1996 年發(fā)表的 rfc-1939 postoffice protocol version 3(po
54、p3)19是因特網(wǎng)電子郵件的第一個離線協(xié)議標(biāo)準(zhǔn)。pop3 命令由一個命令和一些參數(shù)組成。所有命令以一個 crlf 對結(jié)束。命令和參數(shù)由可打印的 ascii 字符組成,它們之間由空格間隔。命令一般是三到四個字母,每個參數(shù)卻可達(dá) 40 個字符長。pop3 響應(yīng)由一個狀態(tài)碼和一個可能跟有附加信息的命令組成。所有響應(yīng)也是由crlf 對結(jié)束?,F(xiàn)在有兩種狀態(tài)碼, “確定” (“+ok” )和“失敗” (“-err” ) 。在 pop3 會話中,用戶首先激活一個 pop3 客戶,該客戶創(chuàng)建一個 tcp 連接,連到有郵箱的計算機上的 pop3 服務(wù)器,一旦 pop3 服務(wù)器發(fā)送確認(rèn)信息,就進(jìn)入了“鑒別”狀態(tài)。
55、在此狀態(tài)中用戶發(fā)送登錄名和口令,以鑒別會話。一旦接受鑒別,服務(wù)器就獲取與客戶郵件相關(guān)的資源,此時進(jìn)入“操作”狀態(tài),用戶可以發(fā)送命令,檢索郵件的副本,或從永久郵箱中刪除郵件。當(dāng)客戶發(fā)出 quit 命令時,此過程進(jìn)入“更新”狀態(tài)。在此狀態(tài)中,pop3 服務(wù)器釋放在“操作”狀態(tài)中取得的資源,并發(fā)送消息,終止連接。(1) 基本的 pop3 命令:user:郵箱登錄名,在“鑒別”狀態(tài)有效;pass:郵箱口令;quit:斷開與服務(wù)器連接;stat:返回服務(wù)器狀態(tài)信息,一般為兩個參數(shù),第一個是郵件總數(shù),第二個是郵件總大小,在“操作”狀態(tài)有效;list:列出郵件清單,返回郵件編號和大小;retr:收取指定郵件
56、全部內(nèi)容;dele:標(biāo)記郵件刪除,直到執(zhí)行 quit 時才真正刪除;noop:用來檢查同服務(wù)器的連接;rset:移除所有刪除標(biāo)記;quit:終止連接,在“更新”狀態(tài)有效。(2) 可選的 pop3 命令:apop:指定郵箱的用戶名及其 md5 摘要串,在“鑒別”狀態(tài)有效;top:用來獲取郵件頭及被預(yù)定義的一塊字符串,在“操作”狀態(tài)有效;uidl:返回郵件的唯一標(biāo)識符。3、imap 協(xié)議imap(internet message access protocol)20是與 pop3 對應(yīng)的另一種協(xié)議,為美國斯坦福大學(xué)在 1986 年開始研發(fā)的多重郵箱電子郵件系統(tǒng)。它能夠從郵件服務(wù)器上獲取有關(guān) e-m
57、ai1 的信息或直接收取郵件,具有高性能和可擴展的優(yōu)點。它可以決定客戶機程序請求郵件服務(wù)器提交所收到郵件的方式,請求郵件服務(wù)器只下載所選中的郵件而不是全部郵件??蛻魴C可先閱讀郵件信息的標(biāo)題和發(fā)送者的名字再決定是否下載這個郵件。imap 通過客戶機的電子郵件程序可在服務(wù)器上創(chuàng)建并管理郵件文件夾或郵箱、刪除郵件、查詢某一封信的一部分或全部內(nèi)容,完成所有這些工作時都不需要把郵件從服務(wù)器下載到個人計算機上。imap 提供操作的三種模式:(1) 在線方式:郵件保留在 mail 服務(wù)器端,客戶端可以對其進(jìn)行管理。其使用方式與 web mail 相類似。(2) 離線方式:郵件保留在 mail 服務(wù)器端,客戶
58、端可以對其進(jìn)行管理。這與 pop協(xié)議一樣。(3) 分離方式:郵件的一部分在 mail 服務(wù)器端,一部分在客戶端。這與一些成熟的組件包應(yīng)用(如 lotus notes/domino)的方式類似?,F(xiàn)在,imap 為很多客戶端電子郵件軟件所采納,如 outlook express、netscape messenger 等,支持 imap 的服務(wù)器端的軟件也越來越多,如criticalpath、eudora、sendmail 等。但是實現(xiàn) imap 也有不足。首先,在利用服務(wù)器磁盤資源方面 imap 不如pop3,由于使用 pop 時服務(wù)器端的郵件被下載到客戶機的同時會刪除,因而不占用額外空間用以存放
59、舊的郵件。而 imap 服務(wù)器將保持舊的郵件,占用了額外空間,而且需要定期地刪除舊郵件。同時,由于用戶查閱信息標(biāo)題和決定下載哪些附件,也需要一定時間,因此連接時間也比 pop 方式長。在應(yīng)用方面,由于 imap 比較復(fù)雜,給開發(fā)者開發(fā)服務(wù)器和客戶機的軟件帶來一些難題。2.2 非技術(shù)手段反垃圾郵件非技術(shù)手段反垃圾郵件垃圾郵件正以每年 5%的速度遞增。這意味著人們每周都會收到數(shù)千封不請自來的電子郵件,這些垃圾郵件不僅消耗了電子郵件網(wǎng)關(guān) 75%的處理能力,使垃圾郵件使得網(wǎng)絡(luò)線路繁忙,服務(wù)器性能大打折扣;而且也浪費了員工的大量時間和精力。 反垃圾郵件成為了當(dāng)前亟待解決的問題。現(xiàn)在非技術(shù)手段有以下幾種:
60、(1) 立法模式。立法模式是由國家和政府主導(dǎo)的模式,這種模式的基本做法是由國家通過立法的方法,從法律上確立網(wǎng)絡(luò)隱私保護(hù)的各項基本原則與各項具體的法律、規(guī)定和制度,并在此基礎(chǔ)上建立相應(yīng)的司法或者行政措施。例如,一旦確認(rèn)某個團(tuán)體或個人發(fā)送垃圾郵件,那他將面臨法律的制裁與處罰。針對目前的垃圾郵件泛濫的形勢,反垃圾郵件立法的呼聲越來越高,但是反垃圾郵件立法也面臨一系列的問題。如垃圾郵件的定義,即到底什么樣的郵件是垃圾郵件。其次就是法律的執(zhí)行問題,即給予什么樣的處罰才是得當(dāng)?shù)?,而且如果缺少國際合作,即使發(fā)現(xiàn)來自境外的垃圾郵件,也無法制裁。(2) 行業(yè)自律模式。行業(yè)控制方面主要是利用實時的黑名單服務(wù)來限制
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國塑料桌布數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國圓頭直澆口熱噴嘴數(shù)據(jù)監(jiān)測研究報告
- 用餐護(hù)理要點勺子的使用準(zhǔn)備兩把勺子勺子放在孩子探頭能夠到的位置等待孩子自主找勺子鼓勵孩子自己使用勺
- 股權(quán)轉(zhuǎn)讓協(xié)議履行瑕疵解決及賠償2025年度合同
- 二零二五年度大學(xué)與企業(yè)就業(yè)合作人才培養(yǎng)協(xié)議
- 二零二五年度智能電網(wǎng)技術(shù)轉(zhuǎn)化合同糾紛調(diào)解辦法
- 2025年度輪胎行業(yè)大數(shù)據(jù)分析與市場預(yù)測合同
- 2025年度網(wǎng)絡(luò)教育平臺教室租用及在線課程服務(wù)協(xié)議
- 2025河北省建筑安全員A證考試題庫附答案
- 2025年度舊房屋拆除工程消防驗收與拆除物處置合同
- 企業(yè)級軟件開發(fā)作業(yè)指導(dǎo)書
- 《中國古代文學(xué)史及作品選II》教學(xué)大綱
- 代工生產(chǎn)合同范本
- 人教版英語2025七年級下冊 Unit1Animal Friends教師版 語法講解+練習(xí)
- DeepSeek新手入門教程
- 課件:《教育強國建設(shè)規(guī)劃綱要(2024-2035年)》學(xué)習(xí)宣講
- 2025年上海市商品交易市場進(jìn)場經(jīng)營合同(2篇)
- 2025年全國幼兒園教師資格證考試教育理論知識押題試題庫及答案(共九套)
- 2024年鄭州電力高等??茖W(xué)校高職單招職業(yè)適應(yīng)性測試歷年參考題庫含答案解析
- 產(chǎn)品試產(chǎn)流程
- 2024年外貿(mào)業(yè)務(wù)員個人年度工作總結(jié)
評論
0/150
提交評論