




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
網(wǎng)頁實訓(xùn)評語總結(jié)第1篇網(wǎng)頁實訓(xùn)評語總結(jié)第1篇關(guān)鍵詞:網(wǎng)頁設(shè)計與制作綜合實訓(xùn)案例教學(xué)任務(wù)驅(qū)動
近年來,隨著我國職業(yè)教育改革的進(jìn)一步深化,計算機(jī)專業(yè)課程改革面臨著進(jìn)一步完善,這就對《網(wǎng)頁設(shè)計與制作》課程改革提出了更高的要求?!毒W(wǎng)頁設(shè)計與制作》課程是中職學(xué)校計算機(jī)應(yīng)用技術(shù)和計算機(jī)網(wǎng)絡(luò)專業(yè)中一門創(chuàng)新性和實踐性很強(qiáng)的專業(yè)課程,要求學(xué)生不但要學(xué)好理論知識,還需要掌握實踐技能,關(guān)鍵是要具有解決實際問題的能力。但是,這樣一門看似簡單好學(xué)的課程,卻經(jīng)常得不到很好的教學(xué)效果。學(xué)生在學(xué)完課程之后,要么設(shè)計結(jié)果達(dá)不到應(yīng)有的功能和視覺效果,要么不能獨(dú)立地進(jìn)行網(wǎng)站規(guī)劃和頁面設(shè)計。因此,筆者在《網(wǎng)頁設(shè)計與制作》課程的教學(xué)實訓(xùn)中,對教學(xué)內(nèi)容、教學(xué)方法、教學(xué)手段、考核方式等進(jìn)行了一些嘗試,收到了良好的效果。
1實訓(xùn)階段
以我校計算機(jī)應(yīng)用專業(yè)為例,《網(wǎng)頁設(shè)計與制作》綜合實訓(xùn)課安排時間為60個課時,以集中訓(xùn)練的方式進(jìn)行。在綜合實訓(xùn)之前,學(xué)生已經(jīng)學(xué)習(xí)理論知識和上機(jī)操作,對課程的重點、難點進(jìn)行了相關(guān)的練習(xí)。筆者在教學(xué)中發(fā)現(xiàn),雖然學(xué)生經(jīng)過指導(dǎo)能夠完成課堂上布置的任務(wù),但是只能根據(jù)規(guī)定的操作步驟進(jìn)行,學(xué)生沒有獨(dú)立設(shè)計和制作網(wǎng)頁的能力。學(xué)生的操作依賴性很強(qiáng),學(xué)習(xí)之后很快就遺忘。針對這些問題,筆者制定了切合實際的實訓(xùn)計劃,主要目的是培養(yǎng)他們團(tuán)隊中協(xié)作能力,獨(dú)力完成所承擔(dān)的網(wǎng)站需求分析、網(wǎng)站規(guī)劃、網(wǎng)頁設(shè)計、綜合測試等工作,從而使學(xué)生牢固掌握所學(xué)知識,實現(xiàn)以技能培養(yǎng)為核心,培育適合當(dāng)前職業(yè)崗位需求的應(yīng)用型、技能型人才。本課程綜合實訓(xùn)如下所示。
實訓(xùn)動員
在綜合教學(xué)實訓(xùn)進(jìn)行前,要做好學(xué)生的學(xué)習(xí)動員工作。一方面,讓學(xué)生明確綜合實訓(xùn)的主要目的是讓學(xué)生通過實踐,了解和掌握網(wǎng)頁設(shè)計與制作的基本方法,通過不斷上機(jī)練習(xí)達(dá)到解決實際問題的能力。因此,集中兩個星期時間使學(xué)生綜合運(yùn)用所學(xué)習(xí)的網(wǎng)頁設(shè)計與制作的知識及以前所學(xué)習(xí)圖形圖像處理等計算機(jī)軟件應(yīng)用方面的知識,根據(jù)網(wǎng)站制作的流程,完成一個綜合的網(wǎng)站,全面鞏固學(xué)生的知識,培養(yǎng)學(xué)生解決實際問題的能力,從而達(dá)到學(xué)以致用的目的。另一方面,讓學(xué)生了解實訓(xùn)的目的和意義、學(xué)習(xí)方法以及考核方式等方面的內(nèi)容。采用展示實際案例效果、歷年網(wǎng)頁設(shè)計與制作競賽獲獎作品、歷屆學(xué)生的優(yōu)秀作品等方式來激發(fā)學(xué)生的學(xué)習(xí)興趣,讓他們積極主動地參與到實訓(xùn)中來。
實訓(xùn)過程
在《網(wǎng)頁設(shè)計與制作》綜合實訓(xùn)教程中,老師的角色是參謀,學(xué)生的角色是任務(wù)的完成者。老師提出項目要求,學(xué)生根據(jù)具體的任務(wù)來完成。我們把一個班的學(xué)生分成10個小組,每個小組4~5人,每個小組選擇一個主題制作網(wǎng)站,綜合運(yùn)用前面所學(xué)的知識和相關(guān)的技術(shù)共同完成。
基本知識回顧
這部分的要求是溫習(xí)網(wǎng)頁制作課程的重點難點,使學(xué)生對Dreamweaver各方面的操作知識系統(tǒng)的由“片”的認(rèn)識轉(zhuǎn)向“面”的認(rèn)識。
案例作品賞識
在網(wǎng)頁設(shè)計過程中,經(jīng)驗豐富的設(shè)計師需要博采眾家之所長,形成自己的風(fēng)格,而對于初學(xué)者來說,模仿是最容易收到效果的方法。大量欣賞優(yōu)秀的網(wǎng)站作品并不斷地分析、比較,會使學(xué)生的各種能力逐漸增長和提高。通過展示歷年中職學(xué)校職業(yè)技能競賽中網(wǎng)頁設(shè)計與制作項目中的獲獎作品、歷屆學(xué)生的優(yōu)秀作品等手段來提起學(xué)生的學(xué)習(xí)興趣,吸引學(xué)生積極主動地參與實訓(xùn)。
案例模仿操作練習(xí)
從歷屆學(xué)生的優(yōu)秀作品中選擇一個典型的案例,讓學(xué)生作為網(wǎng)頁設(shè)計與制作知識的回顧。例如,對一個旅游網(wǎng)站進(jìn)行解析,使學(xué)生了解制作網(wǎng)站的基本方法,讓學(xué)生對旅游網(wǎng)站的粗略和宏觀認(rèn)識得到細(xì)化,使學(xué)生懂得如何獨(dú)立面對旅游網(wǎng)站進(jìn)行需求分析、站點規(guī)劃和設(shè)計。
作品的選擇、網(wǎng)站需求分析、站點規(guī)劃
在綜合實訓(xùn)中,首先要求各小組學(xué)生選擇一個網(wǎng)站主題,主題一般選擇如下內(nèi)容:校園生活、教育、體育、旅游、電子商務(wù)等。然后,小組成員開始著手進(jìn)行網(wǎng)站需求分析,設(shè)計整個網(wǎng)站的框架,選定要設(shè)計和制作的各部分內(nèi)容,由組長組織完成一份完整的網(wǎng)站規(guī)劃書。在此過程中,老師要適當(dāng)指導(dǎo),要求學(xué)生獨(dú)立完成,設(shè)計出有具有本組特色的網(wǎng)站。最后,由組長給本組成員進(jìn)行網(wǎng)站設(shè)計與制作任務(wù)分配,分頭搜集素材并進(jìn)行整理。
網(wǎng)站色彩搭配
網(wǎng)站的色彩就像人的外表一樣,如果打扮得美觀大方,就會給人一種魅力四射的感受,而不修邊幅則讓人感到粗糙毛草,所以,網(wǎng)頁的色彩搭配將直接影響訪問者對網(wǎng)站的印象。網(wǎng)頁配色有著很強(qiáng)的藝術(shù)性,不同的色彩搭配方案就會讓人產(chǎn)生不一樣的感受。對于初學(xué)者來說,模仿是最容易看到效果的方法。在站點規(guī)劃完成的基礎(chǔ)上,選擇網(wǎng)站的主色調(diào)和學(xué)習(xí)色彩搭配。主頁的色彩處理得好,可以錦上添花,達(dá)到事半功倍的效果。色彩總的應(yīng)用原則應(yīng)該是“總體協(xié)調(diào),局部對比”,也就是:主頁的整體色彩效果應(yīng)該是和諧的,只有局部的、小范圍的地方可以有一些強(qiáng)烈色彩的對比。由于中職生英語、數(shù)學(xué)等文化基礎(chǔ)較差,編程對他們來說難度太大,他們走上工作崗位后一般不會從事程序開發(fā)工作,大多數(shù)學(xué)生畢業(yè)后從事的是網(wǎng)站美工等,因此,應(yīng)該在網(wǎng)頁美工等方面加強(qiáng)培養(yǎng)。
網(wǎng)頁實訓(xùn)評語總結(jié)第2篇筆者以實現(xiàn)深網(wǎng)信息自動化獲取為研究目標(biāo),從面向深網(wǎng)資源的搜索提取方法、面向?qū)嶓w層Web的信息索引和分類技術(shù)、面向用戶的信息檢索平臺建設(shè)3個技術(shù)層面展開研究,有計劃地將大量無序的特色網(wǎng)絡(luò)資源實現(xiàn)自有化并得以快捷利用。
1基于半監(jiān)督順序回歸模型的爬蟲算法
在資源搜索方面,將搜索目標(biāo)設(shè)定為通常無法訂購但軍事特種醫(yī)院特點鮮明的特色資源。通常,這些網(wǎng)絡(luò)資源都是以深網(wǎng)的方式存儲,并且無法直接獲取。為此,筆者研究了面向深網(wǎng)的信息提取技術(shù),研究并實現(xiàn)了一種面向軍事特種醫(yī)院資源的基于半監(jiān)督順序回歸模型的快速爬蟲算法。此算法主要包括以下3個步驟:首先,根據(jù)軍事特種醫(yī)院網(wǎng)站資源的特點,利用半監(jiān)督順序回歸的方法構(gòu)造深網(wǎng)頁面分類器,定義所需的主題相關(guān)的網(wǎng)頁分為N個不同的層次。此時層次的數(shù)量級根據(jù)所給定網(wǎng)站資源特點設(shè)定。一般情況下,N≤4。其次,構(gòu)造深網(wǎng)鏈接信息抽取器,抽取對應(yīng)N層次的有效鏈接。在提取這些鏈接信息時,采用多線程的方法完成。最后,把深網(wǎng)頁面分類器的分類作為指導(dǎo),形成特征庫,利用讓爬蟲自動提取滿足要求的鏈接特征,快速實時地找到各層有效鏈接。對于爬行過程而言,筆者具體采用如下方法:在開始爬行前,把預(yù)先定義的符合特種醫(yī)院資源信息的種子放入最低層的鏈接隊列中,鏈接信息提取器從深網(wǎng)頁面中抽取滿足特點規(guī)則的鏈接信息,包括鏈接的網(wǎng)址、頁面標(biāo)題,鏈接的錨屬性等信息,并同時交付鏈接特征學(xué)習(xí)器。在鏈接特征學(xué)習(xí)器中,筆者將采用深度機(jī)器學(xué)習(xí)方法,將這些特征進(jìn)行歸類、分析。然后,按照上述方法,將所有N層隊列中的鏈接進(jìn)行爬行。對于同一層次的鏈接,根據(jù)預(yù)先定義的規(guī)則讓距離網(wǎng)站主頁近的鏈接先爬行。這樣,既可以爬行到最佳的鏈接,又保證讓所有的鏈接都被爬行到。系統(tǒng)運(yùn)行結(jié)果表明筆者提出的爬行策略能夠提取深網(wǎng)中有效鏈接的基本特征,并過濾掉無關(guān)鏈接,提高了爬蟲的速度和準(zhǔn)確度。
2面向?qū)嶓w層Web的信息索引技術(shù)
采用高效的爬蟲技術(shù)從DeepWeb上抽取出的軍事特種醫(yī)院特點鮮明的特色資源之后,將其存儲在本地數(shù)據(jù)庫中。對于索引而言,由于軍事特種醫(yī)院信息的特色,其索引對象可表示為Web實體(WebEntity)。Web實體通常具有各種屬性,并由屬性進(jìn)行描述。如海軍信息、潛水艇實體,具有長、寬、重量、下水深度等屬性,可以將軍事特種醫(yī)院信息劃歸為多種不同實體。顯然,進(jìn)行實體搜索,索引的對象為實體而非頁面,其索引域為實體的各個屬性。用戶進(jìn)行檢索時,搜索器根據(jù)搜索關(guān)鍵字來查詢實體索引域,然后進(jìn)行綜合排序?;诖?,筆者提出了一種基于迭代和組合的信息抽取方法,實現(xiàn)Web實體的信息抽取及其索引建立。整個基于迭代和組合的信息抽取和索引方法實現(xiàn)框架圖。為實現(xiàn)此信息抽取方法,首先生成簡單的頁面索引。頁面層的索引技術(shù),主要采用基于關(guān)鍵字的倒排排序方法,然后再對其按實體關(guān)鍵屬性進(jìn)行分類。其次,采用學(xué)習(xí)和深度搜索的方法抽取基本實體屬性信息。在該過程,首先利用基于反饋的條件隨機(jī)域模型來抽取實體的屬性信息,之后通過快速排序及其深度搜索方法窮盡搜索包含某些特定實例的所有頁面集。采用基于反饋的條件隨機(jī)域模型的基本思想是先從已有的實體集中構(gòu)造訓(xùn)練數(shù)據(jù)集,采用預(yù)先定義的規(guī)則對訓(xùn)練數(shù)據(jù)集中的頁面進(jìn)行有條件的標(biāo)注,然后進(jìn)行模型訓(xùn)練。在訓(xùn)練中,筆者采用基于反饋的方式進(jìn)行,即通過已有的訓(xùn)練結(jié)果對訓(xùn)練模型進(jìn)行反饋,提高訓(xùn)練的速度和效率,最終使得抽取精度較高。最后,在迭代抽取和組合集成過程中,采用方法的基本原理是:對所有的待抽取頁面集,進(jìn)行用戶交互定義的頁面快速分割,將頁面分割成多個不同的部分。然后,根據(jù)實體模型,對于還未抽取的相關(guān)實體屬性,采用上述的抽取方法進(jìn)行迭代抽取,并將抽取的數(shù)據(jù)結(jié)果集成在一起,最后構(gòu)成一個完整可信的信息實體。
3面向用戶的分布式信息檢索平臺建設(shè)
在此分布式信息檢索平臺建設(shè)中,根據(jù)用戶的需求,采用上述相關(guān)關(guān)鍵技術(shù),設(shè)計了一個面向用戶的分布式信息檢索平臺。本平臺的后端服務(wù)器采用主從分布式架構(gòu)。本檢索平臺由3個主要部分構(gòu)成,分別為:總體控制服務(wù)器、半監(jiān)督順序回歸爬蟲服務(wù)器和迭代與組合實體索引檢索服務(wù)器。其中,總體控制服務(wù)器主要負(fù)責(zé)整個爬蟲系統(tǒng)的整體控制管理、各個服務(wù)器之間消息的發(fā)送、傳遞以及任務(wù)的分配等等;半監(jiān)督順序回歸爬蟲服務(wù)器主要負(fù)責(zé)爬行深網(wǎng),下載軍事特種醫(yī)院信息網(wǎng)頁,并抽取網(wǎng)頁中包含的各種實體信息;索引檢索服務(wù)器主要負(fù)責(zé)接收采集到的特種醫(yī)院軍事等實體信息,并以建立索引,為用戶提信息搜索等服務(wù)。此外,為了保證系統(tǒng)運(yùn)行的可靠性,總體控制服務(wù)器和迭代與組合實體索引檢索服務(wù)器均采用了雙機(jī)熱備份的方式,以維護(hù)服務(wù)器和對應(yīng)的備用服務(wù)器之間數(shù)據(jù)的同步。本系統(tǒng)中的控制服務(wù)器是采用按用戶指定的靜態(tài)任務(wù)分配模式來進(jìn)行網(wǎng)頁采集,所以控制服務(wù)器和它的備用服務(wù)器之間的通信量不會太大,之間的數(shù)據(jù)同步壓力并不大,從而可以解決主從式分布爬蟲系統(tǒng)中控制服務(wù)器的效率瓶頸問題。
二總結(jié)
網(wǎng)頁實訓(xùn)評語總結(jié)第3篇第一部分:封面(格式見附件1)
頁面第三行起:頂崗實訓(xùn)總結(jié)報告,一號字黑體居中;頁面第十六行起:黑龍江林業(yè)職業(yè)技術(shù)學(xué)院經(jīng)濟(jì)管理系,小二號字宋體居中;頁面第十七行起:專業(yè)、班級、姓名小二號字宋體居中;頁面第十八行起:年月日,小二號字宋體居中。
第二部分:標(biāo)題:××專業(yè)××級頂崗實訓(xùn)總結(jié)報告
要求:××專業(yè)××級為宋體三號字居中;頂崗實訓(xùn)總結(jié)報告為黑體二號字加粗居中。
第三部分:正文:宋體四號字
一、實訓(xùn)單位基本情況(200字以內(nèi))
二、實訓(xùn)過程總結(jié)(800至1000字)
三、主要收獲(500字以內(nèi))實習(xí)報告網(wǎng)
四、實訓(xùn)過程中存在的主要問題和建議(300字以內(nèi))
五、專業(yè)、班級
六、本人簽名
七、年月日
第四部分:實訓(xùn)單位評價(單置一頁,格式見附件2):由實訓(xùn)單位人力資源管理部門或服務(wù)部門主管做出實訓(xùn)鑒定并蓋章。
第五部分:經(jīng)濟(jì)管理系評價(單置一頁空白,格式見附件3)
全文采用A4紙正版打印。
網(wǎng)頁實訓(xùn)評語總結(jié)第4篇關(guān)鍵詞:文本自動分類分類算法特征抽取
1介紹
面對目前Internet上存在的數(shù)以萬計的WWW服務(wù)器,以及在其中存儲著的極其豐富的信息資源,如何解決用戶在應(yīng)用各種搜索引擎查找信息時,搜索引擎返回給用戶的網(wǎng)頁信息數(shù)目過多、范圍過廣的問題,就是如何讓用戶一目了然哪些是對自己“有用的”的網(wǎng)頁信息,哪些是對自己“無用的”或是用處不大的網(wǎng)頁信息,是非常重要的。
文本分類是指按照預(yù)先定義的主題類別,為文檔集合中的每個文檔確定一個類別。網(wǎng)頁的自動分類,一方面,可以將網(wǎng)頁按類分別建立相應(yīng)的數(shù)據(jù)庫,對分類數(shù)據(jù)庫進(jìn)行查詢,提高文章的查全率和查準(zhǔn)率;另一方面,可以建立自動的分類信息資源,為用戶提供分類信息目錄。
2文本分類
自動歸類的一般做法是,預(yù)先確定好文本類別,并且對每個文本類別提供一批預(yù)先分好類的文本(稱為訓(xùn)練文本集),分類系統(tǒng)先通過訓(xùn)練文本集學(xué)習(xí)分類知識,在實際分類時,再根據(jù)學(xué)習(xí)到的分類知識為需要分類的文本確定一個或多個文檔類別。自動聚類是指文本聚類,即對給定的待分類文本集利用聚類方法(主要有凝聚法和分解法)將其劃分為多個類別。自動聚類系統(tǒng)不需要訓(xùn)練文本,劃分出的文檔類也是不確定的。本文研究的文本自動分類是指在給定類別體系下的文本自動歸類。
文本分類的定義
文本分類就是將一個二元組映射到一個布爾值的任務(wù)。其中是所討論的文檔的集合,是預(yù)先定義的類別的集合。如果將二元組映射為值,則認(rèn)為文檔屬于類別,否則認(rèn)為文檔不屬于類別。
更形式化的說,假設(shè)有個未知的目標(biāo)函數(shù),這個函數(shù)能夠?qū)⑷我庖粋€文本準(zhǔn)確的分類。文本分類就是要找到一個函數(shù)使得它的結(jié)果能夠盡可能的與接近。
根據(jù)應(yīng)用的需要,可以給文本分類加以不同的約束。例如可能需要這樣一個分類器,對給定的整數(shù),每個文檔需要分類到中的個不同的類別中。
時,即一個文檔只能分給一個類別,這樣的分類稱為單類別分類,而如果一個文檔可以分給中的任意類別,這樣的分類稱為多類別分類。單類別分類的一個特例就是二值分類,即對任意一個文檔,要么屬于類別,要么不屬于類別(這時屬于類別的補(bǔ)集)。
自動分類過程
文檔的自動分類可以描述為如下過程:抽取文檔特征,將文檔表示為統(tǒng)一的標(biāo)準(zhǔn)方式;使用分類器判斷文檔所屬類別,分類器是分類系統(tǒng)的核心,可以通過學(xué)習(xí)不斷改進(jìn)和完善,包括:增加、更新類別和知識(訓(xùn)練分類器)即:是類別集合;是所有文檔集合;是訓(xùn)練文檔集合;;是文檔特征向量空間;是文檔;是映射,將文檔轉(zhuǎn)換為特征向量;是已知的映射,訓(xùn)練集合中的文檔已經(jīng)分好了類。
文檔分類模型
文本分類由訓(xùn)練模塊和分類模塊構(gòu)成。在訓(xùn)練模塊,首先將訓(xùn)練文本集向量化,得到的特征的集合;特征子集抽取算法從特征的全集中抽取一個最優(yōu)的特征子集;這里的“最優(yōu)”子集是由評價算法來判定的,它根據(jù)分類器對由特征子集所表示的訓(xùn)練文本進(jìn)行分類,并對分類性能進(jìn)行性能評價。在分類模塊中,遵循先將測試文本用最優(yōu)特征子集表示,再經(jīng)分類器分類。文本分類模型如圖1所示。
圖1文本分類模型
3文本分類研究
自動分類實現(xiàn)的方法
進(jìn)行網(wǎng)頁文本分類研究的首要任務(wù)就是確定實驗所需的網(wǎng)站,并將這些網(wǎng)站組成集合。之后將會檢測這些網(wǎng)站是否含有信息標(biāo)簽以及其信息標(biāo)簽是否有效。收集所需網(wǎng)站的方法是收集用戶日常生活中登錄的網(wǎng)址數(shù)據(jù),比如可以利用網(wǎng)絡(luò)記錄列表來得到訪問網(wǎng)站的名單。這樣可以“覆蓋”更多的網(wǎng)站;因為網(wǎng)址導(dǎo)航頁一般不包括含有騷擾信息的網(wǎng)站,而這些網(wǎng)站又是進(jìn)行實驗所必需的。收集日常實際數(shù)據(jù)的另一個優(yōu)勢就是可以更好的反映出實際用戶的行為,還能夠更大程度的接觸到一些網(wǎng)址導(dǎo)航頁中所不包含的信件網(wǎng)站。本文是在此基礎(chǔ)上,通過手工輸入簡歷訓(xùn)練集和被測試集,從而達(dá)到模擬真實分類的效果。
應(yīng)用Bayes算法實現(xiàn)文本分類
簡單貝葉斯模型假定特征向量的各分量間相對于決策變量是相對獨(dú)立的,也就是說各分量獨(dú)立地作用于決策變量。盡管這一假定一定程度上限制了簡單貝葉斯模型的適用范圍,然而在實際應(yīng)用中,不僅以指數(shù)級降低了貝葉斯網(wǎng)絡(luò)構(gòu)建的復(fù)雜性,而且在許多領(lǐng)域,在違背這種假定的條件下,簡單貝葉斯也表現(xiàn)出相當(dāng)?shù)慕研院透咝?,貝葉斯定理告訴我們?nèi)绾瓮ㄟ^給定的訓(xùn)練樣本集預(yù)測未知樣本的類別,它的預(yù)測依據(jù)是取后驗概率最大的類別。
Bayes算法的基本思路是,計算網(wǎng)頁屬于類別的概率,網(wǎng)頁屬于類別的幾率等于網(wǎng)頁中每個詞屬于類別的幾率的綜合表達(dá)式。具體算法步驟如下:
(1)對訓(xùn)練網(wǎng)頁和測試網(wǎng)頁分別進(jìn)行預(yù)處理和分詞(采用的全自動詞典切詞方法),抽取特征項。
(2)計算特征詞屬于每個類別的幾率向量,公式如式(1)所示。
(1)
其中,為該類的訓(xùn)練網(wǎng)頁數(shù),為詞在中的詞頻,為總詞數(shù)。
(3)在新網(wǎng)頁到達(dá)時,根據(jù)特征詞分詞,然后按公式(2)計算該網(wǎng)頁屬于類的幾率。
(2)
其中,是訓(xùn)練網(wǎng)頁數(shù)/總訓(xùn)練網(wǎng)頁數(shù),為相似含義,為類的總數(shù),為在中的詞頻,為特征總數(shù)。
(4)進(jìn)行網(wǎng)頁分類。
在頭文件()中定義了私有數(shù)據(jù)成員和訓(xùn)練文本集,核心代碼如下:
//訓(xùn)練文本中所有不同單詞的集合
setm_Vocabulary;
//第一個值記錄分類名,第二個值記錄每個特征值和它出現(xiàn)的次數(shù)
mapm_KeyGather;
//記錄每個分類的樣本值
MapTypem_ClassStyle;
//記錄每個類別中各個單詞的數(shù)量
MapTypem_CharNum;
系統(tǒng)應(yīng)用效果
有兩個重要的指標(biāo)來評價和測試文本自動分類算法,查全率和查準(zhǔn)率。查全率的公式如公式(3)所示。
(3)
其中為通過分類算法被正確分類為C類的文本數(shù)目,為未分類文本之前屬于C類的文本的數(shù)目。
查準(zhǔn)率的公式如公式(4)所示。
(4)
表1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 出售學(xué)校學(xué)區(qū)房合同范本
- 一建培訓(xùn)合同范本
- 年度供貨合同范本
- 供銷總社采購合同范例
- 勞動工人合同范本
- 公司合作簽合同范本
- 中央新風(fēng)合同范本
- 加盟飯店合同范本
- 中介房租合同范本
- app項目轉(zhuǎn)讓合同范本
- 社會階層與教育選擇行為分析-深度研究
- 社會工作行政(第三版)課件匯 時立榮 第6-11章 項目管理- 社會工作行政的挑戰(zhàn)、變革與數(shù)字化發(fā)展
- 學(xué)校小賣部承包合同范文
- 2025年湘潭醫(yī)衛(wèi)職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測試近5年常考版參考題庫含答案解析
- 2025年湖南鐵道職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測試近5年常考版參考題庫含答案解析
- DB 63- T993-2011 三江源生態(tài)監(jiān)測技術(shù)規(guī)范
- 北京市東城區(qū)2025年公開招考539名社區(qū)工作者高頻重點提升(共500題)附帶答案詳解
- 2025福建福州地鐵集團(tuán)限公司運(yùn)營分公司校園招聘高頻重點提升(共500題)附帶答案詳解
- 2025至2030年中國電子護(hù)眼臺燈數(shù)據(jù)監(jiān)測研究報告
- 兒童睡眠障礙治療
- 2025年浙江省溫州樂清市融媒體中心招聘4人歷年高頻重點提升(共500題)附帶答案詳解
評論
0/150
提交評論