廈門大學(xué)本科生畢業(yè)論文標(biāo)準(zhǔn)模板示范_第1頁
廈門大學(xué)本科生畢業(yè)論文標(biāo)準(zhǔn)模板示范_第2頁
廈門大學(xué)本科生畢業(yè)論文標(biāo)準(zhǔn)模板示范_第3頁
廈門大學(xué)本科生畢業(yè)論文標(biāo)準(zhǔn)模板示范_第4頁
廈門大學(xué)本科生畢業(yè)論文標(biāo)準(zhǔn)模板示范_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、(小二號宋體)本 科 畢 業(yè) 論 文(二號黑體)(主修 / 輔修專業(yè))(三號宋體)面向非結(jié)構(gòu)化企業(yè)指標(biāo)信息的智能處理和可視分析Indicators of the Unstructured Enterprise Information for Intelligence Processing and Visualization姓 名: 學(xué) 號:學(xué) 院: 系:專 業(yè):年 級:校內(nèi)指導(dǎo)教師: (姓名) (職稱)(三號Times New Roman加粗)校外指導(dǎo)教師: (姓名) (職稱)小三號宋體(四號宋體)二XX 年 六 月廈門大學(xué)本科學(xué)位論文誠信承諾書本人呈交的學(xué)位論文是在導(dǎo)師指導(dǎo)下獨立完成的研究成

2、果。本人在論文寫作中參考其他個人或集體已經(jīng)發(fā)表的研究成果,均在文中以適當(dāng)方式明確標(biāo)明,并符合相關(guān)法律規(guī)范及廈門大學(xué)本科畢業(yè)論文(設(shè)計)規(guī)范。該學(xué)位論文為( )課題(組)的研究成果,獲得( )課題(組)經(jīng)費或?qū)嶒炇业馁Y助,在( )實驗室完成(請在以上括號內(nèi)填寫課題或課題組負(fù)責(zé)人或?qū)嶒炇颐Q,未有此項聲明內(nèi)容的,可以不作特別聲明)。另外,本人承諾輔修專業(yè)畢業(yè)論文(設(shè)計)(如有)的內(nèi)容與主修專業(yè)不存在相同與相近情況。學(xué)生聲明(簽名): 年 月 日封面之后、正文之前的頁碼用羅馬數(shù)字表示。(小三號黑體)致 謝(小四號宋體)值此論文完成之際,謹(jǐn)向所有關(guān)心和支持我的人們致以誠摯的謝意!首先,我要衷心地感謝我

3、的導(dǎo)師XXX教授。從論文選題、內(nèi)容和整體結(jié)構(gòu)的確定,到直至最后定稿,XXX老師都以極其負(fù)責(zé)的態(tài)度給予悉心指導(dǎo),為我提出了許多寶貴的意見和建議,使我獲益良多。他淵博的學(xué)識、嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度以及樸實的學(xué)術(shù)作風(fēng)時刻激勵我不斷努力完善自己,對我的悉心關(guān)懷和教誨也將鼓舞我在今后的學(xué)習(xí)和工作上不斷努力向上。在此,謹(jǐn)向XXX老師致以最誠摯的感謝!其次,還要感謝與我一起完成這個項目的所有團(tuán)隊成員。沒有他們的幫助和共同努力,就沒有項目的圓滿成功,也就不會有本文的形成。在此,向他們表示衷心的感謝!(小三號黑體)摘 要(小四號宋體)隨著信息的發(fā)展,出現(xiàn)了越來越多的非結(jié)構(gòu)化信息。并且非結(jié)構(gòu)化信息在政府和企業(yè)等的決策中扮

4、演著重要的角色。如何將非結(jié)構(gòu)化數(shù)據(jù)有效的管理起來,能夠進(jìn)行數(shù)據(jù)和知識挖掘,提取當(dāng)中的隱含信息,提供一種形象的可視分析,為政府和企業(yè)決策提供支持成為當(dāng)今亟待解決的主要問題。本文以北京市科委的指數(shù)統(tǒng)計文檔為研究對象,主要任務(wù)是針對以北京市科委的指數(shù)統(tǒng)計文檔為代表的非結(jié)構(gòu)化信息的抽取和企業(yè)指標(biāo)信息的可視分析。主要工作包括三個方面:第一,設(shè)計了一套以北京市科委的指數(shù)統(tǒng)計文檔編寫規(guī)范為標(biāo)準(zhǔn)的確實可行的信息抽取算法;第二,針對抽取出來的指標(biāo)信息,借助于Dundas可視化工具進(jìn)行可視分析;第三,完成了一個滿足客戶需求的企業(yè)信息庫管理系統(tǒng)。(小四號宋體)(小四號黑體)論文從項目背景出發(fā),介紹了系統(tǒng)開發(fā)的背景和

5、研究價值。然后,詳細(xì)介紹了企業(yè)指標(biāo)信息智能處理的可行性和算法設(shè)計,以及企業(yè)指標(biāo)信息可視分析的原理及其實現(xiàn)。再次,論文詳細(xì)闡述了系統(tǒng)的需求,具體介紹了企業(yè)信息庫管理系統(tǒng)的設(shè)計及其實現(xiàn),最后論文針對企業(yè)信息庫管理系統(tǒng)進(jìn)行了分析和評價,并指明了下一步的改進(jìn)計劃。關(guān)鍵詞:非結(jié)構(gòu)化信息;信息可視化;可視分析(小三號Times New Roman加粗)Abstract(小四號Times New Roman)With the development of information, there has been an increasing number of unstructured information.

6、 And it plays an important role in decision of government and enterprise, etc. How to manage the unstructured information efficiently, mine the data and knowledge, extract the implicit information, provide a visual image analysis, and then support the government and enterprise's decision have be

7、come the main issues to be settled urgently. In this question for discussion, we mainly have a research in indicator of enterprise documents from the Beijing Science and Technology Commission and try to obtain the indicators of the unstructured information, and then provide a visual image analysis.

8、It includes three aspects: First, to design a set of practical information extraction algorithm; second, through the use of the Dundas Chart toolbox, providing visual analysis; third, completed Enterprise Information Management System which meet customers requirement.(小四號Times New Roman加粗)(小四號Times

9、New Roman)The beginning of the dissertation introduced the background of the project, introduced the background of the system and research value. Second, detailing information extraction algorithms and principles of Information Visualization. Third, the dissertation elaborated the system's requi

10、rement, specifically introduced the system design and implementation. Finally, some possible improvements and future works were presented.Key words: Unstructured Information; Information Visualization; Visual Analysis(四號黑體)目 錄(小四號黑體)(小三號黑體)1 緒論11.1 問題背景及意義1 1.2 研究內(nèi)容和方法1.3 論文組織結(jié)構(gòu)22 系統(tǒng)相關(guān)技術(shù)概述4(小四號宋體)2.

11、1 非結(jié)構(gòu)化信息處理42.1.1 非結(jié)構(gòu)化信息管理概述4信息抽取技術(shù)52.2 信息可視化72.3 其它系統(tǒng)技術(shù)介紹82.3.1 ASP.NET簡介82.3.2 ASP.NET AJAX簡介92.3.3 ASP.NET Ajax Control Toolkit組件112.3.4 Dundas Chart工具箱簡介122.4 本章小結(jié)143 非結(jié)構(gòu)化信息處理和可視分析163.1 企業(yè)指標(biāo)信息統(tǒng)計分析設(shè)計方案163.2 企業(yè)指標(biāo)信息的智能處理17企業(yè)指標(biāo)信息文檔的結(jié)構(gòu)分析17指標(biāo)信息的提取算法設(shè)計24指標(biāo)值的提取算法設(shè)計333.3 信息可視化的設(shè)計方案34信息可視分析過程模型34基于Dundas的信

12、息可視分析設(shè)計363.4 本章小結(jié)384 企業(yè)信息庫管理系統(tǒng)的實現(xiàn)394.1 系統(tǒng)概述及功能39開發(fā)背景與系統(tǒng)目標(biāo)394.1.2 系統(tǒng)功能和模塊劃分404.2 系統(tǒng)的框架設(shè)計424.3 指數(shù)統(tǒng)計模塊的實現(xiàn)43統(tǒng)計分析模塊的實現(xiàn)43問卷管理模塊的實現(xiàn)454.4 文檔資源庫模塊的實現(xiàn)464.5 系統(tǒng)維護(hù)模塊的實現(xiàn)48用戶管理子模塊的實現(xiàn)48角色管理子模塊的實現(xiàn)49文檔類型定義子模塊的實現(xiàn)49數(shù)據(jù)庫備份&還原的實現(xiàn)494.7 本章小結(jié)495 系統(tǒng)測試及運行結(jié)果505.1 系統(tǒng)測試505.2 運行結(jié)果50統(tǒng)計分析模塊的運行結(jié)果50問卷管理模塊的運行結(jié)果52文檔資源庫模塊的運行結(jié)果54用戶管理子

13、模塊的運行結(jié)果55角色管理子模塊的運行結(jié)果56文檔類型定義子模塊的運行結(jié)果57數(shù)據(jù)庫備份&還原的運行結(jié)果585.2.8 改善用戶體驗的工作595.3 本章小結(jié)606 結(jié)論616.1 論文總結(jié)616.2 工作展望62參考文獻(xiàn)63致 謝64(四號Times New Roman加粗)(小三號Times New Roman加粗)Content除專業(yè)名詞外,英文目錄標(biāo)題第一個單詞的首字母須大寫,其余小寫。Chapter 1 Introduction11.1 Introduction11.2 The structure of this dissertation2Chapter 2 Literatu

14、re review4(小四號Times New Roman加粗)2.1 Unstructured information management42.1.1 Introduction of unstructured information42.1.2 Information extraction52.2 Information visualization72.3 Other related technologies introduce82.3.1 Introduction of ASP.NET8(小四號Times New Roman)2.3.2 Introduction of ASP.NET A

15、JAX92.3.3 ASP.NET Ajax Control Toolkit112.3.4 Dundas Chart Toolkit122.4 Summary14Chapter 3 Unstructured information management and visulization163.1 The design philosophy of enterprise indicators163.2 The design philosophy of enterprise indicators extraction17 The statistics documents structure anal

16、ysis17 The statistics information extraction algorithm24 The value of statistic extraction algorithm333.3 The design philosophy of information visualization35 Information visualization model35 Information visualization base on Dundas Chart Toolkit363.4 Summary38Chapter 4 Implementation of Enterprise

17、 Infromation Management394.1 System profiler and function39 Development background and overall objective394.1.2 Functional requirements and module division404.2 System architecture424.3 Indicators of statistics module design43 Statistical Analysis module design 43 Questionnaire management module des

18、ign454.4 Document management module design464.5 System maintenance module design48 User management sub-module design48 Role management sub-module design49 Document attribute management sub-module design49 Database backup and restore494.7 Summary49Chapter 5 System testing and the running results505.1

19、 System testion505.2 Running results50 Statistical Analysis module running results50 Questionnaire management module running results52 Document management module running results54 User management module running results55 Role management module running results56 Document attribute management module r

20、unning results57 Database backup and restore running results585.2.8 Improve the system-experience595.3 Summary60Chapter 6 Conclusions and future works616.1 Conclusions of the dissertation616.2 Future works62References63Acknowledgements64(正文從另右頁開始;奇數(shù)頁頁眉為當(dāng)前章名,小五號宋體。)(四號黑體)(小三號黑體)1 緒論1.1問題及其意義(小四號宋體,1.

21、5倍行間距,兩端對齊)隨著計算機技術(shù)的發(fā)展,使海量信息得以存在并迅猛發(fā)展。尤其是信息技術(shù)的日益普及其應(yīng)用以后,隨著各個行業(yè)的信息系統(tǒng)的規(guī)模的日益擴大,信息系統(tǒng)在長年累月的運轉(zhuǎn)過程中,積累了龐大的數(shù)據(jù)資源。然而決策者卻很難利用這些數(shù)據(jù)資源,為企業(yè)和政府的決策提供確實有效的幫助。這是因為一方面,在這龐大的數(shù)據(jù)資源中,非結(jié)構(gòu)化信息占據(jù)了主要部分。Gartner的一項調(diào)查顯示,在今天的社會中,有80% 以上的商業(yè)行為依賴于非結(jié)構(gòu)化信息;我們所存儲的數(shù)據(jù)中,85%以上是非結(jié)構(gòu)化信息;每過三個月,我們周圍的非結(jié)構(gòu)化信息就會增加一倍1。這些數(shù)據(jù)充分說明,我們周圍信息的形態(tài)是以非結(jié)構(gòu)化信息為絕對主體的,也可以

22、說我們接觸到的信息中絕大部分是非結(jié)構(gòu)化信息。因此對非結(jié)構(gòu)化信息進(jìn)行管理,能夠進(jìn)行數(shù)據(jù)和知識挖掘,提取當(dāng)中的隱含信息,對決策進(jìn)行支持成為當(dāng)今亟待解決的主要問題2。另一方面,隨著信息技術(shù)的發(fā)展,信息結(jié)構(gòu)越來越復(fù)雜,信息更新越來越快,信息規(guī)模越來越大,給人們獲取信息、理解信息、掌握信息帶來了沉重的負(fù)擔(dān),常常導(dǎo)致“認(rèn)知過載”、“視而不見”34順序編碼制參考文獻(xiàn)的標(biāo)注方式:數(shù)字加方括號在右上角,置于句號之前。(正文之后的頁碼用阿拉伯?dāng)?shù)字連續(xù)編碼,小五號Times New Roman。)北京市科學(xué)技術(shù)委員會在企業(yè)指標(biāo)信息統(tǒng)計分析工作上就存在這兩方面的問題,文獻(xiàn)5介紹了這方面的工作。每年北京市科委都要對北京

23、市企業(yè)進(jìn)行企業(yè)指標(biāo)信息的調(diào)查,在長年累月的積累過程中,北京市科委積累了大量的企業(yè)指標(biāo)調(diào)查表、項目立項、執(zhí)行、驗收等文檔。這些調(diào)查表以word形式保存起來,并且調(diào)查指標(biāo)的方式也呈現(xiàn)多樣化,存在選擇、填空、表格、問答以及這些題目的復(fù)合等形式。而且企業(yè)指標(biāo)的調(diào)查涵蓋范圍也很廣泛,從企業(yè)性質(zhì)及登記情況到企業(yè)財務(wù)及信息化投入狀況,再到人力狀況及信息化支撐狀況,到企業(yè)信息化基礎(chǔ)設(shè)施建設(shè)狀況、企業(yè)信息化應(yīng)用情況,甚至涉及到企業(yè)對信息化工程的滿意程度的調(diào)查。面對海量的非結(jié)構(gòu)化企業(yè)指標(biāo)信息,北京市科委每年都要投入大量的人力、物力、精力,將企業(yè)指標(biāo)信息從word文檔中手工提取出來,形成計算機可以識別的結(jié)構(gòu)化的表格

24、信息,再對企業(yè)指標(biāo)信息進(jìn)行統(tǒng)計分析。即使是這樣,仍然存在許多問題:第一,手工抽取企業(yè)信息調(diào)查表耗時較長,工作強度大。第二,手工抽取數(shù)據(jù)信息容易出現(xiàn)錯誤,準(zhǔn)確性不能得到有效保證,而且一旦出錯,就有可能導(dǎo)致整個統(tǒng)計分析結(jié)果的錯誤,進(jìn)行核對非常困難。第三,即使是將企業(yè)指標(biāo)信息全部準(zhǔn)確轉(zhuǎn)成計算機可以識別的表格數(shù)據(jù)以后,由于數(shù)據(jù)的多樣性,缺少形象的對企業(yè)指標(biāo)信息的統(tǒng)計分析工具。(偶數(shù)頁頁眉為論文題目,小五號宋體。)針對北京市科委的企業(yè)指標(biāo)信息統(tǒng)計分析問題,我的畢業(yè)設(shè)計結(jié)合北京市科委的業(yè)務(wù)需求,開發(fā)了企業(yè)信息庫管理系統(tǒng)。這個項目來源于國家科技支撐計劃項目課題“面向服務(wù)的智能化制造技術(shù)及示范應(yīng)用”(課題編號

25、2006BAF01A17)。該項目主要是為了解決北京市科委的指標(biāo)信息統(tǒng)計分析過程中,存在指數(shù)統(tǒng)計困難和文檔管理困難兩個問題,以業(yè)務(wù)為主線,主要包括科委文檔的管理、企業(yè)指標(biāo)信息的智能處理、企業(yè)指標(biāo)信息的可視分析三個方面的內(nèi)容。通過為科委中存在的大量信息文檔實體構(gòu)建基礎(chǔ)信息模型,來方便用戶的日常管理和提高文檔的利用率。通過構(gòu)建應(yīng)用數(shù)據(jù)模型,將企業(yè)指標(biāo)信息文檔中的非結(jié)構(gòu)化信息智能抽取出來,并存儲于數(shù)據(jù)庫當(dāng)中,將非結(jié)構(gòu)化信息結(jié)構(gòu)化,用成熟的結(jié)構(gòu)化數(shù)據(jù)管理理論來管理非結(jié)構(gòu)化數(shù)據(jù)。通過對指標(biāo)信息的查詢,構(gòu)建信息可視分析模型,使用戶可以對知識進(jìn)行挖掘,提供形象的可視分析,提高北京市科委的企業(yè)指標(biāo)信息的統(tǒng)計分

26、析效率。本項目完成后將會在北京市科委投入使用。1.2 研究內(nèi)容和方法1.3論文組織結(jié)構(gòu)本論文共分為六章,論文首先分析了政府和企業(yè)在信息化過程中遇到的兩個問題:非結(jié)構(gòu)化信息管理和“認(rèn)知過載”。并結(jié)合北京市科委的企業(yè)指標(biāo)統(tǒng)計分析問題,介紹了畢業(yè)設(shè)計項目的背景和研究價值,引出了論文所做的主要工作內(nèi)容。緊接著論文簡單概述了畢業(yè)設(shè)計項目中所用到的各項技術(shù),并針對北京市科委的業(yè)務(wù)要求提出了信息抽取和基于Dundas Chart信息可視化的解決方案。然后論文就項目中的兩個技術(shù)難點非結(jié)構(gòu)化信息處理和信息可視分析,詳細(xì)闡述了信息抽取技術(shù)的算法設(shè)計和信息可視分析技術(shù)的模型設(shè)計。在系統(tǒng)實現(xiàn)方面,論文詳細(xì)介紹了企業(yè)信

27、息庫管理系統(tǒng)所使用的技術(shù)要點:基于A的三層結(jié)構(gòu)(USL-BLL-DAL)的框架設(shè)計;在用戶體驗方面,采用了A Ajax改善用戶的體驗。論文具體安排如下:第1章 簡單介紹了企業(yè)和政府在信息化過程中遇到的非結(jié)構(gòu)化信息管理困難和“認(rèn)知過載”問題。針對北京市科委的指標(biāo)統(tǒng)計分析問題,提出了畢業(yè)設(shè)計的背景、目標(biāo)和研究價值。第2章 概述系統(tǒng)中所使用的各項技術(shù)及各項技術(shù)的國內(nèi)外發(fā)展現(xiàn)狀。第3章 詳細(xì)介紹了針對北京市科委企業(yè)指標(biāo)信息文檔的信息抽取技術(shù)的算法設(shè)計和信息可視分析的模型設(shè)計。第4章 介紹了企業(yè)信息庫管理系統(tǒng)的實現(xiàn)。詳細(xì)闡述了系統(tǒng)的背景和總體目標(biāo),基于表示層(USL)-業(yè)務(wù)邏輯層(BLL)-數(shù)據(jù)訪問層(

28、DAL)的三層結(jié)構(gòu)的框架設(shè)計和功能模塊介紹及其實現(xiàn)。第5章 介紹了企業(yè)信息庫管理系統(tǒng)的系統(tǒng)測試和運行結(jié)果。第6章 最后論文總結(jié)了畢業(yè)設(shè)計所做的工作,并且指明了下一步的改進(jìn)計劃。主要是在信息抽取算法的改進(jìn),以及在用戶體驗方面的改進(jìn)計劃。2 文獻(xiàn)綜述每一章均從奇數(shù)頁開始。如前一章在奇數(shù)頁結(jié)束,那么下一頁偶數(shù)頁則空白。2.1 非結(jié)構(gòu)化信息處理2.1.1 非結(jié)構(gòu)化信息管理概述在引言中,我們提到過“在當(dāng)今的社會中,我們周圍信息的形態(tài)是以非結(jié)構(gòu)化信息為絕對主體的, 也可以說我們接觸到的信息中絕大部分是非結(jié)構(gòu)化信息?!保敲词裁词欠墙Y(jié)構(gòu)化信息?非結(jié)構(gòu)化信息具有什么特點?如何管理非結(jié)構(gòu)化信息?信息可以分為三類

29、:結(jié)構(gòu)化信息,非結(jié)構(gòu)化信息和半結(jié)構(gòu)化信息。1. 結(jié)構(gòu)化信息經(jīng)過嚴(yán)格標(biāo)引后的數(shù)據(jù),一般以二維表的形式存在。如數(shù)據(jù)庫中的表、各種票據(jù)信息等等。結(jié)構(gòu)化信息又分為以下三種:(1)一維結(jié)構(gòu)化信息。一維結(jié)構(gòu)化信息可以進(jìn)一步分為以下兩類:(a)第一類一維結(jié)構(gòu)化信息。這里給出了論文正文中三個層次的序號使用方法。如果有第四個層次,則可用(b)第二類一維結(jié)構(gòu)化信息。(2)二維結(jié)構(gòu)化信息。(3)三維結(jié)構(gòu)化信息。2. 非結(jié)構(gòu)化信息沒有經(jīng)過人為處理的不規(guī)整的信息。這些信息更加符合人類交流的方式。如新聞報道、科技文獻(xiàn)、散文等等。3. 半結(jié)構(gòu)化信息介于結(jié)構(gòu)化信息和非結(jié)構(gòu)化信息之間的。有一定格式約束,這不同于非結(jié)構(gòu)化信息,但

30、局部上,又按人類自然語法組織信息,與結(jié)構(gòu)化信息又有所區(qū)別,例如電報報文,通知、公告、指數(shù)統(tǒng)計表等等。非結(jié)構(gòu)化信息具有如下特點:第一,其格式非常多樣;第二,標(biāo)準(zhǔn)是多樣性的,不像我們結(jié)構(gòu)化的數(shù)據(jù)一目了然;第三,在技術(shù)上非結(jié)構(gòu)化信息比結(jié)構(gòu)化信息更難標(biāo)準(zhǔn)化和理解。所以存儲、檢索、發(fā)布以及利用需要更加智能化的計算機技術(shù)?;诜墙Y(jié)構(gòu)化信息的特點,將非結(jié)構(gòu)化信息結(jié)構(gòu)化,轉(zhuǎn)化為結(jié)構(gòu)化信息進(jìn)行管理是一個可行的管理方案,而構(gòu)建的面向用戶的企業(yè)非結(jié)構(gòu)化信息管理系統(tǒng)必須具備以下特征5:1. 必須對非結(jié)構(gòu)化信息資源的獲取、轉(zhuǎn)換、分析、管理、應(yīng)用全過程進(jìn)行分析,提供基于標(biāo)準(zhǔn)工作過程的支持環(huán)境。2. 必須提供標(biāo)準(zhǔn)的對外接口

31、、信息描述方法和定制規(guī)范降低定制分析機組件和信息應(yīng)用組件的復(fù)雜性。3. 必須提供靈活的信息描述資源模式簡化信息結(jié)構(gòu)化信息資源庫的構(gòu)建。4. 采用自然資源技術(shù)以支持高質(zhì)量的“拉式”信息服務(wù)和知識抽取。5. 提供對外的標(biāo)準(zhǔn)的接口以支持非結(jié)構(gòu)化信息資源管理系統(tǒng)與企業(yè)其他應(yīng)用系統(tǒng)的集成。6. 提供界面友好的工具方便用戶系統(tǒng)管理和應(yīng)用。7. 其本身應(yīng)具有易于擴充、動態(tài)發(fā)展的能力。圖2-1為基于UIMA(Unstructured Information Management Architecture)的非結(jié)構(gòu)化信息管理的架構(gòu)圖,具有一定的指導(dǎo)意義:(圖名居于圖下方正中,五號宋體加粗。)圖2-1 企業(yè)非結(jié)構(gòu)

32、化信息管理系統(tǒng)應(yīng)用模式6如果該圖是引用別人的,則應(yīng)在此進(jìn)行引用文獻(xiàn)的標(biāo)注。在把列名映射到Dundas里面的圖例,而行名則映射為Dundas里的軸標(biāo)簽。完成了數(shù)據(jù)表的映射以后,剩下的就是圖表自身形態(tài)的改變了。為了實現(xiàn)Dundas(表名居于表上方正中,五號宋體加粗。)形態(tài)的改變,我們對Dundas的屬性進(jìn)行了分類和總結(jié),如表2-1所示:(五號宋體加粗)表2-1 Dundas的部分屬性表屬性描述圖表類型(Chart Type)條柱型圖表(Bar and Column Charts):條形圖、柱狀圖;線型圖表(Line Charts): 折線圖、曲線圖、階梯圖;點圖表(Point Charts):點圖

33、、泡泡圖;餅圖(Pie Charts):餅圖、圈圖;分區(qū)圖(Area Charts):折線分區(qū)圖、曲線分區(qū)圖;條柱寬度(Point Width)針對條柱型圖表,條柱的寬度。取值從(0,1)。條柱風(fēng)格針對條柱型圖表,有默認(rèn)、磚型、圓形、棱型、明暗變化數(shù)值標(biāo)簽(Value Label)是否顯示數(shù)值標(biāo)簽。3D顯示是否3D顯示。簇狀顯示是否簇狀顯示。圖例(Legend)字體屬性;字號屬性;顯示位置:圖表的左邊、右邊、上面、下面。標(biāo)簽(Axis)字體屬性;字號屬性。標(biāo)題(Title)字體屬性;字號屬性。選擇算子決定了哪些染色體進(jìn)入下一代。本算法中采用“輪盤賭”的選擇方式,它按照染色體的適應(yīng)值大小來確定該

34、染色體的被選擇概率。如果染色體的適應(yīng)值越大,其被選中的概率越大。個體ri被選中的概率p(ri)定義如下: (pSize為種群大小) (公式2-1)公式編號用英文圓括號括起,放在公式右邊行末,在公式和編號之間不加虛線。確定了每個染色體的被選擇概率后,系統(tǒng)生成一個在0,1區(qū)間的隨機數(shù)組,然后與對應(yīng)染色體的被選擇概率比較,如果隨機數(shù)大于染色體的被選擇概率則該染色體被選擇,反之被淘汰。算法2-1 直線擬合算法Begin(1) 對Vl中的每個元素aa,重復(fù)執(zhí)行以下的步驟:mx=mx+aa.X;my=my+aa.Y;mxx=mxx+aa.X*aa.X;mxy=mxy+aa.X*aa.Y;(2) If mx

35、*mx-mxx*n=0 擬合失敗Else k=(my*mx-mxy*n)/(mx*mx-mxx*n); b=(my-mx*k)/n;End定義2-1 如果存在一條從Vi到Vj的路,稱Vi是Vj的前驅(qū)節(jié)點,而對于(Vi,Vj)E,稱Vi是Vj的立即前驅(qū)節(jié)點,記為ViiPred(Vj),稱Vj是Vi的立即后繼節(jié)點,記為VjiSucc(Vi)。定義一個公共容器類型的代碼如下正文中插入的代碼示例需要放入帶邊框及底色的文本框中,使用五號字單倍行距。:class Container : public Objectpublic:virtual Object* get(); /刪除并返回當(dāng)前元素virtual

36、 void put(Object*); /在當(dāng)前元素之前插入virtual Object*& operator (size_t); /下標(biāo)/;2.4本章小結(jié)本章詳細(xì)介紹了針對北京市科委企業(yè)指標(biāo)信息文檔的信息抽取技術(shù)的算法設(shè)計和信息可視分析的模型設(shè)計。首先,我們參考了UIMA的非結(jié)構(gòu)化信息的管理體系結(jié)構(gòu),并結(jié)合北京市科委的實際業(yè)務(wù)要求,提出了自己的非結(jié)構(gòu)化企業(yè)指標(biāo)信息的管理模型。并指出了在這個指標(biāo)模型當(dāng)中的兩個技術(shù)難點:非結(jié)構(gòu)化信息的提取和信息可視分析的實現(xiàn)。然后就存在的兩個技術(shù)難點展開了詳細(xì)的分析和設(shè)計。其次,我們詳細(xì)闡述了信息抽取算法的思想。首先,我們了詳細(xì)分析了企業(yè)指標(biāo)統(tǒng)計表中存在

37、的規(guī)律和模型,抽象出企業(yè)指數(shù)統(tǒng)計表中存在的五條規(guī)則,并提出了用信息抽取技術(shù)中的知識工程法進(jìn)行信息抽取的可行性。為了更好地進(jìn)行指標(biāo)信息的提取,我們給出了三條建議。其次,在總結(jié)的規(guī)則的基礎(chǔ)上,我們闡述了企業(yè)指標(biāo)信息分析的流程圖。結(jié)合科委的業(yè)務(wù)情況,將企業(yè)指標(biāo)信息的分析分成指標(biāo)提取和指標(biāo)值提取兩個方面。 緊接著,結(jié)合企業(yè)指數(shù)信息表的規(guī)則,我們給出了指標(biāo)信息提取的體系結(jié)構(gòu)圖,包括分塊、題目樹的構(gòu)建、題目的分割、題目的細(xì)化、基礎(chǔ)模型的解析五個步驟。并詳細(xì)闡述了各個步驟的算法思想。最后,我們闡述了指標(biāo)值抽取的算法思想。最后,我們結(jié)合Card模型,提出了企業(yè)信息管理系統(tǒng)信息可視分析的模型。然后,我們分析Du

38、ndas工具箱的元素和屬性,并詳細(xì)闡述了該模型在Dundas中的實現(xiàn)。 6 結(jié)論6.1論文總結(jié)論文分析了北京市科委的指標(biāo)統(tǒng)計分析業(yè)務(wù)中遇到的兩種問題:非結(jié)構(gòu)化信息管理困難和“認(rèn)知過載”問題,并詳細(xì)介紹了針對這兩種問題國內(nèi)外系統(tǒng)的解決方案。結(jié)合北京市科委的業(yè)務(wù)需求,提出了建立企業(yè)信息庫管理系統(tǒng)建設(shè)方案。論文詳細(xì)介紹了將非結(jié)構(gòu)化信息結(jié)構(gòu)化,利用成熟的結(jié)構(gòu)化信息的管理方案來解決非結(jié)構(gòu)化信息管理的問題,借鑒UIMA的體系結(jié)構(gòu),結(jié)合業(yè)務(wù)需求,提出了信息庫管理系統(tǒng)體系結(jié)構(gòu)。并詳細(xì)闡述了系統(tǒng)中存在的兩大技術(shù)難點的解決方案指標(biāo)信息智能抽取的算法設(shè)計和信息可視分析的模型設(shè)計。首先就指標(biāo)信息抽取的算法設(shè)計,我們詳細(xì)分析了北京市科委指標(biāo)文檔存在的規(guī)則,提出了利用知識工程法來抽取指標(biāo)信息的體系結(jié)構(gòu),詳細(xì)闡述了指標(biāo)抽取和指標(biāo)值抽取的算法設(shè)計。其次,在信息可視化方面,我們構(gòu)建了利用Dundas工具箱的可視分析的模型。本文還介紹了企業(yè)信息庫管理

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論