




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
TRS產(chǎn)品技術(shù)體系總體介紹1交流要點TRS總體產(chǎn)品與技術(shù)體系介紹TRS技術(shù)解決方案介紹(部分)企業(yè)搜索、內(nèi)容管理解決方案知識管理解決方案內(nèi)網(wǎng)門戶解決方案TRS相關(guān)產(chǎn)品Demo演示2企業(yè)的信息管理現(xiàn)狀企業(yè)應(yīng)用系統(tǒng)20%80%數(shù)據(jù)倉庫非結(jié)構(gòu)化資源管理各種關(guān)鍵業(yè)務(wù)數(shù)據(jù)各種文本、圖片、郵件等其他未管理但有用的各種信息缺失3TRS公司愿景和技術(shù)理念自主創(chuàng)新搜索整合發(fā)現(xiàn)海量非結(jié)構(gòu)化信息處理TRS產(chǎn)品具有100%的自主知識產(chǎn)權(quán)現(xiàn)實世界中80%的信息是非結(jié)構(gòu)化的每18個月新增的存儲量等于有史以來存儲量之和!企業(yè)搜索引擎讓人們像使用互聯(lián)網(wǎng)搜索引擎那樣搜索復(fù)雜的企業(yè)信息內(nèi)容管理技術(shù)實現(xiàn)對非結(jié)構(gòu)化信息的全生命周期管理(采集、生產(chǎn)、存貯、檢索、發(fā)布、利用)智能挖掘技術(shù)通過知識提取和內(nèi)容之間關(guān)系的挖掘,發(fā)現(xiàn)內(nèi)容的新價值面向全球競爭
目標(biāo)是成為中國和亞洲非結(jié)構(gòu)化信息處理技術(shù)的領(lǐng)導(dǎo)者。4TRS行業(yè)技術(shù)地位自主核心技術(shù)搜索內(nèi)容管理文本挖掘的知識管理國家科技進步二等獎為全文檢索和非結(jié)構(gòu)化數(shù)據(jù)庫第一品牌中文內(nèi)容管理的首倡者國內(nèi)內(nèi)容管理市場占有率第一覆蓋從內(nèi)容采集、創(chuàng)建、傳遞到分析完整的內(nèi)容全生命周期管理在多次權(quán)威評測中名列前茅率先實現(xiàn)文本挖掘技術(shù)的產(chǎn)品化和實用化5TRS市場地位
2007年中國企業(yè)搜索市場主力廠商份額結(jié)構(gòu)2007年中國內(nèi)容管理市場主力廠商份額結(jié)構(gòu)
2007年中國Web內(nèi)容管理市場主力廠商份額結(jié)構(gòu)企業(yè)搜索軟件第一名Web內(nèi)容管理軟件第一名主要競爭對手均為國際知名大廠商
數(shù)據(jù)來源:賽迪顧問2008,36TRS產(chǎn)品架構(gòu)總圖7公司業(yè)務(wù)和主要產(chǎn)品應(yīng)用領(lǐng)域產(chǎn)品類別文本挖掘全文檢索內(nèi)容管理核心技術(shù)結(jié)構(gòu)化信息(20%)非結(jié)構(gòu)化信息(80%)數(shù)據(jù)庫Oracle/SQLServer/DB2/…置標(biāo)信息XML/網(wǎng)頁郵件/群件/即時消息/…Domino/SharePoint/…格式文檔TXT/Office/PDF/PS/音視頻/…紙質(zhì)資源公文/報告/圖書/…業(yè)務(wù)應(yīng)用系統(tǒng)OA/ERP/CRM…互聯(lián)網(wǎng)/內(nèi)聯(lián)網(wǎng)專有電子資源光盤/期刊…桌面數(shù)據(jù)信息源細(xì)分市場網(wǎng)站及內(nèi)容管理市場企業(yè)及垂直搜索市場文本分析與挖掘市場知識管理和門戶市場內(nèi)容管理軟件企業(yè)搜索軟件互聯(lián)網(wǎng)信息服務(wù)文本挖掘軟件知識管理與門戶信息類型主營業(yè)務(wù)與目標(biāo)市場關(guān)系圖企業(yè)內(nèi)容管理電子政務(wù)知識管理企業(yè)搜索互聯(lián)網(wǎng)垂直搜索輿情監(jiān)控門戶網(wǎng)站群數(shù)字媒體競爭情報數(shù)字圖書館8TRS主要產(chǎn)品列表企業(yè)搜索相關(guān)產(chǎn)品TRSDatabaseServer、Cluster、API、GateWayTRSWAS、TRSCDS內(nèi)容管理相關(guān)產(chǎn)品TRSWCM、TRSEKP門戶及應(yīng)用整合相關(guān)產(chǎn)品TRSPortal、TRSIDS互聯(lián)網(wǎng)信息服務(wù)相關(guān)產(chǎn)品TRSInforadar、TRSCIS、TRSOM文本挖掘基礎(chǔ)產(chǎn)品TRSCKM知識挖掘工具包9企業(yè)信息化相關(guān)解決方案企業(yè)搜索解決方案網(wǎng)站內(nèi)容管理解決方案企業(yè)知識管理解決方案企業(yè)內(nèi)網(wǎng)門戶解決方案10TRS企業(yè)搜索解決方案WorldResearchBlogsNewsProductsTheWebImagesPrintContentEnterpriseFileSharesEnterpriseApplicationIntranetSecureContentDatabasesContentMgmtCRMCorporateWebSiteSpreadsheetsDesktopPresentationsReportsIMChatsDocumentsWebPagesEmail搜索的對象與范圍12應(yīng)用場景互聯(lián)網(wǎng)搜索垂直搜索服務(wù)企業(yè)內(nèi)部統(tǒng)一檢索服務(wù)某系統(tǒng)內(nèi)部全文檢索服務(wù)13TRS企業(yè)搜索總體架構(gòu)數(shù)據(jù)庫Web應(yīng)用文件系統(tǒng)多媒體郵件系統(tǒng)Notes等系統(tǒng)檢索入口數(shù)據(jù)庫網(wǎng)關(guān)網(wǎng)絡(luò)雷達(dá)文件采集郵件采集Notes等網(wǎng)關(guān)擴展采集統(tǒng)一身份及單點登錄智能分析與挖掘自動分類聚類分析關(guān)聯(lián)分析排重分析分類匯總知識發(fā)現(xiàn)拼音檢索語義分析全文檢索引擎索引庫存儲全文檢索引擎檢索集群服務(wù)用戶權(quán)限服務(wù)關(guān)鍵詞檢索語義檢索高級檢索結(jié)果命中結(jié)果排序14
軟件技術(shù)架構(gòu)15TRS搜索引擎集群架構(gòu)16TRS搜索集群擴展機制17搜索引擎接口體系18基于自然語言特點的索引策略(中文)漢語分詞及字詞混合索引采用語料統(tǒng)計的機器學(xué)習(xí)方法+歧義規(guī)則實例知識庫的漢語分詞解決方案,切分正確率達(dá)到99.1%。由于漢語分詞不能達(dá)到100%準(zhǔn)確,所以中文檢索系統(tǒng)需要提供一種索引方式(字詞混合索引),保證一定查準(zhǔn)率的同時提供100%查全的手段。為了兼顧中文檢索的查全和查準(zhǔn),索引程序也要做適應(yīng)性調(diào)整。國外檢索產(chǎn)品只是簡單地內(nèi)嵌一個好的分詞軟件并不能解決問題(英文)
英文詞根英文詞根采用”詞典+算法”結(jié)合的解決方案,準(zhǔn)確率達(dá)到99.999%。支持中英文以及其它幾十種主流語言的混合檢索。19支持各種檢索高級應(yīng)用組合檢索以及屬性字段檢索和全文檢索的聯(lián)合查詢各種邏輯表達(dá)式檢索提供了多達(dá)48種檢索運算符多字段相關(guān)性排序支持相關(guān)性排序,并且可以設(shè)置文檔的不同字段以不同的權(quán)重,提升關(guān)鍵字段的權(quán)重分類匯總檢索結(jié)果的分類統(tǒng)計,支持用正則表達(dá)式來篩選分類統(tǒng)計的目標(biāo)字段值,并支持抽取部分子串組成新的類別。20檢索的智能語義擴展語義分析檢索提供基于短語、句子、段落的模糊檢索
英文大小寫敏感檢索、中文簡繁體擴展檢索。支持簡繁擴展檢索,且簡繁對照是基于詞語級語境的,例如:恢復(fù)復(fù)員報復(fù)復(fù)議:恢復(fù)復(fù)員報復(fù)復(fù)議
復(fù)雜復(fù)查復(fù)制重復(fù):複雜複查複制重複
檢索時能夠應(yīng)用同義詞典和主題詞典進行擴展檢索,并且詞典可維護拼音檢索、相似檢索21技術(shù)性能優(yōu)勢實時動態(tài)索引
索引空間膨脹率小,一般在100%內(nèi)。
提供分布式檢索和負(fù)載均衡集群,以及二級集群。千萬級數(shù)據(jù)秒級響應(yīng)支持主流的開發(fā)平臺,提供CAPI、JavaBeans和ADO.NET二次開發(fā)接口。22企業(yè)搜索應(yīng)用舉例:搜索的應(yīng)用集成檢索結(jié)果的展現(xiàn),建議先作檢索結(jié)果匯總的展現(xiàn)
點擊進入各系統(tǒng)結(jié)果界面展現(xiàn)具體列表可以避免異構(gòu)數(shù)據(jù)在統(tǒng)一界面展現(xiàn)的繁瑣23結(jié)果的智能化組織熱點詞自動追蹤用戶搜索行為掌握用戶搜索熱點相關(guān)文章推薦1、利用TRSCKM的關(guān)鍵詞抽取+TRSlike函數(shù)檢索實現(xiàn)
對于所有文章抽取5個關(guān)鍵詞,作為另一個字段存儲,每次取得文章后根據(jù)關(guān)鍵詞進行如下檢索:keyword=like(‘本文關(guān)鍵詞’,60)。2、可以根據(jù)關(guān)鍵字定義相關(guān)檢索結(jié)果
同音字推薦搜索24結(jié)果的智能化組織信息來源標(biāo)注,幫助用戶迅速判斷文檔是否所要相關(guān)短語1、預(yù)置數(shù)十萬的主題詞庫提供關(guān)聯(lián)2、提供用戶檢索關(guān)鍵字自動采集、關(guān)聯(lián)相關(guān)度模型cosine向量空間模型簡單講:1、根據(jù)關(guān)鍵字在文章出現(xiàn)的頻度自動匹配2、關(guān)鍵字與主題的相關(guān)性3、剔除貢獻(xiàn)較小的虛詞、助詞等25結(jié)果的人性化展現(xiàn)26TRS內(nèi)容管理解決方案TRSWCM簡介TRSWCM是TRS內(nèi)容管理產(chǎn)品家族中的核心成員國內(nèi)首款基于SOA架構(gòu)的內(nèi)容管理平臺產(chǎn)品可以輕松創(chuàng)建內(nèi)部門戶、外部門戶、媒體門戶、信息共享平臺、組織工作協(xié)作平臺等等TRSWCM的功能集成文字庫、圖片庫、視頻庫、資源庫,四位一體,構(gòu)成業(yè)界最為強大、完善的內(nèi)容管理應(yīng)用平臺;集成強大的工作流引擎與基于表單的網(wǎng)上辦事功能,突破并豐富了內(nèi)容管理內(nèi)涵擴展提供內(nèi)容評論、問卷調(diào)查、智能處理、在線訪談、博客、廣告管理、可視化模板等的即插即用的功能選件,極大擴展了內(nèi)容管理外延全面支持Web
Service,具有靈活的擴展集成應(yīng)用與二次開發(fā)功能系統(tǒng)與TRS全文檢索、信息采集、信息分發(fā)、單點登錄等產(chǎn)品無縫集成應(yīng)用,為用戶提供最為完善、先進的內(nèi)容管理解決方案28定位:一套系統(tǒng)實現(xiàn)多種應(yīng)用一套內(nèi)容管理平臺,就可以建立外部大型站點、內(nèi)部信息門戶、內(nèi)部辦公平臺,部署不同的內(nèi)容管理應(yīng)用。TRSWCM外部網(wǎng)站內(nèi)部門戶辦公平臺通訊平臺29網(wǎng)站群的管理模式30TRS知識管理解決方案TRS內(nèi)網(wǎng)門戶解決方案TRS產(chǎn)品相關(guān)演示TRSWCMDemo演示TRS檢索Demo演示TRS知識管理Demo演示TRS內(nèi)網(wǎng)門戶Demo演示33TRS重點產(chǎn)品介紹TRSCKM產(chǎn)品介紹其他(根據(jù)現(xiàn)場要求)34TRS中文知識管理工具包(TRSCKM)主要功能是為中文文本應(yīng)用提供開發(fā)工具箱。它集成了TRS公司最新推出的多項中文處理技術(shù)。工具包組成
TRS文本分類工具TRS文本摘要工具TRS文本聚類工具
TRS相似性檢索工具TRS文本分詞工具TRS政治常識校對工具
TRS信息過濾工具TRS相關(guān)短語檢索工具TRS拼音同音檢索工具調(diào)用
各功能模塊均提供ANSIC和webservice標(biāo)準(zhǔn)接口,可以輕松地嵌入到各種編程環(huán)境中。目前已經(jīng)被TRS網(wǎng)絡(luò)雷達(dá)系統(tǒng)等多個TRS產(chǎn)品及項目采用。35功能模塊簡介自動分詞
可以對文本進行分詞,識別文本中的人名、地名、組織機構(gòu)名等信息,是各種文本應(yīng)用的基礎(chǔ)。自動分類
可以自動地對文檔進行分類,賦予文檔一個預(yù)先定義的類別主題詞,便于文檔的組織,不需人工干預(yù)。自動摘要+主題詞標(biāo)引
可以提取文本的主題,自動生成文本摘要,為用戶快速瀏覽信息提供快捷有效的方式。36功能模塊簡介自動聚類可以自動對文檔進行歸類,把內(nèi)容相近的文檔歸為一類,并自動為該類生成主題詞。
相似性檢索(自動排重)
可以幫助用戶檢索與給定文檔相似的文檔,可以應(yīng)用于文檔查重等諸多領(lǐng)域。(政治)常識校對
可以對文章中敏感的政治內(nèi)容進行校對,是審稿,校對過程的有效工具。37功能模塊簡介自動過濾
識別和過濾各種有害文本信
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年漁家傲試題及答案
- 2025年專升碩英語試題及答案
- 5年級下冊英語第5單元
- 嘉興風(fēng)機吊裝施工方案
- 登鸛雀樓寫了詩人的所見
- arm芯片霍爾信號
- 2025年天然植物纖維及人造纖維編織工藝品合作協(xié)議書
- 2025年內(nèi)蒙古通遼市單招職業(yè)傾向性測試題庫1套
- 2025年重慶青年職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性測試題庫及參考答案1套
- 2025年攀枝花攀西職業(yè)學(xué)院單招職業(yè)技能測試題庫審定版
- 2025年四川綿陽市科技城新區(qū)下屬國有企業(yè)新投集團招聘筆試參考題庫附帶答案詳解
- 教科版三年級下冊科學(xué)全冊單元教材分析
- 2025年國家鐵路局工程質(zhì)量監(jiān)督中心招聘歷年高頻重點提升(共500題)附帶答案詳解
- 《S中學(xué)宿舍樓工程量清單計價編制(附三維圖)》30000字
- 全國運動員注冊協(xié)議書范本(2篇)
- 2024年03月浙江南潯銀行春季招考筆試歷年參考題庫附帶答案詳解
- 執(zhí)行立案申請書模版
- 《高點全景視頻監(jiān)控聯(lián)網(wǎng)技術(shù)要求》
- 智能建筑外掛電梯安裝方案
- 2024屆廣東省廣州市高三一??荚囉⒄Z試題講評課件
- 數(shù)字電子技術(shù)(廣東工業(yè)大學(xué))知到智慧樹章節(jié)測試課后答案2024年秋廣東工業(yè)大學(xué)
評論
0/150
提交評論