版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、數(shù)圖新服務研發(fā)關(guān)鍵技術(shù)技術(shù)與產(chǎn)品中心1為啥要講點技術(shù)?2關(guān)鍵技術(shù)領(lǐng)域3主要內(nèi)容文本數(shù)據(jù)庫系統(tǒng)自動標引、自動分類交互式檢索以用戶為中心的知識揭示 知識脈絡(luò)分析論文相似性檢測(copy detection)集群與分布式服務相關(guān)技術(shù)規(guī)范與標準 4文本數(shù)據(jù)庫數(shù)據(jù)庫是什么?GoogleBaidu萬方數(shù)據(jù)知識服務平臺他們是數(shù)據(jù)庫嗎?他們的底層系統(tǒng)是數(shù)據(jù)庫技術(shù)嗎?5文本數(shù)據(jù)庫存儲對象:文獻等文本內(nèi)容:期刊論文、學位論文、會議論文、專利特點:文本數(shù)據(jù)特有的結(jié)構(gòu)關(guān)系:重復、層級 刪改少,增加、檢索操作(對應CRUD四個計算機操作)海量數(shù)據(jù)的處理能力B*樹索引結(jié)構(gòu)與算法6WFIRC存儲XML格式支持文本、數(shù)值、日
2、期、貨幣等數(shù)據(jù)類型索引全文索引:權(quán)重、分詞策略整字段索引稀疏值索引檢索表達式CQL檢索結(jié)果自動聚類檢索結(jié)果文獻的學科、期刊、時間等分布情況秒級響應7WFIRC在知識服務平臺的應用特色多指標綜合排序相關(guān)度標題、關(guān)鍵詞、摘要、其他文獻質(zhì)量被引次數(shù)、核心刊、瀏覽次數(shù)、下載次數(shù)文獻新舊程度論文發(fā)表時間根據(jù)經(jīng)驗在知識服務平臺推薦使用的三種排序方式新論文優(yōu)先相關(guān)度優(yōu)先經(jīng)典論文優(yōu)先8WFIRC在知識服務平臺的應用特色檢索結(jié)果聚類查全查準的特色考慮“和服”問題的處理9主要內(nèi)容文本數(shù)據(jù)庫系統(tǒng)自動標引、自動分類交互式檢索以用戶為中心的知識揭示 知識脈絡(luò)分析論文相似性檢測(copy detection)集群與分布式
3、服務相關(guān)技術(shù)規(guī)范與標準10自動標引、自動分類人工智能、機器學習學什么?怎么學?學習成果什么?如何應用學習成果進行工作?1112萬方數(shù)據(jù)知識服務平臺標引與分類工具特色基于共現(xiàn)詞的相關(guān)詞網(wǎng)絡(luò)基于最長詞優(yōu)先的分詞策略基于千萬級文獻語料的學習13主要內(nèi)容文本數(shù)據(jù)庫系統(tǒng)自動標引、自動分類交互式檢索以用戶為中心的知識揭示 知識脈絡(luò)分析論文相似性檢測(copy detection)集群與分布式服務相關(guān)技術(shù)規(guī)范與標準WIKI知識分享與管理 14用戶的期望與失望所得所想所看15用戶研究和交互設(shè)計用戶研究用戶的目標用戶的行為模型交互設(shè)計系統(tǒng)與用戶交互的流程信息設(shè)計何時何地何信息?視覺設(shè)計強調(diào)、弱化結(jié)構(gòu)、關(guān)系16矛
4、盾用戶希望付出少、得到多需要展示的信息量多、界面有限界面信息量多、用戶關(guān)注點少17萬方數(shù)據(jù)知識服務平臺交互式檢索與頁面信息揭示交互式檢索:一框式進入交互反饋啟發(fā)式信息提供頁面精簡顯示、重點突出18主要內(nèi)容文本數(shù)據(jù)庫系統(tǒng)自動標引、自動分類交互式檢索以用戶為中心的知識揭示 知識脈絡(luò)分析論文相似性檢測(copy detection)集群與分布式服務相關(guān)技術(shù)規(guī)范與標準WIKI知識分享與管理 19知識脈絡(luò)客觀事實的展示基于海量文獻的分析共現(xiàn)詞、引用關(guān)系的應用20主要內(nèi)容文本數(shù)據(jù)庫系統(tǒng)自動標引、自動分類交互式檢索以用戶為中心的知識揭示 知識脈絡(luò)分析論文相似性檢測(copy detection)集群與分布式
5、服務相關(guān)技術(shù)規(guī)范與標準21技術(shù)方案檢測算法基于數(shù)字指紋 基于詞頻統(tǒng)計 基于VSM的方法基于文本序列模式的方法22萬方數(shù)據(jù)知識服務平臺-論文相似性檢測服務基于文本序列模式的方法特點:速度快精準23主要內(nèi)容文本數(shù)據(jù)庫系統(tǒng)自動標引、自動分類交互式檢索以用戶為中心的知識揭示 知識脈絡(luò)分析論文相似性檢測(copy detection)集群與分布式服務相關(guān)技術(shù)規(guī)范與標準24訪問量大了怎么辦?舉例25優(yōu)化軟件添加硬件架構(gòu)支持能力本地服務集群多節(jié)點IDC機房26萬方數(shù)據(jù)知識服務平臺集群與分布式方案優(yōu)化軟件支持擴展的架構(gòu):SOALTM管理GTM管理27主要內(nèi)容文本數(shù)據(jù)庫系統(tǒng)自動標引、自動分類交互式檢索以用戶為中心的知識揭示 知識脈絡(luò)分析論文相似性檢測(copy detection)集群與分布式服務相關(guān)技術(shù)規(guī)范與標準28Html、xmlhttp、httpsRSS、ATOMZ39.50、S
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基礎(chǔ)教育中的兒童文學閱讀觀后感
- 寵物護理服務協(xié)議書中的特別免責條款
- 科普知識小靈通征文
- 醫(yī)療設(shè)備維護與使用安全管理制度
- 童年回憶中的兒歌讀后感
- 2025年北海貨運從業(yè)資格證考試試題
- 旅游規(guī)劃與景點介紹作業(yè)指導書
- 汽車行業(yè)智能汽車制造技術(shù)優(yōu)化方案
- 品牌推廣策劃合作框架協(xié)議
- 2025年四平經(jīng)營性道路客貨運輸駕駛員從業(yè)資格考試
- 小兒體質(zhì)中醫(yī)調(diào)理方案課件
- 體外培育牛黃技術(shù)幻燈3課件
- 公路工程決算與工程竣工決算財務決算的關(guān)系
- 護士N2晉級N3職稱評定述職報告PPT課件(帶內(nèi)容)
- 動物、礦物藥分析課件
- 2019-2020學年江蘇省徐州市九年級(上)期末數(shù)學試卷(常用)(精品)
- 精選天津高三生物知識點
- 心有靈犀猜詞游戲常備詞匯總結(jié)
- DB22∕T 5006-2018 裝配式路面基層工程技術(shù)標準
- 《士兵突擊》PPT課件(PPT 43頁)
- JGJ107-2016鋼筋機械連接技術(shù)規(guī)程培訓宣貫
評論
0/150
提交評論