中國(guó)知網(wǎng)檢測(cè)流程圖_第1頁(yè)
中國(guó)知網(wǎng)檢測(cè)流程圖_第2頁(yè)
中國(guó)知網(wǎng)檢測(cè)流程圖_第3頁(yè)
中國(guó)知網(wǎng)檢測(cè)流程圖_第4頁(yè)
中國(guó)知網(wǎng)檢測(cè)流程圖_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

知網(wǎng)檢測(cè)流程學(xué)位論文學(xué)術(shù)不端行為檢測(cè)系統(tǒng)研制介紹與使用方法第一章系統(tǒng)介紹1.1系統(tǒng)概述學(xué)位論文學(xué)術(shù)不端行為檢測(cè)系統(tǒng)(簡(jiǎn)稱“TMLC”)以《中國(guó)學(xué)術(shù)文件網(wǎng)絡(luò)出版總庫(kù)》為全文比對(duì)數(shù)據(jù)庫(kù),實(shí)現(xiàn)了對(duì)剽竊與剽竊、偽造、篡改等學(xué)術(shù)不端行為快速檢測(cè),可供用戶檢測(cè)學(xué)位論文,并支持用戶自建比對(duì)庫(kù)。其系統(tǒng)示意圖如圖1所表示。圖1檢測(cè)系統(tǒng)示意圖1.2系統(tǒng)技術(shù)路線介紹TMLC采取CNKI自主研發(fā)自適應(yīng)多階指紋(AMLFP)特征檢測(cè)技術(shù),具備檢測(cè)速度快,準(zhǔn)確率,召回率較高,抗干擾性強(qiáng)等特征。

支持篇章、段落、句子各層級(jí)檢測(cè);

支持文件改寫,多篇文件組合等各種文件變形檢測(cè);

支持碩士學(xué)位論文、圖書專著等超長(zhǎng)文件學(xué)術(shù)不端檢測(cè)。

CNKI自適應(yīng)多階指紋技術(shù)原理如圖2所表示:圖2CNKI自適應(yīng)多階指紋技術(shù)原理圖對(duì)任意一篇需要檢測(cè)文件,系統(tǒng)首先對(duì)其進(jìn)行分層處理,按照篇章、段落、句子等層級(jí)分別創(chuàng)建指紋,而比對(duì)資源庫(kù)中比對(duì)文件,也采取一樣技術(shù)創(chuàng)建指紋索引。這么分層多階指紋結(jié)構(gòu),不但能夠滿足我們對(duì)超長(zhǎng)文件快速檢測(cè),而且,因?yàn)槲覀冏钚≈讣y粒度為句子,所以,也滿足了系統(tǒng)對(duì)檢準(zhǔn)率和檢全率高要求。標(biāo)準(zhǔn)上,只要檢測(cè)文件與比對(duì)文件存在一個(gè)相同句子,就能被檢測(cè)系統(tǒng)發(fā)覺(jué)。1.3系統(tǒng)功效概述系統(tǒng)主要功效包含:已發(fā)表文件檢測(cè)、論文檢測(cè)、問(wèn)題庫(kù)查詢、自建比對(duì)庫(kù)管理等?!粢寻l(fā)表文件檢測(cè):指檢測(cè)系統(tǒng)能夠自動(dòng)將屬于用戶已正式發(fā)表學(xué)位論文檢索出來(lái),并對(duì)每一篇已發(fā)表文件進(jìn)行實(shí)時(shí)檢測(cè),快速給出檢測(cè)結(jié)果。◆論文檢測(cè):主要實(shí)現(xiàn)論文實(shí)時(shí)在線檢測(cè)功效。◆問(wèn)題庫(kù)查詢:指用戶能夠?qū)z測(cè)結(jié)果中確認(rèn)有問(wèn)題文件放入到問(wèn)題庫(kù),便于用戶集中管理?!糇越ū葘?duì)庫(kù):指管理人員能夠選擇將檢測(cè)文件放入個(gè)人比對(duì)庫(kù)或者批量上傳文件作為個(gè)人比對(duì)庫(kù),該個(gè)人比對(duì)庫(kù)即可作為以后學(xué)術(shù)不端文件檢測(cè)比對(duì)數(shù)據(jù)庫(kù),該自建個(gè)人比對(duì)庫(kù)完全屬于用戶,其余用戶無(wú)權(quán)使用。1.4系統(tǒng)目標(biāo)TMLC目標(biāo)是輔助各碩士培養(yǎng)單位對(duì)學(xué)位論文質(zhì)量進(jìn)行評(píng)定,為審查論文提供技術(shù)服務(wù)。檢測(cè)系統(tǒng)在對(duì)論文進(jìn)行檢測(cè)之后,生成檢測(cè)匯報(bào),為判斷論文性質(zhì)提供相關(guān)依據(jù)。第二章檢測(cè)原理及方法2.1支撐技術(shù)CNKI擁有強(qiáng)大技術(shù)研發(fā)隊(duì)伍,現(xiàn)在已經(jīng)擁有了具備國(guó)際或國(guó)內(nèi)領(lǐng)先水準(zhǔn)全方面數(shù)字出版相關(guān)技術(shù),包含資源采集技術(shù),文本數(shù)據(jù)庫(kù)加工技術(shù),文本數(shù)據(jù)庫(kù)技術(shù),數(shù)字資源版權(quán)保護(hù)技術(shù),知識(shí)挖掘技術(shù),自然語(yǔ)言處理技術(shù)、快速比對(duì)技術(shù)等。在海量全文數(shù)據(jù)基礎(chǔ)上實(shí)現(xiàn)快速準(zhǔn)確檢測(cè),上述技術(shù)是基本確保。2.2支撐資源TMLC需要一個(gè)盡可能完備全文數(shù)據(jù)比對(duì)資源庫(kù),而CNKI《中國(guó)學(xué)術(shù)文件網(wǎng)絡(luò)出版總庫(kù)》則恰好滿足這一要求。到現(xiàn)在為止,CNKI擁有學(xué)術(shù)期刊7000余種,期刊全文文件2480萬(wàn)篇,期刊期數(shù)和文件收錄完整率都大于99.9%,文件量居國(guó)際國(guó)內(nèi)同類產(chǎn)品之首;出版503家碩士學(xué)位點(diǎn)72萬(wàn)篇優(yōu)異碩士學(xué)位論文,368家博士學(xué)位點(diǎn)9.6萬(wàn)篇博士學(xué)位論文;1286家主要會(huì)議論文106萬(wàn)篇;515家主要報(bào)紙500多萬(wàn)篇;1376種主要年鑒787萬(wàn)篇;600多個(gè)工具書220多萬(wàn)條;學(xué)術(shù)引文索引數(shù)據(jù)600多萬(wàn)條;這些出版物做到平均日更新0條統(tǒng)計(jì);國(guó)家標(biāo)準(zhǔn)、專利、SPRINGER數(shù)據(jù)庫(kù)也集成到CNKI網(wǎng)絡(luò)出版平臺(tái)中;另外,出版平臺(tái)還集成整合出版了各類第三方數(shù)據(jù)庫(kù)資源1020種。在收錄資源種類上,CNKI在國(guó)內(nèi)具備顯著優(yōu)勢(shì),收錄了期刊、學(xué)位論文、會(huì)議論文、報(bào)紙、年鑒、工具書、專利、外文文件、學(xué)術(shù)文件引文等與科學(xué)研究、學(xué)習(xí)相關(guān)主要資源。在資源收錄數(shù)量上,CNKI顯著優(yōu)于同類產(chǎn)品,各個(gè)資源庫(kù)收錄年限長(zhǎng),期刊等主要資源庫(kù)回溯到創(chuàng)刊。在資源更新速度上,CNKI產(chǎn)品除了第三方合作外文文件以外,其余資源都做到了日更新,單日更新數(shù)量大,這是推行產(chǎn)業(yè)化、標(biāo)準(zhǔn)化運(yùn)作結(jié)果。2.3系統(tǒng)架構(gòu)模式2.3.1系統(tǒng)架構(gòu)圖圖3系統(tǒng)架構(gòu)圖2.3.2系統(tǒng)示意圖檢測(cè)系統(tǒng)提供整套文件學(xué)術(shù)不端行為檢測(cè),系統(tǒng)服務(wù)器位于CNKI中心網(wǎng)站,用戶將待檢測(cè)學(xué)位論文經(jīng)過(guò)網(wǎng)絡(luò)在線提交到中心網(wǎng)站服務(wù)器,服務(wù)器在檢測(cè)完成后,自動(dòng)將檢測(cè)結(jié)果返回給用戶。整套系統(tǒng)架構(gòu)為B/S結(jié)構(gòu),客戶端不需要安裝任何軟件。其系統(tǒng)示意如圖4所表示:圖4系統(tǒng)示意圖2.3.3系統(tǒng)流程圖圖5系統(tǒng)關(guān)鍵流程圖2.4用戶提供資源實(shí)現(xiàn)學(xué)位論文學(xué)術(shù)不端檢測(cè),用戶需要提供資源包含:1.論文全文內(nèi)容論文全文內(nèi)容是檢測(cè)論文是否存在學(xué)術(shù)不端行為基礎(chǔ)數(shù)據(jù)。本檢測(cè)系統(tǒng)是對(duì)提交論文全文內(nèi)容進(jìn)行分析,在內(nèi)容分析基礎(chǔ)上,生成各項(xiàng)檢測(cè)指標(biāo)。所以,全文數(shù)據(jù)是系統(tǒng)所需要必要資源。2.元數(shù)據(jù)信息元數(shù)據(jù)指論文對(duì)應(yīng)作者、作者單位、發(fā)表時(shí)間、支持基金項(xiàng)目等信息。元數(shù)據(jù)是檢測(cè)系統(tǒng)對(duì)學(xué)術(shù)不端類型進(jìn)行判斷所需基礎(chǔ)數(shù)據(jù),為了更準(zhǔn)確便于系統(tǒng)做出預(yù)判,用戶能夠在提交檢測(cè)文件同時(shí),一并提交文件元數(shù)據(jù)信息。尤其提到是:在進(jìn)行學(xué)位論文檢測(cè)時(shí)候,作者信息是非常必要。輸入作者信息,在后續(xù)檢測(cè)過(guò)程中,系統(tǒng)能夠自動(dòng)依照作者信息區(qū)分比對(duì)資源中文件是屬于該作者已發(fā)表文件,還是他人文件,為用戶快速甄別論文是否存在學(xué)術(shù)不端行為提供更直觀印象。因?yàn)樵趯W(xué)位論文中,引用自己以前發(fā)表過(guò)文件是合理。注意:元數(shù)據(jù)不是系統(tǒng)必需數(shù)據(jù),用戶在使用檢測(cè)系統(tǒng)時(shí)候,能夠選擇不填寫元數(shù)據(jù)。但我們提議最好輸入作者信息。2.5檢測(cè)結(jié)果內(nèi)容在對(duì)用戶提交檢測(cè)文件檢測(cè)之后,系統(tǒng)生成檢測(cè)結(jié)果包含:1.

重合文字起源文件信息。系統(tǒng)詳細(xì)列出重合文字起源文件信息,這些文件都是真實(shí)存在,而且應(yīng)是公開發(fā)表或得到發(fā)表確認(rèn)。2.

比對(duì)信息。檢測(cè)文件和起源文件詳細(xì)比對(duì)信息,用戶能夠快速選擇重合文字部分查閱。3.

總檢測(cè)指標(biāo)。該指標(biāo)體系從多個(gè)角度對(duì)檢測(cè)文件中文字復(fù)制情況進(jìn)行了概括性描述。4.

子檢測(cè)指標(biāo)。因?yàn)閷W(xué)位論文通常較長(zhǎng),所以,系統(tǒng)通常按章檢索,而且每一章給出子檢測(cè)指標(biāo),該檢測(cè)指標(biāo)從多個(gè)角度對(duì)該章內(nèi)容檢測(cè)情況進(jìn)行了詳細(xì)描述。5.

診療類型。系統(tǒng)依照指標(biāo)參數(shù)以及其余元數(shù)據(jù)相關(guān)信息,自動(dòng)給出一個(gè)預(yù)判診療類型,供審查人員參考。6.

檢測(cè)匯報(bào)。檢測(cè)系統(tǒng)自動(dòng)生成一個(gè)檢測(cè)匯報(bào)單,詳細(xì)列出檢測(cè)文件學(xué)術(shù)不端行為檢測(cè)情況,用戶能夠?qū)υ搮R報(bào)單進(jìn)行修改,生成終審匯報(bào)。注意:系統(tǒng)只對(duì)疑似存在學(xué)術(shù)不端行為論文生成檢測(cè)匯報(bào)。第三章檢測(cè)指標(biāo)體系學(xué)位論文學(xué)術(shù)不端行為檢測(cè)系統(tǒng)采取指標(biāo)體系分為兩個(gè)部分:3.1總檢測(cè)指標(biāo)學(xué)位論文通常文件篇幅較大,字?jǐn)?shù)多,碩士論文通常為3~5萬(wàn)字,博士論文則多達(dá)十多萬(wàn)字。所以,為了讓用戶對(duì)整個(gè)學(xué)位論文有一個(gè)快速概況了解,特制訂了以下指標(biāo)體系:

總重合字?jǐn)?shù)(CCA)

總文字復(fù)制比(TTR)

總文字?jǐn)?shù)(TCA)

疑似章節(jié)數(shù)(QCA)

總章節(jié)數(shù)(TCA)

首部重合文字?jǐn)?shù)(HCCA)

尾部重合文字?jǐn)?shù)(ECCA)上述指標(biāo)從整體情況描述了論文檢測(cè)情況,便于用戶快速了解該論文總檢測(cè)概況。下面對(duì)上述指標(biāo)分別進(jìn)行說(shuō)明。3.1.1總重合字?jǐn)?shù)(CCA)學(xué)位論文通常篇幅大,少則3~5萬(wàn)字,多則十多萬(wàn)字,若以文字復(fù)制比來(lái)衡量一篇論文文字重合情況,則不太適宜。因?yàn)閷?duì)于一篇十幾萬(wàn)字博士論文來(lái)說(shuō),10%就已達(dá)成1萬(wàn)字,文字復(fù)制情況已經(jīng)非常嚴(yán)重。所以,對(duì)于博碩士論文檢測(cè),檢測(cè)系統(tǒng)使用絕對(duì)字?jǐn)?shù)即總重合字?jǐn)?shù)作為檢測(cè)結(jié)果關(guān)鍵指標(biāo)。如圖6所表示:圖6總重合字?jǐn)?shù)示例3.1.2總文字復(fù)制比(TTR)總文字復(fù)制比則是指學(xué)位論文中總重合字?jǐn)?shù)在總論文字?jǐn)?shù)中所占百分比。經(jīng)過(guò)該指標(biāo),我們能夠直觀了解到重合字?jǐn)?shù)在該檢測(cè)學(xué)位論文中所占百分比情況。3.1.3總文字?jǐn)?shù)(TCA)總文字?jǐn)?shù)是指該檢測(cè)論文全部包含字?jǐn)?shù),文字復(fù)制比與總文字?jǐn)?shù)乘積即為重合字?jǐn)?shù)。3.1.4疑似章節(jié)數(shù)(QCA)、總章節(jié)數(shù)(TCA)疑似章節(jié)數(shù)是則檢測(cè)論文疑似存在學(xué)術(shù)不端行為章節(jié)數(shù)量??傉鹿?jié)數(shù)則是指學(xué)位論文總章節(jié)數(shù)(對(duì)于不按章節(jié)顯示,而是按照固定長(zhǎng)度切分論文,每一段落為一章節(jié))。3.1.5首部重合文字?jǐn)?shù)(HCCA)、尾部重合文字?jǐn)?shù)(ECCA)首部重合文字?jǐn)?shù)指學(xué)位論文前1萬(wàn)字中重合文字?jǐn)?shù)量。尾部重合文字?jǐn)?shù)是指除去前1萬(wàn)字,剩下部分中重合文字?jǐn)?shù)量。對(duì)于學(xué)位論文,通常開頭部分均是綜述性匯報(bào)介紹,其主要性遠(yuǎn)低于論文尾部。3.2子檢測(cè)指標(biāo)對(duì)于學(xué)位論文每一章節(jié),又制訂了以下檢測(cè)指標(biāo)來(lái)反應(yīng)該章節(jié)檢測(cè)情況,對(duì)于一篇學(xué)位論文來(lái)說(shuō),每一章內(nèi)容各異,重點(diǎn)也不一樣,其關(guān)鍵工作內(nèi)容通常主要存在某幾章中,子檢測(cè)指標(biāo)能夠讓用戶快速了解每一章節(jié)檢測(cè)情況。子檢測(cè)指標(biāo)包含:

文字復(fù)制比(TR)

重合字?jǐn)?shù)(CNW)

最大段長(zhǎng)(LPL)

平均段長(zhǎng)(APL)

段落數(shù)(PN)

段文字比(PR)

首部復(fù)制比(HR)

尾部復(fù)制比(ER)

引用復(fù)制比(RR)*上述指標(biāo)從多個(gè)角度反應(yīng)了檢測(cè)文件檢測(cè)情況,便于用戶進(jìn)行針對(duì)性審核。下面對(duì)各項(xiàng)指標(biāo)分別進(jìn)行說(shuō)明。3.2.1文字復(fù)制比(TR)因?yàn)閷W(xué)位論文通常文字量較多,為了便于用戶快速瀏覽檢測(cè)結(jié)果。系統(tǒng)會(huì)自動(dòng)對(duì)學(xué)位論文進(jìn)行切分處理。有以下兩種處理方式:1.若用戶提交論文是MSWord格式,且按照MSWord格式生成了文檔目錄,檢測(cè)系統(tǒng)會(huì)自動(dòng)識(shí)別論文章節(jié),按論文實(shí)際章節(jié)信息顯示論文內(nèi)容。2.若學(xué)位論文不存在顯著章節(jié)信息,或者不是MSWord格式論文,則系統(tǒng)會(huì)自動(dòng)按照每段1萬(wàn)余字符切分學(xué)位論文,按照切分后結(jié)果顯示。文字復(fù)制比即指論文切分后每一章節(jié)段落文字復(fù)制情況。文字復(fù)制比即指學(xué)位論文某一章節(jié)與比對(duì)文件比較后,重合文字部分在該章節(jié)中所占百分比。百分比越高,反應(yīng)該章節(jié)越多文字來(lái)自于其余已發(fā)表文件。文字復(fù)制比反應(yīng)了文章“剽竊”文字?jǐn)?shù)量百分比,通常來(lái)說(shuō),文字復(fù)制比越高,存在學(xué)術(shù)不端行為可能性越大。文字復(fù)制比情況如圖7所表示。圖7文字復(fù)制比示例3.2.2重合字?jǐn)?shù)(CNW)重合字?jǐn)?shù)指學(xué)位論文該章節(jié)與比對(duì)文件比較后,重合部分字?jǐn)?shù)。通常來(lái)說(shuō),不論文字復(fù)制比怎樣,重合字?jǐn)?shù)越多,存在學(xué)術(shù)不端行為可能性越大。如圖8所表示,在圖中,即使文字復(fù)制比只有16%,百分比不高,但圖中左文標(biāo)紅部分實(shí)際上是剽竊了右文標(biāo)紅部分。圖8重合字?jǐn)?shù)示例3.2.3最大段長(zhǎng)(LPL)、平均段長(zhǎng)(APL)、段落數(shù)(PN)在學(xué)位論文檢測(cè)中,當(dāng)連續(xù)文字超出一定百分比時(shí),稱之為段。在本系統(tǒng)中,通常認(rèn)為,連續(xù)200以上文字稱為段。與比對(duì)文件重合最大段長(zhǎng)度即為最大段長(zhǎng)。最大段長(zhǎng)反應(yīng)成段剽竊特征。連續(xù)文字越長(zhǎng),剽竊可能性越大。在學(xué)位論文中,全部段長(zhǎng)度平均值即為平均段長(zhǎng)。在學(xué)位論文中,全部段數(shù)量為段落數(shù)。平均段長(zhǎng)和段落數(shù)反應(yīng)了重合文字在學(xué)位論文中分布情況,通常來(lái)說(shuō),指標(biāo)參數(shù)越高,存在學(xué)術(shù)不端行為可能性越大。如圖9所表示,標(biāo)紅部分連續(xù)文字組成了段,而且它是算法設(shè)計(jì)剽竊,審查人員比較輕易判斷;而在圖10中,標(biāo)紅文字不組成段,連續(xù)文字較少,對(duì)它性質(zhì)判斷則可能需要更多信息。圖9

段落復(fù)制示例圖10句子復(fù)制示例3.2.4段文字比(PR)在學(xué)位論文某一章節(jié)中,全部該章節(jié)文字重合段字?jǐn)?shù)之和占該章節(jié)文字?jǐn)?shù)百分比為段文字比。段文字比反應(yīng)了剽竊連續(xù)特征。通常來(lái)說(shuō),連續(xù)文字出現(xiàn)越多,比文字分散出現(xiàn)情況更可能存在學(xué)術(shù)不端行為。3.2.5首部復(fù)制比(HR)學(xué)位論文某一章節(jié)前20%稱之為章節(jié)首部,首部文字復(fù)制比為首部復(fù)制比。就漢字文件來(lái)說(shuō),通常每一章節(jié)正文開頭部分出現(xiàn)是綜述性語(yǔ)言,主要性相對(duì)偏低。如圖11所表示,左文和右文開頭大段相同,但文字內(nèi)容基本都是綜述性介紹。圖11首部復(fù)制比示例3.2.6尾部復(fù)制比(ER)每一章節(jié)后80%稱之為章節(jié)尾部,尾部文字復(fù)制比為尾部復(fù)制比。通常情況下,尾部文字內(nèi)容就主要性來(lái)說(shuō),比前部文字內(nèi)容要高。如圖12所表示,我們仔細(xì)查閱比較圖11和圖12內(nèi)容發(fā)覺(jué),圖11中首部文件是綜述他人工作,而圖12中尾部文件則是闡述自己研究工作目標(biāo)和意義,應(yīng)該是作者個(gè)人工作表現(xiàn),在這部分直接剽竊他文,性質(zhì)要嚴(yán)重得多。圖12尾部復(fù)制比示例3.2.7引用復(fù)制比(RR)引用復(fù)制比指與存在引證關(guān)系文件文字重合部分百分比。對(duì)于學(xué)位論文來(lái)說(shuō),存在引證關(guān)系與不存在引證關(guān)系復(fù)制部分應(yīng)區(qū)分對(duì)待。復(fù)制了他文內(nèi)容,而不注明引用,性質(zhì)要愈加嚴(yán)重。同時(shí)我們也認(rèn)為,不是全部注明了引用,就不存在剽竊,引用也應(yīng)有一個(gè)度和范圍限制。第四章類型及實(shí)例介紹按照上面檢測(cè)方法和指標(biāo)體系,TMLC能夠處理多個(gè)學(xué)術(shù)不端類型。在學(xué)位論文檢測(cè)中,通常不存在不妥署名、一稿多投等學(xué)術(shù)不端行為。對(duì)于學(xué)位論文檢測(cè)中各類學(xué)術(shù)不端行為,按照性質(zhì)嚴(yán)重性由低到高排序,主要包含:剽竊、篡改、偽造等。下面分別進(jìn)行介紹。4.1剽竊針對(duì)各種類型,下面分別舉例說(shuō)明:圖16段落剽竊示例4.2篡改篡改是指按照期望值隨意篡改或取舍數(shù)據(jù),以符合自己研究結(jié)論,通常有主觀取舍數(shù)據(jù)和篡改原始數(shù)據(jù)等形式。對(duì)于篡改,系統(tǒng)也具備一定伎倆進(jìn)行檢測(cè),首先來(lái)看一個(gè)例子,在一篇文件中提到:分詞準(zhǔn)確率為99.66%,詞性標(biāo)注準(zhǔn)確率為99.07%,利用CNKI已經(jīng)有相關(guān)技術(shù),系統(tǒng)能夠快速檢測(cè)與分詞準(zhǔn)確率和詞性標(biāo)注準(zhǔn)確率關(guān)于數(shù)值信息,供審查人員參考,對(duì)文件中數(shù)據(jù)值遠(yuǎn)高于當(dāng)前公布數(shù)據(jù)值情況,提醒審查人員仔細(xì)核查,如圖19所表示。圖19篡改檢測(cè)示例在圖中,上面黃色標(biāo)示是檢測(cè)文件中描述分詞準(zhǔn)確率和詞性標(biāo)注準(zhǔn)確率,下面部分則是在CNKI特色搜索功效——數(shù)值搜索中檢索到當(dāng)前關(guān)于分詞準(zhǔn)確率和詞性標(biāo)注準(zhǔn)確率描述。我們能夠觀察到,當(dāng)前檢測(cè)到所關(guān)于于分詞準(zhǔn)確率和詞性標(biāo)注準(zhǔn)確率描述文字中,其數(shù)值均低于檢測(cè)文件中所描述數(shù)值,所以,我們有理由對(duì)檢測(cè)文件中分詞準(zhǔn)確率產(chǎn)生懷疑,提醒審查人員深入核查。4.3偽造偽造特點(diǎn):新研究結(jié)果中提供材料、方法、數(shù)據(jù)、推理等方面不符合實(shí)際,無(wú)法經(jīng)過(guò)重復(fù)試驗(yàn)再次取得,有些甚至連原始數(shù)據(jù)都被刪除或丟棄,無(wú)法查證。偽造包含方面很多,能夠偽造數(shù)據(jù)、偽造基金、偽造項(xiàng)目、偽造數(shù)值、表格、圖形等。偽造基金/偽造項(xiàng)目:有些論文中虛設(shè)基金、項(xiàng)目支持,這種情況可經(jīng)過(guò)查詢政府相關(guān)基金項(xiàng)目庫(kù)能夠快速驗(yàn)證;偽造數(shù)值、圖表等知識(shí)元,則能夠經(jīng)過(guò)CNKI已經(jīng)有成熟數(shù)值搜索技術(shù)、圖表搜索技術(shù)進(jìn)行查證,起到警示作用。注意:偽造是檢測(cè)難度最高不端行為,還需要做深入、更深研究。4.4其余類型學(xué)術(shù)不端類型必定不止上面列出幾個(gè),其余現(xiàn)在能夠有所處理類型還包含:1.引用杜撰他人根本沒(méi)有說(shuō)過(guò)話,自己編造,卻作為他人話引用。尤其是杜撰引用國(guó)外學(xué)者。2.引文杜撰根本就不存在文件,杜撰一篇引文。第五章系統(tǒng)功效及實(shí)例分析TMLC主要功效包含:已發(fā)表文件檢測(cè)、論文檢測(cè)、問(wèn)題庫(kù)查詢、自建比對(duì)庫(kù)管理等,下面分別結(jié)合例子進(jìn)行介紹。5.1已發(fā)表文件檢測(cè)各注冊(cè)用戶可在權(quán)限范圍內(nèi)查看本單位已被CNKI正式收錄論文檢測(cè)結(jié)果。對(duì)于確定有問(wèn)題文件,還能夠?qū)⑵渲苯臃湃雴?wèn)題統(tǒng)計(jì)庫(kù)。其流程圖如圖20所表示:圖20已發(fā)表文件檢測(cè)流程圖用戶能夠選擇詳細(xì)某一年論文進(jìn)行查閱檢測(cè),也能夠經(jīng)過(guò)頁(yè)面提供檢索功效,檢索某一個(gè)作者論文或者按照論文篇名檢索詳細(xì)某一篇文件,如圖21所表示。圖21已發(fā)表文件檢測(cè)列表注意:因?yàn)橄嚓P(guān)原因,全部示例中包括詳細(xì)單位和個(gè)人信息基本都隱去。選擇某一篇論文,點(diǎn)擊論文標(biāo)題,進(jìn)入下一個(gè)頁(yè)面,對(duì)于學(xué)位論文來(lái)講,通常會(huì)被切分成幾個(gè)到十幾個(gè)段落,用戶能夠依次點(diǎn)擊查閱,如圖22所表示。圖22已發(fā)表文件切分段落點(diǎn)擊每一段落查看詳細(xì)檢測(cè)結(jié)果,包含:檢測(cè)指標(biāo),重合文字起源文件信息以及與其文字復(fù)制比,在頁(yè)面下部還標(biāo)紅了全部重合文字。讓用戶快速了解到選擇文件大約有多少文字與其余文件重合以及重合文字所處位置等,如圖23所表示。圖23檢測(cè)結(jié)果頁(yè)面(1)再選擇點(diǎn)擊某篇重合文字起源文件篇名,進(jìn)入下一頁(yè)面,該頁(yè)面顯示了檢測(cè)文件與重合文字起源文件詳細(xì)比對(duì)信息,兩篇文件全部重合文字部分都有藍(lán)色字體標(biāo)示,用戶能夠選擇左文任意藍(lán)色文字點(diǎn)擊,其字體顏色變?yōu)榧t色,同時(shí),右文中與之相同文字段將自動(dòng)標(biāo)紅,并自動(dòng)定位到頁(yè)面上部,便于用戶查閱,如圖24所表示。圖24已發(fā)表文件檢測(cè)頁(yè)面(2)點(diǎn)擊圖24頁(yè)面中“查看原版比對(duì)”按鈕,還能夠查看論文原版比對(duì),原版是指文件發(fā)表時(shí)排版樣式,這使得用戶能夠快速確實(shí)定網(wǎng)頁(yè)所指文件是否與原版文件文字一致,如圖25所表示。圖25原版比對(duì)頁(yè)面5.2論文檢測(cè)該項(xiàng)功效提供對(duì)論文實(shí)時(shí)在線檢測(cè)。將待檢測(cè)文件經(jīng)過(guò)互聯(lián)網(wǎng)提交到檢測(cè)系統(tǒng)服務(wù)器,系統(tǒng)依照論文長(zhǎng)度大小將在數(shù)秒內(nèi)返回檢測(cè)結(jié)果給用戶。包含以下特點(diǎn):1)多伎倆論文提交方式。在線提交論文方式包含三種:一是單篇論文在線提交,能夠選擇需要檢測(cè)某一論文直接上傳提交;二是批量論文在線提交,能夠?qū)⑿枰獧z測(cè)多篇論文壓縮為一個(gè)zip格式或rar格式壓縮文件,然后提交壓縮文件至檢測(cè)服務(wù)器,系統(tǒng)將自動(dòng)處理壓縮文件,完成壓縮文件內(nèi)全部論文檢測(cè);三是手工錄入方式,能夠在線錄入一段文字進(jìn)行檢測(cè),如圖26所表示。2)多格式論文處理能力。系統(tǒng)能夠自動(dòng)處理MSWord、PDF、CAJ、HTML、TXT等多個(gè)格式文檔,如圖26所表示。

圖26提交文件頁(yè)面3)文件夾式管理方式。為便于用戶管理,系統(tǒng)采取了用戶完全自主文件夾式管理方法。用戶能夠創(chuàng)建文件夾,設(shè)定文件夾各項(xiàng)系數(shù),包含:比對(duì)專業(yè)范圍選擇、檢測(cè)時(shí)間選擇、比對(duì)數(shù)據(jù)庫(kù)類型選擇等。在創(chuàng)建文件夾之后,當(dāng)用戶將文件提交到選擇文件夾之后,系統(tǒng)將自動(dòng)依照該文件夾設(shè)定各項(xiàng)系數(shù)進(jìn)行檢測(cè),而用戶無(wú)需每次都進(jìn)行系數(shù)設(shè)置操作。而且用戶能夠隨時(shí)對(duì)文件夾系數(shù)進(jìn)行修改,重新設(shè)定文件夾系數(shù),如圖27所表示。圖27文件夾式管理頁(yè)面4)便捷文件夾系數(shù)設(shè)置。用戶能夠設(shè)置比對(duì)專業(yè),比如只選擇醫(yī)學(xué)領(lǐng)域文件作為比對(duì)數(shù)據(jù)庫(kù);能夠設(shè)置檢測(cè)時(shí)間,比如只選擇到文件作為比對(duì)數(shù)據(jù)庫(kù);能夠設(shè)置比對(duì)庫(kù)類型,CNKI收錄了期刊、學(xué)位論文、會(huì)議論文、報(bào)紙、年鑒、工具書、專利、外文文件、學(xué)術(shù)文件引文等與科學(xué)研究、學(xué)習(xí)相關(guān)主要資源,這些資源組成了檢測(cè)系統(tǒng)豐富比對(duì)庫(kù)類型,用戶能夠選擇一個(gè)或多個(gè)比對(duì)庫(kù)進(jìn)行檢測(cè),在檢測(cè)系統(tǒng)中,用戶在提交論文頁(yè)面下,選擇創(chuàng)建文件夾鏈接,將出現(xiàn)如圖28所表示頁(yè)面,供用戶設(shè)置文件夾各項(xiàng)系數(shù)。圖28文件夾系數(shù)設(shè)置5)用戶完全自主控制模式。對(duì)于用戶提交全部文件,用戶擁有完全處置能力,能夠隨時(shí)進(jìn)行刪除。不但能夠刪除某一篇文件,還能夠刪除整個(gè)文件夾,如圖27所表示。注意:對(duì)于學(xué)位論文,因篇幅較大,系統(tǒng)只允許用戶重新檢測(cè)每一章節(jié),不能對(duì)整個(gè)論文進(jìn)行重新檢測(cè)。6)快速檢測(cè)結(jié)果瀏覽方式。當(dāng)系統(tǒng)檢測(cè)完成后,用戶能夠快速比對(duì)檢測(cè)文件與剽竊起源文件,系統(tǒng)自動(dòng)將兩篇文件文字重合部分標(biāo)示出來(lái),便于用戶進(jìn)行快速查閱檢驗(yàn)。一樣,系統(tǒng)實(shí)現(xiàn)了在文件原始格式(即發(fā)表時(shí)格式)上標(biāo)示比對(duì),更便于用戶準(zhǔn)確把握檢測(cè)結(jié)果,如圖29,30,31所表示。圖29論文章節(jié)列表圖30檢測(cè)結(jié)果詳細(xì)信息頁(yè)面圖31檢測(cè)結(jié)果比對(duì)頁(yè)面7)用戶能夠選擇將上傳論文放入個(gè)人比對(duì)庫(kù),以作為以

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論