基于B-S架構(gòu)的電子數(shù)據(jù)相似檢測審計(jì)方法研究_第1頁
基于B-S架構(gòu)的電子數(shù)據(jù)相似檢測審計(jì)方法研究_第2頁
基于B-S架構(gòu)的電子數(shù)據(jù)相似檢測審計(jì)方法研究_第3頁
基于B-S架構(gòu)的電子數(shù)據(jù)相似檢測審計(jì)方法研究_第4頁
基于B-S架構(gòu)的電子數(shù)據(jù)相似檢測審計(jì)方法研究_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、    基于b/s架構(gòu)的電子數(shù)據(jù)相似檢測審計(jì)方法研究    陳文佳摘要:在一個或者多個被審計(jì)數(shù)據(jù)源中可能存在相似重復(fù)實(shí)體,這些相似重復(fù)實(shí)體可能隱藏著審計(jì)項(xiàng)目中需要查找的疑點(diǎn),筆者采用了基于b/s架構(gòu)的軟件開發(fā)方法分析并設(shè)計(jì)出相似檢測審計(jì)方法。本文中介紹了相似檢測方法的定義和工作原理,并應(yīng)用了審計(jì)案例數(shù)據(jù)對該方法的實(shí)用性進(jìn)行了檢驗(yàn)。關(guān)鍵詞:相似檢測;電子數(shù)據(jù)審計(jì);案例應(yīng)用:tp31 文獻(xiàn)識別碼:a :1001-828x(2017)003-0-02在筆者研讀文獻(xiàn)和參與實(shí)踐的過程中發(fā)現(xiàn),一種用于數(shù)據(jù)清理的相似檢測方法可以有效地適用于審計(jì)工作中。在一個或者多個被

2、審計(jì)數(shù)據(jù)源中可能存在相似重復(fù)實(shí)體,這些相似重復(fù)實(shí)體可能隱藏著審計(jì)項(xiàng)目中需要查找的疑點(diǎn)。一、相似檢測方法的定義審計(jì)數(shù)據(jù)中也常常出現(xiàn)冗余或有意重復(fù)的部分,通過應(yīng)用相似檢測方法,一方面可以提高電子審計(jì)數(shù)據(jù)的質(zhì)量,另一方面審計(jì)人員在分析相似重復(fù)記錄時也可能挖掘出新的審計(jì)線索。相似重復(fù)記錄的產(chǎn)生通常發(fā)生在數(shù)據(jù)取得和傳遞過程中,審計(jì)人員需要結(jié)合審計(jì)數(shù)據(jù)本身的作用、來源等分析相似重復(fù)記錄產(chǎn)生的情況是否可以合理解釋,以及相似重復(fù)記錄產(chǎn)生后是否會引起重大的后果。二、相似檢測方法的工作原理(一)相似檢測的參數(shù)設(shè)置兩條記錄是否相似,常常是通過其具有代表性的屬性值判斷。因此計(jì)算相似度之前,首先需要選定判斷相似的屬性字

3、段并分配字段權(quán)重?,F(xiàn)實(shí)生活中,每個實(shí)體都有著多個屬性,判斷相似時,需要綜合各個屬性的相似情況。另外,每個屬性的重要性也是有差別的,因此,對每一個屬性需要設(shè)置權(quán)重來反映其在判定相似度的重要程度,權(quán)重的分配一般需要基于人員對數(shù)據(jù)屬性的理解和需求來自主地確定。(二)記錄相似度的算法和度量1.字符型字段的相似度計(jì)算方法對于字符型字段,其匹配算法采用編輯距離算法,這種算法是計(jì)算一個字符串通過插入、替換、刪除字符等編輯方式轉(zhuǎn)換成另一個字符串所需要的最少的編輯次數(shù),根據(jù)計(jì)算出的編輯距離,需要對應(yīng)地給出一個介于0和1之間的小數(shù)表示其相似的程度(完全不同時為0,完全相同時為1),這個數(shù)值的確定方法可以根據(jù)操作人

4、員的需要自行設(shè)定,漢字表述為主的數(shù)據(jù)通常適用這個算法。2.數(shù)值型字段的相似度計(jì)算方法對于數(shù)值型字段,可以通過計(jì)算數(shù)字間的相對差異取得其相似度:其中a與b為數(shù)值型字段。值得注意的是,通常情況下s(a,b)的取值范圍為0,1,而當(dāng)兩個數(shù)值符號不同時,會導(dǎo)致s(a,b)0,在該情況下,相似度取值為0。3.布爾型字段的相似度計(jì)算方法對于布爾型字段,如果相同,則相似度為1,如果不同,則相似度為0。計(jì)算完每個字段對應(yīng)的相似度后,結(jié)合參數(shù)設(shè)置時確定的字段權(quán)重,計(jì)算出兩條記錄的整體相似度,這個相似度的值應(yīng)當(dāng)也介于0和1之間,數(shù)值越大代表其為相似記錄的可能性也越大。三、電子數(shù)據(jù)相似檢測審計(jì)的應(yīng)用在多個被審計(jì)數(shù)據(jù)

5、源中可能含有相似的內(nèi)容,這些相似內(nèi)容在某些情況下也許會成為審計(jì)問題的突破口。下文將以某審計(jì)案例數(shù)據(jù)為例介紹本系統(tǒng)的應(yīng)用。為了審計(jì)某省應(yīng)取消的行政審批事項(xiàng)是否及時取消,審計(jì)人員搜集了國務(wù)院取消行政審批事項(xiàng)的發(fā)文,并讓省法制辦公室提供該省行政審批事項(xiàng)的清單。審計(jì)人員的審計(jì)方法是將國務(wù)院發(fā)文中每項(xiàng)取消的事項(xiàng)帶入該省行政審批事項(xiàng)清單中查找是否存在應(yīng)取消的審批事項(xiàng),隨時將可疑的審批事項(xiàng)記錄下來。然而,2013年以來,國務(wù)院通過取消和下放行政審批事項(xiàng)共618項(xiàng),進(jìn)行完所有的查找至少需要一個小時。如果使用本系統(tǒng)的相似檢測審計(jì)方法,只需要簡單的幾步操作,具體如下:1.將待對比的兩個文件轉(zhuǎn)換為數(shù)據(jù)庫文件的格式。

6、具體操作過程為:打開access并新建“空白桌面數(shù)據(jù)庫”,選擇從外部獲取數(shù)據(jù),在對應(yīng)類型下選擇數(shù)據(jù)文件導(dǎo)入即可。本案例中的文檔應(yīng)當(dāng)是國務(wù)院取消行政審批事項(xiàng)的發(fā)文和該省行政審批事項(xiàng)的清單。2.在網(wǎng)頁界面中,選擇進(jìn)行匹配的數(shù)據(jù)庫文件,將數(shù)據(jù)庫文件上傳到系統(tǒng)指定的目錄下,并界面中顯示出兩個文件中的內(nèi)容,同時,左側(cè)的“表一字段”和“表二字段”下方的下拉菜單直接獲取表頭的字段名。3.根據(jù)審計(jì)的需要,首先選擇需要進(jìn)行相似檢測的字段,并根據(jù)字段的數(shù)據(jù)類型選擇相應(yīng)的相似檢測算法,再設(shè)置每對字段在此次匹配中的權(quán)重,接著設(shè)置“字段間閾值”和“記錄閾值”,用于判斷字段相似度和記錄相似度是否滿足審計(jì)人員認(rèn)定的相似程度

7、。本案例中,兩張表的對應(yīng)字段為:表一的“項(xiàng)目名稱”與表二的“權(quán)力名稱”相對應(yīng),表一的“審批部門”和表二的“行使主體”相對應(yīng)。其中,“權(quán)力名稱”的相似比“部門”的相似更重要,所以暫且設(shè)置“權(quán)力名稱”的權(quán)重為0.7,“權(quán)力名稱”的權(quán)重為0.3,假設(shè)將字段閾值控制在0.3,記錄閾值為0.4,執(zhí)行命令后獲得了兩組記錄(詳細(xì)內(nèi)容見圖1),這兩組數(shù)據(jù)可以作為審計(jì)線索進(jìn)行下一步審計(jì)工作。四、結(jié)語上述案例中,使用本系統(tǒng)的相似檢測審計(jì)方法得到的結(jié)果與審計(jì)人員得到的結(jié)果是一致的,因此,使用相似檢測審計(jì)系統(tǒng)能夠更加便于審計(jì)人員發(fā)現(xiàn)更多的審計(jì)線索,提高審計(jì)工作的效率和效果。參考文獻(xiàn):1陳偉.大數(shù)據(jù)環(huán)境下基于模糊匹配的審計(jì)方法j.中國注冊會計(jì)師,2016(11):84-88+3.2殷秀葉.大數(shù)據(jù)環(huán)境下的相似重復(fù)記錄檢測方法j.武漢工程大學(xué)學(xué)報(bào),2014(09):66-69.基金項(xiàng)目:本文系2016年南京審計(jì)大學(xué)研究生科研創(chuàng)新計(jì)劃項(xiàng)目(項(xiàng)目編號:mz2016001)的研究成果之一。 現(xiàn)代經(jīng)濟(jì)信息2017年3期現(xiàn)代經(jīng)濟(jì)信息的其它文章

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論