軟件設計說明書(基于元數(shù)據(jù)的虛擬數(shù)據(jù)自動生成系統(tǒng))_第1頁
軟件設計說明書(基于元數(shù)據(jù)的虛擬數(shù)據(jù)自動生成系統(tǒng))_第2頁
軟件設計說明書(基于元數(shù)據(jù)的虛擬數(shù)據(jù)自動生成系統(tǒng))_第3頁
軟件設計說明書(基于元數(shù)據(jù)的虛擬數(shù)據(jù)自動生成系統(tǒng))_第4頁
軟件設計說明書(基于元數(shù)據(jù)的虛擬數(shù)據(jù)自動生成系統(tǒng))_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、基于元數(shù)據(jù)的虛擬數(shù)據(jù)自動生成系統(tǒng)設計說明書1 系統(tǒng)簡介信息系統(tǒng)一般都是以數(shù)據(jù)庫為后臺進行開發(fā)的,其功能與性能測試往往需要一定量的數(shù)據(jù)為基礎。由于安全保密和時效性等原因,在信息系統(tǒng)的開發(fā)過程中不能直接加載真實數(shù)據(jù)進行測試。因此,需要大量虛擬數(shù)據(jù)對系統(tǒng)進行全面測試。虛擬數(shù)據(jù)的獲取根據(jù)錄入的方法的不同可以分為人工和自動生成兩種方式。人工錄入方式,仿真程度高,確保了虛擬數(shù)據(jù)的質(zhì)量。但以每張表的記錄數(shù)百萬條計,工作量會非常大,且此工作沒有繼承性,以某個需求背景下錄入的數(shù)據(jù),當背景變化后難以重用。因此,設計一個虛擬數(shù)據(jù)生成工具,自動生成虛擬數(shù)據(jù)非常必要。本系統(tǒng)的設計目的就是為自動為用戶提供海量虛擬數(shù)據(jù)。本

2、系統(tǒng)的設計采用了元數(shù)據(jù)技術(shù),根據(jù)不同需求背景,通過元數(shù)據(jù)對數(shù)據(jù)庫結(jié)構(gòu)、數(shù)據(jù)特征和關系的描述,設定的模擬數(shù)據(jù)生成規(guī)則,自動生成海量的模擬數(shù)據(jù)。歸納起來,本系統(tǒng)具有如下特點:(1)能夠適應數(shù)據(jù)需求變化隨著技術(shù)的發(fā)展和運用場景的變化,信息系統(tǒng)對虛擬數(shù)據(jù)在結(jié)構(gòu)和內(nèi)容上將提出新的要求。通過傳統(tǒng)的手工錄入方式,將不得不大量修改記錄甚至重新錄入,實現(xiàn)起來時間長,工作量大。本文檔所描述的虛擬數(shù)據(jù)生成系統(tǒng)采用了基于元數(shù)據(jù)的規(guī)則生成技術(shù),當需求改變時,及時更新相關配置,就可以重新自動生成虛擬數(shù)據(jù),提高生產(chǎn)效率。(2)能夠高效靈活實現(xiàn)數(shù)據(jù)生成規(guī)則配置本系統(tǒng)對虛擬數(shù)據(jù)的生成是基于數(shù)據(jù)生成規(guī)則,而數(shù)據(jù)生成規(guī)則的制定,首

3、先從數(shù)據(jù)庫結(jié)構(gòu)中自動讀取結(jié)構(gòu)化元數(shù)據(jù),獲取數(shù)據(jù)的特征及關系,構(gòu)成基本生成規(guī)則。在基本數(shù)據(jù)規(guī)則的基礎上系統(tǒng)給出了針對不同類型數(shù)據(jù)的規(guī)范表達式,幫助用戶定制符合自身需求的生成規(guī)則,實現(xiàn)數(shù)據(jù)生成規(guī)則配置的高效靈活。(3)具有較好的資源字典擴展性信息系統(tǒng)所在的業(yè)務領域是不斷地發(fā)展的,因此總會產(chǎn)生一些對新類型數(shù)據(jù)需求,而這些需要應及時加入到信息系統(tǒng)中。本虛擬數(shù)據(jù)生成系統(tǒng)提供良好的資源字典維護功能,只需要及時更新字典中相關數(shù)據(jù),既可實現(xiàn)了數(shù)據(jù)的無縫擴展。(4)能夠海量生成虛擬數(shù)據(jù)本系統(tǒng)的設計目的既實現(xiàn)海量虛擬數(shù)據(jù)的生成。用戶一旦根據(jù)需求,配置好數(shù)據(jù)生成規(guī)則實現(xiàn)資源字典的更新后,系統(tǒng)既可運用規(guī)則算法,自動生

4、成海量數(shù)據(jù),經(jīng)測試生成1百萬條記錄的數(shù)據(jù),大約花費10分鐘。2 軟件設計2.1軟件組成及框架“基于元數(shù)據(jù)的虛擬數(shù)據(jù)自動生成系統(tǒng)”的基本架構(gòu)及連接關系如圖1所示。系統(tǒng)采用三層體架構(gòu),由數(shù)據(jù)支撐層、系統(tǒng)支撐層、系統(tǒng)應用層組成。圖1 系統(tǒng)組成及連接關系圖數(shù)據(jù)支撐層為系統(tǒng)支撐層和系統(tǒng)應用層提供數(shù)據(jù)支撐,包括源數(shù)據(jù)庫和虛擬數(shù)據(jù)庫兩部分。源數(shù)據(jù)庫為包含真實數(shù)據(jù)的信息系統(tǒng)數(shù)據(jù)庫,包含了數(shù)據(jù)庫結(jié)構(gòu)、字典類數(shù)據(jù)(用于抽取的固定數(shù)據(jù),如地名字典表)等信息,是整個虛擬數(shù)據(jù)生成的模板和來源。虛擬數(shù)據(jù)庫與源數(shù)據(jù)庫結(jié)構(gòu)相同,系統(tǒng)最終生成的虛擬數(shù)據(jù)存放于此。系統(tǒng)支撐層為系統(tǒng)應用層提供后臺軟件支撐,包括元數(shù)據(jù)管理、虛擬數(shù)據(jù)生

5、成兩個子模塊。元數(shù)據(jù)管理子模塊用于從源數(shù)據(jù)庫中讀取描述數(shù)據(jù)特征的結(jié)構(gòu)化元數(shù)據(jù),如數(shù)據(jù)的長度、類型、格式等,作為生成虛擬數(shù)據(jù)的基本標準。虛擬數(shù)據(jù)生成子模塊根據(jù)虛擬數(shù)據(jù)生成規(guī)則和生成需求(如生成虛擬數(shù)據(jù)數(shù)量等)生成數(shù)據(jù),并存儲到虛擬數(shù)據(jù)庫中。系統(tǒng)應用層面向用戶,包括虛擬規(guī)則設置、數(shù)據(jù)需求設置兩個子模塊。生成虛擬規(guī)則設置子模塊將輔助用戶,在元數(shù)據(jù)描述特征的基礎上,設置數(shù)據(jù)生成規(guī)則。在數(shù)據(jù)需求設置子模塊中,用戶錄入生成數(shù)據(jù)量、是否唯一等用戶對數(shù)據(jù)的整體需求。2.2 實現(xiàn)方法虛擬數(shù)據(jù)要達到代替真實數(shù)據(jù)的目的,必須做到與真實數(shù)據(jù)不但形似而且神似,即兩者雖然在內(nèi)容上不盡相同,但在結(jié)構(gòu)和反映事物特征上要相同。

6、本系統(tǒng)嘗試以數(shù)據(jù)建模理論為基礎,結(jié)合工程實踐,通過分析數(shù)據(jù)特征,找出規(guī)律,提出虛擬數(shù)據(jù)的實現(xiàn)方法。描述實體的數(shù)據(jù)有以下幾個主要特征:1實體屬性特征,作為數(shù)據(jù)庫中原子的數(shù)據(jù)值,固有的長度、類型、格式等特征;2實體關系特征,描述數(shù)據(jù)實體之間是如何相關的,根據(jù)工程實踐關注以下幾種:(1)關聯(lián)關系,包括一對一、一對多、多對多等數(shù)據(jù)實體間的關聯(lián)關系;(2)分類關系,關聯(lián)關系的一種特殊關系,相關的實體被分為一組,其中所有公共屬性統(tǒng)一在一個超類實體中。(3)自反關系,關聯(lián)關系的一種特殊關系,是指一個實體所參與的關系,在這個關系中該實體即是父實體又是子實體。2.2.1實體屬性特征實現(xiàn)實體屬性特征描述時包括兩個

7、方面。一是數(shù)據(jù)所在字段的類型,如字段長度、類型、格式等;二是反映真實實體的特征,例如“電話號碼”字段是長度為10的字符串,它有自定義格式:“XXXXXXXXX”,前四個“X”表示區(qū)號,后五個“X”表示號碼,“”為二者的分隔。真實實體用數(shù)據(jù)進行描述時,通常包含這二個特征。實體屬性特征的第一個方面是數(shù)據(jù)的基本特征,通常較好處理,只需要按數(shù)據(jù)所在字段的類型、長度要求,調(diào)用隨機函數(shù)生成符合該特征的虛擬數(shù)據(jù)即可。實體屬性特征的第二個方面,需要在對真實實體特征仔細分析的基礎上,利用不同途徑實現(xiàn)。下面嘗試四種處理方式:1隨機生成法隨機生成法首先按照數(shù)據(jù)的類型、長度、大小等約束條件劃定數(shù)據(jù)的取值范圍,然后在范

8、圍區(qū)間內(nèi)隨機生成數(shù)據(jù)。圖2隨機生成法流程隨機生成法是虛擬數(shù)據(jù)生成的基本方法,是其他生成法的基礎??梢哉f其他生成法是在隨機生成法基礎上增加其它相關功能和方法實現(xiàn)的。系統(tǒng)默認對數(shù)據(jù)的生成采用該方法,特點是適用范圍廣,任何數(shù)據(jù)的虛擬都可以采用該方法實現(xiàn),但遇到需要考驗數(shù)據(jù)的特殊結(jié)構(gòu)和數(shù)據(jù)間的邏輯關系時該方式并不適用。1替換實現(xiàn)法主要用于格式固定的隨機數(shù)據(jù)。這類數(shù)據(jù)有固定的格式,且有部分數(shù)值為可變,例如“單位名稱”字段的基本格式為“第XX單位XXX部門”。針對這類數(shù)據(jù)的特點將它分段為固定部分和動態(tài)部分,固定部分保持不變,動態(tài)部分調(diào)用隨機函數(shù)實現(xiàn),最后合并各段得到虛擬數(shù)據(jù)。如前例,“X”為隨機部分,其他

9、為固定部分,處理時調(diào)用隨機函數(shù)生成一個十位整數(shù)替換“第XX單位”中的“XX”隨機部分;一個為小于1000的整數(shù)代替“第XXX部門”中的“XXX” 隨機部分,然后合并固定和動態(tài)部分生成虛擬數(shù)據(jù)。圖2 替換實現(xiàn)法生成流程替代生成法是基礎方法,因為大多數(shù)數(shù)據(jù)的數(shù)值都有一定的格式規(guī)范,即使沒有格式規(guī)范的數(shù)據(jù),也可以認為該數(shù)據(jù)動態(tài)數(shù)值部分為數(shù)據(jù)本身,固定格式部分為空,如果不必考慮該數(shù)據(jù)的邏輯關系,該算法適合生成絕大多數(shù)虛擬數(shù)據(jù)。當然,由于替代生成法是采用隨機方式生成數(shù)據(jù)的,因此遇到需要考驗數(shù)據(jù)間的拓撲、邏輯、關聯(lián)的信息時,該方式并不適用。2枚舉法主要用于有限集且值域較小的數(shù)據(jù)。處理方法是,首先建立數(shù)據(jù)所

10、有可以包括的集合,同時給出集合中數(shù)據(jù)出現(xiàn)的概率。然后按照概率隨機抽取集合中的數(shù)據(jù)作為虛擬數(shù)據(jù)。這種方法在實際運用中仿真度高,可用性較強。圖3 枚舉法生成流程3組合法將一個字段的值設定為幾個特定值的組合。組合規(guī)則可以由多個參數(shù)組成,各組合參數(shù)可以從系統(tǒng)數(shù)據(jù)字典和樣本數(shù)據(jù)庫中取值,也可以從目標數(shù)據(jù)庫中其他表中取值,還可以是固定的一個詞。比如“公司名稱”字段的值可以設定為“地名”+“通信責任有限公司”,其中“地名”可以從基礎數(shù)據(jù)庫中的地名表取值,“通信責任有限公司”為一個固定詞組。圖3 組合法生成流程組合法應適合虛擬有限數(shù)據(jù)集的數(shù)據(jù),如果數(shù)據(jù)分布信息設計成熟,還能確保虛擬數(shù)據(jù)的邏輯分布信息,在實際運

11、用中仿真度高,可用性較強。 4偏移生成法偏移生成法是利用一定數(shù)量的真實數(shù)據(jù),按照設定的偏移規(guī)則進行隨機偏移,從而遮蔽數(shù)據(jù)的真實性,生成類似真實數(shù)據(jù)的虛擬數(shù)據(jù)。虛擬數(shù)據(jù)生成法實際上就是以真實數(shù)據(jù)作為基礎數(shù)據(jù),并根據(jù)字符、數(shù)字或日期等類型的字段整體進行偏移規(guī)則設置,也可以對以上字段類型的字段單獨進行偏移規(guī)則設置。圖4 偏移生成流程偏移生成法主要工作是對偏移規(guī)則的設計,配置簡單;生成時偏移即可生成,數(shù)據(jù)速度較快,且生成的虛擬數(shù)據(jù)與真實數(shù)據(jù)具有很高的相似度,物理意義明確、邏輯關系清晰,可理解性更強。偏移生成法的局限性在于該方法的基礎是真實數(shù)據(jù),因此必須有真實數(shù)據(jù)才可進行。另外,在偏移規(guī)則的設定上要著重

12、斟酌,因為偏移量過大,將造成數(shù)據(jù)失真,過小又不足以遮蔽數(shù)據(jù)的真實性。5混淆生成法混淆生成法是對真實數(shù)據(jù)的屬性進行隨機交換,從而實現(xiàn)真實數(shù)據(jù)的遮蔽。真實數(shù)據(jù)中常有這樣的屬性,將其單個取出,難以表達明確的含義,而需要多個組合,才能包含足夠的信息量?;煜煞ㄊ菍?shù)據(jù)中這類組合屬性打散進行重新隨機組合,獲取虛擬數(shù)據(jù)的方法。比如,對于“人員信息表”,單獨獲取“姓名”并沒有多大的意義,但當“姓名”和“職位”組合就成為描述個人情況的關鍵信息。利用混淆生成法將“姓名”與“職位”在表中進行重新隨機組合,既可生成虛擬數(shù)據(jù)。與替換生成法相比,不但確保了“姓名”的質(zhì)量(不會出現(xiàn)隨機而生成的奇怪人名),“職位”的布局

13、結(jié)構(gòu)也與真實的拓撲情況基本相同,從而在保障數(shù)據(jù)質(zhì)量的同時,遮蔽了數(shù)據(jù)的真實性。圖5混淆生成法生成流程混淆生成法生成的虛擬數(shù)據(jù)與真實數(shù)據(jù)具有很高的相似度,能很好的保存真實數(shù)據(jù)的拓撲結(jié)構(gòu)和邏輯關系,數(shù)據(jù)質(zhì)量高?;煜煞ㄒ紤]哪些屬性的組織包含關鍵信息,而不需要過多考慮數(shù)據(jù)的邏輯關系和拓撲結(jié)構(gòu)等,因此設置規(guī)則更加簡便。由于該方法的基礎是真實數(shù)據(jù),必須有真實數(shù)據(jù)才可進行,并且如果數(shù)據(jù)的邏輯關系和拓撲結(jié)構(gòu)也是需要遮蔽的信息,就要酌情使用該方法。2.2.2 實體關系特征實現(xiàn)依據(jù)實體屬性特征生成的數(shù)據(jù),能夠保證虛擬數(shù)據(jù)合格,但在反應數(shù)據(jù)間關聯(lián)關系的合理性方面是不足的。針對不同關聯(lián)關系,提出相應的處理方法。

14、需要注意的是,系統(tǒng)主要解決工程中實際問題,因此并非嚴格遵循數(shù)據(jù)建模相關概念。1外鍵關聯(lián)關系生成法實體間的關聯(lián)關系落到物理模型層次,表現(xiàn)為表與表間的外鍵關系,在該關系中作為主鍵存在,提供數(shù)據(jù)的表將之稱為字典表,在處理時隨機抽取字典表中的數(shù)據(jù)直接放入到虛擬表中對應字段即可。但在實際工程中,存在大量和外鍵關系類似,但并非嚴格符合數(shù)據(jù)建模的關系,例如虛擬表A中有“通信地址”字段,那么它與地名字典表存在類似外鍵關聯(lián)的關系。對該數(shù)據(jù)的處理,不是簡單的直接抽取,而是對抽取的數(shù)據(jù)經(jīng)過一定的規(guī)則轉(zhuǎn)換后,生成虛擬數(shù)據(jù),本文稱這種轉(zhuǎn)換后引用的關系為“函數(shù)引用”。如上例 “通信地址”中的數(shù)據(jù)“XX市XX區(qū)XX街道XX

15、X號”,“XX市XX區(qū)XX街道”部分從地名字典表獲得,而“XXX號”可以隨機生成,然后將兩者結(jié)合,就生成了虛擬的“通信地址”數(shù)據(jù)。圖6 外鍵關聯(lián)關系生成法流程外鍵關聯(lián)關系生成法適合于有主外鍵關系,或者隱含主外鍵關系的虛擬數(shù)據(jù)生成。配置完整字典表,設計符合實際情況的規(guī)則是確保是本方法成功的兩大關鍵,因此一旦做好這兩個主要工作,系統(tǒng)就可以很方便的生成高質(zhì)量的虛擬數(shù)據(jù)。2分類關系生成法分類關系是關聯(lián)關系中特殊的一類,考慮到獨立實體上有被稱為超類實體的一個高層實體,因此在生成獨立實體的特有數(shù)據(jù)時,要首先生成超類實體的共同屬性數(shù)據(jù)。其他處理方式與一般關聯(lián)關系基本相同。圖7 分類關系生成法流程分類關系生成

16、法本身不是生成虛擬數(shù)據(jù)的方法,而應當認為是針對包含超類實體關系的虛擬數(shù)據(jù)的一種處理流程。實際數(shù)據(jù)的處理時,遵循本方法的流程進程,對具體的數(shù)據(jù)虛擬可以使用前面提供的生成法進行處理,從而確保虛擬數(shù)據(jù)的邏輯結(jié)構(gòu)完整。3自反關系生成法自反關系是關聯(lián)關系中特殊的一類,由于關系中該表字段的數(shù)據(jù)被本表其他字段引用,因此在實體屬性間存在依賴關系,即表自身是自己的字典表。在實際工程中,將該關系進行了擴展,字段間不僅僅是引用,還包括相互間的邏輯關系,如“入伍時間”字段中的數(shù)據(jù)早于“現(xiàn)崗時間”字段的數(shù)據(jù)。圖8 自反關系生成法流程自反關系生成法適用于在同一張表中不同記錄間存在引用或者邏輯關聯(lián)關系的虛擬數(shù)據(jù)生成。該方法

17、與關聯(lián)關系生成法近似,但因為在數(shù)據(jù)的生成的過程中存在自依賴關系,因此在某個數(shù)據(jù)生成要對依賴的記錄是否存在進行判斷,判斷存在才能生成。4外鍵組關系生成法外鍵組關系是指虛擬表中一組字段來自于字典表中對應的一組字段的數(shù)據(jù)。這個概念與前面描述的外鍵關系相似,只是對應的字段從一對一變?yōu)槎鄬Χ嗔?。下面給出一個實例來說明外鍵組關系的含義,并給出處理方式:假設某“臺站”表中有“臺站名稱”字段格式為“XXX短波站”(“XXX”為地名),“臺站經(jīng)度”字段格式為“XXXXXXXXX”(小數(shù)點后取6位的浮點數(shù)),“臺站緯度”字段格式同經(jīng)度字段。三個字段的虛擬數(shù)據(jù)可以通過讀取“地址字典表”中地名、經(jīng)度、緯度三個字段的數(shù)

18、據(jù)獲取。但如果這三個字段分別隨機獲取,會出現(xiàn)地名與經(jīng)緯度不一致的情況,如臺站名稱為“北京短波站”的經(jīng)緯度可能偏移到廣州一帶,這種虛擬數(shù)據(jù)合格但不合理,不可用。因此要將地址字典表中的三個字段的數(shù)據(jù)看成一組,從一條記錄中讀取,處理流程如圖5:圖9 外鍵組關系生成法流程外鍵組關系生成法適合于有主外鍵關系,或者隱含主外鍵關系的一組虛擬數(shù)據(jù)生成。外鍵組關系生成法是外鍵關聯(lián)關系生成法的加強,在使用該方法之前要依據(jù)元數(shù)據(jù)的描述信息對需要成組生成的數(shù)據(jù)進行提取并規(guī)范,一旦設計完成后,具體實現(xiàn)與外鍵關系生成法近似。3 使用說明3.1 使用環(huán)境本系統(tǒng)是采用Delhpi7.0開發(fā)的,支持的數(shù)據(jù)庫是Oracle8i,

19、可在windows XP、window2007等操作系統(tǒng)中運行。3.2 使用流程本系統(tǒng)可用生成仿真數(shù)據(jù)。主要工作包括:選擇虛擬表、數(shù)據(jù)需求設置、配置虛擬數(shù)據(jù)規(guī)則、虛擬數(shù)據(jù)生成。具體組織流程如圖10所示。圖10 使用流程3.2.1選擇混淆表用戶選擇需要生成虛擬數(shù)據(jù)的表后,系統(tǒng)調(diào)用元數(shù)據(jù)管理功能分析該表的結(jié)構(gòu)信息,獲取該表的元數(shù)據(jù)信息。系統(tǒng)根據(jù)獲取的元數(shù)據(jù),初步生成虛擬數(shù)據(jù)生成規(guī)則,為用戶進一步配置提供基礎。初步生成虛擬數(shù)據(jù)生成規(guī)則如下:(1)默認根據(jù)字段的類型、長度等生成隨機數(shù)據(jù)生成規(guī)則。(1)判斷字段是否主外鍵關系,如果有,自動生成外鍵關系生成規(guī)則。(2)根據(jù)字段類型和長度,自動生成該類型隨機

20、數(shù)的生成規(guī)則。(3)判斷字段是否為唯一鍵,自動生成唯一鍵生成規(guī)則,防止違反數(shù)據(jù)約束條件。(4)判斷表中主鍵或唯一鍵是否包含多個字段,如果包含將這些字段分為一組生成約束條件。3.2.2數(shù)據(jù)需求設置用戶在數(shù)據(jù)需求設置界面填寫對虛擬數(shù)據(jù)的需求。主要設置如下:(1)虛擬數(shù)據(jù)的數(shù)據(jù)量,在“虛擬數(shù)據(jù)量”文本框中填寫大于0的整數(shù),確定生成虛擬數(shù)據(jù)的數(shù)據(jù)量。(2)選擇同步虛擬從表。虛擬數(shù)據(jù)表的同時是否同步虛擬從表數(shù)據(jù),如果虛擬從表數(shù)據(jù),選擇從表,并進行該表的虛擬規(guī)則配置(配置方式與虛擬數(shù)據(jù)表基本相同)。(3)選擇常用字典表。選擇參與虛擬數(shù)據(jù)生成的基本字典表,如地名、人名等表,為替換法、枚舉法、組合法等方法提供

21、基礎。3.2.3配置虛擬數(shù)據(jù)規(guī)則用戶在系統(tǒng)自動生成的數(shù)據(jù)規(guī)則上進行修改,生成符合用戶需求的虛擬數(shù)據(jù)生成規(guī)則:1精簡數(shù)據(jù)取值范圍系統(tǒng)按照元數(shù)據(jù)自動生成的數(shù)據(jù)取值范圍,該范圍通常過大,并不能完全滿足用戶需求。用戶可以在系統(tǒng)設定取值范圍內(nèi),進一步對取值范圍進行精簡,但獲取的新范圍不超過原有范圍,以免違法數(shù)據(jù)的約束條件。如果數(shù)據(jù)的取值方法固定,如人名、地名等,可將基本字典表作為取值范圍進行設置。2設置數(shù)據(jù)格式用戶對有某些數(shù)據(jù)有固定的格式要求,如電話號碼、郵政編碼等。設置數(shù)據(jù)格式,使數(shù)據(jù)的生成按照該格式進行。3組合數(shù)據(jù)組某些字段之間有相應的關聯(lián)關系,如工作時間和在崗時間,前一個一定早于后一個,對這些有關

22、聯(lián)關系的字段,可將其視為一組,進行同步處理。4連接關聯(lián)關系字段包含的外鍵、自相關、分類等關聯(lián)關系,系統(tǒng)通過元數(shù)據(jù)信息,通??梢宰詣由?,如果用戶認為這類關聯(lián)關系不能滿足需求,可增加這些關聯(lián)關系,但不允許刪除默認生成關聯(lián)關系,防止破壞數(shù)據(jù)的約束性。3.2.4虛擬數(shù)據(jù)生成系統(tǒng)根據(jù)配置好的虛擬數(shù)據(jù)生成規(guī)則,調(diào)用不同生成法產(chǎn)生虛擬數(shù)據(jù)。生成流程如下:(1)遍歷虛擬數(shù)據(jù)表中全部字段,對每個字段依據(jù)規(guī)則采用不同方式生成滿足用戶需求的數(shù)據(jù)量。(2)首先確定字段是否是從屬與某個外鍵組,如果是,將從屬該外鍵組的其他字段也提取出來,調(diào)用外鍵組關系生成法生成這幾個字段的虛擬數(shù)據(jù)。生成虛擬數(shù)據(jù)的字段不再參與遍歷。(3

23、)確定字段是否有外鍵、分類、自反關聯(lián)關系規(guī)則,如果有根據(jù)規(guī)則描述信息,分別調(diào)用外鍵關聯(lián)關系生成法、分類關聯(lián)關系生成法或自反關聯(lián)關系生成法等方法生成達到用戶需求量的虛擬數(shù)據(jù)。生成虛擬數(shù)據(jù)的字段不再參與遍歷。(4)如果字段不涉及實體關系特征的實現(xiàn),查看描述字段生成規(guī)則,確定其實體屬性特征實現(xiàn)方法。分別調(diào)用替換生成法、組合生成法、偏移生成法、混淆生成法等方法生成達到用戶需求量的虛擬數(shù)據(jù)。生成虛擬數(shù)據(jù)的字段不再參與遍歷。3.3 操作使用3.3.1選擇虛擬數(shù)據(jù)表系統(tǒng)啟動后,在列表中顯示當前可以訪問的表。用戶選擇要虛擬數(shù)據(jù)的表對象(下文稱該表為虛擬表)。系統(tǒng)自動執(zhí)行以下兩步操作:(1)讀取該對象的元數(shù)據(jù)信息,為下一步虛擬規(guī)則設置提供準備。(2)根據(jù)元數(shù)據(jù)信

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論