大數(shù)據(jù)專業(yè)英語(yǔ)教程 課件 Unit 2 BData Modeling_第1頁(yè)
大數(shù)據(jù)專業(yè)英語(yǔ)教程 課件 Unit 2 BData Modeling_第2頁(yè)
大數(shù)據(jù)專業(yè)英語(yǔ)教程 課件 Unit 2 BData Modeling_第3頁(yè)
大數(shù)據(jù)專業(yè)英語(yǔ)教程 課件 Unit 2 BData Modeling_第4頁(yè)
大數(shù)據(jù)專業(yè)英語(yǔ)教程 課件 Unit 2 BData Modeling_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

DataModeling

Unit

2TextBContents

NewWords

Abbreviations

Phrases參考譯文NewWordsNewWordsPhrasesPhrasesAbbreviationsListeningtoTextA數(shù)據(jù)建模數(shù)據(jù)建模是將復(fù)雜的軟件系統(tǒng)設(shè)計(jì)記錄為易于理解的圖的過(guò)程,該圖使用文本和符號(hào)來(lái)表示數(shù)據(jù)需求流動(dòng)的方式。該圖可用于確保有效利用數(shù)據(jù),作為構(gòu)建新軟件或重新設(shè)計(jì)舊版應(yīng)用程序的藍(lán)圖。數(shù)據(jù)建模是數(shù)據(jù)科學(xué)家或其他參與數(shù)據(jù)分析的人員的一項(xiàng)重要技能。傳統(tǒng)上,數(shù)據(jù)模型在項(xiàng)目的分析和設(shè)計(jì)階段建立,以確保充分理解新應(yīng)用程序的需求。數(shù)據(jù)模型也可以在數(shù)據(jù)生命周期的稍后階段調(diào)用,以使程序員最初在臨時(shí)基礎(chǔ)上創(chuàng)建的數(shù)據(jù)設(shè)計(jì)更合理。1.數(shù)據(jù)建模方法數(shù)據(jù)建??赡苁且粋€(gè)艱苦的前期過(guò)程,有時(shí)被視為與快速開(kāi)發(fā)方法不符。隨著敏捷編程已被更廣泛用于加速開(kāi)發(fā)項(xiàng)目,在某些情況下正在采用事后建模的數(shù)據(jù)建模方法。通常,數(shù)據(jù)模型可以看作是流程圖,它說(shuō)明了數(shù)據(jù)之間的關(guān)系。它使利益相關(guān)者能夠在編寫(xiě)任何編程代碼之前識(shí)別錯(cuò)誤并進(jìn)行更改?;蛘?,可以將模型作為逆向工程工作的一部分引入,以從現(xiàn)有系統(tǒng)中提取模型,如NoSQL數(shù)據(jù)所示。參考譯文數(shù)據(jù)建模人員經(jīng)常使用多個(gè)模型來(lái)查看相同的數(shù)據(jù),并確保已識(shí)別所有流程、實(shí)體、關(guān)系和數(shù)據(jù)流。他們通過(guò)收集業(yè)務(wù)利益相關(guān)者的需求來(lái)啟動(dòng)新項(xiàng)目。數(shù)據(jù)建模階段大致分成創(chuàng)建多種邏輯數(shù)據(jù)模型,這些邏輯數(shù)據(jù)模型顯示特定的屬性、實(shí)體以及實(shí)體與物理數(shù)據(jù)模型之間的關(guān)系。邏輯數(shù)據(jù)模型用作創(chuàng)建物理數(shù)據(jù)模型的基礎(chǔ),該物理數(shù)據(jù)模型針對(duì)要實(shí)現(xiàn)的應(yīng)用程序和數(shù)據(jù)庫(kù)。數(shù)據(jù)模型可以成為構(gòu)建更詳細(xì)的數(shù)據(jù)架構(gòu)的基礎(chǔ)。2.分層數(shù)據(jù)建模隨著數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)的使用興起,數(shù)據(jù)建模作為一門(mén)學(xué)科于1960年代開(kāi)始出現(xiàn)。數(shù)據(jù)建模使組織能夠使數(shù)據(jù)處理具有一致性、可重復(fù)性和有序開(kāi)發(fā)。應(yīng)用程序的最終用戶和程序員能夠?qū)?shù)據(jù)模型用作與數(shù)據(jù)設(shè)計(jì)人員進(jìn)行溝通的參考。參考譯文參考譯文以樹(shù)狀、一對(duì)多的方式排列數(shù)據(jù)的分層數(shù)據(jù)模型標(biāo)記了這些早期工作,并在許多流行的用例中取代了基于文件的系統(tǒng)。IBM的信息管理系統(tǒng)(IMS)是分層方法的主要示例,該方法在企業(yè)(尤其是銀行業(yè)務(wù))中得到了廣泛的應(yīng)用。盡管從1980年代開(kāi)始,分層數(shù)據(jù)模型在很大程度上被關(guān)系數(shù)據(jù)模型所取代,但是分層方法在當(dāng)今的XML(可擴(kuò)展標(biāo)記語(yǔ)言)和地理信息系統(tǒng)(GIS)中仍然很普遍。在DBMS的早期,網(wǎng)絡(luò)數(shù)據(jù)模型也應(yīng)運(yùn)而生,它是一種為數(shù)據(jù)設(shè)計(jì)人員提供其系統(tǒng)的廣泛概念視圖的方法。這樣的例子之一是數(shù)據(jù)系統(tǒng)語(yǔ)言會(huì)議(CODASYL),該會(huì)議成立于1950年代后期,旨在指導(dǎo)可在各種類型的計(jì)算機(jī)上使用的標(biāo)準(zhǔn)編程語(yǔ)言的開(kāi)發(fā)。3.關(guān)系數(shù)據(jù)建模盡管與基于文件的系統(tǒng)相比,它降低了程序的復(fù)雜性,但分層模型仍然需要詳細(xì)了解所采用的特定物理數(shù)據(jù)存儲(chǔ)。作為替代分層數(shù)據(jù)模型的提議,關(guān)系數(shù)據(jù)模型不需要開(kāi)發(fā)人員定義數(shù)據(jù)路徑。關(guān)系數(shù)據(jù)建模最早是在1970年由IBM研究人員E.F.Codd撰寫(xiě)的技術(shù)論文中描述的。Codd的關(guān)系模型為行業(yè)使用關(guān)系數(shù)據(jù)庫(kù)奠定了基礎(chǔ),與將數(shù)據(jù)隱式連接在一起的分層模型不同,它通過(guò)使用表將數(shù)據(jù)段顯式地連接在一起。關(guān)系數(shù)據(jù)模型一經(jīng)問(wèn)世便與結(jié)構(gòu)化查詢語(yǔ)言(SQL)結(jié)合使用,并在企業(yè)計(jì)算中立足日益穩(wěn)固,成為處理數(shù)據(jù)的有效手段。4.實(shí)體關(guān)系模型關(guān)系數(shù)據(jù)建模在1970年代中期又向前邁出了一步,因?yàn)閷?shí)體關(guān)系(ER)模型的使用變得越來(lái)越普遍。實(shí)體關(guān)系模型與關(guān)系數(shù)據(jù)模型緊密集成,使用圖表以圖形方式描述數(shù)據(jù)庫(kù)中的元素并簡(jiǎn)化對(duì)基礎(chǔ)模型的理解。通過(guò)關(guān)系建模,可以確定數(shù)據(jù)類型,并且數(shù)據(jù)類型很少隨時(shí)間變化。實(shí)體包括屬性;例如,員工實(shí)體的屬性可以包括姓、名、受雇年限等。關(guān)系被可視化地映射,為將數(shù)據(jù)設(shè)計(jì)目標(biāo)傳達(dá)給數(shù)據(jù)開(kāi)發(fā)和維護(hù)中的各個(gè)參與者提供了現(xiàn)成的手段。隨著時(shí)間的流逝,系統(tǒng)的數(shù)據(jù)架構(gòu)師都廣泛使用包括Idera的ER/Studio、ErwinDataModeler和SAPPowerDesigner在內(nèi)的建模工具。

參考譯文5.面向?qū)ο竽P碗S著1990年代面向?qū)ο缶幊痰陌l(fā)展,面向?qū)ο蟮慕W鳛樵O(shè)計(jì)系統(tǒng)的另一種方式受到了廣泛的關(guān)注。面向?qū)ο蟮姆椒m然與實(shí)體關(guān)系方法有些相似,但區(qū)別在于它們專注于現(xiàn)實(shí)世界實(shí)體的對(duì)象抽象。對(duì)象按類層次結(jié)構(gòu)分組,此類類層次結(jié)構(gòu)中的對(duì)象可以從父類繼承屬性和方法。由于具有這種繼承特性,在確保數(shù)據(jù)完整性和支持更復(fù)雜的數(shù)據(jù)關(guān)系方面,面向?qū)ο蟮臄?shù)據(jù)模型相對(duì)于實(shí)體關(guān)系建模具有一些優(yōu)勢(shì)。在1990年代還出現(xiàn)了專門(mén)針對(duì)數(shù)據(jù)倉(cāng)庫(kù)需求的數(shù)據(jù)模型。值得注意的示例是雪花模式和星型維度模型。6.圖形數(shù)據(jù)模型層次圖和網(wǎng)絡(luò)數(shù)據(jù)建模的一個(gè)分支是屬性圖模型,它與圖數(shù)據(jù)庫(kù)一起已越來(lái)越多地用于描述數(shù)據(jù)集內(nèi)的復(fù)雜關(guān)系,尤其是在社交媒體、推薦器和欺詐檢測(cè)應(yīng)用程序中。設(shè)計(jì)人員使用圖數(shù)據(jù)模型將其系統(tǒng)描述為節(jié)點(diǎn)和

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論