版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、Chapter 1: Introduction to Spatial Databases1、舉例說明什么是空間數(shù)據(jù)、非空間數(shù)據(jù)?如何理解空間查詢(spatial queries)和非空間查詢的區(qū)別( Non-spatial queries )? 答:河流的泛洪區(qū),衛(wèi)星影像數(shù)據(jù)、氣象氣候數(shù)據(jù)等都可以是空間數(shù)據(jù)書店名稱 店員人數(shù),去年的銷售量,電話號碼等是非空間數(shù)據(jù) 空間查詢是對空間數(shù)據(jù)的查詢或命令2、什么是 GIS ,什么是 SDBMS ?請闡述二者的區(qū)別和聯(lián)系。答: 1、GIS 是一個利用空間分析功能進行可視化和空間數(shù)據(jù)分析的軟件。它的主要功能有: 搜索、定位分析、地形分析、流分析、分布、空間
2、分析/統(tǒng)計、度量GIS 可以利用 SDBMS 來存儲、搜索、查詢、分享大量的空間數(shù)據(jù)集2、SDBMS 是一個軟件模塊。它可以 、利用一個底層的數(shù)據(jù)庫管理系統(tǒng) 、支持多種空間數(shù)據(jù)模型、相應(yīng)的空間抽象數(shù)據(jù)類型(ADT )以及一種能夠調(diào)用這些 ADT 的查詢語言 、支持空間索引、高效的空間操作算法以及用于查詢優(yōu)化的特定領(lǐng)域規(guī)則3、區(qū)別與聯(lián)系: 、利用 GIS 可以對某些對象和圖層進行操作,而利用 SDBMS 則可以 對更多的對象集和圖層進行更加簡單的操作、 SDBMS 可以在 GIS 不能使用的某些領(lǐng)域進行使用,例如基因組學(xué)、天 文學(xué)、多媒體信息系統(tǒng)等、 GIS 可以作為 SDBMS 的前端,利用一
3、個高效的 SDBMS 可以大大提高 GIS 的效率和生產(chǎn)率。3、從 GIS 這一縮寫的三種含義來理解 GIS 的發(fā)展歷程。 答:地理信息系統(tǒng):為專業(yè)人員提供的軟件PC機上的地理和空間服務(wù)地理信息科學(xué):為地理信息系統(tǒng)和服務(wù)提供使用和發(fā)展的定義、框架和理論地理信息服務(wù):為普通用戶提供的網(wǎng)點和服務(wù)中心,例如4、用傳統(tǒng)數(shù)據(jù)庫系統(tǒng)管理空間數(shù)據(jù),存在什么不足之處?答: 1)無法用遞歸和嵌套的方式來描述復(fù)雜關(guān)系的層次和網(wǎng)狀結(jié)構(gòu),模擬和操作復(fù)雜地理 對象的能力較弱;2)用關(guān)系模型描述本身具有復(fù)雜結(jié)構(gòu)和涵義的地理對象時,需對地理實體進行不自然的分 解,導(dǎo)致存儲模式、查詢途徑及操作等方面均顯得語義不甚合理;3)由
4、于概念模式和存儲模式的相互獨立性,及實現(xiàn)關(guān)系之間的聯(lián)系需要執(zhí)行系統(tǒng)開銷較大 的聯(lián)接操作,運行效率不夠高4)空間數(shù)據(jù)通常是變長的,而一般RDBMS 只允許記錄的長度設(shè)定為固定長度,此外,通用 DBMS 難于存儲和維護空間數(shù)據(jù)的拓撲關(guān)系。5)一般 RDBMS 都難以實現(xiàn)對空間數(shù)據(jù)的關(guān)聯(lián)、連通、包含、疊加等基本操作。6)一般 DBMS 不能支持 GIS 需要的一些復(fù)雜圖形功能。7)一般 RDBMS 難以支持復(fù)雜的地理信息,因為單個地理實體的表達需要多個文件、多 條記錄,包括大地網(wǎng)、特征坐標、拓撲關(guān)系、屬性數(shù)據(jù)和非空間專題屬性等方面信息。8)GIS 管理的是具有高度內(nèi)部聯(lián)系的數(shù)據(jù),為了保證地理數(shù)據(jù)庫的
5、完整性,需要復(fù)雜的 安全維護系統(tǒng), 而這些完整性約束條件必須與空間數(shù)據(jù)一起存儲, 由地理數(shù)據(jù)庫來維護系統(tǒng) 數(shù)據(jù)的完整性。否則,一條記錄的改變會導(dǎo)致錯誤、相互矛盾的數(shù)據(jù)存在,而一般 RDBMS 難以實現(xiàn)這一功能。5、What is a SDBMS ?答: SDBMS 是一個軟件模塊。它可以 、利用一個底層的數(shù)據(jù)庫管理系統(tǒng) 、支持多種空間數(shù)據(jù)模型、相應(yīng)的空間抽象數(shù)據(jù)類型( ADT )以及一種能夠調(diào)用 這些 ADT 的查詢語言、支持空間索引、高效的空間操作算法以及用于查詢優(yōu)化的特定領(lǐng)域規(guī)則6、什么是后關(guān)系數(shù)據(jù)庫模型?后關(guān)系數(shù)據(jù)庫模型有哪些? 答:后關(guān)系數(shù)據(jù)庫模型支持用戶定義抽象數(shù)據(jù)類型,空間數(shù)據(jù)的類
6、型可以添加。包括面向?qū)ο蟮臄?shù)據(jù)庫模式 OOBDMS 和面向關(guān)系 ORDBMS 的數(shù)據(jù)庫模式。7、SDBMS 的三層體系結(jié)構(gòu)( Three Layer Architecture )是什么?借此深入理解 SDBMS 的 作用。答:空間應(yīng)用空間數(shù)據(jù)庫 DBMS教材 P11 的圖8、空間數(shù)據(jù)庫主要涉及哪些內(nèi)容? 答:數(shù)據(jù)模型、查詢語句、查詢處理與優(yōu)化、文件組織和索引、數(shù)據(jù)挖掘9、舉例說明單遍掃描查詢和多遍掃描查詢的概念。 答:單邊掃描查詢中,被查詢的表(關(guān)系)中的一條記錄(元組)最多只被訪問一次;例如 “列出武大周圍 5km 內(nèi)的書店的名字” 。多遍掃描查詢是被查詢的表(關(guān)系)中的一條記錄(元組)至少
7、被訪問一次,例如“找出其 代表的選取范圍大于 200 公頃并且在這區(qū)擁有公司的女議員的名字”10、過濾精煉策略的作用?兩個步驟的內(nèi)容是什么?提示: ppt : Efficient algorithms to answer spatial queriesCommon Strategy - filter and refine (過濾精煉 )Filter Step:Query Region overlaps with MBRs ofB,C and D過濾:查詢區(qū)域與 B、C、 D 的最小外接矩形有重疊部分,保留 B、C、D,其他的舍棄Refine Step: Query Region overlap
8、s with B and C精煉:查詢區(qū)域與 B、C 有重疊,舍棄 D11、平面掃描 (plane sweep)技術(shù)主要解決什么問題?其主要步驟? 答:主要解決的是如何在過濾階段中盡可能多的淘汰不符合條件的對, 從而減少幾何計算的 計算代價。Step 1:從左至右移動一條掃描線 (例如,垂直于 x 軸的線 ),停在 R S 的第一個元素處。這 就是具有最小 Txl 值的矩形 T,例子為是矩形 R4 。Step2:搜索 S中已排序的矩形,直到抵達第一個矩形Sf,這里有 Sfxl T xu。顯然,對于所有 1jf,關(guān)系Txl,TxuSjxl,Sjxu存在(非空),在本例中 Sf 就是 S1。 注意
9、 f 是以圖 1-9c 的數(shù)組索引為序,即 S1=S2、S2= S1、 S3=S3。這樣 S2 就是一個可能與R4 交疊的候選矩形。Step 3:如果對任意 ljf,關(guān)系 Tyl,Tyu Sjyl,Sjyu存在,則 Sj與 T 相交。 因此,這一步就確定了 R4與 S2的確是交疊的,并且 是連接結(jié)果的一部分。記錄 所有這樣的信息,然后將矩形 T(R4)從集合 RS 中去掉,它不再需要參與結(jié)果集中的其 他相交對。Step 4:繼續(xù)移動掃描線來穿過集合 RS,直至碰到下一個矩形,在本例中是S2。這時進行步驟 2 和 3。Step 5:當 R S=? 時,處理結(jié)束;12、從程序員的觀點和 DBMS
10、設(shè)計者的觀點看,影響系統(tǒng)效率的因素有何不同。 答:在程序員看來,計算機主要包括兩個部分: CPU 和無限量的內(nèi)存在 DBMS 設(shè)計者看來, 計算機主要包括三個部分: CPU 、有限的內(nèi)存、 無限的硬盤空間。 訪問硬盤的速度要遠遠小于訪問內(nèi)存的速度, 因此前者關(guān)注減少算法的計算時間, 后者 強調(diào)的是將計算時間和 I/O 時間的總和減少到最小。13、查詢優(yōu)化和數(shù)據(jù)挖掘的概念。 答:查詢優(yōu)化:基于數(shù)據(jù)集的特點對查詢中的操作進行排序,為每一步操作選擇有效策略 數(shù)據(jù)挖掘:即進行系統(tǒng)的搜索,找出隱藏在電子信息中潛在的有用信息。Chapter 2: Spatial Concepts and Data Mod
11、els1、什么是數(shù)據(jù)模型?舉例說明數(shù)據(jù)模型的重要性。答、數(shù)據(jù)模型是數(shù)據(jù)集的特定結(jié)構(gòu)和模式, 是對數(shù)據(jù)的文件描述, 有利于某些性質(zhì)的前期分 析。作用:、屬性的前期分析;、重利用多媒體應(yīng)用中的共享數(shù)據(jù);、組織中交換數(shù)據(jù) 、將數(shù)據(jù)傳遞給新軟件或環(huán)境 例子:千禧年危機 正確的使用數(shù)據(jù)模式可以顯著的降低成本,如果軟件中的時間和數(shù)據(jù)被 定義成抽象數(shù)據(jù)模型,只有一小部分的軟件會執(zhí)行數(shù)據(jù), ADT 數(shù)據(jù)要被重新修改。2、掌握兩種常用的空間信息模型:要素模型和場模型,矢量、柵格數(shù)據(jù)結(jié)構(gòu)。答:場模型:、空間分割框架 、場函數(shù) 、場操作:并、復(fù)合森林模型中分段函數(shù)表示,區(qū)域中每個點被映射成主要樹種對應(yīng)的值要素模型:
12、、對象:把空間信息抽象成明確的,可識別的事物或?qū)嶓w;、對象具有 屬性和操作森林模型中多邊形表示(林分) ,每個對象有唯一的標示符、主要樹種和一 塊區(qū)域。矢量數(shù)據(jù)結(jié)構(gòu) 柵格數(shù)據(jù)結(jié)構(gòu):柵格結(jié)構(gòu)用密集正方形(或三角形,多邊形)將地理區(qū)域劃分為網(wǎng)格 陣列。位置由行,列號定義,屬性為柵格單元的值。點:由單個柵格表達。線:由沿線走向 有相同屬性取值的一組相鄰柵格表達。面:由沿線走向有相同屬性取值的一片柵格表達。3、基于場模型的操作有哪些, 舉例說明區(qū)基于場模型的局部操作、 聚焦 (focal)和區(qū)域操作? 基于對象模型的操作有哪些?答:基于場模型:局部操作: 空間框架內(nèi)一個給定位置的新場的取值只依賴于同一
13、個位置場的輸入值。 書 上 P31。聚焦操作:在指定位置的結(jié)果場的值依賴于同一位置的一個假定小領(lǐng)域輸入場的值。 極限、高程場的梯度區(qū)域操作:與聚集運算符或微積分中的積分運算有關(guān)。計算每個樹種的平均高度。 基于對象模型:面向集合、拓撲、方位、度量空間4、什么是拓撲關(guān)系,舉例說明拓撲與非拓撲特性、拓撲與非拓撲操作。答:是指 滿足拓撲幾何學(xué)原理的各空間數(shù)據(jù)間的相互關(guān)系。即用結(jié)點、弧段和多邊 形所表示的實體之間的鄰接關(guān)聯(lián)和包含等關(guān)系。拓撲特性:彈性變形后臨近物體之間的拓撲關(guān)系沒有發(fā)生改變 非拓撲特性:彈性變形后臨近物體之間的拓撲關(guān)系發(fā)生了改變 拓撲操作與非拓撲操作5、OGIS 提出的關(guān)于空間幾何體的基
14、本構(gòu)件有哪些?6、說明九交模型表達拓撲關(guān)系的原理。答:在一個平面上。兩個對象 A 、B 之間的二元拓撲關(guān)系主要基于以下的相交情況,即分別是 A 和 B 的內(nèi)部、邊界、外部。值六部分可以構(gòu)成九交模型。考慮取值有空 (0)和非空 (1),可以確定有 29=512 種二元拓撲關(guān)系。對于 R2嵌在中的二維區(qū) 域,有八個關(guān)系是可實現(xiàn)的,并且它們彼此互斥且完全覆蓋。 :相離、相接、交疊、相等、 包含、在內(nèi)部、覆蓋、被覆蓋。7、數(shù)據(jù)庫設(shè)計的三個步驟及其主要內(nèi)容。 答、首先,采用高層次的概念數(shù)據(jù)模型來組織所有與應(yīng)用相關(guān)的可用信息; 然后,邏輯建模階段,與概念數(shù)據(jù)模型在商用 DBMS 上的具體實現(xiàn)有關(guān) 最后,數(shù)
15、據(jù)庫設(shè)計的第三個步驟是物理設(shè)計的建模,它解決數(shù)據(jù)庫營養(yǎng)在計算機中具體 實現(xiàn)是方方面面的細節(jié)。8、ER 模型的作用, ER 圖包括哪些要素,如何表達多值屬性? ER 圖與空間信息對象模型 之間的異同?答:ER 圖可以以一種避開計算機隱喻的方式來表達這個微型世界,從而把應(yīng)用中的概念與實現(xiàn)細節(jié)分離開來。ER 圖包括實體 (物理上或概念上獨立存在的事物或?qū)ο螅?、屬性和聯(lián)系。 實體用屬性來刻畫 性質(zhì),實體之間通過練習(xí)相互作用和關(guān)聯(lián)。屬性可以是單值或多值。 ER 圖中實體用矩形表 示,屬性表示為橢圓,聯(lián)系為菱形。碼屬性加下劃線,多值屬性用雙橢圓。 異同:、實體是物體屬性的集合;、 ER 模型不允許普通用
16、戶定義操作;、在對象模 型中關(guān)系不被直接支持,但可以由操作來模仿。9、數(shù)據(jù)庫三層約束的內(nèi)容: 碼約束 - 實體完整性 (entity integrity) 約束,參照完整性 (referential integrity 約束和用戶參照完整性。簡述關(guān)系模式中的三種完整性。答;碼約束:每個關(guān)系必須要有一個主碼;實體完整性約束:主碼不能為空; 參照完整性約束:外碼的屬性值要么是另一個關(guān)系的主碼,要么為空值。10、外碼的概念。答:外碼是一個關(guān)系的屬性集,這個關(guān)系被復(fù)制到另外一個關(guān)系中。 主碼與外部碼提供了 一個實現(xiàn)關(guān)系間聯(lián)系的手段。11、ER 圖向關(guān)系模型的轉(zhuǎn)換,注意對多值屬性的轉(zhuǎn)換。 (P16) 答
17、:、實體成為關(guān)系;實體的屬性映射成為關(guān)系的屬性;多值屬性形成新的關(guān)系 、 Relationships (1:1): 將任一實體的碼屬性作為其他關(guān)系的一個外碼 、 Relationships (M :1):將“ 1側(cè)”的關(guān)系的主碼作為 “ M”側(cè)關(guān)系的外碼。 、 M:N Relationships become a relation ( M:N 中 M 和 N 共同形成新表的關(guān)鍵字)12、對于空間數(shù)據(jù), ER 模型方法的不足之處?為表達空間概念,擴展 ER 模型主要增加了 哪些要素? -實體象形圖、關(guān)系象形圖,讀懂擴展 ER 模型的表示符號。 (書上 P51) 答: 1)、ER模型的最初設(shè)計隱含
18、了基于對象模型的假設(shè)。因此,場模型無法用ER 模型進行自然的映射2)、在傳統(tǒng)的 ER 模型中,實體之間的聯(lián)系由所要開發(fā)的應(yīng)用來導(dǎo)出,而在空間建模中, 空間對象之間總會有內(nèi)在的聯(lián)系3)、建??臻g對象所使用額試題聯(lián)系類型和“地圖”的比例尺有關(guān)13、舉例說明用象形符號擴展 ER 圖,對于空間數(shù)據(jù)建模有何好處?用象形符號擴展 ER 圖,以便專門處理空間數(shù)據(jù)類型。這將減少 ER 圖以及所產(chǎn)生的關(guān) 系模式的復(fù)雜度,同時改進空間建模的質(zhì)量。空間聯(lián)系(例如 Road-Crosses-River) 就可以從ER圖中省略,用隱式的方式表示。關(guān)系模式中的表達多值空間屬性的關(guān)系和M:N 空間聯(lián)系也就不需要了14、舉例
19、說明類、屬性、方法、聚合、泛化、和關(guān)聯(lián)等概念? 答:類:是多有在應(yīng)用中具有相同性質(zhì)的對象的封裝,等價于 ER 模型中的實體;例如設(shè)施 就是一個類。屬性:描述類的對象。屬性還有一個與之相關(guān)聯(lián)的作用域,分為公有、私有、受保護 方法:是一些函數(shù),是類定義的一部分,用來修改類的行為或狀態(tài) 關(guān)系:將一個類與另一個類或者它自己相聯(lián)系,類似于 ER 中的聯(lián)系。 UMLCD 中三種 重要關(guān)系:聚合、泛化、關(guān)聯(lián)。聚合:描述部分與整體的關(guān)系:強聚合、弱聚合泛化: eg. 多邊形是點線面的泛化; 關(guān)聯(lián):反應(yīng)不同類的對象是如何聯(lián)系的。15、UML 的作用?了解 UML 的主要符號。答: UML 是用于面向?qū)ο筌浖O(shè)計
20、的概念層建模的新興標準之一,它是一種標準化語言, 用于在概念層對結(jié)構(gòu)化模式和董濤行為進行建模。16、比較 ER 與 UML 。答: 1)、沒有方法的類就是實體; 2)、屬性在兩個里都一樣; 3)、 UML 中沒有主鍵和完整 性約束; 4)、ER 中沒有方法; 5)、ER 中關(guān)系的內(nèi)容更豐富; 6)、ER 圖中的實體與數(shù)據(jù)集 有關(guān),但 UML 的類幾乎和數(shù)據(jù)集無關(guān)。Chapter 3 Spatial Query Languages1. Three Components of SQL 。請列舉 SQL 所包含的功能,并對每種功能列舉相關(guān)的操作 符(語句)。答:數(shù)據(jù)定義語言 DDL :創(chuàng)建和修改關(guān)系
21、表(包括索引)數(shù)據(jù)操縱語言 DML :插入,刪除,更新,查詢數(shù)據(jù)控制語言 DCL :并發(fā)控制,事務(wù)處理2. SELECT specifies desired columnsFROM specifies relevant tablesWHERE specifies qualifying conditions for rows ( 限定條件 )ORDER BY specifies sorting columns for resultsGROUP BY, HAVING specifies aggregation and statistics (要求:看懂書上例句,要求會寫語句)3. 擴展 SQL 以
22、處理空間數(shù)據(jù),掌握對標準 SQL 進行了哪些方面的擴展?提示:ppt: SQL 3 allows user defined data types and operations. Spatial data types and operations can be added to SQL3SQL3 支持用戶自定義類型和操作,空間數(shù)據(jù)類型和操作被允許加入到 SQL3 中4. Open Geodata Interchange Standard (OGIS) 支持的 Spatial Data Model 和空間操作有哪些 答:用于所有集合類型的基本操作;用于空間對象間拓撲關(guān)系的操作謂詞;用于空間分析的一
23、般操作5. 讀懂 List of Spatial Query Examples 。給語句,說明查詢目的?或者給出查詢目的,要求 寫語句。6. view( 視圖 )的含義。視圖使用來描述導(dǎo)出數(shù)據(jù)或查詢結(jié)果簡化復(fù)雜網(wǎng)狀查詢的表Chapter4: Spatial Storage and Indexing1、What is a physical data model? Why learn physical data model concepts ? 答: 1)、執(zhí)行邏輯數(shù)據(jù)模型的理論基礎(chǔ),使用現(xiàn)有的構(gòu)件在一個有效容錯的方式中2)、選擇合適的 DBMS ,某些 DBMS 不支持空間索引;使 DBMS 運
24、行的更加有效率。2、Is relational DBMS physical data model suitable for spatial data? 如果不適合,有哪兩類解決 途徑? 答:不合適。關(guān)系 DBMS 則只能對數(shù)字進行簡單處理;排序、查詢樹對數(shù)字非常有效,但 這些概念都不適合用于處理空間數(shù)據(jù)提示: ppt 途徑 1)Reusing relational physical data model concepts ,重新使用關(guān)系物理數(shù)據(jù)模 型的概念:Space filling curves define a total order for points 用空間填充曲線來定義點的排列Th
25、is total order helps in using ordered files, search trees 有助于使用有序文件和查詢樹 But may lead to computational inefficiency! 但可能會導(dǎo)致計算無效率途徑 2): New spatial techniques 新空間技術(shù):Spatial indices, e.g. grids, hierarchical collection of rectangles 空間索引:例如網(wǎng)格Provide better computational performance 能提供更好的計算表現(xiàn)3、計算機存儲設(shè)備的
26、種類?數(shù)據(jù)庫系統(tǒng)是怎么利用各種設(shè)備的? 提示: ppt: Types of storage Devices:Main memories - fast but content is lost when power is off 主存:速度快,信息斷電丟失Secondary storage - slower, retains content without power 二級存儲器:慢,信息斷電不丟 Tertiary storage (如磁帶驅(qū)動器 ) - very slow, retains content, very large capacity 脫機存 儲器:非常慢,保存信息容量非常大。DBM
27、S usually manage data? on secondary storage, e.g. disks? Use main memory to improve performance? User tertiary storage (e.g. tapes) for backup 備份 , archival 檔案 etc.4、磁盤存儲相關(guān)概念:磁道 track 、扇區(qū) sector、柱面 cylinder ?頁面的概念? 答:磁道:圓心磁盤片上向邊緣延伸的同心圓扇區(qū):每個磁道中被分成若干等份的區(qū)域柱面:是磁盤上具有相同鐳的磁道的集合 頁面:又稱磁盤塊。是磁盤與主存之間的最小傳輸單位5、訪問
28、磁盤扇區(qū)數(shù)據(jù)的過程,哪個過程花費的時間最多?提示: ppt : Accessing a sector has three major steps:? Seek(尋道) : Move head assembly to relevant track ( ts)? 磁頭到達特定磁道所用的時間? Latency( 延遲時間 ): Wait for spindle to rotate relevant sector under disk head (tl )塊旋轉(zhuǎn)到磁頭下方所用的時間? Transfer 傳輸時間 : Read or write the sector (tt) 置于正確位置后讀寫塊中數(shù)據(jù)
29、 的實際時間? 1236、如何有效利用磁盤硬件?提示: ppt :Using Disk Hardware EfficientlySize of sectors 扇區(qū)面積? Larger sector provide faster transfer of large data sets? 數(shù)據(jù)集大時大扇區(qū)提供更快的傳輸速度? But waste storage space inside sectors for small data sets? 但浪費了小數(shù)據(jù)集的存儲空間Placement of most frequently accessed data items 放置頻繁使用的數(shù)據(jù)? On m
30、iddle tracks rather than innermost or outermost tracks? 在中間的磁道而不是最里面或最外面的磁道? Reason: minimize average seek time 可以減少尋道時間Placement of items in a large data set requiring many sectors 放置一個需要很多扇區(qū)的 大數(shù)據(jù)集? Choose sectors from a single cylinder 盡量放在同一個柱面? Reason: Minimize seek cost in scanning the entire d
31、ata set. 減少掃描全集花費 的時間7、域 (filed) 、記錄 (record)、文件( file )的概念, 提示: Mapping Records and files to Disk.? Records? Often smaller than a sector? Many records in a sector? Files with many records 文件是記錄的集合? Many sectors per file8、頁面的概念:磁盤與主存之間的最小傳輸單位。一個文件可能跨越多個頁面。一個頁面 是槽的集合,一個槽包含一條記錄9、文件結(jié)構(gòu)的含義,舉例說明幾種常用文件結(jié)構(gòu)he
32、ap,Ordered、 Hashed 、 Clustered。答:文件結(jié)構(gòu)是指文件中記錄的組織形式。堆:無序文件。記錄沒有特定的順序。 ,根據(jù)給定的關(guān)鍵碼 (如 name)查找一條記錄需要掃 描文件中的記錄。 在最壞情況下, 文件的所有記錄都要被檢查, 所有存儲該文件數(shù)據(jù)的磁盤 頁面都要被訪問。 平均來說, 需要檢索一半的磁盤頁面。 優(yōu)點是在進行插入操作時可以很容 易地在文件末尾插入一條新記錄。存儲河流表散列文件:使用散列函數(shù)吧記錄分到一系列散列單元中。可取之處在于它能夠把數(shù)量大 致相同的記錄放入每個散列單元中。對于點查詢、插入、刪除都很有效。不適合范圍查詢。 按字符個數(shù)存儲城市名稱。有序文件
33、: 根據(jù)給定的主碼與對記錄進行組織。 折半法非常有效。 不能直接運用在空間領(lǐng) 域例如, 除非對多維空間中的點定義一個全序, 否則無法對城市的位置排序。 有序文件組織 方式還可以根據(jù)對空間數(shù)據(jù)集的文件組織方式而概括成空間聚類。聚類:聚類的目的就是降低響應(yīng)常見的大查詢的尋道時間 (ts)和等待時間 (t1) 。對于空間數(shù) 據(jù)庫來說, 這意味著在二級存儲中, 空間上相鄰的和查詢上有關(guān)聯(lián)性的對象在物理上應(yīng)當存 儲在一起。10、使用空間填充曲線組織空間數(shù)據(jù)的意義?提示: Chapter 1 , Organizing spatial data with space filling curves? Impo
34、se an ordering on the locations in a multi-dimensional space? 加強了多維空間中的位置排序? Allow use of traditional efficient search methods on spatial data? 允許在空間數(shù)據(jù)中使用傳統(tǒng)的有效搜索11、掌握 Z-曲線、 hilbert 曲線的生成。(要求給 IJ號,能夠?qū)懗鰧?yīng) Z碼和 Hilbert 碼的計 算過程)12、基于 Z-曲線,如何進行區(qū)域匹配的?(匹配有效性?)答:用 z1 和 z2 分別代表兩個 z 值,其中 z1 是較短的一個,并未失去一般性;對于相應(yīng)
35、的 區(qū)域 (比如塊 )r1 和 r2,只有兩種可能: 1)如果 z1 是 z2 的前綴 (例如, z1=l* ,z2=11* 或 z1=*l* ,z2=11*) ,則 r1 完全包含 r2;2)兩個區(qū)域不相交 (例如, z1=*0* ,z2=11*) 。13、什么是索引?索引文件的內(nèi)容。主索引和二級索引。A table can have at most oneprimary index. Why?答:索引文件是用來提高數(shù)據(jù)文件查詢效率的輔助文件。 記錄的只有碼值和數(shù)據(jù)文件中的頁 面地址。索引記錄被排序,數(shù)據(jù)文件本身可以是不按關(guān)鍵碼排序。主索引, 如果數(shù)據(jù)文件的記錄是按照主碼排列的, 那么索引就
36、只需要保存數(shù)據(jù)文件的每個磁 盤頁面第一個主碼域值。每個索引記錄一個數(shù)據(jù)頁面。二級索引:堆數(shù)據(jù)文件,一個索引記錄一個數(shù)據(jù)。 一個磁盤最多只有一個主索引,因為主索引決定了數(shù)據(jù)在磁盤上的存儲順序。14、什么是空間索引?有哪些空間索引方法? 答:空間索引結(jié)構(gòu)用一組桶 (通常對應(yīng)二級存儲的頁面 )來組織對象??臻g索引呢就是依據(jù)空間對象的位置和形狀或空間對象之間的某種空間關(guān)系按一定的順序 排列的一種數(shù)據(jù)結(jié)構(gòu), 其中包含空間對象的概要信息, 如對象的標識、 外接矩形及指向空間 對象實體的指針。方法:1)在系統(tǒng)中加入專門的外部空間數(shù)據(jù)結(jié)構(gòu),為空間屬性提供如同 B 樹之于線性屬性的功能。2)使用空間填充曲線 (
37、 如 Z 序、 Hilbert 曲線 )將空間對象映射到一維空間,以便空間對 象存儲在標準的一維索引 (例如 B 樹)中。15、網(wǎng)格文件包含哪兩部分內(nèi)容?建立格網(wǎng)索引的思路和步驟?了解R 樹索引和 R+樹索引的思想?答:包含 n 維網(wǎng)格目錄, 目錄只能夠的每一項指向一個數(shù)據(jù)桶。 第二部分是由稱為線性比例 的一維數(shù)組組成的結(jié)構(gòu)。思路:是將研究區(qū)域用橫豎線條劃分大小相等或不等的格網(wǎng), 記錄每一個格網(wǎng)所包含的空間 實體。 當用戶進行空間查詢時, 首先計算出用戶查詢對象所在格網(wǎng), 然后再在該網(wǎng)格 中快速查詢所選空間實體,這樣一來就大大地加速了空間索引的查詢速度。步驟:劃分行列( M X N ); 計算
38、網(wǎng)格大小及每個格網(wǎng)的矩形范圍; 開辟目標空間(記錄目標穿過的網(wǎng)格)和格網(wǎng)空間(記錄格網(wǎng)內(nèi)的目標) ; 注冊點、線、面、注記等目標,并記錄之;提取窗口所覆蓋的目標關(guān)鍵字 (采用數(shù)據(jù)位方法, 以降低排序時間, 及避免數(shù)據(jù)的繪制順序 等);提取目標所涉及的網(wǎng)格。Chapter5 Query Processing and Optimization1、從查詢處理的角度來看,空間數(shù)據(jù)庫與關(guān)系數(shù)據(jù)庫之間有哪些主要區(qū)別? 答:至少有三個主要區(qū)別:、 與關(guān)系數(shù)據(jù)庫不同, 空間數(shù)據(jù)庫沒有固定的運算符集合可以 充當查詢計算的基本構(gòu)件、空間數(shù)據(jù)庫要處理非常大量的復(fù)雜對象,這些對象具有空間范圍,不能自然的排列 成一維數(shù)
39、組。、檢測空間謂語要用到計算量極大的算法,所以不能再假定 I/O 代價在 CPU 的處理代 價中只能主導(dǎo)地位2、空間查詢的基本構(gòu)件有哪些?提示: ppt5.1.2 Choice of building blocks , List of building blocksPoint Query , Range Query, Spatial Join , Nearest Neighbor ; 點查詢:給定一個查詢點 P,找出所有包含它的空間對象 O 范圍或區(qū)域查詢:給定一個查詢多邊形P,找出所有與之相交的空間對象 O空間鏈接:兩個表 R 和 S 基于一個空間謂語 進行連接時,該連接成為空間連接。 最近
40、鄰居:空間聚集,即給定一個對象 O,找出所有距離 O 最近的對象 P3、空間查詢處理的 “過濾 -精煉模式 ”是什么,其目的?(對象操作的兩步查詢處理) 目的:用兩步算法高效地處理復(fù)雜的數(shù)據(jù)類型過濾:尋找 Q 最終結(jié)果的超集 S;精煉:利用 GIS 處理 S來找到精確的 Q 的答案4、空間查詢處理中,一般是采用什么(MBR) )來替代不同類型的空間實體(如線、面)?這樣做有何好處?提示: Ppt: Approximating spatial data typesMinimum orthogonal bounding rectangle (MOBR or MBR) 最小外接矩形 approxim
41、ates line string, polygon, 近似的線串,多邊形See Examples below (Black rectangle are MBRs for red objects)MBRs are used by spatial indexes, e.g. R-treeMAlgorithms for spatial operations MBRs are simple 空間操作 MRS 的算法很簡單5、舉例說明 SDBMS 是如何利用空間實體的 MBRs 來加快處理速度的?Ppt: Approximate Spatial Operations6、對于點查詢、區(qū)域查詢、空間連接查詢
42、操作,各自有哪些處理算法(策略)?它們與什 么因素有關(guān)?提示: Strategies for Point Queries,Strategies for Range Queries , Strategies for Spatial Joins 與包含待查詢的關(guān)系的文件的組織方式有關(guān)。答:點查詢:數(shù)據(jù)未排列且沒有索引:窮舉法,掃描整個文件并判斷每條記錄是否滿足謂語 建立空間索引:在索引中使用 find 操作;需要查找的磁盤扇區(qū)等于索引的深度 空間填充曲線散列:運用折半法尋找點;檢驗大約 logB(n), 的磁盤扇區(qū) 區(qū)域查詢:數(shù)據(jù)未排列且沒有索引:窮舉法,掃描整個文件并判斷每條記錄是否滿足謂語建立
43、空間索引:在索引中使用范圍查詢操作 空間填充曲線散列:驗證 Z 值滿足范圍查詢要求;使用折半查詢找到最低的 Z 值;掃描前面的數(shù)據(jù)文件直至滿足查詢要求的最大的 Z 值 空間連接:嵌套循環(huán),檢驗所有可能的空間謂語對;基于空間分塊,只檢驗普通空間區(qū)域的對象對 樹匹配:從每張表中找出分層的的對象組7、什么是查詢優(yōu)化器?查詢優(yōu)化器所承擔(dān)的主要任務(wù)是什么?答:查詢優(yōu)化器是數(shù)據(jù)庫軟件中的一個模塊, 它用于產(chǎn)生不同計算計劃并確定適當?shù)膱?zhí)行策 略。主要任務(wù):邏輯轉(zhuǎn)換、動態(tài)規(guī)劃。8、查詢語言與查詢樹之間的互換 ? 語法分析器執(zhí)行9、對查詢樹進行邏輯轉(zhuǎn)換的目的和一般方法是什么?答:方法:將非空間的選擇和投影操作下
44、推目的:減少連接操作所涉及的關(guān)系大小,從而減少計算代價。10、Distributed Environments 的概念?在分布式環(huán)境下,空間數(shù)據(jù)庫系統(tǒng)面臨哪些挑戰(zhàn)? 提示 ppt: New issues for SDBMS ) 答:自治異質(zhì)計算機的集合,通過網(wǎng)絡(luò)連接,服務(wù)器框架:服務(wù)器提供定義明確的服務(wù),用 戶使用服務(wù)。挑戰(zhàn):概念模型上:不同種類模式之間的轉(zhuǎn)換邏輯模式上:在其他 SDBMS 上命名、查詢表;其他 SDBMS 上的表要復(fù)制原始表 查詢過程與優(yōu)化:通過網(wǎng)路的數(shù)據(jù)傳輸代價將會主導(dǎo) CPU 和 I/O 代價,需要新的 策略來控制數(shù)據(jù)的傳輸成本。11、舉例說明分布式空間數(shù)據(jù)庫的半連接操作
45、。 (書上 P161)答: 1)只將連接屬性和主碼從站點 1發(fā)送到站點 22)只將有關(guān)元組從站點 2 發(fā)送到站點 1.12、了解基于 Web 的空間數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu)。 (書上 P162)Chapter 6: Spatial Networks1、舉例理解空間網(wǎng)絡(luò)、空間網(wǎng)絡(luò)查詢。鐵路網(wǎng)絡(luò)、密西西比河河網(wǎng),查詢YW 線沿途車站數(shù)量,最后一個車站,密西西比河的支流名稱2、圖及其相關(guān)概念。答:一個圖 G=(V , E)是由一個有限頂點集 V 頂點之間的邊集 E 組成的。邊集 E 頂點集 V 的一個二元關(guān)系。如果構(gòu)成邊集的各個頂點對是有序的,那么圖 G 就是有向的 (directed) ;否則該圖是無向 的 (undirected) 。頂點和邊有時也分別稱為結(jié)點 (node)和鏈接 (1ink) 。 有序頂點對的第一個頂點稱為前驅(qū)(predecessor)或者源 (source) ,第二個頂點稱為后繼(successor)、目的 (destina
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度企業(yè)物流信息化服務(wù)合同
- 2025年度個人住房貸款保證擔(dān)保及信貸支持合同4篇
- 二零二五年度老舊小區(qū)綠化改造養(yǎng)護合同4篇
- 2025年印刷設(shè)計中介合同
- 2025年書法定制合同
- 2025年借殼上市合同風(fēng)險保障條款
- 專屬中介服務(wù)居間合同(2024年版)一
- 2025年存儲設(shè)施定值保險合同
- 2025年叉車租賃合同范本一(含租賃物質(zhì)量保證)4篇
- 大化中考數(shù)學(xué)試卷
- 反騷擾政策程序
- 運動技能學(xué)習(xí)與控制課件第十一章運動技能的練習(xí)
- 射頻在疼痛治療中的應(yīng)用
- 四年級數(shù)學(xué)豎式計算100道文檔
- “新零售”模式下生鮮電商的營銷策略研究-以盒馬鮮生為例
- 項痹病辨證施護
- 職業(yè)安全健康工作總結(jié)(2篇)
- 懷化市數(shù)字經(jīng)濟產(chǎn)業(yè)發(fā)展概況及未來投資可行性研究報告
- 07FD02 防空地下室電氣設(shè)備安裝
- 教師高中化學(xué)大單元教學(xué)培訓(xùn)心得體會
- 彈簧分離問題經(jīng)典題目
評論
0/150
提交評論