基本的索引原理_第1頁
基本的索引原理_第2頁
基本的索引原理_第3頁
基本的索引原理_第4頁
基本的索引原理_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、本章內(nèi)容并不是針對數(shù)據(jù)庫專家或是那些想快速找到答案的讀者。本章主要 是討論基本的索引原理(也可能是僅有的一章)。對初學者來說,最困難的就是如 何找到那些可以填補最主要差距的信息,以及如何了解oracle的索引功能。本章 就是服務于這個目的。盡管市場上有大量面向中高級用戶的書籍,但面向初學者 的資料卻非常少,而且需求量往往很高。oracle提供了大量索引選項。知道在給定條件下使用哪個選項對于一個應用 程序的性能來說非常重要。一個錯誤的選擇可能會引發(fā)死鎖,并導致數(shù)據(jù)庫性能 急劇下降或進程終止。而如果做出正確的選擇,則可以合理使用資源,使那些已 經(jīng)運行了幾小時甚至幾天的進程在幾分鐘內(nèi)得以完成,這樣會

2、使您頗有成就感。 本章將討論每個索引選項,然后指出每個選項的優(yōu)缺點。本章主要內(nèi)容:基本的索引概念查找被索引的表以及具有連接索引的表 組合索引的使用方法 oracle rowid 基于函數(shù)的索引的使用方法 如何避免比較不匹配的數(shù)據(jù)類型,造成索引取消 作為索引策略的集群因子 使用index_stat覦圖 索引的二元高度(binary height) 使用直方圖 快速全局掃描 使用索引跳躍式掃描特性的方法 b樹索引的解釋 使用位圖索引的時機 使用has隘弓i的時機 使用索引順序表的時機使用反轉(zhuǎn)鍵索引的時機使用基于函數(shù)的索引的時機 本地和全局分區(qū)索引2.1 基本的索引概念當從表中訪問數(shù)據(jù)時,oracl

3、e提供了兩個選擇:從表中讀取每一行(即全表掃 描),或者通過rowia次讀取一行。當訪問大型表的少量行時,您可能想使用索 引。例如,如果只訪問大型表中5%勺行,并且使用索引標識讀取的塊,則可以執(zhí) 行較少的i/o。如果沒有使用索引,則要讀取表中所有的塊。索引改進性能的程度部分取決于數(shù)據(jù)的選擇性以及在表的塊之間分布數(shù)據(jù)的 方式。如果數(shù)據(jù)非常具有選擇性,則表中將只有很少的行匹配索引值(例如護照號 碼)。oracle將能夠快速查詢匹配索引值的 rowid?索引,并且可以快速查詢少 量的相關表塊。如果數(shù)據(jù)不是非常具有選擇性(例如國家名),則索引可能返回許 多rowid導致從表中查詢許多單獨的塊。如果數(shù)據(jù)

4、非常具有選擇性,但是相關的行在表中的存儲位置并不互相靠近, 則會進一步減少索引的益處。如果匹配索引值的數(shù)據(jù)分散在表的多個塊中,則必 須從表中選擇多個單獨的塊以滿足查詢。在一些情況中,您會發(fā)現(xiàn)當數(shù)據(jù)分散在 表的多個塊中時,最好是不使用索引,而是執(zhí)行全表掃描。執(zhí)行全表掃描時,oracle使用多塊讀取以快速掃描表?;谒饕淖x取是單塊讀取,因此在使用索引 時的目標是減少解決查詢所需的單個塊的數(shù)量。通過使用oracle中的一些可用選項,比如分區(qū)、并行 dml并行查詢操作以 及使用db_file_multiblock_read_count 進行更大的i/o操作,全表掃描和索引 查找之間的平衡點發(fā)生了改變

5、。硬件更為快速,磁盤可以在磁盤上的高速緩存中 緩存更多的信息,內(nèi)存也變得更為廉價。與此同時,oracle已經(jīng)增強的索引特性, 包括了跳躍式掃描索引和其他減少檢索數(shù)據(jù)所需時間的操作。技巧:不 當升級oracle版本時,確保測試應用程序的查詢以確定查詢的執(zhí)行路徑是否仍然使用在 升級之前使用的索引。查看執(zhí)行路徑是否改變,并且查看這種改動的效果是更好還是更 差。索引通常能提高查詢的性能。selec詔旬、updater deleter令的where 子句的性能(當訪問的行較少時)可以從索引中獲益。一般來說,增加索引會降低 inserts句的性能(因為需要同時對表和索引進行插入)。如果未索引列,則索引 列

6、的updat螟作將會減慢執(zhí)行速度,因為數(shù)據(jù)庫必須管理對表和索引的改動。此 外,大量行的deleted乍將會由于表中存在索引而減慢執(zhí)行速度。用于刪除表中一半數(shù)據(jù)的delet曲句同時需要刪除所有這些行的索引(這種 情況是非常耗時的)。通常,表中的每個索引都會使對表執(zhí)行的inserts作變慢 兩倍;使用兩條索引通常會使插入操作變慢一倍(然而,一個由兩部分組成的單一 索引并不比只有一個部分組成的單一索引差很多)。索引列的update口 deletes 作同樣也會變慢。您需要根據(jù)對數(shù)據(jù)操作性能的影響平衡索引對查詢性能帶來的 益處。查詢dba_indexes圖可獲得表上所有查詢的清單。同樣需要注意的是,

7、可以通過訪問user_indexes圖檢索模式的索引。查詢all_indexe視圖可以查 看已經(jīng)訪問的所有表的索引。例如,在empg上創(chuàng)建了一些索引,empg是oracle的一個演示表。create index emp_id1 on emp(empno, ename, deptno);create index emp_id2 on emp (sal);當發(fā)出這些命令時,數(shù)據(jù)庫將在empg上創(chuàng)建兩個單獨的索引。每個索引將 包含empg中的指定值以及匹配指定值的行的 rowidb。如果需要查找sal值為 1000的emp2錄,優(yōu)化器就會使用emp_id2r引查找該值,在索引中查找相關的 rowid

8、并且使用該rowide表中查找正確的行。下面的user_indexes詢顯示了 empg上的新索引:selecttable_name, index_namefromuser_indexeswheretable_name = emp;index nametable nameempemp _id1empemp_id2輸出顯示了兩個索引,但是沒有顯示每個索引中的列。為了獲得給定表中被 索引的特定列,可訪問user_ind_columns。同樣需要注意的是,dbaw以通 過訪問dba_ind_columns檢索所有模式中被索引的列,而通過訪問 all_ind_ columns圖則可以查看所有表的索引列

9、。column index_name format a12column column_name format a8column table_name format a8selecttable_name, index_name, column_name, column_positionfromuser_ind_columnsorderby table_name, index_name, column_position;table_na index_name column_n column_positionempemp_id1empno1empemp_id1ename2empemp_id1dept

10、no3empemp_id2sal1empg中有兩個索引。首先,emp_id做一個組合(concatenated)索引,它對empno enameffi deptno這幾列進行索弓i。而第二個索引 emp_id2r對sal列進 行索引。顯示在程序清單中的column_position顯示了組合索引中的列順序,即 按照 empno enamel口 deptno 的順序。技巧:查詢dba indexes和dba ind columns 可以檢索到一個給定表的索引列表。對 于您自己的模式,只能使用 user_indexes和user_ind_ columns來檢索信息。2.2 組合索引當某個索引包含有

11、多個已索引的列時,我們稱這個索引為組合(concatenated)索引或是復合索引。雖然oracle 9i引入的跳躍式掃描索引訪問方法增強了優(yōu) 化器在使用組合索引時的選擇,但是您應該謹慎地選擇索引中的列順序。一般來說,索引的第一列應該是最有可能在 where句中使用的列,并且也是索引中最 具選擇性的列。在引入跳躍式掃描功能之前,查詢只能在where句中使用索引的第一列時 使用索引??紤]如下程序清單中的示例,其中表empt一個組合索引,該索引包 含了 empno enamel口 deptno。注意第部分是 empno 第二部分貝u是 ename 最后是deptno。如果沒有使用跳躍式掃描功能,除

12、非在where句中對第一列(e mpno才旨定一個值,否則oracle 一般不會使用這個索引。selectjob, empnofromempwhereename = rich;因為enamel是索引的第一列,優(yōu)化器可能會選擇不使用該索引。隨著在 o racle 9i中引入了跳躍式掃描功能,即使在 where句中沒有指定empnofi, 優(yōu)化器也可能會選擇使用該索引。相反,優(yōu)化器可能會選擇索引的快速全局掃描 或全表掃描。如果在where句中使用索引的第三列,也會產(chǎn)生相同的情況:selectjob, empnofromemp在該程序清單中,where句指定了索引中第三列的值。優(yōu)化器可能選擇執(zhí) 行索

13、引快速掃描訪問、索引快速全局掃描或全表掃描。通過創(chuàng)建索引,您可以在 執(zhí)行查詢時為數(shù)據(jù)庫提供更多的選擇。從而有希望改進整體的性能。注意,用戶 的代碼沒有改變,優(yōu)化器可以識別該索引,并且根據(jù)每種替代方法的預期成本決 定使用何種方法。在下面的示例中,使用了索引的一部分。將第一列empnomwhere句中的限制條件,以便oracle可以使用該索引。selectjob, empnofromempwhereempno = rich;兩種最常見的索引掃描類型是唯一掃描和范圍掃描。在唯一掃描中,數(shù)據(jù)庫 知道索引包含一個唯一值列表。在范圍掃描中,數(shù)據(jù)庫將根據(jù)查詢標準從索引中 返回多個值。在該示例中,emp_id

14、1和emp_id2索引沒有被創(chuàng)建為唯一索引。or acle將在檢索它們的值時執(zhí)行范圍掃描。在創(chuàng)建索引時,使用 create uniqu index命令可以創(chuàng)建唯一索引。在創(chuàng)建主鍵約束或unique勺束時,oracle將基于指定的列自動創(chuàng)建唯一索 引(除非使用disable?句創(chuàng)建約束)。如果創(chuàng)建多列的主鍵,oracle將創(chuàng)建組 合索引,其中的列按照在創(chuàng)建主鍵時指定的順序排列。通過提供每個行的rowid類似于emp_id儕口 emp_id2勺索引為oracle提供 了訪問單行數(shù)據(jù)的能力。rowidt實就是直接指向單獨行的物理位置的指針。技巧:廠 將oracle的rowid硬編碼成特定代碼時,一定

15、要小心謹慎。因為不同版本的rowid 結構會有所不同,而且在將來的版本里可能還會有所改變。我建議不要對 rowid進行硬編碼。2.3 限制索引限制索引是一些沒有經(jīng)驗的開發(fā)人員經(jīng)常犯的錯誤之一。在sql中有很多陷阱會使一些索引無法使用。后文的各小節(jié)將討論一些常見的問題。oracle優(yōu)化器在后臺工作,選擇并使用可能最有效的數(shù)據(jù)檢索方法。例如, 在許多情況下不需要指定 where句,從而oracle可以使用索引。如果查詢索 引列的min或max值,oracle將從索引(而不是表)中檢索該值。同樣,如果對 索引列執(zhí)行coun函數(shù),oracle可以使用索引而不是該列。在下面的小節(jié)中, 您將看到where

16、句的邏輯阻止oracle使用索引的情況。2.3.1 使用不等于運算符(、!=)索引只能用于查找表中已有的數(shù)據(jù)。 每當在where句中使用不等于運算符 時,都將無法使用所引用的列的索引。請考慮下文對customers勺查詢,cutomers中的cust_rating有一個索引。下面的語句仍會執(zhí)行一次全表掃描 (因為大多數(shù)記錄都可以被檢索到),即使列cust_rating存在索弓i。selectcust_id, cust_namefromcustomerswherecust_rating aa;當分析表時,oracle收集表中數(shù)據(jù)分布的相關統(tǒng)計信息。通過使用這種分析, 基于成本的優(yōu)化器就可以決定在

17、 where句中對一些值使用索引,而對其他的值 不使用索引。在應用程序開發(fā)和測試期間,應該使用具有代表性的行集,從而可 以模擬產(chǎn)品環(huán)境中實際的數(shù)據(jù)值分布。技巧:(參考10gr2通過使用 create index 命令的 compute statistics 子句,可以在一個步驟中創(chuàng) 建索引并分析它們。也可以從產(chǎn)品數(shù)據(jù)庫中導入統(tǒng)計信息以測試執(zhí)行路徑database performance tuning guide (part number b14211-01)的 14.5.2 節(jié))。2.3.2 使用 is null 或 is not null在where句中使用is null或is not nu

18、ll同樣會限制索引的使用,因為 null1并沒有被定義。數(shù)據(jù)庫中沒有值等于null;甚至null也不等于null在sql語句中使用null有很多麻煩。如果被索引的列在某些行中存在null值,在索引中就不會有相應的條目(例外情況是位圖索引,這是位圖索引對于 nul段索通常較為快速的原因)。一般情況下,下面的語句將造成執(zhí)行全表掃描, 即使sal列被索引。selectempno, ename, deptnofromempwheresal is null;如果要在上面的三列中禁用 null,可以在創(chuàng)建或修改表時使用 not null 注意,如果表中已經(jīng)包含數(shù)據(jù),只有在表中每一行都有非null或是使用a

19、lter tabled令的default旬時,才可以為列設置 not null1性。下面的程序 清單顯示了修改emrs的sal列以禁用null值:alter table emp modify (sal not null);注意,如果想嘗試在sal列中插入一個nullfi,會返回一個錯誤信息。技巧:在創(chuàng)建表時對列指定 not null后會禁用null值,而且可以避免與使用 null值相 關的性能問題。下面的創(chuàng)建表語句為deptno列提供了一個默認值。如果在執(zhí)行inser做作 時該列沒有指定的值,就會使用默認值。如果指定了默認值,并且您確實需要使 用null,則需要在該列中插入nullcreate

20、 table employee(empl_id number(8) not null, first_name varchar2(20) not null,last_name varchar2(20) not null, deptno number(4) default 10);insert into employee(empl_id, first_name, last_name)values (8100, regina, niemiec);1 row created.select*fromemployee;empl_id first_namelast_namedeptno8100 regina

21、niemiec10insert into employeevalues (8200, rich, niemiec, null);1 row created.selectfromempl id first namedeptno8100regina108200rich技巧:null值通常會限制索引。在創(chuàng)建表時對某一列指定last_nameniemiecniemiecnot null 或 default ,對于避employee;免可能出現(xiàn)的性能問題很有幫助。2.3.3 使用函數(shù)如果不使用基于函數(shù)的索引,那么在sql語句的where句中對存在索引的 列使用函數(shù)時,會使優(yōu)化器忽略掉這些索引。一些常見的

22、函數(shù),如 trunc subs tr to_dateto_char instr等,都能改變列的值。因此,無法使用已被函 數(shù)引用的索引和列。下面的語句會執(zhí)行一次全表掃描,即使hire_date列上存在 索引(只要它不是基于函數(shù)的索引)。selectempno, ename, deptnofromempwheretrunc(hiredate) = 01-may-01;把上面的語句改成如下所示的語句,這樣就可以通過索引進行查找。selectempno, ename, deptnofromempwherehiredate 01-may-01andhiredate for columns size 10

23、 company_code);pl/sql procedure successfully completed.前面的查詢會在company上創(chuàng)建一個帶有10個存儲桶的直方圖,如圖2- 2所示。圖中company_code所有值被分成10個存儲桶。這個例子中有一個 占大部分的company_code值(大約80%,即1430)。同樣如圖中所示,多數(shù)寬度 均衡的存儲桶都只有3行記錄;有一個存儲桶卻有73行記錄。在高度均衡圖中, 每個存儲桶有相同數(shù)目的行,多數(shù)存儲桶的終點都是1430,這也反映了數(shù)據(jù)的偏斜分布。oracle的直方圖是高度均衡的,而不是寬度均衡。也就是說,直方圖里的所 有存儲桶都有相同

24、的行數(shù)。存儲桶的起點和終點取決于包含這些值的行數(shù)。寬度均衡的直方圖則著重于確定每個存儲桶的值的范圍,然后統(tǒng)計出這個范圍內(nèi)的行 數(shù)。這并不是一個理想的選擇。高度拈濟 10m - 130114011430-i3d0 1mq 1430 iw 1430 mm 1430 14w 1枷 ifcq行 i。 舊 1。2101。 q k 101寬度內(nèi)粉1000-1051-1101-1151- 1301-12j1-1x1-1351-1401-1451-1c5&ii 如ii 同1200 1250130013501jooi 居0jsco4t j 33333圖2-2 構建在company_cod字段上的直方圖(具有10

25、個存儲桶)技巧:如果表中的數(shù)據(jù)分布得較不均勻,直方圖會為基于成本的優(yōu)化器提供一個數(shù)據(jù)分布的 均衡圖(把數(shù)據(jù)平均分布到各個存儲桶)。在不是很偏斜的列上使用直方圖并不會提高 性能 技巧:默認情況時,oracle的直方圖會產(chǎn)生75個存儲桶??梢园?size的值指定在1254之 間。2.8 快速全局掃描在索引的快速全局掃描期間,oracle讀取b樹索引上的所有樹葉塊。這個索 引可以按順序讀取,這樣可以一次讀取多個塊。初始化文件中的 db_file_multi block _read_cou可以控制同時被讀取的塊的數(shù)目。相比于全表掃描,快 速全局掃描通常需要較少的物理i/o ,并且允許更快速地處理查詢。

26、如果表查詢中的所有列都被包括在索引里, 而索引的前置列并不在 where 件中,就可以使用快速全局掃描(必須指定第7章講到的index_ffs!示)。在下 面的示例中用到了 emp表。它有一個組合索引,包括列empno enamel deptno。selectempno, ename, deptnofromempwheredeptno = 30;oracl由于sql句中的所有列都包括在索引中,因此可以執(zhí)行快速全局掃描。通 常在只查詢索引連接鍵列的連接期間執(zhí)行索引快速全局掃描。作為選擇,e可能執(zhí)行索引的跳躍式掃描訪問;優(yōu)化器應該考慮deptno列的直方圖(如果有可用的直方圖),并且確定哪個可用的

27、訪問路徑可以產(chǎn)生最低的性能成本。技巧:如果索引相對于表的總體尺寸來說很小,快速全局掃描就可以使應用程序的性能陡增。如果表中有一個包含了大部分列的組合索引,索引可能要比真實的表要大,這樣快速全 局掃描反而會降低性能。2.9 跳躍式掃描本章前面的“組合索引” 一節(jié)中介紹過,索引跳躍式掃描特性允許優(yōu)化器使用組合索引,即便索引的第一列沒有出現(xiàn)在 where句中。索引跳躍式掃描比全索引掃描快得多,這是因為它只需要執(zhí)行很少量的讀取。例如,下面的查詢顯示了索引全掃描和跳躍掃描之間的區(qū)別。參考第6章,可以更好地了解什么是執(zhí)行計劃或后面的程序清單中列出的統(tǒng)計數(shù)據(jù)。在該程序清單中,emp5r成百上千的行。跟隨查詢

28、的執(zhí)行,該程序清單顯示了查詢花費的時間、它在數(shù)據(jù)庫中的執(zhí)行路徑,以及顯示處理該查詢所需的邏輯讀數(shù)量 (一致的獲取)和物理讀數(shù)量的統(tǒng)計數(shù)據(jù)。create index skipl on emp5(job,empno);index created.select count(*)fromemp5whereempno = 7900;日apsed: 00:00:03.13 (result is a single rownot displayed)execution planselect statement optimizer=choose (cost=4 card=1 bytes=5)sort (aggr

29、egate)index (fast full scan) of skip1 (non-unique)statistics6826consistent gets6819physical readsselect /*+ index(emp5 skipl) */ count(*)fromemp5whereempno = 7900;elapsed: 00:00:00.56execution plan0select statement optimizer=choose (cost=6 card=1 bytes=5)1 0 sort (aggregate)2 1index (skip scan) of s

30、kip1 (non-unique)statistics21consistent gets17physical reads如同該程序清單所示,第二個選項使用index (skip scan臊作讀取索引。 該執(zhí)行路徑需要21個邏輯讀,這些邏輯讀又需要17個物理i/o操作。第一個選 項執(zhí)行index (fast full scang作,該操作需要更多數(shù)量的邏輯和物理i/o。為了讓優(yōu)化器選擇跳躍式掃描,可能需要在查詢中使用提示,如同該程序清單所示。提示影響了優(yōu)化器,使其偏向您所指定的執(zhí)行路徑。技巧:對于那些有組合索引的大型表而言,索引跳躍式掃描特性可以提供一個快速訪問,即使j索引的第一列沒有在限制條件

31、中使用。2.10 索引的類型下面列出了本節(jié)要討論的索引類型: b樹索引 位圖索引 hash索弓i 索引組織表索引 反轉(zhuǎn)鍵(reverse key)索引基于函數(shù)的索引 分區(qū)索引(本地和全局索引) 位圖連接索引2.10.1 b樹索引b樹索引在oracle中是一個通用索引。 在創(chuàng)建索引時它就是,默認的索引類型。b樹索引可以是一個列的(簡單)索引,也可以是組合/復合(多個列)的索引。b樹索引最多可以包括 32 列。在圖2-3的例子中,b樹索引位于雇員表的last_name列上。這個索引的二元高度為3;接下來,oracle會穿過兩個樹枝塊(branch block),到達包含有 rowid的樹葉塊。在每

32、個樹 枝塊中,樹枝行包含鏈中下一個塊的id號。樹葉塊包含了索引值、rowid ,以及指向前一個和后一個樹葉塊的指針。oracle可以從兩個方向遍歷這個二叉樹。b樹索引保存了在索引列上有值的每個數(shù)據(jù)行的rowid值。oracle不會對索引列上包含null值的行進行索引。如果索引是多個列的組合索引,而其中列上包含null值,這一行就會處于包含 null值的索引列中,且將被處理為空(視為null)。必然歸 r id block id gcvt irb( block id jkrfisan由a idkinga- kk block id俎劑1更必出 blodk idconley也rdedwirds小hs

33、 mfinlt曲;dgorifridic hloct idgrossbfikncm出 hock dholmendx ahdwsonidx block idhlocfe id麻飛j jhl i:jkaivnonkk block id& kladtlovonidxblch idblerleper#bl融kj出劑2gqn1iiw idgoutemw idgroe&irew idgrewiidgrowiwv idgroutir?* idhallhernanfw id fww idhilmanrtr* idmimirw idhinsdalejjhittanrurw idhirrxmiijw idholi

34、eriw idhapw圖 idhqjjwnow id/刑3圖2-3 b樹索引創(chuàng)建過程技巧:i/o量索引列的值都存儲在索引中。因此,可以建立一個組合(復合)索引,這些索引可以直接 滿足查詢,而不用訪問表。這就不用從表中檢索數(shù)據(jù),從而減少了2.10.2 位圖索引位圖索引非常適合于決策支持系統(tǒng)(decision support system, dss)和數(shù)據(jù)倉庫,它們不應該用于通過事務處理應用程序訪問的表。它們可以使用較少到中等基數(shù)(不同值白數(shù)量)的列訪問非常大的表。盡管位圖索引最多可達30個列,但通常它們都只用于少量的列。例如,您的表可能包含一個稱為sex的列,它有兩個可能值:男和女。這個基數(shù)只為

35、2,如果用戶頻繁地根據(jù) sex列的值查詢該表,這就是位圖索引的基列。當一個表內(nèi)包含了多個 位圖索引時,您可以體會到位圖索引的真正威力。如果有多個可用的位圖索引,oracle就可以合并從每個位圖索引得到的結果集,快速刪除不必要的數(shù)據(jù)。下面的程序清單給出了 一個創(chuàng)建位圖索引的例子:create bitmap index dept_idx2_bm on dept (deptno);index created.技巧:對于有較低基數(shù)的列需要使用位圖索引。性別列就是這樣一個例子,它有兩個可能值:男或女(基數(shù)僅為2)。位圖對于低基數(shù)(少量的不同值)列來說非??欤@是因為索引的尺 寸相對于b樹索引來說小了很多

36、。因為這些索引是低基數(shù)的 b樹索引,所以非常小,因 此您可以經(jīng)常檢索表中超過半數(shù)的行,并且仍使用位圖索引。當大多數(shù)條目不會向位圖添加新的值時,位圖索引在批處理(單用戶)操作中加載表(插入操彳)方面通常要比b樹做得好。當多個會話同時向表中插入行時不應該使用位圖索引,在 大多數(shù)事務處理應用程序中都會發(fā)生這種情況。位圖索引示例下面來看一個示例表 participant ,該表包含了來自個人的調(diào)查數(shù)據(jù)。列 age_code、 income_level、education_level 和 marital_status 都包括了各自的位圖索引。圖 2-4 顯示了 每個直方圖中的數(shù)據(jù)平衡情況, 以及對訪問每

37、個位圖索引的查詢的執(zhí)行路徑。圖中的執(zhí)行路 徑顯示了有多少個位圖索引被合并,可以看出性能得到了顯著的提高。r afccdcc筌獷德37 glem-w-處一hatlammswincome level10.m0- -1.000 3mm】 la.ooo 然 網(wǎng)初 22,000 h?2m-1 2d0( dos s i fran; f&rliclpaill v0anal ion*iws 1 . sbd?pmd erisutwt i qfldwvul * k5 md mri%al_statub ,if2c-ht imxjrrlhee ihtwap comwamoh 號工akp a:tmaf itoex bl

38、ikap index 9ttka index &ctma1* ihkx.srl5wt ctatesmft 的通cm0mersibclg hmmej of fht.eomeljjoteizi mingle vaujbj ! lpawit_jz_coe, i5ibule 7mwhj cf *faht_educ 1ti0m_lbv3l1 isinglb vai二:hl oe ?aw ?4afiital_sta7usj圖2-4 位圖索引創(chuàng)建過程如圖2-4所示,優(yōu)化器依次使用 4個單獨的位圖索引, 這些索引的列在 where子句中被引用。每個位圖記錄指針 (例如0或1),用于指示表中的哪些行包含位圖中的

39、已知值。有了這些信息后,oracle就執(zhí)行bitmap and操作以查找將從所有 4個位圖中返回哪些行。該值然后被轉(zhuǎn)換為 rowid值,并且查詢繼續(xù)完成剩余的處理工作。注意, 所有4個列都有 非常低的基數(shù),使用索引可以非??焖俚胤祷仄ヅ涞男小<记桑涸谝粋€查詢中合并多個位圖索引后,可以使性能顯著提高。位圖索引使用固定長度的數(shù) 據(jù)類型要比可變長度的數(shù)據(jù)類型好。較大尺寸的塊也會提高對位圖索引的存儲和讀取性卜面的查詢可顯示索引類型。臺p 目匕。b樹索引作為normal列出;而位圖索引的類型值為 bitmap 。select index_name, index_typefrom user_indexes

40、;技巧:如果要查詢位圖索引列表,可以在 user _indexes視圖中查詢index_type歹u。建議不要在一些聯(lián)機事務處理(oltp)應用程序中使用位圖索引。b樹索引的索引值中包含rowid ,這樣oracle就可以在行級別上鎖定索引。位圖索引存儲為壓縮的索引值,其中包含了一定范圍的 rowid ,因此oracle必須針對一個給定值鎖定所有范圍內(nèi)的rowid 。這種鎖定類型可能在某些 dml語句中造成死鎖。select語句不會受到這種鎖定問題的影響。位圖索引有很多限制,如下所示:基于規(guī)則的優(yōu)化器不會考慮位圖索引。 當執(zhí)行alter tabled句并修改包含有位圖索引的列時,會使位圖索引失

41、效。 位圖索引不包含任何列數(shù)據(jù),并且不能用于任何類型的完整性檢查。 位圖索引不能被聲明為唯一索引。 位圖索引的最大長度為 30。技巧:不要在繁重的oltp環(huán)境中使用位圖索引2.10.3 hash 索弓 |使用hash索引必須要使用 hash集群。建立一個集群或 hash集群的同時,也就定 義了一個集群鍵。這個鍵告訴oracle如何在集群上存儲表。在存儲數(shù)據(jù)時,所有與這個集群鍵相關的行都被存儲在一個數(shù)據(jù)庫塊上。如果數(shù)據(jù)都存儲在同一個數(shù)據(jù)庫塊上,并且將hash索引作為 where子句中的確切匹配,oracle就可以通過執(zhí)行一個 hash函數(shù)和i/o來訪問數(shù)據(jù)一一 而通過使用一個二元高度為4的b樹索

42、引來訪問數(shù)據(jù),則需要在檢索數(shù)據(jù)時使用4個i/q 如圖2-5所示,其中的查詢是一個等價查詢,用于兀配hash列和確切的值。oracle1以快速使用該值,基于h ash函數(shù)確定行的物理存儲位置。hash索引可育配訪問數(shù)據(jù)庫中數(shù)據(jù)的最快方法,但它也有自身的缺點。集群鍵k不同值的數(shù)目必須在創(chuàng) 建hash集群之前就要用i。需要在創(chuàng)建hash集群的時候指定這個值。低估了集群鍵的不同值的數(shù)字可能會 造成集群的沖突(兩個集群的鍵值擁有相同的hash彳孰。這種沖突是非常消耗資源的。沖突會造成用來存儲額外 行的緩沖溢凡 然后造成褥卜的i/o。如果不iw hash值的數(shù)目已經(jīng)被低(古,您就必須在重建這個集群之后改變

43、 這個值。alter cluster令不能改變hash鍵的數(shù)目。hash集群還可能浪費空間。如果無法確定需要多少空間來維護某個集群鍵上的所有行,就可育繼成空間 的浪費。如果不能群的未來t曾長分0己好附加的空間,hash集忡!育!不是最好的選擇。如果應用程序經(jīng)常在集群表上進行金表掃描,hash集群可能也不是最好的選擇。由于需要為未來的增長 分配好集群的剩余空間量,全表掃描可能非常消耗資源。圖2-5 使has度引的例子在實現(xiàn)hash集群之前一定要小心。您需要全面地觀察應用程序,保證在實現(xiàn)這個選項之前已經(jīng)了解關于表數(shù)據(jù)的大量信息。通常,hash對于一些包有序值的靜態(tài)數(shù)!非常有必 技巧:/*hash索

44、引在有限制條件(需要指定一個確定的值而不是一個值范圍)的情況下非常有用。,52.10.4 索引組織表索引組織表會把表的存儲結構改成b樹結構,卬!的主鍵進行b序。這#特殊的櫥口其他類型的樣, 可以在表上執(zhí)行所有白dml和ddl語句。由于表的特殊結構,rowid并沒有澄聯(lián)到表的行上。對一些涉及精確匹配和范圍搜索的語句,索引組織表提供了一種基于鍵的快速數(shù)據(jù)訪問機基于主鍵 值白update和delete語句的性能也同樣得以提高,這是因為行在物理上有序。由于鍵列j的值在表和索引中 都沒有重復,存儲所需要的空間也隨之減少。如果不會姍t地根據(jù)主鍵列查詢數(shù)據(jù),則需要在索引組織表中的其他列上倉犍二級索引。不會頻

45、繁根據(jù)主 崢詢表的應用程序不會了解到使用索弓i組織表的全部優(yōu)點。對于總是通過對主鍵的精t匹配或范圍掃描進行訪 問的表,就需要考慮使用索引組織表。技巧:可以在索引組織表上建立二級索引。2.10.5 反鎖1索引當載入一些有序數(shù)據(jù)時,索引肯定會碰到與i/o相關的一些瓶頸。在數(shù)據(jù)載入期間,某部分索引和磁盤肯定 會比其他部分使用隧得多。為了解決這個問題,可以把索引表空間存放在能夠把文件物理分害庭多個磁盤上的 磁盤體系結構上。為了解決這個問題,orac前提供了一種反轉(zhuǎn)鍵索弓i的方法。如果數(shù)據(jù)以反轉(zhuǎn)鍵索引存儲,這些數(shù)據(jù)的值就 會原先存儲的數(shù)值相反。這樣,數(shù)據(jù)1234 1235m23酗被存儲成4321 5321和6321結果就是索弓i會為 每次新插入的行更新不同的索弓塊。不育樹位圖索引和索引組織表進行反轉(zhuǎn)鍵處理。技巧:如果您的磁盤容量有限,同時還要執(zhí)行大量的有序載入,就可以使用反轉(zhuǎn)鍵索引。不可以將反轉(zhuǎn)鍵索引與位圖索引或索引組織表結合使用。2.10.6 基于函數(shù)的索引可以在表中創(chuàng)建基于函數(shù)的索引。如果沒有基于函數(shù)的索引,任何在列上執(zhí)行了函數(shù)的查詢都不能使用這 個列的索弓i。例如,下面的查詢就不能使用job列上的索引,除非它少于函數(shù)的索引:select *fromempwhere upper(job= mgr;下面的查詢使用job列上的索弓i,但是它將不會返回job列具

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論