版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、通過分析SQL語句的執(zhí)行計劃優(yōu)化SQL做DBA快7年了,中間感悟很多。在DBA的日常工作中,調(diào)整個別性能較差的SQL語句時一項富有挑戰(zhàn)性的工作。其中的關鍵在于如何得到SQL語句的執(zhí)行計劃和如何從SQL語句的執(zhí)行計劃中發(fā)現(xiàn)問題。總是想將日常經(jīng)驗的點點滴滴總結一下,但是直到最近才下定決心,總共花了3個周末時間,才將其整理成冊,便于自己日常工作。不好意思獨享,所以將其貼出來。第一章、第2章 并不是很重要,是自己的一些想法,關于如何做一個穩(wěn)定、高效的應用系統(tǒng)的一些想法。第三章以后都是比較重要的。附錄的內(nèi)容也是比較重要的。我常用該部分的內(nèi)容。前言 本文檔
2、主要介紹與SQL調(diào)整有關的內(nèi)容,內(nèi)容涉及多個方面:SQL語句執(zhí)行的過程、ORACLE優(yōu)化器,表之間的關聯(lián),如何得到SQL執(zhí)行計劃,如何分析執(zhí)行計劃等內(nèi)容,從而由淺到深的方式了解SQL優(yōu)化的過程,使大家逐步步入SQL調(diào)整之門,然后你將發(fā)現(xiàn)。 該文檔的不當之處,敬請指出,以便進一步改正。請將其發(fā)往我的信箱:。 如果引用本文的內(nèi)容,請著名出處!第1章 性能調(diào)整綜述 Oracle數(shù)據(jù)庫是高度可調(diào)的數(shù)據(jù)庫產(chǎn)品。本章描述調(diào)整的過程和那些人員應與O
3、racle服務器的調(diào)整有關,以及與調(diào)整相關聯(lián)的操作系統(tǒng)硬件和軟件。本章包括以下方面:l 誰來調(diào)整系統(tǒng)?l 什么時候調(diào)整?l 建立有效調(diào)整的目標l 在設計和開發(fā)時的調(diào)整l 調(diào)整產(chǎn)品系統(tǒng)l 監(jiān)控產(chǎn)品系統(tǒng)誰來調(diào)整系統(tǒng): 為了有效地調(diào)整系統(tǒng),若干類人員必須交換信
4、息并牽涉到系統(tǒng)調(diào)整中,例如:l 應用設計人員必須傳達應用系統(tǒng)的設計,使得每個人都清楚應用中的數(shù)據(jù)流動.l 應用開發(fā)人員必須傳達他們選擇的實現(xiàn)策略,使得語句調(diào)整的過程中能快速、容易地識別有問題的應用模塊和可疑的SQL語句.l 數(shù)據(jù)庫管理人員必須仔細地監(jiān)控系統(tǒng)活動并提供它們的資料,使得異常的系統(tǒng)性能可被快速得識別和糾正.l 硬件/軟件管理人員必須傳達系統(tǒng)的硬件、軟件配置并提供它們的資料
5、,使得相關人員能有效地設計和管理系統(tǒng)。 簡而言之,與系統(tǒng)涉及的每個人都在調(diào)整過程中起某些作用,當上面提及的那些人員傳達了系統(tǒng)的特性并提供了它們的資料,調(diào)整就能相對的容易和更快一些。不幸的是,事實上的結果是:數(shù)據(jù)庫管理員對調(diào)整負有全部或主要的責任。但是,數(shù)據(jù)庫管理員很少有合適的系統(tǒng)方面的資料,而且,在很多情況下,數(shù)據(jù)庫管理員往往是在實施階段才介入數(shù)據(jù)庫,這就給調(diào)整工作帶來許多負面的影響,因為在設計階段的缺陷是不能通過DBA的調(diào)整而得以解決,而設計階段的缺陷往往對數(shù)據(jù)庫性能造成極大的影響。 其實,在真正成熟的開發(fā)環(huán)境下,開
6、發(fā)人員作為純代碼編寫人員時,對性能的影響最小,此時大部分的工作應由應用設計人員完成,而且數(shù)據(jù)庫管理員往往在前期的需求管理階段就介入,為設計人員提供必要的技術支持。調(diào)整并不是數(shù)據(jù)庫管理員的專利,相反大部分應該是設計人員和開發(fā)人員的工作,這就需要設計人員和開發(fā)人員具體必要的數(shù)據(jù)庫知識,這樣才能組成一個高效的團隊,然而事實上往往并非如此。什么時候作調(diào)整? 多數(shù)人認為當用戶感覺性能差時才進行調(diào)整,這對調(diào)整過程中使用某些最有效的調(diào)整策略來說往往是太遲了。此時,如果你不愿意重新設計應用的話,你只能通過重新分配內(nèi)存(調(diào)整SGA)和調(diào)整I/O的辦法或多或少地提高
7、性能。Oracle提供了許多特性,這些特性只有應用到正確地設計的系統(tǒng)中時才能夠很大地提高性能。 應用設計人員需要在設計階段設置應用的性能期望值。然后在設計和開發(fā)期間,應用設計人員應考慮哪些Oracle 特性可以對系統(tǒng)有好處,并使用這些特性。通過良好的系統(tǒng)設計,你就可以在應用的生命周期中消除性能調(diào)整的代價和挫折。圖1-1圖1-2說明在應用的生命周期中調(diào)整的相對代價和收益,正如你見到的,最有效的調(diào)整時間是在設計階段。在設計期間的調(diào)整能以最低的代價給你最大的收益。圖1-1在應用生命周期中調(diào)整的代價圖1-2 在應用生命周期中調(diào)整的
8、收益 當然,即使在設計很好的系統(tǒng)中,也可能有性能降低。但這些性能降低應該是可控的和可以預見的。調(diào)整目標 不管你正在設計或維護系統(tǒng),你應該建立專門的性能目標,它使你知道何時要作調(diào)整。如果你試圖胡亂地改動初始化參數(shù)或SQl 語句,你可能會浪費調(diào)整系統(tǒng)的時間,而且無什么大的收益。調(diào)整你的系統(tǒng)的最有效方法如下:l 當設計系統(tǒng)時考慮性能l 調(diào)整操作系統(tǒng)的硬件和軟件l
9、160; 識別性能瓶頸l 確定問題的原因l 采取糾正的動作當你設計系統(tǒng)時,制定專門的目標;例如,響應時間小于秒。當應用不能滿足此目標時,識別造成變慢的瓶頸(例如,I/O競爭),確定原因,采取糾正動作。在開發(fā)期間,你應測試應用研究,確定在采取應用之前是否滿足設計的性能目標。當你正在維護生產(chǎn)庫系統(tǒng)時,有多種快速有效的方法來識別性能瓶頸。不管怎樣,調(diào)整通常是一系列開銷。一旦你已確定了瓶頸,你可能要犧牲一些其它方面的指標來達到所要的結果。例如,如果I/O有問題,你可能需要更多內(nèi)存或
10、磁盤。如果不可能買,你可能要限制系統(tǒng)的并發(fā)性,來獲取所需的性能。然而,如果你已經(jīng)明確地定義了性能的目標,那用什么來交換高性能的決策就變的很容易的,因為你已經(jīng)確定了哪些方面是最重要的,如過我的目標為高性能,可能犧牲一些空間資源。隨著應用的越來越龐大,硬件性能的提高,全面的調(diào)整應用逐漸變成代價高昂的行為,在這樣情況下,要取得最大的投入/效率之比,較好的辦法是調(diào)整應用的關鍵部分,使其達到比較高的性能,這樣從總體上來說,整個系統(tǒng)的性能也是比較高的。這也就是有名的20/80原則,調(diào)整應用的20%(關鍵部分),能解決80%的問題。在設計和開發(fā)系統(tǒng)時作調(diào)整 良
11、好設計的系統(tǒng)可以防止在應用生命周期中產(chǎn)生性能問題。系統(tǒng)設計人員和應用開發(fā)人員必須了解Oracle的查詢處理機制以便寫出高效的SQL語句?!暗?章 有效的應用設計”討論了你的系統(tǒng)中各種可用的配置,以及每種配置更適合哪種類型的應用?!暗?章 優(yōu)化器”討論了Oracle的查詢優(yōu)化器,以及如何寫語句以獲取最快的結果。當設計你的系統(tǒng)時,使用下列優(yōu)化性能的準則:l 消除客戶機服務器應用中不必要的網(wǎng)絡傳輸。- 使用存儲過程。l 使用適合你系統(tǒng)的相應Oracle服務器選件(例如,并行查詢或分布式數(shù)據(jù)庫)
12、。l 除非你的應用有特殊的需要,否則使用缺省的Oracle鎖。l 利用數(shù)據(jù)庫記住應用模塊,以便你能以每個模塊為基礎來追蹤性能。l 選擇你的數(shù)據(jù)塊的最佳大小。 - 原則上來說大一些的性能較好。l 分布你的數(shù)據(jù),使得一個節(jié)點使用的數(shù)據(jù)本地存貯在該節(jié)點中。調(diào)整產(chǎn)品系統(tǒng) 本節(jié)描述對應用系統(tǒng)快速、容易地找出性能瓶頸,并決定
13、糾正動作的方法。這種方法依賴于對Oracle服務器體系結構和特性的了解程度。在試圖調(diào)整你的系統(tǒng)前,你應熟悉Oracle調(diào)整的內(nèi)容。為調(diào)整你已有的系統(tǒng),遵從下列步驟:l 調(diào)整操作系統(tǒng)的硬件和軟件l 通過查詢V $SESSION_WAIT視圖,識別性能的瓶頸,這個動態(tài)性能視圖列出了造成會話(session)等待的事件。l 通過分析V $SESSION_WAIT中的數(shù)據(jù),決定瓶頸的原因。l
14、; 糾正存在的問題。監(jiān)控應用系統(tǒng)這主要是通過監(jiān)控oracle的動態(tài)視圖來完成。各種有用的動態(tài)視圖:如v$session_wait, v$session_event等。第2章 有效的應用設計 我們通常將最常用的應用分為2種類型:聯(lián)機事務處理類型(OLTP),決策支持系統(tǒng)(DSS)。聯(lián)機事務處理(OLTP) 該類型的應用是高吞吐量,插入、更新、刪除操作比較多的系統(tǒng),這些系統(tǒng)以不斷增長的大容量數(shù)據(jù)為特征,它們提供給成百用戶同時存取,典型的OLTP系統(tǒng)是訂票系統(tǒng),銀行的業(yè)務系統(tǒng),訂單系統(tǒng)。
15、OTLP的主要目標是可用性、速度、并發(fā)性和可恢復性。當設計這類系統(tǒng)時,必須確保大量的并發(fā)用戶不能干擾系統(tǒng)的性能。還需要避免使用過量的索引與cluster 表,因為這些結構會使插入和更新操作變慢。決策支持(DSS) 該類型的應用將大量信息進行提取形成報告,協(xié)助決策者作出正確的判斷。典型的情況是:決策支持系統(tǒng)將OLTP應用收集的大量數(shù)據(jù)進行查詢。典型的應用為客戶行為分析系統(tǒng)(超市,保險等)。決策支持的關鍵目標是速度、精確性和可用性。該種類型的設計往往與OLTP設計的理念背道而馳,一般建議使用數(shù)據(jù)冗余、大量索引、cluster table、并行查
16、詢等。近年來,該類型的應用逐漸與OLAP、數(shù)據(jù)倉庫緊密的聯(lián)系在一起,形成的一個新的應用方向。第3章 SQL語句處理的過程在調(diào)整之前我們需要了解一些背景知識,只有知道這些背景知識,我們才能更好的去調(diào)整sql語句。本節(jié)介紹了SQL語句處理的基本過程,主要包括:· 查詢語句處理 · DML語句處理(insert, update, delete) · DDL 語句處理(create . ,
17、drop . , alter . , ) · 事務控制(commit, rollback) SQL 語句的執(zhí)行過程(SQL Statement Execution) 圖3-1 概要的列出了處理和運行一個sql語句的需要各個重要階段。在某些情況下,Oracle運行sql的過程可能與下面列出的各個階段的順序有所不同。如DEFINE階段可能在FETCH階段之前,這主要依賴你如何書寫代碼。對許多oracle的工具來說,其中某些階段會自動
18、執(zhí)行。絕大多數(shù)用戶不需要關心各個階段的細節(jié)問題,然而,知道執(zhí)行的各個階段還是有必要的,這會幫助你寫出更高效的SQL語句來,而且還可以讓你猜測出性能差的SQL語句主要是由于哪一個階段造成的,然后我們針對這個具體的階段,找出解決的辦法。圖 3-1 SQL語句處理的各個階段DML語句的處理 本節(jié)給出一個例子來說明在DML語句處理的各個階段到底發(fā)生了什么事情。假設你使用Pro*C程序來為指定部門的所有職員增加工資。程序已經(jīng)連到正確的用戶,你可以在你的程序中嵌入如下的SQL語句:EXEC SQL UPDATE employees S
19、ET salary = 1.10 * salary WHERE department_id = :var_department_id; var_department_id是程序變量,里面包含部門號,我們要修改該部門的職員的工資。當這個SQL語句執(zhí)行時,使用該變量的值。每種類型的語句都需要如下階段:· 第1步: Create a Cursor 創(chuàng)建游標· 第2步: Parse the Statement
20、; 分析語句· 第5步: Bind Any Variables 綁定變量· 第7步: Run the Statement 運行語句· 第9步: Close the Cursor 關閉游標如果使用了并行功能,還會包含下面這個階段:· 第
21、6步: Parallelize the Statement 并行執(zhí)行語句如果是查詢語句,則需要以下幾個額外的步驟,如圖 3所示:· 第3步: Describe Results of a Query 描述查詢的結果集· 第4步: Define Output of a Query 定義查詢的輸出數(shù)據(jù)· 第8步:
22、Fetch Rows of a Query 取查詢出來的行下面具體說一下每一步中都發(fā)生了什么事情:.第1步: 創(chuàng)建游標(Create a Cursor) 由程序接口調(diào)用創(chuàng)建一個游標(cursor)。任何SQL語句都會創(chuàng)建它,特別在運行DML語句時,都是自動創(chuàng)建游標的,不需要開發(fā)人員干預。多數(shù)應用中,游標的創(chuàng)建是自動的。然而,在預編譯程序(pro*c)中游標的創(chuàng)建,可能是隱含的,也可能顯式的創(chuàng)建。在存儲過程中也是這樣的。第2步:分析語句(Parse
23、the Statement) 在語法分析期間,SQL語句從用戶進程傳送到Oracle,SQL語句經(jīng)語法分析后,SQL語句本身與分析的信息都被裝入到共享SQL區(qū)。在該階段中,可以解決許多類型的錯誤。語法分析分別執(zhí)行下列操作:l 翻譯SQL語句,驗證它是合法的語句,即書寫正確l 實現(xiàn)數(shù)據(jù)字典的查找,以驗證是否符合表和列的定義l 在所要求的對象上獲取語法分析鎖,使得在語句的語法分析過程中不改變這些對象的定義l
24、0; 驗證為存取所涉及的模式對象所需的權限是否滿足l 決定此語句最佳的執(zhí)行計劃l 將它裝入共享SQL區(qū)l 對分布的語句來說,把語句的全部或部分路由到包含所涉及數(shù)據(jù)的遠程節(jié)點 以上任何一步出現(xiàn)錯誤,都將導致語句報錯,中止執(zhí)行。只有在共享池中不存在等價SQL語句的情況下,才對SQL語句作語法分析。在這種情況下,數(shù)據(jù)庫內(nèi)核重新為該語句分配新的共享SQL區(qū),并對語句
25、進行語法分析。進行語法分析需要耗費較多的資源,所以要盡量避免進行語法分析,這是優(yōu)化的技巧之一。語法分析階段包含了不管此語句將執(zhí)行多少次,而只需分析一次的處理要求。Oracle只對每個SQL語句翻譯一次,在以后再次執(zhí)行該語句時,只要該語句還在共享SQL區(qū)中,就可以避免對該語句重新進行語法分析,也就是此時可以直接使用其對應的執(zhí)行計劃對數(shù)據(jù)進行存取。這主要是通過綁定變量(bind variable)實現(xiàn)的,也就是我們常說的共享SQL,后面會給出共享SQL的概念。雖然語法分析驗證了SQL語句的正確性,但語法分析只能識別在SQL語句執(zhí)行之前所能發(fā)現(xiàn)的錯誤(如書寫錯誤、權限不足等)。因此,有些錯誤通過語法
26、分析是抓不到的。例如,在數(shù)據(jù)轉(zhuǎn)換中的錯誤或在數(shù)據(jù)中的錯(如企圖在主鍵中插入重復的值)以及死鎖等均是只有在語句執(zhí)行階段期間才能遇到和報告的錯誤或情況。查詢語句的處理 查詢與其它類型的SQL語句不同,因為在成功執(zhí)行后作為結果將返回數(shù)據(jù)。其它語句只是簡單地返回成功或失敗,而查詢則能返回一行或許多行數(shù)據(jù)。查詢的結果均采用表格形式,結果行被一次一行或者批量地被檢索出來。從這里我們可以得知批量的fetch數(shù)據(jù)可以降低網(wǎng)絡開銷,所以批量的fetch也是優(yōu)化的技巧之一。 有些問題只與查詢處理相關,查詢不僅僅指
27、SELECT語句,同樣也包括在其它SQL語句中的隱含查詢。例如,下面的每個語句都需要把查詢作為它執(zhí)行的一部分:INSERT INTO table SELECT. UPDATE table SET x = y WHERE. DELETE FROM table WHERE. CREATE table AS SELECT. 具體來說,查詢· 要求讀一致性· 可能使用回滾段作中間處理· 可能要求SQL語句處理描述
28、、定義和取數(shù)據(jù)階段第3步: 描述查詢結果(Describe Results of a Query) 描述階段只有在查詢結果的各個列是未知時才需要;例如,當查詢由用戶交互地輸入需要輸出的列名。在這種情況要用描述階段來決定查詢結果的特征(數(shù)據(jù)類型,長度和名字)。第4步: 定義查詢的輸出數(shù)據(jù)(Define Output of a Query) 在查詢的定義階段,你指定與查詢出的列值對應的接收變量的位置、大小和數(shù)據(jù)類型,這樣我們通過接收變量就可以得到查詢結果。如果必要的話,Oracle會自動實現(xiàn)數(shù)據(jù)類型的轉(zhuǎn)換。這是將
29、接收變量的類型與對應的列類型相比較決定的。第5步: 綁定變量(Bind Any Variables) 此時,Oracle知道了SQL語句的意思,但仍沒有足夠的信息用于執(zhí)行該語句。Oracle 需要得到在語句中列出的所有變量的值。在該例中,Oracle需要得到對department_id列進行限定的值。得到這個值的過程就叫綁定變量(binding variables)此過程稱之為將變量值捆綁進來。程序必須指出可以找到該數(shù)值的變量名(該變量被稱為捆綁變量,變量名實質(zhì)上是一個內(nèi)存地址,相當于指針)。應用的最終用戶可能并沒有發(fā)覺他們正在指定捆綁變量,因
30、為Oracle 的程序可能只是簡單地指示他們輸入新的值,其實這一切都在程序中自動做了。因為你指定了變量名,在你再次執(zhí)行之前無須重新捆綁變量。你可以改變綁定變量的值,而Oracle在每次執(zhí)行時,僅僅使用內(nèi)存地址來查找此值。如果Oracle 需要實現(xiàn)自動數(shù)據(jù)類型轉(zhuǎn)換的話(除非它們是隱含的或缺省的),你還必須對每個值指定數(shù)據(jù)類型和長度。關于這些信息可以參考oracle的相關文檔,如Oracle Call Interface Programmer's Guide第6步: 并行執(zhí)行語句(Parallelize the Statement ) ORA
31、CLE 可以在SELECTs, INSERTs, UPDATEs, MERGEs, DELETEs語句中執(zhí)行相應并行查詢操作,對于某些DDL操作,如創(chuàng)建索引、用子查詢創(chuàng)建表、在分區(qū)表上的操作,也可以執(zhí)行并行操作。并行化可以導致多個服務器進程(oracle server processes)為同一個SQL語句工作,使該SQL語句可以快速完成,但是會耗費更多的資源,所以除非很有必要,否則不要使用并行查詢。第7步: 執(zhí)行語句(Run the Statement) 到了現(xiàn)在這個時候,Oracle擁有所有需要的信息與資源,因此可以真正運行SQL語句了。如
32、果該語句為SELECT查詢或INSERT語句,則不需要鎖定任何行,因為沒有數(shù)據(jù)需要被改變。然而,如果語句為UPDATE或DELETE語句,則該語句影響的所有行都被鎖定,防止該用戶提交或回滾之前,別的用戶對這些數(shù)據(jù)進行修改。這保證了數(shù)據(jù)的一致性。對于某些語句,你可以指定執(zhí)行的次數(shù),這稱為批處理(array processing)。指定執(zhí)行N次,則綁定變量與定義變量被定義為大小為N的數(shù)組的開始位置,這種方法可以減少網(wǎng)絡開銷,也是優(yōu)化的技巧之一。第8步: 取出查詢的行(Fetch Rows of a Query) 在fetch階段,行數(shù)據(jù)被取出來,每
33、個后續(xù)的存取操作檢索結果集中的下一行數(shù)據(jù),直到最后一行被取出來。上面提到過,批量的fetch是優(yōu)化的技巧之一。第9步: 關閉游標(Close the Cursor) SQL語句處理的最后一個階段就是關閉游標DDL語句的處理(DDL Statement Processing) DDL語句的執(zhí)行不同與DML語句和查詢語句的執(zhí)行,這是因為DDL語句執(zhí)行成功后需要對數(shù)據(jù)字典數(shù)據(jù)進行修改。對于DDL語句,語句的分析階段實際上包括分析、查找數(shù)據(jù)字典信息和執(zhí)行。事務管理語句、會話管理語句、系統(tǒng)管理語句只有分析與
34、執(zhí)行階段,為了重新執(zhí)行該語句,會重新分析與執(zhí)行該語句。事務控制(Control of Transactions) 一般來說,只有使用ORACLE編程接口的應用設計人員才關心操作的類型,并把相關的操作組織在一起,形成一個事務。一般來說,我門必須定義事務,這樣在一個邏輯單元中的所有工作可以同時被提交或回滾,保證了數(shù)據(jù)的一致性。一個事務應該由邏輯單元中的所有必須部分組成,不應該多一個,也不應該少一個。· 在事務開始和結束的這段時間內(nèi),所有被引用表中的數(shù)據(jù)都應該在一致的狀態(tài)(或可以被回溯到
35、一致的狀態(tài))· 事務應該只包含可以對數(shù)據(jù)進行一致更改(one consistent change to the data)的SQL語句例如,在兩個帳號之間的轉(zhuǎn)帳(這是一個事務或邏輯工作單元),應該包含從一個帳號中借錢(由一個SQL完成),然后將借的錢存入另一個帳號(由另一個SQL完成)。這2個操作作為一個邏輯單元,應該同時成功或同時失敗。其它不相關的操作,如向一個帳戶中存錢,不應該包含在這個轉(zhuǎn)帳事務中。在設計應用時,除了需要決定哪種類型的操作組成一個事務外,還需要決定使用BEGIN_DISCRETE_TRANSACTIO存儲過程是
36、否對提高小的、非分布式的事務的性能有作用。第4章 ORACLE的優(yōu)化器 優(yōu)化器有時也被稱為查詢優(yōu)化器,這是因為查詢是影響數(shù)據(jù)庫性能最主要的部分,不要以為只有SELECT語句是查詢。實際上,帶有任何WHERE條件的DML(INSERT、UPDATE、DELETE)語句中都包含查詢要求,在后面的文章中,當說到查詢時,不一定只是指SELECT語句,也有可能指DML語句中的查詢部分。優(yōu)化器是所有關系數(shù)據(jù)庫引擎中的最神秘、最富挑戰(zhàn)性的部件之一,從性能的角度看也是最重要的部分,它性能的高低直接關系到數(shù)據(jù)庫性能的好壞。
37、0; 我們知道,SQL語句同其它語言(如C語言)的語句不一樣,它是非過程化(non-procedural)的語句,即當你要取數(shù)據(jù)時,不需要告訴數(shù)據(jù)庫通過何種途徑去取數(shù)據(jù),如到底是通過索引取數(shù)據(jù),還是應該將表中的每行數(shù)據(jù)都取出來,然后再通過一一比較的方式取數(shù)據(jù)(即全表掃描),這是由數(shù)據(jù)庫的優(yōu)化器決定的,這就是非過程化的含義,也就是說,如何取數(shù)據(jù)是由優(yōu)化器決定,而不是應用開發(fā)者通過編程決定。在處理SQL的SELECT、UPDATE、INSERT或DELETE語句時,Oracle 必須訪問語句所涉及的數(shù)據(jù),Oracle的優(yōu)化器部分用來決定訪問數(shù)據(jù)的有效路徑,使得語句執(zhí)行所需的I/O和處
38、理時間最小。 為了實現(xiàn)一個查詢,內(nèi)核必須為每個查詢定制一個查詢策略,或為取出符合條件的數(shù)據(jù)生成一個執(zhí)行計劃(execution plan)。典型的,對于同一個查詢,可能有幾個執(zhí)行計劃都符合要求,都能得到符合條件的數(shù)據(jù)。例如,參與連接的表可以有多種不同的連接方法,這取決于連接條件和優(yōu)化器采用的連接方法。為了在多個執(zhí)行計劃中選擇最優(yōu)的執(zhí)行計劃,優(yōu)化器必須使用一些實際的指標來衡量每個執(zhí)行計劃使用的資源(I/0次數(shù)、CPU等),這些資源也就是我們所說的代價(cost)。如果一個執(zhí)行計劃使用的資源多,我們就說使用執(zhí)行計劃的代價大。以執(zhí)行計劃的代價大小
39、作為衡量標準,優(yōu)化器選擇代價最小的執(zhí)行計劃作為真正執(zhí)行該查詢的執(zhí)行計劃,并拋棄其它的執(zhí)行計劃。 在ORACLE的發(fā)展過程中,一共開發(fā)過2種類型的優(yōu)化器:基于規(guī)則的優(yōu)化器和基于代價的優(yōu)化器。這2種優(yōu)化器的不同之處關鍵在于:取得代價的方法與衡量代價的大小不同?,F(xiàn)對每種優(yōu)化器做一下簡單的介紹:基于規(guī)則的優(yōu)化器 - Rule Based (Heuristic) Optimization(簡稱RBO): 在ORACLE7之前,主要是使用基于規(guī)則的優(yōu)化器。ORACLE在基于規(guī)則的優(yōu)化器中采用啟發(fā)式的方法(Heuristic Approach)
40、或規(guī)則(Rules)來生成執(zhí)行計劃。例如,如果一個查詢的where條件(where clause)包含一個謂詞(predicate,其實就是一個判斷條件,如”=”, “>”, ”<”等),而且該謂詞上引用的列上有有效索引,那么優(yōu)化器將使用索引訪問這個表,而不考慮其它因素,如表中數(shù)據(jù)的多少、表中數(shù)據(jù)的易變性、索引的可選擇性等。此時數(shù)據(jù)庫中沒有關于表與索引數(shù)據(jù)的統(tǒng)計性描述,如表中有多上行,每行的可選擇性等。優(yōu)化器也不考慮實例參數(shù),如multi block i/o、可用排序內(nèi)存的大小等,所以優(yōu)化器有時就選擇了次優(yōu)化的計劃作為真正的執(zhí)行計劃,導致系統(tǒng)性能不高。 如,對于selec
41、t * from emp where deptno = 10這個查詢來說,如果是使用基于規(guī)則的優(yōu)化器,而且deptno列上有有效的索引,則會通過deptno列上的索引來訪問emp表。在絕大多數(shù)情況下,這是比較高效的,但是在一些特殊情況下,使用索引訪問也有比較低效的時候,現(xiàn)舉例說明: 1) emp表比較小,該表的數(shù)據(jù)只存放在幾個數(shù)據(jù)塊中。此時使用全表掃描比使用索引訪問emp表反而要好。因為表比較小,極有可能數(shù)據(jù)全在內(nèi)存中,所以此時做全表掃描是最快的。而如果使用索引掃描,需要先從索引中找到符合條件記錄的rowid,然后再一一根據(jù)這些rowid從
42、emp中將數(shù)據(jù)取出來,在這種條件下,效率就會比全表掃描的效率要差一些。 2) emp表比較大時,而且deptno = 10條件能查詢出表中大部分的數(shù)據(jù)如(50%)。如該表共有4000萬行數(shù)據(jù),共放在有500000個數(shù)據(jù)塊中,每個數(shù)據(jù)塊為8k,則該表共有約4G,則這么多的數(shù)據(jù)不可能全放在內(nèi)存中,絕大多數(shù)需要放在硬盤上。此時如果該查詢通過索引查詢,則是你夢魘的開始。db_file_multiblock_read_count參數(shù)的值200。如果采用全表掃描,則需要500000/db_file_multiblock_read_count=50000
43、0/200=2500次I/O。但是如果采用索引掃描,假設deptno列上的索引都已經(jīng)cache到內(nèi)存中,所以可以將訪問索引的開銷忽略不計。因為要讀出4000萬x 50% = 2000萬數(shù)據(jù),假設在讀這2000萬數(shù)據(jù)時,有99.9%的命中率,則還是需要20000次I/O,比上面的全表掃描需要的2500次多多了,所以在這種情況下,用索引掃描反而性能會差很多。在這樣的情況下,用全表掃描的時間是固定的,但是用索引掃描的時間會隨著選出數(shù)據(jù)的增多使查詢時間相應的延長。 上面是枯燥的假設數(shù)據(jù),現(xiàn)在以具體的實例給予驗證:
44、0; 環(huán)境: oracle 817 + linux + 陣列柜,表SWD_BILLDETAIL有3200多萬數(shù)據(jù); 表的id列、cn列上都有索引 經(jīng)查看執(zhí)行計劃,發(fā)現(xiàn)執(zhí)行select count(id) from SWD_BILLDETAIL;使用全表掃描,執(zhí)行完用了大約1.50分鐘(4次執(zhí)行取平均,每次分別為1.45 1.51 2.00 1.46)。而執(zhí)行select count(id) from SWD_BILLD
45、ETAIL where cn <'6'卻用了2個小時還沒有執(zhí)行完,經(jīng)分析該語句使用了cn列上的索引,然后利用查詢出的rowid再從表中查詢數(shù)據(jù)。我為什么不使用select count(cn) from SWD_BILLDETAIL where cn <'6'呢?后面在分析執(zhí)行路徑的索引掃描時時會給出說明。 下面就是基于規(guī)則的優(yōu)化器使用的執(zhí)行路徑與各個路徑對應的等級: RBO Path 1: Single Row by Rowid(等級最高)
46、160; RBO Path 2: Single Row by Cluster Join RBO Path 3: Single Row by Hash Cluster Key with Unique or Primary Key RBO Path 4: Single Row by Unique or Primary Key RBO Path 5: Clustered Join
47、60; RBO Path 6: Hash Cluster Key RBO Path 7: Indexed Cluster Key RBO Path 8: Composite Index RBO Path 9: Single-Column Indexes RBO Path 10: Bounded Range Search on Indexed Column
48、s RBO Path 11: Unbounded Range Search on Indexed Columns RBO Path 12: Sort Merge Join RBO Path 13: MAX or MIN of Indexed Column RBO Path 14: ORDER BY on Indexed Column
49、0; RBO Path 15: Full Table Scan(等級最低) 上面的執(zhí)行路徑中,RBO認為越往下執(zhí)行的代價越大,即等級越低。在RBO生成執(zhí)行計劃時,如果它發(fā)現(xiàn)有等級高的執(zhí)行路徑可用,則肯定會使用等級高的路徑,而不管任何其它影響性能的元素,即RBO通過上面的路徑的等級決定執(zhí)行路徑的代價,執(zhí)行路徑的等級越高,則使用該執(zhí)行路徑的代價越小。如上面2個例子所述,如果使用RBO,則肯定使用索引訪問表,也就是選擇了比較差的執(zhí)行計劃,這樣會給數(shù)據(jù)庫性能帶來很大的負面影響。為了解決這個問題,從ORACLE 7開始oracle引入了基于代價的優(yōu)化
50、器,下面給出了介紹?;诖鷥r的優(yōu)化器 - Cost Based Optimization(簡稱CBO) Oracle把一個代價引擎(Cost Engine)集成到數(shù)據(jù)庫內(nèi)核中,用來估計每個執(zhí)行計劃需要的代價,該代價將每個執(zhí)行計劃所耗費的資源進行量化,從而CBO可以根據(jù)這個代價選擇出最優(yōu)的執(zhí)行計劃。一個查詢耗費的資源可以被分成3個基本組成部分:I/O代價、CPU代價、network代價。I/O代價是將數(shù)據(jù)從磁盤讀入內(nèi)存所需的代價。訪問數(shù)據(jù)包括將數(shù)據(jù)文件中數(shù)據(jù)塊的內(nèi)容讀入到SGA的數(shù)據(jù)高速緩存中,在一般情況下,該代價是處理一個查詢所需要的最主要
51、代價,所以我們在優(yōu)化時,一個基本原則就是降低查詢所產(chǎn)生的I/O總次數(shù)。CPU代價是處理在內(nèi)存中數(shù)據(jù)所需要的代價,如一旦數(shù)據(jù)被讀入內(nèi)存,則我們在識別出我們需要的數(shù)據(jù)后,在這些數(shù)據(jù)上執(zhí)行排序(sort)或連接(join)操作,這需要耗費CPU資源。 對于需要訪問跨節(jié)點(即通常說的服務器)數(shù)據(jù)庫上數(shù)據(jù)的查詢來說,存在network代價,用來量化傳輸操作耗費的資源。查詢遠程表的查詢或執(zhí)行分布式連接的查詢會在network代價方面花費比較大。 在使用CBO時,需要有表和索引的統(tǒng)計數(shù)據(jù)(分析數(shù)據(jù))作
52、為基礎數(shù)據(jù),有了這些數(shù)據(jù),CBO才能為各個執(zhí)行計劃計算出相對準確的代價,從而使CBO選擇最佳的執(zhí)行計劃。所以定期的對表、索引進行分析是絕對必要的,這樣才能使統(tǒng)計數(shù)據(jù)反映數(shù)據(jù)庫中的真實情況。否則就會使CBO選擇較差的執(zhí)行計劃,影響數(shù)據(jù)庫的性能。分析操作不必做的太頻繁,一般來說,每星期一次就足夠了。切記如果想使用CBO,則必須定期對表和索引進行分析。 對于分析用的命令,隨著數(shù)據(jù)庫版本的升級,用的命令也發(fā)生了變換,在oracle 8i以前,主要是用ANALYZE命令。在ORACLE 8I以后,又引入了DBMS_STATS存儲包來進行分析。幸運的是
53、從ORACLE 10G以后,分析工作變成自動的了,這減輕的DBA的負擔,不過在一些特殊情況下,還需要一些手工分析。 如果采用了CBO優(yōu)化器,而沒有對表和索引進行分析,沒有統(tǒng)計數(shù)據(jù),則ORACLE使用缺省的統(tǒng)計數(shù)據(jù)(至少在ORACLE 9I中是這樣),這可以從oracle的文檔上找到。使用的缺省值肯定與系統(tǒng)的實際統(tǒng)計值不一致,這可能會導致優(yōu)化器選擇錯誤的執(zhí)行計劃,影響數(shù)據(jù)庫的性能。 要注意的是:雖然CBO的功能隨著ORACLE新版本的推出,功能越來越強,但它不是能包治百病的神藥,否則就不再
54、需要DBA了,那我就慘了!實際上任何一個語句,隨著硬件環(huán)境與應用數(shù)據(jù)的不同,該語句的執(zhí)行計劃可能需要隨之發(fā)生變化,這樣才能取得最好的性能。所以有時候不在具體的環(huán)境下而進行SQL性能調(diào)整是徒勞的。 在ORACLE8I推出的時候,ORACLE極力建議大家使用CBO,說CBO有種種好處,但是在那是ORACLE開發(fā)的應用系統(tǒng)還是使用基于規(guī)則的優(yōu)化器,從這件事上我們可以得出這樣的結論:1) 如果團隊的數(shù)據(jù)庫水平很高而且都熟悉應用數(shù)據(jù)的特點,RBO也可以取得很好的性能。2)CBO不是很穩(wěn)定,但是一個比較有前途的優(yōu)化器,Oracle極力建議大家用是為了讓
55、大家盡快發(fā)現(xiàn)它的BUG,以便進一步改善,但是ORACLE為了對自己開發(fā)的應用系統(tǒng)負責,他們還是使用了比較熟悉而且成熟的RBO。從這個事情上給我們的啟發(fā)就是:我們在以后的開發(fā)中,應該盡量采用我們熟悉并且成熟的技術,而不要一味的采用新技術,一味采用新技術并不一定能開發(fā)出好的產(chǎn)品。幸運的是從ORACLE 10G后,CBO已經(jīng)足夠的強大與智能,大家可以放心的使用該技術,因為ORACLE 10G后,Oracle自己開發(fā)的應用系統(tǒng)也使用CBO優(yōu)化器了。而且ORACLE規(guī)定,從ORACLE 10G開始,開始廢棄RBO優(yōu)化器。這句話并不是指在ORACLE 10G中不能使用RBO,而是從ORACLE 10G開始
56、開始,不再為RBO的BUG提供修補服務。 在上面的第2個例子中,如果采用CBO優(yōu)化器,它就會考慮emp表的行數(shù),deptno列的統(tǒng)計數(shù)據(jù),發(fā)現(xiàn)對該列做查詢會查詢出過多的數(shù)據(jù),并且考慮db_file_multiblock_read_count參數(shù)的設置,發(fā)現(xiàn)用全表掃描的代價比用索引掃描的代價要小,從而使用全表掃描從而取得良好的執(zhí)行性能。 判斷當前數(shù)據(jù)庫使用何種優(yōu)化器: 主要是由optimizer_mode初始化參數(shù)決定的。該參數(shù)可能的取
57、值為:first_rows_1 | 10 | 100 | 1000 | first_rows | all_rows | choose | rule。具體解釋如下: RULE為使用RBO優(yōu)化器。 CHOOSE則是根據(jù)實際情況,如果數(shù)據(jù)字典中包含被引用的表的統(tǒng)計數(shù)據(jù),即引用的對象已經(jīng)被分析,則就使用CBO優(yōu)化器,否則為RBO優(yōu)化器。 ALL_ROWS為CBO優(yōu)化器使用的第一種具體的優(yōu)化方法,是以數(shù)據(jù)的吞吐量為主要目標,以便可以使用最少的資
58、源完成語句。 FIRST_ROWS為優(yōu)化器使用的第二種具體的優(yōu)化方法,是以數(shù)據(jù)的響應時間為主要目標,以便快速查詢出開始的幾行數(shù)據(jù)。 FIRST_ROWS_1 | 10 | 100 | 1000 為優(yōu)化器使用的第三種具體的優(yōu)化方法,讓優(yōu)化器選擇一個能夠把響應時間減到最小的查詢執(zhí)行計劃,以迅速產(chǎn)生查詢結果的前 n 行。該參數(shù)為ORACLE 9I新引入的。 從ORACLE V7以來,optimizer_mode參數(shù)的缺省設置應是"
59、choose",即如果對已分析的表查詢的話選擇CBO,否則選擇RBO。在此種設置中,如果采用了CBO,則缺省為CBO中的all_rows模式。 注意:即使指定數(shù)據(jù)庫使用RBO優(yōu)化器,但有時ORACLE數(shù)據(jù)庫還是會采用CBO優(yōu)化器,這并不是ORACLE的BUG,主要是由于從ORACLE 8I后引入的許多新特性都必須在CBO下才能使用,而你的SQL語句可能正好使用了這些新特性,此時數(shù)據(jù)庫會自動轉(zhuǎn)為使用CBO優(yōu)化器執(zhí)行這些語句。什么是優(yōu)化 優(yōu)化是選擇最有效的執(zhí)行計劃來執(zhí)行SQL語句的過
60、程,這是在處理任何數(shù)據(jù)的語句(SELECT,INSERT,UPDATE或DELETE)中的一個重要步驟。對Oracle來說,執(zhí)行這樣的語句有許多不同的方法,譬如說,將隨著以什么順序訪問哪些表或索引的不同而不同。所使用的執(zhí)行計劃可以決定語句能執(zhí)行得有多快。Oracle中稱之為優(yōu)化器(Optimizer)的組件用來選擇這種它認為最有效的執(zhí)行計劃。 由于一系列因素都會會影響語句的執(zhí)行,優(yōu)化器綜合權衡各個因素,在眾多的執(zhí)行計劃中選擇認為是最佳的執(zhí)行計劃。然而,應用設計人員通常比優(yōu)化器更知道關于特定應用的數(shù)據(jù)特點。無論優(yōu)化器多么智能,在某些情況下開發(fā)人
61、員能選擇出比優(yōu)化器選擇的最優(yōu)執(zhí)行計劃還要好的執(zhí)行計劃。這是需要人工干預數(shù)據(jù)庫優(yōu)化的主要原因。事實表明,在某些情況下,確實需要DBA對某些語句進行手工優(yōu)化。注:從Oracle的一個版本到另一個版本,優(yōu)化器可能對同一語句生成不同的執(zhí)行計劃。在將來的Oracle 版本中,優(yōu)化器可能會基于它可以用的更好、更理想的信息,作出更優(yōu)的決策,從而導致為語句產(chǎn)生更優(yōu)的執(zhí)行計劃。第5章 ORACLE的執(zhí)行計劃背景知識: 為了更好的進行下面的內(nèi)容我們必須了解一些概念性的術語:共享sql語句 為了不重復解析相同的SQL語句(因為解析操作比
62、較費資源,會導致性能下降),在第一次解析之后,ORACLE將SQL語句及解析后得到的執(zhí)行計劃存放在內(nèi)存中。這塊位于系統(tǒng)全局區(qū)域SGA(system global area)的共享池(shared buffer pool)中的內(nèi)存可以被所有的數(shù)據(jù)庫用戶共享。因此,當你執(zhí)行一個SQL語句(有時被稱為一個游標)時,如果該語句和之前的執(zhí)行過的某一語句完全相同,并且之前執(zhí)行的該語句與其執(zhí)行計劃仍然在內(nèi)存中存在,則ORACLE就不需要再進行分析,直接得到該語句的執(zhí)行路徑。ORACLE的這個功能大大地提高了SQL的執(zhí)行性能并大大節(jié)省了內(nèi)存的使用。使用這個功能的關鍵是將執(zhí)行過的語句盡可能放到內(nèi)存中,所以這要求
63、有大的共享池(通過設置shared buffer pool參數(shù)值)和盡可能的使用綁定變量的方法執(zhí)行SQL語句。 當你向ORACLE 提交一個SQL語句,ORACLE會首先在共享內(nèi)存中查找是否有相同的語句。這里需要注明的是,ORACLE對兩者采取的是一種嚴格匹配,要達成共享,SQL語句必須完全相同(包括空格,換行等)。 下面是判斷SQL語句是否與共享內(nèi)存中某一SQL相同的步驟:1). 對所發(fā)出語句的文本串進行hashed。如果hash值與已在共享池中SQL語句的hash值相同,則進行第2步:
64、 2) 將所發(fā)出語句的文本串(包括大小寫、空白和注釋)與在第步中識別的所有 已存在的SQL語句相比較。 例如: SELECT * FROM emp WHERE empno = 1000; 和下列每一個都不同 SELECT * from emp WHERE empno =
65、 1000; SELECT * FROM EMP WHERE empno = 1000; SELECT * FROM emp WHERE empno = 2000; 在上面的語句中列值都是直接SQL語句中的,今后我們將這類sql成為硬編碼SQL或字面值SQL 使用綁定變量的SQL語句中必須使用相同的名字的綁定變量(bind v
66、ariables) ,例如: a. 該2個sql語句被認為相同 select pin , name from people where pin = :blk1.pin; select pin , name from people where pin = :blk1.pin; b. 該2個sql語句被認為不相同 select
67、 pin , name from people where pin = :blk1.ot_ind; select pin , name from people where pin = :blk1.ov_ind; 今后我們將上面的這類語句稱為綁定變量SQL。 3). 將所發(fā)出語句中涉及的對象與第步中識別的已存在語句所涉及對象相比較。 例如:
68、 如用戶user1與用戶user2下都有EMP表,則 用戶user1發(fā)出的語句:SELECT * FROM EMP; 與 用戶user2發(fā)出的語句:SELECT * FROM EMP; 被認為是不相同的語句, 因為兩個語句中引用的EMP不是指同一個表。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 一級親屬遺傳咨詢策略-洞察分析
- 2024年柞水縣人民醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 農(nóng)產(chǎn)品質(zhì)押合同(2篇)
- 計算機組裝與維護項目教程項目教程課件
- 2024年昌黎縣中醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 2024年華東師大版七年級科學下冊階段測試試卷含答案
- 2024年北師大版七年級物理上冊階段測試試卷含答案
- 2024年滬教版九年級歷史上冊階段測試試卷
- 2024年魯科版七年級物理下冊月考試卷
- 2024年湘師大新版八年級科學上冊階段測試試卷
- 消防水域救援個人防護裝備試驗 大綱
- 機電樣板施工主要技術方案
- 涉稅風險管理方案
- 青島市2022-2023學年七年級上學期期末道德與法治試題
- 高空作業(yè)安全免責協(xié)議書范本
- 石油化學智慧樹知到期末考試答案章節(jié)答案2024年中國石油大學(華東)
- 手術后如何防止排尿困難
- 特種設備“日管控、周排查、月調(diào)度”表格
- 重點關愛學生幫扶活動記錄表
- 2021年10月自考00850廣告設計基礎試題及答案含解析
- 結構化面試表格
評論
0/150
提交評論