大數(shù)據(jù)量高并發(fā)的數(shù)據(jù)庫優(yōu)化總結(jié)

上傳人：卷*** IP屬地：江蘇上傳時(shí)間：2023-10-16 格式：DOCX 頁數(shù)：23 大?。?7.51KB 積分：20 舉報(bào) 版權(quán)申訴

大數(shù)據(jù)量高并發(fā)的數(shù)據(jù)庫優(yōu)化總結(jié)_第2頁

大數(shù)據(jù)量高并發(fā)的數(shù)據(jù)庫優(yōu)化總結(jié)_第3頁

大數(shù)據(jù)量高并發(fā)的數(shù)據(jù)庫優(yōu)化總結(jié)_第4頁

大數(shù)據(jù)量高并發(fā)的數(shù)據(jù)庫優(yōu)化總結(jié)_第5頁

已閱讀5頁，還剩18頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

大數(shù)據(jù)量高并發(fā)的數(shù)據(jù)庫優(yōu)化一、數(shù)據(jù)庫構(gòu)造的設(shè)計(jì)如果不能設(shè)計(jì)一種合理的數(shù)據(jù)庫模型，不僅會(huì)增加客戶端和服務(wù)器段程序的編程和維護(hù)的難度，并且將會(huì)影響系統(tǒng)實(shí)際運(yùn)行的性能。因此，在一種系統(tǒng)開始實(shí)施之前，完備的數(shù)據(jù)庫模型的設(shè)計(jì)是必須的。在一種系統(tǒng)分析、設(shè)計(jì)階段，由于數(shù)據(jù)量較小，負(fù)荷較低。我們往往只注意到功效的實(shí)現(xiàn)，而很難注意到性能的單薄之處，等到系統(tǒng)投入實(shí)際運(yùn)行一段時(shí)間后，才發(fā)現(xiàn)系統(tǒng)的性能在減少，這時(shí)再來考慮提高系統(tǒng)性能則要耗費(fèi)更多的人力物力，而整個(gè)系統(tǒng)也不可避免的形成了一種打補(bǔ)丁工程。因此在考慮整個(gè)系統(tǒng)的流程的時(shí)候，我們必須要考慮，在高并發(fā)大數(shù)據(jù)量的訪問狀況下，我們的系統(tǒng)會(huì)不會(huì)出現(xiàn)極端的狀況。（例如：對(duì)外統(tǒng)計(jì)系統(tǒng)在7月16日出現(xiàn)的數(shù)據(jù)異常的狀況，并發(fā)大數(shù)據(jù)量的的訪問造成，數(shù)據(jù)庫的響應(yīng)時(shí)間不能跟上數(shù)據(jù)刷新的速度造成。具體狀況是：在日期臨界時(shí)（00：00：00），判斷數(shù)據(jù)庫中與否有現(xiàn)在日期的統(tǒng)計(jì)，沒有則插入一條現(xiàn)在日期的統(tǒng)計(jì)。在低并發(fā)訪問的狀況下，不會(huì)發(fā)生問題，但是當(dāng)天期臨界時(shí)的訪問量相稱大的時(shí)候，在做這一判斷的時(shí)候，會(huì)出現(xiàn)多次條件成立，則數(shù)據(jù)庫里會(huì)被插入多條現(xiàn)在日期的統(tǒng)計(jì)，從而造成數(shù)據(jù)錯(cuò)誤。），數(shù)據(jù)庫的模型擬定下來之后，我們有必要做一種系統(tǒng)內(nèi)數(shù)據(jù)流向圖，分析可能出現(xiàn)的瓶頸。為了確保數(shù)據(jù)庫的一致性和完整性，在邏輯設(shè)計(jì)的時(shí)候往往會(huì)設(shè)計(jì)過多的表間關(guān)聯(lián)，盡量的減少數(shù)據(jù)的冗余。（例如顧客表的地區(qū)，我們能夠把地區(qū)另外寄存到一種地區(qū)表中）如果數(shù)據(jù)冗余低，數(shù)據(jù)的完整性容易得到確保，提高了數(shù)據(jù)吞吐速度，確保了數(shù)據(jù)的完整性，清晰地體現(xiàn)數(shù)據(jù)元素之間的關(guān)系。而對(duì)于多表之間的關(guān)聯(lián)查詢（特別是大數(shù)據(jù)表）時(shí)，其性能將會(huì)減少，同時(shí)也提高了客戶端程序的編程難度，因此，物理設(shè)計(jì)需折衷考慮，根據(jù)業(yè)務(wù)規(guī)則，擬定對(duì)關(guān)聯(lián)表的數(shù)據(jù)量大小、數(shù)據(jù)項(xiàng)的訪問頻度，對(duì)這類數(shù)據(jù)表頻繁的關(guān)聯(lián)查詢應(yīng)適宜提高數(shù)據(jù)冗余設(shè)計(jì)但增加了表間連接查詢的操作，也使得程序的變得復(fù)雜，為了提高系統(tǒng)的響應(yīng)時(shí)間，合理的數(shù)據(jù)冗余也是必要的。設(shè)計(jì)人員在設(shè)計(jì)階段應(yīng)根據(jù)系統(tǒng)操作的類型、頻度加以均衡考慮。另外，最佳不要用自增屬性字段作為主鍵與子表關(guān)聯(lián)。不便于系統(tǒng)的遷移和數(shù)據(jù)恢復(fù)。對(duì)外統(tǒng)計(jì)系統(tǒng)映射關(guān)系丟失（******************）。原來的表格必須能夠通過由它分離出去的表格重新構(gòu)建。使用這個(gè)規(guī)定的好處是，你能夠確保不會(huì)在分離的表格中引入多出的列，全部你創(chuàng)立的表格構(gòu)造都與它們的實(shí)際需要同樣大。應(yīng)用這條規(guī)定是一種好習(xí)慣，但是除非你要解決一種非常大型的數(shù)據(jù)，否則你將不需要用到它。（例如一種通行證系統(tǒng)，我能夠?qū)SERID，USERNAME，USERPASSWORD，單獨(dú)出來作個(gè)表，再把USERID作為其它表的外鍵）表的設(shè)計(jì)具體注意的問題：1、數(shù)據(jù)行的長度不要超出8020字節(jié)，如果超出這個(gè)長度的話在物理頁中這條數(shù)據(jù)會(huì)占用兩行從而造成存儲(chǔ)碎片，減少查詢效率。2、能夠用數(shù)字類型的字段盡量選擇數(shù)字類型而不用字符串類型的（電話號(hào)碼），這會(huì)減少查詢和連接的性能，并會(huì)增加存儲(chǔ)開銷。這是由于引擎在解決查詢和連接回逐個(gè)比較字符串中每一種字符，而對(duì)于數(shù)字型而言只需要比較一次就夠了。3、對(duì)于不可變字符類型char和可變字符類型varchar都是8000字節(jié)char查詢快，但是耗存儲(chǔ)空間，varchar查詢相對(duì)慢某些但是節(jié)省存儲(chǔ)空間。在設(shè)計(jì)字段的時(shí)候能夠靈活選擇，例如顧客名、密碼等長度變化不大的字段能夠選擇CHAR，對(duì)于評(píng)論等長度變化大的字段能夠選擇VARCHAR。4、字段的長度在最大程度的滿足可能的需要的前提下，應(yīng)當(dāng)盡量的設(shè)得短某些，這樣能夠提高查詢的效率，并且在建立索引的時(shí)候也能夠減少資源的消耗。二、查詢的優(yōu)化確保在實(shí)現(xiàn)功效的基礎(chǔ)上，盡量減少對(duì)數(shù)據(jù)庫的訪問次數(shù)；通過搜索參數(shù)，盡量減少對(duì)表的訪問行數(shù)最小化成果集，從而減輕網(wǎng)絡(luò)負(fù)擔(dān)；能夠分開的操作盡量分開解決，提高每次的響應(yīng)速度；在數(shù)據(jù)窗口使用SQL時(shí)，盡量把使用的索引放在選擇的首列；算法的構(gòu)造盡量簡樸；在查詢時(shí)，不要過多地使用通配符如SELECT*FROMT1語句，要用到幾列就選擇幾列如：SELECTCOL1COL2FROMT1；在可能的狀況下盡量限制盡量成果集行數(shù)如：SELECTTOP300COL1COL2COL3FROMT1由于某些狀況下顧客是不需要那么多的數(shù)據(jù)的。在沒有建索引的狀況下，數(shù)據(jù)庫查找某一條數(shù)據(jù)，就必須進(jìn)行全表掃描了，對(duì)全部數(shù)據(jù)進(jìn)行一次遍歷，查找出符合條件的統(tǒng)計(jì)。在數(shù)據(jù)量比較小的狀況下，可能看不出明顯的差別，但是當(dāng)數(shù)據(jù)量大的狀況下，這種狀況就是極為糟糕的了。SQL語句在SQLSERVER中是如何執(zhí)行的，他們緊張自己所寫的SQL語句會(huì)被SQLSERVER誤解。例如：select*fromtable1wherename='zhangsan'andtID>10000和執(zhí)行:select*fromtable1wheretID>10000andname='zhangsan'某些人不懂得以上兩條語句的執(zhí)行效率與否同樣，由于如果簡樸的從語句先后上看，這兩個(gè)語句確實(shí)是不同，如果tID是一種聚合索引，那么后一句僅僅從表的10000條后來的統(tǒng)計(jì)中查找就行了；而前一句則要先從全表中查找看有幾個(gè)name='zhangsan'的，而后再根據(jù)限制條件條件tID>10000來提出查詢成果。事實(shí)上，這樣的緊張是不必要的。SQLSERVER中有一種“查詢分析優(yōu)化器”，它能夠計(jì)算出where子句中的搜索條件并擬定哪個(gè)索引能縮小表掃描的搜索空間，也就是說，它能實(shí)現(xiàn)自動(dòng)優(yōu)化。即使查詢優(yōu)化器能夠根據(jù)where子句自動(dòng)的進(jìn)行查詢優(yōu)化，但有時(shí)查詢優(yōu)化器就會(huì)不按照您的本意進(jìn)行快速查詢。在查詢分析階段，查詢優(yōu)化器查看查詢的每個(gè)階段并決定限制需要掃描的數(shù)據(jù)量與否有用。如果一種階段能夠被用作一種掃描參數(shù)（SARG），那么就稱之為可優(yōu)化的，并且能夠運(yùn)用索引快速獲得所需數(shù)據(jù)。SARG的定義：用于限制搜索的一種操作，由于它普通是指一種特定的匹配，一種值的范疇內(nèi)的匹配或者兩個(gè)以上條件的AND連接。形式以下：列名操作符<常數(shù)或變量>或<常數(shù)或變量>操作符列名列名能夠出現(xiàn)在操作符的一邊，而常數(shù)或變量出現(xiàn)在操作符的另一邊。如：Name=’張三’價(jià)格>50005000<價(jià)格Name=’張三’and價(jià)格>5000如果一種體現(xiàn)式不能滿足SARG的形式，那它就無法限制搜索的范疇了，也就是SQLSERVER必須對(duì)每一行都判斷它與否滿足WHERE子句中的全部條件。因此一種索引對(duì)于不滿足SARG形式的體現(xiàn)式來說是無用的。因此，優(yōu)化查詢最重要的就是，盡量使語句符合查詢優(yōu)化器的規(guī)則避免全表掃描而使用索引查詢。具體要注意的：1.應(yīng)盡量避免在where子句中對(duì)字段進(jìn)行null值判斷，否則將造成引擎放棄使用索引而進(jìn)行全表掃描，如：selectidfromtwherenumisnull能夠在num上設(shè)立默認(rèn)值0，確保表中num列沒有null值，然后這樣查詢：selectidfromtwherenum=02.應(yīng)盡量避免在where子句中使用!=或<>操作符，否則將引擎放棄使用索引而進(jìn)行全表掃描。優(yōu)化器將無法通過索引來擬定將要命中的行數(shù)因此需要搜索該表的全部行。3.應(yīng)盡量避免在where子句中使用or來連接條件，否則將造成引擎放棄使用索引而進(jìn)行全表掃描，如：selectidfromtwherenum=10ornum=20能夠這樣查詢：selectidfromtwherenum=10unionallselectidfromtwherenum=204.in和notin也要慎用，由于IN會(huì)使系統(tǒng)無法使用索引而只能直接搜索表中的數(shù)據(jù)。如：selectidfromtwherenumin(123)對(duì)于持續(xù)的數(shù)值，能用between就不要用in了：selectidfromtwherenumbetween1and35.盡量避免在索引過的字符數(shù)據(jù)中，使用非打頭字母搜索。這也使得引擎無法運(yùn)用索引。見以下例子：SELECT*FROMT1WHERENAMELIKE‘%L%’SELECT*FROMT1WHERESUBSTING(NAME21)=’L’SELECT*FROMT1WHERENAMELIKE‘L%’即使NAME字段建有索引，前兩個(gè)查詢?nèi)匀粺o法運(yùn)用索引完畢加緊操作，引擎不得不對(duì)全表全部數(shù)據(jù)逐條操作來完畢任務(wù)。而第三個(gè)查詢能夠使用索引來加緊操作。6.必要時(shí)強(qiáng)制查詢優(yōu)化器使用某個(gè)索引，如在where子句中使用參數(shù)，也會(huì)造成全表掃描。由于SQL只有在運(yùn)行時(shí)才會(huì)解析局部變量，但優(yōu)化程序不能將訪問計(jì)劃的選擇推遲到運(yùn)行時(shí)；它必須在編譯時(shí)進(jìn)行選擇。然而，如果在編譯時(shí)建立訪問計(jì)劃，變量的值還是未知的，因而無法作為索引選擇的輸入項(xiàng)。以下面語句將進(jìn)行全表掃描：selectidfromtwherenum=@num能夠改為強(qiáng)制查詢使用索引：selectidfromtwith(index(索引名))wherenum=@num7.應(yīng)盡量避免在where子句中對(duì)字段進(jìn)行體現(xiàn)式操作，這將造成引擎放棄使用索引而進(jìn)行全表掃描。如：SELECT*FROMT1WHEREF1/2=100應(yīng)改為:SELECT*FROMT1WHEREF1=100*2SELECT*FROMRECORDWHERESUBSTRING(CARD_NO14)=’5378’應(yīng)改為:SELECT*FROMRECORDWHERECARD_NOLIKE‘5378%’SELECTmember_numberfirst_namelast_nameFROMmembersWHEREDATEDIFF(yydatofbirthGETDATE())>21應(yīng)改為:SELECTmember_numberfirst_namelast_nameFROMmembersWHEREdateofbirth<DATEADD(yy-21GETDATE())即：任何對(duì)列的操作都將造成表掃描，它涉及數(shù)據(jù)庫函數(shù)、計(jì)算體現(xiàn)式等等，查詢時(shí)要盡量將操作移至等號(hào)右邊。8.應(yīng)盡量避免在where子句中對(duì)字段進(jìn)行函數(shù)操作，這將造成引擎放棄使用索引而進(jìn)行全表掃描。如：selectidfromtwheresubstring(name13)='abc'--name以abc開頭的idselectidfromtwheredatediff(daycreatedate'-11-30')=0--‘-11-30’生成的id應(yīng)改為:selectidfromtwherenamelike'abc%'selectidfromtwherecreatedate>='-11-30'andcreatedate<'-12-1'9.不要在where子句中的“=”左邊進(jìn)行函數(shù)、算術(shù)運(yùn)算或其它體現(xiàn)式運(yùn)算，否則系統(tǒng)將可能無法對(duì)的使用索引。10.在使用索引字段作為條件時(shí)，如果該索引是復(fù)合索引，那么必須使用到該索引中的第一種字段作為條件時(shí)才干確保系統(tǒng)使用該索引，否則該索引將不會(huì)被使用，并且應(yīng)盡量的讓字段次序與索引次序相一致。11.諸多時(shí)候用exists是一種好的選擇：selectnumfromawherenumin(selectnumfromb)用下面的語句替代：selectnumfromawhereexists(select1frombwherenum=a.num)SELECTSUM(T1.C1)FROMT1WHERE((SELECTCOUNT(*)FROMT2WHERET2.C2=T1.C2>0)SELECTSUM(T1.C1)FROMT1WHEREEXISTS(SELECT*FROMT2WHERET2.C2=T1.C2)兩者產(chǎn)生相似的成果，但是后者的效率顯然要高于前者。由于后者不會(huì)產(chǎn)生大量鎖定的表掃描或是索引掃描。如果你想校驗(yàn)表里與否存在某條紀(jì)錄，不要用count(*)那樣效率很低，并且浪費(fèi)服務(wù)器資源。能夠用EXISTS替代。如：IF(SELECTCOUNT(*)FROMtable_nameWHEREcolumn_name='xxx')能夠?qū)懗桑篒FEXISTS(SELECT*FROMtable_nameWHEREcolumn_name='xxx')經(jīng)常需要寫一種T_SQL語句比較一種父成果集和子成果集，從而找到與否存在在父成果集中有而在子成果集中沒有的統(tǒng)計(jì)，如：SELECTa.hdr_keyFROMhdr_tbla----tbla表達(dá)tbl用別名a替代WHERENOTEXISTS(SELECT*FROMdtl_tblbWHEREa.hdr_key=b.hdr_key)SELECTa.hdr_keyFROMhdr_tblaLEFTJOINdtl_tblbONa.hdr_key=b.hdr_keyWHEREb.hdr_keyISNULLSELECThdr_keyFROMhdr_tblWHEREhdr_keyNOTIN(SELECThdr_keyFROMdtl_tbl)三種寫法都能夠得到同樣對(duì)的的成果，但是效率依次減少。12.盡量使用表變量來替代臨時(shí)表。如果表變量包含大量數(shù)據(jù)，請(qǐng)注意索引非常有限（只有主鍵索引）。13.避免頻繁創(chuàng)立和刪除臨時(shí)表，以減少系統(tǒng)表資源的消耗。14.臨時(shí)表并不是不可使用，適宜地使用它們能夠使某些例程更有效，例如，當(dāng)需要重復(fù)引用大型表或慣用表中的某個(gè)數(shù)據(jù)集時(shí)。但是，對(duì)于一次性事件，最佳使用導(dǎo)出表。15.在新建臨時(shí)表時(shí)，如果一次性插入數(shù)據(jù)量很大，那么能夠使用selectinto替代createtable，避免造成大量log，以提高速度；如果數(shù)據(jù)量不大，為了緩和系統(tǒng)表的資源，應(yīng)先createtable，然后insert。16.如果使用到了臨時(shí)表，在存儲(chǔ)過程的最后務(wù)必將全部的臨時(shí)表顯式刪除，先truncatetable，然后droptable，這樣能夠避免系統(tǒng)表的較長時(shí)間鎖定。17.在全部的存儲(chǔ)過程和觸發(fā)器的開始處設(shè)立SETNOCOUNTON，在結(jié)束時(shí)設(shè)立SETNOCOUNTOFF。無需在執(zhí)行存儲(chǔ)過程和觸發(fā)器的每個(gè)語句后向客戶端發(fā)送DONE_IN_PROC消息。18.盡量避免大事務(wù)操作，提高系統(tǒng)并發(fā)能力。19.盡量避免向客戶端返回大數(shù)據(jù)量，若數(shù)據(jù)量過大，應(yīng)當(dāng)考慮對(duì)應(yīng)需求與否合理。20.避免使用不兼容的數(shù)據(jù)類型。例如float和int、char和varchar、binary和varbinary是不兼容的。數(shù)據(jù)類型的不兼容可能使優(yōu)化器無法執(zhí)行某些原來能夠進(jìn)行的優(yōu)化操作。例如:SELECTnameFROMemployeeWHEREsalary>60000在這條語句中如salary字段是money型的則優(yōu)化器很難對(duì)其進(jìn)行優(yōu)化由于60000是個(gè)整型數(shù)。我們應(yīng)當(dāng)在編程時(shí)將整型轉(zhuǎn)化成為錢幣型而不要等到運(yùn)行時(shí)轉(zhuǎn)化。21.充足運(yùn)用連接條件，在某種狀況下，兩個(gè)表之間可能不只一種的連接條件，這時(shí)在WHERE子句中將連接條件完整的寫上，有可能大大提高查詢速度。例：SELECTSUM(A.AMOUNT)FROMACCOUNTACARDBWHEREA.CARD_NO=B.CARD_NOSELECTSUM(A.AMOUNT)FROMACCOUNTACARDBWHEREA.CARD_NO=B.CARD_NOANDA.ACCOUNT_NO=B.ACCOUNT_NO第二句將比第一句執(zhí)行快得多。22、使用視圖加速查詢把表的一種子集進(jìn)行排序并創(chuàng)立視圖，有時(shí)能加速查詢。它有助于避免多重排序操作，并且在其它方面還能簡化優(yōu)化器的工作。例如：SELECT，rcvbles.balance，……othercolumnsFROMcust，rcvblesWHEREcust.customer_id=rcvlbes.customer_idANDrcvblls.balance>0ANDcust.postcode>“98000”O(jiān)RDERBY如果這個(gè)查詢要被執(zhí)行多次而不止一次，能夠把全部未付款的客戶找出來放在一種視圖中，并按客戶的名字進(jìn)行排序：CREATEVIEWDBO.V_CUST_RCVLBESASSELECT，rcvbles.balance，……othercolumnsFROMcust，rcvblesWHEREcust.customer_id=rcvlbes.customer_idANDrcvblls.balance>0ORDERBY然后下列面的方式在視圖中查詢：SELECT＊FROMV_CUST_RCVLBESWHEREpostcode>“98000”視圖中的行要比主表中的行少，并且物理次序就是所規(guī)定的次序，減少了磁盤I/O，因此查詢工作量能夠得到大幅減少。23、能用DISTINCT的就不用GROUPBYSELECTOrderIDFROMDetailsWHEREUnitPrice>10GROUPBYOrderID可改為：SELECTDISTINCTOrderIDFROMDetailsWHEREUnitPrice>1024.能用UNIONALL就不要用UNIONUNIONALL不執(zhí)行SELECTDISTINCT函數(shù)，這樣就會(huì)減少諸多不必要的資源35.盡量不要用SELECTINTO語句。SELECTINOT語句會(huì)造成表鎖定，制止其它顧客訪問該表。上面我們提到的是某些基本的提高查詢速度的注意事項(xiàng)但是在更多的狀況下往往需要重復(fù)實(shí)驗(yàn)比較不同的語句以得到最佳方案。最佳的辦法固然是測(cè)試，看實(shí)現(xiàn)相似功效的SQL語句哪個(gè)執(zhí)行時(shí)間最少，但是數(shù)據(jù)庫中如果數(shù)據(jù)量極少，是比較不出來的，這時(shí)能夠用查看執(zhí)行計(jì)劃，即：把實(shí)現(xiàn)相似功效的多條SQL語句考到查詢分析器，按CTRL+L看查所運(yùn)用的索引，表掃描次數(shù)（這兩個(gè)對(duì)性能影響最大），總體上看詢成本比例即可。三、算法的優(yōu)化盡量避免使用游標(biāo)，由于游標(biāo)的效率較差，如果游標(biāo)操作的數(shù)據(jù)超出1萬行，那么就應(yīng)當(dāng)考慮改寫。.使用基于游標(biāo)的辦法或臨時(shí)表辦法之前，應(yīng)先尋找基于集的解決方案來解決問題，基于集的辦法普通更有效。與臨時(shí)表同樣，游標(biāo)并不是不可使用。對(duì)小型數(shù)據(jù)集使用FAST_FORWARD游標(biāo)普通要優(yōu)于其它逐行解決辦法，特別是在必須引用幾個(gè)表才干獲得所需的數(shù)據(jù)時(shí)。在成果集中涉及“累計(jì)”的例程普通要比使用游標(biāo)執(zhí)行的速度快。如果開發(fā)時(shí)間允許，基于游標(biāo)的辦法和基于集的辦法都能夠嘗試一下，看哪一種辦法的效果更加好。游標(biāo)提供了對(duì)特定集合中逐行掃描的手段，普通使用游標(biāo)逐行遍歷數(shù)據(jù)，根據(jù)取出的數(shù)據(jù)不同條件進(jìn)行不同的操作。特別對(duì)多表和大表定義的游標(biāo)（大的數(shù)據(jù)集合）循環(huán)很容易使程序進(jìn)入一種漫長的等特甚至死機(jī)。在有些場(chǎng)合，有時(shí)也非得使用游標(biāo)，此時(shí)也可考慮將符合條件的數(shù)據(jù)行轉(zhuǎn)入臨時(shí)表中，再對(duì)臨時(shí)表定義游標(biāo)進(jìn)行操作，可時(shí)性能得到明顯提高。（例如：對(duì)內(nèi)統(tǒng)計(jì)第一版）封裝存儲(chǔ)過程四、建立高效的索引創(chuàng)立索引普通有下列兩個(gè)目的：維護(hù)被索引列的唯一性和提供快速訪問表中數(shù)據(jù)的方略。大型數(shù)據(jù)庫有兩種索引即簇索引和非簇索引，一種沒有簇索引的表是按堆構(gòu)造存儲(chǔ)數(shù)據(jù)，全部的數(shù)據(jù)均添加在表的尾部，而建立了簇索引的表，其數(shù)據(jù)在物理上會(huì)按照簇索引鍵的次序存儲(chǔ)，一種表只允許有一種簇索引，因此，根據(jù)B樹構(gòu)造，能夠理解添加任何一種索引均能提高按索引列查詢的速度，但會(huì)減少插入、更新、刪除操作的性能，特別是當(dāng)填充因子（FillFactor）較大時(shí)。因此對(duì)索引較多的表進(jìn)行頻繁的插入、更新、刪除操作，建表和索引時(shí)因設(shè)立較小的填充因子，方便在各數(shù)據(jù)頁中留下較多的自由空間，減少頁分割及重新組織的工作。索引是從數(shù)據(jù)庫中獲取數(shù)據(jù)的最高效方式之一。95%的數(shù)據(jù)庫性能問題都能夠采用索引技術(shù)得到解決。作為一條規(guī)則，我普通對(duì)邏輯主鍵使用唯一的成組索引，對(duì)系統(tǒng)鍵（作為存儲(chǔ)過程）采用唯一的非成組索引，對(duì)任何外鍵列[字段]采用非成組索引。但是，索引就象是鹽，太多了菜就咸了。你得考慮數(shù)據(jù)庫的空間有多大，表如何進(jìn)行訪問，尚有這些訪問與否重要用作讀寫。事實(shí)上，您能夠把索引理解為一種特殊的目錄。微軟的SQLSERVER提供了兩種索引：聚集索引（clusteredindex，也稱聚類索引、簇集索引）和非聚集索引（nonclusteredindex，也稱非聚類索引、非簇集索引）。下面，我們舉例來闡明一下聚集索引和非聚集索引的區(qū)別：其實(shí)，我們的漢語字典的正文本身就是一種聚集索引。例如，我們要查“安”字，就會(huì)很自然地翻開字典的前幾頁，由于“安”的拼音是“an”，而按照拼音排序中文的字典是以英文字母“a”開頭并以“z”結(jié)尾的，那么“安”字就自然地排在字典的前部。如果您翻完了全部以“a”開頭的部分仍然找不到這個(gè)字，那么就闡明您的字典中沒有這個(gè)字；同樣的，如果查“張”字，那您也會(huì)將您的字典翻到最后部分，由于“張”的拼音是“zhang”。也就是說，字典的正文部分本身就是一種目錄，您不需要再去查其它目錄來找到您需要找的內(nèi)容。我們把這種正文內(nèi)容本身就是一種按照一定規(guī)則排列的目錄稱為“聚集索引”。如果您認(rèn)識(shí)某個(gè)字，您能夠快速地從自動(dòng)中查到這個(gè)字。但您也可能會(huì)碰到您不認(rèn)識(shí)的字，不懂得它的發(fā)音，這時(shí)候，您就不能按照剛剛的辦法找到您要查的字，而需要去根據(jù)“偏旁部首”查到您要找的字，然后根據(jù)這個(gè)字后的頁碼直接翻到某頁來找到您要找的字。但您結(jié)合“部首目錄”和“檢字表”而查到的字的排序并不是真正的正文的排序辦法，例如您查“張”字，我們能夠看到在查部首之后的檢字表中“張”的頁碼是672頁，檢字表中“張”的上面是“馳”字，但頁碼卻是63頁，“張”的下面是“弩”字，頁面是390頁。很顯然，這些字并不是真正的分別位于“張”字的上下方，現(xiàn)在您看到的持續(xù)的“馳、張、弩”三字事實(shí)上就是他們?cè)诜蔷奂饕械呐判?，是字典正文中的字在非聚集索引中的映射。我們能夠通過這種方式來找到您所需要的字，但它需要兩個(gè)過程，先找到目錄中的成果，然后再翻到您所需要的頁碼。我們把這種目錄純正是目錄，正文純正是正文的排序方式稱為“非聚集索引”。進(jìn)一步引申一下，我們能夠很容易的理解：每個(gè)表只能有一種聚集索引，由于目錄只能按照一種辦法進(jìn)行排序。（一）何時(shí)使用聚集索引或非聚集索引下面的表總結(jié)了何時(shí)使用聚集索引或非聚集索引（很重要）。動(dòng)作描述使用聚集索引使用非聚集索引列經(jīng)常被分組排序應(yīng)應(yīng)返回某范疇內(nèi)的數(shù)據(jù)應(yīng)不應(yīng)一種或極少不同值不應(yīng)不應(yīng)小數(shù)目的不同值應(yīng)不應(yīng)大數(shù)目的不同值不應(yīng)應(yīng)頻繁更新的列不應(yīng)應(yīng)外鍵列應(yīng)應(yīng)主鍵列應(yīng)應(yīng)頻繁修改索引列不應(yīng)應(yīng)事實(shí)上，我們能夠通過前面聚集索引和非聚集索引的定義的例子來理解上表。如：返回某范疇內(nèi)的數(shù)據(jù)一項(xiàng)。例如您的某個(gè)表有一種時(shí)間列，正好您把聚合索引建立在了該列，這時(shí)您查詢1月1日至10月1日之間的全部數(shù)據(jù)時(shí)，這個(gè)速度就將是很快的，由于您的這本字典正文是按日期進(jìn)行排序的，聚類索引只需要找到要檢索的全部數(shù)據(jù)中的開頭和結(jié)尾數(shù)據(jù)即可；而不像非聚集索引，必須先查到目錄中查到每一項(xiàng)數(shù)據(jù)對(duì)應(yīng)的頁碼，然后再根據(jù)頁碼查到具體內(nèi)容。（二）結(jié)合實(shí)際，談索引使用的誤區(qū)理論的目的是應(yīng)用。即使我們剛剛列出了何時(shí)應(yīng)使用聚集索引或非聚集索引，但在實(shí)踐中以上規(guī)則卻很容易被無視或不能根據(jù)實(shí)際狀況進(jìn)行綜合分析。下面我們將根據(jù)在實(shí)踐中碰到的實(shí)際問題來談一下索引使用的誤區(qū)，方便于大家掌握索引建立的辦法。1、主鍵就是聚集索引這種想法筆者認(rèn)為是極端錯(cuò)誤的，是對(duì)聚集索引的一種浪費(fèi)。即使SQLSERVER默認(rèn)是在主鍵上建立聚集索引的。普通，我們會(huì)在每個(gè)表中都建立一種ID列，以分辨每條數(shù)據(jù)，并且這個(gè)ID列是自動(dòng)增大的，步長普通為1。我們的這個(gè)辦公自動(dòng)化的實(shí)例中的列Gid就是如此。此時(shí)，如果我們將這個(gè)列設(shè)為主鍵，SQLSERVER會(huì)將此列默認(rèn)為聚集索引。這樣做有好處，就是能夠讓您的數(shù)據(jù)在數(shù)據(jù)庫中按照ID進(jìn)行物理排序，但筆者認(rèn)為這樣做意義不大。顯而易見，聚集索引的優(yōu)勢(shì)是很明顯的，而每個(gè)表中只能有一種聚集索引的規(guī)則，這使得聚集索引變得更加貴重。從我們前面談到的聚集索引的定義我們能夠看出，使用聚集索引的最大好處就是能夠根據(jù)查詢規(guī)定，快速縮小查詢范疇，避免全表掃描。在實(shí)際應(yīng)用中，由于ID號(hào)是自動(dòng)生成的，我們并不懂得每條統(tǒng)計(jì)的ID號(hào)，因此我們很難在實(shí)踐中用ID號(hào)來進(jìn)行查詢。這就使讓ID號(hào)這個(gè)主鍵作為聚集索引成為一種資源浪費(fèi)。另首先，讓每個(gè)ID號(hào)都不同的字段作為聚集索引也不符合“大數(shù)目的不同值狀況下不應(yīng)建立聚合索引”規(guī)則；固然，這種狀況只是針對(duì)顧客經(jīng)常修改統(tǒng)計(jì)內(nèi)容，特別是索引項(xiàng)的時(shí)候會(huì)負(fù)作用，但對(duì)于查詢速度并沒有影響。在辦公自動(dòng)化系統(tǒng)中，無論是系統(tǒng)首頁顯示的需要顧客簽收的文獻(xiàn)、會(huì)議還是顧客進(jìn)行文獻(xiàn)查詢等任何狀況下進(jìn)行數(shù)據(jù)查詢都離不開字段的是“日期”尚有顧客本身的“顧客名”。普通，辦公自動(dòng)化的首頁會(huì)顯示每個(gè)顧客尚未簽收的文獻(xiàn)或會(huì)議。即使我們的where語句能夠僅僅限制現(xiàn)在顧客尚未簽收的狀況，但如果您的系統(tǒng)已建立了很長時(shí)間，并且數(shù)據(jù)量很大，那么，每次每個(gè)顧客打開首頁的時(shí)候都進(jìn)行一次全表掃描，這樣做意義是不大的，絕大多數(shù)的顧客1個(gè)月前的文獻(xiàn)都已經(jīng)瀏覽過了，這樣做只能徒增數(shù)據(jù)庫的開銷而已。事實(shí)上，我們完全能夠讓顧客打開系統(tǒng)首頁時(shí)，數(shù)據(jù)庫僅僅查詢這個(gè)顧客近3個(gè)月來未閱覽的文獻(xiàn)，通過“日期”這個(gè)字段來限制表掃描，提高查詢速度。如果您的辦公自動(dòng)化系統(tǒng)已經(jīng)建立的2年，那么您的首頁顯示速度理論上將是原來速度8倍，甚至更快。2、只要建立索引就能明顯提高查詢速度事實(shí)上，我們能夠發(fā)現(xiàn)上面的例子中，第2、3條語句完全相似，且建立索引的字段也相似；不同的僅是前者在fariqi字段上建立的是非聚合索引，后者在此字段上建立的是聚合

人人文庫> 全部分類> 專業(yè)文獻(xiàn) > 工程機(jī)械

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

大數(shù)據(jù)量高并發(fā)的數(shù)據(jù)庫優(yōu)化總結(jié)

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔