常見存儲(chǔ)知識(shí)總結(jié)_第1頁
常見存儲(chǔ)知識(shí)總結(jié)_第2頁
常見存儲(chǔ)知識(shí)總結(jié)_第3頁
常見存儲(chǔ)知識(shí)總結(jié)_第4頁
常見存儲(chǔ)知識(shí)總結(jié)_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、了解存儲(chǔ)設(shè)備的工作原理2、了解七種RAID技術(shù)的原理和特點(diǎn)3、了解磁盤陣列的構(gòu)成原理4、了解以太網(wǎng)和TCP/IP協(xié)議的內(nèi)容和工作原理5、了解FibreChannel的內(nèi)容和工作原理6、了解IPSAN存儲(chǔ)網(wǎng)絡(luò)的原理與特點(diǎn)7、了解FC、IP等協(xié)議的融合方式8、了解DAS、SAN、NAS存儲(chǔ)協(xié)議的工作原理9、了解主流多路徑軟件的使用方式2.3常見存儲(chǔ)知識(shí)1、存儲(chǔ)設(shè)備的工作原理磁帶機(jī)工作原理磁帶機(jī)的工作原理,就像普通音樂磁帶一樣,只是存儲(chǔ)數(shù)字信息的格式上不同,并且有更加嚴(yán)格的數(shù)據(jù)校驗(yàn)功能。所以只有專用的磁帶機(jī)才能讀出磁帶里的數(shù)據(jù)。電腦上看不到磁帶機(jī)的盤符,是因?yàn)樾枰惭b驅(qū)動(dòng)程序。如果要使用磁帶機(jī)備份數(shù)據(jù)的話,在系統(tǒng)備份里有選擇項(xiàng)供選擇。主流的磁帶機(jī)有4mm,8mm,QIC,mini-cartridge和DLT。4mm(DDS:DigitalDataStorage)4mm磁帶機(jī)取代了QIC而成為工作站備份數(shù)據(jù)在設(shè)備面停止了QIC設(shè)備的生產(chǎn)。4mm的驅(qū)動(dòng)器更加小和安靜,但對(duì)于數(shù)據(jù)保存的可信度仍不及8mm驅(qū)動(dòng)器。它要比8mm的便宜和小得多(3x2x0.5inches,76x51x12mm)。和8mm的一樣,讀寫關(guān)的壽命都不長,因?yàn)樗鼈兺瑯邮褂寐菪降姆绞絹碜x寫。數(shù)據(jù)傳輸?shù)乃俣燃s在50kB/s到500kB/s之間,可存儲(chǔ)空間從1.3GB到2.0GB之間,硬件壓縮可使空間加倍。磁帶庫單元可以有6臺(tái)磁帶機(jī),120個(gè)磁帶匣,以自動(dòng)切換的方式使用同一個(gè)磁帶柜,磁帶庫的容量可達(dá)240GB。DDS-3標(biāo)準(zhǔn)現(xiàn)在支持的磁帶機(jī)容量最高可達(dá)到12GB(或壓縮的24GB)。4mm和8mm同樣都使用螺旋式讀寫的方式,所有螺旋式讀寫的優(yōu)點(diǎn)及缺點(diǎn),都可以在4mm和8mm磁帶機(jī)上看到。磁帶在經(jīng)過2,000次的使用或100次的全部備份后,就該退休了。8mm(Exabyte)8mm磁帶機(jī)是最常見的SCSI磁帶機(jī),也是磁帶交換的最佳選擇。幾乎每個(gè)工作站都有一臺(tái)2GB8mm磁帶機(jī)。8mm磁帶機(jī)可信度高、方便、安靜。卡匣小(4.8x3.3x0.6inches;122x84x15mm)而且不貴。8mm磁帶機(jī)的下邊是一個(gè)短短的讀寫頭,而讀寫頭的壽命取決于磁帶經(jīng)過讀寫頭時(shí),相對(duì)高速運(yùn)動(dòng)情況。數(shù)據(jù)傳輸速度約在250kB/s到500kB/s之間,可存儲(chǔ)的空間從300MB到7GB,硬件壓縮可使空間加倍。磁帶庫單元可以有6臺(tái)磁帶機(jī),120個(gè)磁帶匣,以自動(dòng)切換的方式使用同一個(gè)磁帶柜,磁帶庫的容量可達(dá)840+GB。Exabyte“Mammoth”模型支持12GB的容量在一個(gè)磁帶上(壓縮后可達(dá)24GB)相當(dāng)于普通磁帶的二倍。數(shù)據(jù)是使用螺旋式讀寫的方式記錄在磁帶上的,讀寫頭和磁帶約相差6度,磁帶以270度纏繞著軸,并抵住讀寫頭,軸適時(shí)地旋轉(zhuǎn),使得磁帶具有高密度,從一端到另一端并可使磁道緊密地分布。QICQIC-150磁帶和磁帶機(jī)可能是最常見的磁帶機(jī)和介質(zhì)了。QIC磁帶機(jī)是最便宜的“正規(guī)”備份設(shè)備。它的缺點(diǎn)在于介質(zhì)的價(jià)格較高。QIC磁帶要比8mm或4mm磁帶貴,每GB的數(shù)據(jù)存儲(chǔ)價(jià)格可能最高高出5倍。但是,如果您的需求能夠?yàn)榘氪虼艓鶟M足的話,那么QIC可能是明智之選。QIC是最常見的磁帶機(jī)。每個(gè)站點(diǎn)都會(huì)有某種密度的QIC。這有時(shí)是一種麻煩,QIC有為數(shù)眾多的密度,但在外觀上相似(有時(shí)一樣)的磁帶。QIC磁帶機(jī)噪音很大。它們?cè)趯ぶ芬约白x寫時(shí)都會(huì)發(fā)出聲音。QIC磁帶的規(guī)格有(6x4x0.7英寸;152x102x17毫米)。數(shù)據(jù)傳輸?shù)乃俣冉橛?50kB/s到500kB/s之間,可存儲(chǔ)的空間從40MB到15GB。較新的QIC磁帶機(jī)具有硬件壓縮的功能。QIC的使用率愈來愈低,漸漸被DAT所取代。數(shù)據(jù)以磁道的方式記錄在磁帶上,磁道數(shù)及磁道的寬度會(huì)根據(jù)容量而有所不同。通常新的磁帶機(jī)具有的向后兼容的讀取功能(通常也具備寫入的功能)。對(duì)于數(shù)據(jù)的安全性,QIC具有不錯(cuò)的評(píng)價(jià)。磁帶機(jī)在經(jīng)過5,000次的使用后,就該退休了。DLT磁帶機(jī)中DLT具有最快的數(shù)據(jù)傳輸率。1/2"(12.5mm)的磁帶包含在單軸的磁帶匣(4x4x1inches;100x100x25mm)中。磁帶匣的一邊是一個(gè)旋轉(zhuǎn)匣道,通過匣道的開合,可以讓磁帶卷動(dòng)。磁帶匣內(nèi)只有一個(gè)軸,而本章中所提到的其他磁帶匣都是有兩個(gè)軸的(9磁道磁帶機(jī)例外)。數(shù)據(jù)傳輸?shù)乃俣燃s1.5MB/s,是4mm,8mm,或QIC磁帶機(jī)的三倍。可存儲(chǔ)的空間從10GB到20GB,具有磁帶機(jī)數(shù)據(jù)庫。磁帶機(jī)數(shù)據(jù)庫單元可以有1to20臺(tái)磁帶機(jī),5到900個(gè)磁帶匣,磁帶機(jī)數(shù)據(jù)庫的容量可達(dá)50GB到9TB。如果要壓縮的話,DLT型IV格式的磁帶機(jī)最高可支持70GB的存儲(chǔ)容量。數(shù)據(jù)存儲(chǔ)在平行于磁帶運(yùn)行方向的磁道上(就像QIC磁帶),一次寫入兩個(gè)磁道。讀寫頭的壽命相當(dāng)長,每當(dāng)磁帶停止前進(jìn),磁帶與讀寫頭之間沒有相對(duì)運(yùn)動(dòng)。AITAIT是Sony開發(fā)的一種新格式,每個(gè)磁帶最高可以存儲(chǔ)50GB。磁帶機(jī)使用內(nèi)存芯片來保存磁帶上的索引內(nèi)容。這個(gè)索引能夠被磁帶機(jī)驅(qū)動(dòng)器快速閱讀來搜索磁帶機(jī)上文件所處的位置,而不像其他的磁帶機(jī)需要花幾分鐘的時(shí)間才能找到文件。像SAMS:Alexandria這樣的軟件:能夠操作四十或者更多的AIT磁帶庫,直接使用內(nèi)存芯片來進(jìn)行通信把內(nèi)容顯示在屏幕上,以決定把什么文件備份到哪個(gè)磁帶上,加載和恢復(fù)數(shù)據(jù)。虛擬帶庫工作原理虛擬帶庫(VirtualTapeLibrary,VTL),是以磁盤作為自身存儲(chǔ)介質(zhì),并能仿真為物理磁帶庫的產(chǎn)品。簡單的說,虛擬帶庫就是將磁盤空間虛擬為磁帶空間,能夠在傳統(tǒng)的備份軟件上實(shí)現(xiàn)和傳統(tǒng)磁帶庫同樣功能的產(chǎn)品。傳統(tǒng)的磁帶庫的存儲(chǔ)介質(zhì)為磁帶,單盤磁帶的最大容量現(xiàn)在可以達(dá)到400GB(非壓縮),磁帶的優(yōu)勢是可以集中的保存,數(shù)據(jù)的移動(dòng)比較方便,但是磁帶介質(zhì)不是非常穩(wěn)定,容易受粉塵、濕度、磁粉、粘連、霉點(diǎn)等因素的影響,出現(xiàn)讀寫錯(cuò)誤,對(duì)保存環(huán)境的要求比較高。帶庫里面的機(jī)械手和驅(qū)動(dòng)器屬于精密機(jī)械設(shè)備,經(jīng)常容易發(fā)生故障,速度比較慢,恢復(fù)時(shí)間比較長。鑒于傳統(tǒng)磁帶的這些缺陷,虛擬磁帶庫的概念早在10余年前即已被IBM,StorageTek等著名存儲(chǔ)廠商所采用。然而,由于技術(shù)和市場的原因,市場認(rèn)知度一直很低。而在近些年,磁盤技術(shù)快速發(fā)展,出現(xiàn)了多種類型磁盤(SCSI、FC、ATA、SATA),使單位容量磁盤存儲(chǔ)的價(jià)格急劇下降,進(jìn)而使磁盤陣列作為備份設(shè)備的應(yīng)用也愈加廣泛,虛擬帶庫也越來越成為備份市場的焦點(diǎn)。虛擬帶庫將使用磁盤作為存儲(chǔ)介質(zhì),使用軟件在邏輯上將磁盤存儲(chǔ)系統(tǒng)(包括SCSI或者光纖陣列或者SAN存儲(chǔ)網(wǎng)絡(luò)等)虛擬為傳統(tǒng)的磁帶庫設(shè)備,自動(dòng)的在邏輯上實(shí)現(xiàn)機(jī)械手,驅(qū)動(dòng)器的功能,磁盤存儲(chǔ)系統(tǒng)的RAID,鏡像等功能可以從底層保護(hù)備份的數(shù)據(jù)。虛擬磁帶庫能夠和各大廠家的備份軟件無縫的兼容,實(shí)現(xiàn)許多高級(jí)的備份功能,最大程度上保護(hù)用戶的數(shù)據(jù)。虛擬帶庫的實(shí)現(xiàn)可以大致分為三種方式。第一,純軟件方式,即將磁帶庫模擬軟件直接安裝在備份服務(wù)器上,把備份服務(wù)器的文件系統(tǒng)分區(qū)模擬成磁帶庫,從而使備份軟件以磁帶庫方式使用磁盤文件系統(tǒng),目前有廠家在備份軟件里面集成了類似的產(chǎn)品。這種方式磁盤本質(zhì)上仍然在線,而且對(duì)備份主機(jī)的負(fù)擔(dān)比較大,使用的環(huán)境有局限性,優(yōu)點(diǎn)是成本比較低。第二種,專用服務(wù)器級(jí)虛擬磁帶庫方案,該方案實(shí)際上是另外一種虛擬磁帶庫的軟件實(shí)現(xiàn)方案,通過把虛擬磁帶庫管理軟件安裝在一臺(tái)獨(dú)立的專用服務(wù)器內(nèi),而將該服務(wù)器及所連接的磁盤存儲(chǔ)設(shè)備模擬成磁帶庫。這種方案的特點(diǎn)是速度比較快,而且數(shù)據(jù)受主機(jī)的影響小,不足是需要利用一臺(tái)的服務(wù)器作為虛擬磁帶庫管理器,系統(tǒng)優(yōu)化性略低。第三,專用控制器級(jí)集成虛擬磁帶庫設(shè)備方案,將磁帶庫模擬管理軟件固化在特別設(shè)計(jì)的硬件設(shè)備中,就形成了專用的虛擬磁帶庫設(shè)備,這種設(shè)備需要配置一定數(shù)量和類型的主機(jī)接口和后端存儲(chǔ)磁盤陣列接口。專用的虛擬磁帶庫設(shè)備硬件結(jié)構(gòu)與不同于服務(wù)器,設(shè)計(jì)采用了精簡的硬件模塊和精簡的操作系統(tǒng)內(nèi)核(一般為Linux內(nèi)核),并且充分考慮了與主機(jī)及存儲(chǔ)設(shè)備的連接能力。專用的虛擬磁帶庫設(shè)備的出現(xiàn)標(biāo)志著虛擬磁帶庫技術(shù)終于突破了操作系統(tǒng)和PC服務(wù)器架構(gòu)的限制,使虛擬磁帶庫真正成為了一種獨(dú)立的外設(shè),其使用方式也更接近普通磁帶庫,而其優(yōu)越性能也體現(xiàn)得更加充分。如果用戶需要的僅僅是將虛擬帶庫做為備份緩存,就是說先將數(shù)據(jù)備份到虛擬帶庫上,再當(dāng)備份服務(wù)器空閑的時(shí)候,將虛擬帶庫的備份數(shù)據(jù)轉(zhuǎn)移到物理的磁帶庫上,而且應(yīng)用的負(fù)載不大,PC或者服務(wù)器可以同時(shí)承擔(dān)備份服務(wù)器和虛擬帶庫兩種功能的情況下,用戶可以使用這種成本比較低廉的方案。如果用戶對(duì)第一種方案的備份性能不滿意,或者用戶的負(fù)載稍微大一點(diǎn),那么我們可以采用第二種的虛擬方式,將備份服務(wù)器和虛擬帶庫分開,使用一臺(tái)單獨(dú)的服務(wù)器作為虛擬帶庫,在這種方式下,數(shù)據(jù)直接以數(shù)據(jù)塊的方式存放,順序讀寫,性能比較良好。這種方式適合于數(shù)據(jù)量不大,有一定負(fù)載的備份情況下,這種方式和第一種方式的備份原理相似。最后一種專用控制器設(shè)備的虛擬方式,容量一般可以達(dá)到幾十TB以上,適合整個(gè)數(shù)據(jù)中心的備份。我們建議2TB容量以上數(shù)據(jù)備份都選用這種虛擬方式,雖然增加了一些成本,但是由于有高階的光纖磁盤陣列作為后端存儲(chǔ),效能和可靠性都很高,而且擴(kuò)展能力很強(qiáng),也能實(shí)現(xiàn)集中存儲(chǔ)。2、RAID技術(shù)的原理和特點(diǎn)RAID(RedundantArrayofInexpensiveDisks)稱為廉價(jià)磁盤冗余陣列。RAID的基本原理是把多個(gè)便宜的小磁盤組合到一起,成為一個(gè)磁盤組,使性能達(dá)到或超過一個(gè)容量巨大、價(jià)格昂貴的磁盤。目前RAID技術(shù)大致分為兩種:基于硬件的RAID技術(shù)和基于軟件的RAID技術(shù)。RAID級(jí)別介紹:一般常用的RAID階層,分別是RAID0、RAID1、RAID2、RAID3、RAID4以及RAID5,再加上二合一型RAID0+1﹝或稱RAID10﹞。我們先把這些RAID級(jí)別的優(yōu)、缺點(diǎn)做個(gè)比較:RAID級(jí)別相對(duì)優(yōu)點(diǎn)相對(duì)缺點(diǎn)RAID0存取速度最快沒有容錯(cuò)RAID1完全容錯(cuò)成本高RAID2帶海明碼校驗(yàn)數(shù)據(jù)冗余多,速度慢RAID3寫入性能最好沒有多任務(wù)功能RAID4具備多任務(wù)及容錯(cuò)功能Parity磁盤驅(qū)動(dòng)器造成性能瓶頸RAID5具備多任務(wù)及容錯(cuò)功能寫入時(shí)有overheadRAID0+1/RAID10速度快、完全容錯(cuò)成本高RAID0的特點(diǎn)、原理與應(yīng)用也稱為條帶模式(striped),即把連續(xù)的數(shù)據(jù)分散到多個(gè)磁盤上存取,如圖所示。當(dāng)系統(tǒng)有數(shù)據(jù)請(qǐng)求就可以被多個(gè)磁盤并行的執(zhí)行,每個(gè)磁盤執(zhí)行屬于它自己的那部分?jǐn)?shù)據(jù)請(qǐng)求。這種數(shù)據(jù)上的并行操作可以充分利用總線的帶寬,顯著提高磁盤整體存取性能。因?yàn)樽x取和寫入是在設(shè)備上并行完成的,讀取和寫入性能將會(huì)增加,這通常是運(yùn)行RAID0的主要原因。但RAID0沒有數(shù)據(jù)冗余,如果驅(qū)動(dòng)器出現(xiàn)故障,那么將無法恢復(fù)任何數(shù)據(jù)。RAID0無差錯(cuò)控制的帶區(qū)組要實(shí)現(xiàn)RAID0必須要有兩個(gè)以上硬盤驅(qū)動(dòng)器,RAID0實(shí)現(xiàn)了帶區(qū)組,數(shù)據(jù)并不是保存在一個(gè)硬盤上,而是分成數(shù)據(jù)塊保存在不同驅(qū)動(dòng)器上。因?yàn)閷?shù)據(jù)分布在不同驅(qū)動(dòng)器上,所以數(shù)據(jù)吞吐率大大提高,驅(qū)動(dòng)器的負(fù)載也比較平衡。如果剛好所需要的數(shù)據(jù)在不同的驅(qū)動(dòng)器上效率最好。它不需要計(jì)算校驗(yàn)碼,實(shí)現(xiàn)容易。它的缺點(diǎn)是它沒有數(shù)據(jù)差錯(cuò)控制,如果一個(gè)驅(qū)動(dòng)器中的數(shù)據(jù)發(fā)生錯(cuò)誤,即使其它盤上的數(shù)據(jù)正確也無濟(jì)于事了。不應(yīng)該將它用于對(duì)數(shù)據(jù)穩(wěn)定性要求高的場合。如果用戶進(jìn)行圖像(包括動(dòng)畫)編輯和其它要求傳輸比較大的場合使用RAID0比較合適。同時(shí),RAID可以提高數(shù)據(jù)傳輸速率,比如所需讀取的文件分布在兩個(gè)硬盤上,這兩個(gè)硬盤可以同時(shí)讀取。那么原來讀取同樣文件的時(shí)間被縮短為1/2。在所有的級(jí)別中,RAID0的速度是最快的。但是RAID0沒有冗余功能的,如果一個(gè)磁盤(物理)損壞,則所有的數(shù)據(jù)都無法使用。RAID1的特點(diǎn)、原理與應(yīng)用RAID1又稱為鏡像(Mirroring),一個(gè)具有全冗余的模式,如圖所示。RAID1可以用于兩個(gè)或2xN個(gè)磁盤,并使用0塊或更多的備用磁盤,每次寫數(shù)據(jù)時(shí)會(huì)同時(shí)寫入鏡像盤。這種陣列可靠性很高,但其有效容量減小到總?cè)萘康囊话?,同時(shí)這些磁盤的大小應(yīng)該相等,否則總?cè)萘恐痪哂凶钚〈疟P的大小。RAID1:鏡象結(jié)構(gòu)對(duì)于使用這種RAID1結(jié)構(gòu)的設(shè)備來說,RAID控制器必須能夠同時(shí)對(duì)兩個(gè)盤進(jìn)行讀操作和對(duì)兩個(gè)鏡象盤進(jìn)行寫操作。通過下面的結(jié)構(gòu)圖您也可以看到必須有兩個(gè)驅(qū)動(dòng)器。因?yàn)槭晴R象結(jié)構(gòu)在一組盤出現(xiàn)問題時(shí),可以使用鏡象,提高系統(tǒng)的容錯(cuò)能力。它比較容易設(shè)計(jì)和實(shí)現(xiàn)。每讀一次盤只能讀出一塊數(shù)據(jù),也就是說數(shù)據(jù)塊傳送速率與單獨(dú)的盤的讀取速率相同。因?yàn)镽AID1的校驗(yàn)十分完備,因此對(duì)系統(tǒng)的處理能力有很大的影響,通常的RAID功能由軟件實(shí)現(xiàn),而這樣的實(shí)現(xiàn)方法在服務(wù)器負(fù)載比較重的時(shí)候會(huì)大大影響服務(wù)器效率。當(dāng)您的系統(tǒng)需要極高的可靠性時(shí),如進(jìn)行數(shù)據(jù)統(tǒng)計(jì),那么使用RAID1比較合適。而且RAID1技術(shù)支持"熱替換",即不斷電的情況下對(duì)故障磁盤進(jìn)行更換,更換完畢只要從鏡像盤上恢復(fù)數(shù)據(jù)即可。當(dāng)主硬盤損壞時(shí),鏡像硬盤就可以代替主硬盤工作。鏡像硬盤相當(dāng)于一個(gè)備份盤,可想而知,這種硬盤模式的安全性是非常高的,RAID1的數(shù)據(jù)安全性在所有的RAID級(jí)別上來說是最好的。但是其磁盤的利用率卻只有50%,是所有RAID級(jí)別中最低的。RAID2的特點(diǎn)、原理與應(yīng)用RAID2:帶海明碼校驗(yàn)從概念上講,RAID2同RAID3類似,兩者都是將數(shù)據(jù)條塊化分布于不同的硬盤上,條塊單位為位或字節(jié)。然而RAID2使用一定的編碼技術(shù)來提供錯(cuò)誤檢查及恢復(fù)。這種編碼技術(shù)需要多個(gè)磁盤存放檢查及恢復(fù)信息,使得RAID2技術(shù)實(shí)施更復(fù)雜。因此,在商業(yè)環(huán)境中很少使用。下圖左邊的各個(gè)磁盤上是數(shù)據(jù)的各個(gè)位,由一個(gè)數(shù)據(jù)不同的位運(yùn)算得到的海明校驗(yàn)碼可以保存另一組磁盤上,具體情況請(qǐng)見下圖。由于海明碼的特點(diǎn),它可以在數(shù)據(jù)發(fā)生錯(cuò)誤的情況下將錯(cuò)誤校正,以保證輸出的正確。它的數(shù)據(jù)傳送速率相當(dāng)高,如果希望達(dá)到比較理想的速度,那最好提高保存校驗(yàn)碼ECC碼的硬盤,對(duì)于控制器的設(shè)計(jì)來說,它又比RAID3,4或5要簡單。沒有免費(fèi)的午餐,這里也一樣,要利用海明碼,必須要付出數(shù)據(jù)冗余的代價(jià)。輸出數(shù)據(jù)的速率與驅(qū)動(dòng)器組中速度最慢的相等。RAID3特點(diǎn)、原理與應(yīng)用RAID3是將數(shù)據(jù)先做XOR運(yùn)算,產(chǎn)生ParityData后,在將數(shù)據(jù)和ParityData以并行存取模式寫入成員磁盤驅(qū)動(dòng)器中,因此具備并行存取模式的優(yōu)點(diǎn)和缺點(diǎn)。進(jìn)一步來說,RAID3每一筆數(shù)據(jù)傳輸,都更新整個(gè)Stripe﹝即每一個(gè)成員磁盤驅(qū)動(dòng)器相對(duì)位置的數(shù)據(jù)都一起更新﹞,因此不會(huì)發(fā)生需要把部分磁盤驅(qū)動(dòng)器現(xiàn)有的數(shù)據(jù)讀出來,與新數(shù)據(jù)作XOR運(yùn)算,再寫入的情況發(fā)生﹝這個(gè)情況在RAID4和RAID5會(huì)發(fā)生,一般稱之為Read、Modify、WriteProcess,我們姑且譯為為讀、改、寫過程﹞。因此,在所有RAID級(jí)別中,RAID3的寫入性能是最好的。RAID3的ParityData一般都是存放在一個(gè)專屬的ParityDisk,但是由于每筆數(shù)據(jù)都更新整個(gè)Stripe,因此,RAID3的ParityDisk并不會(huì)如RAID4的ParityDisk,會(huì)造成存取的瓶頸。RAID3的并行存取模式,需要RAID控制器特別功能的支持,才能達(dá)到磁盤驅(qū)動(dòng)器同步控制,而且上述寫入性能的優(yōu)點(diǎn),以目前的Caching技術(shù),都可以將之取代,因此一般認(rèn)為RAID3的應(yīng)用,將逐漸淡出市場。RAID3以其優(yōu)越的寫入性能,特別適合用在大型、連續(xù)性檔案寫入為主的應(yīng)用,例如繪圖、影像、視訊編輯、多媒體、數(shù)據(jù)倉儲(chǔ)、高速數(shù)據(jù)擷取等等。RAID3:帶奇偶校驗(yàn)碼的并行傳送這種校驗(yàn)碼與RAID2不同,只能查錯(cuò)不能糾錯(cuò)。它訪問數(shù)據(jù)時(shí)一次處理一個(gè)帶區(qū),這樣可以提高讀取和寫入速度,它像RAID0一樣以并行的方式來存放數(shù)據(jù),但速度沒有RAID0快。校驗(yàn)碼在寫入數(shù)據(jù)時(shí)產(chǎn)生并保存在另一個(gè)磁盤上。需要實(shí)現(xiàn)時(shí)用戶必須要有三個(gè)以上的驅(qū)動(dòng)器,寫入速率與讀出速率都很高,因?yàn)樾r?yàn)位比較少,因此計(jì)算時(shí)間相對(duì)而言比較少。用軟件實(shí)現(xiàn)RAID控制將是十分困難的,控制器的實(shí)現(xiàn)也不是很容易。它主要用于圖形(包括動(dòng)畫)等要求吞吐率比較高的場合。不同于RAID2,RAID3使用單塊磁盤存放奇偶校驗(yàn)信息。如果一塊磁盤失效,奇偶盤及其他數(shù)據(jù)盤可以重新產(chǎn)生數(shù)據(jù)。如果奇偶盤失效,則不影響數(shù)據(jù)使用。RAID3對(duì)于大量的連續(xù)數(shù)據(jù)可提供很好的傳輸率,但對(duì)于隨機(jī)數(shù)據(jù),奇偶盤會(huì)成為寫操作的瓶頸。利用單獨(dú)的校驗(yàn)盤來保護(hù)數(shù)據(jù)雖然沒有鏡像的安全性高,但是硬盤利用率得到了很大的提高,為n-1。RAID4特點(diǎn)、原理與應(yīng)用創(chuàng)建RAID4需要三塊或更多的磁盤,它在一個(gè)驅(qū)動(dòng)器上保存校驗(yàn)信息,并以RAID0方式將數(shù)據(jù)寫入其它磁盤,如圖所示。因?yàn)橐粔K磁盤是為校驗(yàn)信息保留的,所以陣列的大小是(N-l)*S,其中S是陣列中最小驅(qū)動(dòng)器的大小。就像在RAID1中那樣,磁盤的大小應(yīng)該相等。如果一個(gè)驅(qū)動(dòng)器出現(xiàn)故障,那么可以使用校驗(yàn)信息來重建所有數(shù)據(jù)。如果兩個(gè)驅(qū)動(dòng)器出現(xiàn)故障,那么所有數(shù)據(jù)都將丟失。不經(jīng)常使用這個(gè)級(jí)別的原因是校驗(yàn)信息存儲(chǔ)在一個(gè)驅(qū)動(dòng)器上。每次寫入其它磁盤時(shí),都必須更新這些信息。因此,在大量寫入數(shù)據(jù)時(shí)很容易造成校驗(yàn)磁盤的瓶頸,所以目前這個(gè)級(jí)別的RAID很少使用了。RAID4是采取獨(dú)立存取模式,同時(shí)以單一專屬的ParityDisk來存放ParityData。RAID4的每一筆傳輸﹝Strip﹞資料較長,而且可以執(zhí)行OverlappedI/O,因此其讀取的性能很好。但是由于使用單一專屬的ParityDisk來存放ParityData,因此在寫入時(shí),就會(huì)造成很大的瓶頸。因此,RAID4并沒有被廣泛地應(yīng)用。RAID4:帶奇偶校驗(yàn)碼的獨(dú)立磁盤結(jié)構(gòu)RAID4和RAID3很象,不同的是,它對(duì)數(shù)據(jù)的訪問是按數(shù)據(jù)塊進(jìn)行的,也就是按磁盤進(jìn)行的,每次是一個(gè)盤。在圖上可以這么看,RAID3是一次一橫條,而RAID4一次一豎條。它的特點(diǎn)的RAID3也挺象,不過在失敗恢復(fù)時(shí),它的難度可要比RAID3大得多了,控制器的設(shè)計(jì)難度也要大許多,而且訪問數(shù)據(jù)的效率不怎么好。RAID5特點(diǎn)、原理與應(yīng)用在希望結(jié)合大量物理磁盤并且仍然保留一些冗余時(shí),RAID5可能是最有用的RAID模式。RAID5可以用在三塊或更多的磁盤上,并使用0塊或更多的備用磁盤。就像RAID4一樣,得到的RAID5設(shè)備的大小是(N-1)*S。RAID5與RAID4之間最大的區(qū)別就是校驗(yàn)信息均勻分布在各個(gè)驅(qū)動(dòng)器上,如圖4所示,這樣就避免了RAID4中出現(xiàn)的瓶頸問題。如果其中一塊磁盤出現(xiàn)故障,那么由于有校驗(yàn)信息,所以所有數(shù)據(jù)仍然可以保持不變。如果可以使用備用磁盤,那么在設(shè)備出現(xiàn)故障之后,將立即開始同步數(shù)據(jù)。如果兩塊磁盤同時(shí)出現(xiàn)故障,那么所有數(shù)據(jù)都會(huì)丟失。RAID5可以經(jīng)受一塊磁盤故障,但不能經(jīng)受兩塊或多塊磁盤故障。RAID5也是采取獨(dú)立存取模式,但是其ParityData則是分散寫入到各個(gè)成員磁盤驅(qū)動(dòng)器,因此,除了具備OverlappedI/O多任務(wù)性能之外,同時(shí)也脫離如RAID4單一專屬ParityDisk的寫入瓶頸。但是,RAI?D5在座資料寫入時(shí),仍然稍微受到"讀、改、寫過程"的拖累。由于RAID5可以執(zhí)行OverlappedI/O多任務(wù),因此當(dāng)RAID5的成員磁盤驅(qū)動(dòng)器數(shù)目越多,其性能也就越高,因?yàn)橐粋€(gè)磁盤驅(qū)動(dòng)器再一個(gè)時(shí)間只能執(zhí)行一個(gè)Thread,所以磁盤驅(qū)動(dòng)器越多,可以O(shè)verlapped的Thread就越多,當(dāng)然性能就越高。但是反過來說,磁盤驅(qū)動(dòng)器越多,數(shù)組中可能有磁盤驅(qū)動(dòng)器故障的機(jī)率就越高,整個(gè)數(shù)組的可靠度,或MTDL(MeanTimetoDataLoss)就會(huì)降低。由于RAID5將ParityData分散存在各個(gè)磁盤驅(qū)動(dòng)器,因此很符合XOR技術(shù)的特性。例如,當(dāng)同時(shí)有好幾個(gè)寫入要求發(fā)生時(shí),這些要寫入的數(shù)據(jù)以及ParityData可能都分散在不同的成員磁盤驅(qū)動(dòng)器,因此RAID控制器可以充分利用OverlappedI/O,同時(shí)讓好幾個(gè)磁盤驅(qū)動(dòng)器分別作存取工作,如此,數(shù)組的整體性能就會(huì)提高很多。基本上來說,多人多任務(wù)的環(huán)境,存取頻繁,數(shù)據(jù)量不是很大的應(yīng)用,都適合選用RAID5架構(gòu),例如企業(yè)檔案服務(wù)器、WEB服務(wù)器、在線交易系統(tǒng)、電子商務(wù)等應(yīng)用,都是數(shù)據(jù)量小,存取頻繁的應(yīng)用。RAID5:分布式奇偶校驗(yàn)的獨(dú)立磁盤結(jié)構(gòu)從它的示意圖上可以看到,它的奇偶校驗(yàn)碼存在于所有磁盤上,其中的p0代表第0帶區(qū)的奇偶校驗(yàn)值,其它的意思也相同。RAID5的讀出效率很高,寫入效率一般,塊式的集體訪問效率不錯(cuò)。因?yàn)槠媾夹r?yàn)碼在不同的磁盤上,所以提高了可靠性,允許單個(gè)磁盤出錯(cuò)。RAID5也是以數(shù)據(jù)的校驗(yàn)位來保證數(shù)據(jù)的安全,但它不是以單獨(dú)硬盤來存放數(shù)據(jù)的校驗(yàn)位,而是將數(shù)據(jù)段的校驗(yàn)位交互存放于各個(gè)硬盤上。這樣,任何一個(gè)硬盤損壞,都可以根據(jù)其它硬盤上的校驗(yàn)位來重建損壞的數(shù)據(jù)。硬盤的利用率為n-1。但是它對(duì)數(shù)據(jù)傳輸?shù)牟⑿行越鉀Q不好,而且控制器的設(shè)計(jì)也相當(dāng)困難。RAID3與RAID5相比,重要的區(qū)別在于RAID3每進(jìn)行一次數(shù)據(jù)傳輸,需涉及到所有的陣列盤。而對(duì)于RAID5來說,大部分?jǐn)?shù)據(jù)傳輸只對(duì)一塊磁盤操作,可進(jìn)行并行操作。在RAID5中有"寫損失",即每一次寫操作,將產(chǎn)生四個(gè)實(shí)際的讀/寫操作,其中兩次讀舊的數(shù)據(jù)及奇偶信息,兩次寫新的數(shù)據(jù)及奇偶信息。RAID-5的話,優(yōu)點(diǎn)是提供了冗余性(支持一塊盤掉線后仍然正常運(yùn)行),磁盤空間利用率較高(N-1/N),讀寫速度較快(N-1倍)。RAID5最大的好處是在一塊盤掉線的情況下,RAID照常工作,相對(duì)于RAID0必須每一塊盤都正常才可以正常工作的狀況容錯(cuò)性能好多了。因此RAID5是RAID級(jí)別中最常見的一個(gè)類型。RAID5校驗(yàn)位即P位是通過其它條帶數(shù)據(jù)做異或(xor)求得的。計(jì)算公式為P=D0xorD1xorD2…xorDn,其中p代表校驗(yàn)塊,Dn代表相應(yīng)的數(shù)據(jù)塊,xor是數(shù)學(xué)運(yùn)算符號(hào)異或。raid5是一種非常具有實(shí)用價(jià)值的raid模式,廣泛應(yīng)用于各種環(huán)境中。raid5模式工作原理:raid5使用至少三塊硬盤來實(shí)現(xiàn)陣列,它既能實(shí)現(xiàn)raid0的加速功能也能夠?qū)崿F(xiàn)raid1的備份數(shù)據(jù)功能,在陣列當(dāng)中有三塊硬盤的時(shí)候,它將會(huì)把所需要存儲(chǔ)的數(shù)據(jù)按照用戶定義的分割大小分割成文件碎片存儲(chǔ)到兩塊硬盤當(dāng)中,此時(shí),陣列當(dāng)中的第三塊硬盤不接收文件碎片,它接收到的是用來校驗(yàn)存儲(chǔ)在另外兩塊硬盤當(dāng)中數(shù)據(jù)的一部分?jǐn)?shù)據(jù),這部分校驗(yàn)數(shù)據(jù)是通過一定的算法產(chǎn)生的,可以通過這部分?jǐn)?shù)據(jù)來恢復(fù)存儲(chǔ)在另外兩個(gè)硬盤上的數(shù)據(jù)。另外,這三塊硬盤的任務(wù)并不是一成不變的,也就是說在這次存儲(chǔ)當(dāng)中可能是1號(hào)硬盤和2好硬盤用來存儲(chǔ)分割后的文件碎片,那么在下次存儲(chǔ)的時(shí)候可能就是2號(hào)硬盤和3號(hào)硬盤來完成這個(gè)任務(wù)了??梢哉f,在每次存儲(chǔ)操作當(dāng)中,每塊硬盤的任務(wù)是隨機(jī)分配的,不過,肯定是兩塊硬盤用來存儲(chǔ)分割后的文件碎片另一塊硬盤用來存儲(chǔ)校驗(yàn)信息。這個(gè)校驗(yàn)信息一般是通過raid控制器運(yùn)算得出的,通常這些信息是需要一個(gè)raid控制器上有一個(gè)單獨(dú)的芯片來運(yùn)算并決定將此信息發(fā)送到哪塊硬盤存儲(chǔ)。raid5同時(shí)會(huì)實(shí)現(xiàn)raid0的高速存儲(chǔ)讀取并且也會(huì)實(shí)現(xiàn)raid1的數(shù)據(jù)恢復(fù)功能,也就是說在上面所說的情況下,raid5能夠利用三塊硬盤同時(shí)實(shí)現(xiàn)raid0的速度加倍功能也會(huì)實(shí)現(xiàn)raid1的數(shù)據(jù)備份功能,并且當(dāng)raid5當(dāng)中的一塊硬盤損壞之后,加入一塊新的硬盤同樣可以實(shí)現(xiàn)數(shù)據(jù)的還原。下面來分析一下raid5如何實(shí)現(xiàn)對(duì)數(shù)據(jù)的還原,舉個(gè)例子來說,使用3塊硬盤來構(gòu)成一個(gè)raid5陣列,用戶定義的分割文件大小為64k,此時(shí)需要存儲(chǔ)的文件大小為128k。首先,當(dāng)raid控制器接收到這部分?jǐn)?shù)據(jù)之后利用一定的算法得出校驗(yàn)信息,然后將這128k的文件分割成兩個(gè)大小為64k大小的文件碎片,然后將這兩個(gè)文件碎片同時(shí)分別放往1號(hào)硬盤和2號(hào)硬盤,最后校驗(yàn)信息被發(fā)往3號(hào)硬盤。如果這個(gè)陣列當(dāng)中某個(gè)硬盤損壞了,還是可以恢復(fù)原來的數(shù)據(jù):如果上面用來存儲(chǔ)校驗(yàn)信息的3號(hào)硬盤損壞了,可以通過1號(hào)和2號(hào)硬盤來重新生成校驗(yàn)信息;如果損壞的是1號(hào)或者2號(hào)硬盤,可以利用3號(hào)硬盤上存儲(chǔ)的校驗(yàn)信息重新生成原來的文件碎片。raid5模式并不是一些都好,如果陣列當(dāng)中某塊硬盤上的信息發(fā)生了改變的話,那么就需要重新計(jì)算文件分割碎片,并且,校驗(yàn)信息也需要重新計(jì)算,這時(shí),三個(gè)硬盤都需要重新調(diào)用。同樣,如果要做raid5陣列的話,最好使用相同容量相同速度的硬盤,raid5模式的有效容量是陣列中容量最小的硬盤容量乘上陣列中硬盤數(shù)目減去一后的數(shù),這里硬盤數(shù)目要減去一是因?yàn)槠渲杏幸粔K硬盤用來存放校驗(yàn)信息。raid5既能夠?qū)崿F(xiàn)速度上的加倍,同時(shí)也能夠保證數(shù)據(jù)的安全性,所以在很多高端系統(tǒng)當(dāng)中都使用這種raid模式。RAID0+1﹝RAID10﹞的特點(diǎn)、原理與應(yīng)用RAID0+1/RAID10,綜合了RAID0和RAID1的優(yōu)點(diǎn),適合用在速度需求高,又要完全容錯(cuò),當(dāng)然經(jīng)費(fèi)也很多的應(yīng)用。RAID0和RAID1的原理很簡單,合起來之后還是很簡單,我們不打算詳細(xì)介紹,倒是要談?wù)?,RAID0+1到底應(yīng)該是RAID0overRAID1,還是RAID1overRAID0,也就是說,是把多個(gè)RAID1做成RAID0,還是把多個(gè)RAID0做成RAID1?RAID0overRAID1假設(shè)我們有四臺(tái)磁盤驅(qū)動(dòng)器,每兩臺(tái)磁盤驅(qū)動(dòng)器先做成RAID1,再把兩個(gè)RAID1做成RAID0,這就是RAID0overRAID1:(RAID1)A=DriveA1+DriveA2(Mirrored)(RAID1)B=DriveB1+DriveB2(Mirrored)RAID0=(RAID1)A+(RAID1)B(Striped)RAID1overRAID0假設(shè)我們有四臺(tái)磁盤驅(qū)動(dòng)器,每兩臺(tái)磁盤驅(qū)動(dòng)器先做成RAID0,再把兩個(gè)RAID0做成RAID1,這就是RAID1overRAID0:(RAID0)A=DriveA1+DriveA2(Striped)(RAID0)B=DriveB1+DriveB2(Striped)RAID1=(RAID1)A+(RAID1)B(Mirrored)在這種架構(gòu)之下,如果(RAID0)A有一臺(tái)磁盤驅(qū)動(dòng)器故障,(RAID0)A就算毀了,當(dāng)然RAID1仍然可以正常工作;如果這時(shí)(RAID0)B也有一臺(tái)磁盤驅(qū)動(dòng)器故障,(RAID0)B也就算毀了,此時(shí)RAID1的兩磁盤驅(qū)動(dòng)器都算故障,整個(gè)RAID1資料就毀了。因此,RAID0OVERRAID1應(yīng)該比RAID1OVERRAID0具備比較高的可靠度。所以我們建議,當(dāng)采用RAID0+1/RAID10架構(gòu)時(shí),要先作RAID1,再把數(shù)個(gè)RAID1做成RAID0。3、了解磁盤陣列的構(gòu)成原理硬件組成:一、專用的電路板:磁盤陣列卡,盒式磁盤陣列控制器(易于嵌入服務(wù)器內(nèi)形成一個(gè)整體);二、通用板卡集成式磁盤陣列:更新速度快,開發(fā)周期短,維修方便,能附加用戶特殊要求和性價(jià)比高等優(yōu)點(diǎn),但存在部分冗余的部件和機(jī)箱尺寸稍大等缺點(diǎn)。硬件結(jié)構(gòu)圖軟件關(guān)系圖陣列處理讀命令過程為:接收命令→命令分解→讀盤→數(shù)據(jù)重組→數(shù)據(jù)輸入→狀態(tài)、消息輸入→完成(等待下一命令到達(dá))陣列處理寫命令過程為:接收命令→接收數(shù)據(jù)→命令分解數(shù)據(jù)分塊→寫磁盤→狀態(tài)、消息輸入→完成(等待下一命令到達(dá))從通道控制模塊(Target):控制陣列中的從通道適配器完成主機(jī)和陣列的消息、命令、數(shù)據(jù)的交互;將來自主機(jī)的I/O命令按順序進(jìn)行排隊(duì)以等待命令分解模塊和其他模塊處理。命令分解,數(shù)據(jù)分塊重組模塊:根據(jù)設(shè)定的陣列參數(shù),從從通道控制模塊生成的命令隊(duì)列里取出的I/O命令按一定的規(guī)則分解為獨(dú)立磁盤上的子命令,同時(shí)將讀寫數(shù)據(jù)進(jìn)行分塊重組。Cache-Buffer管理模塊:該模塊提供了三種可供用戶根據(jù)實(shí)際應(yīng)用的數(shù)據(jù)請(qǐng)求特點(diǎn)進(jìn)行選擇的Buffer策略,即寫回策略(Write-back)、寫直達(dá)策略(Write-through)、自適應(yīng)的順序預(yù)取策略。Cache-Buffer管理模塊的主要目的是減少實(shí)際的磁盤I/O次數(shù),達(dá)到快速響應(yīng)用戶的數(shù)據(jù)請(qǐng)求,從軟件上最大限度地提供磁盤陣列的性能。I/O調(diào)度模塊:依次掃描各子命令隊(duì)列,對(duì)這些子命令經(jīng)過Cache-Buffer管理模塊過濾后,將需要磁盤操作的子命令按優(yōu)先級(jí)分組,然后按優(yōu)先級(jí)從高到低逐組分派給各主通道控制模塊并行地完成磁盤操作請(qǐng)求。該模塊是整個(gè)陣列控制程序的控制核心,其他模塊幾乎都要和它發(fā)生交互。主通道控制模塊(串控制器):調(diào)度、控制陣列中的串控制器完成磁盤I/O操作,并且負(fù)責(zé)向上層模塊報(bào)告I/O完成情況和磁盤狀態(tài)。容錯(cuò)功能模塊:包括數(shù)據(jù)重構(gòu)(Reconstruct)和磁盤數(shù)據(jù)的重建(Rebuild)修復(fù)。前者是指在陣列運(yùn)行于有容錯(cuò)功能的級(jí)別下單盤失效時(shí)陣列降級(jí)運(yùn)行,利用冗余的校驗(yàn)信息重新生成失效盤上的數(shù)據(jù)以響應(yīng)主機(jī)的I/O請(qǐng)求;后者指的是在有盤失效的情況下,當(dāng)系統(tǒng)檢測到有新的磁盤被換上時(shí),系統(tǒng)在后臺(tái)將失效盤上的數(shù)據(jù)恢復(fù)到新盤上。4、以太網(wǎng)和TCP/IP協(xié)議的內(nèi)容和工作原理以太網(wǎng)的內(nèi)容和工作原理以太網(wǎng)采用共享信道的方法,即多臺(tái)主機(jī)共同一個(gè)信道進(jìn)行數(shù)據(jù)傳輸。為了解決多個(gè)計(jì)算機(jī)的信道征用問題,以太網(wǎng)采用IEEE802.3標(biāo)準(zhǔn)規(guī)定的CSMA/CD(載波監(jiān)聽多路訪問/沖突檢測)協(xié)議,它是控制多個(gè)用戶共用一條信道的協(xié)議。CSMA/CD的工作原理如下:(1)載波監(jiān)聽(先聽后發(fā))使用CSMA/CD協(xié)議時(shí),總線上各個(gè)節(jié)點(diǎn)都在監(jiān)聽總線,即檢測總線上是否有別的節(jié)點(diǎn)發(fā)送數(shù)據(jù)。如果發(fā)現(xiàn)總線是空閑的,既沒有檢測到有信號(hào)正在傳送,即可立即發(fā)送數(shù)據(jù);如果監(jiān)聽到總線忙,即檢測到總線上有數(shù)據(jù)正在傳送,這時(shí)節(jié)點(diǎn)要持續(xù)等待直到監(jiān)聽到總線空閑時(shí)才能將數(shù)據(jù)發(fā)送出去,或等待一個(gè)隨機(jī)時(shí)間,再從新監(jiān)聽總線,一直到宗賢空現(xiàn)在發(fā)送數(shù)據(jù)。載波監(jiān)聽也稱作先聽后發(fā)。(2)沖突檢測當(dāng)兩個(gè)或兩個(gè)以上的節(jié)點(diǎn)同時(shí)監(jiān)聽到總線空閑,開始發(fā)送數(shù)據(jù)時(shí),就會(huì)發(fā)生碰撞沖突;傳輸延遲可能會(huì)使第一個(gè)節(jié)點(diǎn)發(fā)送的數(shù)據(jù)還沒有到達(dá)目標(biāo)節(jié)點(diǎn)時(shí),另一個(gè)要發(fā)送的數(shù)據(jù)的節(jié)點(diǎn)就已經(jīng)監(jiān)聽到總線空閑,并開始發(fā)送數(shù)據(jù),這也會(huì)帶至沖突的產(chǎn)生。當(dāng)兩個(gè)幀發(fā)生沖突時(shí),兩個(gè)傳輸?shù)膸蜁?huì)被破壞,被損壞幀繼續(xù)傳輸毫無意義,而且信道無法被其他站點(diǎn)使用,對(duì)于有限的信道來講,這是很大的浪費(fèi)。如果每個(gè)發(fā)送節(jié)點(diǎn)邊發(fā)送邊監(jiān)聽,并在監(jiān)聽到?jīng)_突之后立即停止發(fā)送,就可以提高信道的利用率。當(dāng)節(jié)點(diǎn)檢測到縱向上發(fā)生沖突時(shí),就立即取消傳輸數(shù)據(jù),隨后發(fā)送一個(gè)短的干擾信,一較強(qiáng)沖突信號(hào),告訴網(wǎng)絡(luò)上的所有的節(jié)點(diǎn),總線已經(jīng)發(fā)生了沖突。在阻塞信號(hào)發(fā)送后,等待一個(gè)隨機(jī)事件,然后再將要發(fā)的數(shù)據(jù)發(fā)送一次。如果還有沖突,則重復(fù)監(jiān)聽、等待和重傳操作。圖6-30顯示了采用CSMA/CD發(fā)送數(shù)據(jù)的工作流程。CSMA/CD采用用戶訪問總線時(shí)間不確定的隨機(jī)競爭方式,有結(jié)構(gòu)簡單、輕負(fù)載時(shí)時(shí)延小等特點(diǎn),但當(dāng)網(wǎng)絡(luò)通信附在增大時(shí),由于沖突增多,網(wǎng)絡(luò)吞吐率下降、傳輸演示增長,網(wǎng)絡(luò)性能會(huì)明顯下降。從以上分析可以看出,以太網(wǎng)的工作方式就像沒有主持人的座談會(huì)中,所有的參會(huì)者都通過一個(gè)共同的戒指來嗎相互交談。每個(gè)參加會(huì)議的人在講話錢,都禮貌的等到別人把話講完。如果兩個(gè)客人同時(shí)開始講話,那么他們都停下來,分別隨即等待一段時(shí)間在開始講話,這時(shí),如果兩個(gè)客人等待的時(shí)間不同,沖突就不會(huì)出現(xiàn)、如果講話超過了一次以上,將采用退避指數(shù)加強(qiáng)等待的時(shí)間。TCP/IP協(xié)議的內(nèi)容和工作原理從體系結(jié)構(gòu)來看,TCP/IP是OSI七層模型的簡化,如圖所示,共分為4層:應(yīng)用層,傳輸層,IP層和物理網(wǎng)絡(luò)接口層。TCP/IP模型將與物理網(wǎng)絡(luò)打交道的物理網(wǎng)絡(luò)部分稱為網(wǎng)絡(luò)接口,它相當(dāng)于OSI的物理層和數(shù)據(jù)鏈路層。TCP/IP協(xié)議的工作流程如下:(1)在源主機(jī)上應(yīng)用層將一串字節(jié)流傳給傳輸層;(2)傳輸層將字節(jié)流分成TCP段,加上TCP包頭交給互聯(lián)網(wǎng)絡(luò)(IP)層;(3)IP層生成一個(gè)包,將TCP段放人其數(shù)據(jù)域,并加上源和目的主機(jī)的IPIP包交給數(shù)據(jù)鏈路層;(4)數(shù)據(jù)鏈路層在其幀的數(shù)據(jù)部分裝IP包,發(fā)往日的主機(jī)或IP路由器;(5)在目的主機(jī),數(shù)據(jù)鏈路層將數(shù)據(jù)鏈路層幀頭去掉,將IP包交給互聯(lián)網(wǎng)層;(6)IP層檢查IP包頭,如果包頭中的校驗(yàn)和與計(jì)算出來的不一致,則丟棄該包;(7)如果校驗(yàn)和一致,IP層去掉IP頭,將TCP段交給TCP層,TCP層檢查順序號(hào)來判斷是否為正確的TCP段;(8)TCP層為TCP包頭計(jì)算TCP頭和數(shù)據(jù)。如果不對(duì),TCP層丟棄這個(gè)包,若對(duì),則向源主機(jī)發(fā)送確認(rèn);(9)在目的主機(jī),TCP層去掉TCP頭,將字節(jié)流傳給應(yīng)用程序;(10)于是目的主機(jī)收到了源主機(jī)發(fā)來的字節(jié)流,就像直接從源主機(jī)發(fā)來的一樣。5、FibreChannel的內(nèi)容和工作原理光纖通道基本架構(gòu)FC-4UpperLayerProtocol:SCSI,HIPPI,SBCCS,802.2,ATM,VI,IPFC-3commonserviceFC-2FramingProtocol/FlowControlFC-1Encode/DecodeFC-0Media:Opticalorcopper,100MB/secto1.062GB/sec描述:FC-0:物理層,定制了不同介質(zhì),傳輸距離,信號(hào)機(jī)制標(biāo)準(zhǔn),也定義了光纖和銅線接以及電纜指標(biāo)FC-1:定義編碼和解碼的標(biāo)準(zhǔn)FC-2:定義了幀、流控制、和服務(wù)質(zhì)量等FC-3:定義了常用服務(wù),如數(shù)據(jù)加密和壓縮FC-4:協(xié)議映射層,定義了光纖通道和上層應(yīng)用之間的接口,上層應(yīng)用比如:串行SCSI協(xié)議,HBA的驅(qū)動(dòng)提供了FC-4的接口函數(shù),F(xiàn)C-4支持多協(xié)議,如:FCP-SCSI,F(xiàn)C-IP,F(xiàn)C-VI.FCP-SCSIFCP-SCSI:是將光纖通道設(shè)備映射為一個(gè)操作系統(tǒng)可訪問的邏輯驅(qū)動(dòng)器的一個(gè)串行協(xié)議,這個(gè)協(xié)議使得以前基于SCSI的應(yīng)用不做任何修改即可使用光纖通道。FC-SCSI是存儲(chǔ)系統(tǒng)和服務(wù)器之間最主要的通信手段。SCSI擴(kuò)展了COPY命令,一個(gè)新的ANSIT10標(biāo)準(zhǔn),也支持SAN上存儲(chǔ)系統(tǒng)之間通過數(shù)據(jù)遷移應(yīng)用來直接移動(dòng)數(shù)據(jù)。FCP-SCSI和總線聯(lián)結(jié)方式相比的優(yōu)點(diǎn)在存儲(chǔ)局域網(wǎng)上已經(jīng)得到證明,F(xiàn)CP-SCSI提供更高的性能(100M/sec),更遠(yuǎn)的連接距離(每連接最遠(yuǎn)達(dá)10公里),更大的尋址空間(最大16000000個(gè)節(jié)點(diǎn))。FCP-SCSI使用幀傳輸取代塊傳輸。幀傳輸以大數(shù)據(jù)流傳輸方式傳輸短的小的事務(wù)數(shù)據(jù),這樣可提高服務(wù)質(zhì)量。FCP-SCSI支持為了簡化管理和資源存儲(chǔ)的存儲(chǔ)“池”技術(shù)的網(wǎng)絡(luò)配置。FCP-SCSI支持提高可靠性和可用性的編碼技術(shù)。FC-IPFC-IP將光纖通道地址映射到IP地址,F(xiàn)C-IP的尋址方式:廣播一個(gè)IP地址,然后從存儲(chǔ)節(jié)點(diǎn)返回一個(gè)MAC地址。如果SCSI設(shè)備不能區(qū)分FCP-SCSI幀和FC-IP幀,IP廣播可能導(dǎo)致錯(cuò)誤。HDS系統(tǒng)可通過檢測幀頭來區(qū)分FCP-SCSI幀和FC-IP幀,沒有這個(gè)能力的存儲(chǔ)系統(tǒng)必須通過別的方法(如switchzoning)來阻止FC-IP幀被廣播到fibre端口。FC-IP和以太網(wǎng)比有幾個(gè)優(yōu)點(diǎn):可以和類似FCP-SCSI存儲(chǔ)的內(nèi)部連接架構(gòu)集成,以節(jié)省使用成本;傳輸速度更快,效率更高。以太網(wǎng)傳輸數(shù)據(jù)包最高到1500字節(jié)。包是以太網(wǎng)中基本校正單元,在每一幀后都會(huì)導(dǎo)致消耗CPU周期的一個(gè)中斷。在GB以太網(wǎng)里負(fù)載通常也是一個(gè)限制因素,避免占用全部帶寬。而FC-IP數(shù)據(jù)幀達(dá)到2000字節(jié),F(xiàn)C-IP校正基本單元是一個(gè)多幀隊(duì)列。MTU可以達(dá)到64個(gè)幀,比較以太網(wǎng)而言允許光纖通道在主機(jī)中斷之間傳輸更多的數(shù)據(jù)。這種MTU可減少需要的CPU周期和提高傳輸效率。FC-IP還有使用光纖通道網(wǎng)絡(luò)的優(yōu)點(diǎn),光纖通道網(wǎng)絡(luò)是基于流控制的封閉網(wǎng)絡(luò)。以太網(wǎng)設(shè)初是考慮到要通過無流控制的公網(wǎng),它在阻塞發(fā)生時(shí),在一貫時(shí)間段之后返回并重發(fā)包,消耗額外的CPU周期。IP應(yīng)用無須修改即可運(yùn)行于FC-IP,享受光纖通道帶來的高速和大大減少處理中斷。Emulex和JNI是提供FC-IP驅(qū)動(dòng)的光纖通道HBA廠商。他們計(jì)劃傳遞一個(gè)“Combo”以支持FCP-SCSI和FC-IP.Troika提供支持FCP-SCSI、FC-IP、FC-IP(QOS)的控制器,QOS允許網(wǎng)絡(luò)管理員分配協(xié)議優(yōu)先權(quán)。FC-VIFC-VI是在光纖通道上實(shí)現(xiàn)VI架構(gòu),它允許數(shù)據(jù)在光纖通道接點(diǎn)的內(nèi)存地址之間快速遷移。FC-VI是VI架構(gòu)的光纖通道應(yīng)用,一個(gè)intel,Compaq,100多家廠商和組織為了減少服務(wù)器通信等待的協(xié)議標(biāo)準(zhǔn)。VI設(shè)計(jì)的初衷是為了達(dá)到集群計(jì)算機(jī)之間通信等待減少和高帶寬的效果。在光纖通道網(wǎng)絡(luò)里,通過和另一節(jié)點(diǎn)接口的HBA的緩沖區(qū)和應(yīng)用內(nèi)存之間直接訪問(DMA)的方法,這個(gè)目標(biāo)完成了VI架構(gòu)建立了內(nèi)存注冊(cè)機(jī)制,實(shí)質(zhì)上就是限制用戶內(nèi)存的內(nèi)存地址并支持?jǐn)?shù)據(jù)從用戶內(nèi)存直接傳輸?shù)紿BA的緩存,然后這個(gè)數(shù)據(jù)可以通過外部介質(zhì)傳輸?shù)搅硪粋€(gè)服務(wù)器應(yīng)用內(nèi)存的指定位置(注冊(cè))。如果要使用VI,應(yīng)用、數(shù)據(jù)庫或操作系統(tǒng)必須獲得相應(yīng)的API.DB26.1和Oracle8.1都在他們的數(shù)據(jù)庫集群應(yīng)用中使用了VI架構(gòu)。IPoverEthernet的延遲包括TCP棧(CPU負(fù)荷)和以太傳輸延遲。100BaseT的最大傳輸速率為100Mbit/sec,F(xiàn)C-IP減少了以太相關(guān)的延遲并以光纖通道的速度傳輸,提供比IPoverEthernet更好的吞吐能力,但仍然避免不了TCP/IP的軟件延遲。FC-VI去掉了TCP棧并提供了應(yīng)用內(nèi)存和HBA之間的DMA.FC-VI饒過了系統(tǒng)內(nèi)核,避免了操作系統(tǒng)上下文轉(zhuǎn)換和緩沖改變,實(shí)現(xiàn)了更高的傳輸速率。FC-VI需要一個(gè)支持VI架構(gòu)的光纖通道HBA,F(xiàn)C-VIHBA和支持SCSII/O的光纖通道HBA有本質(zhì)上的不同。Troika和Finisar都提供支持VI架構(gòu)的光纖通道HBA.Finisar出售一種基于PCI的支持VI架構(gòu)的光纖通道HBA,支持點(diǎn)對(duì)點(diǎn)連接或交換形式。Troika出售一種基于PCI的智能控制器?D?DSAN2000系列控制器,這種控制器支持FC-SCSI,F(xiàn)C-IP,點(diǎn)對(duì)點(diǎn)FC-VI,F(xiàn)C-AL和交換拓?fù)?。Troika控制器提供多種管理選項(xiàng)和特征,比如協(xié)議優(yōu)先權(quán)配置和在負(fù)載均衡的path變換。多協(xié)議結(jié)構(gòu)所有的這三種協(xié)議(FC-SCSI,F(xiàn)C-IP,F(xiàn)C-VI)可以備組合成一個(gè)光纖通道結(jié)構(gòu)。盡管這些協(xié)議也能在FC-AL里工作,但相應(yīng)的帶寬共享和仲裁消耗忽略掉了FC-IP和FC-IP的性能優(yōu)點(diǎn)。建議使用Fabric交換,這是因?yàn)镕abric交換提供服務(wù)器之間和服務(wù)器與存儲(chǔ)設(shè)備之間的多個(gè)無阻塞的100M/sec的通路。HDS公司開發(fā)了一個(gè)模擬使用FC-SCSI,F(xiàn)C-IP,F(xiàn)C-VI交換結(jié)構(gòu)的多協(xié)議商業(yè)智能解決方案。使用Ancor、Brocade或一起使用這兩家的Fabric交換機(jī),這個(gè)方案于1999年11月的計(jì)算機(jī)分銷商展覽會(huì)和2000年6月的Gartner集團(tuán)存儲(chǔ)2000年會(huì)議上得到驗(yàn)證。在這個(gè)方案里的Fabric交換集成了全部數(shù)據(jù)網(wǎng)絡(luò)的集中管理并提供了無限的可擴(kuò)展性(隨服務(wù)器和存儲(chǔ)系統(tǒng)節(jié)點(diǎn)的增加)。Fabric交換的使用犧牲了一些完全可以忽略的性能損耗,在多數(shù)情況下,F(xiàn)CP-SCSI通過交換所消耗不超過2%.當(dāng)越來越多的應(yīng)用為VI架構(gòu)而修改或開發(fā)時(shí),我們會(huì)看到越來越多數(shù)據(jù)網(wǎng)絡(luò)集成到光纖通道上。出現(xiàn)的市場機(jī)遇如EAI(企業(yè)應(yīng)用交換)需要提供異平臺(tái)和異種數(shù)據(jù)庫之間的數(shù)據(jù)實(shí)時(shí)傳輸和交換,F(xiàn)C-VI使得服務(wù)器之間高速數(shù)據(jù)交換成為可能?,F(xiàn)存的應(yīng)用如NAS通過使用VIsockets可以光纖通道的速度運(yùn)行他們的網(wǎng)絡(luò)文件系統(tǒng)。人們正在努力提出訪問存儲(chǔ)的IP標(biāo)準(zhǔn),Cisco為SCSIoverIP向IETF提交了一個(gè)規(guī)范,目前這個(gè)規(guī)范仍在開發(fā)中,它需要將控制和命令信號(hào)與數(shù)據(jù)信號(hào)的傳輸電纜分開,主要是考慮流控制和傳輸控制的開銷。6、IPSAN存儲(chǔ)網(wǎng)絡(luò)的原理與特點(diǎn)IP-SAN存儲(chǔ)基礎(chǔ)由于FC-SAN的高昂價(jià)格和自身的種種不足,使得SAN技術(shù)并不能得到真正意義上的普及,SAN更多的是被應(yīng)用在高端存儲(chǔ)市場。為了提高SAN的普及度,充分利用SAN本身所具備的架構(gòu)優(yōu)勢,許多存儲(chǔ)和網(wǎng)絡(luò)設(shè)備開始考慮放棄使用異構(gòu)的FC,而在應(yīng)用廣泛、構(gòu)建費(fèi)用低廉的IP網(wǎng)絡(luò)上繼續(xù)享受SAN架構(gòu)所帶來的存儲(chǔ)性能優(yōu)勢。這樣的市場需求直接導(dǎo)致了“StorageOverIP”的誕生。IP存儲(chǔ)的優(yōu)勢因?yàn)椴捎媚壳皯?yīng)用廣泛且相對(duì)比較成熟的IP技術(shù),所以基于IP的存儲(chǔ)網(wǎng)絡(luò)構(gòu)建也比較簡單,所需要的時(shí)間也更短。此外,還可以充分利用目前在IP網(wǎng)絡(luò)方面已經(jīng)大量部署的設(shè)備和投資,且新購設(shè)備也不需要昂貴的光纖通道交換機(jī),從而有效的降低了總體擁有成本,更好的保護(hù)了用戶的投資。此外,由于IP技術(shù)的多年普及造就了眾多的IP網(wǎng)絡(luò)管理人員和技術(shù)人員,企業(yè)在部署IP存儲(chǔ)之后無需再聘請(qǐng)專門的FC-SAN管理和技術(shù)人員,從而可以大大降低IP存儲(chǔ)網(wǎng)絡(luò)的維護(hù)和管理費(fèi)用。另外,由于IP的廣泛應(yīng)用,IP-SAN允許數(shù)據(jù)存儲(chǔ)發(fā)生在企業(yè)網(wǎng)絡(luò)的任何地方而沒有物理地理位置的限制,從而可以很方便的實(shí)現(xiàn)遠(yuǎn)程備份、鏡像和災(zāi)難恢復(fù)。盡管IP存儲(chǔ)標(biāo)準(zhǔn)早已建立且應(yīng)用,但是將其真正廣泛應(yīng)用到存儲(chǔ)環(huán)境中還需要解決幾個(gè)關(guān)鍵問題:塊數(shù)據(jù)傳輸問題:FC存儲(chǔ)協(xié)議具有高速、低延遲和距離短的特點(diǎn),計(jì)算機(jī)在這個(gè)網(wǎng)絡(luò)中是所有外部設(shè)備的控制者,因而計(jì)算機(jī)和存儲(chǔ)設(shè)備是主從關(guān)系,適合傳輸大塊的數(shù)據(jù)(BlockData);而從網(wǎng)絡(luò)協(xié)議上來看,IP協(xié)議具備速度低、延遲高和距離長的特點(diǎn),比較適合傳輸大量的小塊消息(Message)。從而,如何提高在IP網(wǎng)絡(luò)中塊數(shù)據(jù)的傳輸效率,是IP存儲(chǔ)急需改進(jìn)的方面。TCP負(fù)載空閑引擎:由于IP協(xié)議是無連接不可靠的傳輸協(xié)議,數(shù)據(jù)的可靠性和完整性是由TCP協(xié)議來提供的。而TCP為了完成數(shù)據(jù)的排序工作需要占用較多的主機(jī)CPU資源導(dǎo)致事務(wù)處理延遲的增加。由此,一種叫做TCP負(fù)載空閑引擎(TCPOff-loadingEngine,TOE)的設(shè)備可降低主機(jī)處理器的負(fù)載,并且,該設(shè)備被期待來最終解決處理器負(fù)載的問題。但是目前TOE設(shè)備較新,其硬件成本和復(fù)雜程度都較高,所以其較高的價(jià)格可能會(huì)延遲其廣泛部署。數(shù)據(jù)安全性:企業(yè)網(wǎng)絡(luò)中最重要的還是數(shù)據(jù),所以,SAN中保存的數(shù)據(jù)的安全性和可靠性應(yīng)當(dāng)受到格外的重視。當(dāng)存儲(chǔ)設(shè)備通過IP架構(gòu)進(jìn)行遠(yuǎn)程連接時(shí),數(shù)據(jù)的安全性愈加重要。盡管IP協(xié)議可以配合IPSec體系使用,但是也只能保護(hù)數(shù)據(jù)在網(wǎng)絡(luò)傳輸過程的安全,它并沒有采取任何措施來保證數(shù)據(jù)被保存在存儲(chǔ)設(shè)備上的安全性。并且由于IP網(wǎng)絡(luò)是開放式網(wǎng)絡(luò),通過IP網(wǎng)絡(luò)傳輸數(shù)據(jù)仍然存在眾多安全漏洞,所以,如何提高數(shù)據(jù)在傳輸過程的安全性和在存儲(chǔ)設(shè)備中的安全性,也是IP存儲(chǔ)面臨的嚴(yán)峻問題?;ミB性:基于IP存儲(chǔ)的技術(shù)并沒有被所有廠家共同使用,雖然該協(xié)議標(biāo)準(zhǔn)早已被IETF公布,但這并不能保證不同廠家之間使用相同的協(xié)議和版本。為了保證IP存儲(chǔ)產(chǎn)品之間能更好的相互配合,還需要有能夠被市場廣泛認(rèn)可的協(xié)議,以便各廠家能采用相同的協(xié)議制造產(chǎn)品并使得這些產(chǎn)品具備良好的互連性。IP存儲(chǔ)技術(shù)實(shí)際上就是使用IP協(xié)議而不是光纖通道將服務(wù)器與存儲(chǔ)設(shè)備連接起來的技術(shù)。IP存儲(chǔ)是基于IP網(wǎng)絡(luò)來實(shí)現(xiàn)數(shù)據(jù)塊級(jí)別存儲(chǔ)的方式,除了標(biāo)準(zhǔn)已獲通過的iSCSI,還有FCIP、iFCP等協(xié)議標(biāo)準(zhǔn)。而iSCSI發(fā)展是最快的,已經(jīng)成為IP存儲(chǔ)技術(shù)的一個(gè)典型代表?;趇SCSI的SAN的目的就是要使用本地iSCSI導(dǎo)向器(Initiator)和iSCSI目標(biāo)(Target)之間來建立SAN。與光纖通道一樣,IP存儲(chǔ)是可交換的。而且,由于IP網(wǎng)絡(luò)經(jīng)過多年的發(fā)展已經(jīng)相當(dāng)成熟,不存在互操作性問題,而這正是FC-SAN最大的弱點(diǎn)。IP協(xié)議已經(jīng)得到業(yè)內(nèi)的廣泛認(rèn)可,實(shí)際上TCP/IP協(xié)議已經(jīng)成為“事實(shí)上”的標(biāo)準(zhǔn),所以有許多網(wǎng)絡(luò)管理軟件和服務(wù)產(chǎn)品可供選擇,而這一點(diǎn)FC網(wǎng)絡(luò)設(shè)備的可選擇性就差了很多。不管是FC存儲(chǔ)或者IP存儲(chǔ),最終傳輸?shù)亩际荢CSI指令和數(shù)據(jù),只是上層封裝的形式不同而已。在IP存儲(chǔ)方案中,數(shù)據(jù)的傳輸是在IP網(wǎng)絡(luò)塊級(jí)進(jìn)行的,使得服務(wù)器可以通過IP網(wǎng)絡(luò)連接SCSI設(shè)備,并且像使用本地的設(shè)備一樣,無需廣播設(shè)備的地址或者位置。整個(gè)存儲(chǔ)網(wǎng)絡(luò)連接則是以IP和以太網(wǎng)為骨干,是以成熟的IP和以太網(wǎng)技術(shù),替代了FC-SAN中的復(fù)雜的光纖通道技術(shù)。這樣的存儲(chǔ)解決方案同時(shí)具備了成熟性和開放性,并且IP存儲(chǔ)技術(shù)得應(yīng)用也避免了設(shè)計(jì)傳統(tǒng)SAN方案時(shí)所必須面對(duì)的產(chǎn)品兼容性和連接性方面的問題,所以在設(shè)計(jì)存儲(chǔ)系統(tǒng)的時(shí)候有了更大的選擇空間?;贗P存儲(chǔ)技術(shù)得新型SAN,兼?zhèn)淞薋C-SAN的高性能和傳統(tǒng)NAS的數(shù)據(jù)共享優(yōu)勢,為新的數(shù)據(jù)應(yīng)用方式提供了更加先進(jìn)的結(jié)構(gòu)平臺(tái)。需要注意的是,這里提到的利用FCIP和iFCP構(gòu)建的IP-SAN存儲(chǔ)并不是指整個(gè)SAN存儲(chǔ)系統(tǒng)都是采用IP技術(shù)構(gòu)建,而是指不同的SAN之間的互聯(lián)是采用IP通道進(jìn)行的。各個(gè)SAN內(nèi)部仍然采用FC協(xié)議進(jìn)行數(shù)據(jù)通信,也就意味者IP-SAN并不是一個(gè)純的IP網(wǎng)絡(luò),而是FC與IP技術(shù)的一種融合。但是iSCSI協(xié)議是一種純粹的IP存儲(chǔ)網(wǎng)絡(luò)技術(shù),它不包含任何的FC內(nèi)容,iSCSI通過IP網(wǎng)絡(luò)傳輸SCSI指令集,在IP網(wǎng)絡(luò)上實(shí)現(xiàn)塊級(jí)數(shù)據(jù)傳輸。通過SCSI控制卡的使用可以連接多個(gè)設(shè)備,形成自己的“網(wǎng)絡(luò)”,但是這個(gè)“網(wǎng)絡(luò)”僅局限于與所附加的主機(jī)進(jìn)行通信,并不能在以太網(wǎng)上共享。那么,如果能夠通過SCSI協(xié)議組成網(wǎng)絡(luò),并且能夠直接掛載到以太網(wǎng)上,作為網(wǎng)絡(luò)節(jié)點(diǎn)和其它設(shè)備進(jìn)行互聯(lián)共享,那么SCSI就可以得到更為廣泛的應(yīng)用。所以,經(jīng)過對(duì)SCSI的改進(jìn),就推出了iSCSI這個(gè)協(xié)議?;趇SCSI協(xié)議的IP-SAN是把用戶的請(qǐng)求轉(zhuǎn)換成SCSI代碼,并將數(shù)據(jù)封裝進(jìn)IP包內(nèi)在以太網(wǎng)中進(jìn)行傳輸。iSCSI方案最早是由Cisco和IBM兩家發(fā)起,并且由Adaptec、Cisco、HP、IBM、Quantum等公司共同倡導(dǎo)。它提供基于TCP傳輸,將數(shù)據(jù)駐留與SCSI設(shè)備的方法。iSCSI標(biāo)準(zhǔn)草案在2001年推出,并經(jīng)過多次論證和修改,于2002年提交IETF,在2003年2月,iSCSI標(biāo)準(zhǔn)正式發(fā)布。iSCSI技術(shù)的重要貢獻(xiàn)在于其對(duì)傳統(tǒng)技術(shù)的繼承和發(fā)展:其一,SCSI(Small

Computer

System

Interface,小型計(jì)算機(jī)系統(tǒng)接口)技術(shù)是被磁盤、磁帶等設(shè)備廣泛采用的存儲(chǔ)標(biāo)準(zhǔn),從1986年誕生起到現(xiàn)在仍然保持著良好的發(fā)展勢頭;其二,沿用TCP/IP協(xié)議,TCP/IP在網(wǎng)絡(luò)方面是最通用、最成熟的協(xié)議,且IP網(wǎng)絡(luò)的基礎(chǔ)建設(shè)非常完善。這兩點(diǎn)為iSCSI的無限擴(kuò)展提供了堅(jiān)實(shí)的基礎(chǔ)。IP網(wǎng)絡(luò)的普及性將使得數(shù)據(jù)可以通過LAN、WAN或者是通過Internet利用新型IP存儲(chǔ)協(xié)議傳輸,iSCSI既是在這個(gè)思想的指導(dǎo)下進(jìn)行研究和開發(fā)的。iSCSI是基于IP協(xié)議的技術(shù)標(biāo)準(zhǔn),實(shí)現(xiàn)了SCSI和TCP/IP協(xié)議的融合,對(duì)眾多的以太網(wǎng)用戶而言,只需要極少的投資,就可以方便、快捷地對(duì)信息和數(shù)據(jù)進(jìn)行交互式傳輸和管理。在支持iSCSI的系統(tǒng)中,用戶在一臺(tái)SCSI存儲(chǔ)設(shè)備上發(fā)出存數(shù)據(jù)或取數(shù)據(jù)的命令,操作系統(tǒng)對(duì)該請(qǐng)求進(jìn)行處理,并將該請(qǐng)求轉(zhuǎn)換成一條或者多條SCSI指令,然后再傳給目標(biāo)SCSI控制卡。指令和數(shù)據(jù)被封裝(Encapsulation)起來,形成一個(gè)iSCSI包,然后該數(shù)據(jù)封裝被傳送給TCP/IP層,再由TCP/IP協(xié)議將iSCSI包封裝成IP協(xié)議數(shù)據(jù)以適合在網(wǎng)絡(luò)中傳輸。也可以對(duì)封裝的SCSI命令進(jìn)行加密處理,然后在不安全的網(wǎng)絡(luò)上傳送。數(shù)據(jù)包可以在局域網(wǎng)或Internet上傳送。在接收存儲(chǔ)控制器上,數(shù)據(jù)報(bào)重新被組合,然后存儲(chǔ)控制器讀取iSCSI包中的SCSI控制命令和數(shù)據(jù)發(fā)送到相應(yīng)的磁盤驅(qū)動(dòng)器上,磁盤驅(qū)動(dòng)器再執(zhí)行初始計(jì)算機(jī)或應(yīng)用所需求的功能。如果發(fā)送的是數(shù)據(jù)請(qǐng)求,那么將數(shù)據(jù)從磁盤驅(qū)動(dòng)器中取出進(jìn)行封裝后發(fā)送給發(fā)出請(qǐng)求的計(jì)算機(jī),而這整個(gè)過程對(duì)于用戶來說都是透明的。盡管SCSI命令的執(zhí)行和數(shù)據(jù)準(zhǔn)備可以通過使用標(biāo)準(zhǔn)TCP/IP和現(xiàn)成的網(wǎng)絡(luò)控制卡的軟件來完成,但是在利用軟件完成封裝和解封裝的情況下,在主機(jī)處理器上實(shí)現(xiàn)這些功能需要很多的CPU運(yùn)算周期來處理數(shù)據(jù)和SCSI命令。如果將這些事務(wù)交給專門的設(shè)備處理,則可以將對(duì)系統(tǒng)性能的影響減少到最小程度,因此,發(fā)展在iSCSI標(biāo)準(zhǔn)下并執(zhí)行SCSI命令和完成數(shù)據(jù)準(zhǔn)備的專用iSCSI適配器是有必要的。iSCSI適配器結(jié)合了NIC和HBA的功能。這種適配器以塊方式取得數(shù)據(jù),利用TCP/IP處理引擎在適配卡上完成數(shù)據(jù)分化和處理,然后通過IP網(wǎng)絡(luò)送出IP數(shù)據(jù)包。這些功能的完成使用戶可以在不降低服務(wù)器性能的基礎(chǔ)上創(chuàng)建一個(gè)基于IP的SAN。iSCSI協(xié)議位于TCP/IP協(xié)議和SCSI協(xié)議之間,可以起到連接這兩種協(xié)議網(wǎng)絡(luò)的作用。在物理層,iSCSI實(shí)現(xiàn)了對(duì)千兆以太網(wǎng)接口的支持,這使得所有支持iSCSI接口的系統(tǒng)都可以方便的直接連接到千兆以太網(wǎng)的路由器或者交換機(jī)上。iSCSI位于物理層和數(shù)據(jù)鏈路層之上,直接面向操作系統(tǒng)的標(biāo)準(zhǔn)SCSI命令集。在iSCSI通信中,具有一個(gè)發(fā)起I/O請(qǐng)求的啟動(dòng)設(shè)備(Initiator)和響應(yīng)請(qǐng)求并執(zhí)行實(shí)際I/O操作的目標(biāo)設(shè)備(Target)。在啟動(dòng)設(shè)備和目標(biāo)設(shè)備建立連接后,目標(biāo)設(shè)備在操作中作為主設(shè)備控制整個(gè)工作過程。在一般情況下將主機(jī)總線適配器(HBA)作為啟動(dòng)設(shè)備,磁盤/磁帶作為目標(biāo)設(shè)備。iSCSI使用iSCSIName來唯一鑒別啟動(dòng)設(shè)備和目標(biāo)設(shè)備。地址會(huì)隨著啟動(dòng)設(shè)備和目標(biāo)設(shè)備的移動(dòng)而改變,但是名字始終是不變的。建立連接時(shí),啟動(dòng)設(shè)備發(fā)出一個(gè)請(qǐng)求,目標(biāo)設(shè)備接收到請(qǐng)求后,確認(rèn)啟動(dòng)設(shè)備發(fā)起的請(qǐng)求中所攜帶的iSCSIName是否與目標(biāo)設(shè)備綁定的iSCSIName一致,如果一致,便建立通信連接。每個(gè)iSCSI節(jié)點(diǎn)只允許有一個(gè)iSCSIName,一個(gè)iSCSIName可以被用來建立一個(gè)啟動(dòng)設(shè)備到多個(gè)目標(biāo)設(shè)備的連接,多個(gè)iSCSIName可以被用來建立一個(gè)目標(biāo)設(shè)備到多個(gè)啟動(dòng)設(shè)備的連接。支持iSCSI的服務(wù)器一般都有一塊專用的iSCSI主機(jī)總線適配器卡。所有的SCSI命令都被封裝成iSCSI協(xié)議數(shù)據(jù)單元(ProtocolDataUnit,PDU),iSCSI會(huì)利用TCP/IP協(xié)議棧的傳輸層協(xié)議TCP來提供的可靠傳輸機(jī)制,再加上TCP/IP包頭后,所封裝的命令就會(huì)被看作是普通的IP數(shù)據(jù)包再IP網(wǎng)絡(luò)中進(jìn)行傳輸。iSCSI為基于IP協(xié)議的PDU提供了一個(gè)在SCSI的命令結(jié)構(gòu)內(nèi)映象的機(jī)制,SCSI的命令及參數(shù)被填充在一定長度的數(shù)據(jù)塊內(nèi)進(jìn)行傳輸。一個(gè)iSCSI翻譯器取得SCSICDB(命令描述塊),并將其映射為iSCSIPDU,在TCP連接上發(fā)送到一個(gè)目標(biāo)iSCSI設(shè)備。翻譯器通過連接ID識(shí)別一組映象SCSI連接的TCP連接。從啟動(dòng)設(shè)備和目標(biāo)設(shè)備的角度來看,它們就像是一個(gè)普通的SCSI通信一樣。啟動(dòng)設(shè)備或目標(biāo)設(shè)備可以是一個(gè)iSCSI設(shè)備,能夠用TCP直接在IP網(wǎng)中通信。在iSCSI啟動(dòng)器上用戶發(fā)起了一個(gè)SCSI請(qǐng)求,操作系統(tǒng)將請(qǐng)求處理為一條或多條SCSI指令,由HBA卡對(duì)指令或數(shù)據(jù)進(jìn)行封裝形成一個(gè)iSCSI報(bào)文,然后傳送給TCP/IP層,由TCP/IP協(xié)議把iSCSI報(bào)文封裝成IP包并在網(wǎng)絡(luò)中傳輸。當(dāng)該報(bào)文到達(dá)目的端以后TCP/IP協(xié)議將數(shù)據(jù)包進(jìn)行解封裝,形成一個(gè)iSCSI報(bào)文,再由目的SCSI卡將iSCSI包還原為SCSI指令,交由操作系統(tǒng)處理。SCSI協(xié)議的會(huì)話就是在一個(gè)網(wǎng)絡(luò)上封包和解包的過程。在網(wǎng)絡(luò)的一端,數(shù)據(jù)包被封裝成包括TCP/IP頭、iSCSI識(shí)別包和SCSI數(shù)據(jù)三部分內(nèi)容。在傳輸網(wǎng)絡(luò)另一端時(shí),這三部分內(nèi)容分別被有序的解開。啟動(dòng)設(shè)備可以通過下列方法發(fā)現(xiàn)目標(biāo)設(shè)備。在啟動(dòng)設(shè)備上設(shè)置目標(biāo)設(shè)備的地址。在啟動(dòng)設(shè)備上設(shè)置默認(rèn)目標(biāo)設(shè)備地址,啟動(dòng)設(shè)備可通過“SendTargets”命令從默認(rèn)目標(biāo)設(shè)備上獲取iSCSI名字列表。發(fā)出服務(wù)定位協(xié)議(SLP)廣播請(qǐng)求,等待目標(biāo)設(shè)備回應(yīng)。查詢存儲(chǔ)設(shè)備名字服務(wù)器,獲取可訪問的目標(biāo)設(shè)備列表。iSCSI有兩種會(huì)話,分別是Discovery會(huì)話和Normal會(huì)話。Discovery會(huì)話僅用于iSCSITargetdiscovery而建立的會(huì)話,Target只能接收帶有SendTarget關(guān)鍵字的TextRequest報(bào)文和原因是“Closethesession”的LogoutRequest報(bào)文,除此以外的其它報(bào)文都會(huì)被拒絕接收。而Normal會(huì)話是無限制會(huì)話,iSCSI無需執(zhí)行SendTarget命令發(fā)現(xiàn)請(qǐng)求,iSCSIInitiator直接使用iSCSITarget的名字來建立iSCSI會(huì)話,會(huì)話建立后可執(zhí)行iSCSI完整功能,具有三個(gè)階段:登錄階段完整功能階段登出階段在建立iSCSI會(huì)話前會(huì)先建立TCP連接,TCP連接是通過三次握手工程來建立的。而Discovery會(huì)話的建立分為三個(gè)階段,首先是Initiator和Target之間的登錄參數(shù)協(xié)商階段,Initiator發(fā)送LoginRequest報(bào)文請(qǐng)求登錄,Target在收到請(qǐng)求信息后返回LoginResponse報(bào)文給Initiator,同意Initiator登錄,從而完成初步的登錄協(xié)商。在登錄之后,傳送數(shù)據(jù)之前還需要進(jìn)行一次從參數(shù)的協(xié)商,這個(gè)過程被稱為完整功能態(tài)下的參數(shù)協(xié)商。最后再由Initiator發(fā)送SentTarget命令請(qǐng)求報(bào)文TextRequest,Target端收到請(qǐng)求報(bào)文以后,查詢到網(wǎng)絡(luò)中存在的iSCSI信息后發(fā)送TextResponse報(bào)文給Initiator,并返回一系列和它相連的iSCSITarget的信息,最終建立會(huì)話。iSCSI會(huì)話的各個(gè)階段如下。登錄階段:初始化登錄階段、安全認(rèn)證階段和操作協(xié)商完整功能階段登出階段iSCSI的登錄階段等同于FC端口登錄過程。該過程用來在兩個(gè)網(wǎng)絡(luò)實(shí)體調(diào)節(jié)中調(diào)整各個(gè)參數(shù)并確認(rèn)登錄器的訪問權(quán)限。如果iSCSI登錄階段成功完成,目標(biāo)設(shè)備將確認(rèn)啟動(dòng)設(shè)備的登錄,否則登錄將不確認(rèn),同時(shí)TCP連接中斷。登錄一旦確認(rèn),iSCSI會(huì)話將進(jìn)入完整功能階段。如果建立了多個(gè)TCP連接,iSCSI將要求每個(gè)命令/響應(yīng)對(duì)應(yīng)一個(gè)TCP連接。但是,不同的數(shù)據(jù)傳輸可以在一個(gè)會(huì)話中通過不同的TCP連接。在數(shù)據(jù)傳送端,啟動(dòng)器發(fā)送/接收最新的數(shù)據(jù),而目標(biāo)器在完成數(shù)據(jù)傳輸后發(fā)送確認(rèn)響應(yīng)。iSCSI注銷命令用來完成一個(gè)會(huì)話,在出現(xiàn)連接錯(cuò)誤的時(shí)候也會(huì)發(fā)送它,以實(shí)現(xiàn)連接中斷處理。iSCSI登錄是用來在啟動(dòng)設(shè)備和目標(biāo)設(shè)備之間建立TCP連接的機(jī)制。登錄的作用包括鑒別通信雙方,協(xié)商會(huì)話參數(shù),打開相關(guān)安全協(xié)議并且給屬于該會(huì)話的連接作標(biāo)志。登錄過程完成后,iSCSI會(huì)話進(jìn)入全功能態(tài)(FullFeaturePhase),這時(shí)啟動(dòng)設(shè)備就能通過iSCSI協(xié)議訪問目標(biāo)設(shè)備里的各邏輯單元了。iSCSI會(huì)話拆除時(shí),Initiator首先向Target發(fā)送LogoutRequest請(qǐng)求報(bào)文,Target接受到請(qǐng)求報(bào)文后返回相應(yīng)的LogoutResponse報(bào)文,至此,iSCSI會(huì)話可以拆除。在拆除iSCSI會(huì)話后還需要拆除TCP連接,TCP連接的拆除是通過四次握手來完成的。iSCSI協(xié)議與FC及其他協(xié)議相比具有一定的優(yōu)勢,也正因?yàn)槿绱耍玫接脩魪V泛的認(rèn)可。與光纖通道相比,在連接距離上比FC-SAN強(qiáng),它可突破FC-SAN目前10公里的極限,擴(kuò)展到整個(gè)WAN上。另外,iSCSI更加經(jīng)濟(jì),其成本的節(jié)約又體現(xiàn)在以下幾個(gè)方面:因?yàn)槭褂玫氖莻鹘y(tǒng)的IP,用戶又良好的使用基礎(chǔ),所以在培訓(xùn)方面的費(fèi)用可大大降低,而且也不必設(shè)立單獨(dú)的崗位。iSCSI可利用現(xiàn)有的、容易理解的TCP/IP基礎(chǔ)設(shè)施來構(gòu)建SAN,網(wǎng)絡(luò)部署成本也將大大降低。隨著千兆以太網(wǎng)的應(yīng)用,用戶將可得到傳輸速率為1Gbps的存儲(chǔ)網(wǎng)絡(luò),而不需改變現(xiàn)有的基礎(chǔ)設(shè)施,在維護(hù)和管理方面同樣可降低成本。相對(duì)其他協(xié)議來說,iSCSI技術(shù)具有如下優(yōu)勢。帶寬高:隨著技術(shù)的進(jìn)步,IP網(wǎng)絡(luò)的帶寬的發(fā)展相當(dāng)迅速,1Gbps的以太網(wǎng)早已大量占據(jù)市場,10Gbps以太網(wǎng)的應(yīng)用也已開始啟動(dòng)。而且,該協(xié)議得到IBM、Cisco、Intel、Brocade和Adaptec等業(yè)界廠商的支持,發(fā)展前景良好??捎眯詮?qiáng):在技術(shù)實(shí)施方面,iSCSI以穩(wěn)健、有效的IP及以太網(wǎng)架構(gòu)為骨干,使網(wǎng)絡(luò)的可用性大大增強(qiáng)。功能強(qiáng):完全解決了數(shù)據(jù)遠(yuǎn)程復(fù)制(DataReplication)及災(zāi)難恢復(fù)(DisasterRecovery)的難題。安全性高:以往的FC-SAN及DAS大都是在管制的環(huán)境內(nèi),安全要求相對(duì)較低。iSCSI卻將這種概念顛倒過來,讓存儲(chǔ)的數(shù)據(jù)在互聯(lián)網(wǎng)內(nèi)流通,令用戶感到需要提升安全要求。而iSCSI已內(nèi)建了支持IPSec的機(jī)制,并且在芯片層面執(zhí)行有關(guān)指令,確保了安全性。當(dāng)然iSCSI也不是完美的,作為一種比較新的技術(shù),它還是有很多地方有待改進(jìn)。與FC-SAN的融合性問題:iSCSI封裝的是SCSI協(xié)議,與其他的存儲(chǔ)協(xié)議如FC協(xié)議不兼容,因此與目前流行的FC-SAN的融合問題還沒有解決。硬件iSCSI適配卡較貴:如果想要讓整體效能有好的表現(xiàn),那么就必須添置較貴的iSCSIHBA卡或稍貴的TOEHBA卡(TCPOffloadEngine),整體成本會(huì)因而大幅攀升。無法兼顧效能及跨平臺(tái)性:就效能而言,Initiator驅(qū)動(dòng)程序最差、TOE居中、iSCSIHBA卡最佳。但是iSCSIHBA只能走iSCSI協(xié)議,而無法透過NFS或CIFS等協(xié)議與應(yīng)用服務(wù)器溝通。但I(xiàn)nitiator驅(qū)動(dòng)程序及TOE則同時(shí)支持iSCSI、NFS及CIFS三種協(xié)議。iSCSI的出現(xiàn)具有重要意義。iSCSI在連通性上給存儲(chǔ)應(yīng)用帶來了極大的優(yōu)勢,iSCSI-FC存儲(chǔ)路由器和iSCSI轉(zhuǎn)換器的轉(zhuǎn)換端口將為FC-SAN和支持FC的存儲(chǔ)網(wǎng)絡(luò)提供必要的IP接入能力。

iSCSI設(shè)備的主機(jī)接口一般默認(rèn)都是IP接口,可以直接與以太網(wǎng)絡(luò)交換機(jī)和iSCSI交換機(jī)連接,形成一個(gè)存儲(chǔ)區(qū)域網(wǎng)絡(luò)。根據(jù)主機(jī)端HBA卡、網(wǎng)絡(luò)交換機(jī)的不同,iSCSI設(shè)備與主機(jī)之間有三種連接方式。以太網(wǎng)卡+I(xiàn)nitiator軟件方式:采用通用以太網(wǎng)卡實(shí)現(xiàn)網(wǎng)絡(luò)連接,主機(jī)CPU通過運(yùn)行軟件完成iSCSI層和TCP/IP協(xié)議棧的功能。由于采用標(biāo)準(zhǔn)網(wǎng)卡,因此這種方式的硬件成本最低。但主機(jī)的運(yùn)行開銷大大增加,造成主機(jī)系統(tǒng)性能下降。實(shí)驗(yàn)證明,檔通信量增大時(shí),主機(jī)CPU的利用率可達(dá)90%以上。硬件TOE網(wǎng)卡+I(xiàn)nitiator軟件方式:采用特定的智能網(wǎng)卡,iSCSI層的功能由主機(jī)來完成,而TCP/IP協(xié)議棧的功能由網(wǎng)卡來完成。與純軟件方式相比,部分降低了主機(jī)的運(yùn)行開銷。iSCSIHBA卡實(shí)現(xiàn)方式:iSCSI層和TCP/IP協(xié)議棧的功能均由主機(jī)總線適配器來完成,對(duì)主機(jī)CPU的需求最少。以太網(wǎng)卡+initiator軟件實(shí)現(xiàn)方式:服務(wù)器、工作站等主機(jī)設(shè)備使用標(biāo)準(zhǔn)的以太網(wǎng)卡,通過以太網(wǎng)線直接與以太網(wǎng)交換機(jī)連接,iSCSI存儲(chǔ)也通過以太網(wǎng)線連接到以太網(wǎng)交換機(jī)上,或直接連接到主機(jī)的以太網(wǎng)卡上。在主機(jī)上安裝Initiator軟件以便將以太網(wǎng)卡虛擬為iSCSI卡,用以接收和發(fā)送iSCSI數(shù)據(jù)報(bào)文,從而實(shí)現(xiàn)主機(jī)和iSCSI設(shè)備之間的iSCSI協(xié)議和TCP/IP協(xié)議傳輸功能。由于采用普通的標(biāo)準(zhǔn)以太網(wǎng)卡和以太網(wǎng)交換機(jī),無需額外配置適配器,因此此種方式硬件成本最低。缺點(diǎn)是進(jìn)行ISCSI包文和TCP/IP包文轉(zhuǎn)換需要占用主機(jī)端的資源,使主機(jī)的運(yùn)行開銷增加而導(dǎo)致系統(tǒng)性能下降。不過在對(duì)于I/O和帶寬性能要求較低的應(yīng)用環(huán)境中基本能夠滿足數(shù)據(jù)訪問要求。智能iSCSI網(wǎng)卡+initiator軟件實(shí)現(xiàn)方式:智能以太網(wǎng)卡可以將網(wǎng)絡(luò)數(shù)據(jù)流量的處理工作全部轉(zhuǎn)到網(wǎng)卡上的集成硬件中進(jìn)行,TCP/IP協(xié)議棧功能由TOE網(wǎng)卡完成,而iSCSI層的功能仍舊由主機(jī)來完成,由此,采用TOE網(wǎng)卡可以大幅度提高數(shù)據(jù)的傳輸速率。與純軟件的方式相比較而言,這種方式部分降低了主機(jī)系統(tǒng)的運(yùn)行開銷而又不會(huì)使網(wǎng)絡(luò)構(gòu)建成本過多增加,是一種比較折衷的配置方案。iSCSIHBA卡連接方式:在主機(jī)上安裝iSCSIHBA適配卡,從而實(shí)現(xiàn)主機(jī)與交換機(jī)之間、主機(jī)與存儲(chǔ)設(shè)備之間的高效數(shù)據(jù)交換。iSCSI層和TCP/IP協(xié)議棧的功能均由主機(jī)總線適配器(HBA)來完成,對(duì)主機(jī)CPU的占用最少。這種方式數(shù)據(jù)傳輸性能最好,但是系統(tǒng)構(gòu)建價(jià)格也最高。iSCSI存儲(chǔ)設(shè)備和SCSI存儲(chǔ)和FC存儲(chǔ)一樣,通過DAS解決方案,使用連接線纜與主機(jī)上的HBA卡連接,作為主機(jī)的直接連接存儲(chǔ)設(shè)備來使用。SCSI存儲(chǔ)設(shè)備的卷由服務(wù)器或NAS網(wǎng)關(guān)來管理和使用,網(wǎng)絡(luò)中的工作站通過服務(wù)器或是NAS網(wǎng)關(guān)來訪問iSCSI存儲(chǔ)設(shè)備上的數(shù)據(jù)。整個(gè)系統(tǒng)的構(gòu)建和安裝簡單方便,服務(wù)器和NAS網(wǎng)關(guān)很容易實(shí)現(xiàn)數(shù)據(jù)在網(wǎng)絡(luò)中的共享訪問。但服務(wù)器和NAS網(wǎng)關(guān)直接影響整體存儲(chǔ)網(wǎng)絡(luò)系統(tǒng)的性能,所以,配置較低的服務(wù)器和NAS網(wǎng)關(guān)可能會(huì)成為整個(gè)系統(tǒng)的性能瓶頸。使用iSCSI構(gòu)建的IP-SAN和FC-SAN一樣具備良好的擴(kuò)展性和靈活性,可通過網(wǎng)絡(luò)交換設(shè)備與多臺(tái)主機(jī)連接。通過網(wǎng)絡(luò)交換設(shè)備連接時(shí),iSCSI存儲(chǔ)上的LUN對(duì)于主機(jī)而言相當(dāng)于裸設(shè)備,因此需要注意文件系統(tǒng)的管理問題。iSCSI設(shè)備上創(chuàng)建多個(gè)LUN,不同的LUN劃分給不同的主機(jī),使得各主機(jī)可以分別管理和訪問自己的LUN這就相當(dāng)于將網(wǎng)絡(luò)中多個(gè)主機(jī)的本地磁盤集中放置在一個(gè)網(wǎng)絡(luò)化的存儲(chǔ)設(shè)備中,主機(jī)之間實(shí)現(xiàn)存儲(chǔ)硬件設(shè)備的共享。由于FC-SAN自身架構(gòu)的缺陷導(dǎo)致SAN存儲(chǔ)應(yīng)用無法廣泛普及開來,所以在FC-SAN的基礎(chǔ)上又衍生出了許多新的存儲(chǔ)協(xié)議和標(biāo)準(zhǔn)以擴(kuò)大SAN的應(yīng)用范圍。在高端存儲(chǔ)應(yīng)用中,F(xiàn)C-SAN被部署較多,但是FC技術(shù)本身的局限性導(dǎo)致了企業(yè)信息存儲(chǔ)點(diǎn)的分散。FCIP就是為了將這些分散的存儲(chǔ)點(diǎn)連接起來產(chǎn)生的一種新技術(shù)。FCIP(FiberChanneloverIP,基于IP協(xié)議的光纖通道)是基于IP協(xié)議的光纖通道方案,是由Brocade、Gadzoox、Lucent、McData以及Qlogic公司共同提出的。FCIP這一技術(shù)的核心,是把光纖通道協(xié)議的數(shù)據(jù)幀封裝在IP數(shù)據(jù)包里,以便在覆蓋廣闊的TCP/IP網(wǎng)絡(luò)中進(jìn)行傳遞。網(wǎng)絡(luò)中的其它設(shè)備接收后,由專門設(shè)備進(jìn)行解封裝還原。FCIP協(xié)議實(shí)質(zhì)上就是采用隧道技術(shù)的IP-SAN方案。采用FCIP技術(shù)可以實(shí)現(xiàn)利用目前的IP網(wǎng)絡(luò)來連接兩個(gè)異地的FC-SAN,以解決FC-SAN之間的互聯(lián)問題。這一隧道傳輸技術(shù)是通過使用FCIP網(wǎng)關(guān)來實(shí)現(xiàn)的,通過光纖通道交換機(jī)的擴(kuò)展端口連接到每個(gè)SAN上,所有發(fā)往遠(yuǎn)程站點(diǎn)的存儲(chǔ)數(shù)據(jù)均通過公用的隧道。接收端的光纖通道交換機(jī)負(fù)責(zé)引導(dǎo)每個(gè)幀前往適當(dāng)?shù)墓饫w通道端點(diǎn)設(shè)備。FCIP協(xié)議是一種隧道協(xié)議(tunnel),IP地址和TCP連接只用在位于IP網(wǎng)絡(luò)重點(diǎn)的FCIP網(wǎng)關(guān)設(shè)備上。FCIP能夠?yàn)閮蓚€(gè)FC-SAN之間提供IP連接,但是不能為兩個(gè)獨(dú)立的FC存儲(chǔ)設(shè)備提供IP連接,即FCIP不能用于利用IP協(xié)議做FC存儲(chǔ)設(shè)備的端到端連接。FCIP協(xié)議利用IP網(wǎng)絡(luò)中創(chuàng)建的“隧道”在兩個(gè)FC-SAN網(wǎng)絡(luò)之間實(shí)現(xiàn)FC協(xié)議的數(shù)據(jù)傳輸,將真正意義上的遠(yuǎn)程數(shù)據(jù)鏡像和FC-SAN的靈活性以及IP網(wǎng)絡(luò)的低成本和易用性結(jié)合在一起,降低了遠(yuǎn)程操作的成本和操作的復(fù)雜性。FCIP提供了在TCP/IP協(xié)議中封裝FC協(xié)議數(shù)據(jù)幀的方法,消除了FC目前存在的距離限制,允許通過IP網(wǎng)絡(luò)來互聯(lián)FC-SAN,使得數(shù)據(jù)的訪問變得更加靈活,存儲(chǔ)策略的部署更加容易。FCIP協(xié)議是一個(gè)點(diǎn)到點(diǎn)的隧道封裝協(xié)議,它可以實(shí)現(xiàn)多個(gè)本地FC-SAN網(wǎng)絡(luò)經(jīng)由FCIP網(wǎng)關(guān)通過IP

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論