《存儲技術(shù)基礎(chǔ)》課件第4章_第1頁
《存儲技術(shù)基礎(chǔ)》課件第4章_第2頁
《存儲技術(shù)基礎(chǔ)》課件第4章_第3頁
《存儲技術(shù)基礎(chǔ)》課件第4章_第4頁
《存儲技術(shù)基礎(chǔ)》課件第4章_第5頁
已閱讀5頁,還剩107頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第四章存儲系統(tǒng)結(jié)構(gòu)4.1主機環(huán)境4.2連接關(guān)系4.3磁盤陣列4.4磁盤存儲系統(tǒng)

小結(jié) 4.1主機環(huán)境

在多數(shù)存儲系統(tǒng)中,主機負(fù)責(zé)提出數(shù)據(jù)讀/寫的請求。那么本節(jié)將主要討論主機環(huán)境中的軟件和硬件元素,以及使這些元素正常工作的關(guān)鍵協(xié)議和概念。使得對數(shù)據(jù)在該環(huán)境中流動建立相應(yīng)的概念。

構(gòu)成主機環(huán)境的設(shè)備可以是非常小的筆記本電腦,也可以是比較大的設(shè)備,如服務(wù)器、服務(wù)器群、大型機,或是它們的組合。主機系統(tǒng)應(yīng)具有硬件(物理)和軟件(邏輯)部件。圖4.1給出了幾種構(gòu)成主機環(huán)境的計算機資源。接下來首先說明硬件部件的情況。圖4.1構(gòu)成主機環(huán)境的計算機資源

1.主機的硬件組成

主機由以下三個主要的硬件構(gòu)成:中央處理單元(CentralProcessUnit,CPU)、存儲設(shè)備(Storage)(包括內(nèi)部存儲和磁盤設(shè)備)、輸入/輸出設(shè)備(Input/OutputDevices)。三者直接通過總線或者通信通路連接起來。圖4.2給出了主機的物理部件。圖4.2主機物理部件

1)中央處理單元

中央處理單元也包括三個主要部分,即算術(shù)邏輯單元(ArithmeticLogicUnit,ALU)、寄存器組(一組超高速的存儲位置)、1級高速緩沖存儲器(Level1Cache,L1)。三者間也通過總線進行互聯(lián)。圖4.3給出了CPU的基本結(jié)構(gòu)。圖4.3中央處理單元結(jié)構(gòu)

2)存儲設(shè)備

主機的存儲設(shè)備可以由半導(dǎo)體器件或者磁盤/光盤等介質(zhì)存儲器構(gòu)成。內(nèi)存就是主要由半導(dǎo)體器件構(gòu)成的顯著實例。通常,主機系統(tǒng)中存在隨機獲取的存儲器(RAM)和只讀存儲器兩種形式。當(dāng)代主機可以構(gòu)建容量在16GB或者更大的內(nèi)存系統(tǒng)。而硬盤、CDROM/DVDROM、軟盤和磁帶則是主要的介質(zhì)存儲器。

在任意主機系統(tǒng)中,通常存在不同類型的存儲設(shè)備,每種類型都有不同的速度、成本和容量特征。一般來講,越是高速的工藝,其成本越高而且越稀少。圖4.4給出了不同類型存儲器成本—速度曲線,由此可見,隨著速度的減慢,存儲器的成本也在下降。

圖4.4不同類型存儲成本—速度關(guān)系

3)輸入/輸出設(shè)備

輸入/輸出設(shè)備負(fù)責(zé)主機與外部進行發(fā)送和接收數(shù)據(jù)。輸入/輸出設(shè)備可以分為人機,接口輸入/輸出設(shè)備、計算機間的輸入/輸出設(shè)備和計算機與外設(shè)間輸入/輸出設(shè)備三種。其中,鍵盤接口、鼠標(biāo)接口和監(jiān)視器接口屬于人機間接口輸入/輸出設(shè)備,網(wǎng)絡(luò)接口卡屬于計算機間的輸入/輸出設(shè)備,USB、主機總線適配器(HostBusAdapter,HBA)則屬于計算機與外設(shè)間的輸入/輸出設(shè)備。

2.主機的軟件組成

構(gòu)成主機的邏輯部件主要指系統(tǒng)的軟件組成,圖4.5給出了其具體結(jié)構(gòu)的組成原理圖。圖4.5主機邏輯部件的組成原理圖

1)軟件部件

主機系統(tǒng)通常包括的軟件部件有:應(yīng)用程序、操作系統(tǒng)、文件系統(tǒng)及設(shè)備驅(qū)動。具體如下:

(1)應(yīng)用程序。應(yīng)用程序提供在用戶與主機間或者主機與其他系統(tǒng)間的交互點。多數(shù)應(yīng)用都有存儲需求,這些存儲或者短期或者長期依賴于應(yīng)用程序。

(2)操作系統(tǒng)。操作系統(tǒng)控制計算機環(huán)境的所有方面,管理所有系統(tǒng)硬件部件的內(nèi)部操作和用戶接口。其主要功能包括:

控制應(yīng)用程序與存儲系統(tǒng)間的交互;

檢測并響應(yīng)用戶的動作和系統(tǒng)狀態(tài);

將硬件部件連接到應(yīng)用程序?qū)雍陀脩簦?/p>

管理系統(tǒng)的活動,例如存儲和通信動作。

(3)文件系統(tǒng)。文件系統(tǒng)提供數(shù)據(jù)的邏輯結(jié)構(gòu)以及存取數(shù)據(jù)的方法。

(4)設(shè)備驅(qū)動。設(shè)備驅(qū)動允許操作系統(tǒng)偵測并使用標(biāo)準(zhǔn)接口存取和控制特定設(shè)備,如打印機、揚聲器、鼠標(biāo)、鍵盤、視頻設(shè)備和存儲設(shè)備等。設(shè)備驅(qū)動提供適當(dāng)?shù)膮f(xié)議使主機能夠訪問設(shè)備。

2)組成原理

對于存儲而言,文件系統(tǒng)是必須的組織方式??梢哉J(rèn)為文件系統(tǒng)是基于主機的邏輯結(jié)構(gòu)和控制讀/寫數(shù)據(jù)存儲軟件例程的通用名稱。文件系統(tǒng)塊是文件數(shù)據(jù)的最小容器。每個文件系統(tǒng)塊是由物理磁盤容量中的臨近區(qū)域構(gòu)成。具體文件系統(tǒng)塊的大小由所存儲的文件類型確定。通常其大小由操作系統(tǒng)在存儲系統(tǒng)配置階段設(shè)置。由于多數(shù)文件本身都比預(yù)定的文件系統(tǒng)塊大,文件包含的數(shù)據(jù)通常都是分布在多個文件系統(tǒng)塊中。但是,包含所有文件數(shù)據(jù)的文件系統(tǒng)塊卻不一定都在一個物理磁盤上連續(xù)存放。當(dāng)辨識存儲于文件中的數(shù)據(jù)時,文件組織結(jié)構(gòu)對用戶而言非常重要。主機僅對存儲在文件塊中的數(shù)據(jù)進行處理,文件系統(tǒng)負(fù)責(zé)將用戶的邏輯結(jié)構(gòu)轉(zhuǎn)化為主機可獲取的塊形式。在多用戶多任務(wù)的環(huán)境中,文件系統(tǒng)通過以下的方式管理存儲資源:

(1)目錄、路徑和結(jié)構(gòu)用來表示文件的位置;

(2)卷管理方式掩蓋復(fù)雜的物理磁盤結(jié)構(gòu);

(3)通過文件的加鎖方式控制對文件的獲取以及有可能競爭的用戶和程序?qū)ξ募淖x寫數(shù)據(jù)流。

數(shù)據(jù)庫和數(shù)據(jù)管理部件指大型、共享關(guān)系數(shù)據(jù)庫以及共享數(shù)據(jù)存儲的管理。主機上保存的文件隨著時間的推移會越來越多,必須考慮采用有效的管理方式方便用戶使用。與線性或者平鋪結(jié)構(gòu)管理不同,文件系統(tǒng)被劃分為不同的目錄,或者在Windows環(huán)境下稱為文件夾方式進行管理。下面簡單說明目錄結(jié)構(gòu)的特點:

(1)目錄是文件的容器,能包括文件也可以包括其他目錄。

(2)目錄不僅保存文件而且保存文件的屬性信息。實質(zhì)上一個目錄就是一個特殊類型的文件,在該文件中包含目錄中文件的列表及對應(yīng)的元數(shù)據(jù)(文件的信息數(shù)據(jù))。當(dāng)用戶試圖通過名稱訪問特定文件時,該名稱將在目錄中查找相應(yīng)文件的入口。在文件入口處可以獲得具體的元數(shù)據(jù)。在UNIX系統(tǒng)下,元數(shù)據(jù)包括文件的類型和權(quán)限、鏈接數(shù)、文件的擁有者和組標(biāo)識、文件字節(jié)大小、最后一次文件獲取時間、最后一次文件修改時間等。在Windows系統(tǒng)下,元數(shù)據(jù)包括時間戳和鏈接計數(shù)、文件名、讀/寫權(quán)限、文件數(shù)據(jù)、索引信息和卷信息。根據(jù)文件系統(tǒng)中是否保存日志可以分為無日志文件系統(tǒng)和有日志文件系統(tǒng)。因為無日志文件系統(tǒng)有可能采用獨立的寫操作更新文件數(shù)據(jù)和元數(shù)據(jù),所以文件系統(tǒng)有丟失文件的可能。如果在寫操作時系統(tǒng)發(fā)生故障,元數(shù)據(jù)和數(shù)據(jù)本身很有可能丟失或損壞。當(dāng)系統(tǒng)重新啟動時,文件系統(tǒng)將通過檢查修復(fù)方式更新元數(shù)據(jù)結(jié)構(gòu)。這種操作對大型文件系統(tǒng)將非常耗時。如果在重建需要的結(jié)構(gòu)信息不夠時,文件將會錯誤存放或者丟失。

日志文件系統(tǒng)采用單獨的日志區(qū)域保存運行的記錄。日志可以保存所有寫操作的數(shù)據(jù),即物理日志;或者僅保存將要更新的元數(shù)據(jù),即邏輯日志。在對文件系統(tǒng)修改之前,這些修改將先寫入獨立的日志區(qū)。當(dāng)日志更新后,對文件系統(tǒng)的操作才能進行。如果在操作過程中出現(xiàn)系統(tǒng)故障,可通過日志信息恢復(fù)相應(yīng)操作。日志方式可以實現(xiàn)對文件系統(tǒng)快速地檢查操作,即僅查看大文件系統(tǒng)中活躍的近期的文件操作。而且由于對操作的信息逐一記錄,文件丟失的危險大大降低。日志文件系統(tǒng)的缺點就是比其他文件系統(tǒng)操作速度慢。這種速度的下降是由于對文件的操作多了寫日志的過程。

文件系統(tǒng)另一個重要方面就是卷管理。其實卷管理是在文件系統(tǒng)與物理磁盤之間的一個可選的中間層。卷可以將幾個小磁盤組成一個大容量虛擬磁盤,并使給虛擬磁盤對高級程序和應(yīng)用可見。采用卷方式可以優(yōu)化對存儲的操作以及簡化存儲資源的管理。主機總線適配器(HBA)負(fù)責(zé)將主機與存儲設(shè)備連接起來。HBA通常以接插件的形式或者主板上繼承芯片的形式連接到系統(tǒng)。在HBA上的端口將是主機與存儲系統(tǒng)互聯(lián)的邏輯接口。主機中可以存在多個HBA,一般HBA也具有一定的存儲命令處理能力,使得主機的CPU負(fù)載能夠降低。對于大規(guī)模的計算環(huán)境,通常要求關(guān)鍵數(shù)據(jù)應(yīng)能不間斷讀取。為了支持這項要求,主機往往通過如下方式設(shè)置實現(xiàn):

(1)設(shè)置多個HBA實現(xiàn)主機與存儲設(shè)備通路的冗余備份;

(2)采用多路徑軟件方式編寫程序。多路徑軟件是運行于服務(wù)器上具有增強可獲性能力的軟件解決方式。多路徑軟件可以利用多個HBA選擇主機與存儲設(shè)備間的冗余通路以提供多種I/O通路和路徑接管能力,并且能實現(xiàn)自動負(fù)載平衡。多路徑軟件可以在路徑故障情況下實現(xiàn)不間斷數(shù)據(jù)傳輸。集群采用冗余的主機系統(tǒng)互聯(lián)方式構(gòu)成。當(dāng)集群中某個主機失效時,其功能可以有生存的成員繼續(xù)完成。集群的成員可以以透明方式配置接管其他成員的負(fù)載,而這種過程對用戶而言僅有微小的影響,甚至沒有影響。

至此,對于主機環(huán)境和文件系統(tǒng)的概念部分已經(jīng)介紹完成。下面通過一個實例來考察文件是如何在系統(tǒng)中進行操作的。圖4.6給出了詳細(xì)的流程。圖4.6文件操作實例

4.2連接關(guān)系

上一節(jié)中我們給出了有關(guān)主機環(huán)境的內(nèi)容,那么在本節(jié)中將主要介紹主機與存儲系統(tǒng)間如何進行互聯(lián),以及相互間通信的邏輯協(xié)議,主要通過總線和具體協(xié)議進行說明。

具有內(nèi)部存儲的主機可以是筆記本電腦或者巨型企業(yè)服務(wù)器。圖4.7說明了基本部件連接關(guān)系。圖4.7具有內(nèi)部存儲的主機

1.總線

總線指為了實現(xiàn)計算機一個部件與其他部件間進行數(shù)據(jù)傳輸而設(shè)置的數(shù)據(jù)通路集合。物理部件在設(shè)備間通過發(fā)送數(shù)據(jù)包的形式利用總線進行通信。這些數(shù)據(jù)包可以利用串行通路或者并行通路。在串行通信中,各個數(shù)據(jù)位依次進行傳送。而并行通信中,數(shù)據(jù)位同時在冗余的通路上進行傳送。圖4.8說明了這兩種通信方式的傳輸形式。圖4.8串行/并行傳輸形式一般,在計算機系統(tǒng)中至少存在兩種類型的總線:系統(tǒng)總線,負(fù)責(zé)處理器與主存間的數(shù)據(jù)傳輸;局部總線或者I/O總線,負(fù)責(zé)外部設(shè)備與主機的數(shù)據(jù)傳輸,而局部總線則是直接連接到處理器的高速數(shù)據(jù)通路。

位寬,即總線的規(guī)模,是總線中非常重要的指標(biāo)。位寬決定了一次可以傳送的數(shù)據(jù)量。例如,16位總線能同時傳輸16位的數(shù)據(jù),而32位總線則能傳送32位的數(shù)據(jù)。形象地講,位寬就如同高速公路的并行車道數(shù)目。

總線都有用MHz衡量的時鐘速度指標(biāo)。高速總線能使得數(shù)據(jù)更快被傳送,也使得應(yīng)用程序運行更快。

2.協(xié)議

協(xié)議指定義好的通信格式,使得發(fā)送方和接收方設(shè)備能夠以約定方式通信。為系統(tǒng)中制定的通信協(xié)議包含的元素有:

緊密互聯(lián)的實體——如中央處理器與RAM,存儲緩沖器與控制器。這些互聯(lián)實體采用標(biāo)準(zhǔn)的總線技術(shù)進行工作。

直接護理的實體——指在中等距離上連接的設(shè)備,例如主機與打印機之間,主機與存儲器間(例如JBOD或DAS)。

網(wǎng)絡(luò)互聯(lián)的實體——例如網(wǎng)絡(luò)主機,NAS或者SAN。

用于局部總線和內(nèi)部磁盤系統(tǒng)互聯(lián)的協(xié)議包括:PCI、IDE/ATA以及SCSI。

PCI指外部設(shè)備互聯(lián)協(xié)議是一種定義在計算機內(nèi)部的局部總線協(xié)議。協(xié)議標(biāo)準(zhǔn)文本中詳細(xì)規(guī)范了如何進行PCI擴充卡(如網(wǎng)絡(luò)卡或調(diào)制解調(diào)器)的安裝及與中央處理器的交換信息。進一步地說,PCI包括:微處理器和連接設(shè)備的互連系統(tǒng),設(shè)備通過主機上各個插槽緊密聯(lián)系并進行高速數(shù)據(jù)傳輸。PCI協(xié)議具有即插即用功能,使得新卡的識別非常簡單,它可以進行32位或者64位的數(shù)據(jù)傳輸,可以達(dá)到133MB/s的吞吐率。

IDE/ATA協(xié)議指集成設(shè)備電子技術(shù)和高級互聯(lián)技術(shù),是目前廣泛應(yīng)用于現(xiàn)代磁盤接口的協(xié)議。IDE/ATA具有低成本高性能特點。

SCSI協(xié)議指小型計算機系統(tǒng)接口,是第二受到廣泛使用的磁盤接口協(xié)議。由于具有比IDE明顯的優(yōu)點,使其在諸如高端計算機的場合中得到了青睞。但是由于成本較高而且對于家庭用戶和商業(yè)桌面用戶來講并不需要新增的特點,使其并沒有IDE/ATA協(xié)議那么廣泛應(yīng)用。需要強調(diào)的是,SCSI協(xié)議是一種系統(tǒng)接口,能夠?qū)崿F(xiàn)設(shè)備與PC或者其他系統(tǒng)的連接,并且采用并行的方式實現(xiàn)多個數(shù)據(jù)線的數(shù)據(jù)傳輸。目前,SCSI本身已經(jīng)得到了很大的拓展,使得其應(yīng)用范圍以不是單純的并行接口,而可以指相關(guān)技術(shù)和標(biāo)準(zhǔn)的寬泛

概念。

圖4.9給出了簡單的SCSI模型。圖4.9SCSI模型發(fā)起一次SCSI進行通信的設(shè)備稱為發(fā)起者,而為請求進行服務(wù)的SCSI設(shè)備成為目標(biāo)。如果發(fā)起者是主機,那么發(fā)起者會釋放通信連接并繼續(xù)處理其他事件而目標(biāo)則執(zhí)行接收到的命令。主機將等待來自于存儲設(shè)備的中斷信號以完成一次傳輸事務(wù)。SCSI通信的部件包括發(fā)起者標(biāo)識(InitiatorID),目標(biāo)標(biāo)識(TargetID)和邏輯單元號(LogicUnitNumbers,LUNs)。其中發(fā)起者標(biāo)識指對發(fā)起者的唯一標(biāo)號,也可以用作初始地址,目標(biāo)標(biāo)識(TargetID)指目標(biāo)的唯一標(biāo)號,用于與發(fā)起者進行交換命令和狀態(tài)的地址信息,而LUNs說明在某個目標(biāo)中的特定邏輯單元,邏輯單元可以不只單個磁盤。

SCSI協(xié)議尋址的方式就是依靠上述的標(biāo)識進行。圖4.10給出了SCSI協(xié)議尋址的具體實例。圖4.10SCSI尋址字段發(fā)起者標(biāo)識,即初始的發(fā)起者ID號,一般用作從存儲設(shè)備反饋的響應(yīng)信號。目標(biāo)標(biāo)識,用于特定存儲設(shè)備,即在諸如磁盤、磁帶和光盤中設(shè)定的接口地址。LUN指設(shè)備的邏輯單元號,反映了由目標(biāo)看到的設(shè)備真實地址。圖4.11給出了一個具體的實例。圖4.11SCSI尋址實例在該例中,主機使用的磁盤驅(qū)動器邏輯設(shè)備名稱可以是:cn|tn|dn。其中,cn指控制器號;tn指設(shè)備目標(biāo)號,例如t0,t1,t2等;dn指設(shè)備號,反映了設(shè)備單元的實際地址。因為目標(biāo)控制器通常僅連接單個磁盤,所以使用d0表示大多數(shù)SCSI磁盤。在智能存儲系統(tǒng)中,每個目標(biāo)可以尋址多個LUN。

下面我們總結(jié)SCSI的特點,如表4.1所示。表4.1SCSI協(xié)議特點表4.2則給出了IDE/ATA與SCSI的比較。表4.2IDE/ATA與SCSI的比較

3.光纖通道

光纖通道是一種用于網(wǎng)絡(luò)存儲環(huán)境中將服務(wù)器和共享存儲設(shè)備間的高速互聯(lián)方式。光纖通道部件一般包括HBA接口、集線器、交換機、電纜和磁盤。圖4.12說明了一般光纖通道的結(jié)構(gòu)。圖4.12光纖通道結(jié)構(gòu)光纖通道一般指用于通道各個元素間通信的軟件協(xié)議和硬件部件。在兩種最常見的外部存儲設(shè)備接口中(SCSI和光纖通道),SCSI通常用于主機內(nèi)部的存儲器件,而光纖通道一般不會用于內(nèi)部。SCSI的特點是:有限距離、有限設(shè)備數(shù)目、單一發(fā)起者、單端口驅(qū)動。光纖通道的特點是:遠(yuǎn)距離、在SAN網(wǎng)絡(luò)中可以有較多互連設(shè)備、支持多個發(fā)起者、雙端口驅(qū)動。

當(dāng)計算環(huán)境需要高速的互聯(lián)性,通常都會使用復(fù)雜的設(shè)備將主機和存儲設(shè)備連接起來。在網(wǎng)絡(luò)存儲環(huán)境中物理上互聯(lián)的部件包括:

(1)?HBA:主機總線適配器用于連接主機和存儲設(shè)備。

(2)光纜:光纖電纜可以增加傳輸距離,減少電纜體積。

(3)交換機:用于控制多個互連設(shè)備進行數(shù)據(jù)傳輸。

(4)導(dǎo)向器:具有高可用性部件的復(fù)雜交換機。

(5)橋:連接不同網(wǎng)絡(luò)部分的設(shè)備。

圖4.13給出了簡單的光纖通道互連的結(jié)構(gòu)形式。圖4.13光纖通道互連形式 4.3磁盤陣列

隨著計算機系統(tǒng)應(yīng)用的廣泛推廣,用戶對計算機速度和性能的要求也越來越高。在一個完整的計算機系統(tǒng)中,CPU和內(nèi)存的作用雖然重要,但是數(shù)據(jù)存儲設(shè)備的好壞和速度的快慢也直接影響到整個系統(tǒng)的速度和性能。早期,計算機數(shù)據(jù)存儲設(shè)備采用單盤方式,但是輔存的技術(shù)升級卻比較緩慢,這樣單盤系統(tǒng)在速度上就逐漸跟不上整個系統(tǒng)的要求。另外,單盤系統(tǒng)在較為惡劣的環(huán)境下存儲數(shù)據(jù)時安全性也存在一定的隱患。為此,磁盤存儲器設(shè)計人員意識到如果采用多盤方式進行數(shù)據(jù)存儲必將使單磁盤的技術(shù)提升得到累積,并且如果配合一定的數(shù)據(jù)保護措施,那么多盤方式將在速度和安全性方面優(yōu)于單盤系統(tǒng)?;诖怂悸罚_發(fā)出了獨立操作和并行處理的磁盤陣列系統(tǒng)。在這種系統(tǒng)上數(shù)據(jù)的存取分布在多個磁盤上,那么單一的I/O請求就可以并行進行。

最早的多盤系統(tǒng)思想出現(xiàn)在1987年美國加州大學(xué)伯克利分校的三位研究人員(Patterson、Gibson和Katz)發(fā)表的名為ACaseofRedundantArrayofInexpensiveDisks學(xué)術(shù)論文中,即廉價磁盤冗余陣列方案。這篇論文的主要思想就是將多個容量較小、相對廉價的硬盤驅(qū)動器進行有機組合,使其性能超過單價較貴的大容量硬盤。這一設(shè)計思想很快引起了重視,并且得到了實際上的應(yīng)用。隨著基于上述思想的多盤系統(tǒng)不斷出現(xiàn),需要對各種技術(shù)進行必要的規(guī)范并制定相應(yīng)的標(biāo)準(zhǔn),為此工業(yè)界通過了一個稱為RAID(RedundantArraysofIndependentDisks,獨立磁盤冗余陣列)的標(biāo)準(zhǔn)方案。根據(jù)RAID系統(tǒng)對磁盤數(shù)據(jù)分布以及校驗方式的不同,RAID系統(tǒng)可以分為7個級別(從RAID0~RAID6)。其中RAID0、RAID1、RAID3以及RAID5是較為常用的級別。

RAID磁盤陣列簡單的理解就是將多臺硬盤通過RAID控制器(基于軟件和硬件)結(jié)合成虛擬單臺大容量的硬盤使用。圖4.14給出了RAID的基本組織方式。RAID方案主要的特色就是在數(shù)據(jù)存取速度提高的同時提供了一定的容錯性,有效解決了冗余的要求。RAID系統(tǒng)使得多個磁盤系統(tǒng)并行工作,這樣增加了數(shù)據(jù)出錯的概率。為了對這種可靠性下降進行補償,RAID特別增加了奇偶校驗數(shù)據(jù)存儲以恢復(fù)由于某種噪音形成的數(shù)據(jù)丟失。圖4.14RAID的基本組織結(jié)構(gòu)為了對RAID系統(tǒng)進行說明,首先給出各種RAID系統(tǒng)整體性能的簡單描述。表4.3給出了各種RAID級的主要特點。表4.3各種RAID級的主要特點從數(shù)據(jù)處理和應(yīng)用的角度看,RAID0采用條帶化方式存取數(shù)據(jù),沒有進行冗余備份,這種方式只是在數(shù)據(jù)存儲方式的組織物理上沒有增加額外的新的存儲設(shè)備,適用于高性能非關(guān)鍵性數(shù)據(jù)的場合。RAID1采用鏡像方式存取數(shù)據(jù),是所存儲數(shù)據(jù)的一對一備份,適用于系統(tǒng)盤和非常重要文件的保存。RAID2和RAID3均采用并行處理方式存取數(shù)據(jù),其中RAID2采用漢明碼進行數(shù)據(jù)冗余校驗,而RAID3采用位交錯奇偶校驗進行數(shù)據(jù)冗余備份,兩者均適用于大容量的I/O請求應(yīng)用背景。RAID4、RAID5和RAID6均采用獨立存取的方式進行數(shù)據(jù)讀寫,其中RAID4采用塊交錯奇偶校驗,RAID5采用塊交錯分布奇偶校驗,而RAID6采用塊交錯雙分布奇偶校驗方式進行數(shù)據(jù)的冗余處理,RAID5適合于高請求速度,且讀集中的查詢應(yīng)用場合,RAID6則是針對要求極高的可靠性的應(yīng)用而設(shè)計。接下來,詳細(xì)介紹各種RAID系統(tǒng)的主要技術(shù)特點。

1.?RAID0級

因為RAID0沒有采用任何冗余方式進行存儲,所以RAID0嚴(yán)格地講不能算作RAID系列的成員。但是,對于某些應(yīng)用,例如超級計算機,性能和容量作為其基本的考慮,低成本要比可靠性重要。

在RAID0系統(tǒng)中,用戶和系統(tǒng)數(shù)據(jù)分布在磁盤陣列的所有盤面上。與單個大容量磁盤相比,其優(yōu)點主要是:如果兩個I/O請求同時等待不同的數(shù)據(jù)塊時,那么這些數(shù)據(jù)塊有可能分布在不同的磁盤上。這樣就可以并行處理這些請求,減少I/O的排隊時間。

圖4.15給出了RAID0的基本結(jié)構(gòu)。圖4.15RAID0的基本結(jié)構(gòu)

RAID0以及其他級別的陣列均采用條帶(Stripe)的形式在可用磁盤上分布存放數(shù)據(jù)。圖4.16給出了磁盤的條帶化存儲形式。用戶數(shù)據(jù)和系統(tǒng)數(shù)據(jù)被看成是存儲在一個邏輯磁盤上,磁盤以條帶的形式劃分,每個條帶是一些物理的塊、扇區(qū)或者其他基本單位。數(shù)據(jù)條帶以輪轉(zhuǎn)方式映射到連續(xù)的陣列磁盤中??梢远x每個磁盤映射一個條帶的一組邏輯連續(xù)的條帶定義為條帶集(Stripes)。在這些條帶上,數(shù)據(jù)是這樣組織的:在一個有n個磁盤的陣列中,第一組的n個邏輯條帶依次物理存儲在n個磁盤的第1個Stripe上,構(gòu)成第一個Stripe;第二組的n個邏輯條帶分布在每個磁盤的第2個條帶上形成第二個Stripe;按照同樣的組織形成更多的Stripe。這樣分布數(shù)據(jù)的特點就是,如果單個I/O請求由多個邏輯相鄰的條帶組成,則最多可以實現(xiàn)n個條帶的請求可以并行處理,提高I/O的吞吐率。圖4.16條帶化存儲形式在高速數(shù)據(jù)傳輸?shù)膽?yīng)用場合,由于RAID0沒有冗余備份,其性能主要取決于主機的請求方式以及數(shù)據(jù)分布。為了適應(yīng)高速傳輸要求,首先在主存和各個磁盤間應(yīng)存在高速的傳輸路徑,即在內(nèi)部控制總線、主系統(tǒng)I/O總線、I/O適配器和存儲總線上應(yīng)有高速路徑。其次,磁盤陣列I/O請求方式上如果是大量邏輯相鄰的數(shù)據(jù),則單個I/O請求可以實現(xiàn)多個磁盤的并行數(shù)據(jù)傳輸,系統(tǒng)效率將會大大提高。

如果每次I/O請求的數(shù)據(jù)量不大,但是請求的次數(shù)頻繁的情況發(fā)生。可以通過平衡多個磁盤中的I/O負(fù)載以提高I/O執(zhí)行速度。當(dāng)條帶的容量較大時,單個I/O請求就不會出現(xiàn)跨磁盤進行存取的情況,這樣就可以實現(xiàn)多個等待I/O的請求并行處理。從整體上減少每個請求的排隊時間。

2.?RAID1級

RAID1采用簡單的備份方式實現(xiàn)數(shù)據(jù)的冗余。與RAID0一樣,RAID1也采用數(shù)據(jù)條帶化分布存儲,但是每個邏輯條帶映射到兩個不同的物理磁盤組中,在磁盤陣列中每個磁盤均有一個包含相同數(shù)據(jù)的鏡像盤。圖4.17給出了RAID1的基本組織形式。圖4.17RAID1的基本組織形式

RAID1具有如下基本特點:

(1)讀請求可由包含請求數(shù)據(jù)的兩個磁盤中的某一個提供服務(wù),這樣就可以找到最小的尋道時間和旋轉(zhuǎn)延遲的磁盤以提高讀速率。

(2)寫請求需要更新兩個對應(yīng)的條帶,這種更新完全同步。因此,寫性能由兩個盤中較慢的寫來確定。RAID1的寫相對于其他級別的陣列沒有額外的操作,所以無“寫損失”。

(3)當(dāng)一個磁盤的數(shù)據(jù)被損壞,可以從另一個磁盤得到恢復(fù)。

(4)?RAID1價格較貴,需要支持兩倍于邏輯磁盤的磁盤空間。因此,RAID1的配置只限于存儲系統(tǒng)軟件、數(shù)據(jù)和關(guān)鍵文件的驅(qū)動器中。這種應(yīng)用情況下,RAID1可以提供數(shù)據(jù)的實時備份能力,如果數(shù)據(jù)有所損失,可以從備份盤中立即恢復(fù)。

(5)如果有大量的讀數(shù)據(jù)要求,則RAID1能實現(xiàn)高速的I/O速率,其性能可以達(dá)到RAID0的兩倍。然而,如果I/O請求中大部分是寫請求,那么其性能將與RAID0差不多。那么在讀請求的概率高的數(shù)據(jù)傳送密集型應(yīng)用中,RAID1提供了對RAID0改進的性能。

3.?RAID2級

RAID2采用并行存取陣列,所有磁盤成員都進行對I/O請求的執(zhí)行。通常情況下,各個驅(qū)動器的軸是同步旋轉(zhuǎn)的,這樣每個磁盤上的每個磁頭都在同一位置。圖4.18給出了RAID2的基本組織形式。

RAID2也采用數(shù)據(jù)條帶的方式進行存取,在RAID2中,條帶非常小,譬如一個字節(jié)或一個字。如圖4.18所示,各個數(shù)據(jù)盤上相應(yīng)位經(jīng)過校驗計算出保護位,將信息位和保護位分別存放在不同的磁盤上。通常有專用的磁盤用存儲保護位,而保護位則采用漢明編碼方式得到,這種編碼方式可以糾正一位錯誤,檢測出兩位錯誤。圖4.18RAID2的基本組織形式

4.?RAID3級

RAID3的存儲數(shù)據(jù)組織結(jié)構(gòu)與RAID2相類似,可以用圖4.18表示。但是與RAID2不同的是:無論磁盤陣列數(shù)目有多少,RAID3只需要單個冗余校驗盤。在RAID3中,數(shù)據(jù)分布在不同的較小的條帶上,并且進行并行方式讀寫操作;RAID3沒有采用糾錯碼而采用對所有數(shù)據(jù)盤上相同位置的數(shù)據(jù)進行奇偶方式校驗。

如果在RAID3陣列中某一個磁盤驅(qū)動器不能工作時,那么可以通過存取奇偶校驗盤的數(shù)據(jù)以及其他驅(qū)動器的數(shù)據(jù)來進行對出錯磁盤重構(gòu)數(shù)據(jù)。這樣,當(dāng)更換到不能工作的磁盤后,新的磁盤也能夠恢復(fù)原有的數(shù)據(jù)。

5.?RAID4級

從RAID4開始,磁盤陣列均采用了獨立的存儲技術(shù),每個磁盤陣列成員的操作是完全獨立的,各個I/O請求能夠并行完成。那么獨立存取方式將更適合于高速數(shù)據(jù)請求傳輸?shù)膽?yīng)用,而較少應(yīng)用于單次請求需要高速數(shù)據(jù)傳輸?shù)膱龊稀?/p>

RAID4同樣采用條帶方式存取數(shù)據(jù),但是其條帶的規(guī)模相對前面的RAID級要大一些。在RAID4中,通過每個數(shù)據(jù)盤上的相應(yīng)條帶數(shù)據(jù)對校驗盤上的數(shù)據(jù)進行計算。圖4.19給出了其基本結(jié)構(gòu)。圖4.19RAID4的基本結(jié)構(gòu)

6.?RAID5級

與RAID4的組織方式基本相似,RAID5也采用校驗的方式保護數(shù)據(jù),但是RAID5并沒有將校驗位集中在一個單獨的物理磁盤上,而是采用分布式的處理方式將校驗位存儲在不同的磁盤上。圖4.20給出了其基本結(jié)構(gòu)。圖4.20RAID5的基本結(jié)構(gòu)

7.?RAID6級

RAID6的基本思想就是進行兩種不同的奇偶計算,并將校驗數(shù)據(jù)分開存儲到不同的磁盤上。那么,如果用戶數(shù)據(jù)需要N個磁盤的陣列,則總的磁盤數(shù)目將是N+2。圖4.21是其基本結(jié)構(gòu)。

由圖4.21可見,P和Q是兩種不同的校驗數(shù)據(jù)算法

,可以認(rèn)為P就是RAID4和RAID5使用的異或計算式的校驗算法,而Q則是與之完全不相關(guān)的校驗算法。因此,即使兩個數(shù)據(jù)盤出現(xiàn)故障,也能夠恢復(fù)數(shù)據(jù)。

RAID6的優(yōu)點是提供了極高的數(shù)據(jù)可用性,只有當(dāng)3個磁盤都發(fā)生故障時,數(shù)據(jù)才會丟失。但是,RAID6的寫性能不高,這是因為進行了兩種奇偶校驗計算的結(jié)果所導(dǎo)致的。圖4.21RAID6的基本結(jié)構(gòu)在隨后的發(fā)展過程中,RAID7成為了新的磁盤陣列級。RAID7自身帶有智能化實時操作系統(tǒng)以及用于存儲管理的工具,而且完全與主機獨立運行。從某種角度看,RAID7可以認(rèn)為是一種存儲計算機,與其他RAID級具有明顯的區(qū)別,具有更高的性能。在眾多的RAID級中,用戶也可以根據(jù)自身的需要將各個級進行組合使用,如將RAID0和RAID1組合形成RAID0+1級或者RAID1+0級,將RAID5和RAID3組合形成RAID5+3級。圖4.22給出了RAID0+1級的基本結(jié)構(gòu)。圖4.22RAID0+1級的基本結(jié)構(gòu)

RAID0+1以RAID0的條帶化為基礎(chǔ),增加了在RAID1中采用的鏡像盤對每個條帶的數(shù)據(jù)塊都進行了有效備份。其明顯的特點在于對較小數(shù)據(jù)塊的高速輸入/輸出速率,且具有中等效果的磁盤數(shù)據(jù)可用性,但相同條帶上的數(shù)據(jù)發(fā)生了故障時,數(shù)據(jù)可以由鏡像盤得到恢復(fù)。這也說明了RAID0+1可以有限程度容忍對多個磁盤的故障。但是,RAID0+1需要雙倍的磁盤空間,其成本較高。在讀/寫方面,寫操作由于存在對鏡像的寫,速度比讀操作稍慢。RAID0+1可應(yīng)用于如圖像和文件服務(wù)器等環(huán)境中。與之對應(yīng)的RAID1+0的基本結(jié)構(gòu)如圖4.23所示。圖4.23RAID1+0基本結(jié)構(gòu)

8.?PC機構(gòu)建RAID陣列

目前在PC機上可以構(gòu)建基本的RAID系統(tǒng),如RAID0和RAID1。對于其他形式的RAID,由于要求的磁盤數(shù)目較多,在普通的個人計算機上并不常見。其中RAID0由于沒有備份的功能,對磁盤系統(tǒng)沒有特殊要求,RAID1則需要至少兩塊以上的相同容量硬盤以構(gòu)成鏡像盤。下面給出以兩塊60GB硬盤構(gòu)建RAID0和RAID1的具體步驟。

1)?RAID0

首先在構(gòu)建RAID0時磁盤原有數(shù)據(jù)將被破壞,因此應(yīng)將磁盤上原有的數(shù)據(jù)進行備份。備份完成后,準(zhǔn)備好Windows系統(tǒng)啟動盤。至此,可以開始RAID0設(shè)置。接下來,將兩塊硬盤通過跳線設(shè)置為Master,分別接到主板上的IDE3、IDE4接口上。RAID0會自動重建兩塊硬盤的分區(qū)表,無需考慮硬盤連接順序。然后,重新啟動計算機進入BIOS進行設(shè)置,打開ATARAIDCONTROLLER選項(這里主板必須集成如HighPoint370的RAID芯片控制器)。例如,在KT7A-RAID主板BIOS中進入INTEGRATEDPERIPHERALS選項并開啟ATA100RAIDIDECONTROLLER。設(shè)置完BIOS內(nèi)容后,重新啟動計算機,這時系統(tǒng)將不會檢測到發(fā)現(xiàn)硬盤,這是因為磁盤的管理由HighPoint370芯片接管。這時系統(tǒng)會提示進入HighPoint370的BIOS設(shè)置。當(dāng)進入HighPoint370BIOS設(shè)置界面后首先選擇創(chuàng)建RAID,即CreateRAID。在“ArrayMode(陣列模式)”中進行RAID級別選擇,可用的RAID級有0、1、0+1和Span。根據(jù)應(yīng)用要求,選擇RAID0項。當(dāng)選擇RAID0之后,需要設(shè)置磁盤驅(qū)動器,然后設(shè)置條帶單位大小,缺省為64KB。當(dāng)這些選項確認(rèn)后,接著“StartCreate”開始創(chuàng)建RAID0并指定BOOT啟動盤。退出BIOS設(shè)置重新啟動計算機,這時就可以在屏幕上看到“Striping(RAID0)forArray#0”的提示符。插入準(zhǔn)備好的啟動盤,啟動DOS??梢酝ㄟ^Fdisk程序查看磁盤系統(tǒng)情況,這時僅一個硬盤可見,RAID陣列已經(jīng)被看做單個硬盤。在操作系統(tǒng)級,RAID完全透明,一切讀寫操作都由控制芯片完成。在此基礎(chǔ)上,可以利用Fdisk進行磁盤分區(qū)。采用RAID0系統(tǒng)后,數(shù)據(jù)分布在兩個硬盤上,讀取數(shù)據(jù)將會變得更快,而且不會浪費磁盤空間。當(dāng)磁盤分區(qū)結(jié)束后,激活主分區(qū)安裝Windows操作系統(tǒng)。在安裝系統(tǒng)過程中,注意需要安裝磁盤控制器的驅(qū)動程序。當(dāng)操作系統(tǒng)已經(jīng)安裝成功后,用戶就可以在硬盤系統(tǒng)中實現(xiàn)RAID0方式的讀寫操作,正常情況下讀取數(shù)據(jù)的速度會提高許多。

2)?RAID1

RAID1的安裝設(shè)置過程基本與RAID0相似,?主要不同在于對RAID控制器的設(shè)置方面。當(dāng)進入到RAID控制器HighPoint370BIOS后選擇創(chuàng)建RAID時,首先選擇“ArrayMode”進入模式并選擇“Mirror(RAID1)forDataSecurity”準(zhǔn)備創(chuàng)建RAID1。然后,分別選擇源盤和目標(biāo)盤(即鏡像盤或備份盤)并開始創(chuàng)建過程。之后BIOS提示進行鏡像的制作,該過程將非常緩慢,最后完成整個RAID1系統(tǒng)的建立。RAID1系統(tǒng)將主盤上的數(shù)據(jù)復(fù)制到鏡像盤上,為此在開始復(fù)制之前就必須確認(rèn)數(shù)據(jù)盤和鏡像盤的位置,防止將兩個盤放反造成不可挽回的損失。RAID1支持在兩個空硬盤上創(chuàng)建,也支持在一塊具有操作系統(tǒng)的硬盤上添加新的空硬盤作為鏡像盤使用。為了驗證RAID1系統(tǒng)是否可以正常工作,可以人為地將源數(shù)據(jù)盤從計算機系統(tǒng)上拆除并重新啟動系統(tǒng)。這時RAID控制器會發(fā)出警告,可以忽略該警告,那么作為鏡像的硬盤就會自動轉(zhuǎn)換為系統(tǒng)硬盤,提供穩(wěn)定的服務(wù)。而鏡像盤上的數(shù)據(jù)完好無損,用戶可以如常使用。對于RAID0和RAID1的系統(tǒng)安裝方式簡單介紹就到此,需要說明的是無論哪種RAID系統(tǒng),用戶對計算機的操作不會受到限制,也就是說,對一般用戶而言RAID0和RAID1完全透明。

除了使用RAID卡或者主板上自帶的芯片實現(xiàn)硬件的磁盤陣列外,在操作系統(tǒng)中也可以直接采用軟件方式實現(xiàn)RAID功能。下面就以Windows2000/XP系統(tǒng)為例說明RAID軟件設(shè)置的方式。目前,Windows系統(tǒng)中與RAID相關(guān)的功能軟件為動態(tài)磁盤管理。動態(tài)磁盤與基本磁盤相比較,不再采用以前的分區(qū)方式,而是采用卷集的方法管理磁盤。動態(tài)磁盤可以任意修改磁盤卷集容量,即在不重新啟動計算機的情況下可實現(xiàn)對磁盤容量大小的修改,而且不會丟失數(shù)據(jù)。動態(tài)磁盤可以擴展到磁盤中離散的磁盤空間中,還可以創(chuàng)建跨磁盤的卷集將不同磁盤整合為一個大卷集。而且在動態(tài)磁盤上可以創(chuàng)建的卷集個數(shù)沒有限制,相對于基本磁盤方式,一個磁盤上最多有4個分區(qū)的限制要靈活許多。動態(tài)磁盤只能在WindowsNT/2000/XP及以后的系統(tǒng)上識別。為了實現(xiàn)軟件RAID功能,必須首先將基本磁盤類型轉(zhuǎn)換為動態(tài)磁盤。具體操作在磁盤管理軟件內(nèi)實現(xiàn)(控制面板→管理工具→計算機管理→磁盤管理)。在該軟件的查看菜單中將其中的一個窗口切換為磁盤列表,并通過右鍵菜單將選擇磁盤轉(zhuǎn)換為動態(tài)磁盤。

在對動態(tài)卷時有四種類型可以選擇:簡單卷、跨區(qū)卷、帶區(qū)卷和鏡像卷。其中,簡單卷包含單一磁盤上的空間與分區(qū)的功能一樣;跨區(qū)卷將來自多個磁盤的未分配空間合并到一個邏輯卷中;帶區(qū)卷可以組合多個(2~32個)磁盤上的未分配空間到一個卷;鏡像卷實現(xiàn)單一卷兩份相同的拷貝,即用于實現(xiàn)RAID1。如果系統(tǒng)具有三個或以上的動態(tài)磁盤時,就可以使用RAID5的分卷方式,形成帶奇偶校驗的帶區(qū)卷。下面給出最常用的RAID0的軟件實現(xiàn)方式簡單說明。首先必須將準(zhǔn)備加入RAID0的磁盤轉(zhuǎn)換為動態(tài)磁盤。為了進行RAID0將分區(qū)劃分為帶區(qū)卷,在劃分過程中系統(tǒng)要求有一個對應(yīng)的分區(qū),即要求其他的動態(tài)磁盤上必須有對應(yīng)大小的分區(qū)或更大未分配的空間。帶區(qū)卷分配完成后,兩個同樣大小的分卷將被系統(tǒng)合并,此時包括格式化操作都將同時在兩個磁盤上進行。這樣就構(gòu)建完成了RAID0系統(tǒng)。那么,這樣的RAID0系統(tǒng)性能如何呢?經(jīng)過實際對硬盤的測試,RAID0系統(tǒng)傳輸速率完全超過了陣列中任意一個硬盤的速率。

其實,在Linux環(huán)境下,可以利用RAIDTOOLS工具來實現(xiàn)軟件RAID功能。該工具可以制作軟件RAID0、RAID1、RAID4和RAID5等多種磁盤陣列。

4.4磁盤存儲系統(tǒng)

關(guān)于智能存儲系統(tǒng),首先給出智能存儲的基本概念,然后說明實現(xiàn)智能存儲系統(tǒng)的兩種基本形式:集成形式和模塊形式。

智能存儲系統(tǒng)是具有分布數(shù)據(jù)到不同的設(shè)備且管理對數(shù)據(jù)操作的磁盤存儲系統(tǒng)。智能存儲系統(tǒng)具有以下主要優(yōu)勢:

(1)存儲容量增長迅速;

(2)系統(tǒng)性能提升迅速;

(3)數(shù)據(jù)管理簡便;

(4)具有更好的數(shù)據(jù)可獲性;

(5)具有更強的魯棒性和恢復(fù)能力;

(6)靈活性和可擴展性非常強。目前,通常磁盤陣列分為兩大類:集成型和模塊型。集成型存儲系統(tǒng)以企業(yè)級應(yīng)用為目標(biāo),將數(shù)據(jù)集成到具有幾百個驅(qū)動器的強大系統(tǒng)中。集成型系統(tǒng)具有如下的特點:

(1)巨大的存儲容量;

(2)具有數(shù)量巨多的高速緩存以暫存I/O數(shù)據(jù)后寫入到磁盤中;

(3)具有用以提高數(shù)據(jù)保護和可獲性的冗余部件;

(4)許多內(nèi)部的特征保證了系統(tǒng)更加魯棒并具有容錯功能;

(5)通常連接到大型機或功能強大的開放系統(tǒng)主機上;

(6)具有多種前端端口以提供連接到多個服務(wù)器;

(7)采用多個后端光纖通道或者SCSIRAID控制器管理磁盤處理;

(8)成本高。

這種類型的系統(tǒng)可以包含到單個主機中或者互連的大型機中,并能支持互連數(shù)目、性能和容量按照要求的擴展。集成存儲設(shè)備能處理數(shù)據(jù)密集應(yīng)用中大量并發(fā)輸入輸出的請求。但是,這種系統(tǒng)成本限制了只能應(yīng)用于大多數(shù)關(guān)鍵的任務(wù)中。同樣,這種系統(tǒng)在數(shù)據(jù)中心占據(jù)了大部分空間。有時,集成型磁盤陣列也稱為企業(yè)磁盤陣列或者Cache密集型陣列。圖4.24給出了這種系統(tǒng)的結(jié)構(gòu)。圖4.24集成存儲系統(tǒng)與集成存儲系統(tǒng)對應(yīng)的是模塊化存儲系統(tǒng),這種系統(tǒng)可以為數(shù)量比較小的Windows或UNIX服務(wù)器提供存儲服務(wù)。模塊化存儲系統(tǒng)通常具有兩種控制器,每一種控制器包括主機接口、高速緩存、RAID處理器和磁盤驅(qū)動接口。

模塊化存儲系統(tǒng)的特點如下:

(1)小型公司或部門級應(yīng)用;

(2)較小的磁盤容量和全局高速緩存;

(3)占地面積小且成本低;

(4)可以僅有較少數(shù)目的磁盤,并可以根據(jù)需要調(diào)整;

(5)與服務(wù)器連接的前端端口數(shù)目少;

(6)隨著容量增加,性能將有所下降;

(7)不能連接到大型機中;

(8)有限的冗余度和互連性;

(9)通常具有與磁盤陣列相獨立的控制器。

模塊化磁盤存儲系統(tǒng)也稱為中等范圍或部門級存儲系統(tǒng)。圖4.25給出了其基本形式。

智能存儲系統(tǒng)的邏輯構(gòu)成可以用圖4.26說明。由該圖可見,一般智能存儲系統(tǒng)由四個主要部分組成:前端、高速緩存、后端和物理磁盤。圖4.25模塊化磁盤存儲系統(tǒng)基本形式圖4.26智能存儲系統(tǒng)的基本構(gòu)成在智能存儲系統(tǒng)中,前端端口負(fù)責(zé)連接主機,這些端口就可以看做連接主機的外部接口。每個存儲端口均有負(fù)責(zé)執(zhí)行與存儲連接的傳輸協(xié)議的處理邏輯。這些端口可以使用SCSI、光纖通道或者iSCSI。在存儲端口之后就是控制器,控制器負(fù)責(zé)通過內(nèi)部數(shù)據(jù)總線將數(shù)據(jù)傳輸?shù)礁咚倬彺嬷小.?dāng)高速緩存接收到數(shù)據(jù)后,控制器將發(fā)出確認(rèn)信息給主機。為了維護數(shù)據(jù)可用性,存儲系統(tǒng)的前端通常具有多個端口。這樣當(dāng)發(fā)生故障時能夠提供一定的備份,或者當(dāng)系統(tǒng)負(fù)荷過載時能夠通過各個端口平衡負(fù)載。對于中等范圍的存儲系統(tǒng),前端端口的數(shù)目可以是1~8個,典型情況設(shè)置為4個。在大型集成陣列中,64個或128個前端端口也非常普遍。對于前端端口執(zhí)行的命令通常采用命令隊列的形式進行組織。命令隊列處理多個并發(fā)的命令的順序是基于數(shù)據(jù)在磁盤上的組織方式,而不是命令到達(dá)前端端口的順序。命令隊列軟件將根據(jù)數(shù)據(jù)在磁盤上的分布重新對命令進行排列使得執(zhí)行效率得到提升,并且該軟件也會給每個命令設(shè)定一個標(biāo)記。該標(biāo)記表示命令將被執(zhí)行的時間。對于像SCSI或者光纖通道磁盤驅(qū)動器能夠自我管理其命令隊列。智能存儲系統(tǒng)在使用這種類型的磁盤時可以采用本身的管理方式,也可以由控制器負(fù)責(zé)管理命令隊列。關(guān)于命令隊列的算法,通常采用的方式有以下幾種:

(1)先入先出,即命令執(zhí)行的順序與到達(dá)控制器的順序一致。那么這種方式實質(zhì)上沒有任何隊列,效率也是最低的。

(2)尋道時間優(yōu)化,這種對尋道時間優(yōu)化的方式比前一種方法要快得多。但是,兩個讀/寫請求有可能在非常臨近的柱面上,但是從磁道角度看卻在不同的位置。這時,有可能出現(xiàn)第三個扇區(qū)從柱面看與第一個請求相距較遠(yuǎn)的情況,但是總體看卻更加接近第一個請求。那么這時優(yōu)化尋道時間方法如果不考慮旋轉(zhuǎn)延遲的話將不會產(chǎn)生最佳效果。

(3)存取時間優(yōu)化,這種方式為了優(yōu)化性能將尋道時間優(yōu)化和旋轉(zhuǎn)延遲分析共同考慮得到最佳的隊列效果。

對于命令隊列深度設(shè)定說明了同時可以活躍的請求數(shù)目,一般生產(chǎn)商能夠提供可以配置的命令隊列深度。圖4.27說明了命令隊列的基本情況。圖4.27命令隊列的基本情況高速緩存也是智能存儲系統(tǒng)必不可少的部分。高速緩存實際上是一塊高速的存儲器,它通過將物理磁盤的機械延遲和主機進行隔離而達(dá)到了提升系統(tǒng)性能的目的。一般由于尋道時間和旋轉(zhuǎn)延遲,從物理磁盤上獲取數(shù)據(jù)時間到達(dá)幾個毫秒,但是從高速的內(nèi)存中獲取數(shù)據(jù)也僅需要不到1ms的時間。這樣使用高速緩存系統(tǒng)不僅可以提升讀的效率,也可以提升寫的效率。

當(dāng)數(shù)據(jù)從高速緩存中讀出后將通過輸入/輸出總線傳送到后端部件,在后端部件數(shù)據(jù)被分配到正確的磁盤驅(qū)動器上。后端部件提供與磁盤進行讀/寫操作的通信方式。其主要功能由磁盤控制器負(fù)責(zé)。磁盤控制器主要的功能有:

(1)存儲系統(tǒng)中管理I/O總線與磁盤間的數(shù)據(jù)傳輸;

(2)處理設(shè)備的尋址,將邏輯塊變換為磁盤上的物理位置;

(3)提供額外的但有限的數(shù)據(jù)暫存空間;

(4)提供與磁盤相似的錯誤偵測和糾正能力;

(5)具有在主機上實現(xiàn)多個設(shè)備與HBA進行通信的能力;

(6)有利于性能增強。在具體硬件實現(xiàn)時,磁盤控制器是一種具有內(nèi)嵌程序

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論