應用和數(shù)據(jù)遷移方案_第1頁
應用和數(shù)據(jù)遷移方案_第2頁
應用和數(shù)據(jù)遷移方案_第3頁
應用和數(shù)據(jù)遷移方案_第4頁
應用和數(shù)據(jù)遷移方案_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、第一章.應用和數(shù)據(jù)遷移方案由于xxx生產(chǎn)作業(yè)是24小時不問斷運作的,因此要求系統(tǒng)能連續(xù)運行,并 具有很高的安全可靠性,用戶希望在以最小的系統(tǒng)停機時間完成生產(chǎn)系統(tǒng)遷移工 作。本次系統(tǒng)遷移工作的最大的風險點和難點在于在有限的停機時間內(nèi)完成數(shù)據(jù) 庫的遷移工作。1.1數(shù)據(jù)庫遷移的解決思路xxx數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)量較大,并且應用系統(tǒng)的可用性要求極高,所以此次升 級要求在有限的停機時間內(nèi),最大限度的降低風險、數(shù)據(jù)庫業(yè)務在新的主機和存 儲系統(tǒng)上能夠正常運行。為了盡可能減少業(yè)務系統(tǒng)的停機時間,保證數(shù)據(jù)庫遷移 工作的順利完成,我們基于以往實施的 數(shù)據(jù)庫遷移成功案例(1.1T的數(shù)據(jù)量,遷 移時間不超過15分),經(jīng)過嚴

2、格的數(shù)據(jù)庫遷移測試,提出了采用數(shù)據(jù)庫Dataguard 技術(shù)的數(shù)據(jù)遷移。采用數(shù)據(jù)庫Dataguard技術(shù)的數(shù)據(jù)遷移的特點:對業(yè)務的影響小,switchover到新主機的時間小于10分鐘一旦新數(shù)據(jù)庫出現(xiàn)問題能夠方便的回切到原來的數(shù)據(jù)庫,不丟失差異 數(shù)據(jù)采用數(shù)據(jù)庫Dataguard技術(shù)的數(shù)據(jù)遷移的主要步驟如下:1)在新主機上安裝Oracle9i數(shù)據(jù)庫軟件2)在新主機上配置Dataguard數(shù)據(jù)庫(物理standby )3)利用DataGuard技術(shù),主數(shù)據(jù)庫不斷的將新產(chǎn)生的數(shù)據(jù)庫歸檔日志傳輸?shù)叫轮鳈C并將這些歸檔日志應用到standby數(shù)據(jù)庫,實現(xiàn)主備數(shù)據(jù)庫之間的數(shù)據(jù)同步4)系統(tǒng)割接期間只需將新主機

3、上的standby數(shù)據(jù)庫切換為主數(shù)據(jù)庫即可(switchover的時間小于10分鐘)5)一旦新系統(tǒng)上數(shù)據(jù)庫運行出現(xiàn)問題只需將數(shù)據(jù)庫切換回原來主機上 即可,不會丟失任何數(shù)據(jù)1.1.1 數(shù)據(jù)庫升級的解決思路1.1.1.1 數(shù)據(jù)庫升級的基本出發(fā)點保證企業(yè)生產(chǎn)及業(yè)務系統(tǒng)運行的安全性、連續(xù)性克服原有系統(tǒng)缺陷吸收適用的系統(tǒng)新特性遷移工作必然涉及到數(shù)據(jù)庫系統(tǒng)的擾動,所以減少對于正常業(yè)務系統(tǒng)的沖 擊,保證它的連續(xù)性和安全性是第一個出發(fā)點,數(shù)據(jù)庫系統(tǒng)是業(yè)務系統(tǒng)的基礎, 認真準備和設計數(shù)據(jù)庫遷移是開始的第一步。遷移到更新版本的工作也是糾正原有系統(tǒng)內(nèi)含的錯誤的良好機會,這個原則同樣也適合于任何軟件系統(tǒng)和硬件設備。1

4、.1.1.2 數(shù)據(jù)庫遷移方式從Oracle9i到Oracle10G的遷移有三種方式:1. 使用 export 和 import優(yōu)點:通過導出和導入方式對數(shù)據(jù)庫存儲結(jié)構(gòu)進行重整有助于減少數(shù)據(jù)庫碎塊缺點:對于超過150G以上的數(shù)據(jù)庫,采用exp/imp方式的停機時 間很長2. 使用Migrate腳本優(yōu)點:速度快,一般在30分鐘內(nèi)能完成腳本升級缺點:一旦升級后就無法回退3. 使用Migrate向?qū)Чぞ撸―BUA )優(yōu)點:速度快,一般在30分鐘內(nèi)能完成腳本升級缺點:一旦升級后就無法回退,容錯性較差我們綜合考慮了數(shù)據(jù)庫規(guī)模、停機時間、升級風險和以往的成功案例后, 我們建議采用數(shù)據(jù)庫升級腳本方式直接升級遷

5、移后的數(shù)據(jù)庫1.2項目實施計劃 1.2.1 實施步驟為了降低項目實施的風險,我們建議將整個系統(tǒng)遷移和升級項目拆分為五個 階段:準備階段準備階段需要完成搭建新系統(tǒng)環(huán)境, 是整個系統(tǒng)遷移項目成功的基石,主要 工作包括安裝操作系統(tǒng)、系統(tǒng)參數(shù)調(diào)整、存儲及LVM設計和規(guī)劃、MS/SG規(guī)劃 和實施等測試階段由于數(shù)據(jù)庫升級采用腳本直接在生產(chǎn)庫上實施,因此完備細致的測試工作 是整個項目成功與否的關(guān)鍵,在測試階段我們需要達到以下目的:驗證遷移方案的可行性解決遷移測試過程中遇到的錯誤根據(jù)測試的結(jié)果調(diào)整遷移過程對整個系統(tǒng)遷移過程做進一步的優(yōu)化數(shù)據(jù)庫遷移階段為了盡可能的減少系統(tǒng)停機時間數(shù)據(jù)庫的遷移工作,我們計劃采用O

6、racle9i Dataguard技術(shù):將數(shù)據(jù)庫熱備份恢復到新主機, 配置主備節(jié)點的數(shù)據(jù)庫歸檔日 志同步,系統(tǒng)割接的時候只需做 switchover操作將新節(jié)點上備用數(shù)據(jù)庫角色切 換為主數(shù)據(jù)庫即可。數(shù)據(jù)庫遷移到新節(jié)點后將應用系統(tǒng)也切換到新數(shù)據(jù)庫,在新系統(tǒng)上運行一段 時間,如果發(fā)現(xiàn)新節(jié)點上數(shù)據(jù)庫或主機出現(xiàn)問題,可以方便的回切到原來的數(shù)據(jù) 庫,不丟失任何數(shù)據(jù)。數(shù)據(jù)庫升級階段數(shù)據(jù)庫升級由于直接在生產(chǎn)數(shù)據(jù)庫上執(zhí)行升級腳本,一旦升級失敗對業(yè)務影響較大,因此其實施的前提是:1)測試階段數(shù)據(jù)庫升級測試成功2)對升級風險有預判和應急措施3)整個數(shù)據(jù)庫升級時間在用戶可接受的范圍內(nèi)4)在數(shù)據(jù)庫升級前必須有個最新的

7、、可用的數(shù)據(jù)庫全備份數(shù)據(jù)庫遷移升級后的工作數(shù)據(jù)庫遷移升級后的工作包括數(shù)據(jù)庫全備份、主機和數(shù)據(jù)庫性能監(jiān)控等1.2.2實施計劃根據(jù)以上步驟整理的該項目實施計劃表格如下:時間工作內(nèi)容負責單位配合單位準備階段系統(tǒng)壞境調(diào)研大鞏科技xxx新主機系統(tǒng)盤做mirror大鞏科技安裝HP DP備份軟件大鞏科技雙機HP MC/SG規(guī)劃及配置大鞏科技主機系統(tǒng)參數(shù)、卷組、文件系統(tǒng)及數(shù)據(jù)庫配置參數(shù)檢查大鞏科技測試階段實施Dataguard 數(shù)據(jù)庫遷移大鞏科技應用測試HP MC/SG雙機切換測試大鞏科技實施數(shù)據(jù)庫升級測試大鞏科技應用測試HP MC/SG雙機切換測試大鞏科技數(shù)據(jù)庫遷移階段數(shù)據(jù)庫全備份大鞏科技在新主機上創(chuàng)建 d

8、ataguard physical standby db大鞏科技配置datagurad使得主備數(shù)據(jù)庫之間歸檔日志 同步大鞏科技停應用xxx生產(chǎn)數(shù)據(jù)庫切換為 physical standby db大鞏科技在新主機的原 physical standby db 切換為主數(shù)據(jù)庫大鞏科技應用系統(tǒng)測試及相關(guān)應用連接數(shù)據(jù)庫配置修 改大鞏科技MC/SG切換測試大鞏科技DataProtector數(shù)據(jù)庫備份配置大鞏科技系統(tǒng)上線大鞏科技數(shù)據(jù)庫升級階段Oracle9i數(shù)據(jù)庫全備份及數(shù)據(jù)庫軟件備份大鞏科技數(shù)據(jù)庫升級前的檢查大鞏科技數(shù)據(jù)庫參數(shù)調(diào)整大鞏科技停應用xxx運行數(shù)據(jù)庫升級腳本大鞏科技編譯數(shù)據(jù)庫無效對象大鞏科技重啟

9、數(shù)據(jù)庫,應用系統(tǒng)測試大鞏科技DataProtector數(shù)據(jù)庫備份配置大鞏科技HP MC/SG切換測試大鞏科技系統(tǒng)上線大鞏科技數(shù)據(jù)庫升級后的工作主機性能監(jiān)控大鞏科技數(shù)據(jù)庫性能監(jiān)控大鞏科技Oracle10g數(shù)據(jù)庫全備份大鞏科技1.3系統(tǒng)遷移應急策略1.3.1 系統(tǒng)遷移實施前的異常如果在規(guī)劃的時間點之前沒有完成實施準備階段的任務,實施時間順延,在確保準備工作就緒的前提下才進行實施工作。天鞏科技將在該項目開始實施前進行全面性的系統(tǒng)軟、硬件健康檢查,確保在項目實施前系統(tǒng)完好。1.3.2 系統(tǒng)遷移實施過程中的異常本次系統(tǒng)遷移實施的原則是確保系統(tǒng)在規(guī)劃的實施時間段之外可以正常運行。為確保系統(tǒng)在發(fā)生硬件或軟件

10、故障時能夠及時得到技術(shù)響應, 需要協(xié)調(diào)各相 關(guān)人員到位。在實施過程中操作步驟具有可逆性, 確保以外發(fā)生的時候可將系統(tǒng) 迅速回退到最初狀態(tài)。系統(tǒng)和數(shù)據(jù)在實施前都做最新的備份。由丁在正式數(shù)據(jù)庫遷移之前,已經(jīng)做過測試遷移的工作,應該能夠估算出遷 移大概所需的時間。如果由丁一些不可測原因?qū)е逻w移過程異常緩慢或終止, 數(shù) 據(jù)庫升級所需時間超過原定時間,我們可以迅速將數(shù)據(jù)庫系統(tǒng)恢復到最初狀態(tài)。1.3.3系統(tǒng)遷移實施后的異常由于該項目實施過程中,只有在確認了 Oracle數(shù)據(jù)庫遷移成功并且 Oracle 9i成功升級到10G成功后,才打開對數(shù)據(jù)庫數(shù)據(jù)的增加、刪除、修改等數(shù)據(jù)庫 變更操作,否則所有表空間均設置

11、為 readonly狀態(tài)(或者通過調(diào)整 Websphere 中間件,停止對后端數(shù)據(jù)庫的寫操作以便限制成功遷移、升級之前的Oracle數(shù)據(jù)庫的變更),因此,系統(tǒng)遷移實施后的異常情況下,由于遷移前后均不涉及到 數(shù)據(jù)庫數(shù)據(jù)的變更,嚴格來說可以簡單通過恢復原環(huán)境節(jié)點承擔中問件連接即可 恢復為原有環(huán)境。另一方面,前期的充分測試也是對該應急措施的保障性測試。1.4風險分析及對策分析通過夭鞏科技多年以來專業(yè)服務項目實施的經(jīng)驗,我們建議xxx在該項目的實施過程中應把風險管理貫穿整個項目,天鞏科技充分考慮了可能造成項目失敗的所有因素和預防措 施,以及發(fā)生時的管理辦法,以此作為該項目的風險規(guī)避方案。1.4.1風險

12、種類不可控制的風險(1) 重大政策出臺,影響公司發(fā)展;(2) 重大社會事件發(fā)生(3) 自然災難導致機房,機器在升級過程中受損 可控制的風險(1) 隨意變更項目目標、范圍、時間;(2) 隨意調(diào)用項目人員,使其沒有足夠的參與時間;(3) 不能及時決策、及時確認項目階段報告;(4) 不遵守項目大綱的要求。可能的風險(1) 數(shù)據(jù)庫版本升級帶來的與應用不兼容,包括性能方面和功能方面(2) 數(shù)據(jù)庫版本升級帶來的現(xiàn)有硬件不兼容,比如帶庫(3) 數(shù)據(jù)庫版本升級帶來的現(xiàn)有軟件不兼容,比如備份軟件,監(jiān)控軟件(4) 數(shù)據(jù)庫版本升級帶來的管理人員培訓需要以上從系統(tǒng)的各個方面簡單描述了各種類型的風險,具體風險及防范措施

13、將 通過下面依據(jù)升級工作生命周期的階段性分析來詳細描述, 將涵蓋可能產(chǎn)生的各 方面風險。1.4.2風險分析及防范措施我們根據(jù)以往數(shù)據(jù)庫 Oracle9i到Oracle10G 的升級的成功經(jīng)驗,對于 xxx改造項目實施過程中可能出現(xiàn)的以下風險點及提出了對應的應對措施:風險一:直接在生產(chǎn)庫上升級使用腳本升級方式,也就意味著最終的正式升級只能是在產(chǎn)品庫上直接進行,那么無論之前做過何種測試,都可能由于意外風險原因?qū)е律壥。ū热缟夁^程中意外斷電, 硬件發(fā)生意外損 壞等),升級失敗就可能意味著生產(chǎn)庫的不可用。穩(wěn)妥的備份策略是升級工作的后備軍。只要有有效的數(shù)據(jù)庫防范措備份,就能夠膽大心細地進行升級工作

14、。而目前帳務數(shù)據(jù)庫在無施錫新區(qū)有異地備份的容災庫,這更是一種有力的保證, 讓升級工作無后顧之憂。風險二:生產(chǎn)庫恢復時間風險如果升級失敗,那么可能需要恢復生產(chǎn)庫以應對第二天的業(yè)務,因為移動的數(shù)據(jù)量很大,即使是使用增量備份的方法也需要至少恢復f的歸檔日志,那么如果萬T級出現(xiàn)問題,能否在 升級窗口期內(nèi)完成數(shù)據(jù)庫恢復是一個風險。防范措穩(wěn)妥的備份策略不僅僅包含備份的效率,同樣也包含恢復的效率,一個只能備份而無法在規(guī)定時間內(nèi)恢復的備份策略是不合施格的,也是沒有意義的。因此問樣,制定有效的備份策略問時進 行問比數(shù)據(jù)量的恢復測試是必要的風險防范措施。風險三:數(shù)據(jù)庫服務器之間版本不風險在一段時間內(nèi),Oracle

15、9i和Oracle10g將問時存在于數(shù)據(jù)庫系統(tǒng)中,各個系統(tǒng)之間存在著不同版本數(shù)據(jù)庫數(shù)據(jù)交互的現(xiàn)象, 可能廣生數(shù)據(jù)不兼容的情況。防范措詳細考慮升級的先后順序,哪套系統(tǒng)先升級,哪套系統(tǒng)后升級。盡量使有數(shù)據(jù)交互的系統(tǒng)在問一時刻進行升級。施如果無法做到問一時刻升級, 那么需要進行升級測試和升級預演,確保在測試環(huán)境中不同版本的數(shù)據(jù)庫之間交互是沒有問題的。風險四:客戶端和服務端版本不一致風險客戶端(Websphere中間件)和服務端(Oracle 10G )同"一段時間內(nèi)版本不一致的現(xiàn)象,服務端可能無法正常處理客戶端請求,而客戶端也可能無法正常接收服務端數(shù)據(jù)。防范措施對E能筒的客戶端和服務器端版

16、本問題,在升級之前必須有測試環(huán)境進行全面測試,將普通的功能問題在測試環(huán)境中就予以解決,盡量減少產(chǎn)品環(huán)境中的升級風險。對于已知故障,可以按照大機科技對應的故障解決方法,通過Patch和設置 Event來避免產(chǎn)生 Core Dump 。風險五:Failover風險對于網(wǎng)卡不支持單機多網(wǎng)卡之間的Failover ,以往的網(wǎng)卡Failover設置需要改動。防范措建議使用操作系統(tǒng)功能將多塊網(wǎng)卡捆綁為一個NIC設備,施以此避免網(wǎng)卡的單點故障。風險六:升級Pro*C程序版本風險在新版本數(shù)據(jù)庫卜可能無法正常編譯;如果無法正常編譯,需要原開發(fā)人員的技術(shù)支持,但是原開發(fā)人員可能因為人員變動而無法找到;如果需要其它

17、開發(fā)人員修改,需要確保源代碼還存在,并且問時要考慮現(xiàn)任人員的修改能力。防范措施對于這樣的情況只有通過測試才能確認是否兼容,盡量詳盡地進行升級測試和升級預演是防范問題出現(xiàn)在產(chǎn)品環(huán)境中的必距壬ea風險七:不升級Pro*C程序版本風險舊版本Pro*C連接新版本數(shù)據(jù)庫可能會出現(xiàn)非預測的錯誤結(jié)果或者低下的應用性能。(需要確認xxx應用系統(tǒng)是否采用該選項)防范措施在Oracle顧問參與的某項目中,客戶就直接使用9i版本的Pro*C程序連接Oracle10g數(shù)據(jù)庫,獲得了跟以往一樣的功能和性能。但是由于Pro*C程序的多樣性,所以必須謹慎測試。對于這樣的情況也只有通過測試才能確認是否兼容,盡量詳盡地進行升級

18、測試和升級預演是防范問題出現(xiàn)在產(chǎn)品環(huán)境中的必要手段。風險八:疲勞操作風險升級工作比較緊張, 高強度的工作也容易使人疲勞,而在緊張和疲勞的狀態(tài)下,是比較容易產(chǎn)生人為失誤的。防范措施升級工作必須由至少 2人協(xié)同完成;按照升級預演的文檔仔細操作;重大命令必須有協(xié)同工作人員確認之后才可以輸入; 完善的備份讓升級工作無后顧之憂。風險九:執(zhí)行計劃穩(wěn)定性風險Oracle10g在創(chuàng)建完數(shù)據(jù)庫之后會產(chǎn)生一個自動定期收集數(shù)據(jù)庫對象統(tǒng)計信息的Schedule ,默認是在周一到周五的每天晚上10點以及周六的凌晨 0點,對于執(zhí)行計劃已經(jīng)比較穩(wěn)定的產(chǎn)品環(huán)境來說,每天收集統(tǒng)計信息是沒有必要的,同時還存在可能改變執(zhí)行計劃的隱

19、患。防范措施禁用統(tǒng)計信息自動收集。加強性能監(jiān)控。風險十:High Version Count風險由于Oracle10.2.0.3 對于cursor是否能夠重用的安全性檢查加強,因此在 Cursor_sharing = SIMILAR 或者FORCE 的系統(tǒng)中,可能會產(chǎn)生同一 SQL的大量Version ,將會嚴重影響應用 的性能。防范措施完善測試應用的功能和性能。風險并行性能風險對于在表或者索引上正義了并行度的情況,對于xxx系統(tǒng)這樣的負載較大的 OLTP系統(tǒng),可能會由于并行進程的大量占用資 源而導致數(shù)據(jù)庫性能急劇下降。防范措施在升級之后需要仔細檢查表和索引的并行度,建議將所有并行度都設置為1。如果確實需要并行,那么通過在程序中指定parallel hint來實現(xiàn)并行。風險十二:RMAN Catalog風險10gR2的RMAN Catalog 跟9i的Catalog有差別,繼續(xù)使 用舊版本的RMAN Catalog會造成RMAN命令錯誤。防范措施在升級完數(shù)據(jù)庫之后立刻升級RMAN Catalog數(shù)據(jù)庫,或者創(chuàng)建新的RMAN Catalog (因為可能有還未及時升級的Oracle9i數(shù)據(jù)庫需要使

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論