前言
隨著網際網路的發展與普及,許多新興行業及應用隨之蓬勃發展(如eCommerce與Internet banking等),創造出嶄新的商業契機,同時,對數位資料依賴日深的企業也將面臨嚴苛的挑戰。因此我們都明白企業網路系統上任何一項網路服務功能的停擺或效率的遲鈍,都可能造成企業工作上極大的影響與損失,為了因應日益增加的數位資料需求或是組織規模的擴大,企業的網路及系統環境變得非常「龐雜」。
面對不同時期增添的新舊與多樣的系統設備,企業網路系統一旦遇到十分嚴重的災難發生時,IT管理者往往很難快速的重新恢復系統及數位資料的正常運作,縱使在每日有完善的備份或詳盡的備援主機啟動程序,一旦遇到不可抗力的天災人禍,樓垮了、火都燒完了,難道你還會期待備份的資料可以安然無恙的放在原地?難道你還會不停的幻想手中的緊急備援計劃可以立即恢復系統正常的運作?
根據IDC之研究報告,請見(表一)指出eCommerce應用系統停止運作時,企業每分鐘將損失US$11,000之營業額,並可能因此而無法生存。由此可知,如何降低企業應用系統停擺的風險,讓企業本身及客戶皆能夠隨時取得其所須之資料並進行運用,將是企業迫切的課題。
國內外教訓歷歷在目
由於地震、火災、水災、人為爆炸等天災人禍之發生,往往是突如其來,對系統所造成的損害之鉅,也往往不是短時間可復原,將嚴重影響公司之生存。例如:美國世貿大樓爆炸案發生後,許多身處其中的公司,就因為無法於短時間內,讓重建系統提供服務,因此導致客戶流失而結束營業。
又如去年921地震發生後,許多災區戶政事務所的戶籍資料,據了解也多埋在灰燼中,讓後續賑災工作憑添困難,甚至以最近的西雅圖大地震及汐止東方科學園區的高樓大火都是一夕之間風雲變色。
我們相信或許有形的主機伺服器等昂貴的機器設備不難花錢緊急購買,但無形的龐大數位資產一旦損失卻是千金再也喚不回。所以,解決此一問題只能透過設置遠端備援系統分散風險方能達成。遠端備援之主要目的即是當主系統因災難而導致損毀時,另一處之備援系統能於最短時間內運轉並提供服務。因此,如何善加規畫並運用遠端備份來分散風險,將成為企業確保永續經營的最後一道關卡。但如何建立遠端備援系統呢?以下將就此一課題加以探討:
認識遠端備援系統
首先,可將遠端備援系統分為「Offline遠端備援系統」與「Online 遠端備援系統」。
Offline遠端備援系統
此系統的主要目的是提供資料之異地保存,避免資料因災難發生而全部遺失。其簡單且成本低廉的特性,使之成為目前企業用戶使用率最廣的方案之一。然而,由於此類系統僅提供資料備援,所以當災難發生時,必須進行較長時間的資料回存工作,系統才能回復,無法做到系統即時備援。
舉例來說,利用備份軟體(如Veritas Vault Management Option)所提供之磁帶複製及Offline磁帶管理功能,於進行例行備份工作時,自動產生另一份複製磁帶,並於完成後自動產生報表通知台北總公司及台中、高雄分公司之系統管理者,那些磁帶必須移出磁帶館後,將分別送至分公司保存,而分公司所存放之磁帶,在超過資料保存期限後,亦將移回總公司作為重複使用。
這樣的異地備援做法優點看來似乎簡單且節省成本,但以人力方式運送至異地存放,再使用人工審閱報表方式逐一列檔管理,所花費的人事成本、運送成本及儲存大量磁帶的恆溫空間場地...等等,如果再加上人為疏失的風險及災難回復的預估時間單位成本損失,對於有大量資料備份需求的企業來說,較不具備經濟效益。
另一方式也可利用數據網路於備份時,透過數據網路(如T1, T3, E1)於台中,高雄分公司產生複製磁帶,以達成自動化,避免人工介入。然而,為顧及資料備份速度,通常需具備T1以上之高速數據網路時方建議使用。
Online 遠端備援系統
Online遠端備援系統為最完整之備援系統,但是相對地初期建置成本最高。此系統主要係將現行系統(包含軟硬體等)皆購置於遠端,透過Replication將資料完全複製於遠端系統。當主系統故障時,備援系統可立即運作提供服務。Replication可分為同步(Synchronous)及非同步(Asynchronous)兩種方式,說明如下:
同步複製:
當資料寫入本地系統時,需同步寫入至遠端系統,此筆資料寫入動作才算完成。他的好處是能確保資料之一致性及完整性,但是,也可能由於某些網路因素及數據網路之頻寬限制而導致系統運行效率降低,因此,通常較適用於系統資料更動量較少,並且兩地資料必須隨時維持一致之環境。如(圖一)。
《圖一 Synchronous replication》 |
|
非同步複製:
當資料寫入本地系統時,此筆寫入動作即告完成。此筆更動會持續存放於系統內,直到遠端系統之資料更新。此種作法可避免影響到系統的運行速度,然而,當備援系統啟動時,亦可能因網路因素及數據網路之頻寬限制,會有一些資料尚未更動完成,造成Database因資料不一致而無法啟動。因此,在採用此方式時,需注意廠商是否能提供正確的技術來確保資料之一致性。如(圖二)。
《圖二 Asynchronous replication》 |
|
以目前的環境來說,遠端備援系統的主要應用方式,若以距離來論可略分為以下二種:
(圖三)所示為利用Fibre Channel 架構的備援系統,所具備之高速(每秒100Mbyte)及長距離傳輸特性(10KM,但若透過Fibre Channel Extender可達40KM),將本地及遠端系統架構成SAN(Storage Areas Network),此時可透過Mirror或Replication方式進行資料備援。
《圖三 利用Fibre Channel 架構的備援系統》 |
|
所謂的Mirror方式為透過作業系統或是其他軟體工具(如Veritas Volume Manager),將資料複製至遠端系統,當本地資料無法存取時,系統可自動存取遠端資料。優點為簡單易用,但會佔用一些主機CPU資源。而Replication 則是透過磁碟陣列系統本身提供之Replication功能(如Compaq StorageWorks之Data Replication Manager),經由磁碟陣列控制器將資料複製於遠端之磁碟陣列內,達成資料備援,此種作法的優點為不佔用主機之CPU資源。
(圖四)之主系統位於New York City,遠端備援系統則設於Philadelphia,透過Replication來建構遠端備援系統。此架構之特點在於:
《圖四 Synchronous Replication with Cluster Secondary》 |
|
1. 主系統與備援系統內皆安裝叢集(Cluster),各自構成高可用度環境,系統內主機可互相備援。當其中一台主機或應用系統故障時,可由另一台主機提供備援,不需切換至備援系統,以提高反映時間。
2. 主系統之資料透過Replication複製至備援系統時,因其應用系統會要求兩地資料隨時保持一致,因此必須使用Synchronous 模式。此外,為預防因暫時性之數據線路故障,影響系統運行速度,可另外設定成當發生上述問題時,可自動切換成Asynchronous 模式,以降低對系統之影響,等到線路恢復正常後,再切換回Synchronous模式,以便當災難發生時,可迅速於備援系統恢復運作。
Information is Power!
綜合以上所述可隱約看出,數據線路之頻寬是企業在建構遠端備援系統時,極為關鍵的重要因素,而隨著國內寬頻網路環境的日益成熟,與各種新興儲存科技如IP storage的發展,未來企業在遠端備援系統的建置將具備更多的彈性並獲致更大的經濟效益。因此,企業在執行建構計畫時,需詳細評估內部現行系統之特性、建構預算與希望達到之目標,並尋找能夠提供完整資料儲存管理解決方案的廠商加以協助,方能建構出適型適用之備援系統。
在e風潮的席捲之下,企業賴以生存與擴張的要素已不再僅是有形的資產,更在於無形智慧財的保存能力,資訊的擷取與管理能力。邁入21世紀的挑戰,建議企業平時應妥善規劃正確的資料備份系統及作業程序,並採取自動化資料備份,以保護公司重要資產;建置高可用度系統(Cluster)以進行重要系統之本地備援;最後,建置遠端備援系統,確保永續經營的最後一道關卡,即使面對突如其來的天災人禍,也可有效的進行災難復原工作。如此一來,無論任何因素導致系統無法運行或資料遺失時,皆能正確且快速地使系統復原繼續運行並提供服務,不僅大幅提昇企業之競爭能力,更能建立令人信賴、可靠的企業形象。