隨著網際網路的發展與普及,許多新興行業及應用隨之蓬勃發展(如E Commerce與Internet banking等),創造出嶄新的商業契機,然而,快速膨脹的資訊與網路的大量被運用,勢必造成資訊應用架構的許多衝擊,同時,對數位資料依賴日深的企業也將面臨嚴苛的挑戰。據IDC之研究報告(圖一)指出E Commerce應用系統停止運作時,企業每分鐘將損失US$11,000之營業額,並可能因此而無法生存。由此可知,提高企業應用系統之可用度(Availability rate),讓企業本身及客戶皆能夠隨時取得其所需之資料並進行交易,將是企業迫切的課題。
《圖一 E Commerce應用系統停擺時損失預估一覽表》 |
|
系統停擺的因素與解決方案
如何提高企業應用系統之可用度?簡而言之,必須降低系統停止服務時間(Down Time)。究竟那些原因會造成系統停止服務?根據Ontrack Data International, Inc.之研究報告(圖二)指出:硬體及軟體問題、電腦病毒、人為因素及天然災害(如地震、火災)等,是造成系統停止服務的主要原因,其中又可分為非計劃性停機(如硬體故障)及計劃性停機(如版本升級,硬體維護)兩種。企業欲提高系統可用度,必須針對上述各種因素,採取適當的解決方案加以排除或避免。以下針對上述各種因素介紹其解決方案:
1.硬體問題
硬體問題可善加運用容錯(Redundant)功能來克服,選擇具備容錯的主要元件(如電源供應器、I/O介面卡),互相備援,再搭配磁碟陣列系統,提供磁碟機之容錯功能,以避免發生單一零件故障及造成系統停止服務,另外,最好具備線上維護(Hot-Swap)能力以便線上進行維護及擴充。
2.軟體問題
軟體問題的成因大多來自於計劃性停機,如軟體版本升級、系統調整等,此類問題可利用一些軟體工具來解決。例如File System Full可利用提供線上調整File System Size之工具如Veritas File System(Solaris),Online JFS(HP)等進行線上調整;又如Database Performance Tuning可利用Veritas Database Edition來進行Online Tuning,降低計劃性停機時間。
3.電腦病毒
電腦病毒問題可使用防毒軟體來預防及解毒並避免使用來路不明之檔案。
4.人為因素
解決此問題最直接之方式為盡可能採自動化作業,以減少人工操作之機會,避免人為因素所造成之問題。例如:在規畫資料備份系統時,使用備份軟體從事備份自動化管理及具備自動換帶功能之磁帶館進行定期備份,防止使用錯誤之磁帶,導致資料遺失或忘記進行資料備份所增加的資料遺失風險。
5.意外災害
解決此一問題只能透過設置遠端備援系統方能達成。遠端備援之主要目的即是當主系統因災難而導致損毀時,另一處之備援系統能於最短時間內運轉並提供服務。
在上述五項導致系統停止作業的原因中,又以意外災害對企業的影響與損害最深。由於地震、火災、水災、人為爆炸等天災人禍之發生,往往是突如其來,對系統所造成的損害之鉅,也往往不是短時間可復原,將嚴重影響公司之生存。例如:美國世貿大樓爆炸案發生後,許多身處其中的公司,就因為無法於短時間內,讓重建系統提供服務,因此導致客戶流失而結束營業。又如去年921地震發生後,許多災區戶政事務所的戶籍資料,據了解也多埋在灰燼中,讓後續賑災工作平添困難。所以,善加規畫並運用遠端備份來分散風險,將成為企業確保永續經營的最後一道關卡。但如何建立遠端備援系統呢?以下將就此一課題加以探討。
遠端備援系統的建置
首先,可將遠端備援系統分為「Offline遠端備援系統」與「Online遠端備援系統」。
Offline遠端備援系統
此系統的主要目的是提供資料之異地保存,避免資料因災難發生而全部遺失。其簡單且成本低廉的特性,使之成為目前企業用戶使用率最廣的方案之一。然而,由於此類系統僅提供資料備援,所以當災難發生時,必須進行較長時間的資料回存工作,系統才能回復,無法做到系統即時備援。
(圖三)所示為一應用實例,利用備份軟體(如Veritas Vault Management Option)所提供之磁帶複製及Offline磁帶管理功能,於進行例行備份工作時,自動產生複製磁帶,並於完成後自動產生報表通知台北總公司及台中、高雄分公司之系統管理者,那些磁帶在移出磁帶館後,將分別送至分公司保存,而分公司所存放之磁帶,在超過資料保存期限後,亦將移回總公司作為重複使用。
上圖之另一方式為利用數據網路於備份時,透過數據網路(如T1, T3, E1)於台中,高雄分公司產生複製磁帶,以達成自動化,避免人工介入。然而,為顧及資料備份速度,通常需具備T1以上之高速數據網路時方建議使用。
Online遠端備援系統
Online遠端備援系統為最完整之備援系統,但是相對建置成本最高。此系統主要係將現行系統(包含軟硬體等)皆購置於遠端,透過Replication將資料完全複製於遠端系統。當主系統故障時,備援系統可立即運作提供服務。Replication可分為同步(Synchronous)及非同步(Asynchronous)兩種方式,說明如下:
Synchronous Replication:
當資料寫入本地系統時,需同步寫入至遠端系統,此筆資料寫入動作才算完成。他的好處是能確保資料之一致性及完整性,但是,也可能由於某些網路因素及數據網路之頻寬限制而導致系統運行效率降低,因此,通常較適用於系統資料更動量較少,並且兩地資料必須隨時維持一致之環境。請參考(圖四)。
《圖四 Synchronous Replication》 |
|
Asynchronous Replication:
當資料寫入本地系統時,此筆寫入動作即告完成。此筆更動會持續存放於系統內,直到遠端系統之資料更新。此種作法可避免影響到系統的運行速度,然而,當備援系統啟動時,亦可能因網路因素及數據網路之頻寬限制,會有一些資料尚未更動完成,造成Database因資料不一致而無法啟動。因此,在採用此方式時,需注意廠商是否能提供正確的技術來確保資料之一致性。請參考(圖五)。
《圖五 Asynchronous Replication》 |
|
以距離來區分遠端備援系統應用方式
以目前的環境來說,遠端備援系統的主要應用方式,若以距離來論可略分為以下二種:
遠端系統距離小於40公里
(圖六)所示為利用Fibre Channel 所具備之高速(每秒100Mbyte)及長距離傳輸特性(10KM,但若透過Fibre Channel Extender可達40KM),將本地及遠端系統架構成SAN(Storage Areas Network),此時可透過Mirror或Replication方式進行資料備援。
所謂的Mirror方式為透過作業系統或是其他軟體工具(如Veritas Volume Manager),將資料複製至遠端系統,當本地資料無法存取時,系統可自動存取遠端資料。優點為簡單易用,但會佔用些需之主機CPU資源。而Replication 則是透過磁碟陣列系統本身提供之Replication功能(如Compaq StorageWorks之Data Replication Manager),經由磁碟陣列控制器將資料複製於遠端之磁碟陣列內,達成資料備援,此種作法的優點為不佔用主機之CPU資源。
遠端系統距離大於40公里
(圖七)主系統位於New York City,遠端備援系統則設於Philadelphia,透過Replication來建構遠端備援系統。此架構之特點在於:
1.主系統與備援系統內皆安裝Cluster,各自構成高可用度環境,系統內主機可互相備援。當其中一台主機或應用系統故障時,可由另一台主機提供備援,不需切換至備援系統,以提高反映時間。
2.主系統之資料透過Replication複製至備援系統時,因其應用系統會要求兩地資料隨時保持一致,因此必須使用Synchronous 模式。此外,為預防因暫時性之數據線路故障,影響系統運行速度,可另外設定成當發生上述問題時,可自動切換成Asynch- ronous 模式,以降低對系統之影響,等到線路恢復正常後,再切換回Synchronous模式,以便當災難發生時,可迅速於備援系統恢復運作。
綜合以上所述可隱約看出,數據線路之頻寬是企業在建構遠端備援系統時,極為關鍵的重要因素。企業在執行建構計畫時,需詳細評估內部現行系統之特性、建構預算與希望達到之目標,方能建構出適型適用之備援系統。
結論
Information is Power!在e風潮的席捲之下,企業賴以生存與擴張的要素已不再僅是有形的資產,更在於無形智慧財的保存能力,資訊的擷取與管理能力。邁入21世紀的挑戰,建議企業平時應妥善規劃正確的資料備份系統及作業程序,並採取自動化資料備份,以保護公司重要資產;建置高可用度系統(Cluster)以進行重要系統之本地備援;最後,建置遠端備援系統,以進行災難復原。如此一來,無論任何因素導致系統無法運行或資料遺失時,皆能正確且快速地使系統復原繼續運行,大幅提昇企業之競爭能力,確保業務蒸蒸日上。
(作者任職於精業公司主機週邊事業部)