何謂資料管理?
線上資料是最重要的電子商務資產,需要良好的管理。而資料管理這個名詞有許多的意思,我們對這個名詞的定義如下:
1.在電腦、儲存裝置、軟體或網站故障後,能夠儘快恢復電子商務的營運。
2.在業務需要的時候,可以隨時隨地取得資料。
3.符合法規與企業政策的資料記錄保存要求。
如前述所強調,電子商務資訊服務部門的主要目標就是要保持線上資料的可用性以供夥伴存取。因此,在電子商務環境中的資料管理必需符合上述目標,以建置全天24小時運作的線上資料庫環境。
資料管理基本上包括移動和複製資料物件,像是備份與複製線上資料庫和其他資料( 例如HTML檔案、腳本、程式等 ),再者,從資料中心將電子檔案移動到安全儲存地點保存,或者是從產生資料的地方將資料複製到使用資料的地方,另外就是將資料從較少使用的地方移動到較常使用的地方或是相反。
從理論上來談不難,實際上在複製與移動資料的簡單動作背後,卻隱藏著重大的技術挑戰,資料管理主要是規劃並建立資料管理政策,讓即使在故障的狀況下,仍能存取所需要的資料,以及掌握資料的所在位置,例如,哪個備份檔案資料在哪個磁帶,以及這些磁帶的所在位置,都要非常清楚。
其他像保證資料物件在移動或複製時的一致性,使服務所需的停機時間降至最低,以免資料因移動或複製而暫時無法取用的問題,或者決定在何時變更資料管理政策最有效益,例如,當資料需要更經常備份時,比如產品資料或價目表副本需要複製到區域辦公室以減少網路流量等問題,也是資料管理在技術上要注意的課題。
備份:資料管理的核心
備份就是資料的副本,是所有資料管理架構的核心。備份副本與營運資料分開儲存,通常存放在磁帶或其他可移動的媒體,且極可能儲存在資料中心的外面以便在災害時能夠留存。備份副本可以是:
1.保存在資料中心,以便當儲存裝置、系統、應用軟體或人為的故障摧毀重要的線上資料時,電子商務仍能恢復至最近的營運狀態。從該時點,與故障地點分開儲存的資料庫記錄可以將資料庫恢復至幾近最新的狀態。
2.移動到其他位置儲存,避免火災、洪水等突發事件摧毀整個資料中心。由於擁有營運資料庫的備份副本,電子商務就可在替代運算裝置啟動後立即恢復營運。
3.以無法覆寫的方式 ( 例如燒錄至CD-ROM或其他單次寫入的儲存技術 ),提供可耐久的業務記錄,以便在資料無需保留在線上時,仍能提供給法規和企業政策目的需要使用。
備份似乎非常簡單?
在觀念上,備份的確非常簡單。系統管理者決定哪些資料物件是電子商務營運所需,並決定備份作業的時間,使備份作業對營運的影響極小化,使用備份程式來進行複製。然後副本會儲存在安全的地方,以便偶發事件發生時,可以供作故障恢復之用。然而,後續的執行細節才是困難所在:
龐大的數量
在大規模進行備份作業時,系統管理者必需面對大量從不同類型的伺服器來備份資料。這不僅是一份沉重的工作,要能精確完成並管理完善,同時還需要獨特的技術以應付各種平台,卻是一大難題。
可靠的執行
系統管理者必須確保備份工作確實執行。通常在複雜且忙碌的資料處理環境中,作業會更加困難。因為除非有變故而需要使用備份資料時,備份才能顯示出其商業價值,因此忙碌的系統作業人員極有可能因為沒有迫切需要而忽略了備份作業。
媒體處理錯誤
隨著電子商務日趨成熟,不可避免地會累積一大堆磁帶或其他備份媒體。當以人工處理媒體時,極有可能發生錯誤,導致備用副本損壞或舊資料被覆蓋的狀況發生。
執行的時間壓力
當線上資料損壞而需要回存備份副本時,狀況總是非常緊急的。管理者極有可能在執行很少演練的作業程序時發生錯誤,讀取錯誤的架構、載入錯誤媒體,或覆蓋寫入受保護的資料,而造成更長的恢復時間或無法完成故障恢復作業。
備份作業的剖析
要瞭解備份技術,必須先將備份作業分成幾個主要元件加以說明。(圖一)
備份終端電腦
包含所要備份資料的電腦主機。這個用語可能會造成混淆,因為備份終端電腦通常是應用軟體、資料庫或檔案伺服器。
備份伺服器
進行備份與保存備份歷史紀錄資料的主機。備份伺服器有兩種:
1. 主要備份伺服器 ( master backup server ),用於排定備份與恢復作業的程序並保存備份副本的目錄。執行這些功能的主要備份伺服器軟體稱為備份管理軟體。
2. 媒體伺服器 ( media server ),依照主要備份伺服器之要求,將資料備份至備份儲存設備。備份儲存設備就連接在媒體伺服器上。
備份儲存設備 ( backup storage units )
由媒體伺服器所控制的磁帶機 ( 櫃 )、磁碟機或光碟機 ( 櫃 )。
成功的備份作業必須透過備份終端電腦、主要備份伺服器與媒體伺服器的合作:首先,備份終端電腦會將完成備份的檔案資訊傳送至主要備份伺服器記錄,將資料傳送至媒體伺服器,然後備份管理軟體會依據備份排程開始並監控備份工作,最後媒體伺服器會選擇一或多個備份儲存單位,選擇和載入媒體,透過網路接收終端電腦的資料,然後寫入備份媒體。
同樣地,若要回存已經備份的資料:第一步是當終端電腦要求回存時,備份管理軟體會找出擁有該備份副本的備份媒體伺服器,指示其執行回存,接著媒體伺服器會找出並設定含有要回存資料物件的備份媒體,然後傳送資料到要求備份的終端電腦,最後備份終端電腦會收到來自媒體伺服器的資料,然後寫入至本地檔案系統。
在小系統裡 ( 例如最近建置的電子商務中 ),上述備份功能全都由一台電腦執行,該電腦同時也是應用軟體伺服器。運用模組化備份管理架構,各功能可以分配至專用伺服器,因應業務成長或需求而變化,而無需中斷預先定義的備份程序。(圖二)說明備份架構的延展。
在電子商務成長或作業改成分散式的時候,具備延展性的備份架構之優點就非常明顯了。(圖三)說明具備延展性的備份架構如何隨著電子商務營運而成長,其兩大主要利益:
集中管理
主要備份伺服器為所有電子商務應用軟體伺服器保存備份時程表與備份資料目錄。集中管理表示簡單的管理人力就可以管理整個分散式企業的備份作業了。
資源分享
媒體伺服器可因應需要而加裝。磁帶機,尤其是搭配自動上/下帶裝置之自動化磁帶櫃,不僅昂貴而且使用率也不高,若能使之在眾多應用軟體伺服器上分享將非常具有經濟效益了。
如圖三所示的分散式架構可使管理成本降至最低,並適當運用昂貴的硬體資源,但是網路的成本就變高了,採用的一些先進技術可使備份對線上作業的衝擊減至最小,在最適當的時機使大量資料從備份終端電腦轉移至備份伺服器,為分散式運算架構所設計之的電子商務備份架構必須評估分散式備份對現有網路流量的影響:
1.與應用軟體共享的備份網路。
2.專供備份資料使用的乙太網路或者光纖通道網路。
3.在某些或是所有應用軟體伺服器上進行本地備份。
結論
無論是恢復電子商務的營運,或是方便隨時取得更新的資料,都是再三強調資料管理未企業所帶來的效益。再者,大量的資料庫的使用已經是現代企業資訊化後必然的趨勢,如何強化資料管理也就愈形重要,有了正確的觀念之後,緊接而來就是把觀念落實在實際資料庫的建置上,運用有限的IT預算,規劃出適合本身企業的資料庫,屆時將是一項重大的資訊工程。