前言
隨著網路使用人口的快速的成長,使得網路上的管理成為一項不可或缺的技術。在網路管理中可分為許多不同層次的功能,包括提供各種不同的服務、管理網路資源與網路交通、維護網路以及解決各種不同的問題。網路管理就像是保母,網路就像是襁褓中的嬰兒,由保母提供細心的呵護,確保嬰兒的安全與建康。因為每天在網路上傳遞的資料非常的龐大,若是要人工來管理網路系統,幾乎是不可能的任務,所以自動化的網路管理就因應而生。
人工智慧已是公認的技術,可以有效建構自動化的網路管理與維護系統,而且可以診斷與修護資料傳輸時所發生的問題。但是,這種做法需要先將網路管理專家所認定的網路問題與解決辦法的規則建立起來,然後才能依據這些規則來解決問題。可惜的是,以此而建立起來的系統,是在問題發生後才來解決問題。所以一個較佳的自動化網路管理系統,應該是可以隨時監控整個網路的情況,以及指示出未來會發生的問題。
DATA MINING-資料挖掘技術的應用
因為資料挖掘技術的普及,越來越多領域希望能透過資料挖掘在大量的歷史資料中,找出一些知識。這些領域期待由資料挖掘帶來的知識中,能夠加強領域的執行效率、效果以及其他的好處。現今的網路系統所要處理的資料量持續的增加,也愈來愈複雜,所以更需要具有智慧的系統來管理和維護這龐大的網路系統。這個智慧型系統除了具有分析與解決問題的能力外,還必須能找出可能會發生的潛在問題。所以資料挖掘在這裡所要擔任的角色,就是找出潛在的問題。
在現今具有知識基底的網路管理系統中,AT&T的Sout是非常有名的。這個系統利用很短的時間週期,進行觀察資料,並藉此診斷整個網路。它具有網路拓撲的資訊,利用歷史資料與網路拓撲資訊,可以找出網路錯誤的型樣(Pattern),它的功能有快速的解決問題、可處理多重線路的問題以及長期性的錯誤。但是這個系統,仍有一些缺點有待解決。接著我們就來看看如何將資料挖掘技術應用在網路管理上。
如(圖一)所示,這是一個簡單但是完整的資料挖掘過程。首先我們必須收集所要觀察的資料,並且在這些資料中先萃取出其特徵,再將其轉換成分類器的資料格式。
第二步是我們必須決定哪一個特徵是當做我們的分類標準(Class label or goal),依據不同的問題我們所訂的分類標準也會有所不同。
接下來完成分類器後,我們必須評估所得到的型樣,這部分有兩種做法,一種是利用人工的方式,由網管專家來判斷哪些是有用的型樣。另一種是用人工智慧的方法,來自我學習判斷型樣。
最後的步驟就是重複的執行分類器,因為網路上的行為時時刻刻都在變動,所以我們要重複的執行分類器以確保型樣的可靠性。
技術應用的方式
接著我們就來深入探討每個環節的技術。
1.資料的萃取
先以資料特徵的萃取來說,為了能夠讓分類器能有效的找出我們所要的型樣,所以我們必須找出資料的特徵。在系統中紀錄的是錯誤發生時間,因為錯誤都是一瞬間發生,所以我們必須觀察錯誤的趨勢。但是並不是每一個錯誤都要紀錄起來,因為有許多錯誤都是固定的,而且不需要立即處理,我們所要預測的是未來會發生的錯誤。當錯誤發生時,網路會回應警告訊息,這些訊息就提供了網路錯誤發生的紀錄。當然這些特徵有可能是同一個錯誤發生的次數、在某一段時間內錯誤發生的平均次數以及錯誤發生的時間區段等等。
2.分類器的執行
再來是分類器的部分,分類器的方法這裡筆者就不再敘述了,因為前幾期已經介紹過,若讀者有興趣可以翻閱其他相關書籍。一個預測的模型(分類器),必須從取樣中的資料來建立並且用與取樣資料不同的資料來測試,才能確定模型的準確性。這裡我們可以使用隨機(Random)的方式將資料分為建立模型資料(Training Data)以及測試模型資料(Test Data),利用建立資料建立預測模型,再用測試資料加以測試,以得到正確的結果,這其中也牽涉到取樣的技術,在這裡筆者也探討。
3.評估型樣
最後是結果的部分,這裡就是我們的重心,要如何利用所找出來的型樣來預測。透過分類器我們找出許多的型樣,我們利用所要預測問題的條件來去掉一些型樣。例如:假設我們要預測的某個錯誤,這個錯誤有個型樣就是這個錯誤所發生時的時間區段數量大於某個整數值,我們可以透過這個型樣來預測這個錯誤。因此透過這樣的方式,我們可以預測許多錯誤的發生。
結語
假設網路上所有的問題不是發生的時間非常短暫,要不就是可以很快的修護,這樣就不需要去偵測重複發生長期性的錯誤。然而世上是沒有這麼美好的事,這種錯誤是存在的,我們必須使用某種機制,讓我們可以事先預測出這種錯誤。在預測錯誤時,我們必須先了解並非所有的錯誤都具有相同程度的重要性,我們必須透過一定程度的臨界值(例如:我們預測錯誤在時間區段內所發生的次數),來產生我們的型樣。另一個我們所必須認知的是,任何一個網路線路都會產生長期性重複錯誤,因此我們不能忽視這個問題。目前有許多的研究仍是針對資料挖掘在於網路管理的其他應用,相信還有其發展空間。