網路迷航?
在這21世紀初的經濟不景氣影響下,使得許多企業不得不尋求有利的法寶來提昇自我的競爭力,從電子商務、企業e化到現在的ERP、CRM。然而這些原先被認為是仙丹妙藥的法寶卻無法達到預期的效果,許多知名的大型網路公司或是電子商務網站,也因為獲利不盡理想紛紛在網路的舞台上下台一鞠躬。究竟出了什麼樣的問題,讓這個世界上最大的市場 - Internet 成了謎樣的百幕達三角洲,使許多企業大船迷失其中?
現在這團謎似乎漸漸地有了一個雛形的解答,就是CRM(Customer relationship management) - 客戶關係管理,這個在以往經常被忽略的層面,如今卻變成了企業的生存利器。但是如何去掌握企業與客戶的互動,如何藉由客戶關係的管理而達到獲取利潤的目的,卻又是另一個難題。這個難題目前最好的答案,看來就是資料挖掘(Data Mining)。
將Data Mining技術應用在客戶關係管理上,的確可以達到非常好的效果,但是Data Mining並不是只有這項用途而已,它是為了找尋隱藏在資料中的資訊而產生的技術,在這以資訊為導向的新世紀,Data Mining的應用範圍會越來越廣,而其技術也會愈來愈成熟,Data Mining的未來與遠景是值得期待的。
人工智慧新趨勢
以Data Mining的技術而言,具有人工智慧的趨勢是不可避免的。在較早的時期,電腦的運算速度並不快,然人工智慧的技術需要具有快速運算能力的電腦,例如模糊理論、類神經網路、基因演算法等,人工智慧也因此而無法被廣泛的採用。但今日電腦的運算速度已不可同日而語,使得沉寂一時的人工智慧技術又再度的復甦起來。
本系列前三期中,介紹了Data Mining目前的技術與應用的例子,其中並沒有上述幾個人工智慧技術的影子。以Data Mining的各種技術而言,其運算速度已經算是發展到了極致,所以追求縮短找尋型樣或是規則的時間已經不再是技術發展的重心,人們現在的焦點在所找尋出來的型樣和規則上。
以關聯式規則(Association Rule)為例,有兩個因素控制著找尋出來的規則:支持度(Support value)和可信度(Confidence value)。在找尋關聯式規則的時候,太低的支持度與可信度會產生過多的規則,也就是說會有許多對使用者毫無助益的規則,即所謂的垃圾規則。如何分辨何種規則才是對使用者有用的,以及如何調整支持度與可信度,的確非常的困難。
再以組群化技術(Cluster)為例,如何確保能將各個群組分的清楚,而且能分的正確很重要。這些問題因為人工智慧的介入,而有了變化。利用人工智慧自我學習與尋找最佳化的特性,使得Data Mining的技術更具有前瞻性,更能找尋出對使用者具有意義的型樣與規則。
利用人工智慧自我學習與尋找最佳化的特性,使得Data Mining的技術更具有前瞻性,更能找尋出對使用者具有意義的型樣與規則。
Data Mining應用,無限寬廣
Data Mining是基於取得資訊而誕生的技術,在今日脫穎而出成為新的資訊技術寵兒是可以想見的。以應用層面來看,Data Mining目前似乎只著眼在於企業間的客戶關係或是商業利潤關係的建構上。另一方面也因為電子商務的市場大餅,讓大家的焦點集中在網站與商務的利益上,反而忽略了Data Mining在於其他層面的應用。
目前Data Mining的層面可以說是相當狹小的,若依Data Mining的精髓,可以應用的層面應該廣到讓人無法想像,可說任何需要資訊的地方就有Data Mining的存在,以下就列舉幾個Data Mining的特殊應用,來大略了解Data Mining的妙用。
工業用途
在工業用途方面,Data Mining可用來決定生產流程的順序,進而達到生產的最佳效率與生產管理。以生產炭的流程為例,將生產炭時的流程,即爐火的溫度、炭的質量、以及其他的因素建立成一個生產資料庫。依據這個資料庫,可找尋出生產品質良好的炭的流程規則。
醫療用途
在醫療用途方面,醫療資源的浪費,一直都是醫院之間頭痛的問題。將醫師開藥的處方籤建立成資料庫,再利用Data Mining來找出資源浪費的原因。除此之外在研究中的還有依據長期病的病徵來找尋各病徵之間的關係,來幫助醫師做疾病的診斷。另外還有一個較為先進的應用,就是基因序列的解析。
除以上的例子外,在國外已有許多的研究機構利用Data Mining來輔助技術的發展,或作為資料分析的工具,這些都是在台灣還沒見到的層面,相信這些應用將會很快的在台灣出現。
勾勒Data Mining發展藍圖
從上述的技術與應用的兩個層面來看,Data Mining目前並非是一種普遍被接受的技術。在傳統產業方面,雖然辦公室早已電腦化,但只是將原先的人工處理的會計或是進銷存事務變成了電腦處理,亦或在生產製程中,原先需要的人工如今變成了機械。雖已達到便利的目的,但無法掌握使其產能增加或減少成本的資訊,進而提昇自我的競爭力,在企業行銷上亦是如此。
許多大型企業開始注意客戶的購物行為模式,了解客戶關係是企業競爭力的基礎,卻不是利用Data Mining技術而是利用行銷的經驗來判斷。這兩者之間的差別是,後者可能會忽略掉經驗之外的客戶關係。可以了解的是Data Mining雖還不普遍,但其潛力是不容忽視的。在台灣以現行的階段而言,似乎新技術的研發和應用的擴展不是首要之務,如何推廣Data Mining才是重點。
以台灣目前的資訊應用角度來看Data Mining的遠景,大約可勾勒出兩個發展藍圖:
客戶關係的處理
依上述所提的客戶關係管理層面是以較小的角度來探討。若以整個完整客戶關係管理的流程來看,只有Data Mining是不夠的,因為Data Mining必須依賴資料才能挖掘,因此資料庫的建立非常重要的。所以Data Mining的未來是必須與「資料倉儲」、「線上分析處理」結合才能發展的久遠。
資料倉儲能整合所收集來的資料,將所有的交易或是行銷資料匯入資料倉儲中,並加以處理,淘汰對於Data Mining處理無助益的資料屬性,能更精確的找尋出有意義的規則與型樣。
Data Mining必須依賴資料才能挖掘,因此資料庫的建立非常重要的。所以Data Mining的未來是必須與「資料倉儲」、「線上分析處理」結合才能發展的久遠。
網路上的應用
無庸置疑的這一方面應用必定是Data Mining未來的首要戰場。目前已有的應用有網站的建立、電子購物的行銷、網路教學機制、和網路廣告等。但是這些都跳脫不出商業行為的架構,資訊在網路的應用上應能更廣泛,資訊的需求相信在任何地方都比不上網路的多樣性。
網路安全機制的建構,就是一個Data Mining能夠充分發揮的地方。對於極需安全機制的網路安全交易來說,駭客就像是一個令人毛骨悚然的名詞。根據美國官方的統計,美國的網站受到駭客入侵而造成的損失,可高達數千萬美元之譜甚至更多。現在因為台灣的網路交易行為並不是非常的盛行,所以這樣的情形尚未發生,但是不久的將來這類的情況會不斷的上演。利用Data Mining,從駭客入侵的方式找尋出的規則來防止駭客的入侵,對於網路的交易機制相信能提供更高的安全性。
另一個未來對於網路技術的應用層面是網路警訊(Alarm)的關係管理。通常在網路系統發生問題前,系統會先發出一個警訊,利用Data Mining可以找出這些警訊之間的關聯性,進而在警訊發生時判斷是否會對系統造成嚴重的影響。
結論
上述的應用在國外已有一些專家在研究中,期待在不久的將來有產品問市,將會是網路發展的一大福音。筆者對網路技術方面的應用較為看好,以商業模式而說,客戶關係的管理會逐漸定型而成為一種模式,大家都可套用。然一種專業技術能夠蓬勃發展而不衰微,必定是因為技術能夠不斷的創新和進步,網路技術的日進千里是有目共睹的,在其上所需的資訊分析更是千變萬化,若是Data Mining能配合網路成長,相信未來能走的更長久也更具有價值。
(作者為網眼科技公司技術顧問,網眼科技為網路市場資訊分析系統專業公司)