今年2月,知名O'Reilly 出版商在美國舊金山Westin St. Francis 旅館舉辦為期四天的全球性P2P(Peer-to-Peer)第一次產業會議,雖值網路業寒冬,但從參與的創投業者及科技業者之盛況,概略說明P2P在資訊產業的未來地位。筆者適逢此會,穿梭於各討論議題中,深感P2P的潛力。
此次會議主體為技術及投資性質,提供各國與會者進行專業資訊交換,探討P2P目前的生態及未來的方向,同時提供創投業者進行多元評估,尋求產業機會。然而,令人意外的,此次會議並沒有針對造成唱片業者震撼,目前仍在引領風騷的MP3音樂檔案下載軟體Napster,進行稍具規模的討論,僅被極輕度地提及。會議之主軸擺在依序Gnutella、FreeNet、P2P在企業的應用、以及其他元件技術如安全及檔案封裝格式等等。
筆者認為捨Napster議題不談的原因只有一個,那就是Napster已佔據了檔案分享(File Sharing)的這塊市場,在一個集創投與頂尖資訊業者的產業會議裡,談論此議題已不具太大意義。在全球擁有六千萬註冊會員,隨時有超過數百萬人連線進行檔案交換的強大優勢下,Napster已經驗證了「先佔先贏,大者恆大」的特性。後繼競爭者欲進入這塊以英語系為主的市場,具體地面臨到極高度的門檻,除非從文化差異做區隔。國內類似的經營模式ezPeer,就是著重華語市場,掌握文化的差異成為其優勢。兩者使用的技術類似,詳細點將於後續文中介紹。
P2P是一種標籤
P2P是一種標籤而不是一個定義,它強調的是網際網路架構之下端點對端點(Peer-to-Peer)、程式對程式(Program-to-Program) 、電腦對電腦(PC-to-PC),人與人間(People-to-People)四重直接的關係。peer具同儕之意思,它可以是個軟體程式,同時擁有網路上客戶端(client)和伺服端(server)的雙重能力,兩個peers之間的溝通是兩組客戶端對伺服端、伺服端對客戶端的連線關係。電腦對電腦的關係是指兩端硬體資源透明(transparent)分享,這些資源包括硬碟儲存、計算處理、以及上網能力。而人與人間的關係是指藉傳訊來進行溝通,層次可以是從聊天訊息至心靈交流。
P2P是如此地C2C(消費者對消費者),它具備幾項特性來支援網路商業C2C應用。
簡單性(Simplicity)
它簡化了網路連線的過程,直接應用網址(IP)連線,使用者不再需要記住連線對方的網域名稱(Domain Name),移走了看似簡單但對泛泛大眾而言卻是煩瑣的網路設定。
透明性(Transparency)
連線對方的所在是透明的,每一個使用者可以與其他使用者進行直接連線,互相知道對方在做什麼,不同於登入一個網站的使用者間是互不認識的,不知道對方在做什麼。
立即性(Immediacy)
因為採直接連線,使用者間可以進行立即溝通,增加時效性。
P2P核心技術(尤其指Napster類者)是立即傳訊(Instant Messaging),這種機制採用國際RFC1459之IRC(Internet Relay Chat Protocol)協定的部份標準。此技術已存在多年,傳訊可以是及時的,也可以是非同步的(Asynchronous)。IRC本身是一個會議傳訊系統,它是應用在分散式伺服主機連線之上,伺服器扮演接受客戶端連線以及轉接訊息至其他伺服主機上的雙重角色,而一個客戶端僅連線至一個伺服器,每一個客戶端是藉其暱稱及其所連線的伺服器名稱來辨認。
再者,搜尋引擎(Search Engine)以及檔案傳輸(File Transfer, FT) 是P2P檔案分享的核心技術,結合立即傳訊技術,形成了(圖一)所示的基礎結構。
混合式P2P-Napster/ezPeer
Napster以及ezPeer之基本運作分為五個層次:由左至右,分別是廣大的使用者、使用者所提供的資訊內容、中介的網路連線服務、資料庫索引管理與查詢之電腦伺服群組、以及個人或團體所提供的內容服務。
使用者個人電腦透過中介的網路連線服務,連接到伺服電腦群組其中的一台之後,將分享檔案之索引「上架」至伺服電腦裡以建立資料庫,供其他所有使用者索引查詢。資料庫扮演媒介的角色,告知使用者A何處有他想要的檔案,當使用者A確定要從使用者B取得時,AB兩點即刻建立連線,進行檔案內容之傳輸交易。
伺服媒介平台是由多個電腦群組所構成,每一個群組是由4~5台電腦伺服器藉由網內網路相互串接而成,某種程度而言,具有容錯(Fault Tolerant)的能力。群組與群組間並沒有採直接線上溝通,然而藉著中央負載平衡控管,使用者可橫跨各群組而毫無痕跡。
每一個使用者本身(某種程度而言)是數位資訊內容提供者,當使用者眾,資料庫所累積到的分享檔案數呈倍數成長。除此之外,專業的內容提供者也可將資訊上架給位於中間的電腦伺服群組,提供B2C服務。總體而言,資訊內容的累積提供給個人的是一個知識管理平台。
此架構是一種分散式(distributed)運算及集中式(centralized)管理之混合體,它是夠分散地,因為檔案內容傳輸發生在使用者端點之間,並未牽涉到伺服端,允許各端點之自主性(Selfishness)。當眾多傳輸同時發生時,運算負載與資料流量是平均分散各端點的。此架構也是夠集中地,因為中心伺服群組管理並組織所有使用者的檔案搜尋索引(Index)以及網路位址(IP Address)兩種資料庫,前者提供檔案快速指認的功能,而後者提供使用者間相互認知(Recognition)的機制,使用者藉交易對象的暱稱(ID)而對應至其網路位址。
分散式P2P-GnutellaNet
如(圖二),GnutellaNet之運作是一種類似電話連線網路,呈現一種多重樹形,各節點提供轉接的服務。當登入網路後,首先它盡可能告訴你,網路現在有多少你的平行同儕(horizontal peers),也就是對你的歡迎。不過,你僅認識鄰近同儕,他們其中的一位再認識其同儕,依此類推而擴展至整個網路。
在此架構下,當使用者欲詢問某一個檔案時,他透過所有鄰近之同儕將此詢問傳話下去。當中任何一個同儕聽到此傳話時,就會繼續傳話下去給其他同儕,如此繼續下去。任何擁有此檔案的使用者會反方向地傳話回去,說明我有這個檔案,在回傳的過程中,沒有同儕知道誰是原始的詢問者,只是繼續傳話下去,即使回傳至詢問者的鄰居,他也不知道下一批傳話的對象當中有一位就是詢問者。
雖然Gnutella利用幾個伺服器來暫存同儕的連線資訊,方便新使用者加入,但運作時並沒有集中管理,是完全分散式地,任何一個節點(同儕)擁有完全相等的能力。然而某個位於流量繁忙通道上的節點,可能會因過多的傳話而造成堵塞。
混合式vs分散式
以Napster為代表的混合式P2P和以Gnutella為代表的分散式P2P各具特性,前者常被質疑的一點是因其具單點脆弱性(point of control) ,因為它採集中式管理,是一個易受政治干擾的點,沒有了它,其他整個分散的使用者將因無協調機制而停頓。而後者分散式P2P雖然無此問題,但卻遭受到以下的質疑:
* 虛擲(overhead)流量可能拖垮網路,因為資訊利用耳語相傳的方式散播,在一次詢問過程中,實質有效連線可能只佔總詢問量極少數的比率,造成虛擲過高。據此,當混合式P2P已經達到數百萬至千萬連線數時,分散式P2P如何將連線數從數千增加至一萬呢?
● 如何建立消費者與企業的關係?分散式P2P不具集中式管理,無法進行訊息推播(information push),企業將無切入點來進行B2C行銷交易等。
● 如何做群組(grouping)?FreeNet的代表曾經回答說「因為人們是地域性地分散,FreeNet有興趣的是連結人們而不是組織他們」,這種迴避性的回答,說明了分散式P2P執行群組的難度。因為使用者間不容易自我組織,特定意識之「群組」難形成。
混合式P2P是一個絕佳的媒體通路,容易形成「社群」(Community)、「群組」(Grouping)、以及「個人化」(Personalization)三層架構。使用者匯集在同一個通路,自然而然形成社群,如ezPeer形成多媒體社群。再者,社群經營具易於管理,口耳相傳的特性,很容易在社群裡進一步地形成「次文化」群組。譬如衍生爵士樂、旅遊以及賞鳥之各次文化。除了這種依性向而形成的群組之外,其他依互動式投票以及民意調查等,也可組織各自群組。最後,P2P可深植個人化經營,使用者已因Peer的技術而有當家做主的自我價值,再輔以集中管理所提供的統計服務,個人的特質就被突顯出來。
P2P待克服的議題
P2P待克服的議題包括管理(management)、安全(security)、互信(trust)、以及臨場(presence),其中的一些議題並不是顯而易見的容易:
● P2P對企業而言將創造不少的優勢,譬如降低硬體投資與協力工作等。然而,分散式軟體需要安裝、設定、更新以及缺乏監控系統(monitoring system),都將成為IT人員反抗P2P的阻力。因此,技術已在那裡,如何平衡優勢與阻力將成為P2P須克服的議題之一。
● P2P解放了個人電腦,將之推向網際網路的邊緣,然而卻開了一個安全的隱憂。重要的是並不是P2P程式不安全,而是它暴露了個人電腦的所在,此種隱憂可以藉防火牆來減輕。
● 使用者互信是P2P平台的關鍵,機制難度高。短期只能認定P2P是高層次互信,使用者必須相信對方。一種暫時性的解法,可以提供類似eBay的信用評鑑系統,讓使用者主動回饋並互相評鑑。
● 臨場包含兩個層次,個人電腦是否可以被連接以及使用者是否待機,一個離開電腦旁邊的使用者與不進行P2P互動的使用者,是無法被區別的。
因此從發展趨勢來看,未來幾種產業將從P2P模式受益,如公信產業、元件廠商如檔案封裝加密、甚至於數位智權管理(Digital Right Management) 等。然而,從高唱在網際網路上自由開放,消費者至上的角度來看,為了維護智權,或建立任何妨礙使用者習慣的機制,是否會造成抗拒而嚇跑消費者,重蹈網路泡沫的覆轍,值得進一步評估。
結語與預測
P2P最可貴之處在於網路資源整合與累積:未來數以億計的CPU以及數以百億計的硬碟位元將被整合於網際網路上,使用者共享了整個資源,而不是過去使用者與網站之間單向資源而已。個人電腦因此被升級,它不再是躲在網路背後的一具瀏覽器,它將是網路世界上的一個附加價值,也是網路世界邊際的一個設備(Device)。同時,P2P繞過網域名稱伺服(Domain Name Server, DNS)的機制,創造一個遠離DNS的世界。最後,P2P挑戰了單向Web的存在,逼使了Web業者思考雙向網頁(Two-Way Web)。
五位與會舊金山P2P會議的專家,包括一位資訊媒體業者以及四位資訊廠商執行長,對未來五年的資訊產業進行預測投票。這位媒體業者和其中一位執行長投給P2P,另外一位將票投給電子郵件系統,一位投給分散式運算系統(P2P是分散式運算的一種延伸),最後一位預測集中式(指Web)與分散式擁有各半的機會。
就同樣以廣大消費者為對象的Web與P2P而言,筆者也在此作一個預測。商業經濟面上,Web的階段任務已完成,接下來網際網路的舞台是提供給P2P以及分散式運算來發揮。技術層面上,Web還會繼續存在,只是它將扮演技術整合的一個支援角色。