因應網際網路資訊的快速發展,網絡用戶要找的資料有如大海撈針,為了滿足大眾對於資訊檢索的需求,於是搜尋引擎的服務便蘊育而生,搜尋引擎的發展已經與現代生活密不可分,搜尋引擎幾乎無所不搜無所不怪,人們習慣突然想到什麼,便直接打開搜尋引擎尋求答案,它對現今人類的影響力有目共睹,在此也篤定預測它對我們的影響將不僅僅是生活服務、廣告與客戶業務,甚至將會改變世界的樣貌。
或許我們很難想像這是甚麼情況,如同90年代搜尋引擎問世,同時Web的發展才剛起步,當下面對寥寥可數的網站,有誰會相信所有的資訊都可上網查詢? 然而今日將步入所謂「物聯網」時代,未來利用搜尋引擎達成「萬物聯網,搜尋萬物」的願景,將重新改變對搜尋引擎服務功能的認知,這是一個時代的機遇,且看過去搜尋引擎的發展歷史,讓我們推敲物聯網搜尋入口尚未成形的癥結,以及未來巨大市場潛力的真正原因。
搜尋引擎概念起始
圖一 : Archie被稱為現代搜尋引擎的始祖。(source:Archie) |
|
網際網路在人類史上是一件不折不扣的大事,有了網際網路的全球化普及的硬體鋪陳,全球的網際網路才能連接,因此思科無疑為網際網路發展奠定了根基。對於網路搜尋的發展概念,則可追溯1990年,蒙特婁大學三位學生Alan Emtage、Peter Deutsch、Bill Wheelan發明了Archie,當時全球資訊網還沒有出現,由於大量的檔案散佈在各個FTP主機中,查詢起來非常不便,而Archie恰恰可以自動索引Internet的免費FTP檔案資訊,並提供一種根據檔案名稱查詢所在FTP地址的方法,因此Archie被稱為現代搜尋引擎的始祖。然而最早提出網頁爬取資料技術的是WebCrawler,它是由Brian Pinkerton在1994年創建的,它最初是一個桌面應用程序,Brian藉此方法生成了網站的列表。
全球第一個瀏覽器--WorldWideWeb
網際網路發展的另一建樹則是瀏覽器,英國科學家Timothy John Berners-Lee是全球資訊網的發明者,1990年開發全球第一個瀏覽器--WorldWideWeb,儘管與現今使用的瀏覽器大不相同,但它還是引導了瀏覽器發展的核心思想,隨後Mosaic與Netscape進一步推動了瀏覽器的創新,使其具有更為直觀的介面,因此在當時大受歡迎。
1994年Netscape推出第一款全球資訊網瀏覽器,不僅佔據瀏覽器市場主導地位,同時開啟了全球資訊網上網熱潮,瀏覽器的發明帶領用戶使用網際網路可以更為簡單便利,以前瀏覽網際網路是極其複雜的,只有電腦專業人士才能上網,瀏覽器開啟了只要會用滑鼠和鍵盤就會上網的可能,毫無疑問,瀏覽器拉近了人類與網際網路資訊之間的距離,大大減少了人們搜尋資訊的時間成本,Netscape瀏覽器也成為了日後瀏覽器的發展原型。
網際網路拓荒者--Yahoo
圖二 : Yahoo起始制訂了網際網路產業的遊戲規則—開放、免費和營利的新型商業模式。(source:Yahoo) |
|
儘管擁有了瀏覽器的上網便利,茫茫網際網路中尋找自己想要的網站依然困難,1994年引發著楊致遠 (Jerry Yang) 和David Filo對網站的探尋,兩個年輕人創建一個分類查詢目錄,存放著兩人找到的網頁並發布到網絡上。
分類查詢其實是一個很簡單的創意,他們將它命名成 "Jerry and David's Guide to the World Wide Web”,其核心就是按照字母順序將站點分類,Yahoo的雛形因此誕生,它制訂了網際網路這個行業的遊戲規則—開放、免費和營利的新型商業模式,1996年Yahoo成立僅一年,便創下了上市時間最短的奇蹟。
1998年Yahoo成為世界最大的網際網路公司,當此巔峰際遇卻發生了轉折,搜索資訊一直依靠人工進行,未能以HTML的Meta參數導向自動化搜索技術,此外,1999年拒絕主動上門以100萬美元收購的Google,因為Yahoo一度認為用戶上網動機,在於瀏覽資訊,不存在目的性搜索,更要命的是,2000年還把搜索功能交給Google完成,無形中扶持了競爭對手。
現代搜尋引擎創建者-- Google
圖三 : Google的搜尋引擎架構收集全球資訊網快速成長。(source:Google) |
|
Google搜尋引擎的發展,始於1996年1月Larry Page和Sergey Brin,在史丹佛大學研究關於搜尋的專案,1997年W3C(World Wide Web Consortium)定義HTML的Meta參數,創建了搜尋引擎自動化搜索的環境,鑒於網頁上只有向外的連結網址,但無法看到指向這個網頁的連結的數量。
為了實踐網站連結數量決定排名的「Page Rank」機制,於是他們開始嘗試建立一個大量連結的資料庫,藉以找出每個網頁的連結會通向什麼網站,因此現代搜尋引擎架構—爬取 (Crawling) 、索引 (Indexing) ,也進而創建出排序 (Ranking)的機制。Page和Brin將這個搜尋引擎命名為「BackRub」,他們的構想在1998年8月獲得Sun Microsystems十萬美元的投資,繼而1998年9月他們在車庫建立了公司,搜尋引擎更改為「Google」名稱。Google的搜尋引擎架構收集全球資訊網快速成長,根據GoogleBlog公布索引資訊數量,1998年僅為25萬筆,2000年便成長到10億6千萬筆。
搜尋引擎的潛在商機
機會其實就在人人耳熟能詳的「物聯網」,物聯網最終以「萬物聯網,搜尋萬物」願景為目標,潛藏的市場指向線下的大數據藍海商機,然而提供線下搜尋與大數據服務的關鍵樞紐,實質的運作機制便是線下搜尋引擎,它可以接管用戶未來的生活服務,也接管未來實體世界的廣告與客戶業務,所以未來商店將不再需要招牌廣告,街頭的樣貌與生活方式因之改變,社會中的各層面資訊效能也因之提升,進而達到「人盡其用,貨暢其流」目標。
對於現有的市場規模估算,根據易觀智庫2019年中國線下市場數據顯示,佔據社會消費零售總額80%市場,是線上消費零售總額的四倍,規模達到大約30兆元人民幣,此將是中國線下導入線上發展的潛在商機,而全球線下市場的潛在商機可達16兆美元,所以物聯網商機可謂十分鉅大,雖然潛在商機並不等於物聯網平台的交易產值,但指標意義在於等同的市場覆蓋範圍,這也是線下搜尋引擎可以拓展市場的最大範圍。
線下搜尋入口的發展現況
當今網際網路進入行動服務時代,服務型態著重於用戶與實體資訊的連結關係,開始導向以人的位置為中心的服務價值,因此線下服務搜尋的需求與日俱增,然而搜尋引擎技術歷經90年代飛躍進展,轉眼已超過二十年光景,時至今日仍難以得見線下搜尋引擎身影。
綜觀現有線下搜尋應用形式,最大的改變就是普遍以App做為線下搜尋應用(應用例如,Uber、Mobike、Foodpanda等),但主流App採用資料串接架構,實際上是一種封閉系統,難以如同開放性的Web系統,去發展跨應用跨服務的整合入口,加上用戶安裝App數量十分有限,致使大部分App在用戶端沒有市場。
根據統計排名前十的App囊括85%以上流量,而且高達90%以上的殭屍App,形成嚴重的軟體資源浪費問題。雖然市面上已發展跨應用整合的線下搜尋入口,例如微信小程序、Amazon智能語音服務,Google地圖等系統,但這些方案整合線下移動服務的方法,幾乎著眼於串接App應用,對照搜尋引擎技術的發展佈局,似乎仍然欠缺完善架構與發展機制,因為服務源頭並非來自開放的Web資訊,而是意圖將主流的App應用導入自家的系統,在山頭林立且互搶資源的情況下,未來能成為線下搜尋入口的機會其實不易達成。
線下搜尋引擎發展的癥結
若把網站比喻成一項商品,商品的自由流通將保證市場最大繁榮,網際網路上的各個網站可以從搜尋引擎分享資訊並帶來流量,搜尋引擎如同組織一個雲端世界,將所有的雲端的服務與資訊連結起來,利用關鍵字搜尋Web內容,水平整合不同應用領域,達成跨領域、跨服務的資訊流通機制,所以若要突破App線下資訊流通的瓶頸,達到開放共享的最大服務價值,最終需要倚重一個線下搜尋引擎做為推手。
自2008年行動服務市場爆發以來,APP便成為了手機用戶的核心應用,因為便利於獲取用戶方位資訊,所以線下應用幾乎採用App方案,為了解決App資訊流通的根本問題,線下應用發展需回到Web方案,然而全球資訊網W3C仍未制定HTML線下應用規範,故全球開發者無法著力在Web線下應用開發,進而導致線下搜尋引擎也無法實現自動化資訊匯集機制。
於此之際,據悉「大千搜尋」平台業已發展線下搜尋引擎,也據聞「微信」正在佈局相關的線下搜尋方案,不過現階段無法以自動化資訊匯集機制,搜索資訊仍需依靠人工勘查,然而目前的線下服務應用幾乎採用App方案,以人工搜索適用的Web線下應用資訊,資訊數量將極其有限,最有效益的做法是將線下應用規範,提案到W3C協會成為HTML標準規範。
結論
儘管網際網路的創新多如繁星,搜尋引擎始終是那顆最耀眼的明星,因為網際網路前進的腳步,需要搜尋引擎巨輪帶領,所以幾乎沒有其他平台可以超越其價值,因而Yahoo曾經造就最大的網際網路公司,Google得以締造全球市值第二的紀錄,也從過去的發展歷程得知,成就偉大的公司的關鍵在於適時創新,但創新並非需要創造十分艱難的技術,比如Yahoo創建的分類查詢機制,則是以普通分類概念達成創新應用,而Google搜尋引擎的爬取與索引方法,則源自WebCrawler與Archie的第三方創意,而網站以被連結數量決定排名的「Page Rank」機制,則延伸自百度創辦人李彥宏的專利,事實上這些技術在一般軟體工程師眼中,並非具備甚高的發展門檻,而真正獲取成功的核心關鍵,則在於掌握最佳時機,提出一個創新應用想法與發展架構。
(本文作者黃柏堯為大千資訊科技創辦人兼執行長)
**刊頭圖(source:FRIS)