早在多年前,資訊業界便已投入許多心力在語音辨識技術上,初期多在語音的正確辨識,如何將說出的話辨識成正確的字詞。進一步的,業界開始將正確辨識出的字詞用於電腦操作,例如喊「重新開機」,電腦就真的重新開機。
更進一步的,業界開始將人工智慧(AI)技術引入,如何讓電腦了解說話者的語意需求,從而由電腦提供解答,例如畫面結果顯現或語音回覆,此方面以2011年Apple為iPhone提出的Siri語音辨識而受到更大的重視。
當然,也因為半導體技術進步與Internet普及,使廣大群眾的語音命令可以集中回傳,由遠端伺服器群大量學習,讓語意辨識精準度大進。
為因應Siri,2014年4月Microsoft揭露其Cortana語音辨識技術技術,可用於多種裝置上,包含Windows 10電腦與平板、Xbox One遊樂器,Microsoft Band/Band 2智慧手環,甚至是Android、iOS上。
在 Apple與Microsoft後,Amazon也加入戰局,於2014年11月提出Amazon Echo裝置,初期只提供給Amazon Prime的用戶或受邀的用戶,2015年6月正式全面發售。Amazon Echo放置在家中,只要先呼喊「Alexa」,而後講出您的需求,例如要查天氣、要查球賽比數等,Amazon Echo就會用語音回覆。
有 趣的是,Amazon Echo的相關技術有開放出來(專案名稱:Raspberry Pi + Alexa Voice Service),有興趣的人可以下載其軟體,安裝到樹莓派(Raspberry Pi, RPi)電腦上,用樹莓派電腦實現與Amazon Echo相同的家庭語音應用。
到了2016年5月Google也加入戰局,提出Google Home裝置,其語音辨識技術為Google Assistant,與Amazon Echo相同,是採放於家中,供所有家庭成員口語詢問、口語聽答的語音辨識、人工智慧裝置。
關於Amazon Echo、Google Home這種新興裝置目前有兩個中性代稱出現,一是簡單稱為Smart Speaker(智慧喇叭),另一則是比較繞口的Voice-Enabled Wireless Speaker(語音啟動的無線喇叭)。
Smart Speaker硬體產品算是登場了,但市場會否就此開展呢?可能有些疑問,一種看法認為,回家之後將iPhone採在客廳中央,並啟動Siri功能,功效類同於Amazon Echo、Google Home,因而沒有市場。
另一看法認為,Smart Speaker可以視為無線藍牙喇叭的功效規格升級,追加麥克風、追加語音辨識與雲端連線等,是現有無線喇叭市場的擴大。如果Smart Speaker市場真的開展,Apple也不會太擔心,Apple現有居家產品進行些許改版,如AirPort系列、Apple TV等,一樣可以輕鬆進入Smart Speaker市場。
即便Smart Speaker市場開展了,硬體市場也非重點,目前看來Amazon Echo還可以賣179.99美元,雖然還不知道Google Home要賣多少錢,但一個35美元的RPi也能達到相近的功能,未來必然會快速降價,成為紅海市場。真正的重點是如何從語音過程中產生商機,如電子購物 下單,或某種語音收費訂閱服務等。
再換另一個設想,Smart Speaker快速普及,硬體價格低到某個程度時,Amazon、Google有可能放棄官方版硬體,而採行軟體技術授權認證,未來這類產品的包裝盒上有 可能出現「Powered by Google Assistant」或「Amazon Alexa Certified」等字樣,事實上這些語音辨識技術業者也是期望能做到各裝置均可用,實現Siri Everywhere、Cortana Everywhere願景。
最後,居家語音助理過去不是沒有失敗的例子,法國Violet公司的娜芭兔 (Nabaztag,2005年即發展,2012年新版改名Karotz)似乎就沒有更大更快速的發展,日本也有許多家庭語音助理產品,能夠遙控家電,同 樣未有更大市場。相近的技術與應用,換成科技大廠主張與提倡,是否就能獲得廣大迴響,仍有待觀察。