隨著各項智慧輸入法的發展以及iPhone 4S 的Siri首開行動裝置搭載聲控功能的風潮,語音輸入也越來越普遍。語音輸入之所以會流行,最主要的原因是其有非常合乎人的自然行為習慣,利用機器做語音辨識,瞭解人說話的意圖,自動完成各項任務,就是當前最熱門的Siri可以達成的事情。
近日,英特爾也積極投入語音辨識開發,其實驗室展出一款Ultrabook™以及智慧會議助理(Smart Meeting Assistant),能夠擷取人們的談話內容,將聲音轉為文字,並在螢幕上顯示即時字幕。隨後透過雲端翻譯服務,就能把對話翻譯成母語,相當適用於跨國會議上。
其中,拜賜於自然語音理解(NLU)技術的漸趨成熟,並在個人電腦、行動裝置以及電視領域攻城掠地,Nuance大中華區總經理鄭裕慶強調,通過語音應用,人們無需再歷經繁瑣而複雜的使用者介面操作,只要通過自然語句說出意圖,便可直接獲取內容。Nuance亞太區高級銷售工程總監Stuart Sharpe強調:「簡單、快速是我們語音輸入追求的目標。」
NLU這樣的技術,能夠帶領語音輸入進入下一個層次-語音智慧搜尋。要讓自然語音理解在第一時間理解並執行,必須仰賴雲端背後資料庫的建構。Nuance亞太區高級銷售工程總監Stuart Sharpe提到:「Nuance主力不在於語音辨識這一塊,而是在自然語分析,重點在於如何分析、再去理解,給出答案。這樣的答案並非是給你多列的網址,而是正確答案。」由此可知,相信,在不久的將來,大街上拿著手機不再是用手機輕輕敲擊,而是只需要對著手機說出話,一切事情皆好辦。