根據IEK(2012/11)整理自KIAT研究報告指出,自然語意理解技術可應用的載具多元,像是互動智慧電視、互動智慧車輛、智慧手機與平板電腦等,發展至2016年將超過210億美元。因此人機介面相關專利已成為國際智慧終端大廠在智財權領域布局的重點,自然語意理解技術已成為語音技術發展的下一步。
工研院讓國內語音辨識與自然語言處理技術再進階,21日發表全國第一套具對話能力的自然語意理解技術,並透過中文電影查詢口語問答系統,進行內容與結果的多次互動詢答,突破一般語音助理只能一次性問答的限制,展示自然語意理解技術實力,使用者只要用最自然的說話方式,不需使用特定語法,就能輕鬆獲得想要的答案,未來將可整合至智慧電視、智慧車輛等載具,是智慧生活的明日之星。
工研院資通所所長吳誠文表示,隨著3C產品快速邁向智慧化方向發展,智慧型行動裝置均內建語音介面,使用者可透過口語問答獲得資訊,簡化搜尋模式,掀起一股口說自然語言系統應用的契機。目前市場產品多半以短句語音辨識為主,自然語意理解能力有限;加上關鍵技術及專利多掌握在國外大廠,國內業者必須仰賴國外技術,佈局市場不易。
因此工研院開發出國內第一套具對話能力「中文自然語意理解技術」,結合語音辨識、語言理解、對話管理、知識庫建構,在雲端系統及巨量資料的快速運算下,可理解使用者提出的敘述性問題回答正確內容, 充分展現對自然語句高度理解能力,更能依據不同產業需求,擴充到不同的應用領域,進而與台灣手機大廠、系統業者、或服務業者結合,提供自主技術的自然語意理解人機介面或應用服務。
同時,工研院也將此系統創新應用到電影領域,結合開眼電影網網站資料,開發出全球第一套可理解語意、敘述性問句、可糾正問句的「中文電影查詢口語問答系統」。這套電影查詢口語問答系統,為運用雲端伺服器與智慧型手機應用程式所建構的服務性系統,目前可查詢2001年起約13年,共1萬4千部電影資訊,針對內容與結果可進行多次互動詢答,一部伺服器可同時處理50筆使用者問句,對話成功率已達88%。
使用者只要對著智慧型手機,以最自然的方式提問,即使提問中有錯誤,電影查詢口語問答系統依然可運作,例如使用者說出「有沒有描述少年在海上漂流的電影?」,工研院「中文電影查詢口語問答系統」則會回答「我找到4部內容關於在海上漂流的電影,您還要找其他的電影嗎?」的互動式對話,有別於一般語音助理回答聽不懂或答非所問的窘境。