與他人進行遠端溝通、創作或消費數位內容,甚或學習使用新裝置時,介面是與機器產生互動的唯一方式。人機互動的效果端賴如何模仿人際互動,亦即人機介面讓使用者感覺自然的程度。這必須整合同一介面下的各種溝通模式,這些模式應盡可能、甚至應該解決所有使用狀況,整合成自然的使用者介面。
人機介面市場已形成語音、手勢及觸控等三大介面模式,且均有硬體與軟體業者涉足,技術方面也採用各種不同方法,但鮮有業者能跨領域發展。
1. 語音辨識
語音辨識亦即從聲音指令產生機器動作,是最為成熟且即將進入生產成熟期的一種模式,但語音轉語音翻譯及自然語言辨識等其他相關衍生技術,目前仍屬發展初期。
上述領域業者間也存在相互競爭的技術重疊部分。像Nuance、telisma、微軟、IBM、三星與蘋果,多多少少在中介軟體與應用層的部份結合了三項技術(語音辨識、語音轉語音翻譯及自然語言辨識)。
這些領域中,多數公司仰賴商品化的現成零件以打造自家的麥克風系統、喇叭、音頻放大器與處理器。Sensory、飛索(Spansion)等業者,則是專門製造語音處理裝置。
2. 手勢控制
雖然支援的手勢相對仍顯粗糙,且未經標準化(業界仍未針對特定指令訂定統一手勢),只要自由揮動四肢便能啟動機器的想法依然相當吸引人,因為使用者只輕鬆移動手指、手部或手臂,即可上網瀏覽、閱讀資料或搜尋選單。
結合手勢控制與語音辨識可增進自然的機器互動,因為這是溝通時最常使用的兩種模式。不過,下面幾家手勢控制業者並未直接涉入語音處理技術:硬體:PMD;中介軟體:Omek;系統:PrimeSense以及SoftKinetic。
3. 觸控控制
螢幕觸控技術目前仍未臻至成熟,但五個手指以上的多點觸控支援可望在2年內進入生產成熟期(Plateau of Productivity)。觸控手勢的標準正逐漸成形且相當普及,尤其是針對小型電子設備。但觸控螢幕使用體驗在某方面仍無法比擬鍵盤文字輸入的體驗:亦即反饋(feedback)。除了螢幕顯示視覺線索的改變,在觸控螢幕上打字不會有太多堪用的反饋。雖可加上按鍵音,但就人體工學來說仍不如反饋直接,且較易令人分心。
以電流刺激壓電材料進而產生機械式震動,藉此提供觸覺式回應 — 也就是觸覺反饋(haptics)— 來補足觸控技術的不足,此一作法相當合適但所費不貲。觸控目前仍為新興科技,要達到生產成熟期可能尚需8年。
(作者為Gartner研究總監Adib Carl Ghubril)