与他人进行远程沟通、创作或消费数字内容,甚或学习使用新装置时,接口是与机器产生互动的唯一方式。人机互动的效果端赖如何模仿人际互动,亦即人机接口让用户感觉自然的程度。这必须整合同一接口下的各种沟通模式,这些模式应尽可能、甚至应该解决所有使用状况,整合成自然的用户接口。
人机接口市场已形成语音、手势及触控等三大接口模式,且均有硬件与软件业者涉足,技术方面也采用各种不同方法,但鲜有业者能跨领域发展。
1. 语音识别
语音识别亦即从声音指令产生机器动作,是最为成熟且即将进入生产成熟期的一种模式,但语音转语音翻译及自然语言辨识等其他相关衍生技术,目前仍属发展初期。
上述领域业者间也存在相互竞争的技术重迭部分。像Nuance、telisma、微软、IBM、三星与苹果,多多少少在中间件与应用层的部份结合了三项技术(语音识别、语音转语音翻译及自然语言辨识)。
这些领域中,多数公司仰赖商品化的现成零件以打造自家的麦克风系统、喇叭、音频放大器与处理器。Sensory、飞索(Spansion)等业者,则是专门制造语音处理装置。
2. 手势控制
虽然支持的手势相对仍显粗糙,且未经标准化(业界仍未针对特定指令订定统一手势),只要自由挥动四肢便能启动机器的想法依然相当吸引人,因为用户只轻松移动手指、手部或手臂,即可上网浏览、阅读数据或搜寻选单。
结合手势控制与语音识别可增进自然的机器互动,因为这是沟通时最常使用的两种模式。不过,下面几家手势控制业者并未直接涉入语音处理技术:硬件:PMD;中间件:Omek;系统:PrimeSense以及SoftKinetic。
3. 触控控制
屏幕触控技术目前仍未臻至成熟,但五个手指以上的多点触控支持可望在2年内进入生产成熟期(Plateau of Productivity)。触控手势的标准正逐渐成形且相当普及,尤其是针对小型电子设备。但触控屏幕使用体验在某方面仍无法比拟键盘文字输入的体验:亦即反馈(feedback)。除了屏幕显示视觉线索的改变,在触控屏幕上打字不会有太多堪用的反馈。虽可加上按键音,但就人体工学来说仍不如反馈直接,且较易令人分心。
以电流刺激压电材料进而产生机械式震动,藉此提供触觉式响应 — 也就是触觉反馈(haptics)— 来补足触控技术的不足,此一作法相当合适但所费不赀。触控目前仍为新兴科技,要达到生产成熟期可能尚需8年。
(作者为Gartner研究总监Adib Carl Ghubril)