Gartner：最自然的人机接口 - 手势加语音控制

		│新东西市集│东西讲座│影音频道│出版中心│智动化专区│
	元件次系统自动控制

最新动态

产业快讯

整合创新X智造未来TIMTOS 2025 聚焦AI新商机

汽配及移动科技产业，叁展热烈报名中!

CTIMES/SmartAuto / 新闻 /

Gartner：最自然的人机接口 - 手势加语音控制

【CTIMES / SMARTAUTO ABC_1 报导】 2012年10月17日星期三

浏览人次：【4033】

与他人进行远程沟通、创作或消费数字内容，甚或学习使用新装置时，接口是与机器产生互动的唯一方式。人机互动的效果端赖如何模仿人际互动，亦即人机接口让用户感觉自然的程度。这必须整合同一接口下的各种沟通模式，这些模式应尽可能、甚至应该解决所有使用状况，整合成自然的用户接口。

人机接口市场已形成语音、手势及触控等三大接口模式，且均有硬件与软件业者涉足，技术方面也采用各种不同方法，但鲜有业者能跨领域发展。

1. 语音识别

语音识别亦即从声音指令产生机器动作，是最为成熟且即将进入生产成熟期的一种模式，但语音转语音翻译及自然语言辨识等其他相关衍生技术，目前仍属发展初期。

上述领域业者间也存在相互竞争的技术重迭部分。像Nuance、telisma、微软、IBM、三星与苹果，多多少少在中间件与应用层的部份结合了三项技术（语音识别、语音转语音翻译及自然语言辨识）。

这些领域中，多数公司仰赖商品化的现成零件以打造自家的麦克风系统、喇叭、音频放大器与处理器。Sensory、飞索（Spansion）等业者，则是专门制造语音处理装置。

2. 手势控制

虽然支持的手势相对仍显粗糙，且未经标准化（业界仍未针对特定指令订定统一手势），只要自由挥动四肢便能启动机器的想法依然相当吸引人，因为用户只轻松移动手指、手部或手臂，即可上网浏览、阅读数据或搜寻选单。

结合手势控制与语音识别可增进自然的机器互动，因为这是沟通时最常使用的两种模式。不过，下面几家手势控制业者并未直接涉入语音处理技术：硬件：PMD；中间件：Omek；系统：PrimeSense以及SoftKinetic。

3. 触控控制

屏幕触控技术目前仍未臻至成熟，但五个手指以上的多点触控支持可望在2年内进入生产成熟期（Plateau of Productivity）。触控手势的标准正逐渐成形且相当普及，尤其是针对小型电子设备。但触控屏幕使用体验在某方面仍无法比拟键盘文字输入的体验：亦即反馈（feedback）。除了屏幕显示视觉线索的改变，在触控屏幕上打字不会有太多堪用的反馈。虽可加上按键音，但就人体工学来说仍不如反馈直接，且较易令人分心。

以电流刺激压电材料进而产生机械式震动，藉此提供触觉式响应 — 也就是触觉反馈（haptics）— 来补足触控技术的不足，此一作法相当合适但所费不赀。触控目前仍为新兴科技，要达到生产成熟期可能尚需8年。

(作者为Gartner研究总监Adib Carl Ghubril)

關鍵字：人机接口手势控制语音识别触控 Nuance IBM Microsoft

comments powered by Disqus