根据IEK(2012/11)整理自KIAT研究报告指出,自然语意理解技术可应用的载具多元,像是互动智能电视、互动智能车辆、智能手机与平板计算机等,发展至2016年将超过210亿美元。因此人机接口相关专利已成为国际智能终端大厂在智财权领域布局的重点,自然语意理解技术已成为语音技术发展的下一步。
工研院让国内语音识别与自然语言处理技术再进阶,21日发表全国第一套具对话能力的自然语意理解技术,并透过中文电影查询口语问答系统,进行内容与结果的多次互动询答,突破一般语音助理只能一次性问答的限制,展示自然语意理解技术实力,用户只要用最自然的说话方式,不需使用特定语法,就能轻松获得想要的答案,未来将可整合至智能电视、智能车辆等载具,是智能生活的明日之星。
工研院资通所所长吴诚文表示,随着3C产品快速迈向智能化方向发展,智能型行动装置均内建语音接口,用户可透过口语问答获得信息,简化搜寻模式,掀起一股口说自然语言系统应用的契机。目前市场产品多半以短句语音识别为主,自然语意理解能力有限;加上关键技术及专利多掌握在国外大厂,国内业者必须仰赖国外技术,布局市场不易。
因此工研院开发出国内第一套具对话能力「中文自然语意理解技术」,结合语音识别、语言理解、对话管理、知识库建构,在云端系统及巨量数据的快速运算下,可理解用户提出的叙述性问题回答正确内容, 充分展现对自然语句高度理解能力,更能依据不同产业需求,扩充到不同的应用领域,进而与台湾手机大厂、系统业者、或服务业者结合,提供自主技术的自然语意理解人机接口或应用服务。
同时,工研院也将此系统创新应用到电影领域,结合开眼电影网网站数据,开发出全球第一套可理解语意、叙述性问句、可纠正问句的「中文电影查询口语问答系统」。这套电影查询口语问答系统,为运用云端服务器与智能型手机应用程序所建构的服务性系统,目前可查询2001年起约13年,共1万4千部电影信息,针对内容与结果可进行多次互动询答,一部服务器可同时处理50笔用户问句,对话成功率已达88%。
用户只要对着智能型手机,以最自然的方式提问,即使提问中有错误,电影查询口语问答系统依然可运作,例如用户说出「有没有描述少年在海上漂流的电影?」,工研院「中文电影查询口语问答系统」则会回答「我找到4部内容关于在海上漂流的电影,您还要找其他的电影吗?」的交互式对话,有别于一般语音助理回答听不懂或答非所问的窘境。