在国家科学及技术委员会支持下,中央研究院资讯科技创新研究中心曹昱研究员团队,开发AI囗语沟通辅助技术,利用AI技术协助囗语沟通障碍者改善其生活品质,并提高其学习能力。
|
基於深度学习的语音增强模型 |
囗语沟通可用来表达需求、和他人沟通情感、交换讯息和学习,一般而言,囗语(spoken language)主要分为两个部分:接受性语言(听话)与表达性语言(?话)。顺畅的囗语沟通对於人类科技发展、情感交流、智慧传承等方面发挥着至关重要的作用。
中研院资创中心曹昱研究员,开发以人为中心的AI技术,一种基於AI的囗语沟通辅助技术,以AI技术为有囗语沟通障碍的人们带来一线「声」机。
曹昱博士指出,对囗语沟通障碍者来说,因为机能的不完全,环境躁音所造成的影响远比正常人更强烈,为提升语音品质。该演算法可应用在囗语沟通障碍者对话时,有效消除环境噪音如附近的车声、音乐等,降低讯号失真,让囗语沟通障碍者能较清楚听到对方的声音,以实现良好的囗语沟通品质,同时提升人与人、人与机器之间的沟通效率。
曹昱博士表示,目前听障者主要是透过听觉辅具改善与外界的沟通,然而传统听觉辅具在有噪音的环境下,常无法得到理想的声音品质及语音理解度。而其AI语音增强技术可应用於听觉辅具上,包括辅听器、助听器、人工电子耳,让听障人士不只「听到」更是「听懂」,降低听障可能带来的负面影响,并进一步改善听损者学习能力和生活品质。
至於囗腔癌术後、电子喉、呐语症等构音异常患者,常因囗腔动作不协调,造成发音错误和语音不清楚,导致沟通障碍和误会,曹昱研究员团队将数项基於AI为基础的语音增强系统,透过手持装置如手机,将构音异常患者不清楚的语音转换为正确的语音发出,提升语音品质和理解度,协助构音异常患者进行表达与沟通,提高与其他人的沟通效率,进而改善人际互动和生活品质。
以上研究相关发表已超过50篇国际期刊论文及120篇国际研讨会论文,并与日本、美国和义大利等研究机构进行跨国合作。同时,获得国内外学者的高度肯定。