在國家科學及技術委員會支持下,中央研究院資訊科技創新研究中心曹昱研究員團隊,開發AI口語溝通輔助技術,利用AI技術協助口語溝通障礙者改善其生活品質,並提高其學習能力。
|
基於深度學習的語音增強模型 |
口語溝通可用來表達需求、和他人溝通情感、交換訊息和學習,一般而言,口語(spoken language)主要分為兩個部分:接受性語言(聽話)與表達性語言(?話)。順暢的口語溝通對於人類科技發展、情感交流、智慧傳承等方面發揮著至關重要的作用。
中研院資創中心曹昱研究員,開發以人為中心的AI技術,一種基於AI的口語溝通輔助技術,以AI技術為有口語溝通障礙的人們帶來一線「聲」機。
曹昱博士指出,對口語溝通障礙者來說,因為機能的不完全,環境躁音所造成的影響遠比正常人更強烈,為提升語音品質。該演算法可應用在口語溝通障礙者對話時,有效消除環境噪音如附近的車聲、音樂等,降低訊號失真,讓口語溝通障礙者能較清楚聽到對方的聲音,以實現良好的口語溝通品質,同時提昇人與人、人與機器之間的溝通效率。
曹昱博士表示,目前聽障者主要是透過聽覺輔具改善與外界的溝通,然而傳統聽覺輔具在有噪音的環境下,常無法得到理想的聲音品質及語音理解度。而其AI語音增強技術可應用於聽覺輔具上,包括輔聽器、助聽器、人工電子耳,讓聽障人士不只「聽到」更是「聽懂」,降低聽障可能帶來的負面影響,並進一步改善聽損者學習能力和生活品質。
至於口腔癌術後、電子喉、吶語症等構音異常患者,常因口腔動作不協調,造成發音錯誤和語音不清楚,導致溝通障礙和誤會,曹昱研究員團隊將數項基於AI為基礎的語音增強系統,透過手持裝置如手機,將構音異常患者不清楚的語音轉換為正確的語音發出,提升語音品質和理解度,協助構音異常患者進行表達與溝通,提高與其他人的溝通效率,進而改善人際互動和生活品質。
以上研究相關發表已超過50篇國際期刊論文及120篇國際研討會論文,並與日本、美國和義大利等研究機構進行跨國合作。同時,獲得國內外學者的高度肯定。