科技部今(25)日於国立台湾科技大学举办「AI语音数据资料集」上线发表会。首批开放400小时「科技大擂台 与AI对话」竞赛所使用的语音试题资料中,除了自行录制的资料外,更结合内政部的警政署警察广播电台及教育部的国立教育广播电台提供相关语音资料,并由科技部指导、国家实验研究院科技政策研究与资讯中心(STPI)拓建加值,成为高品质的数据集(Dataset)。此数据集公开释出後,台湾企业、学研界可免费取得授权,用於AI相关技术研发突破,提升台湾竞争力。
|
/news/2019/06/25/1043250560S.jpg |
科技部政务次长许有进於发表会上表示,「科技大擂台 与AI对话」挑战AI在语意理解与语音对话,期??能够加速开发中文语音对话的核心技术。对AI的训练来说,最重要的就是正确的资料。搭配这个比赛的进行,科技部建立了AI语音数据资料库,也邀请台北科技大学的廖元甫??教授协助语音资料的标注;由科技部来提供大家方便取得的资料,加速AI的训练与精进。感谢警察广播电台宣介慈及教育广播电台谢忠武两位台长协助科技部,一起建立起这个资料集,顺利完成比赛并开放各位研究者与企业来授权运用。
本次释出约400小时的「AI语音数据资料集」,可以大幅缩短发展语音过程中所需的资料标注人力和时间,降低相关技术的发展门槛。资料集在国家实验研究院高速网路与计算中心资料集平台(NCHC DATA MARKET)上架,期??藉此吸引更多企业、学研机构齐力投入,共同推动台湾语音AI技术跃进,协助台湾企业进行数位转型。
同日,结合2019年语音讯号处理研讨会(SPEECH PROCESSING WORKSHOP 2019),共同举办「科技大擂台 与AI对话」第二场赛後技术交流会,邀请Google台湾董事总经理简立峰分享自然语言处理与AI未来趋势的看法、Taiwan AI Labs创办人杜奕瑾、台湾大学资讯工程学系教授,同时也是台湾AI独角兽沛星互动科技(Appier)首席科学家林轩田博士等,发表目前在AI与语音讯号处理的前瞻研究成果。另外,第一届「与AI对话」的获奖团队:台湾大学电资学院、华硕电脑、中央研究院等代表也应邀出席,和大家分享叁赛经历及比赛中使用的秘技。