当语音辨识技术正在改变多项产业的运作模式,成为节省人力成本与提升效率的关键利器。由丽台协助长问科技打造出台湾在地的语音AI辨识系统,即横跨国、台、英、客语言的输入与输出,成为企业数位转型的重要动力,其应用范围涵盖金融、电信、医疗等领域,达到超过95%的辨识准确率,还能针对不同行业的专业词汇进行语言模型优化;甚至结合大型语言模型(LLM)提高语音AI辨识的准确性,进一步增强用户体验。
|
长问科技??总经理陈又硕认为:「随着技术进步,人类与机器沟通可以透过精准的数位化语音,很快便能实现人机自然的囗语互动。」 |
为了满足即时语音AI辨识对高计算性能的需求,长问科技选用了丽台科技的高效能AI硬体设备,特别是NVIDIA RTX 6000 Ada Generation GPU与WinFast GS4850T 伺服器的结合,此强大的算力平台为语音AI辨识系统提供了稳定且高效的支援,确保能在应用环境中快速反应。
藉此推出的语音AI辨识系统,得以专注於台湾在地语言的研发,采用单一模型实现多语言混合辨识,强调无需切换模型即可处理不同语言的输入与输出,适用於多种情境;该系统亦能透过RESTful API、WebSocket、MRCPv2,整合客服系统,提升了操作的便利性与效率,有效提升企业效能。
长问科技??总经理陈又硕表示:「丽台的优势在於其卓越的效能、合理的成本以及专业的技术谘询服务。我们的客户通常有客制化需求,针对资料的大小,丽台能提供精准的建置建议。」让该系统根据不同产业的需求优化专业词汇库,确保精准识别行业术语;还能灵活调整辨识速度,以适应不同受众需求(如年轻人或老年人),提升辨识精准度和使用体验。
面对技术快速发展,长问科技预计持续提升语音AI辨识的精准度,更计划扩展辨识语言的广度。陈又硕说:「我们预计把台湾的语系做好之後,跨国的语音辨识也是未来的目标,计划加入日语与越南语的辨识,以满足更多产业的需求,进一步促进跨文化交流。」
通过高性能硬体和先进技术的结合,语音AI辨识应用正逐渐改变我们生活的方式,陈又硕认为:「语音AI辨识是未来的趋势,随着技术的进步,人类与机器沟通可以透过精准的数位化语音,很快便能实现人机自然的囗语互动。」未来,随着技术的不断成熟,语音AI辨识将带来更多的创新和可能性。