當語音辨識技術正在改變多項產業的運作模式,成為節省人力成本與提升效率的關鍵利器。由麗臺協助長問科技打造出台灣在地的語音AI辨識系統,即橫跨國、台、英、客語言的輸入與輸出,成為企業數位轉型的重要動力,其應用範圍涵蓋金融、電信、醫療等領域,達到超過95%的辨識準確率,還能針對不同行業的專業詞彙進行語言模型優化;甚至結合大型語言模型(LLM)提高語音AI辨識的準確性,進一步增強用戶體驗。
|
長問科技副總經理陳又碩認為:「隨著技術進步,人類與機器溝通可以透過精準的數位化語音,很快便能實現人機自然的口語互動。」 |
為了滿足即時語音AI辨識對高計算性能的需求,長問科技選用了麗臺科技的高效能AI硬體設備,特別是NVIDIA RTX 6000 Ada Generation GPU與WinFast GS4850T 伺服器的結合,此強大的算力平台為語音AI辨識系統提供了穩定且高效的支援,確保能在應用環境中快速反應。
藉此推出的語音AI辨識系統,得以專注於台灣在地語言的研發,採用單一模型實現多語言混合辨識,強調無需切換模型即可處理不同語言的輸入與輸出,適用於多種情境;該系統亦能透過RESTful API、WebSocket、MRCPv2,整合客服系統,提升了操作的便利性與效率,有效提升企業效能。
長問科技副總經理陳又碩表示:「麗臺的優勢在於其卓越的效能、合理的成本以及專業的技術諮詢服務。我們的客戶通常有客製化需求,針對資料的大小,麗臺能提供精準的建置建議。」讓該系統根據不同產業的需求優化專業詞彙庫,確保精準識別行業術語;還能靈活調整辨識速度,以適應不同受眾需求(如年輕人或老年人),提升辨識精準度和使用體驗。
面對技術快速發展,長問科技預計持續提升語音AI辨識的精準度,更計劃擴展辨識語言的廣度。陳又碩說:「我們預計把台灣的語系做好之後,跨國的語音辨識也是未來的目標,計劃加入日語與越南語的辨識,以滿足更多產業的需求,進一步促進跨文化交流。」
通過高性能硬體和先進技術的結合,語音AI辨識應用正逐漸改變我們生活的方式,陳又碩認為:「語音AI辨識是未來的趨勢,隨著技術的進步,人類與機器溝通可以透過精準的數位化語音,很快便能實現人機自然的口語互動。」未來,隨著技術的不斷成熟,語音AI辨識將帶來更多的創新和可能性。