无线科技暨全球蓝牙连接方案厂商CSR宣布,BlueCore5-Multimedia平台开始提供整合的语音合成(text-to-speech; TTS)和语音识别(speech recognition; SR)功能。CSR透过其eXtension协力伙伴计划,与NowSpeak和Rubidium公司合作开发这些新技术,为耳机和免持听筒套件用户提供完全免手动的蓝牙经验。CSR的BlueCore5-Multimedia是唯一整合数字信号处理器(DSP)并拥有on-chip内存的蓝牙芯片,支持多种协力伙伴软件。
|
CSR的BlueCore5-Multimedia整合语音合成与语音识别功能。(来源:厂商) |
CSR藉由结合语音合成与语音识别技术,让用户不论利用蓝牙耳机或嵌入式汽车套件通讯时,都能享有完全的控制能力。当用户的移动电话接到一通来电时,语音合成引擎将会发声宣告来电者的名字和号码,而用户可以透过语音识别功能下达是否接听来电的指令,不需动手按任何按钮。语音合成也可应用于提供连接与配对状态导引,以及向用户告知现在透过蓝牙播放的音乐曲目。此外,语音识别能力可供用户透过语音指令,轻易且安全的控制多种功能,包括接受或拒绝来电、语音拨号、以及音乐控制和曲目选择。语音合成与语音识别二者的结合,让采用以CSR BlueCore5-Multimedia为基础的产品用户享有完全免手动的蓝牙体验。
NowSpeak为CSR的BlueCore设备提供免手动接口,包括下一代的语音合成及语音识别功能。NowSpeak的语音合成技术能够将文字自动且实时合成语音,并且针对人名、电话号码以及设备状态等常用语句进行优化,以最自然的语调呈现。NowSpeak语音功能仅占极小的内存需求即可在一个蓝牙设备上完整支持所有主要语言。语音识别功能支持大量字汇并且可用于辨识单字、数字或完整句子。NowSpeak语音识别技术针对现实应用环境而设计,能够过滤吵杂环境的噪音以及不需要的声音。厂商可选择同时采纳NowSpeak的语音合成及语音识别功能或单独采纳其一。
CSR BlueCore5-Multimedia平台也支持Rubidium的语音合成与语音识别技术。Rubidium语音合成采用以实际人类语音为基础的串接语音合成法(concatenate TTS)以产出纯净且自然的声音,而且所需耗用的运算资源特别低。它支持多种语言,并且能够快速且弹性的增加几乎任何语言和语音。Rubidium的核心语音识别源自其专利的Rubidium Dialog Engine系列技术,具备语者独立的辨识功能(speaker independent)、关键词侦测(keyword spotting)和噪音耐受性。Rubidium技术业经优化设计,能够支持几乎任何语言和腔调,它利用人工智能以处理自然语言、动态字汇和多阶层对话(multi-layer dialogues)。
CSR BlueCore5-Multimedia特别针对包括高阶立体音响和单音耳机应用设计,提供最好的音效质量。其功能强大的64 MIPS DSP允许客户增加CSR eXtension伙伴计划所提供的音效或语音强化软件,进一步提升他们终端设计的效能与功能性。
CSR无线音效策略事业单位资深副总裁Anthony Murray表示:「CSR的BlueCore5-Multimedia平台是唯一为蓝牙配件市场提供语音操控接口(speech controlled user interface)的蓝牙芯片。透过CSR整合于芯片的DSP,eXtension伙伴例如NowSpeak和Rubidium可以在一颗单芯片上为我们的客户提供真正的免手动经验,降低电子物料列表(eBOM)成本。」