音訊/語音用戶介面(VUI)是未來人機交互的一個重要的新興趨勢,將越來越多地用於智慧家居控制、建築物自動化、智慧零售、聯接的汽車、醫療等物聯網垂直領域,這涉及語音觸發、識別、處理技術,同時設計人員還面臨如何提高能效的挑戰。針對本地和雲端,安森美半導體都有相應的VUI方案,提供先進的語音觸發、識別、處理、控制等功能,具備出色的計算能力和能效,確保卓越的用戶體驗。
VUI架構及分類
圖一是基於麥克風陣列的高級語音介面架構,本地處理需要進行說話人跟蹤、語音增強,其中涉及波束成形、喚醒詞檢測、聲源定位、降噪、語音檢測等技術,雲端方案則涉及自然語言處理。其後,指令還需通過音訊播放功能播放出來,同時需進行回聲消除。
本地VUI以預存的詞或句為識別單位,說話人可以是特定用戶也可以是非特定用戶,而雲端VUI基於人工智慧進行語義理解和語音合成,說話人是非特定用戶。本地VUI通過藍牙聯接網路,而雲端VUI通常通過WiFi聯接。本地VUI的功耗和資訊洩露的風險相對更低,雲端VUI具有更高的識別率和擴展性。相對而言,本地VUI比雲端VUI的功耗低。設計人員可根據特定應用需求決定是用本地VUI方案還是雲端VUI方案。
本地VUI方案
根據本地VUI方案的特點,它必須能進行雙向語音通訊,能識別非特定用戶語音,支持充足的指令和多種語言,可靈活擴展,最好把波束成形和降噪等技術整合到單個晶片上以降低成本和減小占位。如安森美半導體的單晶片方案LC823450,含雙Cortex-M3核,整合數位訊號處理(DSP)用作語音前端處理,SRAM提供1656k位元組記憶體,無需配備輔助記憶體晶片,含兩個數位麥克風I/F介面、兩個數模轉換器,包括回音消除、降噪等先進功能,具備極高擴展性、小占位,功耗超低,若結合生態系統合作夥伴的語音控制技術如Sensory的TrulyHandsfree,支持喚醒詞和語音命令的定制,適用於家居自動化和音樂播放的語音交互。
圖二所示為本地VUI方案的一個示例應用框圖及評估板。採用安森美半導體的超低功耗音訊處理單晶片LC82345X、麥克風預放大器FAN3852、低壓降穩壓器(LDO)NCP170、同步 PWM 開關降壓穩壓器NCP3170、單聲道音訊功率放大器NCP2823。安森美半導體憑藉在電源管理的經驗和專知,使這方案實現超低功耗,這是此方案與其他競爭對手方案相比的一個優勢。現有的方案雖然未整合WiFi、藍牙雙模的模組,但安森美半導體已收購了WiFi領袖Quantenna,已具備相關技術,未來會考慮將WiFi模組也整合進去。
雲端VUI方案
從應用場景來看,雲端VUI除了進行語義理解和語音合成,還可推送各種服務,如智慧語音助手除了可播放音樂、講故事,還支持智慧零售,如叫車、叫外賣等。當前雲端VUI的一個痛點是工作頻率較高,需外接記憶體和閃存,耗電量大,物料單(BoM)成本高。
安森美半導體的音訊DSP系統單晶片(SoC)LC823455方案很好地解決了這些痛點問題,整合4M RAM,無需外部存儲,除了CPU核外還含波束成形、降噪、回音消除功能,整合預實現的音訊硬體(模數轉換器、數模轉換器及功放),降低BoM成本,因降低時鐘頻率從而提供功耗優化的MCU,功耗超低,提供穩定的聯接和極高擴展性,寬廣的封裝陣容支持各種音訊產品,如音樂播放器、錄音器、智慧家電、WiFi/藍牙音箱等。
圖三所示為智慧音箱參考設計框圖,此參考設計基於LC823455,有4個ONA101V和1個ONA40功放,含USB-C PD源/汲介面,支持Strata平台,設計人員只需將此評估板插入裝有Strata的電腦,即可自動識別並開始下載相關的所有文檔及配套資料,包括原理圖、布板、測試報告、用戶指南等,同時出現圖形用戶介面(GUI),顯示所有相關參數和選項供工程師開始評估,幫助加快和簡化開發。
此參考設計目前支持亞馬遜Alexa語音服務,安森美半導體也在同中國國內一些語音服務商接洽,未來也會支持國內語音助手。這方案最顯著的一個優勢也是超低功耗,經過將其與競爭對手方案的功耗進行測試,安森美半導體的方案功耗約為競爭對手方案功耗的一半。
移動及智慧音箱音訊技術/知識產權
安森美半導體具備豐富的知識產權支持移動及智慧音箱的設計開發,包括音訊處理系統、D類功放、麥克風預放大、高性能音訊開關,提供具競爭力的優勢助力設計人員設計出具競爭優勢的產品。
在音訊處理系統方面的競爭優勢,包括小的PCB占位、高度整合的SoC (CPU+DSP+音訊)、整合ARM Cortex-M3雙核、專有的32位DSP。
在D類功放方面,支持小於10 W、10W至30 W,針對大於30 W的應用僅提供樣品。其中小於10 W的功放尺寸小,採用類比輸入,10W至30W的功放支持數位介面,提供最佳的動態範圍、增益誤差漂移。
對於麥克風預放大,安森美半導體的方案採用最小的標準間距WLCSP封裝將類比音訊轉換為數位音訊,支持不同的感測器介面。
音訊開關方面,安森美半導體提供最小阻抗/面積的耗盡型開關。
周邊技術:USB Type-C和D類功放
USB Type-C使每個端口都能成為電源、數據、視訊或音訊端口,大大地方便了用戶,將越來越多地用於各種電子應用,如語音交互。安森美半導體提供完整的USB Type-C方案陣容支持音訊應用的開發,包括供電、複用音訊訊號、訊號開關、介面保護等,具有最小的占位、超低靜態功耗,整合豐富的保護功能。
智慧音箱等新興音訊應用對功放的要求越來越高,安森美半導體針對性地開發出了一系列10 W以上功率等級的D類功放產品線,結合陶瓷封裝技術、CMOS電路技術及可針對不同應用定制的功率MOSFET技術,提供低熱阻、高頻互聯、高功率密度、低雜訊(<70 uV)、低總諧波失真(THD<0.03%)等優勢。
以ONA101V為例,這是一款單通道數位輸入D類功放,動態範圍105 dB,帶喇叭採樣數位輸出功能,該功能即時採樣所驅動喇叭的電壓和電流,可使用微控制器上運行的演算法來計算喇叭特性。這些參數可用於計算喇叭電阻、迴響、溫度等。 根據這些值,可以創建演算法來執行一系列任務,從而實現喇叭保護、範圍擴展等功能。
總結
語音交互正日漸流行,語音識別和自然語言處理技術是VUI的基礎,安森美半導體提供本地VUI方案和雲端VUI方案,整合波束成形、回音消除、降噪等先進的語音處理技術、超低功耗電源管理及USB Type-C、D類功放等周邊器件,並攜手生態鏈合作夥伴,大大降低BoM成本,同時具備出色的計算能力和超低功耗,提供極佳的用戶體驗。