採用英飛凌獨特密封雙膜技術的最新一代微機電系統(MEMS)麥克風,為高階應用定義全新基準,為各種消費性裝置提供全新的音訊體驗。
就理論而言,它非常簡單:麥克風將聲壓波轉換為電訊號。實際上,麥克風提供不同等級的效能,並有若干參數是決定專屬功能和應用之效能的關鍵。當今尖端裝置的潛力可能會因為提供的音訊原始資料品質不良而受到嚴重限制。
近年來,以MEMS技術為基礎的麥克風已廣泛用於各種應用。縮小尺寸和聲學特性的提升,使我們的應用能透過智慧型手機視訊和FaceTime分享資訊和體驗(圖一)。
這類麥克風可用來讓智慧型手錶撥打語音電話、與數位助理溝通、命令智慧音箱播放喜愛歌曲,或透過語音功能控制智慧家庭設備。此外,在長途飛行或聽音樂時,MEMS麥克風可提供主動式降噪功能。
以虛擬實境創造真正的沉浸式體驗
想像一下,戴上虛擬實境頭戴式顯示器,發現自己身處太平洋上一個陽光明媚的島嶼。您在美麗的海灘上欣賞風景,在棕櫚樹叢中漫步並聆聽海浪聲。五顏六色的鸚鵡在您的頭上大聲鳴叫。時至今日,已有可創造上述360°視訊體驗所需的硬體,而且日漸普及(圖二)。然而,輕易創造附帶360°音訊的能力卻相當落後。
圖二 : 若要使虛擬實境提供真正身臨其境的體驗,高傳真音訊拾音器是關鍵。 |
|
波蘭錄音技術開發商Zylia採用英飛凌領先同級產品的69-dB SNR數位XENSIV MEMS麥克風,推出全球首個可攜式錄音工作室。三階Ambisonics錄音機Zylia ZM-1麥克風陣列可擷取虛擬和增強實境(VR/AR)的沉浸式3D音訊(圖三)。
圖三 : 內含19個英飛凌XENSIV MEMS麥克風的三階Ambisonics錄音機 |
|
藉由使用多個裝置,甚至可實現六自由度錄音。為了讓虛擬實境提供真正身臨其境的體驗,英飛凌MEMS麥克風的高傳真音訊拾取,結合Zylia先進的數位訊號處理演算法和麥克風陣列技術是關鍵所在。若要不遺漏任何音訊細節,麥克風必須具備接近錄音室麥克風的品質。MEMS麥克風不僅可提供此種效能,還能進一步使360°錄音裝置小型化。
放大或減弱四周的聲音
目前有幾款耳機專為實現最佳360°音訊聆聽而設計。透過VR/AR頭戴式顯示器,使用者可將其環境轉換為互動式視聽音景,並可擷取、觸摸及塑造聲音。藉由在耳機中整合優質麥克風,可減弱或放大四周的聲音。主動式降噪功能可確保使用者只聽到自己喜歡的節拍,不會聽到飛機的噪音,以享受舒適的睡眠。
現已開發出通透聆聽模式,可讓使用者選擇透過優質麥克風擷取多少的外部環境聲音,從而結合強化的音訊體驗。耳機藉由複製具有極佳真實感的空間效果以補足AR體驗,協助使用者精確感知和定位虛擬聲音。藉由混合適當水準的外部聲學環境與特定虛擬音訊世界,可選擇創造真正身歷其境的社交體驗。
圖四 : 當今的視訊會議系統是完全整合的單元,包括編解碼器、顯示器、攝影機麥克風及揚聲器。 |
|
這些耳機可隔絕令人分心的外部噪音,使用者可不受干擾地專注聆聽感興趣的音訊內容。結合主動式降噪與主動式語音強化,意味著即使在吵雜的環境中也能聽到對話中的每個單字。
未來的通訊系統
先進音訊功能可縮短與朋友和同事之間的感知距離。世界各地的團隊都開始使用先進的視訊會議系統以提升通訊品質。為提高此類裝置的效能,優質MEMS麥克風與先進音訊處理的整合程度持續提高,例如盲訊號源分離或波束成形(圖四)。當今的視訊會議系統是完全整合的單元,包括編解碼器、顯示器、攝影機麥克風及揚聲器。
對企業有用的東西也可能很快地改變人們的社交生活。例如,Facebook利用這些技術來增強朋友和家人之間的溝通。將來,這些裝置還能追加虛擬和增強的音訊和視訊功能。新一代MEMS麥克風將成為智慧型手機等更小尺寸裝置擁有先進通訊功能的關鍵。
以智慧型手機享受強大的音訊和視訊體驗
過去需要龐大攝影機才能完成的作業,現在使用手掌大小的設備即可拍攝。智慧型手機錄影功能使每個人都成為了自製影片導演,讓我們有機會不僅與家人和朋友分享我們的體驗,還能透過社交媒體與數百萬觀眾分享。
雖然智慧型手機錄影功能已顯著進步,並提供慢動作或縮時攝影等功能,但錄音功能尚未發展到相同水準。即使是最精密的智慧型手機,還是只能錄製單聲道音訊,只有少數產品支援立體聲。難怪智慧型手機發出的聲音很差,平坦而且沒有吸引力,無法匹配其優異的視覺效果。
但情況正在改變:優質MEMS麥克風和先進音訊處理技術將智慧型手機錄音功能引領至全新境界。特殊的錄音選項可讓智慧型手機使用者將其對焦方向的聲音放大。音訊變焦功能可讓使用者選擇記錄想要聽到的內容,並抑制其他聲音。
新一代語音使用者介面
語音指令以及與數位語音助理對話變得越來越流行。不幸的是,使用者還是經常必須以不自然的聲音發出指令,甚至從遠處大聲喊叫。語音識別公司正在為新一代語音使用者介面改善其處理器和演算法。
新版本的Alexa已可識別使用者低聲說話,並低聲回答,避免在晚上打擾沉睡中的家人。不久之後,這個使用者介面將能使用語音命令關閉不同房間的燈光或電視。
優質MEMS麥克風和頂尖音訊處理,是使語音控制裝置備真正符合日常使用環境的關鍵因素。因此,英飛凌及其語音使用者介面生態系統合作夥伴Aaware、CEVA、Creoir、SoundAI、Sugr和XMOS利用自家專業技術,提供創新的參考平台和立即可用的新一代語音使用者介面解決方案(圖五)。
圖五 : 英飛凌及其語音使用者介面生態系統合作夥伴 Creoir、XMOS、Sugr、CEVA、SoundAI 和 Aaware (由左至右、由上至下),提供創新的參考平台和立即可用的新一代語音使用者介面解決方案。 |
|
基礎技術
MEMS麥克風利用半導體製程進行量產。典型設計結合MEMS感測器和ASIC。感測器會產生一個電訊號,並用來放大類比麥克風訊號,或是放大由 ADC處理ASIC中的數位麥克風訊號。將音訊轉換為電訊號的MEMS麥克風基本上是DC偏壓電容器,其中由音訊壓力引起的膜(或隔膜)的移動會改變一或多個電容器極板的電壓。
隔膜和背板的運作類似於平行板電容器。當隔膜因進入的聲壓而振動時,隔膜和背板之間的間隙及電容會發生變化。MEMS麥克風擷取這些變化做為電訊號。處理大音量壓力水準的主要挑戰是膜的大幅度機械運動,當膜移動到極端時將導致失真。第二個挑戰是設計ASIC以處理MEMS元件產生的大訊號。由於音訊處理演算法採用線性訊號,任何高於1%的失真都會導致先進音訊處理所倚賴的音訊品質顯著降低。
方法之一是採用MEMS感測器元件,將移動的膜放置在兩個電容器極板(雙背板)之間。如此一來,便能產生全差分(相較於單端) 輸出,它具有多個優點。雙背板MEMS麥克風由於其對稱結構而大幅減少失真。透過移動夾住電容器極板的兩個膜(雙膜)以實現相同的效果。
新一代優質MEMS麥克風:密封雙膜
相較於單背板的MEMS麥克風,引進雙背板技術可顯著提升線性度規格。下一個演進階段是具有密封雙膜的電容式MEMS麥克風(圖六)。電容區域的密封可實現幾乎無雜訊的音訊擷取。SNR從70 dB進一步增加到 75 dB。
2018年的第一批原型產品已透過4.0×3.0×1.2 mm封裝實現75 dB的SNR。採用全新密封雙膜設計的優質 MEMS 麥克風,適用於先進錄音、主動式降噪、通訊及語音使用者介面。英飛凌將於2020年和2021年推出進一步縮小密封的雙膜麥克風,以因應空間受限的裝置,因此無論身在何處皆可聆聽。
(本文作者Marcel Knecht任職於英飛凌科技)