CTIMES- MP3音效品質設計考量 :MP3,ARC,行動終端器

│新東西市集│東西講座│影音頻道│出版中心│智動化專區│

元件次系統自動控制

最新動態

【文章精選】鍺：綠色回收與半導體科技的新未來

【東西講座】11/29 智慧製造與資訊安全

【東西講座】11/22 新一代雙臂協作機器人：多元應用與創新商業模式

產業快訊

整合創新X智造未來TIMTOS 2025 聚焦AI新商機

汽配及移動科技產業，參展熱烈報名中!

CTIMES / 文章 /

MP3音效品質設計考量

【作者：邵芳雯】 2009年05月22日星期五

瀏覽人次：【6119】

你平時聽不聽MP3的音樂呢？恐怕很少人能自外於這股潮流吧。這和落不落伍並無關係，而是因為它太方便了，只要有1GB的Flash記憶體，就能儲存上百首的MP3歌曲！今日的隨身碟容量已上看32GB、64GB，所以一台小小的MP3隨身碟，儼然就能成為個人帶著走且取之不竭的音樂庫。在此優勢下，再加上網路上的大量傳播與分享，試問MP3如何能不成為大眾的寵兒呢？

MP3和AAC這類格式能將原始音樂檔案縮小十分之一，甚至是二十分之一，必然是對原始檔案動了一些手腳，也就是採取了破壞性的壓縮作法。透過數位編碼技巧，這類格式將對人類聽覺「較不重要」的音訊資料給捨棄了，讓大多數使用者在收聽時不會察覺重放的音質與最初的未壓縮音質之間有明顯的落差。壓縮格式的目標確是如此，但事實上，當聆聽MP3時，還是很容易可以感覺得到：就是少了些什麼！

當然，除了音訊來源本身外，最後的音效品質與播放裝置的效能也是密不可分的。以家庭劇院來說，必須配置高輸出功率的放大器和多聲道的喇叭，才能做到逼真的原音重現。這種音質確實很動聽，但也意味著高昂的設備成本投資。然而，多數人看電視只使用電視本身的喇叭；在家聽MP3音樂使用PC的喇叭，出門則戴耳機聽MP3隨身碟、手機和可攜式多媒體播放器（PMP）的音樂，或利用這些手持設備的喇叭來播放。由於這些設備的小型喇叭或耳機的功效有限，加上MP3的壓縮格式，在先天不足、後天又失調的條件下，消費者聽到的音質自然不會好到哪裡去。

以今日的液晶電視來說，薄型化的技術能力愈來愈強，例如Sony近期推出的Bravia ZX1液晶電視，其厚度連1公分都不到，只有9.9mm。這種厚度與DVD的盒子相當，掛在牆上幾乎感受不到它的厚度。不過，對於喇叭的設計來說則是更為嚴苛，因為愈薄的設計讓喇叭的音腔愈為受限，影響最大的即是重低音頻（Bass）的響應。

《圖一　Sony日前推出的Bravia ZX1液晶電視，其厚度連1公分都不到，只有9.9mm。》

這是目前液晶電視或手機這類小型喇叭共同的宿命，也就是在180Hz頻率範圍以下的低音響應非常有限，有些甚至無法產生低音響應，造成只能提供一個單薄的聲音。對於電視觀眾來說，這種音響無法確實呈現低音弦的音感或影片中的爆炸衝擊，也會模糊了樂器和人聲的界線，讓影片演員的對話顯得含糊不清；對於愛樂者來說，也會因為無法呈現重低音與逼真的臨場感。更嚴重的情形則是失真的聲音產生不悅耳的隆隆聲響，讓人聽了很不舒服。

數位化為音訊失真元凶

這種音質失真的現象，數位化可說是主要的元凶。自從音樂光碟（Audio CD）在近三十年前問世，它的便利性即一步步取代類比式的黑膠唱片及卡帶，而成為主流的音樂媒介。音樂光碟以44.1kHz的頻率取樣，將類比音樂轉為數位音樂，並將人耳無法分辨的高、低音頻濾掉，以降低儲存容量；然而，這些高、低音的音場雖然無法辨識，但仍能予人厚實的感覺。這也是為何類比的黑膠唱片能提供比CD更逼真的臨場感。

因此，現在所謂的無壓縮音樂原始檔案（通常為WAV或AIFF格式），其實經過數位化的取樣轉換後，本身已存在某種程度的失真了。用這樣的格式轉換而來的一首數位音樂原始檔，動輒需要30到40MB的容量，對儲存或下載的負擔都太大了，為了讓音樂檔「瘦身」，於是發展出壓縮的格式，此舉雖然降低了檔案容量，但也進一步犧牲到音訊的品質。

壓縮格式又可以分為兩種：即無損壓縮（lossless compression）和有損壓縮（lossy compression）。壓縮後的音質除了取決於格式本身的演算法外，取樣頻率和位元率愈高音質愈好，但檔案容量也會愈大。目前網路上常見的MP3和AAC格式都是有損壓縮，其中AAC為iPod大力支援的音樂壓縮格式，它能將壓縮比做到18：1，甚至到20：1，大幅超越了MP3（約10：1），加上支援多聲道和使用低複雜性的描述方式，優勢相當明顯。不過，由於MP3已取得廣泛軟、硬體的支援，短期內AAC仍難撼動它的主流地位。

壓縮音訊的救星

在壓縮格式音樂或音訊愈來愈普及的趨勢下，難道消費者只能消極地對音質妥協嗎？事實上並非如此。其實由前端數位化所帶來的失真，還是可以靠後端先進的音訊強化（Audio Enhancement）技術來還原逼真的音訊原貌。這種音訊強化技術能夠兼顧到包括類比數位轉換器、放大器、喇叭音腔以及喇叭驅動器等帶來的效果，回復因數位化和壓縮而喪失的音響品質，並創造出具臨場感的音效環境。

ARC在2008年2月併購Sonic Focus後，即致力於將Sonic Focus的音訊強化技術與其多媒體硬體子系統進行整合，目的就是要為電子產品提供低成本和高品質的音訊解決方案。以下將介紹幾項重要的音訊強化技術：

Virtual Bass

如前所述，今日的小型喇叭或耳芽式（earbud）耳機，往往無法如實的表現出重低音的效果，讓人在聽音樂或看電影時總是覺得聲音太扁平而不生動。這時，一般人或許會採用等化器（EQ）來加重低音功能，不過，這種作法通常是加入人工的重低音資料，也就是以方波或三角波數位訊號來模擬真實的重低音。如此一來，很容易大幅改變音調和聲音的特性，讓語音發音變得模糊並降低音訊的清晰度。

ARC Sonic Focus提出的虛擬重低音（Virtual Bass）技術，則是在無損語音完整性和細節的前提下，放大音訊本身已存在的自然重低音資料，並扁平化揚聲器的頻率響應，以讓揚聲器的音量做到歸一化（normalization）的效果。此技術能將產品的低音表現發揮到極致，更精確的反映原始音源，使得原本扁平、無活力的數位音訊轉化為生動的音樂或電影播放，或回復現場原聲演奏時的臨場感與氣氛。

更重要的是，只要使用平常的喇叭或耳機就能將原本的立體聲轉化為自然的環場音效。對於時常收聽小型PC喇叭、耳機或嵌入型電視喇叭的聽眾來說，能夠立即感受到虛擬重低音技術對音質所做的改善。

(表一)　Virtual Bass與等化器重低音強化技術比較

Virtual Bass	等化器（EQ）中的重低音加強功能
●在無損語音完整性和細節的前提下，增加重低音資訊 ●放大音訊本身已存在的自然重低音資料 ●延伸感知的重低音響應	●加入人工的重低音資料，以方波或三角波的人工訊號方式來模擬重低音訊號 ●容易大幅改變音調，並扭曲了聲音的特性

Adaptive Dynamics

壓縮音訊格式刪除了聽者察覺不到的音訊資料，但事實上這會造成聽覺遺失的現象，還是得靠人腦來填補這些音訊空隙，所以長期聆聽壓縮音訊會造成聽覺疲累。一般的等化器作法採用數學模型為基礎，利用對特定頻率的抑制來突顯其他的聲音，如此一來會改變電影中人聲對話的音調，給人假造的感受。

Adaptive Dynamics則在維持原始音調的前提下，重塑各種壓縮格式在其過程中失去的資料，並增加整個音訊頻段的清晰度，以得到「原音重現」的效果，聽眾會覺得自然而不易疲累。此技術是根據數十萬聽者的經驗回饋而開發，能強化整個聲音頻譜的清晰度和發音，甚至涵蓋低於耳朵能偵測到的音頻，而且不會變更語音的調性，聽者可以聽到喇叭的自然音色。

《圖二　Adaptive Dynamics強化整個聲音頻譜的清晰度和發音，甚至涵蓋低於耳朵能偵測到的音頻，聽者不需擔心語音的變調，可以聽到喇叭的自然音色。》

X-Matrix

X-Matrix可以從一個二聲道立體音源建立豐富的5.1或7.1環場音效環境，也就是用DSP模擬出多聲道的環繞音場效果，再輸出到立體聲的喇叭或耳機。當使用耳機或立體聲喇叭聆聽5.1聲道音訊時，通常需要將音訊由5.1聲道降至2聲道，但這個過程經常會使對白的音效模糊。X-Matrix虛擬技術擴大了音場並創造一個虛擬的中央聲道來強調音樂段落和清晰對話，為耳機或立體音響喇叭提供完整、豐富且自然的環場經驗，增加語音清晰度，不會出現相位位移瑕疵。無論聽者與喇叭的相對位置在哪裡，X-Matrix能讓語音保持清晰，音節明確。

《圖三　X-Matrix擴充音場同時增加一個虛擬中央聲道，為耳機或立體音響喇叭提供完整、豐富且自然的環場經驗。》

Extrapolator

Extrapolator技術能將二聲道立體音源轉換成臨場般的前後音景（soundscape）環境，讓人聽起來有如置身交響樂廳或演唱舞台。此技術採用先進的聲學模型為每個前、後揚聲器單獨增加細節技術，擴充立體音源成份，從身歷聲源產生逼真的、環繞聲響體驗，而不是簡單的由放大揚聲器發出的聲音。

一些相位式（Phase-based）的技術是透過相位差和延遲的作法來擴展音效，但這樣做會降低音場的動態性，而且僅限於電影音效。此種作法更大的限制是需在編碼時即加入相位資訊，但今天的壓縮數位內容並不包含環場編碼處理，這使得相位鑑別（phase-discrimination）環場音效解碼技術無法發揮效用。實際上大多數的聲音傳播技術會將音訊導引至中央聲道，而後置喇叭的音訊大多呈現出雜訊。

相較之下，Extrapolator不需要任何環場預編碼，使用物理模型在聽者前後創造出兩個虛擬的空間，人聲和獨奏樂器在前音景中更為顯著，而背景效果和環境細節則突顯於後音景。透過加法程序來增加動態性，而且因為不需預先編碼，就能為音樂、電影、遊戲等應用輸出5.1或7.1聲道格式的音訊。

《圖四　Extrapolator採用先進的物理模型技術，擴充立體音源材料，並且建立一個如臨場般的多聲道音景。》

讓影音產品大幅提升價值

為今日的中、低階音訊輸出設備導入先進的音訊強化技術，顯然已是大勢所趨。這種軟體技術能夠讓既有的硬體條件發揮最佳的音訊表現，進而突顯出產品的價值。一個鮮明的例子即是在2008年CES榮獲創新產品榮譽獎賞（2008 CES Innovations Award Honoree）的Ultra-Dock，當一般的iPod Dock處於低價競爭的泥沼時，Bel Canto因其在音訊處理軟、硬體的用心，一舉將其Ultra-Dock產品提升為高階音響市場的頂級iPod Dock解決方案，一台就要價兩千美金。值得一提的是，Ultra-Dock的音訊處理核心即採用了ARC Sonic Focus的強化技術。

這種產品位階提升的效果，對於設備開發的廠商當然是非常樂見的。以液晶電視來說，因為音響效果的改善，不論是特效或演員對話都能更為清晰生動，觀眾當然會更肯定此產品的價值。同樣的，對於手持式的多媒體手機或PMP來說，即使耳機和喇叭的低頻響應很差，也能因音訊強化技術而得到更佳的重低音及自然的效果。

當然，除了音訊強化的後處理軟體外，音訊硬體也需要相輔相成，才能在效能、成本和功耗等因素上取得最佳的結果。音訊硬體的處理單元包括收音的麥克風、類比數位轉換器（ADC）、編解碼（CODEC）及音訊處理器、數位類比轉換器（DAC），以及最後類比音訊的放大處理與揚聲器／耳機的功率驅動，再播放出聲音。

在這一連串的音訊處理鏈中，居於核心的正是編解碼及音訊處理器，它必須支援廣泛的影音編解碼格式，同時具備升級和更新的彈性，才能滿足今日多樣且多變的影音錄放需求。此外，除了音效品質外，編解碼及音訊處理器往往也是成本與功耗的決定關鍵。

以今日的照相手機或PMP來說，往往只能提供平庸的音訊品質，而且電池續航力大約只能維持30個小時。因此，可攜性的消費電子產品極力於尋求在改善音質的同時也能延長電池續航力的解決方案。以ARC來說，結合Sonic Focus音訊強化技術的ARC Sound Subsystem硬體子系統，即強調能提供一個完整的低功耗音訊方案，能將MP3裝置播放時間延長至100小時以上，同時還能節省晶片尺寸及為設備商節省龐大的材料元件成本（BoM）。

以Web為中心的消費族群已越來越多，他們已成為電子產業需求的主要推動者。我們將這個族群稱為YouTube世代。YouTube世代的社交網路目前正快速在全球蔓延開來，這個族群內的消費者也刺激了新類型電子裝置的需求成長，他們希望擁有隨時隨地捕捉、共享和播放高品質音樂與視訊影像的能力。結合音訊強化技術與低功耗音訊硬體系統，將為設備商帶來更大的產品價值，而消費者也能得到更滿意的MP3等影音品質。

---作者為ARC International 大中華區業務總監---

‧	剖析MEMS技術之消費性應用
‧	低成本的MP3播放機系統整合技術
‧	MP3 Player技術市場發展趨勢
‧	一個擁有加密系統的P2P傳輸軟體 – MUTE
‧	數位音樂版權的新中間路線

comments powered by Disqus

相關討論