CTIMES- 神奇的魔術－影音壓縮技術 :MPEG-2,ZIP,RAR,MPEG-4,MJPEG,JPEG2000,H.263,H.264,ITU

│新東西市集│東西講座│影音頻道│出版中心│智動化專區│

元件次系統自動控制

最新動態

【文章精選】鍺：綠色回收與半導體科技的新未來

【東西講座】11/29 智慧製造與資訊安全

產業快訊

整合創新X智造未來TIMTOS 2025 聚焦AI新商機

汽配及移動科技產業，參展熱烈報名中!

CTIMES / 文章 /

神奇的魔術－影音壓縮技術

【作者：誠君】 2004年01月15日星期四

瀏覽人次：【7101】

目前，MPEG-2的傳輸速率約2 Mbits/s，如果所要傳的數位影像（digital picture）愈是複雜，MPEG-2的傳輸速度就會愈慢。乍看之下，這個結果是出奇的慢；這意味著，160 Mbits/s的動態視訊信號（motion video）只有1.5%被使用；具DVD畫質的影像速率是6 Mbits/s，也只能使用到其中的4%而已。這是為什麼呢？這是一個魔術，一個以「有限」代表「無限」，但又不被拆穿的「把戲」。圖一可以簡單解釋此壓縮處理的步驟。

《圖一》

簡言之，圖一就是表示數位壓縮技術。利用數位信號來儲存和傳送數位資訊比利用純粹的（raw）類比信號需要更多的頻寬，那為什麼還要利用數位信號呢？因為以數位信號來代表資訊是比較容易的，而且品質可以維持比較久，可支援長距離通訊，能降低成本，資訊內容可以用標準格式傳收。其中成本價格是影音處理技術的成敗關鍵。數位壓縮技術適用於各種多媒體形式，例如：圖片、影像、動畫、照片、語音、文字...等。

在(圖一)中，「去除累贅資訊」就是將原始資訊去蕪存菁，它是一個前置動作（preprocessing），通常是在做取樣的動作；「熵」是統計學或數學的專有名詞，簡單講，就是「不確定」；「去熵」就是利用演算法建構數學模型，去除輸入的取樣信號的不確定性；無損編碼也是一種演算法（這裡所說的編碼其實就是「壓縮」），和它相反的稱作「有損（lossy）編碼」，底下解釋一下有損和無損編碼之間不同的地方：

有損編碼是將影像做選擇性編碼，將「沒有用的（useless）」影像拋棄掉，而且是永遠拋棄，無法復原。基本上，全部的過程都樣魔術一樣，欺騙人的眼睛和大腦，讓人無法發現被拋棄掉的細節部份。如果利用慢速的傳輸率傳送，此時人眼將可識破此「騙局」。不過，決定哪些部份才是可以拋棄的篩選原則必須符合人類視覺或聽覺的本能（human instincts），目前科學家已經研發出多種統計模型（pattern）可資利用。目前有損編碼技術廣泛地應用在多媒體通訊領域，尤其是在網際網路上。目前利用有損編碼的技術有：DivX、MP3、WMA、WMV、DVD/SVCD/MPEG-2（DVD也是利用有損編碼，但是因為它的傳輸速度很快，所以人眼無法發覺有異）、VCD/MPEG-1、OGG、PEG、GIF、JPEG、Musepack、XviD....等。經過有損編碼，檔案大小是縮小了，但是資訊內容（或品質）也遺失（或降低）了。

無損編碼類似ZIP或RAR壓縮技術，它是利用數論（number theory）的原理來執行編碼，不會拋棄任何細節，解壓縮之後的資訊內容也不會遺失。簡單說，其編碼方法就是利用演算法將重複一次以上的資料編碼。目前利用無損編碼的技術有：Huffyuv、BMP、PCM...等。

在目前的多媒體市場中，有三個響叮噹的壓縮技術標準：MPEG、H.26x、JPEG。下面分別介紹它們的技術特性：

在MPEG系列標準中，包含：

●MPEG-1，1991年：是針對352 x 240解析度，30fps（frame per sec）NTSC或352 x 288，25 fps PAL的電視而設計，最佳傳輸率為1.5 Mb/sec。目前廣泛應用於VCD。

●MPEG-2，1994年：是針對數位電視而設計，720 x 480，30 fps NTSC，最佳傳輸率為1.5 Mb/sec；可延伸支援高畫質電視（HDTV），1920 x 1080，30 fps，80Mb/sec。目前廣泛應用於VCD（720 x 480，30 fps，10Mb/sec）。新增支援交織視訊（interlaced video）的功能，支援高畫質，是DSP多媒體嵌入式作業系統的最佳解決方案。對於不同的I/O標準、圖像延遲、記憶體最佳化、語音解碼器而言，MPEG2是最佳的解決方案。

●MPEG-4，1999年：是針對網際網路低速傳輸（小於1.5MBit/sec）而設計的。目前Windows Media Video、DivX v5...等都支援MPEG-4。MPEG-4的基礎是物件導向技術，視每個物件為離散和獨立的，它們被追蹤和壓縮在一起成為一個MPEG-4檔案。MPEG4包含有AAC和CELP兩個語音壓縮標準。主要特徵為：將複雜的多媒體內容區區分成獨立的視訊和音訊物件，每一個物件來自合成或自然的環境或類型，針對每個不同物件類型，採取高效率的編碼方式。

JPEG目前有兩個新標準：

●JPEG 2000是採用Wavelet壓縮技術的靜態圖片（still image）格式標準，可應用於可攜式裝置、印刷前檢視（prepress）、醫療影像、高空攝影...等。主要特徵為：壓縮比高、畫質好、採用前進式解碼（progressive decoding），可以使用有損或無損編碼。

●MJPEG（motion JPEG）是採用「離散正弦轉換（Discrete Cosine Transform；DCT）」壓縮技術的靜態圖片（still image）格式標準，壓縮比可高達100:1，但解壓縮後並不會失真。因為是採用有損編碼，其資料遺失量和壓縮比成正比。MJPEG只是一連串JPEG圖片形成的串流檔，不像MPEG和H.26x具有移動態預測（motion estimation）和自動修補失去封包（frame interpolation）的功能。

H.26x系列包含兩個主要的標準：

●H.261是ITU針對ISDN（視訊會議）雙向通訊而制定的標準，支援的傳輸速率是64Kbit/s的倍數。以DCT壓縮技術為基礎，支援CIF和QCIF的解析度。

●H.263是以H.261為基礎，但改善了因使用數據機（modem）所造成的視訊品質低落的問題。支援低傳輸率的影像通訊，提供CIF、QCIF、SQCIF、4CIF、16CIF的解析度，能支援低價位的DSP多媒體嵌入式作業系統。主要特徵為：產品設計的延展性和彈性大，允許整合其它額外的功能，例如：音訊、數據機..等。

上述這些標準分別適用於不同的產品，如表一所示。

《表一》

雖然目前在網際網路上，MPEG-4或H.263算是主流的影音壓縮技術，但是未來可能會有一個新標準將取代它們，那就是H.264。H.264是國際電信聯盟（ITU）與MPEG所共同制定的壓縮標準。H.264具有以下三大特點：更高的編碼效率、更強的解碼差錯恢復能力、以及提高了對行動通訊和IP網路的適應性，可提供從行動電話到高畫質電視 (HDTV) 的廣泛應用。

自從2003年5月ITU正式批准H.264標準之後，許多廣播公司、服務供應商（ISP）和消費性電子產品公司都對它很有興趣。與MPEG-4不同的是，H.264包含一個內建的網際網路通訊協定適配層（internet protocol adaptive layer），所以H.264可以被映射到任何固定IP、無線IP、儲存裝置或廣播網路中，而這正是為什麼電信公司和消費性電子產品公司都準備支援H.264的原因。

但是，如何確定一種可行的授權商業模式？是H.264目前面臨的最大發展障礙。為了解決這個難題，負責管理MPEG-2和MPEG-4 Visual授權的美國MPEG LA和LLC在2003年11月公佈了H.264/MPEG-4 AVC授權規定。如果此遊戲規則無法得到大多數廣播和電信公司認同的話，微軟的Windows Media Video/Audio可能就會漁翁得利。

此外，H.264編碼器的複雜度約是MPEG-4的10倍以上，而解碼器複雜度則為MPEG-4的3倍以上。如此高複雜度，將使得H.264難以滿足嵌入式作業系統之需求。因此，如何在不犧牲H.264編解碼功能的前提下，降低它的運算複雜度，使它真正能夠商品化，仍然考驗著業者。不過，目前TI、LSI Logic、Vsoft等公司已經宣稱克服了這個技術障礙。(作者為電子產業資深研發工程師，現為誠君工作室負責人:　su2b08@saturn.seed.net.tw)

‧	針對可調式視訊之影像編碼器
‧	影音光碟之視訊壓縮規格比較
‧	行動影音應用關鍵－串流技術
‧	網路多媒體傳輸技術面面觀
‧	H.264技術特色與廣播視訊應用方案

comments powered by Disqus

相關討論