為滿足圖像在存儲、傳輸和應用方面的要求,對靜止或活動的數位圖像進行資料壓縮和編碼的過程、方法和技術。

  圖像有靜止圖像和活動圖像。前者指的是單幅圖像,後者指的是內容隨時間變化的一個圖像序列,又稱視頻,通常每秒鐘包含25~30幅圖像。

  單幅圖像的資料量可按下面的公式計算(以比特為單位):

     圖像資料量=圖像水準解析度×圖像垂直解析度×每個圖元的比特數數

可見其資料量很大。為瞭節省存儲數字圖像的存儲器容量,降低存儲成本,特別是在因特網應用中,為瞭提高圖像的傳輸速度,減少通信費用,大幅度壓縮圖像的數據量非常重要。以使用電話接入因特網的用戶為例,假設數據傳輸速率為56kb/s,傳輸一幅分辨率為640×480的6.5萬色的未經壓縮的圖像約1~2分鐘,如果圖像的資料量壓縮10倍,那麼下載時間僅需10秒鐘左右。

  由於數字圖像中的資料相關性很強,或者說,資料的冗餘度很大,因此對數字圖像進行大幅度的數據壓縮是完全可能的。而且,人眼的視覺有一定的局限性,即使壓縮前後的圖像有一定失真,隻要限制在人眼無法察覺的誤差范圍之內,也是允許的。

  圖像數據壓縮可分成無損壓縮和有損壓縮兩種類型兩種類型。無損壓縮指壓縮以後進行圖像還原(又稱解壓縮)時,重建的圖像與原始圖像完全相同。有損壓縮指壓縮後進行圖像重建時,重建的圖像與原始圖像雖有一定的誤差,但不影響人們對圖像含義的正確理解。

  為瞭得到較高的數據壓縮比,數字圖像的壓縮一般都采用有損壓縮,如變換編碼、矢量編碼等。評價一種壓縮編碼方法的優劣主要看3個方面:壓縮倍數的大小,重建圖像的質量(有損壓縮時),以及壓縮算法的復雜程度。

  為瞭便於在不同的系統中交換圖像數據,人們對計算機中使用的圖像壓縮編碼方法制訂瞭國際標準和工業標準。

  最新的靜止圖像壓縮編碼的國際標準是JPEG2000,是為瞭滿足21世紀圖像應用的需要而開發的,適用於不同類型(黑白、灰度、彩色等)和不同特性的圖像(自然圖像、醫學圖像、遙感圖像、合成圖像等),可應用於不同的模式(實時傳輸模式、檢索應用模式、存檔應用模式等)。

  活動圖像(視頻)的數據量比靜止圖像大得多。例如1分鐘的CCIR601規格(演播室質量)的數字視頻,數據量約為1G字節,這樣大的數據量無論是存儲、傳輸還是處理,都是極大的負擔,為此必須對數字視頻進行大幅度的數據壓縮。

  由於視頻信息中相鄰畫面的內容有高度的連貫性,其變化往往發生在畫面的局部范圍。因此,可以對相鄰畫面中發生變化的部分用運動矢量來描述,這樣,後續的圖像可以看成是前面圖像經過運動補償後的結果。基於這種運動補償的畫面預測和畫面插值的方法是數字視頻壓縮編碼的主要手段,再加上各個畫面內部有很強的信息相關性,所以數字視頻的資料量可壓縮幾十倍甚至上百倍。