Concepțiile de bază
|
Datele originale, reprezentând imaginile și secvențele video salvate în format RGB conțin informații suplimentare și neesențiale. Primele pot fi refăcute în baza altor date referitoare la aceeași imagine. În schimb informațiile neesențiale sunt acelea a căror eliminare nu cauzează o degenerare observabilă a imaginii. Algoritmii de compresie sunt astfel construiți pentru a evalua în mod automat care informații neesențiale sunt cel mai puțin observabile de către observator. Gradul de compresie obținut depinde de conținutul imagini, precum și de gradul acceptat de pierdere a calității imaginii. Graficul de mai jos (fig. 1) prezintă dependența teoretică a fluxului de date și deformarea.
|
|
Compresia poate fi în interiorul imagini sau inter-imagine. În primul caz, întreaga imagine este compresată, indiferent de cadrele secvenței rămase. În al doilea caz, compresia depinde de cadrele anterioare și cele ulterioare.
|
Reprezentarea nuanțelor
|
În mod obișnuit, imaginile în culori sunt supuse compresiei. Pe monitor, imaginile sunt obținute prin amestecarea celor trei nuanțe de bază: roșu, verde și albastru (RGB). Fiecare pixel este reprezentat de suma acestor trei componente. Din păcate, imaginile salvate în acest sistem se caracterizează printr-un volum sporit. Luând în considerare specifica ochiului uman, este mai bine să se salveze datele sub forma luminanței Y și a două crominanțe diferențiale Cr și Cb, unde:
|
Y = 0.299R + 0.587G + 0.114B,
|
Avantajul este că ochiul uman este cel mai sensibil la modificarea luminozității punctelor reprezentate de luminanță și este mai puțin sensibilă la schimbarea crominanței. De aceea semnalul crominanței poate fi redus. În sistemele analogice de televiziune, ca de exemplu PAL, SECAM sau NTSC, această proprietate a fost utilizată, fiind destinată transferului semnalului crominanței pe o bandă de două ori mai scurtă, fără a se pierde în mod considerabil calitatea imaginii.
|
Compresia în interiorul imaginii
|
Idea de bază a tehnicilor de compresie în interiorul imaginii constă în faptul că spectrul semnalului vizual este puternic concentrat în zona frecvențelor celor mai joase. Așadar, este îndeajuns să se calculeze spectrul semnalului și să se salveze numai un număr redus de parametri care sunt importanți (în general cu frecvențe foarte joase) iar ceilalți parametri (în principiu corespunzători frecvențelor înalte) pot fi salvați pe o cantitate foarte mică de biți.
|
În practică, imaginile se împart în blocuri de 8×8 puncte și se calculează transformata cosinusoidală (transformata lui Fourier modificată). Șirul obținut se divizează, folosind un tabel special de cuantizare. Ca urmare a acestei operațiuni, se obțin multe zerouri repetitive. Reprezentanța obținută se salvează în perechi de tip: numărul de zerouri, valoarea coeficientului nenul. Rezultatele obținute se salvează folosind coduri cu lungimea schimbabilă a biților. Aceasta înseamnă că perechile care sunt cele mai frecvente vor primi coduri cu un număr mai mic de biți, iar cele care apar mai rar vor primi coduri cu un număr mai mare de biți.
|
Compresia inter-imagine
|
Idea compresiei inter-imagine costă în utilizarea fenomenului următor: de obicei cadrul anterior și ulterior fiecărei imagini se aseamănă foarte mult cu imaginea. De acea, este îndeajuns să se transmită doar eroarea de predicție, adică diferența dintre imagine și cea preconizată. În cel mai simplu caz, se preconizează că imaginea următoare este identică cu cea anterioară.
|
În sistemele de compresie mai avansate, pentru preconizare se utilizează compensarea mișcării. Pentru pătratele 16×16 de probe de luminanță se caută cele mai asemănătoare pătrate din imaginea ulterioară. Diferențele de poziție ale acestor pătrate sunt întocmai vectorii de mișcare. Fie că se folosește sau nu compensarea mișcării, în funcție de sistemul de compresie, este generată imaginea prevăzută, care este apoi comparată cu cea reală. Diferența, codată asemănător ca și în cazul codării în interiorul imaginii, este apoi transmisă către receptor.
|
|