Kompresja MPEG-4, wykorzystująca algorytmy różnicowego podziału bloków, przeznaczona jest do szybkiego zapisu i transmisji przy zapewnieniu wysokiej jakości obrazu. Jej wadą natomiast są wysokie wymagania sprzętowe, które musi spełnić system, by w pełni wykorzystać możliwości rejestracji w tym formacie.
Standard MPEG-4 stał się krokiem milowym w rozwoju telekomunikacji, Internetu i telewizji w kierunku transmisji i przetwarzania multimediów. Dzięki swoim wbudowanym mechanizmom skalowania i systemowi profili oraz obiektowej reprezentacji danych daje ogromne możliwości interakcji z przekazem audiowizualnym.
Standard MPEG-1 (Moving Pictures Expert Group), opublikowany w roku 1993. Stosowany był do kodowania sekwencji obrazów o jakości znacznie gorszej niż wymagana w telewizji programowej. Metoda kompresji pozwalała na transmitowanie danych z przepływnością binarną rzędu 1.5 Mbit/s, np. zapis sekwencji obrazów na dyskach CD ROM. Jakość obrazu uzyskana tą drogą jest porównywalna z jakością obrazu otrzymywaną w analogowych magnetowidach VHS. Zwiększenie rozdzielczości jest możliwe, aczkolwiek prowadzi do obniżenia efektywności kompresji.
Standard MPEG-2 został opracowany z myślą zastosowania w cyfrowych systemach telewizyjnych. Nie jest związany z żadnym wykorzystywanym obecnie analogowym standardem telewizyjnym.
Umożliwia transmisję zarówno programów telewizyjnych zrealizowanych w europejskim standardzie 625 linii/50 Hz, jak i amerykańskim 525 linii/60 Hz. Istnieje również możliwość przesyłania nim programów zrealizowanych w standardach wysokiej rozdzielczości HDTV.
Kompresja MPEG-4 wprowadza duże innowacje w zagadnieniach kodowania strumienia multimedialnego, co przenosi się na płaszczyznę Internetu i telewizji.
Standard kompresji i transmisji danych multimedialnych MPEG-4 opracowany został w 1998 roku (ISO-14496) i definiuje metody reprezentacji danych, wprowadzając pojęcie obiektów audiowizualnych AVO (Audio Visual Object). To nowatorskie podejście (nazywane Object-Based Code) zakłada, iż scena audiowizualna jest zakodowaną reprezentacją obiektów AVO, powiązanych ze sobą odpowiednimi relacjami czasoprzestrzennymi.
Charakterystyczną cechą tego standardu jest fakt, iż obiekty AVO kodowane są niezależnie od swojego otoczenia czy tła (nie są traktowane jako jeden strumień bitowy). Zaletą takiego podejścia jest możliwość kodowania obiektów, niosących ważne informacje w sposób bardziej odporny na błędy – istnieje możliwość wyboru stosowanej rozdzielczości np. do tła sceny).
Przed rozpoczęciem transmisji, koder i dekoder wymieniają informacje kontrolne niezbędne w procesie dekodowania AVO (np. klasy algorytmów).
Po stronie nadawczej przeprowadzane są procesy kodowania informacji, zabezpieczania przed błędami (stosujące zaawansowane mechanizmy korekcji), multipleksacja (w jednym strumieniu może nastąpić połączenie do 1024 strumieni elementarnych) oraz wysyłanie danych. Po stronie odbiorczej występują mechanizmy odwrotne czyli demultipleksacja, dekodowanie, składanie i prezentacja danych.
Ze względu na złożoność techniki standardu wprowadzono profile umożliwiające częściową implementację. Należą do nich:
Scene Profiles – profile systemowe obejmujące:
Standard kodowania AVC (Advanced Video Coding) jest połączeniem badań grupy ITU (International Telecommunications Union) i ISO (International Standards Organization). Kodowanie tego typu jest również obecnie znane pod nazwą „H.26L”, numerem dokumentu ITU „H.264” czy „MPEG-4 part 10”.
Po zakończeniu prac nad pierwotnym standardem H.263 w 1995 grupa ekspertów ITU Video Coding Experts Group rozpoczęła długofalowe prace dotyczące stworzenia nowego standardu, obniżającego bitową szybkość transmisji wizualnej. W konsekwencji otrzymano znacznie lepszą jakość kompresji w porównaniu do obowiązujących dotychczas standardów ITU-T. Przyczyniło się to do utworzenia w 2001 roku przez ISO MPEG nowej grupy ekspertów JVT (Join Video Team), której głównym zadaniem jest rozwój projektu H.26L w kontekście międzynarodowego standardu (Rys.2).
Do podstawowych zmian wprowadzonych w MPEG-4 AVC należą:
Wprowadzone zmiany powodują. iż MPEG-4 AVC dostarcza dużych możliwości na polu techniki. Nowy, prezentowany standard może zostać wdrożony sprawnie i stosunkowo łatwo w środowisku DVB i powinien znaleźć szerokie zastosowanie w tego typu rozwiązaniach w ciągu maksimum dwóch lat.
Aplikacje wykorzystujące kompresje MPEG-4:
Przeprowadzono już pokazy wideokonferencji prowadzonych z terminala mobilnego. Transmisja odbywa się na podstawie wielodostępu kodowego WB-CDMA (WideBand Code Division Multiply Access) z prędkością około 300 kb/s właśnie z wykorzystaniem kompresji MPEG4.
Opracowano pierwszy na świecie układ kodeka (koder/dekoder) MPEG-4 w postaci chipu (10,84 x 10,84 mm z modułem pamięci 12 MB).
Pierwszy wideotelefon wykorzystujący kompresję MPEG4 przystosowany został do pracy w trybie transmisji pakietowej GPRS (prędkość od 9,6 do 144 kb/s). Układ opracowano z myślą o sieciach CDMA i trzeciej generacji (UMTS). Wideotelefon może działać również w infrastrukturze radiokomunikacyjnej bez trybu GPRS. Jednak jakość transmisji wideo jest wówczas bardzo słaba.
Planowane jest uruchomienie pierwszego systemu transmisji multimedialnej. System ma składać się ze specjalnych terminali, zaopatrzonych w kolorowy wyświetlacz ciekłokrystaliczny oraz małą kamerę CCD. Terminale mają współpracować z telefonami komórkowymi PHS. Przekazy audiowizualne będą transmitowane z prędkością 32/64 kb/s.
Prowadzone są również prace nad uniwersalną platformą, która połączyć ma zarówno standard MPEG-2, jak i MPEG -4 AVC w pewne i ekonomiczne przejście na nowo realizowane systemy dekodujące.
MPEG-4 pozwala na dużą modyfikacje w zależności od oczekiwanej jakości obrazu i dźwięku oraz parametrów kanału transmisyjnego. Kodowanie obiektów AVO może zachodzić z różną dokładnością i mocą obliczeniowa, uwzględniając tym samym możliwości kodera/dekodera.
Dużą zaletą standardu MPEG-4 jest możliwość przystosowania go do pracy w środowisku o różnej przepustowości, co pozwala na współpracę z rożnymi sieciami, np. GSM, ISDN, ATM, Internet i nośnikami informacji jak dysk optyczny, karty elektroniczne itd. Umożliwia minimalną transmisję na poziomie ok. 10 kb/s z zadowalającą jakością (odpowiadającą transmisji mowy w systemach GSM).