Videofilmen, Wissen

Was ist MPEG-4? Technische Hintergründe

Dienstag, 31. Januar 2006: Schon 1988 wurde ein Komitee gegründet, das sich mit verschiedenen Komprimierungstechniken von digitalen Audio- und Videosignalen befassen und sie zu einer Normierung führen sollte: Die „Motion Picture Expert Group„. Die von ihr verabschiedeten Komprimierungsverfahren tragen den gleichen Namen: MPEG. Inzwischen ist aus den Anstrengungen dieser „Expertengruppe für bewegte Bilder„ eine ganze Familie an Kompressionsstandards für Bild und Ton hervorgegangen. Alle arbeiten mit einer sogenannten asymmetrischen Kodierung, was bedeutet, dass die Komprimierung des Datenstroms erheblich mehr Rechenaufwand erfordert als das Lesen.

Beim Group Of Picture Management wird eine Gruppe von Bildern zusammengefasst und in einem Datenpaket, aufgeteilt in I-, B- und P-Frames komprimiert.

Das erste MPEG-Format, MPEG-1, wurde 1991 vorgestellt. Es macht sich spezielle Eigenschaften des Fernsehbildes und unseres Sehvermögens zu Nutze und erreicht so Kompressionsraten von bis zu 200:1. Entwickelt wurde dieser Standard vor allem für interaktive Informations-, Lern- und Spielprogramme auf CD, die Video CD, sowie für die interaktive CD-i.

MPEG 2

Schon bei der Verabschiedung des MPEG-1 Standards hatte die analoge Videotechnik den Schritt zur Highband -Technik auch im Amateurbereich vollzogen. Die daraus resultierende höhere Bildqualität kann MPEG-1 nicht verarbeiten. Vor allem die Fernsehanstalten waren im Hinblick auf das digitale Fernsehen und Pay-TV an einem besseren Komprimierungsverfahren interessiert. Sie forderten ein qualitativ hochwertigeres Komprimierungsverfahren, das auch die Halbbildtechnik des Videosignals berücksichtigt. 1994 wurde MPEG-2 verabschiedet. Es basiert im Prinzip auf MPEG-1, vollzieht die Bildanalyse aber in wesentlich feineren Strukturen. Außerdem eignet es sich auch für das beim Fernsehen übliche Zeilensprungverfahren. Des Weiteren sind verschiedene Bildformate und Qualitätsstufen möglich.

Parallel zu MPEG-2 wurde an MPEG-3 gearbeitet, das für das künftige hochauflösende Fernsehen HDTV bestimmt sein sollte. Im Laufe der Entwicklungsarbeit erkannte man jedoch, dass diese Aufgabe auch MPEG-2 übernehmen könnte und legte es entsprechend dafür aus. MPEG-3 wurde darauf hin als eigenständiges Kompressionsformat eingestellt.

MPEG zum Dritten: MPEG 4

Im Herbst 1993 wurde die Arbeit an einem weiteren MPEG-Standard aufgenommen. Er sollte gute Ergebnisse bei Raten unter 64 kBit/s ermöglichen, wie sie in der Bildtelefonie oder für Videoanwendungen im Internet interessant sind (z.B. Webcam, Streaming Video, Videokonferenzen), da hier die Leitungskapazitäten noch relativ gering sind. Doch schon während der Entwicklungsarbeit wurde der Anwendungsbereich auf Video- und Audioanwendungen ausgedehnt. Allerdings geht es bei diesem Standard weniger um eine qualitativ hochwertige Komprimierung für die Videobearbeitung, sondern mehr um die Analyse des Bildinhaltes auf Bild- und Tonobjekte, um diese gegebenenfalls auch voneinander getrennt zu verarbeiten. Dazu wird das Bild in statische und bewegte Elemente sowie einzelne räumliche Ebenen aufgelöst, die darin enthaltenen Objekte auf getrennten Kanälen digital verarbeitet und mit Hilfe der schon bekannten MPEG-Komprimierungstechniken zeitgleich übertragen. Inzwischen wird MPEG 4 bereits in der Praxis verwendet. Es verblüfft durch eine gute Bildqualität bei wesentlich geringerem Speicherbedarf als MPEG 1 und 2.

MPEG zum Letzten?

1998 wurde die Arbeit am vorläufig letzten MPEG-Standard aufgenommen. Allerdings handelt es sich hier nicht um ein Komprimierungsverfahren, sondern um eine Weiterentwicklung der Eigenschaften von MPEG 4 bezüglich der Objekterkennung. Deshalb wurde mit der 7 als Nummer auch ein gewisser Abstand zu den bisherigen Standards geschaffen. Die Versionen 5 und 6 gibt es derzeit nicht. Es ist auch nicht bekannt, ob die Lücke geschlossen werden soll.

Wie funktioniert MPEG?

Der erste Schritt zur Datenreduktion findet noch vor der Digitalisierung des Fernsehbildes statt. Wie in der Einführung erwähnt, genügen für den Eindruck einer fließenden Bewegung 25 Bilder pro Sekunde allemal. Ein Zusammenfassen der 50 Halbbilder auf 25 Vollbilder bewirkt allerdings Bewegungsunschärfen, da ein bewegtes Objekt auf beiden Halbbildern unterschiedliche Positionen hat. Deshalb wird nur ein Field verwendet. Da es nur über die Hälfte der Bildinformation verfügt, reduziert sich das Bildformat beim PAL-Fernsehformat auf 352 x 288 Pixel, beim amerikanischen und japanischen NTSC auf 352 x 240 Pixel.

Der nächste Schritt ist die Komprimierung des Farbraums durch Umwandlung der Farbinformation und Aufteilung in sogenannte Macroblöcke, deren Farbinformation noch weiteren Analysen unterzogen wird.

Beim Group Of Picture Management wird eine Gruppe von Bildern zusammengefasst und in einem Datenpaket, aufgeteilt in I-, B- und P-Frames komprimiert.

Wer einmal mittels Einzelbildschaltung sein Video betrachtet, wird feststellen, dass die Unterschiede zwischen zwei Bildern relativ gering sind, außer bei schnellen Bewegungen und beim Szenenwechsel. Genau hier setzt nun MPEG-1 an. Ein beliebiges Ausgangsbild wird mit nur geringer Kompression digitalisiert. Diese Referenz wird I-Einzelbild (Intra-Einzelbild) genannt. Gewöhnlich ist bei MPEG-1 nur jedes 12. Oder 15. Bild (also alle halbe Sekunde bei PAL bzw. NTSC) ein I-Einzelbild. Um die Änderungen zwischen beiden zu ermitteln, wird es in Macroblöcke zu 16 x 16 Pixel zerlegt. Durch diverse mathematische Verfahren werden die Änderungen in zeitlicher wie in räumlicher Ebene ermittelt. Damit liefert ein I-Einzelbild die Ausgangsdaten für zwei weitere, nämlich die P- und B-Frames.

Ein P-Einzelbild (Predicted-Einzelbild) beinhaltet nur die Unterschiede zum vorhergehenden I-Einzelbild oder einem anderen P-Einzelbild, kann aber seinerseits wieder als Referenz für eine Änderung dienen, da es auch Informationen über das nächste Bild enthält. Deshalb darf die Kompressionsrate auch hier noch nicht zu hoch sein (etwa Faktor 3 gegenüber dem I-Einzelbild). Eigentlich ist es bereits kein Bild mehr, sondern nur noch ein Datenblock, der in Bezug zum Ausgangsbild und den B-Frames steht. Das B-Einzelbild (Bidirectional-Einzelbild) lässt sich am höchsten komprimieren, benötigt aber, wie der Name schon andeutet, Informationen des letzten, aber auch des nachfolgenden Bildes. Das kann ein I-, ein P- oder auch ein weiteres B-Einzelbild sein. Allerdings darf man sich hier nicht mehr ein Bild im wörtlichen Sinne vorstellen, sondern nur ein Datenpaket, das einen Näherungswert aus dem letzten und dem folgenden Bild enthält. Die Organisation der I-, B- und P-Frames wird in Gruppen, sogenannten GOP s (Group Of Pictures) vorgenommen. Dabei ist nicht vorgeschrieben, dass alle Bildtypen vorhanden sein müssen. So kann die Codierung nur aus I-Frames bestehen, was qualitativ zwar das beste Ergebnis liefert, aber auch den meisten Speicherplatz benötigt. Ein guter Kompromiss ist eine I-P-Einzelbild Codierung, wobei die P-Frames so gesetzt werden müssen, dass deren Abstände ein Vielfaches der I-Frames betragen, also z.B. jedes zweite oder vierte einer Gruppe ein P-Einzelbild ist.

Die höchste Kompression wird mit B-Frames erzielt. Je mehr B-Frames innerhalb einer Bildgruppe erzeugt werden, um so geringer ist der Speicherbedarf, aber auch die Bildqualität. Gleichzeitig steigt der Rechenaufwand, da die Bilder erst aus den unterschiedlichen Datenblöcken rekonstruiert werden müssen.

Da nur die Eigenschaften der oben genannten Bildtypen festgelegt sind, nicht aber deren Abfolge, kommt es, je nach verwendeten Codec, zu unterschiedlichen Ergebnissen. MPEG-1 scheidet aufgrund der Digitalisierung nur eines Halbbildes und der begrenzten Auflösung für die Videobearbeitung aus. Als Speichermedium für das alternde Videoarchiv ist er nur begrenzt zu verwenden, da allenfalls VHS-Niveau möglich ist. Bei Hi 8 oder S-VHS Aufnahmen geht zuviel Qualität verloren. Des Weiteren eignet sich der MPEG-1 Standard nicht sehr gut für detailreiche Videosequenzen mit viel Bewegung (z.B. Sport). Auch bei Schwenks oder Zoomfahrten stößt dieses Komprimierungsverfahren an seine Grenzen. Dann werden an Objektkanten oder feineren Bilddetails meist sogenannte Bewegungsartefakte kleine Klötzchen sichtbar. Für Anwendungen, bei denen es mehr auf den Inhalt als auf die Qualität ankommt, ist MPEG-1 als Komprimierungsstandard jedoch gut geeignet.

Zur Sicherung und Nachbearbeitung in S-Video Qualität eignet sich MPEG-2 besser. Es basiert im Wesentlichen auf der MPEG-1 Technologie, komprimiert aber beide Halbbilder und arbeitet mit der vollen PAL- bzw. NTSC-Auflösung. Insgesamt wurden für MPEG-2 vier Substandards verabschiedet:

  • Low (352 x 288 Pixel mit 1,5 bis 4 Mbit/s.) für die Kompatibilität mit MPEG-1.
  • Main (720 x 576 Pixel) mit bis zu 15 Mbit/s. für DV, digitales Fernsehen und DVD.
  • High 1440 (1140 x 1152 Pixel) mit 60 Mbit/s für HDTV im 4:3 Format
  • High (1920 x 1080 Pixel) mit 80 Mbit/s. für HDTV im 16:9 Format.

MPEG-2 ist als Komprimierungsstandard für die DVD weithin bekannt, die Qualität überzeugt auch Profis. Fernsehanstalten und Medienkonzerne nutzen das Komprimierungsverfahren zur digitalen Übertragung via Satellit, da sich damit mehrere Programme auf einem Kanal gleichzeitig senden lassen. Die Berücksichtigung beider Halbbilder, die größere Anzahl von Macroblöcken zur exakteren Bildanalyse sowie der größere Farbraum machen MPEG-2 auch für die Videobearbeitung interessant. Professionelle Schnittsysteme wie Silver von Fast arbeiten mit dem I-Einzelbild-only-Format. Hier werden keine P- oder B-Frames erzeugt, weshalb auf jedes Einzelbild zugegriffen werden kann. Da jedes für sich komprimiert wird, ist der Speicherplatz nicht wesentlich geringer als bei M-JPEG basierenden Systemen. Dafür entfallen aufwändige Berechnungen von Zwischenbildern, die Schnittsysteme arbeiten schneller und präziser. Werden zusätzlich auch P-Frames gespeichert, erhöht sich zwar der Rechenaufwand etwas, doch der Speicherplatzbedarf sinkt bereits merklich.

Den meisten Rechenaufwand benötigen Schnittsysteme nach dem I-B-P Einzelbild-Verfahren, da hier die Zwischenbilder wieder aufwändig rekonstruiert werden müssen. Mit Prozessoren unter 500 MHz Taktfrequenz arbeiten solche Systeme in der Regel nicht sauber. Die Grenzen dieses Verfahrens machen sich beim Anfahren eines Schnittpunktes per Einzelbildschaltung bemerkbar: Erfolgt der Bildwechsel zu schnell, kommt es zu Bildsprüngen von mehreren Bildern, der Schnittpunkt muss erneut, diesmal langsamer angefahren werden. Bei Schnittprofis ist daher das I-B-P Einzelbild- Verfahren nicht sehr beliebt. Ganz anders bei der Produktion von DVD s. Das Filmmaterial wird dafür in der Regel nach diesem Verfahren komprimiert, da beim Nutzer keine Nachbearbeitung mehr erfolgt.

 

Preisvergleich für MPEG Camcorder bei idealo.de.




Leserkommentare
Keine Kommentare

Kommentar hinzufügen

* - Pflichtfeld

*
*



*