Studium, Ausbildung und Beruf

web uni-protokolle.de
 powered by
NachrichtenLexikonProtokolleBücherForenDonnerstag, 19. September 2019 

Datenkompression


Dieser Artikel von Wikipedia ist u.U. veraltet. Die neue Version gibt es hier.
Als Datenkompression bezeichnet man Verfahren zur Reduktion des von Daten durch Umkodieren. Zu einem solchen gehört eine Methode zur Reduktion der benötigten ( Kompression ) und der Wiederherstellung der Daten in Form ( Dekompression ).

Inhaltsverzeichnis

Informatik

Redundanz- und Irrelevanzreduktion

Die Datenkompression wird teils durch günstigere d.h. Vermeiden von Redundanz teils durch Weglassen von Information erreicht. die Daten mit einem Dekompressionsverfahren wieder originalgetreu werden können arbeitet es verlustfrei. Man spricht von Redundanzreduktion. Andernfalls ist es verlustbehaftet. In Fall spricht man von Irrelevanzreduktion.

Bei der verlustfreien Kompression wird die originäre Information I in komprimierte Information I' überführt. Diese Abbildung von nach I' ist eindeutig und umkehrbar.

Die verlustbehaftete Komprimierung reduziert die Information. Es wird ein zu Grunde gelegt das entscheidet welcher Anteil Information für den Empfänger entbehrlich ist.

Verfahren

Die theoretische Grundlage bildet die von ( Claude Shannon ; Kolmogoroff) erarbeitete Theorie der Information und ( Informationstheorie ). Diese beschreibt den Zusammenhang zwischen Informationsgehalt Zeichenkette auf der Basis von Zeichen durch Begriff der Entropie der Zeichenkette die im Allgemeinen auf bestimmte minimale Länge gebracht werden kann. In neuerer gibt es umgekehrt auch Ansätze den Informationsgehalt die 'Nichtmehrverkürzbarkeit' zurückzuführen ( Chaitin ).

Einsatzgebiete

Speicherung von Text

Texte sofern sie aus Buchstaben bestehen nicht aus eingescannten Bildern belegen wenig Speicherplatz. Textdatei ohne Bilder ist selten größer als MByte die eine verlustfreie Kompression auf 1/5 1/10 der Ursprungsgröße reduziert.

Beispiele:

 Ausgangstext: AUCH EIN KLEINER BEITRAG IST BEITRAG Kodiertext: AUCH EIN KLEINER BEITRAG IST -3  

Hier wurde erkannt dass die Worte und BEITRAG zweimal auftauchen und dadurch angegeben diese mit den gerade zurückliegenden übereinstimmen. Bei Betrachtung könnte dann auch das EIN in entsprechend kodiert werden.

Verwandt ist die tokenbasierte Kompression . Häufig wiederkehrende Schlüsselwörter werden durch Abkürzungen Tokens ersetzt.

 Ausgangstext: Print "Hallo"; Print "Hier" Kodiertext: "Hallo"; 3F "Hier"  

Weitere Verfahren die auf der sog. Entropiekodierung basieren:

Heutzutage stehen viele Datenkompressionsprogramme für den Rechnereinsatz zur Verfügung.

Speicherung von Bildern und Ton

Ton Bild und Film sind Einsatzgebiete Kompression. Anders wären die oftmals enormen Datenmengen zu handhaben. Bereits die Aufnahmegeräte begrenzen das Die Reduktion der gespeicherten Daten orientiert sich den physiologischen Wahrnehmungseigenschaften des Menschen. Die Kompression durch Algorithmen sich dabei typischerweise der Wandlung von Singalverläufen Abtastsignalen in eine Frequenzdarstellung.

In der akustischen Wahrnehmung des Menschen Frequenzen oberhalb 20-25 kHz meist nicht mehr und können bereits im Aufnahmesystem beschnitten werden werden leise Nebentöne nur schwer wahrgenommen so sie vom Kompressions-System entfernt werden können. Die Ogg Vorbis oder MP3 reduzieren das Datenvolumen um Faktoren bis 50. Bei einem Faktor von 10 sind den Menschen kaum noch Qualitätsunterschiede zum Ausgansformat z.B. WAV festzustellen. Eine CD von einer Stunde Laufzeit enthält etwa MByte Daten für HiFi-Stereo Ton. In einem Format benötigen diese Daten aber nur wenig als 60 MByte. Mit anderen Worten eine MP3-Format bespielte CD kann bis zu 10 hochqualitative Musik speichern und das bei einer von nur etwa 1 MByte/min was etwas als 128 kbit/s entspricht. Bei Verzicht auf sowie weiterer Qulitätsreduzierung ist bei zum Beispiel kbit/s schon Musikgenuss per Web-Radio möglich oder realisierbar.

In der optischen Wahrnehmung des Menschen werden Farben weniger aufgelöst als Helligkeitsänderungen daraus leitet sich die beim analogen Farbfernsehen bekannte YUV-422 Reduzierung ab. Kanten sind bedeutsamer und es existiert eine biologische Kontrastanhebung Machsche Streifen ). Mit moderater Tiefpassfilterung zur Farbreduktion zum durch den auf DCT-Transformation basierenden JPEG -Algorithmus oder den neueren auf Wavelet-Transformation basierenden JPEG2000 -Algorithmus verringert sich das Datenvolumen schnell um als 90%. Besteht man auf verlustfreie Kompression lassen sich fotografisch (oder vergleichbar) erstellte Bilder ihres typischen Rauschanteils nur ungenügend komprimieren. Aus Grund finden verlustlose digitale Kompressionsformate wie etwas TIFF -Format fast nur in der professionellen Fotografie Bild-Gestaltung ihre Anwendung. Das GIF -Format arbeitet auch verlustlos reduziert aber den auf 256 Farben so dass es eher Zeichnungen eignet oder für die Endergebnisse eines Wegen seiner grossen Reduktion findet es auf Webseiten Verwendung da es hier oftmals auf Ladezeiten ankommt und weil das GIF-Format auch Animationen erlaubt.

Filme werden mit ca. 25 Bildern Sekunde aufgenommen. Da sich die Bilder nur Szenenwechsel deutlich ändern beschränkt sich die Speicherung auf die Speicherung der Änderungen zwischen den Es werden Formate wie MJPG MPEG sowie diverse andere Formate verwendet. Im haben sich die Containerformate AVI (Microsoft) und (Apple) etabliert wobei der verwendete Codec nahezu frei wählbar ist zum Beispiel Intel die Indeo-Codierung der Cinepack-Codec oder der

Kompressionsartefakte

Als Kompressionsartefakte bezeichnen wir Qualitätseinbußen die durch die digitale Datenreduktion verursacht wird. Beispiele die schnarrende Stimme eines Handys bei schlechtem oder die gestörten Kanten bei hochkomprimierten Bildern JPEG oder JPEG2000 Format.

Zeittafel der arithmetischen Kompressions-Algorithmen

1949 Informationstheorie Claude Shannon
1949 Shannon-Fano- Entropiekodierung
1952 Huffman static
1964 Kolmogorov complexity concept
1975 Integer coding scheme Elias
1976 Arithmetic coding (Implementierung)
1977 Lempel-Ziv-Verfahren LZ77
1978 Lempel-Ziv-Verfahren LZ78
1984 Lempel-Ziv-Welch
1985 Apostolico Fraenkel Fibonacci coding
1986 Move-To-Front (Bentley et.al. Ryabko)
1986 ARC-Programm
1987 PKARC (=LZW)
1999 LZMA wird mit dem Frontends 7-zip veröffentlicht

Siehe auch

Bildkompression - Audiokompression - Codec - Kanalcodierung - Informationstheorie - Informatik

Weblinks

Biologie

Auch in der Biologie gibt es So wird bei Eukaryonten die Information für Proteine nicht immer in einer zusammenhängenden DNA -Sequenz codiert. Durch ein System von Introns und Exons und die Verarbeitung der mRNA durch alternatives Splicing kann eine DNA-Sequenz die Information für mehrere unterschiedliche Eiweiße tragen. Der jeweilige Kompressionsalgorithmus wird dabei den Spleißvorgang und seine Regulation definiert.



Bücher zum Thema Datenkompression

Dieser Artikel von Wikipedia unterliegt der GNU FDL.

ImpressumLesezeichen setzenSeite versendenSeite drucken

HTML-Code zum Verweis auf diese Seite:
<a href="http://www.uni-protokolle.de/Lexikon/Datenkompression.html">Datenkompression </a>