Dateiformate: Unterschied zwischen den Versionen

Aus IV1
Hans4mido (Diskussion | Beiträge)
Die Seite wurde neu angelegt: „In einem elektronischem Dokument müssen häufig Informationen verschiedener Art gespeichert werden: Ein Textdokument z.B. enthält nicht nur den erfassten Text, ...“
 
Verbod (Diskussion | Beiträge)
Keine Bearbeitungszusammenfassung
Zeile 11: Zeile 11:
[Bearbeiten] Textformate
[Bearbeiten] Textformate


== Grafikformate
== Grafikformate ==
[Bearbeiten] Video
[Bearbeiten] Video
[Bearbeiten] Audio
[Bearbeiten] Audio
Zeile 19: Zeile 19:
[Bearbeiten] Präsentationsdateien
[Bearbeiten] Präsentationsdateien
[Bearbeiten] Sicherung der Informationsdarstellung
[Bearbeiten] Sicherung der Informationsdarstellung
Informationen müssen gegen Fehler abgesichert werden, die z.B. bei Datenübertragun¬gen (durch Störungen des elektrischen Signals), aber auch durch Speicherung auf defek¬ten Speichermedien auftreten können. Das Prinzip hierfür ist überall dasselbe: Zusätzliche („redundante” ) Bits werden eingeführt und erhalten ihren Wert in Abhängigkeit von den abzusichernden Daten.
Ein einfaches Verfahren dieser Art ist das Paritätsbit: Ein zusätzliches Bit wird so gesetzt, dass die Anzahl der Eins-Bits gerade (bei „gerader Parität”) bzw. ungerade („ungerade Parität”) ist. Lautet z.B. der Wert eines Bytes 01101011, so ist dieser Wert bei gerader Parität durch ein Bit mit dem Wert 1 zu ergänzen: Es ergibt sich 011010111. Wird ein Bit verfälscht (z.B. 010010111), ist die Anzahl der Eins-Bits ungerade, und die Verfälschung der Daten wird erkannt. Der Fehler kann aber aus den falschen Daten heraus nicht korrigiert werden (im Fall der Datenübertragung z.B. müssen die verfälschten Werte noch einmal angefordert werden). Ebenso wenig können Fehler erkannt werden, bei denen zwei Bits verfälscht wurden (z.B. 010010101), da die Anzahl der Eins-Bits gerade bleibt.
Aufwendigere Verfahren können auch Fehler erkennen, bei denen mehr als ein Bit verfälscht wird; manche dieser Verfahren können auch bestimmte Fehler korrigieren, ohne dass die verfälschten Daten neu übertragen werden müssen. (Im Fall von Disketten und Festplatten wird z.B. ein Verfahren namens „cyclic redundancy check” eingesetzt; wird z.B. beim Lesen oder Beschreiben einer Diskette oder Festplatte die Fehlermeldung „CRC-Fehler” angezeigt, so bedeutet dies, dass eine Verfälschung der aufgezeichneten Information eingetreten ist – z.B. aufgrund eines Materialdefekts auf dem Datenträger.)
[Bearbeiten] Datenkompression
Wird bei den Verfahren zur Fehlererkennung und -korrektur gezielt Redundanz eingeführt, so sollen die Verfahren der Datenkompression Redundanz reduzieren (etwa um Speicherplatz einzusparen oder die Dauer einer Datenübertragung zu verkürzen).
Grundlage der Datenkompression bildet dabei die Beobachtung, dass verschiedene Werte nur selten gleich häufig gebraucht werden (z.B. kommt in deutschen Texten das „E” wesentlich häufiger vor als das „Y”). Diese Beobachtung kann ausgenutzt werden, indem häufiger vorkommende „Zeichen” durch kürzere Bitfolgen dargestellt werden als seltenere Zeichen (mit dieser Maßnahme allein kann z.B. bei deutschen Texten eine Reduktion des benötigten Speicherplatzes um ca. 30% erreicht werden).
Aufwendigere Verfahren, die noch bessere Ergebnisse liefern, berücksichtigen darüber hinaus Abhängigkeiten zwischen verschiedenen „Zeichen” (so kann z.B. angenommen werden, dass in den Worten der deutschen Sprache auf jedes „Q” ein „U” folgt; Bilder besitzen häufig größere, mit einer Farbe eingefärbte Flächen, sodass ein Bildpunkt weitaus häufiger mit der Farbe eines Nachbarpunktes eingefärbt ist als mit einer anderen Farbe). Extrem hohe Kompressionsraten kann man in Spezialfällen erreichen, in denen das „Original” nicht exakt rekonstruierbar, sondern lediglich erkennbar bleiben muss (z.B. bei Bildern oder Schallwellen); höhere Datenkompressionsraten bedingen in diesen Fällen jedoch immer einen stärkeren Qualitätsverlust zum Original. Kann man das Original wieder vollständig herstellen spricht man von verlustfreier Kompression, ansonsten von verlustbehafteter Kompression. Komprimierte Daten sind zur Durchführung von Be- und Verarbeitungsoperationen allerdings ungeeignet. Vor Be- und Verarbeitungsschritten sind diese Daten daher wieder zu dekompri¬mieren

Version vom 10. August 2009, 15:29 Uhr

In einem elektronischem Dokument müssen häufig Informationen verschiedener Art gespeichert werden: Ein Textdokument z.B. enthält nicht nur den erfassten Text, sondern auch Formatinformationen (Schriftart und -größe, Seitengröße, Ränder, Tabulatorpositionen und -arten, Schriftausrichtung, ...) sowie eingebettete Grafiken und Bilder.

Um all diese Informationen in einer Datei (die zunächst nichts anderes als eine Folge von Bytes ist) richtig identifizieren und interpretieren zu können, müssen Konventionen festgelegt werden, z.B. wie die verschiedenen Informationsarten gekennzeichnet sind, wie ihre Anfangsposition und ihre Länge in der Datei ermittelt werden kann, ... Ein Satz von solchen Konventionen wird als ein Dateiformat bezeichnet.

Dateiformate wurden für verschiedene Zwecke definiert: für grafische Informationen (sowohl für Vektorgrafiken als auch für Pixelgrafiken), für Textdokumente, für die Auf¬zeichnung von Schall, für Multimediapräsentationen, für Programme (die „nur” spezielle Dateien sind), ... Für den gleichen Zweck können dabei durchaus verschiedene Dateifor¬mate definiert sein. Neben standardisierten Dateiformaten (bei Bildern z.B. GIF, das „Graphics Image Format”, oder JPEG, ein von der „Joint Photographic Expert Group” genormtes Dateiformat), die auch zum Informationsaustausch zwischen verschiedenen Anwendungsprogrammen geeignet sind, definieren viele Applikationen eigene („proprietäre”) Dateiformate.

Der Benutzer eines Personalcomputers speichert ein von ihm bearbeitetes Dokument (Text, Daten, Bild, Sprache, Sound) in einem vom jeweiligen Anwendungssoftwarepaket vorgesehenen Dateiformat unter Verwendung eines vom Betriebssystem zugelassenen Dateinamens (Filenames) ab. Zu beachten sind die daraus resultierende eingeschränkte Zugänglichkeit und Nutzbarkeit durch jene Benutzer, die andere Anwendungssoftwarepakete einsetzen. Die Vielfalt an PC-Dateiformaten (Fileformaten) erschwert nicht nur das Wiederauffinden von gespeicherten Dokumenten, sondern auch das Nutzen der Informationen durch andere Benutzer.

Immer häufiger bestehen bei Endbenutzerwerkzeugen sowohl beim Speichern, als auch beim Öffnen von Dokumenten Wahlmöglichkeiten zwischen mehreren Dateiformaten. [Bearbeiten] Tabellenkalkulationsformate [Bearbeiten] Textformate

Grafikformate

[Bearbeiten] Video [Bearbeiten] Audio [Bearbeiten] Ausführbare Dateien [Bearbeiten] Audio [Bearbeiten] Tabellenformate (csv, txt,…) [Bearbeiten] Präsentationsdateien [Bearbeiten] Sicherung der Informationsdarstellung