Dateiformate: Unterschied zwischen den Versionen

Aus IV1
Hans4mido (Diskussion | Beiträge)
Die Seite wurde neu angelegt: „In einem elektronischem Dokument müssen häufig Informationen verschiedener Art gespeichert werden: Ein Textdokument z.B. enthält nicht nur den erfassten Text, ...“
 
K Textersetzung - „mussswiki.idv.edu“ durch „mussswiki.idb.edu“
 
(45 dazwischenliegende Versionen von 7 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
In einem elektronischem Dokument müssen häufig Informationen verschiedener Art gespeichert werden: Ein Textdokument z.B. enthält nicht nur den erfassten Text, sondern auch Formatinformationen (Schriftart und -größe, Seitengröße, Ränder, Tabulatorpositionen und -arten, Schriftausrichtung, ...) sowie eingebettete Grafiken und Bilder.
<!--<yambe:breadcrumb>Informationsdarstellung|Informationsdarstellung</yambe:breadcrumb>-->
{{Kurzform|In einem elektronischen Dokument müssen häufig Informationen verschiedener Art gespeichert werden: Ein Textdokument z. B. enthält nicht nur den erfassten Text, sondern auch Formatinformationen (Schriftart und -größe, Seitengröße, Ränder, Tabulatorpositionen und -arten, Schriftausrichtung, ...) sowie eingebettete Grafiken und Bilder.


Um all diese Informationen in einer Datei (die zunächst nichts anderes als eine Folge von Bytes ist) richtig identifizieren und interpretieren zu können, müssen Konventionen festgelegt werden, z.B. wie die verschiedenen Informationsarten gekennzeichnet sind, wie ihre Anfangsposition und ihre Länge in der Datei ermittelt werden kann, ... Ein Satz von solchen Konventionen wird als ein Dateiformat bezeichnet.
Um all diese Informationen in einer Datei (die zunächst nichts anderes als eine Folge von Bytes ist) richtig identifizieren und interpretieren zu können, müssen Konventionen festgelegt werden, z. B. wie die verschiedenen Informationsarten gekennzeichnet sind, wie ihre Anfangsposition und ihre Länge in der Datei ermittelt werden kann, ... Ein Satz solcher Konventionen wird als ein Dateiformat bezeichnet.


Dateiformate wurden für verschiedene Zwecke definiert: für grafische Informationen (sowohl für Vektorgrafiken als auch für Pixelgrafiken), für Textdokumente, für die Auf¬zeichnung von Schall, für Multimediapräsentationen, für Programme (die „nur” spezielle Dateien sind), ... Für den gleichen Zweck können dabei durchaus verschiedene Dateifor¬mate definiert sein. Neben standardisierten Dateiformaten (bei Bildern z.B. GIF, das „Graphics Image Format”, oder JPEG, ein von der „Joint Photographic Expert Group” genormtes Dateiformat), die auch zum Informationsaustausch zwischen verschiedenen Anwendungsprogrammen geeignet sind, definieren viele Applikationen eigene („proprietäre”) Dateiformate.
Dateiformate wurden für verschiedene Zwecke definiert: für grafische Informationen (sowohl für Vektorgrafiken als auch für Pixelgrafiken), für Textdokumente, für die Aufzeichnung von Schall, für Multimediapräsentationen, für Programme (die „nur” spezielle Dateien sind), ... Für den gleichen Zweck können dabei durchaus verschiedene Dateiformate definiert sein. Neben standardisierten Dateiformaten (bei Bildern z. B. GIF, das „Graphics Image Format”, oder JPEG, ein von der „Joint Photographic Expert Group” genormtes Dateiformat), die auch zum Informationsaustausch zwischen verschiedenen Anwendungsprogrammen geeignet sind, definieren viele Applikationen eigene („proprietäre”) Dateiformate.


Der Benutzer eines Personalcomputers speichert ein von ihm bearbeitetes Dokument (Text, Daten, Bild, Sprache, Sound) in einem vom jeweiligen Anwendungssoftwarepaket vorgesehenen Dateiformat unter Verwendung eines vom Betriebssystem zugelassenen Dateinamens (Filenames) ab. Zu beachten sind die daraus resultierende eingeschränkte Zugänglichkeit und Nutzbarkeit durch jene Benutzer, die andere Anwendungssoftwarepakete einsetzen. Die Vielfalt an PC-Dateiformaten (Fileformaten) erschwert nicht nur das Wiederauffinden von gespeicherten Dokumenten, sondern auch das Nutzen der Informationen durch andere Benutzer.
Der/die BenutzerIn eines Personalcomputers speichert ein von ihm/ihr bearbeitetes Dokument (Text, Daten, Bild, Sprache, Sound) in einem vom jeweiligen Anwendungssoftwarepaket vorgesehenen Dateiformat unter Verwendung eines vom Betriebssystem zugelassenen Dateinamens (File-Name) ab. Zu beachten sind die daraus resultierende eingeschränkte Zugänglichkeit und Nutzbarkeit durch jene BenutzerInnen, die andere Anwendungssoftwarepakete einsetzen. Die Vielfalt an PC-Dateiformaten (File-Formaten) erschwert nicht nur das Wiederauffinden von gespeicherten Dokumenten, sondern auch das Nutzen der Informationen durch andere BenutzerInnen.  


Immer häufiger bestehen bei Endbenutzerwerkzeugen sowohl beim Speichern, als auch beim Öffnen von Dokumenten Wahlmöglichkeiten zwischen mehreren Dateiformaten.
Immer häufiger bestehen bei EndbenutzerInnen-Werkzeugen sowohl beim Speichern als auch beim Öffnen von Dokumenten Wahlmöglichkeiten zwischen mehreren Dateiformaten. }}
[Bearbeiten] Tabellenkalkulationsformate
[Bearbeiten] Textformate


== Grafikformate
[Bearbeiten] Video
[Bearbeiten] Audio
[Bearbeiten] Ausführbare Dateien
[Bearbeiten] Audio
[Bearbeiten] Tabellenformate (csv, txt,…)
[Bearbeiten] Präsentationsdateien
[Bearbeiten] Sicherung der Informationsdarstellung


Informationen müssen gegen Fehler abgesichert werden, die z.B. bei Datenübertragun¬gen (durch Störungen des elektrischen Signals), aber auch durch Speicherung auf defek¬ten Speichermedien auftreten können. Das Prinzip hierfür ist überall dasselbe: Zusätzliche („redundante” ) Bits werden eingeführt und erhalten ihren Wert in Abhängigkeit von den abzusichernden Daten.
__TOC__


Ein einfaches Verfahren dieser Art ist das Paritätsbit: Ein zusätzliches Bit wird so gesetzt, dass die Anzahl der Eins-Bits gerade (bei „gerader Parität”) bzw. ungerade („ungerade Parität”) ist. Lautet z.B. der Wert eines Bytes 01101011, so ist dieser Wert bei gerader Parität durch ein Bit mit dem Wert 1 zu ergänzen: Es ergibt sich 011010111. Wird ein Bit verfälscht (z.B. 010010111), ist die Anzahl der Eins-Bits ungerade, und die Verfälschung der Daten wird erkannt. Der Fehler kann aber aus den falschen Daten heraus nicht korrigiert werden (im Fall der Datenübertragung z.B. müssen die verfälschten Werte noch einmal angefordert werden). Ebenso wenig können Fehler erkannt werden, bei denen zwei Bits verfälscht wurden (z.B. 010010101), da die Anzahl der Eins-Bits gerade bleibt.


Aufwendigere Verfahren können auch Fehler erkennen, bei denen mehr als ein Bit verfälscht wird; manche dieser Verfahren können auch bestimmte Fehler korrigieren, ohne dass die verfälschten Daten neu übertragen werden müssen. (Im Fall von Disketten und Festplatten wird z.B. ein Verfahren namens „cyclic redundancy check” eingesetzt; wird z.B. beim Lesen oder Beschreiben einer Diskette oder Festplatte die Fehlermeldung „CRC-Fehler” angezeigt, so bedeutet dies, dass eine Verfälschung der aufgezeichneten Information eingetreten ist – z.B. aufgrund eines Materialdefekts auf dem Datenträger.)
== Textformate ==
[Bearbeiten] Datenkompression


Wird bei den Verfahren zur Fehlererkennung und -korrektur gezielt Redundanz eingeführt, so sollen die Verfahren der Datenkompression Redundanz reduzieren (etwa um Speicherplatz einzusparen oder die Dauer einer Datenübertragung zu verkürzen).
*.txt (ASCII Textdatei)
*.odt (OpenOffice.org Writer)
*.docx (XML-basiertes Dateiformat von Microsoft Word)
*.doc (Microsoft Word)
*.rtf (Rich Text Format; zum Datenaustausch zwischen Textverarbeitungsprogrammen unterschiedlicher Hersteller)
*.pdf (Portable Document Format; ist ein plattformübergreifendes Dateiformat für Dokumente)


Grundlage der Datenkompression bildet dabei die Beobachtung, dass verschiedene Werte nur selten gleich häufig gebraucht werden (z.B. kommt in deutschen Texten das „E” wesentlich häufiger vor als das „Y”). Diese Beobachtung kann ausgenutzt werden, indem häufiger vorkommende „Zeichen” durch kürzere Bitfolgen dargestellt werden als seltenere Zeichen (mit dieser Maßnahme allein kann z.B. bei deutschen Texten eine Reduktion des benötigten Speicherplatzes um ca. 30% erreicht werden).
== Tabellenkalkulationsformate ==


Aufwendigere Verfahren, die noch bessere Ergebnisse liefern, berücksichtigen darüber hinaus Abhängigkeiten zwischen verschiedenen „Zeichen” (so kann z.B. angenommen werden, dass in den Worten der deutschen Sprache auf jedes „Q” ein „U” folgt; Bilder besitzen häufig größere, mit einer Farbe eingefärbte Flächen, sodass ein Bildpunkt weitaus häufiger mit der Farbe eines Nachbarpunktes eingefärbt ist als mit einer anderen Farbe). Extrem hohe Kompressionsraten kann man in Spezialfällen erreichen, in denen das „Original” nicht exakt rekonstruierbar, sondern lediglich erkennbar bleiben muss (z.B. bei Bildern oder Schallwellen); höhere Datenkompressionsraten bedingen in diesen Fällen jedoch immer einen stärkeren Qualitätsverlust zum Original. Kann man das Original wieder vollständig herstellen spricht man von verlustfreier Kompression, ansonsten von verlustbehafteter Kompression. Komprimierte Daten sind zur Durchführung von Be- und Verarbeitungsoperationen allerdings ungeeignet. Vor Be- und Verarbeitungsschritten sind diese Daten daher wieder zu dekompri¬mieren
*.ods (OpenOffice.org Calc)
*.xls (Microsoft EXCEL)
*.xlsx (XML-basiertes Dateiformat von Microsoft Excel)
 
== Grafikformate ==
 
*.tif (Tag Image File Format, zum Austausch hochaufgelöster Bilder im Printbereich)
*.gif (Graphics Interchange Format, beinhaltet verlustfreie Kompression, Verwendung hauptsächlich in Webdokumenten)  
*.jpg (File-Interchange-Format, reduziert (für das menschliche Auge wenig sichtbar) die Bildqualität und komprimiert das File, um die File-Größe zu verringern, vielseitig verwendbar, z. B. Digitalkameras, Webdokumente)
*.png (Portable Network Graphics ist ein Grafikformat mit verlustfreier Kompression, als Ersatz für .gif gedacht)
*.svg (Scalable Vector Graphics, Standard zur Beschreibung zweidimensionaler Vektorgrafiken in der XML-Syntax)
*.psd (Photoshop Document, ist eines der proprietären Dateiformate von Adobe Photoshop)
 
== Video und Audio ==
 
* .mpg, .mpeg (qualitativ hochwertiges Komprimierungsformat von Audio- und Video-Daten)
* .wav (Format für Audio-Daten, Microsoft Windows)
* .mp3 (verlustbehaftetes Komprimierungsformat für Audiodateien)
* .mov (QuickTime Movie)
* .avi (Format für Video-Daten, Microsoft Windows)
* .ogg (freies Audio-,Videoformat)
 
== Ausführbare Dateien ==
 
* .exe (Windows)
* .com (Windows)
* .bat (Windows)
 
== Präsentationsdateien ==
 
* .odp (OpenOffice.org Impress)
* .pptx (XML-basiertes Dateiformat von Microsoft PowerPoint)
* .ppt (Microsoft PowerPoint)
 
== Zitiervorschlag ==
''Bodenhofer'' in ''Höller'', Informationsverarbeitung I, Informationsdarstellung#Dateiformate (mussswiki.idb.edu/iv1)

Aktuelle Version vom 1. Oktober 2018, 14:08 Uhr

In einem elektronischen Dokument müssen häufig Informationen verschiedener Art gespeichert werden: Ein Textdokument z. B. enthält nicht nur den erfassten Text, sondern auch Formatinformationen (Schriftart und -größe, Seitengröße, Ränder, Tabulatorpositionen und -arten, Schriftausrichtung, ...) sowie eingebettete Grafiken und Bilder.

Um all diese Informationen in einer Datei (die zunächst nichts anderes als eine Folge von Bytes ist) richtig identifizieren und interpretieren zu können, müssen Konventionen festgelegt werden, z. B. wie die verschiedenen Informationsarten gekennzeichnet sind, wie ihre Anfangsposition und ihre Länge in der Datei ermittelt werden kann, ... Ein Satz solcher Konventionen wird als ein Dateiformat bezeichnet.

Dateiformate wurden für verschiedene Zwecke definiert: für grafische Informationen (sowohl für Vektorgrafiken als auch für Pixelgrafiken), für Textdokumente, für die Aufzeichnung von Schall, für Multimediapräsentationen, für Programme (die „nur” spezielle Dateien sind), ... Für den gleichen Zweck können dabei durchaus verschiedene Dateiformate definiert sein. Neben standardisierten Dateiformaten (bei Bildern z. B. GIF, das „Graphics Image Format”, oder JPEG, ein von der „Joint Photographic Expert Group” genormtes Dateiformat), die auch zum Informationsaustausch zwischen verschiedenen Anwendungsprogrammen geeignet sind, definieren viele Applikationen eigene („proprietäre”) Dateiformate.

Der/die BenutzerIn eines Personalcomputers speichert ein von ihm/ihr bearbeitetes Dokument (Text, Daten, Bild, Sprache, Sound) in einem vom jeweiligen Anwendungssoftwarepaket vorgesehenen Dateiformat unter Verwendung eines vom Betriebssystem zugelassenen Dateinamens (File-Name) ab. Zu beachten sind die daraus resultierende eingeschränkte Zugänglichkeit und Nutzbarkeit durch jene BenutzerInnen, die andere Anwendungssoftwarepakete einsetzen. Die Vielfalt an PC-Dateiformaten (File-Formaten) erschwert nicht nur das Wiederauffinden von gespeicherten Dokumenten, sondern auch das Nutzen der Informationen durch andere BenutzerInnen.

Immer häufiger bestehen bei EndbenutzerInnen-Werkzeugen sowohl beim Speichern als auch beim Öffnen von Dokumenten Wahlmöglichkeiten zwischen mehreren Dateiformaten.



Textformate

  • .txt (ASCII Textdatei)
  • .odt (OpenOffice.org Writer)
  • .docx (XML-basiertes Dateiformat von Microsoft Word)
  • .doc (Microsoft Word)
  • .rtf (Rich Text Format; zum Datenaustausch zwischen Textverarbeitungsprogrammen unterschiedlicher Hersteller)
  • .pdf (Portable Document Format; ist ein plattformübergreifendes Dateiformat für Dokumente)

Tabellenkalkulationsformate

  • .ods (OpenOffice.org Calc)
  • .xls (Microsoft EXCEL)
  • .xlsx (XML-basiertes Dateiformat von Microsoft Excel)

Grafikformate

  • .tif (Tag Image File Format, zum Austausch hochaufgelöster Bilder im Printbereich)
  • .gif (Graphics Interchange Format, beinhaltet verlustfreie Kompression, Verwendung hauptsächlich in Webdokumenten)
  • .jpg (File-Interchange-Format, reduziert (für das menschliche Auge wenig sichtbar) die Bildqualität und komprimiert das File, um die File-Größe zu verringern, vielseitig verwendbar, z. B. Digitalkameras, Webdokumente)
  • .png (Portable Network Graphics ist ein Grafikformat mit verlustfreier Kompression, als Ersatz für .gif gedacht)
  • .svg (Scalable Vector Graphics, Standard zur Beschreibung zweidimensionaler Vektorgrafiken in der XML-Syntax)
  • .psd (Photoshop Document, ist eines der proprietären Dateiformate von Adobe Photoshop)

Video und Audio

  • .mpg, .mpeg (qualitativ hochwertiges Komprimierungsformat von Audio- und Video-Daten)
  • .wav (Format für Audio-Daten, Microsoft Windows)
  • .mp3 (verlustbehaftetes Komprimierungsformat für Audiodateien)
  • .mov (QuickTime Movie)
  • .avi (Format für Video-Daten, Microsoft Windows)
  • .ogg (freies Audio-,Videoformat)

Ausführbare Dateien

  • .exe (Windows)
  • .com (Windows)
  • .bat (Windows)

Präsentationsdateien

  • .odp (OpenOffice.org Impress)
  • .pptx (XML-basiertes Dateiformat von Microsoft PowerPoint)
  • .ppt (Microsoft PowerPoint)

Zitiervorschlag

Bodenhofer in Höller, Informationsverarbeitung I, Informationsdarstellung#Dateiformate (mussswiki.idb.edu/iv1)