Binärdatei

Eine Binärdatei ist eine Datei, die keinen Text enthält. Sie wird verwendet, um Daten in Form von Bytes zu speichern, die normalerweise als etwas anderes als Textzeichen interpretiert werden. Diese Dateien enthalten in der Regel Anweisungen in ihren Kopfzeilen, um festzulegen, wie die in ihnen gespeicherten Daten zu lesen sind. Sie können zur Speicherung aller Arten von Daten in einem Computer verwendet werden.

Obwohl alle Dateien Daten in ähnlicher Weise speichern, werden sie von Ihrem Betriebssystem nicht alle auf die gleiche Weise behandelt. Das bedeutet, dass eine Tondatei und ein Bild zwar im Dateisystem als zusammenhängende Datenfolgen gespeichert sind, ein Bild aber nicht in einem Musikplayer abgespielt werden kann und eine Musikdatei auch nicht in einer Fotobetrachtungssoftware geöffnet werden kann. Das Format der Datei beeinflusst dieses Verhalten. Anhand von Dateierweiterungen wie ".png" und ".mp3" wird bestimmt, welche Art von Daten sie enthalten sollen.

Binäre Dateien

Alle Dateien, die nicht zur Speicherung von Textdaten verwendet werden, fallen in diese Kategorie. Jeder benutzerdefinierte Dateityp kann mit einer Binärdatei erstellt werden, solange die notwendigen Informationen zum Lesen der Datei in der Datei gespeichert sind. Die einzige Voraussetzung dafür ist, dass ein geeignetes Programm zum Lesen dieser Art von Daten im System vorhanden ist. 

Das PNG-Format ist ein gutes Beispiel für den oben genannten Anwendungsfall. Eine PNG-Datei kann von den meisten Bildbetrachtern gelesen werden und zeigt grafische Informationen an. Wenn Sie eine PNG-Datei mit einem Texteditor öffnen, wird der größte Teil der Datei aus nicht erkennbaren Zeichen bestehen. Sie werden aber auch lesbare Textstücke finden, die über die gesamte Datei verstreut sind. Das liegt daran, dass die PNG-Datei kleine Abschnitte enthält, in denen neben den grafischen Informationen auch Textdaten gespeichert werden. Einige andere Dateiformate unterstützen dies ebenfalls, und dies ist aufgrund der dynamischen Natur von Binärdateien möglich.

Binärdateien enthalten einen Header am Anfang. Dieser Header ist der Schlüssel zur Datei. In ihm werden die Informationen gespeichert, die den Inhalt der Datei kennzeichnen. Normalerweise enthalten Header den Dateityp und andere Metadaten wie Größe und Datum der letzten Änderung. Wenn der Header einer Binärdatei beschädigt ist, ist dies gleichbedeutend mit dem Verlust des Schlüssels, was bedeutet, dass Sie nicht mehr auf sinnvolle Daten aus der Datei zugreifen können.

Vorteile der Verwendung von Binärdateien

Binärdateien bieten im Vergleich zu reinen Textdateien mehrere Vorteile:

Effizienz durch Komprimierung

Daten werden in Binärdateien nach benutzerdefinierten Regeln für anwendungsspezifische Optimierungen gespeichert. PNG ist ein hervorragendes Beispiel dafür, da es zur Erstellung kleiner und effizienter Bilddateien verwendet werden kann.

Höhere Sicherheit

Die Anpassungsmöglichkeiten, die Binärdateien bieten, ermöglichen es Unternehmen, eigene Kodierungsstandards zu erstellen, die sich nur schwer zurückentwickeln lassen. In den meisten Fällen besteht die einzige Möglichkeit, eine individuell kodierte Binärdatei zu lesen, darin, zu erraten, wie die Daten darin gespeichert wurden.

Unerreichte Geschwindigkeit

Da die Daten in einem Rohformat gespeichert werden und keine Zeichencodierungsstandards verwendet werden, können sie schneller gelesen und gespeichert werden. Dies ist der Hauptgrund, warum Datenspeicher für Anwendungen nicht mit reinen Textdateien erstellt werden.

Probleme mit Binärdateien

Obwohl Binärdateien viele Vorteile gegenüber reinen Textdateien bieten, haben sie auch einige Probleme:

Schwierig zu verarbeiten

Binärdateien können von herkömmlichen Textverarbeitungsprogrammen nicht gelesen werden, so dass ihre Bearbeitung schwer bis unmöglich wird. In den meisten Fällen entscheiden sich Anwendungen dafür, ihre Daten in einem eigenen Kodierungsschema zu speichern. Diese Daten können dann nur innerhalb der Anwendungen mit demselben Kodierungsschema bearbeitet werden.

Der Effizienzgewinn ist nicht einheitlich

Während die Speicherung von Daten im Binärformat bei Formaten wie PNG schnell und effizient sein kann, ergeben sich bei anderen Datentypen möglicherweise keine spürbaren Leistungsvorteile. Die Speicherung von Textdaten führt zu einem weiteren Problem bei der Kodierung und Dekodierung der Daten während der Anzeige.

Für Maschinen kann es verwirrend werden

Computer können Daten auf unterschiedliche Weise speichern und darauf zugreifen. Wenn binäre Daten zwischen zwei Computern mit unterschiedlichen Architekturen übertragen werden, können Probleme auftreten. Wenn ein Computer "WINDOWS" in einer Binärdatei speichert und die Datei auf einem anderen Computer mit einer anderen Architektur geöffnet wird, wird sie möglicherweise als "DOWSWIN" gelesen. Textdaten, die in TXT- oder ähnlichen Formaten gespeichert sind, sind gegen solche Probleme gefeit, da es Standards wie ASCII gibt.

Hier sind einige der wichtigsten Anwendungsfälle von Binärdateien:

  • Software-Entwicklung. Die meisten Compiler wie die JVM erstellen optimierten Bytecode aus dem Quellcode, um eine schnellere Ausführung zu ermöglichen. Während der Quellcode in Form von Textdateien gespeichert wird, macht es wenig Sinn, den Bytecode auf die gleiche Weise zu speichern. Dies liegt daran, dass der Quellcode von einem Entwickler bei der Erstellung der Software eingesehen werden muss, während der Bytecode von der Maschine gelesen werden muss.
  • Speicherung großer Datensätze. Datensätze für Aufgaben wie das Training von Modellen für maschinelles Lernen müssen oft gespeichert und Computern zur Verfügung gestellt werden. Die Speicherung eines Datensatzes in einer Textdatei ist zwar sinnvoll, da sie leicht eingesehen werden kann, kann aber Leistungsprobleme für die Maschine mit sich bringen.

Stand: 14.01.2022