ASCII (American Standard Code for Information Interchange)

ASCII steht für American Standard Code for Information Interchange. ASCII ist eine Zeichenkodierung, die numerische Codes zur Darstellung von Zeichen verwendet. Dazu gehören englische Groß- und Kleinbuchstaben, Zahlen und Interpunktionssymbole.

Standard-ASCII

Standard-ASCII kann 128 Zeichen darstellen. Er verwendet 7 Bits zur Darstellung jedes Zeichens, da das erste Bit des Bytes immer 0 ist. Zum Beispiel wird ein großes "T" durch 84 oder 01010100 im Binärformat dargestellt. Ein kleingeschriebenes "t" wird durch 116 oder 01110100 in binärer Form dargestellt. Andere Tasten der Tastatur werden ebenfalls auf Standard-ASCII-Werte abgebildet. Zum Beispiel ist die Escape-Taste (ESC) in ASCII 27 und die Löschtaste (DEL) 127.

ASCII-Codes können auch als hexadezimale Werte anstelle der oben aufgeführten Dezimalzahlen (0 bis 127) angezeigt werden. Zum Beispiel ist der ASCII-Wert der Escape-Taste (27) in hexadezimaler Darstellung 1B. Der hexadezimale Wert der Löschtaste (127) ist 7F.

Erweiterter ASCII

Die 128 (27) Zeichen, die von Standard-ASCII unterstützt werden, reichen aus, um alle standardmäßigen englischen Buchstaben, Zahlen und Interpunktionssymbole darzustellen. Es reicht jedoch nicht aus, um alle Sonderzeichen und Zeichen aus anderen Sprachen darzustellen. Extended ASCII hilft bei der Lösung dieses Problems, indem es zusätzliche 128 Werte für insgesamt 256 (28) Zeichen hinzufügt. Die zusätzlichen Binärwerte beginnen mit einer 1 anstelle einer 0. Beispielsweise wird das Zeichen "é" im erweiterten ASCII durch 233 oder 11101001 im Binärformat dargestellt. Der Großbuchstabe "Ö" wird durch 214 bzw. 11010110 in binärer Form dargestellt.

Der erweiterte ASCII-Zeichensatz verdoppelt zwar den Zeichensatz von Standard-ASCII, enthält aber nicht annähernd genug Zeichen, um alle Sprachen zu unterstützen. Einige asiatische Sprachen benötigen zum Beispiel Tausende von Zeichen. Daher werden heute für Dokumente und Webseiten häufiger andere Zeichenkodierungen wie Latin-1 (ISO-8859-1) und UTF-8 als ASCII verwendet. UTF-8 unterstützt über eine Million Zeichen.

Stand: 08.05.2018