M2a

Projekt Bildtutorial
Projekt Animation
Projekt Dateiformate
Projekt

Welche Textformate gibt es?
ASCII-Format (American Standard Code for Information Interchange) Es ist das Standardformat für unformatierten Text. Es ist ein 7-bit-Code, welcher 128 Zeichen enthält. Die Erweiterung auf den 8-bit-Code ermöglicht die Codierung von europäischen Zeichen wie die deutschen Umlaute und Akzente. Nachteil: Die Zeichenbelegung ist Hersteller- und länderspezifisch und bedarf deshalb beim Austausch einer Zeichenkonvertierung. Der heutige MIME-Standard, der Basis für Mailprogramme ist, wandelt im Hintergrund den 8-bit-Code in den 7-bit-Code um, sodaß eine sichere Übertragung im Rahmen des kleinsten gemeinsamen Nenners möglich ist. Neuere Entwicklungen beziehen sich auf den 16-bit-Code »Unicode«, der auch umfangreichere Zeichensätze ermöglicht (China).

RTF (Rich Text Format) Das von Microsoft entwickelte Austauschformat beschränkt sich auf einen 7-bit-ASCII-Code. Die Formatierungen bleiben erhalten. Leider können nicht alle Programme das Format lesen.

SGML (Standard Generalized Markup Language) Die bisher besprochenen Formate integrieren die Formatierungsanwei- sungen in die Datei, SGML-Dateien nicht. Während im Originaldoku- ment nur die Strukturen (Überschrift, Grundtext, Fußnote,…) gesichert werden, werden in einer separaten Datei die Formatierung definiert.

1. Welche Besonderheiten besitzen die Formate ASCII, ANSI, RTF, Unicode.

ANSI
Dieser Zeichensatz enthält 256 fortlaufend (von 0 bis 255) durchnummerierte Zeichen. Der ANSI-Zeichensatz stimmt in den Zeichen Nummer 32 bis 127 mit dem ASCII überein, ist also sozusagen abwärtskompatibel. Der ANSI-Zeichensatz geht jedoch über den ASCII hinaus; er enthält auch Sonderzeichen, etwa die Umlaute. Der ANSI-Zeichensatz wird daher auch als „extended ASCII“ (Dt.: „erweiterter ASCII“) bezeichnet.

(Die ersten 32 Zeichen des ANSI-Zeichensatzes (mit den Nummern 0 bis 31) sind Steuerbefehle (Engl.: „Control Characters“); es handelt sich dabei um nicht druck- oder darstellbare Zeichen. Die alphanummerischen Zeichen mit den Nummern 33 bis 127 stimmen, wie gesagt, zwischen ANSI-Zeichensatz und ASCII überein. Die ANSI-Zeichen mit den Nummern 128 bis 159 sind nicht definiert (vakant). Die ANSI-Zeichen mit den Nummern 160 bis 255 stimmen mit den des Unicode UCS-2-Skript „C1 Controls and Latin 1 Supplement“ überein.)

ASCII
Die ersten 32 Zeichen des ASCII werden als Kontrollzeichen benutzt, etwa für die Steuerung von Druckern. Diese Zeichen sind nicht anzeig- oder druckbar.
Die deutschen Sonderzeichen (wie Umlaute und das ß) sind nicht Teil des ASCII. Auch die Sonderzeichen anderer europäischer Länder sind nicht im ASCII enthalten.

Unicode
Stellt alle gebräuchlichen Schriftsysteme in einem Zeichensatz dar. Unicode (Dt. etwa: „Einheitsschlüssel“) ist ein alphanumerischer Zeichensatz (CES), der weltweit alle bekannten Textzeichen (Buchstaben, Silbenzeichen, Piktogramme, Ideogramme, Satzzeichen, Sonder