Show
Im Computerbereich gibt es verschiedene Zeichensätze und Zeichencodierungen. Der Zeichensatz, also die Menge aller verwendbaren Zeichen, ist für HTML-Dokumente generell Unicode. Um ein konkretes Dokument zu erstellen, müssen Sie dafür eine Zeichencodierung verwenden. Die Zeichencodierung legt fest, wie ein bestimmtes Zeichen in Bits und Bytes abgebildet wird. Wenn Sie nichts weiter unternehmen, werden Ihre Werkzeuge (Editor, Browser) eine voreingestellte Codierung verwenden. Das ist insofern problematisch, als dass alle beteiligten Systeme nun raten müssen, in welcher Codierung ein Dokument vorliegt. Das ist aber nicht immer eindeutig erkennbar. Es ist deshalb eine gute Idee, für Klarheit zu sorgen.
Empfehlung: Verwenden Sie für neue Projekte UTF-8 als Zeichencodierung, wenn überwiegend westliche Sprachen verwendet werden (bei asiatischen Sprachen ist oft UTF-16 günstiger). Stellen Sie sicher, dass Sie diese Zeichencodierung nicht nur angeben, sondern das Dokument auch wirklich in diesem Format abspeichern. Lesen Sie dazu den Ratschlag zur praktischen Anwendung. Beachten Sie: Eine korrekt verwendete Zeichencodierung oder eine Ersatzschreibweise für einzelne Zeichen bedeutet nicht zwangsläufig, dass alle Zeichen korrekt dargestellt werden. Es müssen u. U. auch die Schriftarten auf dem Computer installiert werden, die für diese verwendeten Zeichen Darstellungsvorschriften enthalten. Fehlen diese, erscheinen statt der Schriftzeichen Kästchen oder Ähnliches auf dem Bildschirm. Als Autor von Webseiten können Sie Ihrer Webseite die passenden Schriften mitliefern. Eine Zeichencodierung beschreibt die konkrete Zuordnung eines Codepoints zu einem Byte oder einer Bytesequenz. UTF-8 und UTF-16 sind beispielsweise Codierungen für den Zeichensatz Unicode. Einige Software-Hersteller bezeichnen Zeichencodierungen mit einem historisch gewachsenen Synonym, nämlich der „Zeichensatz-“ oder kurz „Zeichentabelle“ (code page bzw. codepage). So bezeichnet beispielsweise Microsoft im seinem Windows-Betriebssystem die Zeichencodierung UTF-8 als „Codepage 65001“ oder kurz „CP65001“. Wenn Sie sich mit Zeichencodierung noch nicht weiter beschäftigt haben, ist es sicherlich am besten, wenn Sie zuerst die auf dieser Seite beschriebenen Grundlagen zur Zeichencodierung lesen und sich anschließend die konkreten Beschreibungen zur Umsetzungen in den einzelnen Techniken der nachfolgenden Links anschauen. Begrifflichkeiten[Bearbeiten]Für die Zeichen-Problematik gibt es eine Reihe Begrifflichkeiten, die allerdings oftmals falsch angewendet werden. Nachfolgend der Versuch einer Aufklärung: Zeichensatz[Bearbeiten]Ein Zeichensatz (englisch: character set, charset) ist die Gesamtheit der zur Verfügung stehenden Zeichen. Ein Zeichensatz ist ein eher abstraktes Gebilde, das nur die Zeichen selbst und eine Reihenfolge beschreibt, nicht jedoch eine konkrete Abbildung auf Byte-Werte. Das ist Aufgabe der Zeichencodierung. Beispielsweise ist Unicode ein Zeichensatz, UTF-8 hingegen ist eine Zeichencodierung. Zur Blütezeit der 1-Byte-Codierungen (für Zeichensätze mit bis zu 256 Zeichen) wurde die Unterscheidung zwischen Zeichensatz und Zeichencodierung in der Praxis oft vernachlässigt. Die Position eines Zeichens im Zeichensatz und seine Codierung ist mit den Werten von 0 bis 255 (= 1 Byte) immer gleich, und auch eindeutig in beide Richtungen. Bei Zeichensätzen mit mehr als 256 Zeichen gibt es jedoch mehrere Verfahren, sie auf Byte-Werte abzubilden, weswegen die Unterscheidung zwischen Zeichensatz und Zeichencodierung wichtig geworden ist. Der Zeichensatz für HTML-Dokumente ist seit Version 4.0 stets Unicode. Die Zeichencodierung eines konkreten Dokuments (Datei) ist beispielsweise UTF-8 oder ISO-8859-1. Mit einer 1-Byte-Codierung wie ISO-8859-1 können nur deren Zeichen direkt eingefügt werden. Über die Escaping-Mechanismen Numerische Zeichenreferenz und teilweise Entitys lassen sich alle in Unicode definierten Zeichen in ein HTML-Dokument einfügen. Statt Zeichensatz werden oft die Begriffe Font, Schriftart oder Zeichencodierung verwendet, obwohl diese genau genommen etwas anderes bedeuten. Auch wird die englische Übersetzung charset an vielen Stellen verwendet, an denen korrekterweise encoding (Codierung) stehen müsste. Das betrifft vor allem den Parameter Codepoint[Bearbeiten]Zeichen in einem Zeichensatz (z. B. ASCII oder Unicode) werden in einer bestimmten Reihenfolge in einem Coderaum (code space) angeordnet. Die Position eines Zeichens ist der Codepoint (zu Deutsch etwa „Codeposition“). Ein Zeichensatz mit Codepoints ist ein codierter Zeichensatz (coded character set). Ein Unicode-Zeichen wird oftmals in der Form Beispiel: € = Codepoint Schriftart[Bearbeiten]Für die grafische Darstellung von Zeichen wird eine Schriftart verwendet, die in der Regel eine in sich konsistente Gestaltung aufweist, beispielsweise für die Strich-Dicke oder Verzierungen. Arial, Times New Roman oder Courier sind Beispiele für Schriftarten. Schriftart ist im engeren Sinne nach eher ein Synonym zu Schriftschnitt, also bspw. Glyphe[Bearbeiten]Der Begriff Glyphe wird gelegentlich für die konkrete Darstellung eines Zeichens verwendet. Die Schriftart bestimmt, welches Zeichen mit welcher Glyphe dargestellt wird. Font[Bearbeiten]Ein Font ist die Aufbereitung einer Schriftart für den Einsatz mit einem Computer, also eine Datei, die eine Schriftart beschreibt. Tastatur-Layout[Bearbeiten]Ein Tastatur-Layout oder eine Tastaturbelegung (auch Tastenlayout oder Tastenbelegung) ordnet einer Taste auf der Tastatur einen Codepoint zu. Beispielsweise produziert die auf einer deutschen Tastatur mit „z“ beschriftete Taste mit einer deutschen Tastenbelegung den Unicode-Codepoint Weblinks[Bearbeiten]
Beachten Sie: Die Verweise sind nicht sprachspezifisch. Das heißt, es wird die Sprach-Version geöffnet, die in Ihrem Browser als bevorzugte Sprache voreingestellt ist (so eine Übersetzung existiert). Eine andere Sprache kann auf den W3C-Seiten oben rechts gewählt werden. Unicode:
Typografie:
Fontsammlungen:
Was bedeuten die formatierungszeichen?Die Formatierungszeichen sind Hilfestellungen für den Anwender. Sie zeigen versteckte Funktionen und helfen so, Fehler (zum Beispiel mehrere Leerzeichen hintereinander) zu finden.
Welche 3 formatierungszeichen gibt es?Formatierungszeichen in Word. Absatzmarke. Markiert das Ende eines Absatzes. ... . Manueller Zeilenumbruch innerhalb eines Absatzes. ... . Leerzeichen. ... . Geschützter Wortzwischenraum. ... . Geschützter Bindestrich. ... . Bedingter Trennstrich. ... . Tabulator.. Was sind formatierungszeichen Word?Word-Formatierungszeichen helfen Ihnen beim ordentlichen Text-Layout. Mit Formatierungszeichen sehen Sie ganz genau die Abstände zwischen den Wörtern, Sätzen und Absätzen Ihres Word-Dokuments. Standardmäßig ist die Anzeige ausgeschaltet, kann aber leicht aktiviert werden.
Warum ist das Einblenden von formatierungszeichen hilfreich?Formatierungszeichen unterstützen das Textlayout. In einer gedruckten Nachricht werden sie nicht angezeigt. Wenn Sie Formatierungszeichen aktivieren oder deaktivieren, bleibt Ihre Auswahl für alle nachfolgenden Nachrichten wirksam, die Sie verfassen, beantworten oder weiterleiten.
|