CSS, HTML und Javascript mit {stil}

HTML Sprachcodes

Sprachcodes – Sprache der Webseite

Eine Reihe von HTML-Tags, in erster Linie aber das html-Tag der Webseite und das link hreflang-Tag im head-Element, weisen Attribute für die Angabe der Sprachcodes auf.

Sprachcodes (Language Codes) für Webseiten bestimmen die gesprochene Sprache des HTML-Dokuments, sind im ISO Standards 639-1 festgelegt und bestehen aus zwei Kleinbuchstaben.

Sprachcodes sind für die Sprachausgabe gedacht und sollen den Suchmaschinen helfen, den Inhalt zuzuordnen. Dem Browser soll die Angabe des Sprachcodes z.B. helfen, die typografischen Anführungszeichen und Sonderzeichen der Sprache richtig anzuzeigen und eine korrekte Silbentrennung durchzuführen.

Die Suchmaschinen stellen anhand des hreflang-Attributs die Ausrichtung der Webseite fest, um etwa gleiche Inhalte mit einer URL in Deutschland und einer URL in der Schweiz nicht als Duplicated Content zu behandeln, sondern als Sprachversionen de und ch.

Angabe der Sprache in HTML5

<html lang="de">

oder XHTML

<html xmlns="http://www.w3.org/1999/xhtml" lang="de" xml:lang="de">

Sprachcodes können aus zwei Teilen bestehen: aus dem primären Sprachcode und einem optionalen Subcode.

en-us // die US-Version von Englisch
en-gb // Englisch 
de-ch // Schweizerdeutsch
fr-ch // Französiche Schweiz
fr-ca // Französisch Kanada
cz-cs // Tschechien

Ein Subcode aus zwei Buchstaben soll als Ländercode nach [ISO3166] aufgefasst werden.

  • "af" Afghanistan
  • "sq" albanisch
  • "ar" arabisch
  • "eu" baskisch
  • "bg" bulgarisch
  • "da" dänisch
  • "de" deutsch
  • "eo" esperanto
  • "et" estnisch
  • "fo" faroese
  • "fi" finnisch
  • "fr" französisch
  • "gl" galizisch
  • "el" griechisch
  • "iw" hebräisch
  • "ga" irisch
  • "is" isländisch
  • "it" italienisch
  • "ja" japanisch
  • "ca" katalanisch
  • "hr" kroatisch
  • "lv" latvian
  • "lt" litauisch
  • "mt" maltesisch
  • "mk" mazedonisch
  • "nl" niederländisch
  • "no" norwegisch
  • "pl" polnisch
  • "pt" portugisisch
  • "ro" rumänisch
  • "ru" russisch
  • "gd" schottisch
  • "sr" serbisch
  • "sk" slovakisch
  • "sl" slowenisch
  • "es" spanisch
  • "sv" schwedisch
  • "cs" tschechisch
  • "tr" türkisch
  • "uk" ukrainisch
  • "hu" ungarisch
Accept-Charset: ISO-8859-1,UTF-8;q=0.7,*;q=0.7[CRLF]
Accept-Language: de,en;q=0.7,en-us;q=0.3[CRLF]

Keine Sprache

Wenn der Text in keiner Sprache ist, sondern eine lange Artikelnummer oder Blindtext? Das gibt's tatsächlich. Dafür hat die IANA "zxx" als Sprachcode für keine Sprache.

<span lang="zxx">
   Lorem ipsum dolor sit amet, consectetur adipiscing elit.
</span>
Italian COLLINS SANSONI ITALIEN DICTIONARY FRENCH COLLINS ROBERTS FRENCH DICTIONARY Oxford Consise Bayrisch Universal Wörterbuch Kölsch GOOGLE G Suchen Finden