Sintaxis Simple
La sintaxis simple de los estándares es bastante sencilla, simplemente con un código de idioma de 2 letras en minúsculas para indicar el idioma requerido. Algunos ejemplos de estos "códigos de idioma" son:
"en"
para el Ingles,"es"
para el Español ó"fr"
para el Frances.
Un ejemplo de como definir un Párrafo con texto establecido en Frances:
<p lang="fr">Ceci est un paragraphe.</p>
Sintaxis Compuesta
La sintaxis compuesta de los estándares definidos, es lo suficientemente profunda como para marcar dialectos de idiomas extremadamente específicos. Esta sintaxis profunda está formada por subetiquetas de idioma separadas por guiones (guion medio), donde cada subetiqueta indica una determinada propiedad del idioma. Las 3 subetiquetas más comunes son:
Subetiqueta de Idioma:
Requerido. Un código de 2 o 3 caracteres que define el lenguaje básico, generalmente escrito en minúsculas. Por ejemplo, el código de idioma para inglés es "en"
y el código para Badeshi es "bdz"
.
Subetiqueta de Escritura:
Opcional. Esta subetiqueta define el sistema de escritura utilizado para el idioma y siempre tiene 4 caracteres, con la primera letra en mayúscula. Por ejemplo, francés en Braille es "fr-Brai"
y "ja-Kana"
es japonés escrito con el alfabeto Katakana. Si el idioma está escrito de una manera muy típica, como el inglés en el alfabeto latino, no es necesario utilizar esta subetiqueta.
Subetiqueta de Región:
Opcional. Esta subetiqueta define un dialecto del idioma base de una ubicación particular, y son 2 letras en mayúsculas que coinciden con un código de país o 3 números que coinciden con un área fuera del país. Por ejemplo, "es-ES"
es para el español que se habla en España y "es-013"
es el español que se habla en Centroamérica. “Español internacional” sería simplemente "es"
.
La subetiqueta de escritura precede a la subetiqueta de región si ambas están presentes: "ru-Cyrl-BY"
es ruso, escrito en alfabeto cirílico, como se habla en Bielorrusia.
Para los códigos de Países puedes ir a: Valores de Países.
Códigos de Idioma
El ISO 639-1 define abreviaciones para los idiomas como se muestran a continuación:
Código | Nombre |
---|---|
|
Afar |
|
Abkhazian |
|
Avestan |
|
Afrikaans |
|
Akan |
|
Amharic |
|
Aragonese |
|
Arabic |
|
Assamese |
|
Avaric |
|
Aymara |
|
Azerbaijani |
|
Bashkir |
|
Belarusian |
|
Bulgarian |
|
Bihari |
|
Bislama |
|
Bambara |
|
Bengali (Bangla) |
|
Tibetan |
|
Breton |
|
Bosnian |
|
Catalan |
|
Chechen |
|
Chamorro |
|
Corsican |
|
Cree |
|
Czech |
|
Old Church Slavonic, Old Bulgarian |
|
Chuvash |
|
Welsh |
|
Danish |
|
German |
|
Divehi, Dhivehi, Maldivian |
|
Dzongkha |
|
Ewe |
|
Greek |
|
English |
|
Esperanto |
|
Spanish |
|
Estonian |
|
Basque |
|
Persian (Farsi) |
|
Fula, Fulah, Pulaar, Pular |
|
Finnish |
|
Fijian |
|
Faroese |
|
French |
|
Western Frisian |
|
Georgian |
|
Cornish |
|
Kalaallisut, Greenlandic |
|
Irish |
|
Gaelic (Scottish) |
|
Galician |
|
Guarani |
|
Gujarati |
|
Gaelic, Manx |
|
Hausa |
|
Hebrew |
|
Croatian |
|
Haitian Creole |
|
Hindi |
|
Hiri Motu |
|
Hungarian |
|
Armenian |
|
Herero |
|
Icelandic |
|
Interlingua |
|
Interlingua |
|
Interlingue |
|
Igbo |
|
Nuosu, Sichuan Yi |
|
Inupiak |
|
Indonesian |
|
Ido |
|
Italian |
|
Inuktitut |
|
Japanese |
|
Indonesian |
|
Javanese |
|
Kongo |
|
Kikuyu |
|
Kwanyama |
|
Kazakh |
|
Khmer |
|
Kannada |
|
Korean |
|
Kanuri |
|
Kashmiri |
|
Kurdish |
|
Komi |
|
Kyrgyz |
|
Latin |
|
Luxembourgish |
|
Luganda, Ganda |
|
Limburgish (Limburger) |
|
Lingala |
|
Lao |
|
Lithuanian |
|
Luga-Katanga |
|
Latvian (Lettish) |
|
Malagasy |
|
Marshallese |
|
Maori |
|
Macedonian |
|
Malayalam |
|
Mongolian |
|
Moldavian |
|
Marathi |
|
Malay |
|
Maltese |
|
Burmese |
|
Nauru |
|
Norwegian bokmål |
|
Northern Ndebele |
|
Nepali |
|
Ndonga |
|
Dutch |
|
Norwegian nynorsk |
|
Norwegian |
|
Southern Ndebele |
|
Navajo |
|
Chichewa, Chewa, Nyanja |
|
Occitan |
|
Ojibwe |
|
Oromo (Afaan Oromo) |
|
Oriya |
|
Ossetian |
|
Pāli |
|
Pashto, Pushto |
|
Punjabi (Eastern) |
|
Polish |
|
Portuguese |
|
Quechua |
|
Romansh |
|
Kirundi |
|
Romanian |
|
Russian |
|
Kinyarwanda (Rwanda) |
|
Sanskrit |
|
Sindhi |
|
Sami |
|
Sango |
|
Serbo-Croatian |
|
Sinhalese |
|
Slovak |
|
Slovenian |
|
Samoan |
|
Shona |
|
Somali |
|
Albanian |
|
Serbian |
|
Swati, Siswati |
|
Sesotho |
|
Sundanese |
|
Swedish |
|
Swahili (Kiswahili) |
|
Tamil |
|
Telugu |
|
Tajik |
|
Thai |
|
Tigrinya |
|
Turkmen |
|
Tagalog |
|
Setswana |
|
Tonga |
|
Turkish |
|
Tsonga |
|
Tatar |
|
Tahitian |
|
Twi |
|
Uyghur |
|
Ukrainian |
|
Urdu |
|
Uzbek |
|
Venda |
|
Vietnamese |
|
Volapük |
|
Wallon |
|
Wolof |
|
Xhosa |
|
Yiddish |
|
Yoruba |
|
Zhuang, Chuang |
|
Chinese |
|
Chinese (Simplified) |
|
Chinese (Traditional) |
|
Zulu |