Albergue de Náufragos
Códigos de idiomas

Los puntos 4.1 y 4.2 de las Directrices de Accesibilidad para el Contenido en la Web (http://www.discapnet.es/web_accesible/wcag10/WAI-WEBCONTENT-19990505_es.html), nos indican que cuando creamos una página web, debemos prestar atención en indicar el idioma principal del documento y si hay cambios de idioma en el mismo.
¿Para qué sirve esto?:

Y más allá de las cuestiones técnicas, que son muy importantes, quizás convenga recordar que "mucha de la vida cultural, espiritual e intelectual de la gente se vive a través del idioma. Esto va desde rezos, mitos, cerremonias, poesía, oratoria y vocabulario técnico, hasta las formas de saludo diario, estilos conversacionales, humor, formas de hablar a los niños y términos únicos para hábitos, comportamientos y emociones. Cuando un idioma se pierde, todo esto se tiene que reacomodar en el nuevo idioma (con categorías diferentes de palabras, sonidos y estructuras gramaticales) si es que se conserva."(2).

A esto yo le agrego el artículo 9° de la Declaración Universal de Derechos Lingüísticos (http://www.egt.ie/udhr/udlr-es.html) que dice que "toda comunidad lingüística tiene el derecho a codificar, estandarizar, preservar, desarrollar y promover su sistema lingüístico, sin interferencias inducidas o forzadas."

¿Y cómo lo hacemos?

En HTML:

Si todo el texto de la página está escrito, por ejemplo, en guaraní, agregaremos en la etiqueta <html> lo siguiente:

<html lang="gu">

Donde gu es el código correspondiente al guaraní.

En el caso que insertemos en un texto de un idioma una palabra o frase de otro, deberemos agregar el atributo lang en la etiqueta span, por ejemplo:

<p>En mapuche, gente o pueblo se dice <span lang="arn">che</span>.</p>

En XML:

Usaremos la etiqueta xml:lang de la siguiente forma:

<p>En mapuche, gente o pueblo se dice <span xml:lang="arn">che</span>.</p>

¿En qué norma se basan estos códigos?

En 1988 se creó la norma internacional ISO 639-1 que identificaba a las lenguas más comunes con un código de dos letras. El problema fue que pronto se encontró que faltaba identificar muchas lenguas y que el sistema de dos letras no alcanzaba para todas (ISO 639-1 identificaba sólo 136 idiomas), por lo que, en el año 1991 se lanzó la norma ISO 639-2 (3) que le da un código de tres letras a unos 400 idiomas. Ante la posibilidad que un mismo lenguaje tenga un código de dos letras y otro de tres letras (sucede en varios casos), la norma RFC 3066 (4), complementando la anteriormente citada, recomienda usar el código de dos letras.

Pero... la ISO 639-2 no incluía a todas las lenguas, sino que ampliaba el espectro de las clasificadas y nada más. En el caso de muchas lenguas de Latinoamérica, salvo las habladas por mucha gente (aymará, guaraní, mapudungun, quechua, etc.) la norma las agrupa por regiones. Así, la mayoría de las lenguas de Sudamérica se las agrupa bajo el código genérico de sai y, en caso de Centroamérica, cai. Para intentar solucionar este problema, en el año 2005 se dio a conocer el borrador de la norma ISO 639-3 que le da un código individual de tres letras a cada una de las lenguas. Como esta norma aún no se ha convertido en un estándar, y aprovechando una opción que la norma RFC 3066 ofrece para lenguas no estandarizadas, en HTML y XHTML se deberá escribir de la siguiente forma:

<html lang="x-sil-xxx">

Y en XML deberá usarse:

xml:lang="x-sil-xxx"

Donde xxx es el código de tres letras brindado por ISO 639-3. Así, si queremos definir un texto escrito en Aoniken o Tehuelche, los respectivos códigos serían:

<html lang="x-sil-teh">

Y...

xml:lang="x-sil-teh"

Resumiendo, si escribimos información en una página, deberemos buscar en la norma ISO 639-1 el código de dos letras que le corresponda al idioma en que está escrita dicha información. Si dicha norma no define un código para ese idioma, deberemos buscarlo en ISO 639-2 y, si en dicha norma se define un código genérico en vez de uno específico, buscaremos en la ISO 639-3 el código que se define para esa lengua.

Agradecimientos

Quiero hacer público mi profundo agradecimiento a las siguientes personas que han aportado sus sugerencias, críticas, observaciones y aportes para la realización de este trabajo: (En estricto orden alfabético) Emmanuelle Gutiérrez y Restrepo (http://www.sidar.org/que/ge/egyr.php), Charles McAthieNevile (http://www.w3.org/People/Charles/) (en especial, sus pacientes explicaciones de cómo volcar esta información a RDF), Eva María Méndez (http://rayuela.uc3m.es/~mendez/) y Héctor Russo.

Lista de códigos de lenguas iberoamericanas (5)

He realizado un listado de todas las lenguas iberoamericanas que podrás encontrar en este sitio.

Para mayor información, sugiero visitar la página de Accesibilidad.

Volver a la página principal
Volver a la página principal de accesibilidad
Volver a la página de preguntas más frecuentes de accesibilidad
Volver arriba

Notas al pie

1: Así, por ejemplo, si desde nuestro navegador en español, escribimos la dirección http://www.google.com, aparecerá en el mismo la versión en español del sitio, en vez de la versión original en inglés. Esto sucede porque el servidor de Google tiene negociación de idioma y, al detectar el idioma de nuestro navegador, redirecciona al sitio de ese idioma. Y si el navegador que estuviéramos usando fuera Opera, las prestaciones de idiomas serían aún mayores. (Volver al texto principal)
2: "Endangered languages", Woodbury, Anthony (1997), Geoffrey Numberg y Thomas Wason (editores), citado y traducido en el sitio del AILLA. (Volver al texto principal)
3: Podrá encontrar el listado completo en las páginas http://lcweb.loc.gov/standards/iso639-2/langcodes.html y http://www.oasis-open.org/cover/iso639a.html. (Volver al texto principal)
4: Podrá encontrar el listado completo de la norma en la página http://www.ietf.org/rfc/rcf3066.txt. (Volver al texto principal)

Derecho de Autor © 2004 Claudio Segovia
Permiso para copiar, distribuir y/o modificar este documento bajo los términos de la Licencia de Documentación Libre GNU (../inst/gnu.html), Versión 1.1 o cualquier otra versión posterior publicada por la Free Software Foundation (http://www.gnu.org/fsf/fsf.es.html); sin Secciones Invariantes, sin texto de la Cubierta Frontal, y sin texto de la Cubierta Posterior. Una copia de la licencia es incluida en la sección titulada "Licencia de Documentación Libre GNU" (../inst/ldl-gnu.html).

Esta página adhiere a la campaña "Se ve mejor con cualquier navegador - Campaña para un WWW no específico de un navegador (http://www.anybrowser.org/campaign/anybrowser_es.html)".
Por favor, hágame saber si ha encontrado algo en mi sitio que no funcione con su navegador (especifíqueme qué navegador está usando y qué no funcionó) y trataré de arreglarlo.
Se ve mejor con cualquier navegador - Enlace a página de CampañaD

Todos los nombres propios, distintivos, logos, marcas, sistemas, hardware, equipos, etc. que aparecen en estas páginas web enlazando a sitios, son marcas registradas de sus respectivas compañias, empresas, organizaciones y/o propietarios. El hecho que aparezcan no implica ningún tipo de compromiso monetario o moral de dichas organizaciones con el autor de éstas páginas, ya que fueron colocadas por éste por simple gusto personal, como colaboración desinteresada para promocionar dichos sitios.

Webmaster: Claudio Segovia - Buenos Aires, San Justo y Lago Puelo - Argentina
Nacimiento del Albergue: 7 de enero de 1999
Ultima actualización: Domingo 2 de noviembre de 2008
Dirección de correo electrónico: claudiosegovia@gmail.com

A Ema, Matilde y Cecilia