Traducir archivos de lenguaje de marcas: HTML, XML, XLIFF

Ampersand

¿Qué es el lenguaje de marcas?

El lenguaje de marcas (markup language en inglés) es un sistema para codificar un documento combinando texto y etiquetas o marcas que contienen información adicional sobre la estructura del texto y su presentación.

La idea y el nombre surgieron de las anotaciones que los editores escribían en los manuscritos con instrucciones de revisión y maquetación del documento para la imprenta. Así, este mismo concepto se trasladó mediante el lenguaje de marcas al mundo de la informática.

Tipos principales de lenguaje de marcas para la traducción

html, etiquetes, tags, llenguatge de marquesEl lenguaje de marcas más extendido y conocido es el HTML (HyperText Markup Language, lenguaje de marcas de hipertexto) y es la base de la World Wide Web, ya que se usa para indicar a un navegador de qué modo tiene que visualizar un documento en la pantalla de un ordenador.

El XML (eXtensible Markup Language, lenguaje de marcas extensible) es un lenguaje de etiquetas desarrollado por el World Wide Web Consortium (W3C) que no tan solo sirve para aplicarlo en Internet, sino también como estándar para el intercambio de información entre diferentes plataformas.

El XLIFF (XML Localisation Interchange File Format) es un tipo de XML específico para el intercambio de información entre las diferentes herramientas que intervienen en un proceso de localización.

Otros formatos traducibles que contienen información en etiquetas y que se utilizan a menudo para la programación de aplicaciones son los archivos PHP, PO y .strings.

Para la traducción de páginas web, es recomendable proporcionar el contenido al traductor en uno de estos formatos, ya sea extrayendo un archivo en formato XML, XLIFF o Excel desde el gestor de contenidos de nuestra web o descargando directamente los archivos HTML.

Traducción de archivos con formato de etiquetas

El principal inconveniente para la traducción de este tipo de archivos es que el texto que hay que traducir se encuentra mezclado entre todo tipo de etiquetas que no se deben modificar si queremos mantener la estructura y la presentación del texto.

Entonces es cuando entran en acción las herramientas de traducción asistida por ordenador (TAO) como las que empleamos en Ampersand Traducciones, ya que estos programas disponen de filtros que, en el momento de importar un archivo traducido, reconocen su extensión y ocultan todo lo que no sea texto traducible y que el traductor no tendría que modificar para que el formato del archivo traducido se mantenga intacto.