El lenguaje de marcas (markup language en inglés) es un sistema para codificar un documento combinando texto y etiquetas o marcas que contienen información adicional sobre la estructura del texto y su presentación.
La idea y el nombre surgieron de las anotaciones que los editores escribían en los manuscritos con instrucciones de revisión y maquetación del documento para la imprenta. Así, este mismo concepto se trasladó mediante el lenguaje de marcas al mundo de la informática.
El lenguaje de marcas más extendido y conocido es el HTML (HyperText Markup Language, lenguaje de marcas de hipertexto) y es la base de la World Wide Web, ya que se usa para indicar a un navegador de qué modo tiene que visualizar un documento en la pantalla de un ordenador.
El XML (eXtensible Markup Language, lenguaje de marcas extensible) es un lenguaje de etiquetas desarrollado por el World Wide Web Consortium (W3C) que no tan solo sirve para aplicarlo en Internet, sino también como estándar para el intercambio de información entre diferentes plataformas.
El XLIFF (XML Localisation Interchange File Format) es un tipo de XML específico para el intercambio de información entre las diferentes herramientas que intervienen en un proceso de localización.
Otros formatos traducibles que contienen información en etiquetas y que se utilizan a menudo para la programación de aplicaciones son los archivos PHP, PO y .strings.
Para la traducción de páginas web, es recomendable proporcionar el contenido al traductor en uno de estos formatos, ya sea extrayendo un archivo en formato XML, XLIFF o Excel desde el gestor de contenidos de nuestra web o descargando directamente los archivos HTML.
El principal inconveniente para la traducción de este tipo de archivos es que el texto que hay que traducir se encuentra mezclado entre todo tipo de etiquetas que no se deben modificar si queremos mantener la estructura y la presentación del texto.
Entonces es cuando entran en acción las herramientas de traducción asistida por ordenador (TAO) como las que empleamos en Ampersand Traducciones, ya que estos programas disponen de filtros que, en el momento de importar un archivo traducido, reconocen su extensión y ocultan todo lo que no sea texto traducible y que el traductor no tendría que modificar para que el formato del archivo traducido se mantenga intacto.