¿Qué es la traducción automática?

La traducción automática (TA o MT del inglés machine translation) estudia el uso de ordenadores y software para traducir texto e incluso diálogos orales entre dos idiomas.

Son herramientas que han conseguidos trabajos bastante aceptables entre lenguas muy cercanas (aunque no en todos los casos), pero bastante peores en lenguas más alejadas. Aunque en un primer momento, puede parecer muy sencillo intercambiar una palabra por otra, e incluso parece ser la tarea perfecta para una máquina, la traducción conlleva todo un engranaje de conocimientos lingüísticos y empíricos. No solamente bastan con conocer las normas de una lengua, sino también sus excepciones, su semántica (los significados de las palabras), su pragmática (cómo se utiliza la lengua en distintos campos del conocimiento o ámbitos de la vida), sus variedades regionales, y toda la cultura que hay detrás de un lenguaje. Así, podemos conseguir textos que no solo estén en otro idioma, sino que resulten comprensibles y adecuados. Sin embargo, las máquinas son mucho mejores buscando y encontrando cosas que ya se han traducido; por eso son tremendamente eficaces como herramienta, pero mediocres como traductor.

En la TA se queda por el camino la norma fundamental de cualquier traductor: que su trabajo sea invisible.

A día de hoy, teniendo en cuenta la alta necesidad de traducción debido a los procesos de globalización y a la digitalización de contenidos, es cuando más nos conviene entender la TA como una aliada para los traductores humanos: los traductores humanos puedes llegar a verse desbordados por la cantidad de texto que se necesita traducir al día alrededor del mundo. Por ejemplo, Google Translate traduce casi 150 mil millones de palabras al día, y ni siquiera es la herramienta que más volumen de traducción genera.

Sin embargo, es importante que nuestros clientes y la sociedad en general comprenda cómo funciona para evitar fiascos provenientes de la traducción automática y para poner en valor la figura del traductor.

Tipos

Actualmente, conviven varios tipos de TA, aunque los que tienen verdadera repercusión son 3: la TA basada en reglas, la TA estadística y la TA neuronal.

La TA basada en reglas

La traducción automática basada en reglas es la que intenta entender el funcionamiento interno de un idioma. Para crear una herramienta de este tipo, se necesita un manual de gramática de la lengua desde la que traducidos y otro de la lengua a la que queremos traducir, diccionarios bilingües y una serie de normas de transferencia (es decir, cómo una misma estructura funciona en el idioma de origen y en el de destino).

El gran inconveniente de este tipo de herramientas también es el motivo de que no se desarrollen más: necesita una inversión de tiempo y de recursos enorme. Una herramienta de TA basada en reglas no podrá traducir una frase si no aparece en su manual de gramática, o una palabra si no aparece en los diccionarios que hayamos cargado, así que es necesario estar actualizándola continuamente.

La parte buena de este tipo de herramientas es que son las que mejores resultados han generado para lenguas cercanas (como el gallego y el catalán, por ejemplo).

La TA estadística

Surge como una alternativa más económica de las herramientas de TA basadas en reglas, porque “solamente” hacen falta datos para que puedan empezar a funcionar. Hay que cargar en ellos un corpus (una colección de textos) en el idioma de destino lo más grande posible y otro con traducciones existentes entre los dos idiomas que queramos.

Para simplificar, estas herramientas tienen 3 procesos: la herramienta busca en el corpus de traducciones todas las traducciones posibles que existen para una frase y comprueba en el corpus en la lengua de destino la probabilidad de que una frase exista y sea correcta; finalmente, compara las dos búsquedas anteriores, ofrece para cada posible traducción el nivel de probabilidad de que la frase traducida sea correcta y muestra la traducción más probable.

Como resulta evidente, este planteamiento ofrecía al principio resultados bastante malos, que han ido mejorando hasta ser aceptables. Es el tipo de traducción automática que utilizaba Google Translator hasta hace unos años, pero decidió evolucionar al siguiente tipo de TA.

La TA neuronal

Es la incorporación más reciente en el mundo de la traducción automática. Igual que el tipo anterior, necesitan corpus muy grandes para funcionar; de hecho, si la TA estadística necesita millones de palabras, la TA neuronal necesitas millones de frases.

Gracias a estas inmensas colecciones de textos, se pretende emular la red neuronal de un cerebro humano en una máquina para que así pueda traducir de la forma más similar posible a cómo lo haría una persona.

No hay una forma simple de explicar este tipo de herramientas, pero tal y como las neuronas crean conexiones entre sí, las partes del lenguaje también crean redes con el resto de las palabras que la rodean. Por lo tanto, al disponer de tantísimos textos, las máquinas pueden analizar no solo cómo se traduce una palabra en concreto sino también cómo se relaciona con el resto de las palabras de su entorno: cuales suelen ir juntas, cuales se parecen más, etc. Es decir, no es capaz de comprender el porqué de las normas de un idioma, pero puede replicarlas en cierta medida.

Este tipo de herramientas pueden parecer la técnica definitiva para traducir. Es la que desarrolla Google Translate, como te contamos en este artículo, y parece la solución a todos los problemas de traducción del mundo, ¿no? Bueno, no exactamente. Muchas veces, cuando este tipo de herramientas tienen que crear una palabra que no está en su corpus, tratan de replicarla según las reglas que conocen y las palabras que sí tienen registradas, y terminan por generar palabras que no existen, verbos mal conjugados, términos que tienen otro significado, un orden poco frecuente en las frases, un léxico que no se ajusta al contexto…

En esta tabla, puedes ver un pequeño esquema que compara los 3 tipos de traducción automática fundamentales:

TA BASADA EN REGLAS

TA ESTADÍSTICA TA NEURONAL

Más calidad, coherencia y consistencia

Menor calidad, coherencia y consistencia Más calidad, coherencia y consistencia

Menor espacio

Mayor espacio Mayor espacio

Menor fluidez

Mayor fluidez

Mayor Fluidez

Mayor coste Menor coste

Mayor coste

Sabe gramática No sabe gramática

No sabe gramática, pero la replica

Falla en las excepciones a las reglas gramaticales Maneja mejor las excepciones gramaticales

Maneja mejor las excepciones gramaticales

La convivencia de TA con traductores humanos

¿Por qué no es competencia?

Lo que nos muestra la tabla anterior es que podemos medir la eficacia, la rentabilidad y evaluar qué conocimientos de gramática tiene una máquina, pero, como vemos, hay campos del lenguaje que sin siquiera aparecen: la pragmática, la semiótica… Son partes fundamentales para una comunicación efectiva que un humano conoce perfectamente, pero que una máquina ni siquiera se plantea.

Sin embargo, es innegable que de ahora en adelante, cada vez la traducción automática tendrá más presencia en el trabajo de los traductores. De hecho, ya hace tiempo que la mayoría de los profesionales de la traducción han adoptado una variante de la traducción automática como apoyo para su trabajo: la traducción asistida por ordenador. Eso será tema para otro post, pero podemos simplificarlo en que en la TA la mayor parte del trabajo la realiza una máquina con apoyo humano, mientras que en la TAO la mayor parte del trabajo la realiza una persona ayudada por una máquina.

Otra de las novedades de la traducción automática en el mercado de la traducción es la posedición, una nueva labor que consiste en realizar la revisión de un texto traducir mediante traducción automática para corregir los errores y generar un texto final aceptable. Aunque la posedición permite trabajar a mayor ritmo y reducir un poco los costes, la realidad es que la cantidad de agencias y traductores que se dedican a ellos todavía es bastante reducida, ya que es un campo que se ha iniciado bastante recientemente.

Con el tiempo, la traducción automática no va a sustituirá los traductores humanos, porque el lenguaje es tan complejo y cambiante que no es posible que una máquina logre comprenderlo lo bastante bien como una persona para poder traducir, pero sí que la podremos utilizar como herramienta que nos permita agilizar nuestro trabajo y en general, es importante estar preparado para todos los avances tecnológicos que quedan por venir.