miércoles, 25 de julio de 2018

Traducción automática y traducción asistida por computadoras


En este artículo describiré dos formas de traducción realizadas con computadoras: la traducción automática y la traducción asistida.

C-3PO de la Guerra de las Galaxias domina 6 millones de formas de comunicación


Traducción automática

Hoy en día, todos conocemos el traductor de Google y todos, alguna vez,lo hemos utilizado. Pero la traducción automática (o machine translation, como se la denomina en inglés) es muy anterior a la existencia de internet.
Aunque la idea de fabricar una máquina que traduzca automáticamente data de siglos anteriores, ésta se popularizó en la segunda mitad del siglo XX cuando a los científicos que habían trabajado decodificando mensajes durante la Segunda Guerra Mundial se les ocurrió que la traducción automática podría pensarse como una forma de descifrado de mensajes en clave. Así, en 1954 se realizó una demostración de tecnología de traducción automática en la Universidad de Georgetown en la que un científico ingresó en una computadora 70 frases en ruso (transliteradas al alfabeto latino) que fueron traducidas al inglés de manera automática. Más allá de la publicidad obtenida por este experimento, la inteligencia artificial aun era muy rudimentaria para fabricar una máquina que pudiera realizar traducciones automáticas a gran escala. Recién tres décadas más tarde, con el avenimiento de las computadoras personales, el mundo científico retomó su interés en este tipo de traducción y se empezaron a desarrollar numerosos programas de computadora con este fin.
Hoy, los programas de traducción automática utilizan principalmente dos métodos: la traducción basada en reglas y la traducción basada en corpus de textos. Aunque la cuestión no se limita a estos dos métodos porque los programas utilizan una combinación de estos y otros métodos, aquí la descripción está simplificada ya que sería necesario un ingeniero en sistemas para explicar esto más detalladamente.

Traducción basada en reglas
Simplificando, quizás demasiado, el proceso, este método consiste en el reemplazo de palabras en la lengua de origen por palabras en la lengua terminal realizando ajustes gramaticales, sintácticos y semánticos por medio de algoritmos que prescriben cómo realizar la operación. Además de los mencionados algoritmos, este método se vale de glosarios bilingües para realizar la traducción que deben ser creados por un ser humano.
Para contextos muy específicos, en los que los textos a traducir son muy repetitivos y sin matices que requieran la intervención de un humano (ambigüedades, metáforas, etc.), este método puede ser muy efectivo. Por ejemplo, puede ser muy útil para realizar la traducción de estados contables de empresas, donde siempre los elementos que los componen son similares y solo se requiere ajustar la puntuación en las cifras allí expresadas. Sin embargo, al momento de traducir las notas explicativas de los rubros de dichos documentos financieros, que ya no son siempre similares, este método comenzará a mostrar sus debilidades.

Traducción basada en corpus de textos
Este tipo de traducción automática funciona con algoritmos que trabajan sobre textos incluidos en una base de datos. El trabajo se puede dar de dos maneras, trabajando con ejemplos o con estadísticas.
Cuando la traducción automática se realiza basada en ejemplos, el programa compara el texto a traducir con los glosarios bilingües que tiene en su memoria y selecciona las opciones coincidentes de ese glosario. Dichos glosarios deben ser ingresados por un operador humano quien “educa” al sistema y pueden consistir en versiones bilingües de palabras sueltas o frases.
La traducción automática realizada por estadísticas analiza un corpus de textos bilingüe y por medio de cálculos estadísticos determina la posible traducción del texto. Estos cálculos estadísticos tienen en cuenta la frecuencia con que aparecen los términos en los textos bilingües analizados y la frecuencia con la que aparecen acompañados por otros términos también incluidos en el documento fuente. Éste es el método principal utilizado por el famoso traductor de Google.
Al igual que en el caso de la traducción basada en reglas, la traducción basada en corpus de textos tiene sus limitaciones. Esta última es más versátil ya que tiene una capacidad mayor de aprender nuevos términos y giros idiomáticos, día a día mejora sus resultados, sin embargo, la inteligencia artificial que la compone aun carece de capacidad para resolver ambigüedades, metáforas, ciertas connotaciones y otras cuestiones lingüísticas que solo el cerebro humano puede realizar. Esto se hace especialmente evidente cuanto más largo y complejo sea el texto que se le hace traducir.


Aunque la traducción automática no es infalible, es una buena herramienta en el mundo globalizado en el que vivimos. Por ejemplo, se la puede utilizar para comprender un texto en un idioma que no manejamos, siempre y cuando seamos conscientes que puede tener errores y que el estilo de la traducción podría ser mejor. En este caso, dada la falibilidad de estos sistemas, no es aconsejable utilizarlo para traducir un texto escrito por uno a otra lengua que no se habla para enviarlo, por ejemplo, por email dado que puede uno quedar en ridículo firmando algo que realmente no quiere decir.
También puede ser utilizado por profesionales de la lengua para prestar un servicio de traducción en lo que se denomina MTPE (Posedición de traducción automática, por su sigla en inglés). Para prestar este servicio, se procesa el texto a traducir con uno de estos programas de traducción automática, y luego un traductor humano le hace las correcciones que sean necesarias para evitar que el texto meta contenga errores terminológicos, gramaticales o de estilo. Cuando el programa produce una traducción aceptable, se reducen mucho los tiempos y costos de una traducción. Cuando no es aceptable, a veces al traductor le conviene traducir el texto desde cero antes de intentar corregir todos los defectos de la traducción automática.


Traducción asistida por computadora

La traducción asistida por computadora (o TAC) se encuentra en un punto intermedio entre la traducción “artesanal”, realizada sin ayuda de programas informáticos, y la traducción automática.
Las herramientas TAC, también denominadas TAO en español peninsular (Traducción Asistida por Ordenador) o  CAT tools (del inglés Computer-Assisted Translation), son programas de computadora que ayudan al traductor humano a realizar su tarea. Hay varias herramientas de este tipo con diferentes funciones que generalmente se utilizan como un sistema coordinado.
Así, se utilizan coordinada o simultáneamente memorias de traducción, glosarios, alineadores de textos, correctores ortográficos, etc.
Las memorias de traducción son programas que descomponen el texto a traducir en segmentos más pequeños (generalmente oraciones) y registran la traducción que realiza el traductor humano de cada segmento. Cuando se crea la memoria, es decir que está vacía, el traductor debe traducir cada uno de los segmentos que se le presentan; pero cuando comienza a crecer y se presentan segmentos repetidos, total o parcialmente, el programa le muestra esta información al traductor que puede aceptar la traducción sugerida o realizarle los cambios que estime pertinentes. De esta manera, cuanto más se traduce utilizando una memoria de traducción, más posibilidades hay de que se encuentren coincidencias entre el segmento a traducir y los traducidos en el pasado y así se acelera el proceso de traducción.
Los programas que gestionan las memorias de traducción también tienen la posibilidad de que se incluyan glosarios o diccionarios específicos de la materia para ahorrarle al traductor tiempo de investigación terminológica
Otra herramienta que suele incluirse en estos sistemas de traducción asistida por computadora es el alineador. El alineador descompone en segmentos a los textos bilingües que se le carguen, los compara y crea una memoria de traducción (o enriquece una ya creada), dando más posibilidades de coincidencias en trabajos futuros realizados con dicha memoria.
Las herramientas TAC hacen posible que se agilice y abarate el proceso de traducción. Garantizan la coherencia y uniformidad terminológica aun cuando trabajen varios profesionales en un mismo proyecto. También aseguran la traducción íntegra del documento fuente dado que alertan sobre la  falta de traducción de algún segmento. Asimismo, al incorporar glosarios, permiten que el cliente indique cómo quiere que se traduzcan términos específicos.
Por otro lado, estas herramientas tienen la desventaja de que la calidad de las traducciones que “recuerdan” y sugieren depende de la calidad del traductor humano que la realizó en primer término; por lo tanto, si se registra en la memoria una traducción deficiente, se corre el riesgo de que se replique en el futuro; por esto, a las memorias de traducción se les puede, y debe, realizar mantenimiento para corregir posibles errores y asegurar su eficacia. También puede ocurrir que un segmento idéntico a uno ya registrado en la memoria necesite ser traducido de una manera diferente en otro texto, ya sea por razones de contexto, estilo, coherencia, etc., y que este hecho escape al ojo del traductor humano cuando la herramienta TAC replica la traducción idéntica.





En conclusión, tanto la traducción automática como la traducción mediante el uso de herramientas de traducción asistida por computadora son una realidad. Son herramientas lingüísticas que facilitan la comunicación entre los seres humanos en este mundo globalizado en el que nos encontramos. Naturalmente, como ocurre con las herramientas que puede tener un mecánico en su taller, cada una tiene su función, sus ventajas y sus limitaciones. Podríamos intentar ajustar un tornillo con una llave francesa y quizás podamos hacerlo, pero posiblemente dañemos el tornillo y, quizás también, la llave. Somos los seres humanos, en especial los traductores profesionales, los que tenemos que utilizar correctamente las herramientas de traducción que hoy nos da la informática para poder aprovecharlas al máximo.

Lucas E. Bonelli




Licencia Creative Commons
Traducción automática y traducción asistida por computadoras por Lucas E. Bonelli se distribuye bajo una Licencia Creative Commons Atribución 4.0 Internacional.

Traducción automática y traducción asistida por computadoras

En este artículo describiré dos formas de traducción realizadas con computadoras: la traducción automática y la traducción asistida. ...