Skip to main content
SearchLoginLogin or Signup

Influencias en el idioma español de las traducciones del inglés basadas en Inteligencia Artificial

«La historia de la traducción automática comienza en la década de los 50. Ya en 1949, Warren Weaver, de la Fundación Rockefeller, configuró una máquina criptográfica y de procesamiento del idioma que fue precursora del concepto de traducción automática» (Yugo, 2017).

Published onNov 27, 2021
Influencias en el idioma español de las traducciones del inglés basadas en Inteligencia Artificial
·
key-enterThis Pub is a Reply to
Description

La precisión de Google Translate, DeepL y Bing para la traducción del registro coloquial del lenguaje es de 29'52%, 36'96% y 17'39%, respectivamente. El desarrollo de la traducción automática ha motivado un elevado desinterés por conocer el idioma, su cultura y creatividad.

Abstracto

Resumir un texto, diferenciar y razonar acciones llevadas a cabo por los sujetos, ¿sigue siendo algo fuera del alcance real de cualquier inteligencia artificial? Porque las máquinas no pueden razonar, afirmamos, sólo combinan datos y los ordenan siguiendo algoritmos preestablecidos para esto. En nuestro estudio se elabora un análisis de cómo las traducciones automáticas basadas en Inteligencia Artificial influyen sobre la lengua española. Se estudia si existe mecanización de las tradiciones (roles asignados a profesiones), sesgos culturales, de género e incluso discriminación en las propias formas del lenguaje (formal e informal). La labor de los traductores automáticos se vuelve incompetente. en nuestra opinión, ante la falta de contextualización y de conocimiento cultural (costumbres) sobre la lengua destino, en este caso el español. A tenor de la evidencia encontrada, entendemos que el traductor automático con más precisión a la hora de interpretar la lengua española es DeepL.

Palabras clave: inteligencia artificial, lengua española, traducción automática y sesgos. #IA #InteligenciaArtificial #español #idioma #traducción

1.- Introducción

El ejercicio de la traducción conlleva el entendimiento tanto del contexto en el que se dice una frase como de los elementos culturales que lleve asociados ésta, porque actúan como modificadores globales en la comunicación. Asimismo algunos elementos muy singulares en una frase pueden variar y tergiversar su significado aparente inicial, porque implican o el uso del razonamiento (unido a veces a expresiones corporales) y/o de elementos o comportamientos histórico-sociales para una correcta interpretación.

Y con la llegada de nuevas herramientas tecnológicas más inteligentes y poderosas, vinculadas a nuevas economías más digitales y usos de tiempos más óptimos, resulta inevitable enfrentar, cotejar y valorar las traducciones llevadas a cabo por humanos versus máquinas ‘inteligentes’. Porque los primeros (los humanos) son recursos caros y con un mayor coste de tiempo en su ejecución, y los segundos (las máquinas) reducen muy considerablemente éstos. Prima en la era 5G la inmediatez de la traducción, su alta disponibilidad y amplia capacidad de uso. También la globalidad de la comunicación.

Aunque la evolución y las nuevas capacidades de la inteligencia artificial están actualmente derribando barreras antes impensables. El traductor de Google[1] fue uno de los detonantes y pioneros de esta nueva era para las traducciones automatizadas cuando lo incorporó a su propio navegador en el año 2012[2]. Con anterioridad, en el año 2006, Google Translate hizo el cambio a la traducción automática estadística, inicialmente admitiendo sólo inglés y árabe[3]. 1

De la misma manera que las palabras nacen y mueren con el uso o desuso de las sociedades, cabe preguntarse si la Inteligencia Artificial (IA) puede ser un inductor que acelere este proceso en el español. Y si además esta tecnología está contribuyendo a mejorar y normalizar el idioma español o por el contrario está siendo una tecnología que impulsa el empobrecimiento de la lengua española y la corrupción de esquemas garantes y ortodoxos afianzados por las reales academias de la lengua del idioma español en su quehacer humano. A su vez la mecanización de las traducciones puede conllevar sesgo cultural, sesgo de razas, de género e incluso de ideologías. También una cierta manipulación en las ideas transmitidas.

El idioma es el transmisor del pensamiento humano, forma ideas y formula razonamientos que en manos de la Inteligencia Artificial nos proponemos analizar en esta publicación para testear si su resultado es un valor adicional a la lengua española y la universalización de este idioma, o por el contrario debe ser inmediatamente regulado su uso.

2.- Principales traductores disponibles en Internet que usan Inteligencia Artificial

Google Translate es un sistema multilingüe de traducción automática desarrollado por Google [4]. Entre sus funcionalidades destaca la traducción de texto, voz, imagen y vídeo en tiempo real. Este servicio de traducción incorpora la Inteligencia Artificial, implementando a su sistema la traducción automática neuronal [5].

Microsoft Translator es un servicio de traducción automática creado por Microsoft [6]. Sus principales funciones son las traducción de texto, la traducción de habla y de texto a voz [7]. Este traductor incorpora dos tecnologías; la traducción de la máquina estadística (SMT) y la traducción automática neural basada en Inteligencia Artificial [8].

DeepL es un servicio de traducción automática creado por el equipo de Linguee [9]. Entre sus funciones destacan la traducción de palabras escritas y la traducción de documentos. El traductor DeepL utiliza la Inteligencia Artificial a través de redes neuronales convolucionales (CNNs) sobre la base de datos de Linguee [10].

3.- Tecnologías de la Inteligencia Artificial más empleadas en los traductores de idiomas

Los traductores elegidos para nuestro estudio tienen como base la traducción automática neuronal. La traducción automática neuronal se ha desarrollado con el objeto de superar las debilidades que presentan los sistemas de traducción convencionales [11]. La NMT, por sus siglas en inglés, neural machine translation, según Wikipedia: “Neural Machine Translation2 is an approach to machine translation that uses an artificial neural network to predict the likelihood of a sequence of words, typically modeling entire sentences in a single integrated model[12].

3.1-Modelos de traducción automática neuronal

El modelo NMT monolingüe es un sistema simple que entrena una única red neuronal en la que los datos son enviados mediante transmisión paralela. Este método de traducción está marcado por una target language, es decir, una lengua final establecida a la que se traducen palabras o textos procedentes de otras lenguas [13]. El siguiente esquema muestra el funcionamiento del modelo, teniendo como lengua objeto el inglés:

Imagen 1

Crédito de imagen: Modelo NTM monolingüe. Deep Neural Transformer Model for Mono and Multi Lingual - Machine Translation. URL: http://ceur-ws.org/Vol-2904/66.pdf

El modelo NMT multilingüe es un sistema entrenado con los datos disponibles de diferentes lenguas, por ejemplo, el francés (L1) y el árabe (L2). Ambas lenguas, L1 y L2, se combinan entre sí para recabar toda la información necesaria para el entrenamiento y la posterior traducción. En este caso se lleva a cabo la evaluación de la traducción con el objetivo de alcanzar la máxima precisión. Para ello se añade un token de la lengua destino a cada oración de origen, simulando una traducción de varias lenguas a una [13]:

Imagen 2

Crédito de imagen: Modelo NTM multilingüe. Deep Neural Transformer Model for Mono and Multi Lingual - Machine Translation. URL: http://ceur-ws.org/Vol-2904/66.pdf

4.- Lenguajes de programación que usan los traductores de idiomas

Google Translate. Los lenguajes de programación que se utilizan son, en realidad, una arquitectura de servicios y API’s con varias capas creadas con: C++, Java, Python, Javascript y Go, inspirado en la sintaxis de C. Además de lenguajes de programación, Google Translate trabaja la combinación de datos con un software específico para la traducción automática estadística o también llamada Statistical Machine Translation [14]. Algunos de ellos son: Apache Joshua Home, empleado para la jerarquía y sintaxis de la traducción automática [15]. Giza ++ se utiliza para entrenar modelos estadísticos de traducción [16]. Moses permite traducir modelos automáticamente en cualquier lengua gracias a un eficiente algoritmo de búsqueda que encuentra la probabilidad de traducción más precisa entre un gran número de opciones [17]. Google Translate tiene a Google Trans [18], una librería de Python opensource que implementa en la API de Google Translate [19].

Microsoft Translator. La API de Microsoft Translator ofrece una traducción online mejorada a través de la implementación de la librería Microsoft Translation API for Python, desarrollada en el lenguaje de programación Python [20].

DeepL anunció el lanzamiento de una librería cliente Python para la API de DeepL con el objeto de mantener todas las funciones de DeepL y facilitar la tarea de los desarrolladores para construir aplicaciones con DeepL [21].

Miguel Rebollo, doctor en Inteligencia Artificial por la Universidad Politécnica de Valencia, añade que Python es la mejor opción para la traducción automática porque hay muchas librerías de aprendizaje automático ya implementadas que facilitan la tarea [22]. A estas palabras se añaden las de Rafael Vargas, director general de deep learning R, LLC, quien habla de las librerías de Python más utilizadas en aprendizaje profundo; Pandas, Scypy y Scikit-learn, Keros y Tensorflow. De igual forma, el lenguaje R con paquetes tales como rminer y tidyverse [23].

5.- Algoritmos singulares de Inteligencia Artificial en los traductores de idiomas

En los últimos años el uso de la inteligencia artificial ha supuesto un impulso importante para la traducción automática ya que ha permitido que los textos comiencen a entenderse en su totalidad, contextualizando los detalles. Para ello, los algoritmos han sido ‘alimentados’ con gran cantidad de textos de diferentes idiomas para que, a modo de referencias, puedan mejorar su eficiencia y eliminar «los idiomas de pocos recursos», según Marta R. Costa-Jussà [24].

Google Translate utiliza BERT (Bidirectional Encoder Representations from Transformers), un modelo lingüístico desarrollado por Google. Esta es una técnica basada en redes neuronales para el pre-entrenamiento del procesamiento del lenguaje natural desarrollada por Google [25]. ¿Qué ventajas aporta BERT a la IA en el proceso de traducción? Ofrece un mayor rendimiento del modelo, mejora la capacidad de procesar grandes cantidades de texto y lenguaje, muestra opciones de ruta fácil para usar modelos previamente entrenados, incrementa la capacidad para ajustar sus datos al contexto del idioma específico y es capaz de aplicarse a datos, sin previo entrenamiento, y dar como respuesta un modelo de alto rendimiento [26].

Microsoft Translator aplica la inteligencia artificial a sus traducciones por medio de redes neuronales [27]. En el último año, el traductor de Microsoft se ha beneficiado de las actualizaciones impulsadas por el código Z, parte de la iniciativa de código XYZ de Microsoft. A través de la combinación de modelos de inteligencia artificial se desarrolla una iniciativa centrada en la creación de modelos lingüísticos multilingües. Esto supone más beneficios en la traducción, entre ellos: mejorar la precisión en la traducción de idiomas con menos de un millón de frases de entrenamiento a través de la combinación de familias y modelos de idiomas[28].

6.- Análisis y comparativa de algunas oraciones traducidas, resultados obtenidos e influencias en el idioma español que resultan del uso de los traductores de inglés

A colación del apartado anterior , es conveniente añadir que la traducción automática también genera problemas de distorsión y género en las diferentes lenguas. Por este motivo, en los siguientes apartados evidenciamos cuáles son los principales problemas que encontramos en la traducción automática.

6.1-Sesgo de género en la traducción automática

El interés por comprender y mitigar el sesgo de género está creciendo dentro de la Programación del Lenguaje Natural (PLN). De hecho, estudios recientes muestran que las disparidades de género afectan a las tecnologías del lenguaje. En ciertos traductores automáticos el pronombre femenino en inglés she es constantemente traducido como un pronombre masculino. Sin embargo, esta traducción no es relevante en lenguas sin género gramatical, por ejemplo: turco, finlandés y húngaro. No ocurre lo mismo con el francés y el español, pues son consideradas lenguas con género gramatical. Cuando hablamos de género gramatical nos referimos a que varias partes del discurso entre: nombres, verbos, determinantes y adjetivos poseen inflexión de género [29].

En los siguientes párrafos analizamos cómo trabajan los traductores automáticos elegidos para nuestro estudio, el problema de la discriminación de género en la traducción y qué medidas adoptan para prevenirlo.

Google Translate. Los avances sobre NMT (Neural Machine Translation) proporcionan mayor naturalidad y fluidez en las traducciones. Por otra parte la aparición de estereotipos y sesgos culturales y sociales han provocado que los traductores automáticos desarrollen nuevas técnicas para reducir la discriminación de género en este sector. Para ello, Google crea un dataset que consiste en agrupar descripciones por geografía, género y trabajo, sin omitir región alguna de todo el mundo. Con este conjunto de datos se ha conseguido reducir en un 67% los errores de contexto referentes a género aunque todavía se observan ciertos fallos. Veamos cómo Google Translate traduce esta frase del inglés al español: Marie Curie was born in Warsaw. The distinguished scientist received the Nobel Prize in Physics in 1903 (inglés) - Marie Curie nació en Varsovia. El distinguido científico recibió el Premio Nobel de Física en 1903 (español). Ahora veamos la diferencia que se produce en la traducción al español aplicando el dataset de Google: Marie Curie nació en Varsovia. La distinguida científica recibió el Premio Nobel de Física en 1903. El principal objetivo es que los modelos aprendan a generar pronombres de un género específico y lo contextualicen [30].

Bing Microsoft Translator. Este traductor automático no ofrece alternativas en la propia traducción, sin embargo, muestra sinónimos y ejemplos de uso. A veces, la forma femenina de una palabra puede aparecer aunque de forma sistemática. Es cierto que si escribimos el adjetivo beautiful para traducir al español, los resultados muestran las opciones en femenino de: bella y hermosa. En cambio, siguiendo el ejemplo anterior, comprobamos que la traducción al español de frases no es completamente correcta porque el género de las palabras no es correcto: Marie Curie nació en Varsovia. El distinguido científico recibió el Premio Nobel de Física en 1903.

DeepL. Este traductor automático, al igual que Bing Microsoft Translate, ofrece alternativas de género en el proceso de traducir una única palabra. DeepL es un traductor automático que mantiene el género dentro de un contexto. En base a nuestro ejemplo, DeepL traduce al español correctamente: Marie Curie nació en Varsovia. La distinguida científica recibió el Premio Nobel de Física en 1903.

La siguiente tabla muestra en porcentaje la frecuencia de uso del género femenino y masculino en adjetivos en Google Translate (GT), Bing Microsoft Translator (BMT) y Deep Learning (DL) [31].

Tabla 1

Adjetivos

GT

BMT

DL

Femenino

37,3%

1,5%

22,8%

Masculino

39,2%

58,8%

45,6%

En lo que a género se refiere, las profesiones son también objeto de discriminación en las traducciones automáticas.

Para comprobar esta teoría tomamos como muestra diez profesiones entre las que se encuentran: gardener, nurse, doctor, teacher, trainer, babysitter, lawyer, engineer, computer scientist y seamstress. A continuación buscamos la traducción al español en Google Translate, Bing Microsoft Translator y DeepL para los que obtenemos los siguientes resultados: jardinero, enfermera, médico, profesor, entrenador, niñera, abogado, ingeniero, informático y costurera. Es evidente que la desigualdad de género existente en el entorno laboral contribuye al desarrollo de un lenguaje sexista. Un claro ejemplo de ello es la traducción de enfermera, niñera y costurera. Los traductores automáticos asignan por defecto el género femenino a estas profesiones, dando por hecho que los trabajos de atención y cuidados están vinculados directamente con la mujer. Mientras tanto, profesiones como abogado, ingeniero y médico, de las que ya no nos referimos a ellas como profesiones de cuidados sino profesiones inteligentes están directamente asociadas con el género masculino. Esto es un claro indicio de que los algoritmos y sistemas de inteligencia artificial aprenden a base de ejemplos creados por la sociedad, recreando errores humanos [32].

6.2-Sesgo del registro lingüístico informal en la traducción automática

La aplicación de la inteligencia artificial en la traducción automática ha mejorado la contextualización de la información que alberga el traductor. Para conseguirlo, se revisan las bases de datos utilizadas en los tratados de comercio, las leyes de la Unión Europea y hasta los protocolos de Naciones Unidas. De esta forma proveen a los algoritmos de miles de referencias, traducidas a varios idiomas. Al mismo tiempo esta forma de entreno genera un sesgo al lenguaje de registro informal (expresiones coloquiales, jerga callejera, frases hechas, refranes y dichos populares), ya que todos los documentos oficiales anteriormente mencionados están escritos en lenguaje formal y académico [33].

Para comprobar que realmente los traductores automáticos ‘apartan’ el registro informal de su vocabulario, comprobamos diez expresiones de la jerga inglesa y analizamos la traducción de inglés a español que realizan los traductores automáticos elegidos para nuestro estudio.

  • What’s the tea? y la traducción al español es: ¿Cuál es el chisme?

Tabla 2

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

¿Qué es el té?

¿Qué es el té?

¿Qué es el té?

  • Omg wig flew! y la traducción al español es: ¡Qué disparate!

Tabla 3

Traductores

Microsoft Translator

DeepL Translate

Traducción (In-Es)

¡Dios mío, la peluca voló!

Omg peluca voló

Omg la peluca voló

  • The law straw y la traducción al español es: la gota que colma el vaso.

Tabla 4

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

La última gota

La gota que colma el vaso

  • To go pear-shaped y la traducción al español es: ir por mal camino.

Tabla 5

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

Ir en forma de pera

Para ir en forma de pera

Para ir en picado

  • Easy-peasy y la traducción al español es: pan comido.

Tabla 6

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

Pan comido

Peasy-fácil

Fácil

  • A stitch in time saves nines y la traducción al español es: más vale prevenir que curar.

Tabla 7

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

Una puntada a tiempo ahorra nueve

Más vale prevenir que lamentar

Una puntada a tiempo salva nueve

  • Absence makes the heart grow fonder y la traducción al español es: nadie sabe lo que tiene hasta que lo pierde.

Tabla 8

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

La ausencia hace crecer el cariño

La ausencia hace que el corazón se haga más cariñoso

La ausencia hace que el corazón se haga más cariñoso

  • Feeling a bit under the weather y la traducción al español es: estar pachucho.

Tabla 9

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

Sintiéndome un poco mal

Sentirse mal

Se siente un poco mal

  • Beggars can’t be choosers y la traducción al español es: cuando hay hambre, no hay pan duro.

Tabla 10

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

Los mendigos no pueden ser selectores

Los mendigos no pueden ser elegidos

Los mendigos no pueden elegir

  • You scratch my back, and I’ll scratch yours y la traducción al español es: hoy por ti, mañana por mí.

Tabla 11

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

Tú me rascas la espalda y yo rasco la tuya

Tú me rascas la espalda y yo te rasco la tuya

Tú me rascas la espalda y yo te rasco la tuya

Tras el análisis realizado, nos percatamos de que sólo 4 de las 30 traducciones automáticas interpretan correctamente el significado de la expresión en español. Otras 5 emiten interpretaciones que se asemejan con la significación original y el resto, es decir, 21, son traducciones literales de la sentencia escrita en la lengua origen, el inglés. Por tanto, tras observar estos resultados de los traductores más utilizados en Internet, deducimos que el registro informal, en este caso, de la lengua española, no está totalmente incluido en la traducción automática. Pero, ¿a caso el registro informal de una lengua no es tan importante y necesario como el registro formal? ¿es esto un punto negativo para el español?

En 1991 César Hernández Alonso afirmaba en la Revista de la Asociación Europea de Profesores de Español que la expresión popular coloquial es una forma espontánea de comunicarnos y además es la que con más frecuencia utilizamos. A través de los refranes y frases hechas expresamos nuestras preocupaciones, formas de pensar, de dar consejos así como la manera de estar en la vida. Es por esto que César Hernández Alonso realza este registro lingüístico, pues en realidad es una expresión de extraordinaria riqueza [34].

“El hombre es el lenguaje. A través de esa facultad casi divina del ser humano, en una de sus realizaciones o lenguas, obtenemos una concepción o sentido de la vida y de las cosas, en una lengua pensamos, nos expresamos y aún sentimos.“ (Hernández Alonso, 1991, 38-39)

Existen palabras de origen inglés que utilizamos a diario independientemente de nuestra lengua, sin embargo, la traducción a otro idioma como puede ser el español, alemán, portugués, francés o sueco no se puede realizar de forma literal porque estas palabras no existen en las lenguas destino, algo que hacen erróneamente los traductores automáticos. Veamos unos ejemplos.

  • Ejemplo A. Don’t give any spoilers.

Tabla 12

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In - Es)

No des spoilers

No des spoilers

No dar ningún spoiler

Traducción (In - Deu)

Nicht spoilern

Geben Sie keine Spoiler

Keine Spoiler verraten

Traducción (In - Pt)

Não dê spoilers

Não dar quaisquer spoilers

Não dar nenhum spoilers

Traducción (In - Fr)

Ne donnez pas de spoils

Ne donnez pas de spoilers

Ne donne pas de spoilers

Traducción (In - Swe)

Ge inga spoilers

Ge inga spoilers

Inte ge några spoilers

La palabra spoiler es un anglicismo patente. Está compuesta por el sufijo -er, indicando agente, sobre el verbo spoil, que significa estropear o echar a perder [35]. De acuerdo con los resultados de la tabla anterior, la palabra spoiler aparece traducida en todos los idiomas de igual forma que se escribió en la lengua origen, lo que nos podría dar indicio de que spoiler no es una palabra reconocida por los idiomas destino. Entendamos qué ocurre con la lengua española, pues es el núcleo de nuestro proyecto. La voz spoiler en español no existe porque no está reconocida por el Diccionario de la Real Academia de la Lengua Española (DRAE), es decir, una de las mayores instituciones culturales dedicada a la regularización lingüística entre el mundo hispanohablante [36]. Por tanto, esta palabra no se debería traducir como spoiler porque es errónea. La traducción correcta de la expresión don’t give me any spoilers no es no me hagas spoiler, sino no me desveles ningún detalle.

  • Ejemplo B. Hashtag.

Tabla 13

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In - Es)

Hashtag

Hashtag

Hashtag

Traducción (In - Deu)

Hashtag

Hashtag

Hashtag

Traducción (In - Pt)

Hashtag

Hashtag

Hashtag

Traducción (In - Fr)

Hashtag

Hashtag

Hashtag

Traducción (In - Swe)

Hashtag

Hashtag

Hashtag

La palabra hashtag es eminentemente anglosajona. Está compuesta por dos términos ingleses hash, la almohadilla, y tag, referido a algo que se clasifica o categoriza [37]. En la tabla que precede, como se puede observar, las traducciones de la palabra hashtag son hashtag. Al igual que ocurre con la palabra spoiler, este vocablo no está reconocido por los idiomas destino, por tanto la traducción de hashtag es incorrecta, a pesar de que la mayoría de los hablantes la introduzca en su vocabulario. En español, aunque hashtag no se incluye en la RAE, la traducción más correcta es etiqueta.

Tabla 14

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In - Es)

Smartphone

Teléfono inteligente

Smartphone

Traducción (In - Deu)

Smartphone

Smartphone

Smartphone

Traducción (In - Pt)

Smartphone

Smartphone

Smartphone

Traducción (In - Fr)

Téléphone intelligent

Smartphone

Smartphone

Traducción (In - Swe)

Smartphone

Smartphone

Smartphone

La palabra smartphone es un préstamo del inglés [38]. El DRAE no registra esta palabra en su vocabulario, por tanto, a pesar del gran uso que hacemos de ella cada día, no es correcta pronunciarla en español como smartphone, sino como teléfono inteligente. Al igual que en español, ocurre con el resto de lenguas reflejadas en la tabla.

6.3-Ambigüedad en la traducción automática a la vista inglés-español

En términos generales, la traducción automática supone un avance importante en las tareas de traducción e interpretación entre idiomas. Sin embargo, la ambigüedad está reconocida como una dificultad lingüística en la traducción automática [39]. La Real Academia de la Lengua Española define ambiguo como: “una característica especialmente del lenguaje que puede entenderse de varios modos o admitir distintas interpretaciones y dar, por consiguiente, motivo a dudas, incertidumbre o confusión.” [40] El problema de la ambigüedad en la traducción automática es la incapacidad para determinar si la información puede ser comprendida en más de un contexto[41]. Para constatar que la ambigüedad es un problema que debe resolver la lingüística computacional, estudiamos estos casos prácticos [42].

  • Caso práctico uno. The dog bit the man at the door y las dos posibles traducciones al español son: el perro mordió al hombre en la puerta y el perro mordió al hombre que estaba en la puerta.

Tabla 15

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

El perro mordió al hombre en la puerta

El perro mordió al hombre en la puerta

El perro mordió al hombre en la puerta

  • Caso práctico dos. The inspector arrested the holigan with a drone y las dos posibles traducciones al español son: la inspectora arrestó al gamberro, quien tenía un dron y la inspectora arrestó al gamberro utilizando un dron.

Tabla 16

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Sp)

El inspector arrestó al gamberro con un dron

El inspector arrestó al gamberro con un dron

El inspector detuvo al gamberro con un dron

  • Caso práctico tres. The lady hit the man with the umbrella y las dos posibles traducciones al español son: la mujer golpeó al hombre que llevaba un paraguas y la mujer golpeó al hombre utilizando un paraguas.

Tabla 17

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

La dama golpeó al hombre con el paraguas

La señora golpeó al hombre con el paraguas

La señora golpeó al hombre con el paraguas

Los primeros casos prácticos representan claros ejemplos de ambigüedad de agrupamiento. Este fenómeno lingüístico se produce cuando una oración admite dos estructuras sintácticas y cada una de ellas con una interpretación semántica diferente [43].

  • Caso práctico cuatro. My glasses have broken y las dos posibles traducciones al español son: se me han roto las gafas y se me han roto los vasos.

Tabla 18

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

Mis lentes se han roto

Mis gafas se han roto

Mis lentes se han roto

  • Caso práctico cinco. Refill the barrel y las dos posibles traducciones al español son: recargar el cañón y recargar el barril.

Tabla 19

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

Rellenar el barril

Rellenar el barril

Rellenar el barril

Sin embargo cuando introducimos esta frase ofreciendo más detalles, el significado cambia. Por ejemplo, he refills the barrel with bullets en español se traduce como: recarga el cañón con balas. O he refills the barrel with wine en español se traduce como: rellenó el barril con vino.

Tabla 20

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

Él vuelve a llenar el cañón de balas

Rellena el cañón con balas

Rellena el cañón con balas

Tabla 21

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

Llenó el barril con vino

Volvió a llenar el barril con vino

Llenó el barril con vino

  • Caso práctico seis. There is a mouse under the table y las dos posibles traducciones al español son: hay un roedor debajo de la mesa y hay un ratón debajo de la mesa.

Tabla 22

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

Hay un ratón debajo de la mesa

Hay un ratón debajo de la mesa

Hay un ratón bajo la mesa

En cambio cuando introducimos esta frase añadiendo más información, el significado varía. Por ejemplo, there is a mouse under the table, kill it en español se traduce como: hay un ratón debajo de la mesa, mátalo. O there is a mouse under the table; use it to replace the damaged one en español se traduce como: hay un ratón debajo de la mesa: cógelo y cámbialo por el que no funciona.

Tabla 23

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

Hay un ratón debajo de la mesa, mátalo

Hay un ratón debajo de la mesa, mátalo

Hay un ratón debajo de la mesa, mátalo

Tabla 24

Traductores

Google Translate

Microsoft Translator

DeepL Translate

Traducción (In-Es)

Hay un ratón debajo de la mesa; úselo para reemplazar el dañado uno

Hay un ratón debajo de la mesa; úselo para reemplazar el dañado uno

Hay un ratón debajo de la mesa; úselo para reemplazar el dañado

Los tres últimos casos prácticos contienen ambigüedad léxica, es decir, una palabra admite dos o más significados distintos [43]. La diferencia es que cuando la palabra va seguida de más información, los traductores automáticos saben distinguir entre, por ejemplo, glasses; vasos y glasses; gafas.

Tras analizar estos ejemplos podemos concluir, por tanto, que la ambigüedad es, junto con el registro del lenguaje informal y el género, uno de los mayores problemas a los que se enfrenta la traducción automática. Esto es debido, principalmente, a la falta de conocimiento de la lengua española. Sin duda esto es un punto desfavorable para los traductores automáticos porque no ofrecen máxima calidad en sus traducciones y por consecuencia contribuyen negativamente al buen uso del idioma español.

7.- ¿Se pueden traducir las emociones?

Los sistemas que incorporan inteligencia artificial, en términos generales, parecen no necesitar la identificación de los sentimientos humanos ya que son autosuficientes para realizar las tareas propuestas [44]. Sin embargo, ¿ocurre lo mismo con los traductores? Los algoritmos que forman parte de la tarea de traducción automática presentan dificultades a la hora de representar el lado emocional de un texto ya traducido [45], por ejemplo las figuras literarias en el estilo poético. Para corroborarlo, elegimos varios versos de tres poemas diferentes en inglés, analizamos las traducciones al español que realizan los traductores objeto de este estudio y vemos si realmente la IA ayuda a conseguir una traducción emocional además de técnica y mecánica.

El primer ejemplo lo tomamos de los versos 1-5 del poema The Road not Taken, escrito por el poeta estadounidense Robert Frost [46].

Tabla 25

Texto original (In)

Google Translate

Microsoft Translator

DeepL Translate

(v1) Two roads diverged in a yellow wood,

Dos caminos divergieron en un bosque amarillo,

Dos caminos divergieron en un bosque amarillo,

Dos caminos se bifurcan en un bosque amarillo,

(v2) And sorry I could not travel both

Y lo siento, no pude viajar tanto

Y lo siento, no pude viajar ambos

Y siento no haber podido viajar los dos

(v3) And be one traveler, long I stood

Y ser un viajero, durante mucho tiempo me quedé

Y sé un viajero, mucho tiempo estuve de pie

Y ser un viajero, mucho tiempo estuve

(v4) And looked down one as far as I could

Y miré hacia abajo, uno tan lejos como pude

Y miré hacia abajo uno hasta donde pude

Y miré hacia abajo, hasta donde pude

(v5) To where it bent in the undergrowth;

A donde se inclinó en la maleza;

A donde se dobló en la maleza;

Hasta donde se dobló en la maleza;

En la siguiente tabla se expone la traducción humana del poema The Road not Taken. La traducción al español desde el idioma original implica la pérdida de la métrica en todos los versos traducidos a excepción del verso número 2.

Tabla 26

Texto original (In)

Traducción humana (Es)

(v1) Two roads diverged in a yellow wood,

Dos caminos se bifurcaron en un áureo bosque,

(v2) And sorry I could not travel both

Y apenado no pude andar entrambos

(v3) And be one traveler, long I stood

Y siendo un solitario viajero, un buen rato de pie estuve

(v4) And looked down one as far as I could

Y en uno de ellos tendí la mirada tan lejos como pude

El segundo ejemplo lo tomamos de los versos 1-4 del poema The Tyger escrito por el poeta británico William Blake [47].

Tabla 27

Texto original (In)

Google Translate

Microsot Translator

DeepL Translate

(v1) Tyger, tyger, burning bright

Telas, telas, ardiendo brillante

Tyger, tyger, ardiendo brillante

Tyger, tyger, ardiente

(v2) In the forests of the night

En los bosques de la noche

En los bosques de la noche

En los bosques de la noche

(v3) What immortal hand or eye

Que mano u ojo inmortal

Qué mano u ojo inmortal

Qué mano u ojo inmortal

(v4) Could frame thy fearful symmetry?

¿Podría enmarcar tu temible simetría?

¿Podría enmarcar tu temible simetría?

¿Podría enmarcartu temible simetría?

En la siguiente tabla se expone la traducción humana del poema The Tyger. La traducción al español desde el idioma original implica la pérdida de la métrica de los versos 3 y 4.

Tabla 28

Texto original (In)

Traducción humana (Es)

(v1) Tyger, tyger, burning bright

Tigre, tigre, ardoroso resplandor

(v2) In the forests of the night

En las tinieblas de la selva

(v3) What immortal hand or eye

¿Qué sempiterna mano o qué eternal ojo

(v4) Could frame thy fearful symmetry?

pudo enmarcar aquella feroz simetría tan tuya?

Como vemos en la tabla 25 y 27, las traducciones que ofrecen los traductores automáticos que utilizan IA son literales. El problema de la literalidad, sobre todo en textos poéticos, es que no hay simplemente un significado que interpretar, sino que la poesía es mucho más que eso; la poesía emite sensaciones de angustia, miedo, felicidad, amor, amistad, exilio, duelo… Es por eso que la IA se enfrenta a todo un reto a la hora de transmitir sentimientos en la traducción automatizada. Sin embargo, en las tablas 26 y 28, las traducciones de ambos poemas son humanas. La creatividad, la capacidad de percibir y emitir emociones del ser humano y el conocimiento de la lengua a la que se desee traducir, en este caso el español, impera ante la precisión y la velocidad de las máquinas.

*La métrica se pierde en la traducción.

8.- Conclusiones

La aplicación de la Inteligencia Artificial a la traducción optimiza, en gran medida, la productividad y rentabilidad de la tarea, traduciendo, por ejemplo, una página web en pocos segundos.

Esta publicación está fundamentada en la creciente influencia de los traductores automáticos en el proceso de aprendizaje de un idioma. El principal problema que encontramos en la traducción automática es la falta de contextualización. Esto quiere decir que la elección de palabras simplistas no ayudan a conocer el contenido original del texto a traducir o lo que es lo mismo: “las máquinas no conocen el mundo“, según afirma Jan-Hendrik Opdenhoff, vicedecano de la Facultad de Traducción e Interpretación de Granada [48]. Si a esto añadimos la falta de involucración del lenguaje informal y el sesgo de género, llegamos a la conclusión de que la aplicación de la tecnología de la inteligencia artificial en la traducción automática no ayuda al enriquecimiento de la lengua española. Por este motivo y ante los proyectos presentados este año 2021 sobre la intención de impulsar lengua española en la esfera de la robótica y el empeño de que la Inteligencia Artificial ‘hable’ español [49], creemos que es necesario la previa regulación de la IA en los traductores automáticos. De esta forma contribuiremos a mejorar y normalizar el idioma español y no a dañarlo aún más.

Sería conveniente que entidades reguladoras de la lingüística española como la Real Academia de la Lengua generara un sello o validador de pruebas para establecer una lista clasificatoria de conformidad con los traductores disponibles y así recomendar si su uso es o no plausible. Ésta podría ser una manera de mejorar las prácticas del español en el uso de los traductores automáticos.

9.- Agradecimientos

Agradecemos a las organizaciones y personalidades que hicieron posible la elaboración de este proyecto, colaborando en la actualización de información y testimonios que engrandecen el valor de la investigación.

Comments
0
comment
No comments here
Why not start the discussion?