Welcome / Bienvenue / Benvinguts / Bienvenidos
For information about my translation services, please visit the main site.
Pour des informations sur mes services, merci de regarder le site principal.
Para información sobre mis servicios de traducción, visite el web principal.

“Pain of the field” es lo de menos

Varios medios españoles y internacionales nos han ofrecido la noticia esta semana de que la web del Ministerio de Industria, Comercio y Turismo tiene una noticia en inglés sobre el nombramiento de un tal “pain of field” como miembro del Oficina Internacional de Pesas y Medidas. Este nombre raro es el resultado de la traducción automática del nombre de Dolores del Campo.

Una de las noticias más compartidas sobre el tema es bastante sorprendente: la de Euronews tiene un inglés muy deficiente, probablemente como resultado de una traducción automática.

Otra cosa que me ha sorprendido es que todos los medios de comunicación españoles que han hecho eco de la noticia tan solo hablan de la traducción automática al inglés, cuando resulta que en los tres idiomas cooficiales (catalán, gallego y vasco), también se ha traducido el nombre o el apellido, o ambos.*

Las versiones de la noticia en catalán y vasco

Las versiones de la noticia en catalán y gallego

(*Cuando escribí este artículo,tan solo se había corregido el nombre de Dolores del Campo en inglés. Ahora, se ha corregido en todas las versiones.)

Puesto que el euskera no se parece a ningún otro idioma que hablo, es más difícil para mi ver lo que ha pasado con la versión en dicho idioma, pero aún así, soy capaz de ver que la versión de la noticia en cuestión es un desastre, con paréntesis que no se cierran y sin la presencia del nombre “Dolores del Campo”. Un usuario de Twitter me ha dicho que su nombre también ha sido traducido al euskera, pero que la traducción significa algo como “Campo de Minas”.

Lo que pasa con las versiones en catalán, gallego y vasco es, según mi parecer, peor que lo que pasa con la versión en inglés. ¿Por qué? Porque, a diferencia de la versión en inglés, las versiones en los idiomas cooficiales no existen para que ciudadanos extranjeros puedan entender la noticia (todos ya entienden el castellano), sino para proteger los derechos lingüísticos de los propios ciudadanos españoles.

Si consultamos el resto de la web en catalán, encontramos errores de traducción en prácticamente todas las noticias. Me imagino que pasa los mismo en gallego y euskera. Entonces, ¿quién va a consultar una versión en lengua cooficial si es de tan pésima calidad? Nadie. Leerán la web en castellano. Entonces, ¿para qué existen las otras versiones?

Creo que existen simplemente para que el ministerio y el gobierno puedan fingir que les interesa una España plural que respeta su pluralidad lingüística. Pero lo único que han hecho es buscar la solución barata, sin preguntar a ningún usuario de dichos idiomas si el resultado es adecuado. Y no lo es.

Hace unos años, yo tenía que presentar un modelo a Hacienda y durante días no lo encontraba en su web. Lo estaba buscando en su web en catalán, puesto que es mi idioma de preferencia entre las lenguas de España. Al final, consulté la versión en castellano y lo encontré. Desde entonces, tan solo he utilizado la versión en castellano de la web de Hacienda porque, desgraciadamente, la versión en catalán me había dado problemas demasiadas veces.

Soy traductor al inglés, así que, económicamente, cuanto más se traduce al inglés mejor (siempre que sea con traductores humanos, claro). Pero los derechos lingüísticos son más importantes que mi bolsillo. La prioridad del Ministerio de Industria, Comercio y Turismo tiene que ser arreglar sus versiones vergonzosas en lenguas cooficiales y aparcar la versión en inglés si no tiene presupuesto para hacerlo bien.

Dada la cercanía de las lenguas catalana y gallega con la castellana, el uso de la traducción automática tiene sentido. Pero las traducciones automáticas siempre, PERO SIEMPRE, se tienen que revisar para evitar disparates como el que hemos visto esta semana.

En el caso de la versión en euskera, aunque no conozco este idioma, me imagino que la traducción automática no será tan útil, así que el ministerio tendrá que contratar un traductor si quieren mantener esta versión.

Es posible que el ministerio no tenga recursos para contratar a correctores para las versiones en catalán y gallego y a un traductor para la versión en euskera. Si es así (aunque me parece grave que el gobierno central no dedique recursos para el uso oficial de los idiomas cooficiales), más vale que borren las versiones en dichos idiomas, porque, como ya he dicho, actualmente tan solo sirven para hacer el ridículo.

Para acabar, vuelvo al tema de los medios de comunicación. ¿Cómo puede ser que los medios de comunicación españoles dan más importancia a los errores en inglés que a los errores en castellano? ¿Cuando habrá una noticia en un periódico español sobre las terribles traducciones a lenguas cooficiales de los webs de los ministerios? Es como si ya se ha asumido que el único idioma de España que tiene importancia es el castellano. Si a la prensa española le interesa más la traducción en inglés que la traducción a las lenguas nacionales, tiene un problema muy serio.

(Tal como comenté más arriba, ahora el nombre “Dolores del Campo” aparece correctamente en los tres idiomas. Sin embargo, las versiones en idioma cooficial de esta noticia y de otras en el mismo portal siguen sin corregirse. En la noticia catalana, por ejemplo, todavía aparece “Centre Español [sic] de Metrologia”, y la versión en euskera todavía tiene sus paréntesis muy raros.)

Share:

Machine translation and context

A sentence I’ve just translated is an excellent example of the advantages and disadvantages of machine translation. The original sentence said this:

Los rankings se basan en indicadores sociales y económicos.

Google Translate offered this:

The rankings are based on social and economic indicators.

This is a good example of how machine translation can speed up the translation process. The translation is almost perfect. I say almost, because the translation doesn’t quite work in my context. The reader is left asking “Which rankings?”.

The original sentence is actually talking about rankings in general, rather than any specific rankings. Unfortunately Spanish does not make this distinction in the use of articles, so the word “los” is needed whether talking about rankings in general or specific rankings referred to earlier in the text. Google Translate works sentence by sentence, so it has no way of knowing whether the word “the” should appear at the beginning of the English translation.

Another similar problem comes up when I translate biographical texts. Imagine a sentence in Spanish that says the following:

Nació en Tolosa en 1960, pero desde 1970 vive en Roma.

Is Tolosa referring to the city of Toulouse in the Languedoc region (Tolosa is the traditional Spanish spelling of the city) or the small town in the Basque Country? OK, so I’ve deliberately come up with an ambiguous place name, but the other problem in this example does occur more often: is the text talking about a male or female? Google Translate has no way of knowing, since it only looks at the context of the sentence. It normally chooses a sex seemingly randomly. In this particular example it has produced a translation that does not specified the sex of the person:

Born in Toulouse in 1960, but since 1970 living in Rome.

Although it has avoided assigning a sex to the person the text is talking about, the translation is unacceptable and would need considerable editing. By changing the sentence slightly I can force Google Translate to assign a sex:

Nació en Tolosa en 1960, pero desde 1970 vive con sus padres en Roma.

Born in Toulouse in 1960, but since 1970 living with his parents in Rome.

The pronoun “his” is used, but the person we’re talking about could just as well be female. As additional evidence that Google Translate doesn’t use context I will now ask it to translate the following two sentences together:

Julia es una ilustradora francesa. Nació en Tolosa en 1960, pero desde 1970 vive con sus padres en Roma.

Google Translate provides the following translation:

Julia is a French illustrator. Born in Toulouse in 1960, but since 1970 living with his parents in Rome.

Google Translate still uses the word his, yet to any human translator it is blatantly obvious, thanks to the context of the first sentence, that the correct pronoun is her.

Share:

Did the Queen have a sex change? Automatic translation of speech

There have been many articles recently, like this one, about advances in the automated translation of speech, and I’ve even read stories about armies using them. I find the latter news very worrying.

Automated translation of speech basically combines two previously existing technologies: speech recognition and machine translation. The problems with the latter are well publicised, and despite the advances made, the problems remain. Google’s corpus-based translations mean that sentences tend to be more coherent nowadays, but a coherent sentence can also be an incorrect translation.

Voice recognition has come on leaps and bounds recently. I use it myself when translating. But as every user of such technology knows, you have to train it to your voice, and even then it makes mistakes that you have to correct. The article from The Times I’ve provided a link to discusses the problem of understanding “high-speed Glaswegian slang”. Current technology would no doubt be absolutely useless at understanding this. But what about more standard forms of English?

I decided to test how Google’s new speech-recognition tool would cope with the Queen’s English — literally the Queen’s English — a speech made by Queen Elizabeth II to parliament in 2009. As I expected, because the tool is not trained to the individual’s voice, the results are pretty awful. To see the video, click on this link. Pause the video, move your mouse over the “CC” button at the bottom of the video, then click on “Transcribe Audio” (don’t click on “English”, as that just gives you captions provided by a human, rather than the automated transcription), click on OK, and the video begins. The Queen tells us how she “was a man that’s in the house of common” [sic].

We can, if we wish, have these captions translated into another language. Just go to the “CC” box and click on “Translate Captions”, then choose your language. But the machine translation will only translate what it’s asked to translate, so we are still likely to get told that the Queen is a man. The translations into the three other languages I work with begin like this:

Catalan: “Jo era un home que està a la Cambra dels Comuns”
Spanish: “Yo era un hombre que está en la Cámara de los Comunes”
French: “J’étais un homme qui est dans la Chambre des communes”

As you can see, there is a very high risk of misunderstanding when using this technology. If the army wants to communicate with people in other languages, I’m afraid they’re just going to have to hire trained interpreters.

Share: