Welcome / Bienvenue / Benvinguts / Bienvenidos
For information about my translation services, please visit the main site.
Pour des informations sur mes services, merci de regarder le site principal.
Para información sobre mis servicios de traducción, visite el web principal.

La guia de CCOO i la manipulació de l’IEC

Ja tenim una altra de les moltes guies del llenguatge no sexista. Aquestes guies les escriuen persones que a la pregunta “com estan els teus pares?” deuen respondre “només tinc un pare”. La gent normal sabem que, segons el context, els noms masculins plurals de vegades es refereixen només a homes i de vegades es refereixen a homes i dones.

El pitjor de la guia de CCOO és la manipulació que fa de la Gramàtica de la llenguage catalana que està preparant l’Institut d’Estudis Catalans (IEC). Argumentant que no s’hauria d’emprar noms masculins plurals com “els treballadors” per a referir-se tant a homes com a dones, la guia de CCOO ens cita un fragment d’aquesta gramàtica:

La quasi totalitat de les categories nominals tenen gènere i nombre, i únicament mostren especificitats morfològiques els noms, els possessius i els pronoms. Els noms, perquè, a diferència de la resta de categories nominals, tenen gènere inherent: els noms són lèxicament masculins o femenins, enfront de les altres categories nominals que poden ésser masculines o femenines segons el context en què apareixen. Els possessius, perquè també presenten la categoria gramatical de persona, i els pronoms, perquè tenen persona i cas.

A partir d’aquest fragment, la guia de CCOO conclou: “Així doncs, cal tenir clar que s’està utilitzant el gènere masculí i no pas el neutre.”

Quina manipulació! Aquest capítol està parlant dels gèneres de les paraules. Diu que tots els noms tenen una gènere: masculí o femení. Però aquí no diu res de la relació entre el gènere i el sexe. Per això, els autors d’aquesta guia haurien d’haver llegit la secció 10.1.2 (“La relació entre gènere i sexe en els noms que designen éssers sexuats”) del mateix document:

En els noms en què el gènere estableix oposicions de sexe, el masculí és la forma no marcada semànticament. El caràcter no marcat del masculí es pot constatar fàcilment en el valor extensiu d’aquest gènere en contextos plurals. Efectivament, un nom masculí plural (com els avis o els llops) pot designar un grup sexualment heterogeni de mascles i femelles, però un nom femení ha de fer referència necessàriament a un grup de femelles (com les àvies o les llobes). El caràcter no marcat del masculí es pot constatar igualment en el fet que la concordança amb mots de gènere diferent es fa en masculí (El meu pare i la meva àvia eren rossellonesos; tots els avantpassats meus són italians menys ells dos).

Els autors d’aquesta guia (per cert, oi que quan he dit “els autors” tots heu entès que podria incloure dones?) no poden utilitzar la gramàtica de l’IEC per a justificar l’ús de les formes dobles com “els autors i les autores”, perquè aquesta gramàtica ho deixa molt clar que aquestes formes són innecessàries.

Share:

Don’t judge a book by its inside cover

Don’t judge a book by its cover, goes the saying. If that includes the inside cover, never could this be more true than with the 2009 edition of the Diccionario politécnico de las lenguas española e inglesa. This very good dictionary has been spoilt by a spelling mistake on the inside cover.

Inside cover

I suspect spelling mistakes on the front and inside covers are more often than not the fault of the publisher, rather than the author. It’s not the first time I’ve come across one. In the Humanities library at the Autonomous University of Barcelona there is an English dictionary with “Lenguage Dictionary” on the front cover (I seem to have lost the photo I used to have). And then there was the infamous case of the Catalan translation of the Asterix book Le Ciel nous Tombe sur la Tête, which erroneously appeared as “El cel s’ens cau al damunt”. Like the French tomber, caure is not a reflexive verb. In Spanish, however, they use the reflexive verb caerse, hence the mistake. But the mistake is twofold, since even if Catalan did use the reflexive form caure’s, the correct combination of the pronouns se and ens is se’ns, not s’ens.

The English title of this technical dictionary is also spelt incorrectly inside the book.

Front cover

Despite these mistakes, this is a very good dictionary and I would highly recommend it to anybody translating technical texts between Spanish and English. I just wonder how many people have read the online fragment provided on the publisher’s website and judged it by its inside cover.

Share:

Linguee

Linguee is an online tool that searches for online translations of terms. It was originally only available for English<>German, but French, Spanish and Portuguese have now been added. You have to look carefully at the sources use and check the results for reliability, but provided you do that it’s a very useful tool.

Linguee website

Spanish<>English toolbar button (drag to the toolbar if using Firefox)
French<>English toolbar button (drag to the toolbar if using Firefox)

Share:

A les dones no els va malament perdre diners?

“A tots ens va malament perdre diners”

Això diu un correu electrònic que la secció sindical de la UGT a la Universitat Autònoma de Barcelona ens ha enviat. Tenen tota la raó. Però mireu aquests altres fragments del missatge.

  • Benvolguts i benvolgudes
  • “Des de la secció sindical de la UGT et demanem que el dia 29 participis d’aquesta vaga que ens afecta a tots i totes.”
  • “No esperis que els altres arreglin el teu cotxe amb el seu sou, ajudem a arreglar-ho entre tots i totes.”
  • “ALS DELEGATS O REPRESENTANTS SINDICALS DE LA UAB, QUE EXERCIREM EL NOSTRE DRET DE VAGA, ENS DESCOMPTARAN EL DIA COM A QUALSEVOL TREBALLADOR O TREBALLADORA

Suposo que la UGT creu que dir simplement “benvolguts”, “tots” o “treballadors” no inclou les dones. Per tant, quan ens diuen “A tots ens va malament perdre diners”, ens està dient que a les dones no. Quina discriminació! A més, sembla que als delegats sindicals els descompta un dia si fan vaga, però a les delegades no. O és que quan diem “benvolguts”, “tots” o “treballadors” estem emprant un gènere no marcat? Si és així, no cal dir formes redundants com “treballadors i treballadores”!

Share:

Did the Queen have a sex change? Automatic translation of speech

There have been many articles recently, like this one, about advances in the automated translation of speech, and I’ve even read stories about armies using them. I find the latter news very worrying.

Automated translation of speech basically combines two previously existing technologies: speech recognition and machine translation. The problems with the latter are well publicised, and despite the advances made, the problems remain. Google’s corpus-based translations mean that sentences tend to be more coherent nowadays, but a coherent sentence can also be an incorrect translation.

Voice recognition has come on leaps and bounds recently. I use it myself when translating. But as every user of such technology knows, you have to train it to your voice, and even then it makes mistakes that you have to correct. The article from The Times I’ve provided a link to discusses the problem of understanding “high-speed Glaswegian slang”. Current technology would no doubt be absolutely useless at understanding this. But what about more standard forms of English?

I decided to test how Google’s new speech-recognition tool would cope with the Queen’s English — literally the Queen’s English — a speech made by Queen Elizabeth II to parliament in 2009. As I expected, because the tool is not trained to the individual’s voice, the results are pretty awful. To see the video, click on this link. Pause the video, move your mouse over the “CC” button at the bottom of the video, then click on “Transcribe Audio” (don’t click on “English”, as that just gives you captions provided by a human, rather than the automated transcription), click on OK, and the video begins. The Queen tells us how she “was a man that’s in the house of common” [sic].

We can, if we wish, have these captions translated into another language. Just go to the “CC” box and click on “Translate Captions”, then choose your language. But the machine translation will only translate what it’s asked to translate, so we are still likely to get told that the Queen is a man. The translations into the three other languages I work with begin like this:

Catalan: “Jo era un home que està a la Cambra dels Comuns”
Spanish: “Yo era un hombre que está en la Cámara de los Comunes”
French: “J’étais un homme qui est dans la Chambre des communes”

As you can see, there is a very high risk of misunderstanding when using this technology. If the army wants to communicate with people in other languages, I’m afraid they’re just going to have to hire trained interpreters.

Share:

¿Qué significa el goal average?

Para traducciones profesionales, consulten mi web profesional en www.timtranslates.com.

Según la Fundéu BBVA (antiguamente Fundación del Español Urgente), la correcta españolización del término inglés goal average es golaveraje. Cita el Diccionario Panhispánico de Dudas (importante obra de referencia para la lengua española), según el cual el término golaveraje “diferencia de tantos marcados y recibidos y se utiliza para deshacer el empate entre equipos con el mismo número de puntos en la clasificación”. Aunque la Fundéu BBVA admite el uso de golaveraje, recomienda “emplear diferencia (o promedio) de goles, de puntos o de tantos.”

Deja entender que diferencia y promedio se pueden utilizar indistintamente, como también goles, puntos y tantos.

Creo que hay bastantes lagunas en la nota de la Fundéu BBVA, las cuales intentaré exponer.

Empecemos por explicar de donde surge la necesidad de esta terminología. En las ligas de fútbol, si los dos primeros equipos tienen los mismos puntos, el reglamento especifica, por orden de importancia, los criterios que se utilizarán para desempatar a los dos equipos.

Muchos seguidores de fútbol se sorprenderían al ver la clasificación final de la liga española por la temporada 2006/07:

[TABLE=2]

La columna GA es el número de goles marcados a favor del equipo menos el número de goles marcados en contra. Es lo que en inglés llamamos la goal difference, es decir, la diferencia de goles. Mucha gente se sorprendería al ver esta clasificación, pues en la mayoría de ligas la diferencia de goles es el primer criterio que utiliza para desempatar a dos equipos con los mismos puntos. En los medios de comunicación en español (y los medios que copian las formulaciones españolas en otras lenguas, como el catalán o el gallego), se suele hablar de goal average, que viene del inglés (a pesar de que average se suele pronunciar como si fuera una palabra francesa) aunque no sea el término utilizado en inglés para este concepto. En inglés significa promedio de goles.

En la liga española, si hay dos equipos empatados, el primer criterio que se aplica es el del resultado total de los dos encuentros entre dichos equipos. Por eso el Real Madrid ganó la liga en 2006/07, y no el Barça, que sí que habría ganado si se aplicaran los mismos criterios que en muchos otros países. Pero curiosamente, aquella temporada oímos y leímos que el Real Madrid “ganó por el goal average“, cosa que parece una contradicción si consultamos la liga, según la cual el “GA” del equipo catalán fue de +45 y el del equipo madrileño solo fue de +26.

Para diferenciar entre estos dos tipos de goal average, a veces se distingue entre goal average particular (en este caso, en inglés hablaríamos de “the results between the teams level on points”, es decir, los resultados entre los equipos con los mismos puntos) y goal average global, pero no se suele hacer esta distinción.

Si en inglés decimos goal difference, y no goal average, ¿cómo es que en español se ha adoptado este anglicismo?

No sé cuando entró este anglicismo al español. No pude encontrar ningún ejemplo en el Corpus Diacrónico del Español. Pero su introducción al español probablemente fue anterior a los años setenta del siglo pasado. De hecho, antes de los años setenta, sí que se hablaba de goal average en inglés cuando había que desempatar a equipos con el mismo número de puntos. Sin embargo, entonces se refería a otro concepto.

Como sugiere la palabra “average”, se calculaba esta cifra haciendo una división, y no una sustracción. El goal average era el resultado de dividir el número de goles a favor por el número de goles en contra. En 1930/31, por ejemplo, empataron por puntos el Athletic Club de Bilbao, el Rácing Santander y el Real Sociedad, pero ganó el campeonato el Athletic Club de Bilbao, con un promedio de goles de 2,2, contra 1,3 y 1,0 para el Rácing Santander y el Real Sociedad respectivamente.

Por tanto, el anglicismo goal average, o goal averaje, se utiliza en los medios de comunicación españoles para tres conceptos diferentes:

  • Los resultados entre equipos empatados por puntos (sistema actual de la liga española)
  • La diferencia de goles (sistema de la mayoría de ligas del mundo)
  • El promedio de goles (sistema antiguo), hablando de contextos históricos

En vez de insistir, simplemente, en que hay que evitar goal average, ¿no sería mejor que la Fundéu BBVA explicara estas diferencias y propusiera terminología coherente para distinguir entre los tres conceptos? Propone utilizar diferencia y promedio indistintamente, y parece decirnos que también hablar de diferencia de puntos, pero teniendo en cuenta que en el campeonato los puntos y los goles no tienen nada que ver el uno con el otro es una propuesta, a mi entender, no muy buena.

El artículo del Diccionario panhispánico de dudas es un poco mejor, aunque deja entender que el inglés goal average significa diferencia de goles.

Share:

DownThemAll! for corpus-building

For professional translations, see my business website at www.timtranslates.com.

DownThemAll! can be a useful tool for creating a large, relatively clean corpus in a short amount of time. In this article, I shall explain one way of using DownThemAll! via a Google search to create a corpus. This particular example involves downloading the texts from the BBC Food website to create a corpus of recipes, which would be useful for translating and editing texts on food. However, the important thing is the method, rather than the result, so even if you do not think you will use a corpus on food, you may still find it useful to follow through the instructions, since you can then use the same method to download texts from other websites.

The method described in this article requires the use of the Firefox browser. The method was developed using the Windows XP operating system, but should work on other operating systems.

Firefox is needed because we will download the texts using the Firefox extension DownThemAll!. Once you have opened Firefox, if you do not already have the DownThemAll! extension, download it from here. When prompted, restart your browser (the browser should open up again with the same pages open).

DownThemAll! allows us to download all the links we have selected on a page. If we go to the BBC Recipes page and enter “chicken” into the search box, we are taken to this page. From here, we could download all 15 recipes by selecting the recipes, then right-clicking and selecting “DownThemAll selection…”, as shown below (click on pictures to enlarge).

Food1

On the next screen you could then click on “All files”, select the folder to save the files to and click on “Start”. The problem with this method, however, is that we can only do 15 recipes at a time.

Downloading from Google

Google can display up to 100 results simultaneously (if anyone finds a search engine that makes it possible to display more results, please leave a comment), and we can target our search on the folder of the BBC website containing all the recipes, as follows:

  • Open a new tab (press ctrl+t), open up Google, and go to “Advanced search”.
  • Type +the as your search term (the plus sign tells Google to search for the word exactly as it is written, and not to ignore it as a frequent word). This should ensure we get a good range of types of recipe. If you wanted only fish or chicken recipes, then you could search for “fish” or “chicken” instead.
  • Change the number of results per page to 100.
  • We need to tell Google to search only within the folder containing the recipes. If you go back to the previous tab, where we searched for “chicken” in the BBC database, and move your mouse over one of the links to a recipe, you will see this folder, as shown below:

Food2

  • The part I have underlined in red in the above image appears in the URLs of all the recipes. This is what we will type into Google in the “Search within a site or domain” field. Our Google search should thus appear as follows:

Google Advanced Search

  • Execute the search.

Downloading the pages

  • On the results page, do not select anything, do a right-click, and click on “DownThemAll!…”.
  • In the DownThemAll! window, scroll down until you can see some of the links to the actual recipes, i.e. those links with descriptions resembling those underlined in red below:

DownThemAll!

We need to find a way of downloading only the recipes, and not the Google Images, Videos, Maps, etc. links, nor the “Cached” and “Similar” links, nor any other links other than the recipes. To do this we shall use the “Fast filtering” option.

  • Disable all the filters (“All files”, “Images”, etc.).
  • Click on the plus sign next to “Fast filtering”
  • In the “Fast filtering” box, click on the drop-down list and select the /(.mp3)$/ option. You can find more on the syntax used in the Help files, but basically this option is to select only mp3 files. In this example we want to download only “shtml” files, since our recipes contain this file extension (see the pink underlines above). Select the letters “mp3” and change it to “shtml”, since all the files we want to download have the shtml file extension. The filter should now read /(.shtml)$/
  • We are going to use the renaming mask. The default mask (*name*.*ext*) means that pages will be saved with their current name and extension, so we would have files such as “theclassicroastturke_65538.shtml”. We are going to change the extension to “html”, since this will make it easier to clean our files once we’ve downloaded them. To do this, change the mask to *name*.html
  • Click on the folder (circled above in green) to select where you want to save the files. Make sure you create a new folder, since we’ll be downloading hundreds of files!
  • Your window should now look like the picture below, with the exception of the folder path (underlined below in pink), which depends on where you want to save the files. At the bottom of the window, as underlined below in red, it should say that you have 100 links selected.
  • Food5

  • Click on the “Start!” button, which will bring up the download window, and start the download.
  • Minimise the download window and go back to your Google search results in Firefox, then scroll to the bottom of the page and click on the number 2 to bring up results 101-200.
  • Once this page has opened, do a right-click, but this time click on “dTa OneClick!” instead of “DownThemAll!”. This will start downloading results 101-200, but using the same settings as for the previous download, so this time you won’t see the settings window. After about five seconds you should see the 100/100 in the download window change to 100/200.
  • You can go to the third page of Google results without waiting for the second page of results to stop downloading. Scroll down and click on the number 3, then once the page is opened, select the “dTa OneClick!” option again to download results 201-300.
  • Again scroll down to the bottom, but this time we’re going to speed things up by opening the next results pages in new tabs. Click on the numbers 4 to 10 one-by-one with the middle button (scroll wheel) of your mouse, or if you don’t have this button, hold the Ctrl key on the keyboard while you click on them. Go to the first of the new tabs and select “dTa One Click!”, then do the same for each of the remaining new tabs.

Google will not let us access more than 1,000 results, but 1,000 texts will give us a pretty good-sized corpus. If you want more than 1,000 texts, then try searching for another term (such as “chicken”) and downloading again. To avoid duplicates, save to the same folder, and if the “Filename conflict” box comes up, click on Skip/Cancel and select “Just for this session”. Once you have done this, all subsequent duplicates will be ignored.

Converting to plain text

If you open one of the files you’ve downloaded in Notepad, you’ll see that the files are not very clean, and are full of html code. However, programs exist to clean this. If you use Windows, you can clean this with the appropriately named HTML2TXT (please add a comment if you know of a tool that does the same thing for another operating system):

  • First, create a new folder somewhere to which we will export the cleaned files.
  • Download and install Bobsoft’s HTML2TXT from here.
  • When you launch the program, the “Unregistered Copy” window will appear. Click on “Try”.
  • Click on “Add folder”, and the select the folder where you’ve saved the recipes. (Don’t try “Add files”, as there are too many files for this.)
  • Click on the option to save the cleaned files to a new folder (highlighted in red below), then select “Click here to select” (highlighted in pink below) and choose the folder you created in the first step of this section.

Food6

  • Click on “Convert All” to convert the files. Don’t panic if the window freezes and you get a “Not Responding” message. Just be patient.
  • In the new folder you will find the cleaned txt files.

Because we’ve used the demo of HTML2TXT, you will find a short message at the top of each cleaned file. This shouldn’t be a problem for most uses of corpus analysis tools (unless you want, say, accurate word counts), but if you do want to completely clean the files, you can remove this message using cheap batch find/replace tools such as FileMonkey (cost $29).

If anybody knows of free tools that do the same as HTML2TXT or FileMonkey, please leave a comment.

You now have an almost-clean corpus of recipes that you can analyse using corpus-analysis tools such as AntConc .

These instructions can be adapted to create other corpora, but certain changes will be necessary. For example, we will not always have a single file extension (such as shtml) for all the files we want to download. I hope to add further tutorials explaining how to adapt this method for other corpora, at which point I will add a link to the bottom of this page.

Please use the comments section if you have any questions or comments to make about these instructions.

Share:

Comunicado de Jueces para la Democracia

Este comunicado fue publicado en varios diarios españoles el día 3 de febrero:

“La Sección Territorial de Madrid de Jueces para la Democracia quiere poner de manifiesto los gravísimos problemas que se están produciendo en la Administración de Justicia de la Comunidad de Madrid, en lo relativo a la designación de los traductores e intérpretes que intervienen en las actuaciones judiciales. Por este motivo REIVINDICAMOS que, en el nombramiento de traductores e intérpretes judiciales solicitados por jueces y magistrados, se tenga en cuenta que aquellos han de tener la formación y acreditación necesarias como intérpretes jurados y en su defecto, titulación superior en esta materia. Se quiere resaltar que las adjudicaciones a través de licitación pública, para la prestación de este servicio, hasta el momento se han revelado muy deficientes, al suponer en la práctica que la Administración Autonómica cede a terceros una serie de garantías individuales, procesales y constitucionales susceptibles de ser vulneradas por ausencia de ulterior control administrativo sobre dichas empresas, las cuales tienen una finalidad primordialmente lucrativa. Esta situación está provocando situaciones de indefensión a los ciudadanos extranjeros y nacionales que precisen de un intérprete o traductor, indefensión que debe ser evitada a toda costa por jueces y magistrados.”

Share:

Remember, remember – Recordem, recordem

For a bit of fun to mark the 5th November, I’ve translated the famous poem into Catalan. If you think you can do it in another language, please post it in the comments!

Original English:

Remember, remember the fifth of November:
The Gunpowder Treason and Plot.
I know of no reason why the Gunpowder Treason
Should ever be forgot.

Catalan translation:

Recordem, recordem el cinc de novembre:
Pólvora i conspiració!
Mai a la vida podem oblidar
Aquella traïció.

Share:

Què significa “match ball”?

En els mitjans de comunicació en espanyol i en les llengües en què els periodistes no fan res més que copiar totes les estructures i expressions espanyoles (català i gallec), és molt comú l’ús de l’expressió “match ball” en les informacions esportives. En aquestes llengües, aquest terme es va començar a utilitzar en el tennis i esports semblants (esquaix, tennis de taula, badminton, etc.) per a referir-se a una situació en què un jugador només necessita un punt per a guanyar un partit.

Amb el temps, els periodistes van començar a fer servir aquest anglicisme en altres esports. En el bàsquet, per exemple, podríem llegir o sentir que “aquesta nit els Lakers tenen el primer ‘match ball'”. En aquest cas significa que ara aquest equip només necessita guanyar un partit més per a guanyar una sèrie (en el final de la NBA, per exemple, juguen fins a set partits i cal guanyar-ne quatre per a proclamar-se campió). En el futbol, diuen que un equip té un “match ball” si, guanyant un partit, es proclamaria campió de la lliga.

En tots aquests casos, l’anglicisme no tan sols és prescindible (quin problema hi ha amb “punt de partit” o “pilota de partit”) sinó també incorrecta. En anglès, emprem l’expressió “match point” quan un jugador necessita només un punt per a guanyar un partit. “Match ball” vol dir una altra cosa. Es refereix simplement a la pilota que s’utilitza durant un partit, i per tant s’empra més aviat en esports com el futbol o el bàsquet en què tradicionalment es jugava amb una sola pilota durant tot un partit. Si cerqueu “match ball” en el Google, veureu que totes les pàgines parlen de la pilota en sí. O sia, un “match ball” és una pilota, no un punt ni una oportunitat. Per tant, en comptes d’intentar demostrar el seu coneixement de terminologia esportiva en anglès, els periodistes que utilitzen aquest fals anglicisme haurien de parlar clar i català, i dir, senzillament, “punt de partit” o “pilota de partit”. Si aquests termes s’entenen perfectament, per què cal substituir-los per un terme anglès que, a més a més, no significa la mateixa cosa?

Share: