Archivo

Archive for the ‘Corrección automática’ Category

Punto final para los comentarios ofensivos de los lectores en los medios de comunicación online: los medios serán los responsables. Y ahora, ¿qué?

24 octubre, 2013 1 comentario

El Tribunal Europeo de Derechos Humanos, el mismo que acaba de deslegitimar la aplicación retroactiva de la denominada “doctrina Parot”, dictó el pasado día 10 de octubre una sentencia muy relevante para los medios de comunicación europeos.

El caso en cuestión fue interpuesto por la web de noticias estonia Delfi, condenada por la justicia de su país por la publicación de comentarios ofensivos de lectores contra el director de una empresa que actuaba como fuente de una información. La publicación de la noticia en cuestión se produjo el 24 de enero de 2006, y algunas semanas después, el 9 de marzo, los abogados del ofendido solicitaron la retirada de 20 comentarios ofensivos y una indemnización por daños morales. La web de noticias retiró los comentarios el mismo día y rechazó la petición económica. Al mes siguiente, se interponía una demanda judicial civil ante los tribunales estonios. Esta demanda llegó hasta la máxima instancia judicial nacional, que confirmó la culpabilidad y condenó al medio a una indemnización de 320 euros para el demandante.

delfi

La empresa propietaria del portal de noticias, Delfi, recurrió a Estrasburgo (sede del Tribunal Europeo de Derechos Humanos), considerando que la condena vulneraba el principio de libertad de expresión, amparado por el artículo 10 de la Convención para la Protección de los Derechos Humanos y las Libertades Fundamentales.

Ahora, este tribunal europeo ha fallado en contra del medio de comunicación. Y ello a pesar de que Delfi disponía de un sistema automático (rudimentario) para filtrar comentarios que incluyeran algunas palabras clave (insultos u otras palabras problemáticas). Además, Delfi disponía de un mecanismo con el que los propios lectores podían marcar un comentario como inadecuado. La sentencia considera que este filtro era insuficiente para impedir daños contra el honor de terceros y que el medio debió tomar medidas más efectivas para prevenir estas situaciones.

El Tribunal considera razonable responsabilizar al editor, siendo su función publicar informaciones y dar visibilidad a los comentarios de los lectores, y lucrándose por ello a través del tráfico generado por esos comentarios.

Y ahora, ¿qué hacer? En un texto de este mismo blog, titulado “Moderar la participación en los medios“, publicado hace un par de años, resumíamos las dificultades y las claves de nuestro enfoque para ayudar a resolver un problema que no es trivial.

Las dificultades son múltiples. Por un lado, no basta con detectar palabras ofensivas aisladas, sino que es necesario filtrar expresiones, a veces teniendo en cuenta el contexto de la expresión y sus variantes flexivas. Por otro lado, hay que interpretar el lenguaje abreviado o los textos con errores ortotipográficos tan frecuentes en las secciones de participación o en los contenidos generados por usuarios. Estos “errores” pueden derivarse de las limitaciones de los dispositivos, del carácter impulsivo de los comentarios, o de la intención enmascaradora de los propios usuarios que, a sabiendas de la existencia de filtros automáticos, tratan de burlarlos por todos los medios (a veces con mucho ingenio).

Además de este problema relacionado con la Variedad de los textos, encontramos las otras dos características recurrentes en las aplicaciones de “big data” (conformando las famosas 3V): el Volumen de comentarios a tratar y la Velocidad de respuesta requerida.

En Daedalus, venimos abordando estos problemas desde hace años para el sector de los medios, y últimamente también en otros sectores, como el de banca y seguros.

En cuanto a la arquitectura de integración de estas soluciones, en la actualidad las estamos ofreciendo como un servicio en modo SaaS (Software as a Service), desde nuestra plataforma Textalytics de APIs en la nube, además del  tradicional licenciamiento para su ejecución on-premises.

Con los sistemas automáticos, no podemos garantizar un 100% de precisión para cualquier tarea de filtrado. Diferentes empresas o medios, y diferentes secciones dentro de un mismo medio, requieren distintas estrategias. Parece evidente que no tiene sentido aplicar los mismos criterios de filtrado a los comentarios de un sesudo artículo de fondo que a las intervenciones surgidas durante la transmisión en directo de un partido de fútbol o de un reality show. En ese sentido, nuestros sistemas caracterizan la gravedad de la expresión, permitiendo flexibilidad a nuestros clientes para establecer el umbral idóneo para su caso. Por otro lado, proporcionamos herramientas de personalización para facilitar la incorporación de nuevas expresiones problemáticas. Por último, también monitorizamos permanentemente el funcionamiento de estos sistemas para los clientes que lo desean, dentro de sus planes de aseguramiento y mejora continuada de la calidad.

¿Interesado? No dude en ponerse en contacto con Daedalus.

Descubra nuestras soluciones para el sector de medios.

Referencias a este asunto:

José Carlos González

Mitos sobre los correctores automáticos en la era de la tecnología semántica

¿Cuántas veces habremos oído afirmaciones como estas acerca de los «malaventurados correctores automáticos»? En la era de las tecnologías semánticas, es hora de cambiar el chip:

 

1.   El corrector automático me corrige cosas que no debería… «el listillo…»

¿El corrector os ha dejado alguna vez en apuros? Para que no ocurra simplemente hay que configurarlo bien. Esto significa que debemos asegurarnos de que esté revisando en la lengua del texto (en portugués ¡un «livro» no es un «libro»!) y de que (si la hubiera) esté desactivada la opción de «autocorrección». ¡No debemos perder el control de la revisión! Siguiendo este par de consejos evitaréis que la aplicación os juegue malas pasadas.

¡Maldito Corrector! Un equívoco provoca el cierre de dos colegios en Georgia y se lía parda

Resulta que alguien envió el siguiente mensaje: «gunna be at west hall today», que se traduciría como: «Hoy voy a estar en el West Hall». Sin embargo, el autocorrector hizo de las suyas y envió el siguiente mensaje: «gunman be at west hall today», que se traduciría como: «Hombre armado en el West Hall hoy». Además, a todo esto se unió que el que envió el mensaje se equivocó de número y lo envió a otra persona. Como resultado, el receptor del mensaje se quedó bastante asustado y acudió a la policía, y esta por motivos de seguridad consideró que lo mejor era proceder al cierre de los dos colegios de la zona. [Leer más…]

 

Image  Sobre Stilus…

Con Stilus estarás a salvo de situaciones embarazosas. Corregirás sin perder el control de tus cambios.

  • Ajusta el idioma de revisión (español, inglés, francés o italiano).
  • Valora sus sugerencias justificadas con explicaciones didácticas y bibliografía antes de corregir.
  • Sé consciente del proceso de revisión y no publiques nada que no hubieras deseado haber escrito.

 

 

2.   ¡Me apellido «Jahuira», no «Jauría»!

De acuerdo, es imposible que ningún corrector contenga en su diccionario todos los nombres propios que existan o puedan existir. Pero podemos minimizar las consecuencias de esa carencia teniendo en cuenta que:

a)   Son aplicaciones que suelen incluir un «diccionario personal» editable donde poder añadir las palabras que a priori no reconozcan.

b)   La tarea de editar el diccionario personal será tanto menos tediosa cuanto más amplia sea la base léxica del propio corrector. Es decir, resulta rentable perder un poco de tiempo en elegir herramientas con «buena cobertura léxica».

c)   No debemos perder de vista otras funcionalidades que pudieran ofrecernos para luchar contra los siempre molestos falsos avisos sobre nombres propios (lee abajo las opciones de Stilus).

Corrector ortográfico (maldito)

Tiempo atrás escribí aquí, en el blog, un resumen y apreciación de una novela inédita, sin publicar. Hace unos días, me trajeron la novela impresa, la miré, la vi, y mi nombre ahí, en el prólogo: MAL ESCRITO.

Era para llorar, el corrector ortográfico jugó en mi contra, mi apellido materno JAHUIRA fue cambiado JAURÍA.

No lo corregí, porque nunca me dijo que ese texto sería prólogo. Sólo quedaba el FE DE ERRATAS en hoja anexa. [Leer más…]

 

Image  Sobre Stilus…

Con Stilus los nombres propios no serán un problema.

  • Incorpora una base léxica de más de 9,5 millones de palabras de las cuales 160 000 son nombres propios.
  • Es continuamente actualizado con neologismos, nombres de personalidades, organizaciones, países, etc. surgidos en el panorama social contemporáneo.
  • Si aún así encuentras molesto que Stilus avise de los casos que ocasionalmente no reconozca, activa la opción «Detección inteligente de nombres propios», a partir de ese momento ningún nombre propio será un problema.

Detección inteligente de nombres propios

 

 

3.   No saben diferenciar entre «que» y «qué»

Seamos honestos, a estas alturas del cuento ya no se pueden hacer afirmaciones tan tajantes. Incluso el popular corrector de Microsoft Word es hoy día capaz de detectar con precisión más del 50 % de las faltas debidas a acentuación diacrítica u ortografía homófona.

Es cierto que «en el siglo pasado» los correctores solo devolvían error sobre palabras que no estaban en su diccionario. Por la misma regla de tres, si se encontraban con una palabra que pertenecía a su diccionario, no eran capaces de determinar si el autor había incurrido en un error al emplear una forma homófona de la pretendida o sin acento en lugar de su par diacrítico.

Hoy en día sí existen correctores automáticos capaces de «desambiguar» en función del contexto sintáctico. Incluso se empiezan a dar los primeros pasos en desambiguación semántica para complementar así las posibilidades que ya ofrecía la gramática.

 La *vaca del coche estaba mal colocada –> baca

VACA no pertenece a COCHE

BACA sí pertenece a COCHE

 

Resumiendo, actualmente no todos los correctores automáticos son simples comparadores formales de ortografía. También los hay «inteligentes».

En este texto hay doce errores. ¿Intuyes cuántos puede detectar el corrector de Microsoft Word? Averígualo, ¡es muy fácil!

– No se si lo sabia, pero mi mujer no esta.

– ¡Que pena!, ¿sé toma usted un café con migo?

– ¿Sabe cuanto bale?

– Si. Un euro y el te, dos.

– Prefiero te, gracias.

– Dé nada.

 

Image  Sobre Stilus…

Stilus es un corrector inteligente que se basa en el contexto lingüístico para realizar una revisión avanzada del texto.

  • La desambiguación sintáctica y semántica hacen posible la detección de errores que suelen pasar inadvertidos a otros correctores automáticos… [Leer más…]
  • Microsoft Word, 7 Stilus, 10

         Compruébalo gratuitamente en nuestra web:

         – No se si lo sabia, pero mi mujer no esta.

         – ¡Que pena!, ¿sé toma usted un café con migo?

         – ¿Sabe cuanto bale?

         – Si. Un euro y el te, dos.

         – Prefiero te, gracias.

         – Dé nada.

 

 

4.   Vale, aciertan algunas cosas de ortografía, pero de gramática ¡no saben nada!

Si acabamos de demostrar que los correctores de última generación son capaces de desambiguar en función del contexto sintáctico, ¿cómo no van a saber de gramática?

Stilus - Revision gramatical

Informe de revisión Stilus

5.   De revisar la puntuación ni hablemos…

Depende de los módulos de corrección que integre. Si bien es cierto que es absurdo confiar en que un programa informático se convierta en tu «asesor lingüístico personal» al estilo de un corrector humano, no lo es menos que muchas de las pautas marcadas en los manuales de estilo y ortotipografía son perfectamente factibles desde el punto de vista de la programación.

Vamos, que sí hay correctores automáticos que aconsejan sobre «dónde van o no van algunas comas».

Stilus - Revisa puntuación

Informe de revisión Stilus

 

Image  Sobre Stilus…

Stilus revisa gran cantidad de aspectos ortotipográficos.

  • Coteja apertura y cierre de pares de signos (comillas, paréntesis, corchetes, signos de admiración e interrogación…).
  • Revisa el espaciado: dobles espacios, exigencia de espaciado o adyacencia entre signos ortográficos y palabras, etc.
  • Avisa sobre secuencias no permitidas de signos de puntuación.
  • Revisa la puntuación en las abreviaturas.
  • Verifica el uso de mayúsculas y minúsculas.
  • Indica la conveniencia de tipografía cursiva sobre voces extranjeras.
  • Recomienda la inserción o supresión de comas en ciertos contextos.
  • etc.

 

 

6.   ¿Y la revisión de estilo, qué?

La revisión de estilo es más delicada y comprende muchas cuestiones que difícilmente una máquina puede controlar (pensamos en la verificación de la coherencia y la cohesión textual, o la detección de ambigüedades discursivas). Pero no minusvaloremos las capacidades de la lingüística computacional porque en el ámbito de la revisión estilística ¡nos puede ayudar más de lo que creemos! Los correctores de hoy son capaces de detectar:

  • ortografías no preferidas
  • expresiones incorrectas (solecismos y barbarismos)
  • expresiones no recomendables
  • impropiedades léxicas
  • extranjerismos léxicos, sintácticos o semánticos
  • expresiones redundantes
  • faltas de rección preposicional
  • faltas de régimen verbal (consecutio temporum)
  • queísmos y dequeísmos
  • repeticiones
  • coloquialismos y vulgarismos
  • etc.

 

En general, el 80 % de las indicaciones que incluye explícitamente un manual de estilo son potencialmente abordables por la revisión automática. E incluso, las tecnologías del texto empiezan a dar sus frutos en desambiguación semántica y detección de anáforas y correferencias (prueba el analizador morfosintáctico de Stilus), por lo que en un futuro próximo se auguran avances en detección de ambigüedades textuales; ¡no los perdamos de vista!

 

Image  Sobre Stilus…

Stilus: revisor ortográfico, gramatical y de estilo

Stilus le permite revisar la ortografía y el estilo de sus textos en varios idiomas, según las preferencias lingüísticas del usurario y desde cualquier ordenador dotado de un navegador estándar o Microsoft Word.

 

 

7.   «Eso de los correctores es lo peor que se ha podido inventar, es un crea asnos…»

corrector crea asnos

¿Seguro? Si hablamos de una herramienta de calidad y prescindimos (de nuevo) de la autocorrección, un corrector automático delega en el usuario la responsabilidad de hacer efectiva la corrección, lo que redunda en el «autoaprendizaje significativo». Esto es, si el corrector sugiere y tú decides, puedes mejorar fácilmente tu competencia escrita.

 

Image Sobre Stilus…

Stilus Corrector, al servicio del aprendizaje de la ortografía

Es frecuente entre los docentes mantener un mal concepto de los correctores ortográficos y gramaticales automáticos porque los asociamos a la corrección automática creyendo así que el alumnado no detecta el error que ha cometido y la forma de resolverlo… [Leer más…]

 

 

8.   En conclusión, los correctores automáticos solo molestan

¿Conoces todas las prescripciones que contempla un manual de estilo o la propia Ortografía de la Academia?, ¿realmente molesta a un nativo un falso aviso de concordancia?, ¿no merece la pena que la máquina realice por ti ciertas tareas tediosas…? Quizá deberíamos plantearnos todas estas cuestiones antes de rehuir de la corrección automática. Explotar las posibilidades que ofrece la tecnología suele ser interesante.

Mónica Castelló, correctora: «no dejan de ser herramientas programadas con un fin similar al nuestro, de las que podemos sacar ventajas…». Corrector humano vs. corrector automático.

 

Image  Sobre Stilus…

Stilus es un nuevo concepto de corrector de textos

La tecnología semántica de Daedalus ha venido aplicándose con éxito en el ámbito corporativo: empresas como el Grupo Prisa, Unidad Editorial, Vocento o el Instituto Cervantes la utilizan para redactar, editar y clasificar noticias o para tareas avanzadas de búsqueda y recuperación de información multimedia.

Con Stilus, Daedalus aborda el mercado de profesionales (revisores, traductores, editores, profesores) y particulares. [Leer más…]

 

 

¿Te hemos convencido de que la «corrección automática» merece una segunda oportunidad? Si es así y te apetece redescubrir las capacidades de la verificación textual «hoy», prueba gratis el nuevo Stilus: www.mystilus.com, ¡cambiarás el chip!

Automatic proofreading for serving translators

19 enero, 2012 1 comentario

Rivers of ink are written about and because of translation. A huge number of texts are translated daily, and many reflections have been made on translating too.

 

 

What should we expect from translators?

Nowadays the translation subject is studied following a descriptive approach. Traditionally, reflections were made on how to properly translate a text, drawing a line between right and wrong translations to that end. More recently, however, translation has been studied as a process. Translating is not choosing between what is right and what is wrong when dealing with difficult texts, but rather choosing among an undefined number of options according to whom the text is addressed. Being able to choose between more or less appropriate options involves developing the translation competence. This competence enables translators, who must demonstrate their knowledge and skills in taking decisions (strategy), using documentary sources (instrumental skills), gaining awareness on subjects that initially are alien to them (encyclopedic knowledge) and, obviously, mastering the involved languages (linguistic awareness).

When clients order translations they expect the highest linguistic quality from the text for which they pay. A great linguistic competence is indeed on the base of the translators’ education and professional experience. In this regard, there is a circumstance that must be stressed: translating into the mother tongue does not equal to translating into a foreign language. For this reason, translators make a distinction among their working languages: The A language is the mother tongue, and the B and C languages are their first and second foreign languages respectively. The A language entails a proficiency level. For the other two languages, a distinction is commonly made between linguistic comprehension (direct translation) and production (inverse translation). The second type involves translating into a foreign language, an activity that is in no way like performing a direct translation.

This is a matter for debate, and there are those who think that these language professionals should not translate into a foreign language. Such an ideal circumstance, however, cannot always come true.

There is a market for inverse translations too. Those who translate into a foreign language know that their level of linguistic competence cannot be the same as in direct translation. Within different levels of proficiency, nevertheless, a reasonable linguistic quality is expected. Also, this level should meet the requirements of the translation brief, which means that some assignments may take priority over others. For instance, cookbooks with receipts should be easily addressed by non-natives, while bestsellers better suit native translators.

 

Automatic proofreading at your service

Is it possible to reach a sound level of linguistic quality for inverse translation? Were translations direct or inverse, they always welcome revisions on their linguistic quality, and it becomes even more evident in the latter. Native proofreaders would ideally perform this task, however, this is not always possible – tight deadlines or work environments force translators to meet a proper standard of linguistic performance without the aid of human proofchecking.

Thus, the automatic proofreading technologies are really helpful in such circumstances. Assuming that technology cannot substitute human proofreaders, automatic proofreading can be added to translators’ knowledge of foreign languages for inverse translation jobs.

STILUS, which is the automatic proofreading software developed by Daedalus, can be useful in an end stage of the translation process. Let’s see how some of its features would be beneficial to translators::

– Spell checking of general language words, plus proper names and specialized terminology.

– Grammar checking to detect syntax errors, such as wrong concordances or prepositional usages.

– Style checking to detect too long sentences or lexical misuses (e.g. foreign words to be avoided, or wrong transliterations).

If you work as a professional translator, we invite you to use STILUS, the proofreading tool developed by Daedalus.

La corrección automática al servicio del traductor

12 enero, 2012 4 comentarios

La traducción genera ríos de tinta, no solo por el inmenso volumen de textos que se traducen diariamente, sino también por el número de reflexiones que se dan en torno a la actividad de traducir.

¿Qué se espera de un traductor?

Actualmente la traducción se mueve en un terreno descriptivo. Si bien tradicionalmente se ha reflexionado sobre la manera de traducir correctamente, distinguiendo traducciones correctas y erradas, hoy día se estudia la traducción como proceso. Por este motivo, a la hora de enfrentarse a un texto, traducir no es elegir entre lo que está bien y lo que está mal, sino hacerlo entre un número indeterminado de opciones en función de quién sea el receptor de la traducción. Para poder elegir entre distintas opciones de traducción es necesario desarrollar una competencia traductora. Esta competencia capacita a un traductor, que tiene que  demostrar una serie de habilidades y conocimientos: estratégicos (saber tomar decisiones), instrumentales (saber cómo documentarse), enciclopédicos (iniciarse en temas a los que en principio es ajeno) y, por supuesto, lingüísticos (dominar la lengua desde la que se traduce y hacia la que se traduce).

El cliente que encarga una traducción espera la máxima calidad lingüística para el texto por el que paga. En efecto, una muy buena competencia lingüística es la base de la formación y la experiencia de un traductor. Al respecto, existe una circunstancia que hay que subrayar: no es lo mismo traducir hacia la lengua materna que hacia la lengua extranjera. Por este motivo, los traductores hacen una distinción en sus lenguas de trabajo: la lengua A es la lengua materna, y las lenguas B y C son respectivamente la primera y la segunda lengua extranjera. En la lengua A la competencia lingüística tiene que ser muy buena, y para las otras dos suele diferenciarse entre la comprensión (traducción directa) y la producción lingüística (traducción inversa). Este último caso consiste en traducir hacia la lengua extrajera, que nunca será igual que hacerlo hacia la lengua materna.

Existe debate al respecto, pues hay quien opina que un traductor no debe traducir hacia una lengua extranjera. Esta visión ideal no se da en la realidad: existe el mercado de la traducción inversa. Quienes traducen hacia una lengua extranjera son conscientes de que para este caso el nivel de competencia lingüística no puede ser el mismo: con distintos grados, se espera una calidad lingüística aceptable, y que se ajuste al encargo de traducción. Esto implica priorizar unos encargos frente a otros: la traducción de un libro de recetas de cocina, por ejemplo, puede ser perfectamente asumible para un traductor no nativo, mientras que un best-seller literario estará en mejores manos si lo traduce un nativo.

La corrección automática a su servicio

Cabe preguntarse entonces cómo puede alcanzarse un nivel de calidad lingüística aceptable en traducción inversa. De por sí las traducciones, independientemente de que sean directas o inversas, requieren revisiones que tengan que ver con su calidad lingüística. Esta necesidad es evidentemente mayor para el segundo caso. La situación ideal es que un revisor nativo corrija la traducción que hace un no nativo. Sin embargo, no siempre es así: los plazos y el entorno de trabajo del traductor obligan a alcanzar un nivel aceptable de corrección lingüística sin la ayuda de un corrector humano.

Por este motivo, las tecnologías de corrección automática son de enorme ayuda en este tipo de situaciones. Aceptando la premisa de que un corrector humano es insustituible frente a la tecnología, los correctores automáticos que tienen un avanzado nivel de procesamiento pueden sumarse al propio conocimiento de la lengua extrajera que tiene un traductor para abordar un encargo de traducción inversa.

STILUS, el corrector automático que desarrolla Daedalus, puede ser una herramienta útil para la fase final de una traducción. Veamos algunas de sus características de las que podría beneficiarse un traductor:

– Revisión ortográfica no solo de palabras de la lengua general, sino también especializada, además de nombres propios.

– Revisión gramatical para detectar errores de sintaxis, como por ejemplo los relativos a concordancias o colocaciones preposiciones.

– Revisión de estilo para detectar frases largas o léxico impropio, como por ejemplo extranjerismos que pueden evitarse, falsos amigos o calcos morfosintácticos.

Si se dedica profesionalmente a la traducción, le invitamos a probar el corrector STILUS en el que trabaja diariamente Daedalus.

How can the automatic proofreading help publishing professionals? (2nd part)

22 diciembre, 2011 1 comentario

As we have shown in the first part, automatic text verification systems aim to become useful resources. However, these applications are by definition tools that help in writing, and they should never replace the human proofreader, especially if the goal is publishing. Until now, there were a lot of questions that technology could not face.

Where should we focus our attention?

We cannot trust technology when text revision involves a comprehensive and careful reading in order to find ambiguous sentences or inconsistencies from the author (e.g. changing in a story the name of the same character), or decide whether a footnote would be necessary, etc.

Apart from this, we must give attention to another type of revision. It is called conceptual or technical revision, and it consists in examining the text to see if it conforms to the terminological conventions which are typical of the related subject. In fact, this task should not be assigned to a specialist in spelling and style, but rather to a specialist in the given subject (a physician for a handbook of medicine, an engineer for a technical text, etc.).

Despite these facts, we must note that language technologies specialists have begun to handle information on a semantic basis. Examples of this are the recognition of anaphoras and coreferences. We believe that, in the near future, there will be major advances in the detection of certain lexical ambiguities or misuses.

Why should publishing professionals make use of automatic proofreading?

We assume that revising a text is a time-consuming task. Thus, we believe that publishing professionals can go a step further, and not just confine themselves to the process of looking for information in dictionaries, grammars, and other reference books. The new automatic proofreading systems are certainly helpful:

  • You can save time on tedious tasks that the proofreader can perform easily.
  • You can focus your efforts on activities that involve human processing.
  • You can improve the quality of the final revision.
  • You will have more time left to meet the tight deadlines imposed by the publisher.

In conclusion, you can be more productive, increase your profits and, at the same time, maintain the quality of your work.

Try STILUS, our proofreading software.

[English version of  ¿Qué aporta la corrección automática al profesional de la edición? (parte 2)]

How can the automatic proofreading help publishing professionals? (1st part)

22 diciembre, 2011 4 comentarios

A human proofreader is a professional in charge of revising materials written by an author. He tries to ensure that the readers receive the message clearly and free from errors.

The editing process is commonly comprised of several different levels of textual revision: spelling and typographical checking, style checking, conceptual revision, and revision of translated texts, were that the case. All of the publishing houses are aware of this process, but only a few put it into practice. In reality, it is not common for a publishing house to properly assign each revision type to specialized proofreaders. Usually, the proofreader of a given text gets far too much work, as he carries out all the revision work that three or four specialists should have done. He stands as a mediatory demiurge who links ideas to something legible. How much are they paid for this? 0,72 € per 1000 matrixes (or characters with spaces) for proofreading on screen, and around 0,50 € for second galleys (proofreading on paper). In conclusion, they are working for five or six euros per hour in the most profitable cases.

Thus, these edition demiurges may want to explore ways of increasing productivity and, at the same time, protecting the quality of their work.

How can the automatic text verification technology contribute to the proofreading process?

Granted, philologists and some other language professionals are very reluctant to anything related to “automatic proofreading”, however, we want to make clear that prejudging a last-generation software tool is somewhat unfair. Language lovers might congratulate themselves on the new Natural Language Processing technologies that make it possible to automatically proofreading a text. These automatic proofreaders are able to check, with a high degree of linguistic precision and recall, many items regarding spelling and typography (according to the application’s degree of processing). Equally, they can make a text conform to the spelling and grammar rules. On the other hand, the majority of these applications do not rewrite the text automatically, but rather they give the user a choice among the different proposals that the application makes.

What issues can be addressed by automatic proofreading?

  • Spelling and typographic checking. An optimum level of orthographic recall can be reached if the system has a good lexical base. This avoids false warnings on existing words (even if they are not frequent), and also permits to check the spelling of national and foreign proper nouns (e.g. toponyms, persons’ names, institutions, brand names, etc.). In addition, many tools comprise personal dictionaries where new words are added, hence the lexical base is expanded. On the other hand, these new applications are becoming context-sensitive so that homophones and diacritic errors can be found. Finally, there are more issues concerning spelling and typography that a proofreading application considers too: it can now advise on the use of italics (e.g. foreign words), verify the opening and closing of pairs of signs, warn of wrong sequences of punctuation marks, verify the correct use of upper and lower case letters, check the spacing (double spaces, required spaces or joins between typographic signs and words), etc.
  • Grammar checking. Last-generation proofreading applications have the potential to disambiguate different senses. It allows for finding many agreement errors at different sentence levels, and other syntactic violations such as mismatched verb tenses, or errors in prepositional government.
  •  Style checking. These applications are able to make suggestions about spelling variations that are much preferred, lexical misuses or very colloquial registers. They can also provide alternatives to foreign words, and warn of phenomena that can make reading confusing (abusive use of prepositions, word repetitions, too long sentences, redundancies, unwanted technical words, etc.).
  •  Revision of translations. These applications are able to find loan translations between the source and the target language. They can also warn of false friends or wrong transliterations.

Try STILUS, our proofreading software

What is left for a human proofreader?

Read it on the next post.

[English version of  ¿Qué aporta la corrección automática al profesional de la edición? (parte 1)]

¿Qué aporta la corrección automática al profesional de la edición? (parte 2)

12 diciembre, 2011 1 comentario

En la primera parte vimos que realmente las nuevas tecnologías de verificación textual pueden resultar muy útiles. Sin embargo, estas aplicaciones se definen como “herramientas de ayuda a la escritura” y no deberían sustituir nunca al profesional humano, sobre todo cuando exista un fin editorial. Todavía hoy en día quedan muchas tareas que la tecnología no es capaz de afrontar en el ámbito de la corrección.

¿A qué cosas deberemos seguir prestando atención?

En general, no podemos delegar en la tecnología aquellas tareas de corrección que tengan que ver con una lectura especialmente meticulosa y comprensiva: detectar oraciones ambiguas, descubrir incongruencias por descuido del autor (ej.: un personaje que tutea a otro y en determinado momento lo llama de usted), decidir si es necesario incluir una nota al pie, etc.

Y tendremos que seguir prestando atención a la llamada corrección técnica o de concepto. Esto es, al examen del texto respecto de su adecuación a las convenciones terminológicas del dominio al que pertenece. De hecho, esta revisión ni siquiera debería encargarse a un especialista en ortotipografía y estilo, sino a un profesional especializado en la materia de que se trate (un médico para revisar un manual de medicina, un informático para verificar un texto sobre tecnología, etc.).

A pesar de todo, debemos saber también que actualmente las tecnologías del lenguaje están concentrando esfuerzos en el terreno del tratamiento semántico de la información y el reconocimiento de anáforas y correferencias, por lo que auguramos que en un futuro no muy lejano podremos contar con nuevas e interesantes mejoras para detectar ciertas ambigüedades o inadecuaciones léxicas.

¿Por qué un profesional de la edición también debería utilizar la corrección automática?

Asumiendo la ingente tarea que supone “corregir un texto”, parece interesante que los profesionales del sector no se limiten al manejo de diccionarios, gramáticas y otros textos de referencia para realizar su labor; las nuevas tecnologías de corrección automática también les serán de gran ayuda:

  • para ahorrarse algunas tareas tediosas o asequibles por el corrector
  • para centrar su dedicación en lo que requiera procesamiento humano
  • para aumentar la calidad de la corrección final
  • para reaccionar más cómodamente ante los plazos impuestos por la editorial

En definitiva, para aumentar su productividad y sus ingresos, preservando la calidad de su trabajo.

Pruebe nuestro corrector STILUS

¿Qué aporta la corrección automática al profesional de la edición? (parte 1)

Cuando hablamos de un corrector humano hablamos de un profesional encargado de revisar material escrito por un autor con el fin de asegurar que el lector reciba el mensaje con claridad y sin errores.

Teóricamente, durante el proceso de edición deberían atenderse, como fases sucesivas e independientes, revisiones textuales de diversa índole, a saber: la corrección ortotipográfica, la corrección de estilo, la corrección de concepto y, si se trata de una traducción, también la revisión de la traducción. En toda editorial que se precie, esto se sabe, pero solo en algunas se asume. La realidad es que en muy pocas ocasiones la casa editora encarga convenientemente cada tipo de revisión a un profesional especializado. Lo habitual es que “el corrector del texto equis” sea “corrector por triplicado” y él, y solo él, se convierta en el demiurgo mediador entre las ideas y lo legible que se encargue de la ingente tarea que deberían haber realizado tres o cuatro especialistas. La retribución por ello: unos setenta y dos céntimos de euro por cada millar de matrices (o caracteres, incluyendo espacios) para primeras pruebas en pantalla, y alrededor de cincuenta y cinco céntimos si son galeradas, esto es, segundas pruebas en papel. A fin de cuentas, cinco o seis euros la hora (en los casos más productivos).

Por tanto, sí parece interesante que estos demiurgos de la edición contemplen cualquier opción que pudiera ayudarles a aumentar su productividad, salvaguardando la calidad de su trabajo.

¿Qué pueden aportar las tecnologías de verificación automática de texto durante el proceso de corrección editorial?

Asumiendo el desprecio que tradicionalmente han venido demostrando filólogos y otros profesionales de la lengua por todo lo que suene a “corrección automática”, hemos de advertir de lo injusto de la opinión cuando se trata de prejuzgar una aplicación de última generación. Por suerte para los amantes del lenguaje, las nuevas tecnologías de Procesamiento del Lenguaje Natural han permitido que actualmente existan correctores capaces de verificar, con gran cobertura y precisión lingüísticas, tanto la adecuación de un escrito a la norma ortográfica y gramatical, como (en función de los niveles de procesamiento que incluya la aplicación) la revisión de no pocos aspectos ortotipográficos y de estilo. Por otro lado, la mayoría de estas aplicaciones ofrecen la opción de no reescribir automáticamente el texto para delegar en el usuario la decisión sobre la conveniencia o no de las propuestas que ofrece el asistente.

¿Qué cuestiones alcanza a atender hoy en día la corrección automática?

  • En revisión ortográfica y ortotipográfica: una buena base léxica asegurará una alta cobertura ortográfica. Esto evitará en gran medida los falsos avisos sobre palabras que existan (aunque sean poco utilizadas) e incluso verificar la manera correcta de escribir nombres propios nacionales o extranjeros (ej.: topónimos, antropónimos, instituciones, nombres comerciales, etc.). Cabe mencionar además que muchas de estas herramientas incluyen un diccionario personal editable mediante el cual podemos sumar a la base léxica las voces que a priori el corrector no reconoce. Por otro lado, gracias a la cada vez mejor sensibilidad contextual de estas nuevas aplicaciones, son capaces de detectar errores relacionados con pares homófonos y diacríticos. En cuanto otro tipo de aspectos de orden ortotipográfico, un verificador automático hoy en día puede indicar la conveniencia de cursivas (ej.: sobre voces extranjeras), cotejar la apertura y cierre de pares de signos (comillas, paréntesis, corchetes, etc.), avisar sobre secuencias no permitidas de signos de puntuación, verificar ciertos usos de mayúsculas y minúsculas, revisar el espaciado (dobles espacios, exigencia de espacio o adyacencia entre signos ortográficos y palabras), etc.
  • En revisión gramatical: gracias al aumento de su capacidad desambiguadora, los correctores de última generación son capaces de detectar gran cantidad de errores de concordancia a distinto nivel oracional, además de otro tipo de violaciones de índole sintáctica como puedan ser la incompatibilidad entre tiempos verbales, la no obediencia de recciones (o exigencias) preposicionales, etc.
  • En revisión de estilo: sugerirán recomendaciones de uso para expresiones o variantes ortográficas menos preferidas, avisarán ante posibles impropiedades léxicas, registros demasiado coloquiales, propondrán alternativas a extranjerismos y voces extranjeras, reaccionarán frente a fenómenos que puedan complicar la lectura (uso abusivo de preposiciones, repetición de palabras, frases demasiado largas, redundancias, uso injustificado de tecnicismos, etc.).
  • En revisión de traducción: por ejemplo, la detección de calcos morfosintácticos entre lengua de origen y lengua meta, el aviso sobre adaptaciones gráficas incorrectas de voces extranjeras, advertencia sobre posibles falsos amigos, etc.

Pruebe nuestro corrector STILUS

¿Qué le queda al corrector humano?

Descúbralo en la segunda parte.

A %d blogueros les gusta esto: