Archive for the ‘Uncategorized’ Category

Myths About Automatic Spell Checkers in the Age of Semantic Technology

How many times have we heard statements like these on “poor automatic spell checkers”? In the age of semantic technology it is time to change attitude:


1. The automatic spell checker corrects things that should not… The know-it-all

Has the spell checker ever cheated you? In order to avoid it, you just need to configure it in the right way. You must be sure that it is proofreading in the correct language (in Portuguese livro is not a ‘book’!) and that, if were, the option “Autocorrect” is not selected. We must not lose control over the proofreading process! By following some advice, you will avoid that the application will give you unpleasant surprises.

Damn spell checker! A misunderstanding causes the closing of two schools in Georgia

Someone sent the following message: “Gunna be at west hall today”, that is to say: “Today I will be at West Hall”. However, the automatic spell checker didn’t work properly and sent the following message: “Gunman be at west hall today”, that is to say: “Armed man in the West Hall today”. Moreover, the person who sent the message dialed the wrong number and sent it to another recipient. As a consequence, who received the message got scared and went to the police, who, for security reasons, considered closing the two schools of the area. [Continue reading…]


ticmitos With Stilus…

With Stilus you will be safe from embarrassing situations. You will proofread texts without losing control over changes.

  • Set the language of proofreading (Spanish, English, French or Italian).
  • Consider suggestions justified with didactic explanations and bibliography before correcting.
  • Be aware of the proofreading process and do not publish anything you wouldn’t have wanted to write.



2. My last name is “Jahuira” and not “Jauría”!

It is true, it is impossible for a spell checker to contain in its dictionary all the existing or potential proper nouns. However, we can minimize the consequences of this gap by taking into account the following aspects:

a)   They are applications which usually include an editable personal dictionary in which is possible to add words that are not recognizable beforehand.

b)   The wider the lexical database of the corrector, the easier the edition of the personal dictionary will be. That is to say, it is convenient to dedicate some time to the choice of tools with good lexical coverage.

c)   You should not lose sight of other features they may offer in order to minimize annoying warnings about proper nouns (read the options of Stilus).

Spell checker (damn)

Some time ago I wrote in the blog a review on a novel that hadn’t been published yet. A couple of days ago, someone brought me the printed novel and my name was there in the prologue: MISSPELLED.

I almost cried. The spell checker played a bad trick on me: my maternal surname JAHUIRA had been changed with JAURÍA.

I didn’t correct it because nobody had said me that that text would have been the prologue. There was only the ERRATA SHEET attached. [Continue reading…]


ticmitosWith Stilus…

With Stilus proper nouns will not be a problem.

  • It includes a lexical database with more than 9,5 million words, of which 160,000 are proper nouns.
  • It is constantly updated with neologisms, names of personalities, organizations, countries, etc. that emerge in the contemporary social landscape.
  • However, if you don’t want Stilus to inform you that it doesn’t recognize a noun, select the option “Automatic recognition of proper nouns” and from that moment no name will be a problem.




3. They don’t know how to differentiate monosyllabic words with double meaning

At this stage, it’s not possible to make such rigid statements anymore. Even Microsoft Word’s well-known spell checker can detect with precision more than 50% of the mistakes resulting from accentuation or spelling of homophones.

It is true that in the past century spell checkers only detected mistakes in words that were not included in their dictionary. Even if a word was part of their dictionary, they were not able to recognize whether the author had made a mistake for using a homophone or a monosyllabic word without accent in place of the same one with accent.

Nowadays there are automatic spell checkers that are able to eliminate any ambiguity according to the syntactic context. Semantic disambiguation is getting foothold too and it broadens the possibilities that grammar already offers. Next, an example in Spanish dealing with the homophones vaca (‘cow’) and baca (‘roof rack’):

 La *vaca del coche estaba mal colocada –> *baca

‘Cow’ (vaca) has nothing to do with ‘car’ (coche)

‘Roof rack’ is the appropriate term instead.


In short, at the moment not all automatic spell checkers are just simple comparators of formal spelling. There are the smart ones too.

In this text in Spanish there are twelve mistakes. Do you know how many of them are detected by Microsoft Word’s spell checker? Find out yourself, it’s easy!

– No se si lo sabia, pero mi mujer no esta.

– ¡Que pena!, ¿sé toma usted un café con migo?

– ¿Sabe cuanto bale?

– Si. Un euro y el te, dos.

– Prefiero te, gracias.

– Dé nada.


ticmitosWith Stilus…

Stilus it’s an intelligent spell checker based on linguistic context, which permits an advanced proofreading of texts.

  •  Syntactic and semantic disambiguation makes it possible to detect mistakes that other automatic spell checkers usually cannot detect… [Continue reading…]
  • Microsoft Word: 7 – Stilus: 10

Try it for free on our website:

– No se si lo sabia, pero mi mujer no esta.

– ¡Que pena!, ¿sé toma usted un café con migo?

– ¿Sabe cuanto bale?

– Si. Un euro y el te, dos.

– Prefiero te, gracias.

– Dé nada.



 4. They obviously detect some spelling issues, but as far as grammar is concerned they are quite unprepared!

If we have just demonstrated that latest-generation spell checkers are able to eliminate ambiguities according to the syntactic context, why do they don’t know anything about grammar?

revision gramatical stilusCheck report. Stilus



5. There’s no need to correct punctuation…

It depends on the integrated correction modules. Although it’s true that it’s absurd to conceive a computer program as a personal linguistic consultant as if it were a human proofreader, many of the rules stressed in typography and style handbooks are entirely feasible from the point of view of programming.

Of course, automatic spell checkers that suggest “to put commas or not” do exist.

stilus revisa puntuacionCheck report. Stilus


ticmitosWith Stilus…

Stilus revises many typographic aspects.

  • Verifies the opening and the closing of pairs of signs (inverted commas, parentheses, brackets, exclamation and question signs…).
  • Checks spacing: double spaces, lack of spacing or adjacency between orthographic signs and words, etc.
  • Warns about unnecessary or mistaken punctuation sequences.
  • Corrects the punctuation of abbreviations.
  • Checks uppercase or lowercase use.
  • Suggests the correct use of italics for foreign terms.
  • Recommends the insertion or the abolition of commas in precise contexts.
  • Etc.



6. What happens with style checking?

Style checking is subtler and includes many issues that a tool hardly can control (just think about textual consistency and cohesion or conversational ambiguities). However, we must not underrate the capacities of computational linguistics because they can help us more than we think in the field of style checking! Nowadays, spell checkers are able to detect:

  • Spelling not recommended
  • Misused expressions (solecisms and barbarisms)
  • Expressions not recommended
  • Lexical improprieties
  • Lexical, syntactic or semantic foreignisms
  • Redundant expressions
  • Mistakes in the prepositional regency
  • Mistakes in the correlation between verbal tenses (consecutio temporum)
  • Queísmos and dequeísmos (for Spanish language)
  • Repetitions
  • Colloquialisms and vulgarisms
  • Etc.

Generally, 80% of the information included in a style handbook can potentially be processed by automatic spell checkers. Moreover, text technologies begin to show significant results in semantic disambiguation and in the detection of anaphoras and references (try Stilus’ morphosyntactic analyzer). Therefore, considerable progresses in the detection of textual ambiguities are expected in the near future; don’t get caught unprepared!


ticmitosWith Stilus…

Stilus: spell, grammar and style checker

Stilus permits to check spelling and style in texts in several languages. It operates according to the user’s linguistic preferences and with an average computer equipped with a standard browser or Microsoft Word.



7. “Spell checkers are the worst thing that has ever been invented, they are for dunces…”

corrector crea asnosAre you sure? If we refer to a quality application and regardless auto-correction, an automatic spell checker leaves the user the decision of accepting any correction and it encourages Meaningful self-learning. This means that if the spell checker suggests and you decide, you can easily improve your writing skills.




ticmitosWith Stilus…

Stilus spell checker, supporting spelling learning

It’s quite common that teachers have a bad opinion about spell and grammar checkers because they are usually associated to automatic correction; furthermore, they believe that pupils may end up not being able to detect the mistakes they make and, consequently, not knowing how to correct them… [Continue reading…]



8. In conclusion, do automatic spell checkers only annoy us?

Are you familiar with every single rule contained in a style handbook or Oxford’s rules of spelling? Is a native really bothered by a false warning about syntactic harmony? If an application can perform tedious tasks, wouldn’t it been convenient? Perhaps we would better asking ourselves all these questions before refusing automatic spell checking. Taking advantage of the potentialities offered by technology is often worthy.

Mónica Castelló, proofreader: “After all they are programmed tools with a scope similar to ours, from which we can benefit…”. Human proofreader vs. Automatic spell checker.


ticmitosWith Stilus…

Stilus is an innovative spell checker

The semantic technology of Daedalus has been successfully applied in the corporative sphere: Spanish media groups Prisa, Unidad Editorial, Vocento or the Cervantes Institute use it to write, edit and classify news or for advanced research and recovery of multimedia information.

With Stilus, Daedalus addresses to professionals (proofreaders, translators, publishers, professors) and freelance. [Continue reading…]




Have we convinced you that automatic spell checking deserves a second chance? If the answer is yes and you’d like to explore the potentialities of textual verification today, try the new Stilus for freewww.mystilus.comyou will change your mind!


Go Global, go multilingual, go Flavius!

3 septiembre, 2012 Deja un comentario

More and more information is published and shared on the Internet, however it is not always available in the working language of each user. Despite the development of translation tools, language is still a barrier, as most people only access information written in their own language. Several options exist today to access information written in another language but all require special settings or skills and they are not very widely used. There are some tools which enable the translation of webpages by visitors, but they do not offer all necessary features, they are not customizable and they don’t preserve the site structure. Moreover, webpages are only indexed in the original language which prevents them from being searchable in other languages.

Flavius is the first end-to-end solution for website translation and indexing. It is a European project funded by ICT Policy Support Programme, inside the frame of Multilingual Web content management- methods, tools and processes.

Flavius allows you to create multilingual versions of your websites and applications in a few minutes, giving you also user-friendly tools to improve and revise the translation by means of customization features.

 Flavius platform allows you to translate either data files (applications and blogs, standard XML format and its declensions: ReSX, WordPress…) or websites. The contents of the websites are extracted to be treated by Flavius and a mirror copy of your website is created.

 Because a good translation can only result from a good source text, Flavius detects the possible spelling and grammar errors contained on your website and invites you to correct them. Daedalus provides Flavius with its experience in the field of text correction as well as the available products for this purpose.

 In a few seconds, a first translation is displayed and you will then be able to revise it manually. Flavius includes some custom engines to improve the quality translation, for example, in the French-English direction; you can choose to translate a website having travel as a theme. The translation quality will increase, reducing the number of revisions necessary to reach a good quality translation.

 You can then revise and modify the translation. You just have to preview your translated site and to click on a “label” or a paragraph to edit it. If you prefer it you can invite a reviewer, Flavius implements a feedback module that allows you to collect feedback from users (better translation ideas, repercussions from layout problems, and free commentary)

 You can guarantee the right translation of your expressions and key terms by creating a dictionary and by adding your keywords and their translation. Besides, the changes made during the stage of revision are kept and reused during the updates of your translated website, thanks to the translation memory feature. Furthermore, if you already have translation memories in TMX format, you can import them on Flavius and use them in the process of translation.

  Your translated website is ready on our servers. You now just have to make it available to all the Internet users by publishing it.

 Websites translated by Flavius are optimized for referencing. Thus, a foreign Internet user who types keywords corresponding to your website in his usual search engine will find your website translated by Flavius.

The Flavius platform is already fully functional and you can create a free account and check the benefits of Flavius translation.

The partners involved in the development of this project are Softissimo as leader, Across, Language Weaver and Daedalus. Additionally, some user organizations of the project (TVTrip, Overblog, Qype) will contribute to the launching of the platform through their very large online audience in various European countries.


El lenguaje en los Discursos del Estado de la Nación

28 junio, 2011 1 comentario

Que el lenguaje de los políticos cambia a lo largo del tiempo es una obviedad: igual que se transforma la coyuntura social, económica y política en las esferas nacional e internacional, e igual que mudamos los ciudadanos, destinatarios de sus discursos. Han pasado casi 28 años desde que Felipe González pronunciara el primer discurso en un Debate del Estado de la Nación, y mucho hemos cambiado España y los españoles desde entonces.

En Daedalus nos hemos planteado el interés de proporcionar herramientas para comparar léxicamente los discursos de los tres Presidentes del Gobierno  (diez de Felipe González y seis de José María Aznar y otros tantos de José Luis Rodríguez Zapatero, incluyendo el que pronuncia hoy).  Es curioso ver cómo algunos términos, como “sostenibilidad” o “igualdad” no han sido relevantes hasta hace muy poco. En el extremo, el término inmigración, no apareció ni una sola vez hasta el año 2001.

También podrán comprobar que la “crisis” fue un tema recurrente en los discursos de Felipe González de los años 83, 84, 91 y 94 (citado entre 14 y 23 veces), mencionando siempre esa palabra en algún momento de sus 10 discursos. Con mucha menor profusión, Aznar también habló de crisis (en todos sus discursos menos en uno). Sin embargo, no hubo ninguna mención a este término en ninguno de los tres primeros discursos de Rodríguez Zapatero, para surgir con fuerza (20 citas) en el año 2009.

Nuestra iniciativa hace posible que el investigador, el lector interesado o el simple curioso, analicen las fuentes de información por sí mismos. Este tipo de iniciativas  no son muy habituales en el periodismo tradicional, más dado a transmitir mensajes más “digeridos” (cuando no claramente orientados a su clientela).

Si lo desea, puede probar nuestro demostrador:

Análisis de los Discursos del Estado de la Nación

Como precedente de este sistema (que no tiene más propósito que el de servir de demostrador de nuestra tecnología), debemos citar los análisis de los discursos del Estado de la Unión que, desde hace algunos años, lleva a cabo el diario “The New York Times”. Pueden ver algunos ejemplos en estos enlaces:

Análisis de los discursos del Estado de la Unión pronunciados por el Presidente Bush

75 Años de Discursos del Estado de la Unión

También es interesante el análisis de los discursos del Presidente Obama propuesto por The Wall Street Journal:

Principales temas y palabras en los discursos del Presidente Obama

Y, por supuesto, una iniciativa independiente: “Speechwars”, donde se analizan las palabras usadas en todos los discursos de la unión desde 1790:

Speechwars: las palabras que hacen una nación

Para terminar, permítanme dos últimas recomendaciones muy especializadas (tesis doctorales), de interés para lingüistas, sociólogos y politólogos:

Emilio Alejandro Núñez Cabezas: “Aproximación al léxico del lenguaje político español”. Tesis Doctoral. Universidad de Málaga, 2000.

Francisco José Sánchez García: “Estudio pragmático del discurso periodístico político español. A propósito de los debates sobre el estado de la nación”. Tesis Doctoral. Universidad de Granada, 2009.

En cuanto finalice el discurso de hoy del Presidente Rodríguez Zapatero, lo incorporaremos para que puedan analizarlo en nuestro sitio de demostraciones: Showroom Daedalus


Nuevo transcriptor automático fonético y fonológico de castellano desarrollado por Daedalus

31 marzo, 2011 1 comentario

Ya está disponible en nuestra página de demostradores el transcriptor fonético y fonológico de castellano desarrollado por Daedalus.

Las herramientas de este tipo ofrecen en la actualidad aplicaciones diversas:

  • En primer lugar, constituyen el primer módulo de todo sistema de síntesis de voz. En efecto, los actuales sistemas llamados TTS (Text to Speech, o Texto a Voz) disponen necesariamente de un primer componente que realiza la conversión del texto a su representación fonética. En componentes posteriores se sustituyen las realizaciones fonéticas detectadas por material acústico que concreta la realización física de los sonidos. En un sentido similar, pero inverso, funcionan los sistemas de reconocimiento de voz.
  • Son también una herramienta imprescindible en la disciplina de la filología. En primer lugar, con fines didácticos, esto es, para uso entre estudiantes de esta ciencia, que deben aprender a transcribir correctamente los textos. Pero también como herramienta de ayuda en el ámbito profesional: el filólogo, en realidad, debe transcribir “de oído” para dar cuenta de los fenómenos no contemplados por la descripción estándar de los planos fonológico y fonético de la lengua, pero bien puede servirse como punto de partida de la transcripción inicial ‘estándar’ ofrecida por un sistema automático, para realizar posteriormente sobre ella las correcciones necesarias. En este sentido, los transcriptores son especialmente útiles en el marco de la Dialectología y sus ramas afines, así como en la ciencia conocida como Fonología histórica. Los transcriptores diseñados actualmente suelen ajustarse a una pronunciación estándar, como se dijo más arriba, y son concebidos solamente desde un punto de vista sincrónico, pero es frecuente parametrizarlos con distintas variables que permiten diferentes niveles de transcripción. En este sentido, nuestro transcriptor permite una cierta (pequeña, en realidad) parametrización sincrónica, tanto diatópica como diastrática y diafásica.
  • Los transcriptores son especialmente útiles también para el aprendizaje de lenguas extranjeras, pues permiten la notación (con mayor o menor nivel de detalle) de la pronunciación real de los textos. De hecho, cada vez más, los diccionarios orientados al uso por parte de extranjeros suelen incluir una transcripción fonética (habitualmente codificada en un AFI bastante simplificado) de cada una de las voces.

Nuestro transcriptor fonético y fonológico permite una transcripción fonética de un texto castellano en distintos alfabetos fonéticos conocidos:

AFI (IPA): Alfabeto Fonético Internacional.

RFE: Alfabeto de la Revista de Filología Española, el alfabeto fonético más utilizado en España dentro del ámbito de la filología hasta hace poco tiempo. Actualmente compite en este ámbito con el AFI.

Alfabetos Fonéticos Orientados a Usos Informáticos: Alfabetos fonéticos basados en caracteres ASCII, que permiten el procesado posterior del texto mediante programas informáticos.

  • DEFSFE: Alfabeto propuesto por Antonio Ríos, de la Universidad Autónoma de Barcelona (ver alfabeto).
  • SAMPA (Speech Assessment Methods Phonetic Alphabet): Alfabeto fonético basado en AFI (IPA). Tenemos en cuenta también la especificación SAMPROSA (SAM Prosodic Transcription).
  • SALA (SpeechDat across Latin America): Adaptación de SAMPA para la transcripción del español de América.
  • WORLDBET: Alfabeto basado en AFI (IPA), con símbolos adicionales.
  • VIA: Alfabeto propio de VIA VOICE, programa comercial para reconocimiento de voz.

Para más información sobre los diferentes alfabetos, pueden consultarse los siguientes enlaces:

Nuestra herramienta ofrece, además, una transcripción fonológica del texto, que es, en principio, poco útil para sistemas automáticos TTS como los comentados anteriormente, pero ciertamente útil en el campo de la filología, especialmente en el contexto de las corrientes filológicas clásicas conocidas como funcionalismo y estructuralismo, aunque, fundamentalmente, en un nivel meramente didáctico.

En cuanto a la arquitectura lógica, de diseño, del transcriptor, éste consta de los siguientes módulos:

  • Módulo de preprocesado: con diferentes submódulos, que preprocesan el texto de entrada, eliminando caracteres innecesarios, identificando pausas, expandiendo números, etc., obteniendo como resultado un texto normalizado.
  • Módulo de silabeo: aplica un algoritmo que descompone los términos del texto en sílabas.
  • Módulo acentuador: coloca los acentos fonéticos en los términos del texto.
  • Módulo transcriptor fonético: realiza la transcripción fonética propiamente dicha, aplicando una serie de reglas que, en función del contexto fonético y pragmático (este último seleccionado mediante opciones de la interfaz, como la realización de ciertos archifonemas), permiten la identificación del alófono correcto.
  • Módulo transcriptor fonológico: realiza la transcripción fonológica.

Nuestro transcriptor fonético ofrece, además, diferentes opciones en la transcripción:

  • Preprocesado: procesar o no abreviaturas, símbolos, números, números romanos.
  • Silabeo: silabear o no los términos, en el nivel fonético y en el fonológico.
  • Transcripción:
    • Vocalismo:marcar los alófonos nasales de las vocales.
    • Consonantismo: transcribir con yeísmo o sin él, realización concreta de los archifonemas /B/ /D/ /G/.
    • Otras opciones: marcar sinalefas, colocar los acentos sobre las vocales (para RFE, fundamentalmente).

La Fundación del Español Urgente invita a Daedalus a participar en su nuevo proyecto

La Fundación del Español Urgente (Fundéu BBVA) ha puesto en marcha el blog que ayudará a vertebrar los trabajos del primer manual de estilo en español para escribir correctamente en Internet o cualquier otro medio de comunicación digital.

El proyecto, codirigido por el periodista Mario Tascón y la lingüista Judith González, además de ofrecer recomendaciones de uso general, tendrá en cuenta los cambios que provoca en el lenguaje escribir en soporte virtual. Será una guía viva en la red cuyos consejos servirán para escribir bien tanto en entornos digitales como en cualquier otro soporte convencional.

Tascón, fundador de, y y desarrollador de importantes proyectos de Internet como ejecutivo de grandes grupos de comunicación, destaca que este hipermanual «es una respuesta a las necesidades que plantea el nuevo entorno virtual, y la nueva forma de leer y escribir».

Por ello, el manual tendrá en cuenta las particulares del entorno digital y contemplará usos prácticos en la escritura optimizada para buscadores, interfaces, redes sociales y microblogging (cómo escribir adecuadamente en 140 caracteres, como Twitter). Además, según apunta Tascón, el proyecto «dedicará una especial atención al desarrollo de la comunicación multimedia y al corazón de los medios digitales: el hipertexto, al tiempo que ayudará a establecer estándares lingüísticos» para preparar los sitios de la Red para la nueva web semántica.

La preparación del manual se asienta en un proceso participativo supervisado por editores. A través del blog, los expertos de la Fundéu BBVA con ayuda de profesionales de motores de búsqueda, periodistas y académicos irán aportando textos que conformarán la web que se presentará el próximo verano. En este marco de trabajo, se ha encargado a Daedalus la redacción de algunos contenidos relacionados con la navegación hipertextual y el funcionamiento de las herramientas de corrección automática de texto. Estos textos estarán enlazados con diversos demostradores de Daedalus en el área de las Tecnologías de la Lengua.

Los principales usuarios del portal serán periodistas, lingüistas, traductores, blogueros, twitteros, diseñadores, maquetadores, especialistas en programación, etc., pero por su propia naturaleza, cercana y clara, se convertirá en un referente para especialistas y público en general.

Look4leaks: ricerca sui cable di Wikileaks

Mario Vargas Llosa ha dichiarato pochi giorni fa i suoi sentimenti ambivalenti per quanto riguarda Wikileaks e la pubblicazione dei cabli del Dipartimento di Stato. Sul lato positivo, valora la trasparenza, che ci protegge dal intrighi e inganni. Per quanto riguarda il negativo, è un rischio per gli stati, in particolare i democràtici, per la loro vulnerabilità alla scomparsa di ogni forma di privacy. (vedi la cronaca, ad esempio,  The Swedish Wire: “WikiLeaks dangerous and wonderful”). Da parte sua, il presidente Obama ha fatto riferimento alla perdita come un’atto deplorevole.

La nostra valutazione complessiva della pubblicazione di questi documenti non è negativa. Rappresenta una piccola vittoria, ma importante per i cittadini, società civile, sull’apparato del potere statale. D’ora in poi, i governi dovranno preoccuparsi di trasparenza nelle relazioni internazionali. In questo punto usciremo, probabilmente, vincendo.

Inoltre, questo problema chiama in causa il ruolo dei servizi segreti di oggi. Le dichiarazioni rivelano, a volte, interpretazioni e opinioni molto superficiale o molto personali. Quel poco che ha pubblicato fino ad oggi degli 250.000 cablogramme, evidenzia anche la distesa ei metodi delle reti di influenza del governo degli Stati Uniti. Non si tratta fino a questo momento,  in ogni caso, di rivelazioni particolarmente sorprendenti. Alla luce dei risultati, i cittadini degli Stati Uniti potranno chiedere in che misura è ora necessario implementare una rete di informazioni così vasta e costosa (e apparentemente, così vulnerabile) come quella che mantiene il suo paese.

Ma analizziamo anche altri aspetti controversi del tema. Per quanto riguarda alla perdita di riservatezza, è un segno dei nostri tempi, il risultato di una società immediatamente interconnessa in cui viviamo. Una scomparsa facilitata dalla tecnologia e amplificata dai media. Qualsiasi azione volta a garantire la privacità e la riservatezza dovrà fare i conti con l’onnipresenza di dispositivi tecnologici e l’immediatezza delle reti di comunicazione … Ma, soprattutto, si incontreranno con la curiosità (spesso morbosa) di una legione di consumatori avidi di informazioni più o meno intima e robusta. La maggior parte dei mezzi di comunicazione sfrutta questa vena con grande successo di audizione, senza evidenti segni di saturazione. Qualsiasi azione per fermare questa tendenza di rifiuti e di curiosità morbosa deve cominciare dalla educazione.

Comprendiamo le paure che possono sorgere davanti ad un abisso d’informazioni, come può succedere nel caso di Wikileaks, ma crediamo che gli effetti positivi saranno predominanti. Per questo motivo, abbiamo riunito, in Daedalus, alcuni componenti della nostra tecnologia per il trattamento di contenuti multilingue in un motore di ricerca specializzato. Questo modulo permette di esplorare le poche centinaia di cablogramma che Wikileaks ha pubblicato e sono pubblicamente accessibili in virtù dei cinque mezzi di comunicazione che realizzano la gestione esclusiva, EL PAÍS tra di loro.

La ricerca sui documenti rilasciati finora (e sono facilmente accessibili da chiunque in rete) è disponibile in

José Carlos González

Categorías:Uncategorized Etiquetas: , , ,

Look4leaks: moteur de recherche sur les câbles de Wikileaks

30 diciembre, 2010 1 comentario

Mario Vargas Llosa a exprimé il y a quelques jours l’ambivalence de ses sentiments sur Wikileaks et la publication des câbles du Département d’Etat. Le côté positif, selon lui, c’est la transparence qui nous protège des intrigues et des mensonges. Mais le côté négatif, c’est le risque couru par les états, surtout les états démocratiques, en raison de leur vulnérabilité face à la disparition de toute forme de confidentialité. (Lire la chronique, par exemple, de The Swedish Wire: “WikiLeaks dangerous and wonderful”.) Le président Obama, quant à lui, a évoqué les filtrations comme une action déplorable.

Notre estimation globale de la publication de ces documents n’est pas négative. Elle suppose une petite mais importante victoire des citoyens, de la société civile, sur les appareils de pouvoir des états. A l’avenir, les gouvernements devront être plus attentifs sur la transparence dans les relations internationales. Et nous y trouverons tous notre compte.De plus, cette affaire remet en question le rôle des services de renseignements actuels. Les communiqués révèlent parfois des interprétations et des opinions très superficielles ou personnelles. Le quelques câbles publiés jusque-là mettent également en évidence les implications et les méthodes des réseaux d’influence de l’administration américaine. Il ne s’agit pas encore de révélations particulièrement surprenantes. Au vu des résultats, les citoyens des Etats-Unis se demandent probablement jusqu’à quel point le déploiement d’un réseau d’informations si étendu et coûteux (et apparemment si vulnérable) que celui des Etats-Unis est nécessaire de nos jours.

Mais analysons aussi d’autres aspects polémiques de cette affaire. Pour ce qui est de la perte de confidentialité, une perte facilitée par la technologie et amplifiée par les médias,  il s’agit d’un signe des temps, c’est le fruit de la société instantanément interconnectée dans laquelle nous vivons. Toute action pensée pour garantir la confidentialité sera confrontée à l’omniprésence de dispositifs technologiques et l’instantanéité des réseaux de communication… Mais, surtout, elle devra faire face à la curiosité (souvent malsaine) d’une quantité de consommateurs avides d’informations plus ou moins intimes et scabreuses. La plupart des médias obtiennent de grands succès d’audience en exploitant ce filon, sans signes apparents de saturation du public. Toute action visant à freiner cette tendance à la curiosité inutile et malsaine devra se faire par l’éducation.

Comprenant les craintes que peut susciter un abîme d’informations tel que celui de l’affaire Wikileaks, nous croyons que ce sont ses effets salutaires qui prédomineront. C’est pour cette raison que chez Daedalus, nous avons incorporé quelques composants de notre technologie destinée au traitement des contenus multilingues à un moteur de recherche spécialisé. Ce moteur de recherche permet d’explorer les quelques centaines de câbles révélés par Wikileaks et accessibles à tous en accord avec les cinq médias qui en détiennent l’exclusivité, dont Le Monde.

Le moteur de recherche sur les documents révélés jusqu’à présent (facilement accessibles à tous sur Internet) est disponible sur

José Carlos González

Categorías:Uncategorized Etiquetas: , , ,

Look4leaks: a search engine on the Wikileaks cables

30 diciembre, 2010 Deja un comentario

Mario Vargas Llosa expressed a few days ago the ambivalence of his feelings about Wikileaks and its publication of the State Department cables. On the positive side he values the transparency that protects us from the intrigues and lies. And for the negative side he sees a risk for the states, above all the democratic ones, because of their vulnerability before the disappearance of any form of confidentiality. (See the chronicle, for example, in The Swedish Wire“WikiLeaks dangerous and wonderful”.) As far as he is concerned, the president Obama referred to these leaks as a deplorable action.

Our global valuation of those documents is not negative. It supposes a small but important victory of the citizens and the civil society, against the states’ political machines. From now on, the governments will have to care more about the transparency in the international relations. And in doing so, everyone wins.

Besides, this matter questions the role of the intelligence services nowadays. The press releases reveal sometimes very superficial or personal interpretations and opinions. The few part of what was published until now out of the 250,000 cables also shows up the implications of the methods of the networks of influence of the United States’ administration. These revelations have not been particularly surprising until now. In the view of the results, the United States’ citizens are wondering to what extent such an extended and expansive (and, as we see it now, vulnerable) information network, as the one their country is supporting, is necessary.

But we must also analyze other controversial aspects of this matter. As far as the loss of confidentiality is concerned, it is a sign of the present days, a fruit of this instantly interconnected society, a loss caused by the technology and amplified by the media. Any action conceived to guarantee the privacy and confidentiality will have to face the omnipresence of technological systems and the instantaneity of the communication networks… But, above all, it will face the curiosity of avid consumers of more or less intimate and lurid information. Most media mine this seam achieving a large audience who does not seem to be saturated. Any action to restrain this tendency to the useless and morbid curiosity must take the education as a starting point.

As we understand the fears that can be generated before an informative abyss like the one we face with the Wikileaks case, we think that beneficial effects will dominate. That is why, in Daedalus, we have integrated some components of our technology for the processing of multilingual contents in a specialized search engine. This search engine makes it possible to explore the hundreds of cables that Wikileaks has revealed and that are publicly available in accordance with the five media managing the exclusive, The New York Times and The Guardian among them.

The search engine about the documents revealed until now (that are easily accessible in the Internet) is available in

José Carlos González

Categorías:Uncategorized Etiquetas: , , ,

Look4leaks: buscador sobre los cables de Wikileaks

29 diciembre, 2010 2 comentarios

Mario Vargas Llosa ha declarado hace unos días sus sentimientos ambivalentes en relación con Wikileaks y su publicación de los cables del Departamento de Estado. Por el lado positivo, valora la transparencia, que nos protege de la intriga y de la mentira. En cuanto a lo negativo, ve un riesgo para los estados, sobre todo los democráticos, por su vulnerabilidad ante la desaparición de toda forma de confidencialidad. (Véase la crónica, por ejemplo, de The Swedish Wire: “WikiLeaks dangerous and wonderful”.) Por su parte, el presidente Obama se ha referido a las filtraciones como una acción deplorable.

Nuestra valoración global de la publicación de estos documentos no es negativa. Supone una pequeña, pero importante victoria de los ciudadanos, de la sociedad civil, sobre los aparatos de poder de los estados. En lo sucesivo, los gobiernos tendrán que preocuparse más por la transparencia en las relaciones internacionales. En esto saldremos, sin duda, ganando.

Además, este asunto pone en cuestión el papel de los servicios de inteligencia en nuestros días. Los comunicados revelan a veces interpretaciones y opiniones muy superficiales o muy personales. Lo poco de lo publicado hasta ahora de los 250.000 cablegramas, pone de manifiesto también el alcance y los métodos de las redes de influencia de la administración estadounidense. No se trata hasta ahora, en todo caso, de revelaciones particularmente sorprendentes. A la vista de los resultados, los ciudadanos estadounidenses se estarán preguntando hasta qué punto es hoy día necesario el despliegue de una red de información tan extensa y costosa (y por lo visto, tan vulnerable) como la que mantiene su país.

Pero analicemos también otros aspectos conflictivos del tema. En cuanto a la pérdida de confidencialidad, se trata de un signo de nuestros días, fruto de la sociedad instantáneamente interconectada en la que vivimos. Una pérdida facilitada por la tecnología y amplificada por los medios de comunicación. Cualquier acción ideada para garantizar la privacidad y la confidencialidad tendrá que lidiar con la omnipresencia de dispositivos tecnológicos y la instantaneidad de las redes de comunicación… Pero, sobre todo, se topará con la curiosidad (a menudo morbosa) de una legión de ávidos consumidores de informaciones más o menos íntimas y escabrosas. La mayor parte de los medios de comunicación explota esta veta con grandes éxitos de audiencia, sin que haya síntomas evidentes de saturación. Cualquier acción para frenar esta tendencia a la curiosidad inútil y morbosa tiene que partir de la educación.

Comprendiendo los temores que se puedan generar ante un abismo informativo como el planteado con el caso Wikileaks, creemos que predominarán los efectos saludables. Por este motivo, en Daedalus hemos montado algunos componentes de nuestra tecnología para el tratamiento de contenidos multilingües en un buscador especializado. Este buscador permite explorar los pocos centenares de cablegramas que Wikileaks ha liberado y que están públicamente accesibles de acuerdo con los cinco medios de comunicación que están gestionando la exclusiva, El País entre ellos.

El buscador sobre los documentos liberados hasta ahora (y que son accesibles fácilmente por cualquiera en la red) se encuentra disponible en

José Carlos González

Categorías:Uncategorized Etiquetas: , , ,
A %d blogueros les gusta esto: