Une équipe de chercheurs américains lance un outil collaboratif capable d'effectuer une recherche d'image en plus de trois cents langues. Le tout, avec précision grâce à un service très performant de traduction...

Une équipe de chercheurs américains lance un outil collaboratif capable d'effectuer une recherche d'image en plus de trois cents langues. Le tout, avec précision grâce à un service très performant de traduction.
 
"Les images sont universelles. La recherche d'images, elle, ne l'est pas", souligne Oren Etzioni, professeur de sciences informatiques et d'ingénierie à l'université de Washington. Les moteurs de recherche traditionnels cherchent en effet une image en fonction de son titre ou de son marquage. Difficile dès lors d'accéder à des photos légendées en langues étrangères. Pour rendre la recherche d'images universelle, l'université de Washington a développé un outil de recherche multilingue. Celui-ci, baptisé PanImages en référence au préfixe grec "pan" qui signifie "total", traduit automatiquement la requête d'un internaute en plus de trois cents langues. Pour permettre cette recherche multilingue, l'équipe de chercheurs a scanné plus de trois cent cinquante dictionnaires en ligne, dont plusieurs "wiktionnaires", des dictionnaires multilingues rédigés par des internautes contributeurs.
 
Une tour de Babel de l'image
 
Le logiciel utilise un algorithme spécifique qui lui permet de sélectionner les résultats avec le plus de précision et de pertinence possibles. Les résultats sont ensuite assemblés dans une matrice qui permet la traduction dans de multiples langues. "PanImages est une ressource lexicale sans précédent. Son principal atout est sa capacité à se repérer au sein d'un nombre important de langues", ajoute Oran Etzioni. "Notre but est de répertorier au final la totalité des langages qui intéressent les gens". Afin de ne pas perdre les internautes sous une masse de résultats pas toujours pertinents, PanImages propose également de cibler le sens exact d'un mot pour en obtenir les bonnes traductions. Selon les chercheurs, le dispositif proposerait ainsi près de deux fois plus d'images correctes sur les quinze premières pages de réponses qu'un moteur traditionnel.
 
Universaliser l'accès à Internet
 
Une fois la requête enregistrée, les photos sélectionnées et dont la légende s'approche au plus près de la recherche initiale sont proposées via Google et le site de photos en ligne Flickr. En plus d'élargir la recherche d'images, le projet vise également à permettre aux personnes parlant une langue peu utilisée d'accéder facilement au web. "Alors qu'Internet devient chaque jour plus accessibles aux nations qui ne font pas partie des régions industrialisées, il devient de plus en plus important de pouvoir fournir des services aux personnes qui ne parlent ni anglais, ni français, ni chinois", explique Oren Etzioni. Et il semble que sur ce sujet, PanImages s'avère efficace. Pour une recherche effectuée en une langue comme le zoulou, l'outil collaboratif propose presque soixante fois plus de résultats qu'un moteur comme Google Images. Enfin, le système, dans une optique de travail collaboratif, permet aux utilisateurs d'ajouter instantanément de nouveaux mots ou traductions.
 

     
Exemple de recherche d'images sur Google et sur PanImages à partir du mot zoulou "ifriji" (réfrigérateur)
(cliquez sur les images pour agrandir)

Mathilde Cristiani pour L'Atelier

A ce sujet lire aussi :

Le langage naturel inspire les moteurs (31/07/2007)

Atelier groupe BNP Paribas