Un programme de recherche intelligente permet d’identifier tous les concepts associés à un mot et les présente à travers une liste exhaustive d’images.

LEVAN s’appuie sur les images pour passer des connaissances encyclopédiques

Le service rendu par les moteurs de recherche, du moins les plus usités, est aujourd’hui limité à la présentation d’une multitude de contenus non triés. Néanmoins, de nouveaux modèles de moteurs de recherche sont conçus, à l’instar de Random, développé par une startup finlandaise et qui se veut comme un moteur de découverte de contenus inattendus basée sur le comportement de l’utilisateur. Dernièrement, des chercheurs en informatique de l’Université de Washington et de l’Institut Allen pour l’Intelligence Artificielle de Seattle se sont demandés comment mener une recherche de contenu précis lorsque le terme recherché est flou, ou à l’inverse, comment être sûr que les résultats de la recherche sont complets. La technologie conçue consiste en un programme informatique entièrement automatisé nommé LEVAN pour "Learning Everything about Anything" (tout apprendre sur n’importe quel sujet).

Une technologie de recherche globale

Le programme LEVAN se base sur l’ensemble des ressources Google Books et les images présentes sur le web pour trouver toutes les variantes possibles d’un terme. La recherche parmi la bibliothèque de livres s’intéresse aux occurrences, c’est-à-dire la fréquence d’apparition d’un mot dans le texte. Les idées qui ne peuvent être associées à une image sont exclues par l’algorithme car non pertinents pour la recherche d’images. Tous les mots synonymes seront regroupés sous un même concept. Le programme procédera ensuite à la recherche d’images correspondant aux concepts identifiés. C’est grâce à un algorithme de reconnaissance d’images que celles-ci seront classifiées pour être associées à un concept. "Le but est de découvrir toutes les associations entre des données textuelles et visuelles." déclare Ali Farhadi, professeur en ingénierie à l’université de Washington. Les résultats sont présentés à travers différentes catégories d’images et/ou intitulés pour permettre à l’internaute de visualiser rapidement l’ensemble des concepts associés à une recherche de mot.

Un nouvel outil pour les données visuelles

Les moteurs de recherche intelligents de ce type ne sont pas nouveaux mais le programme LEVAN ne nécessite pas de supervision humaine et pourrait ainsi constituer une avancée pour les données encyclopédiques. En effet, Santosh Divvala, chercheur à l’Institut Allen, explique que les grandes sources d’information, telles que les dictionnaires ou encyclopédies adoptent de plus en plus de données visuelles car elles permettent une meilleure compréhension des concepts. Mais il apparaît difficile d’alimenter toutes les sources car elles doivent être gérées manuellement par l’homme. Ce nouveau programme a l’avantage de combiner les connaissances textuelles et visuelles pour couvrir tous les concepts d’un mot. Lancé en mars 2014, LEVAN peut aujourd’hui classer 13 millions d’images à travers 65 000 concepts différents. L’équipe de chercheurs a pour ambition d’en faire un outil pédagogique et également une banque d’information d’images. La prochaine étape sera de créer une application sur smartphone.

Rédigé par Eliane HONG
Journaliste