Imense développe un logiciel capable d'indexer n'importe quelle image présente sur Internet. Pour tester son système, la société a bénéficié de l'aide d'un consortium de spécialistes en physique des particules...

Imense développe un logiciel capable d'indexer n'importe quelle image présente sur Internet. Pour tester son système, la société a bénéficié de l'aide d'un consortium de spécialistes en physique des particules.
 
Pour Imense, une société installée à Cambridge, l'objectif est de devenir le Google de la recherche d'images sur le web. Pour y parvenir, la start-up - anciennement baptisée Cambridge Ontology - développe une technologie permettant de rechercher au sein même des images, le tout sans s'appuyer sur un référencement préalable ou une balise texte. Mais, après avoir développé son logiciel, la société s'est trouvée face à une impasse. De taille modeste, elle ne pouvait en effet pas procéder aux investissements nécessaires à l'acquisition de la puissance informatique nécessaire au test et au développement commercial de son produit. "Nous avons construit un prototype de notre nouvelle technologie de recherche et d'analyse d'images, mais nous n'étions pas capables de tester notre logiciel sur un nombre suffisant de photos", explique le docteur David Sinclair, l'un des fondateurs d'Imense.
 
La physique des particules à la rescousse de la recherche d'images sur le Net
 
Pour sortir de l'impasse, la société a fait appel au UK particle physics Grid, ou GridPP, un consortium de scientifiques spécialisés en physique des particules et d'informaticiens. Celui-ci a été conçu dans le but d'analyser les millions de données en provenance du plus récent accélérateur de particules européen, le Large Hadron Collider. "Notre équipe a aidé Imense pour que leur logiciel accède aux ressources de notre Grid, en utilisant une interface baptisée Ganga, explique le professeur Andy Parker, directeur du eScience Centre à l'université de Cambridge, et en l'assistant lors de ses tests sur plus de trois millions d'images". Le processus d'analyse d'images ressemble en effet beaucoup au procédé utilisé par les scientifiques du GridPP pour traiter les particules.
 
Un web dominé par l'image
 
Alors que les images et les vidéos représentent désormais plus des deux tiers du contenu disponible sur la Toile, un grand nombre d'entre elles reste inaccessible. Les moteurs de recherche traditionnels ne peuvent toujours pas indexer directement ces informations, et n'affichent que les contenus visuels reliés à un document ou ceux dont le propriétaire a inséré une balise image pour le référencement. Imense s'est attaqué à ce problème. Son dispositif permet d'analyser automatiquement les images selon leur contenu. Ce, sans recourir à aucune légende. Un logiciel de reconnaissance poussée du langage permet ensuite de faire correspondre la requête de l'internaute à un nombre important d'images. Intérêt de ce nouveau logiciel : permettre aux utilisateurs d'accéder à des contenus non indexés, comme c'est souvent le cas sur les réseaux sociaux comme MySpace.
 
Et il faut croire que la collaboration avec le GridPP a porté ses fruits : Imense bénéficie aujourd'hui d'un investissement de 500 000 livres pour lancer son dispositif sur le marché dans les mois à venir. La société souhaite même intégrer à son logiciel les technologies en open-source du Grid en matière de physique des particules.
 

Exemple de recherche d'images avec le logiciel Imense
(cliquez pour agrandir)

 

(Atelier groupe BNP Paribas – 07/08/2007)