Pour identifier avec précision les objets qui composent une vidéo, il faut pouvoir en délimiter les contours. Le but : faciliter le suivi d'objets en mouvement, améliorer les logiciels de réalité augmentée.

Le succès de la reconnaissance d'images passe par celle des contours

Identifier les contours d’un objet est une chose que notre oeil sait faire avec facilité. En regardant par la fenêtre par exemple, nous savons faire la distinction entre un immeuble, la rue, une voiture ou un lampadaire présents dans notre champ de vision. Pour un ordinateur, la tâche est loin d’être aussi facile. Dans ce but, deux chercheurs du MIT viennent de mettre au point un algorithme, qui serait 50 000 fois plus efficace que ses prédécesseurs, indiquent les scientifiques. Cette avancée technologique sera notamment utile pour résoudre les problématiques de suivi d’objet en mouvement, comme dans une vidéo, améliorer la qualité des logiciels de réalité augmentée ou dans un domaine plus médical, aider à mieux identifier l’évolution de la taille d’une tumeur au fil du temps.

Pas facile d’imiter la vision humaine

Pour Jason Chang, du département de Génie Electrique et d’Informatique du MIT et son Directeur John Fisher, chercheur au Laboratoire d’Intelligence artificielle (CSAIL) du MIT, l’idée était de se rapprocher au mieux de la vision humaine. "L’algorithme doit savoir segmenter les images comme nous le faisons", explique Jason Chang dans le communiqué. Ce n’est cependant pas une mince affaire. "Si vous demandez à 10 personnes de tracer les limites des objets dans une image numérique, vous obtiendrez dix réponses différentes", continue Jason Chang. Chaque personne segmente les images à sa manière. Pour obtenir une segmentation de qualité, la meilleure méthode s’appuie sur deux mesures. L’algorithme évalue en effet à la fois la simplicité du contour de l’objet et son contraste (différences de couleur). Il effectue plusieurs essais et les compare. L’essai qui a le meilleur score est le plus proche de la réalité.

Plus performant car moins précis

Jason Chang et John Fisher ne sont pas les seuls à travailler sur ce type de recherche de segmentation d’images. Beaucoup de méthodes concurrentes existent et sont même brevetées, à l’instar des laboratoires HP Labs à Palo Alto par exemple. Beaucoup se basent sur cette méthode de comparaison. Mais l’algorithme des deux chercheurs du MIT est intéressant par son approche : là où les autres cherchent à obtenir le résultat le plus précis possible, ce qui consomme un temps de calcul considérable, ce dernier recherche moins la précision. Selon le MIT, la méthode fournit un résultat cependant suffisant et permet ainsi d’être 50 000 fois plus efficace.