En associant un système de reconnaissance optique des caractères, un correcteur orthographique et une connexion Internet pour analyser le sens des mots, un robot peut lire et comprendre les inscriptions des panneaux urbains.

Quand la lecture se met à la portée des robots

Il ne suffit pas qu'un robot reconnaisse des éléments de l'environnement dans lequel il se trouve pour se déplacer plus aisément dans un endroit inconnu. Il doit aussi être capable de déchiffrer des informations écrites, estiment des chercheurs du Département of Engineering Science de l'université d'Oxford. Ils ont développé un logiciel associé à une caméra qui permet à des robots de décrypter des inscriptions signalétiques et textuelles. "Le but est de leur permettre d'estimer la pertinence de l'endroit où ils se trouvent et des lieux avoisinants par rapport aux actions qu'ils doivent effectuer", soulignent les responsables du projet. Ces derniers ont dans un premier temps intégré un procédé de reconnaissance optique de caractères (OCR), dit de vidéocodage. Il transforme des images de textes imprimés ou dactylographiés en fichiers texte.

Le système repère des zones textuelles

Car "la compréhension des mots affichés dans l'environnement urbain dépend du contraste entre le texte et son fond, de la taille des caractères, de leur alignement horizontal et vertical ou encore de la quantité", expliquent-ils. A cela s'ajoutent un dictionnaire et un correcteur orthographique. Cela permet au dispositif de récupérer certains des mots mal orthographiés ou se débarrasse de ceux considérés comme tronqués. Autre point important : pour comprendre le sens des mots, c'est en direction d'Internet que les chercheurs se sont tournés. Connecté à la Toile en Wi-Fi ou en 3G, le logiciel analyse le nombre de fois où un mot apparaît sur les façades des rues, comme le nom d'un restaurant, d'une pharmacie ou d'une banque.

Une connexion Internet permet d'analyser le sens des termes

Il effectue ensuite des recherches sur le web pour voir s'ils font référence à un type d'enseigne en particulier. Si tel est le cas, le type de boutique est confronté à une base de données connues de la machine, qui pourra alors comprendre de quoi il s'agit et si cela peut la servir. Dans le cadre de leur recherche, les scientifiques ont doté un robot connecté en 3G du système et l'ont confronté à la lecture de 300 images comprenant un total de presque 4 000 mots enregistrés avec une caméra.  Résultat : si la quantité de texte perçue par le robot varie selon les endroits, la luminosité ou l'angle "cette dernière a été généralement suffisante pour définir le sens des inscriptions". A noter que le projet a été présenté lors de l'International Conference on Intelligent Robots and Systems de Taiwan.