Qui à part un être humain peut véritablement instruire ? L'université Paris Diderot a mis au point un système qui permet à un ordinateur de comprendre les règles d'un jeu simplement en regardant une personne y jouer.

"Le meilleur moyen d'apprendre est de voir quelqu'un agir et de répéter ses actions". Voici
comment Lukasz Kaiser, chargé de recherches en automates et en applications à l'Université
Paris Diderot
explique la finalité du logiciel qu'il vient de créer. Celui-ci permet en effet à un
ordinateur, à partir de vidéos d'individus en train de jouer à des jeux de société, d'apprendre
les règles du jeu et ainsi de battre l'humain. Bien sûr, l'apprentissage des ordinateurs
intelligents par les jeux n'est pas une nouveauté. Mais le système est intéressant par sa
capacité d'apprendre en observant, même des règles complexes. De plus, à la différence
d'essais précédents qui ne peuvent analyser qu'un seul jeu à la fois à partir de données
visuelles, l'ordinateur peut analyser n'importe quelles données et cela, sans informations sur le
jeu pré-installé.

Structures relationnelles et logiques mathématiques

Pour cela, Lukasz Kaiser a mis au point un algorithme qui s'appuie sur deux caractéristiques
encore peu exploitées. La première est de représenter l'état du système en s'appuyant sur des structures relationnelles et non des formules mathématiques. Ce qui a permis de réduire le nombre d'informations nécessitant d'être pré-installées et fait en sorte que le système de vision puisse ainsi reconnaître les rangées, les colonnes, les relations diagonales et les pièces du jeu. La seconde variable est que le chercheur s'est appuyé non pas sur une seule mais plusieurs logiques mathématiques. Ces deux caractéristiques ont permis au chercheur de mettre en place un système qui apprend les règles d'un jeu à partir de vidéos intuitives de moins de deux minutes de celui-ci. Combiné à un programme de jeu simple, l'algorithme a ainsi pu être utilisé de manière compétitive.

Des vidéos et une avancée pour la robotique

Résulta, il ne suffit que de quatre vidéos pour que l'ordinateur puisse apprendre entièrement
les règles et puisse les réutiliser. La première représentait un premier joueur gagnant et la
seconde, un second joueur gagnant. Pour la troisième personne ne gagnait, soit suite à une
égalité soit lors d'une partie interrompue, et enfin une quatrième présentant un non-respect des règles de jeu. Pour Lukasz Kaiser "l'intérêt est qu'un tel apprentissage de la machine pourra être exploité dans différents domaines". "En particulier, dans la robotique, où cela permettra au robot d'évaluer les distances et de comprendre où se placent les éléments qui l'entourent et son environnement", explique-t-il. Mais pas seulement, selon le chercheur, ces données sont également exploitables pour tout ce qui est de l'exploration de données et de « pattern learning »