Afin d'éviter que des pages pertinentes ne soient ignorées par les moteurs de recherche, Wiki-ES reformule la requête en la confrontant à des articles de Wikipedia.

Wikipedia vient enrichir les recherches en ligne

 

Pour augmenter la pertinence des systèmes de recherche d’information, dont les moteurs de recherche font partie, il faut sortir d’un modèle qui se limite aux mots clés pour intégrer des contenus dits “conceptuels”, affirment dans une étude trois chercheurs de l’université d’Aalto, en Finlande. Les scientifiques ont développé un système, baptisé Wiki-ES (pour “Wikipedia-based Evolutionary Semantics”) qui utilise les liens de l’encyclopédie en ligne pour affiner les résultats des requêtes effectuées sur Internet. En effet, habituellement, les premières pages qui apparaissent quand un utilisateur tape quelques mots clés dans un moteur de recherche contiennent nécessairement l’un de ces mots clés.

Intégrer les pages les plus pertinentes

Et celles qui abordent le même sujet avec autant voire plus de pertinence mais dans d’autres termes sont par conséquent ignorées. Pour remédier à ce problème, l’idée des chercheurs est d’intégrer aux systèmes de recherche d’information des algorithmes qui vont analyser la requête. Et proposer des extraits de documents tirés de la base de données de Wikipedia, censés correspondre au sujet abordé. Ce, pour mieux le redéfinir ensuite. Le système développé classe ainsi les documents en leur attribuant une valeur booléenne, ou binaire - la matrice les ordonne en deux catégories : pertinents ou non pertinents. A partir de ces données, de nouvelles requêtes sont ensuite générées.

Le savoir conceptuel de l’encyclopédie en ligne

Ces dernières élargissent la recherche initiale, en prenant en compte l’enrichissement apporté par les algorithmes Wiki-ES, c’est-à-dire en incluant certains concepts liés aux termes entrés par l’utilisateur. “L’intégration de ce savoir conceptuel dans le système de recherche permet de déterminer la pertinence d’un document en fonction du sens des mots et non simplement des mots en tant que tels”, expliquent les auteurs de l’étude. Ces derniers ont testé leur système, par rapport aux moteurs de recherche traditionnels. Et affirment dans leur étude qu’il augmente de plus de 60 % la précision et la pertinence des résultats.