Les méthodes de prédictions de liens dans les plates-formes collaboratives utilisées aujourd’hui ne seraient pas encore suffisamment performantes. Notamment parce qu'elles auraient du mal à s'adapter aux réseaux très larges.

Prédire l’évolution de la structure des réseaux sociaux serait plus dur que prévu

Un réseau social, du point de vue des chercheurs spécialisés dans son analyse, est un graphe dont les nœuds sont des individus interconnectés par des liens sociaux. Ces réseaux étant dynamiques, certains laboratoires s’intéressent à ce qu’ils appellent la prédiction de liens : quelle est la probabilité d’avoir un lien entre deux noeuds à un instant t, ou quelle est la probabilité que deux noeuds n’aient plus de liens à un autre instant ? Par exemple, l’idée est de tenter de prédire si deux personnes qui ne collaborent pas mais qui ont dans leurs relations un collaborateur commun, vont être amenées à collaborer dans le futur. Objectif de ces recherches : mieux prédire l’évolution de la structure du réseau social lui-même. Mais selon un article de chercheurs de l’Université de Beihang publié ce mois-ci, les performances des modèles appliqués seraient surestimées, notamment parce que ces derniers auraient des difficultés à s’adapter aux réseaux très larges, comme Facebook, qui contient aujourd’hui plus de 600 millions d’utilisateurs (et donc de noeuds). 

 

La réalité n’est pas aussi performante que prévu

 
Selon leur article, "il est difficile dans ce cas d’obtenir une représentation complète et riche du réseau. Beaucoup de liens ne sont pas pris en compte dans cette modélisation", indiquent les chercheurs. Les résultats seraient déformés parce que les méthodes utilisées ne s’attacheraient qu’à la partie la plus dense du réseau social, et occulteraient les autres parties. Ils ne seraient donc pas représentatifs, et la prédiction des liens inégale selon les réseaux. Cependant, cette prédiction est un challenge car elle doit tenir compte de nombreux paramètres (échanges de messages, co-signatures de publications, appartenance à une même famille...). 
 

S’appuyer sur le réel pour évaluer la performance des modèles

 
Pour arriver à leur conclusion, les chercheurs chinois ont en fait réévalué la performance des mesures de prédiction en s’appuyant sur des échantillonnages basés sur neuf réseaux sociaux réels : Netscience, textttPower, USAir, Yeast, Dimes, Pb, Caltech, Email, Hepph. Des données topologiques sur ces réseaux réels sont connues et ont permis aux chercheurs de les intégrer aux méthodes habituelles. Selon l’article, les performances des méthodes de prédictions de liens seraient surestimées. Si l’article critique donc les méthodes actuelles, il ne donne néanmoins aucune piste pour les améliorer. Il semblerait que de nombreux laboratoires de recherche soient cependant en train de plancher depuis plusieurs années sur de nouveaux algorithmes hybrides combinant approches topologiques avec les scores d’un lien, ses caractéristiques, en fonction du temps.