Les communautés sur les réseaux sociaux devenant de plus en plus importante pour les marketeurs, l'identification de celle-ci à grande échelle nécessiterait l'utilisation des données de liens faibles.

LabelRank déduit les communautés des réseaux en ligne à partir des liens faibles

Contrairement aux idées reçues, pour déterminer sur un réseau social vaste les individus appartenant à une même communauté, il serait nécessaire d'étudier plutôt les liens faibles que les liens forts. C'est ce qu'affirment en tout cas deux chercheurs - Boleslaw Szymanski et Jierui Xie - de l’institut polytechnique Rensselaer (New York), qui ont décidé d'étudier le fonctionnement des structures complexes, tels que les réseaux de communication, des réseaux génétiques mais aussi des réseaux en ligne. Ainsi, pour rappel, ce qu'on appelle liens sont en fait les relations que les différents individus entretiennent au sein d'un réseau, les liens forts faisant référence aux relations proches (familles, amis...), les liens faibles aux connaissances éloignées (amis d'amis, salariés d'une même entreprise). Et dans le cas de cette recherche, les chercheurs ont mis au point un algorithme, basé sur le principe de « propagation d’étiquettes » – données associées à un ensemble de données plus important - pour étayer leur propos.

Un algorithme adapté à l’analyse de big data

Ainsi, pour identifier à quelle communauté un individu appartient, l’algorithme utilise la liste des personnes qui ont le plus interagi avec ses proches. L’algorithme permet alors de détecter les nouvelles communautés issues de ces interactions. Pour simplifier, le Pr Szymanski prend l'exemple d’un élève qui suit les cours d’un professeur X, s’entraîne avec un coach Y et interagit avec sa mère Z. « Suivant le principe de propagation d’étiquettes les camarades de cet individu ont aussi des interactions avec X mais peuvent avoir un coach différent et ont une mère différente ». A la fin de l’algorithme, les camarades auront X dans leur liste, les coéquipiers auront leur entraîneur Y et les frères et sœurs de l’individu auront Z dans la leur. Chaque nœud – un nœud représentant un individu, qui fait partie de la liste de l’individu appartient alors à la même communauté.

Le chevauchement de communautés également détecté

Parmi les spécificités de cet algorithme on retrouve également la possibilité de détecter le chevauchement des communautés, car en effet chaque individu peut appartenir à plusieurs groupes. Les interactions réalisées sur les réseaux en ligne peuvent être représentées par des particules se diffusant aléatoirement. Chacune de ces particules porte en soi la liste de personnes reliées à un nœud et à la possibilité de s'installer dans un autre nœud. En s’installant dans plusieurs nœuds déjà reliés entre eux, la particule révélera alors une nouvelle communauté. En tout cas, cet algorithme s'adresse directement aux marketeurs qui de plus en plus souhaitent améliorer leur ciblage de clientèle potentielle par l’étude des comportements et l’exploitation des préférences des utilisateurs. En effet, ceux-ci se retrouvant bloqués par l’émergence des réseaux sociaux de grande échelle, à l’instar de Facebook qui connecte à présent plus d’un milliard d’utilisateurs entre eux, celui-ci pourra ainsi simplifier leurs stratégies.