Il serait possible de localiser des personnes sur les réseaux sociaux sans que leurs données géographiques soient publiques. Un modèle analyse pour cela les échanges entre utilisateurs.

Sur Twitter, les interactions suffisent à la localisation

 

Facebook, Google Lattitude, Gowalla, Foursquare… Autant d’outils qui permettent de géolocaliser l’utilisateur et de récupérer des données précieuse dans un but marketing. Encore faut-il que les fonctions adhoc soient activées. Quoique…  Trois chercheurs du département d’informatique de l’université de Rochester, dans l’Etat de New York, ont mis au point un modèle de probabilité permettant de situer sur une carte un utilisateur de Twitter dont les données géographique ne sont pas disponibles. Leur méthode ? Analyser les interactions avec leurs "followers" et la localisation de ces derniers. L’article des trois auteurs, "Finding your friends and following them to where you are", détaille deux expériences menées sur le site de microblogging et analyse des tweets émis pendant un mois entre mai et juin 2010 depuis deux zones, l’une de 150 kilomètres autour du centre de Los Angeles et une autre couvrant 100 kilomètres autour du centre de New York. Au total, 1,2 millions de twittos pour 26 millions de messages.

Une localisation exacte à 85%

Un autre pan de l’étude fait le chemin inverse : à partir de la localisation publique d’un utilisateur, découvrir avec qui il échange sur Twitter. Pourquoi Twitter ? Parce qu’avec la contrainte d’écrire en 140 signes maximum, les utilisateurs sont amenés à poster, donc à échanger, plus souvent. Les chercheurs ont bâti un système algorithmique appelé FLAP (Friendship + Location Analysis and Prediction). Il collecte les données issues des tweets, notamment les noms des utilisateurs, la régularité des messages, les moments où ils sont postés, et part du principe que des personnes qui se suivent sur un média social se rencontrent dans le monde physique. Le système est lié à une interface Google Maps servant à visualiser les prédictions de localisation. Selon cette méthode, les chercheurs de Rochester ont réussi à localiser 85% des personnes avec une précision de 100 mètres de rayon, pas en temps réel mais quand même dans un intervalle de temps de 20 minutes. Quant à déduire qui sont les followers, les prédictions du système se sont révélées exactes à 90%.

Contextualisation marketing

Cette expérience ne vaut évidemment pas seulement pour sa performance. Elle montre que même si nous prenons toutes les précautions pour limiter nos informations publiques, il est possible de contourner les paramétrages, en toute légalité, juste par l’analyse des relations sociales qui en disent autant sinon plus sur une personne que les données publiées volontairement. Ce qui signifie qu’avec des outils adéquats, les professionnels du marketing, de la publicité, de la relation client, peuvent cibler et contextualiser leurs actions auprès de consommateurs et prospects en collectant des données a priori limitées. Il faudra cependant des outils qui croisent plusieurs données au sein de plusieurs interactions pour trouver la localisation d’une personne, et sur un mode prédictif, c’est-à-dire avec une marge d’erreur (même si celle-ci est faible). Ce qui peut être un peu plus lourd à mettre en place que la simple collecte d’une donnée publique.