En analysant les résultats de recherche personnalisés de services web, il est possible de reconstituer les informations collectées par ces derniers sur leurs utilisateurs.

Le ciblage de son profil par les moteurs se comprend aisément

Vous aimeriez savoir ce que Bing, Google ou Yahoo savent de vous ? Deux chercheurs de l’université de Bangalore, en Inde, ont peut-être trouvé la solution. Ils sont d’abord partis du constat que la plupart des moteurs de recherche proposent des résultats personnalisés à leurs utilisateurs (des publicités, mais pas seulement). Leur idée est simple : puisque le profil établi par ces services web est à l’origine de cette personnalisation, il suffit de remonter le fil pour y accéder. Autrement dit, en analysant les résultats personnalisés fournis par les moteurs de recherche, il devient possible de reconstituer peu à peu les fameuses données utilisateurs récoltées par eux. Pour y parvenir, les chercheurs ont récupérés l’historique web de dix utilisateurs de Google.

30 % des recherches donnent lieu à une personnalisation

C’est en effet à partir de l’historique des internautes que l’entreprise de Mountain View établit ces profils. Les chercheurs ont considéré les résultats de recherche comme des "boîtes noires", selon leurs propres termes. En comparant les résultats de ces dix utilisateurs identifiés et ceux d’un internaute "témoin" (ne présentant aucune information personnelle et à l’historique vierge), les chercheurs ont pu identifier les différences dans les résultats proposés par Google. D’après eux, environ 30 % des recherches donnent lieu à une personnalisation. Mieux, l’algorithme qu’ils ont créé parvient à reconstituer sommairement le profil utilisateur des internautes concernés.

Un prototype en cours d’élaboration

Par exemple, pour une recherche donnée, leur système est capable d’identifier les sujets ayant donné lieu à une personnalisation avec une probabilité de plus de 80 %. Mis bout à bout, cela permet d’établir la liste des centres d’intérêt de l’internaute tels qu’identifiés par le moteur de recherche. A terme, les chercheurs espèrent aller plus loin. "L’outil pourrait être utilisé pour reconstituer la personnalisation qui se produit sur des recherches sensibles (financières, médicales…)", écrivent les deux chercheurs. Les chercheurs pensent pouvoir utiliser ces informations pour créer un outil permettant aux internautes de conserver un meilleur contrôle sur leur profil utilisateur, et donc sur leur vie privée. Ils travaillent en ce moment-même sur un prototype.