Si les hashtag permettent de suivre un sujet, ils ne sont pas un filtre suffisant. Idem pour les listes. La solution serait dans la curation en temps réel de ces mêmes listes, basée sur le croisement de multiples critères.

Sur Twitter, pour suivre l'actualité, listes et hashtag ne suffisent pas

Pour simplifier le suivi de sujets particuliers sur Twitter, le site avait lancé en 2009 le principe des listes, qui consiste à regrouper des utilisateurs par thématiques, afin de ne voir que leurs messages dans la Timeline. Un système de filtre intéressant, mais qui n'est pas suffisant pour suivre une actualité en temps réel et de la manière la plus précise possible. En effet, souligne une étude* menée par une équipe de l'école de sciences informatiques de l'université de Dublin et la startup Storyful, les personnes d'une liste donnée ne vont pas forcément parler d'un sujet, même s'il fait partie de leurs thématiques habituelles. Et se référer uniquement à tous les messages utilisant un hashtag fait prendre le risque de se retrouver avec nombre de retweets et de messages inutiles. Du coup, les chercheurs ont mis au point un système capable de déterminer en temps réel les personnes les plus pertinentes sur un sujet d'actualité. Celui-ci part d'une petite base de personnes considérées comme référentes sur un sujet, et dont on peut être sûrs qu'elles parleront de toutes les actualités qui s'y rapportent.

Affiner

Le dispositif élargit ensuite sa cible parmi un panel de personnes proposées par le curateur qui souhaite affiner le suivi d'un sujet. Techniquement, le système consiste en plusieurs critères lancés lors de la sortie d'une actualité. Si un utilisateur combine plusieurs de ces caractéristiques, il est considéré comme fiable. Cela étant représenté de manière graphique. Pour réaliser cette sélection, le dispositif utilise des solutions de text mining et de recherche dans le contenu. Premier critère sélectionné : le contenu. Les informations sont obtenues en croisant plusieurs critères, comme les tweets les plus récents (des 50 aux 200 derniers) des personnes sélectionnées afin de créer ce qu'ils appellent un profil matrice, le nom des listes auxquelles les personnes sélectionnées appartiennent, ou les descriptions de listes.

Croiser les vecteurs

Deuxième critère : celui du réseau. Celui-ci consiste en l'obtention de données comme le type de suiveurs par personne, le type d'articles retweetés et mentionnés, et par qui. L'ensemble des vecteurs sont ensuite croisés pour obtenir une vision la plus fine possible des personnes selon un sujet. Le système a été expérimenté à l'occasion de la nomination, côté Républicain, du candidat aux élections présidentielles américaines de cette année. Au total, plus d'1,6 millions de tweets provenant de plus de 8 300 personnes ont été observés. Cela a permis de réaliser des recommandations de personnes par région, et par sujet. Et de constater que c'était véritablement le croisement de toutes ces données qui permettait d'obtenir un résultat fiable. Ne se baser que sur un ou deux critères ne proposant pas de résultat assez fin. 

* D. Greene, G. Sheridan, B. Smyth, P. Cunningham, Aggregating Content and Network Information to Curate Twitter User Lists (2012)