Le réseau d'un créateur de contenu n'explique pas seul la reprise du contenu qu'il crée. Une autre force - la proximité sémantique - est également à l'oeuvre.

Deux blogs dont les contenus sont très semblables se citeront dix fois plus que deux publications dont la production est moyennement similaire, et cent fois plus qu'un binôme dont les textes sont très dissemblables. Ce ne sont donc pas les liens tissés par leurs auteurs qui expliquent seuls la diffusion de l'information dans la blogosphère. Voilà la conclusion à laquelle sont arrivés deux chercheurs français, Jean-Philippe Cointet et Camille Roth (*).
Une dimension sociale déterminante
Pour y arriver, ils ont analysé la production - plus de 70 000 posts - de plus de mille blogs. Ceux-ci avaient tous comme caractéristiques d'être nord-américains et focalisés sur la campagne présidentielle de 2008 aux USA. "Une analyse de sites français a donné le même résultat", précise Jean-Philippe Cointet à L'Atelier. Leurs travaux tendent à prouver que les deux forces sont à l'œuvre, mais une d'entre elles domine t-elle ? "Apparemment, la dimension sociale est plus déterminante, mais on ne sait pas si c'est un artefact de nos méthodes de mesure".
Privilégier les sites qui font le pont entre deux communautés
Leur étude, "Socio-semantic dynamics in a blog network", apporte d'autres éclairages. Un, assez classique : les blogs avec une forte audience mènent à une plus forte reprise de l'information (cascade informationnelle) d'autres sites. Le deuxième est plus original : "les sites en situation de pont entre deux communautés distantes ont un rôle déterminant sur la longévité de la cascade", affirme Jean-Philippe Cointet. Et ce, sans que ces sites soient forcement des stars de la blogosphère en terme de nombre de visiteurs.
(*)Jean-Philippe Cointet est chercheur au CREA & INRA SenS, et Camille Roth chercheur au centre d'analyse et de mathématique sociales CAMS-EHESS