Les membres du site de micro-blogging ont tendance à utiliser massivement les expressions langagières propres à leur région. Notamment parce que le site encourage un ton informel et conversationnel.

L'interconnectivité ne tend pas à homogénéiser la langue. Voilà ce que rappelle une équipe de l'école en sciences informatiques de Carnegie Mellon. Les chercheurs se sont penchés sur les messages envoyés sur Twitter par les internautes américains. Résultat : le langage familier et le dialecte propres à une région se retrouvent également dans les tweets. Cela, plus que sur des blogs et autres lieux d'échange virtuels. La raison en est simple : sur ces derniers, les internautes ont tendance à adopter un langage formel et homogénéisé pour être accessible au plus grand nombre. Alors que les tweets sont souvent rédigés dans un style informel et conversationnel, sur le type de l'échange en face à face.

Des réseaux focalisés sur l'intérêt ou la région

Autre chose : sur les réseaux sociaux, les individus ont tendance à s'adresser à des pairs qui soit résident dans la même zone géographique, soit qui partagent des intérêts communs. Ce qui encourage l'utilisation d'un vocabulaire spécifique à une communauté. Pour confirmer leur postulat, les scientifiques ont collecté sur une semaine près de 400 000 messages, en mars 2010. Ces tweets ayant été rédigés par une base d'environ 10 000 personnes utilisant la localisation de ses posts et publiant au moins vingt messages par semaine. Dans le détail, les chercheurs notent que certaines expressions régionales bien connues se retrouvent sur la plate-forme de micro-blogging.

Etudier les modifications de la langue

Mais pas uniquement : celle-ci, disent-ils, est aussi le moyen idéal d'étudier de nouveaux usages de la langue au fur et à mesure où ils se développent. Et de citer l'exemple de l'utilisation du terme "koo" pour signifier "cool" en Californie du nord, quand la Californie du sud aura plutôt tendance à dire "coo". Ces spécificités, selon eux, permettent d'identifier la région de provenance de l'internaute avec une marge d'erreur de 300 miles. Cela, sans se référer aux indications potentiellement laissées par une personne sur sa localisation. Enfin, elles donnent la possibilité pour les linguistes d'étudier les évolutions de la langue en temps réel. "Est-ce que l'utilisation de 'suttin' pour 'something' à New York restera le mot le plus utilisé à New York ou est-ce que cette habitude va se diluer ?", conclut ainsi Jacob Eisenstein, qui a participé au projet.