Pour optimiser la gestion de ses données clients, une solution consiste à recourir à un modèle de classification des informations intégrant à l'analyse comportementale toutes les données non-étiquetées.

Exploiter les données non-structurées pour améliorer la relation client

Dans le monde du commerce et de la relation client, il existe un ratio bien connu : 20% des clients génèrent 80% des profits. Et augmenter de seulement cinq points la fidélisation peut entraîner une croissance allant jusqu’à 95% des gains d’une société ! Autant dire que bien gérer ses données clients est stratégique. C’est ce sur quoi ont travaillé deux chercheurs iraniens des universités Azad et Alzahra à Téhéran : ils ont mis au point un algorithme permettant de tenir compte dans l’analyse d’informations non étiquetées et d’affiner ainsi les tendances et les modèles de prédiction, en vue d’un usage marketing. Ils ont présenté un modèle d’analyse des données et de comportements clients dans Advances in Information Sciences and Service Sciences.

Des classificateurs de données étiquetées ou non

Le principe de départ consiste à constituer un premier classificateur de données étiquetées (un classificateur étant en grammaire un outil de catégorisation d’un mot). L’algorithme va ensuite s’en servir pour traiter les données non étiquetées, puis créer un nouveau classificateur, mis à jour en quelque sorte, où seront intégrées les données de départ et celles qui ont été nouvellement étiquetées. Ce nouveau classificateur sera le nouveau point de départ pour analyser et étiqueter des données non-étiquetées supplémentaires, constituant encore un classificateur amélioré, et ainsi de suite. C’est un modèle par apprentissage semi-automatisé. Après le tout premier classificateur, le système apprend tout seul.

Affiner la connaissance des clients

Testé avec un logiciel d’extraction et d’analyse de données en open source, Rapid Miner 5.1, ce modèle mène à un meilleur classement des données, plus complet. Surtout, il en découle une meilleure utilisation des informations. C’est un moyen de connaître encore plus finement les clients, leurs comportements de consommation, d’identifier ceux qui comptent le plus pour l’activité marchande de la société. Un tel algorithme semble particulièrement adapté à l’univers numérique actuel, surchargé de données non structurées en raison d’une multiplicité de canaux de communication, aux contenus qui plus est informels (réseaux sociaux, mobiles, Web).