Le MIT propose de perfectionner la sauvegarde de copies de pages Web, en ajoutant une couche intermédiaire. Celle-ci veille à ce que les données soient toutes transmises simultanément.

Pour être efficaces, les systèmes “en cache” doivent être cohérents

Le système de sauvegarde “en cache” de pages Internet est indispensable pour assurer la continuité de la navigation, et s'avère particulièrement utile pour le fonctionnement des applications Web. Problème : il arrive que les données stockées soient séparées au moment de l’enregistrement des copies en cache. Pour palier ce défaut, des chercheurs du MIT proposent un système qui veille à rassembler l’ensemble des informations relatives à une page Web de façon homogène, pour transmettre ce paquet de données en une seule fois, sans risque de perdition. Baptisé “TxCache”, le système consiste en une couche applicative intermédiaire.

Des mises à jour régulières

Elle permet de vérifier, au moment du transfert des informations à l’application, que l’ensemble des données est bien envoyé. L’objectif principal : éviter des dysfonctionnements, où certaines informations seraient mise à jour sur la page, et pas d’autres, par exemple. Ce qui aurait pour conséquence de troubler l'internaute. Le programme mis au point compare en fait les données en fonction que celles-ci proviennent des serveurs où elles sont stockées “en cache” ou qu’elles appartiennent à la base de données du site. A intervalle régulier, le système met ainsi à jour les données sauvegardées.

Augmenter la rapidité tout en garantissant la fiabilité

Et ne transmet celles-ci à l’application qu’en paquets homogènes, où l’ensemble des informations est cohérent à un instant T, celui de la dernière mise à jour effectuée. En d’autres termes, le système effectue ce que les scientifiques appellent des “transactions”. “Le problème avec des services comme Bing, Amazon, Google, etc. c’est qu’ils fonctionnent avec un grand degré de scalabilité”, expliquent les chercheurs. Avant d’ajouter : “pour une seule requête, il y a de nombreuses applications impliquées en temps réel, qui font chacune appel à des serveurs différents”.