Comment fonctionne la déduplication et quel est l’impact sur le stockage et la bande passante ?

Les principes de déduplication native en mode CDC de Cybee

Restic découpe les données en blocs de taille variable (content-defined chunking). Chaque bloc est identifié par son empreinte cryptographique (SHA-256). Avant tout transfert, Cybee compare les empreintes des nouveaux blocs avec ceux déjà présents dans le dépôt S3. Seuls les blocs véritablement nouveaux sont transférés et stockés.

En pratique, les gains observés sont significatifs : jusqu’à 70 % d’économie d’espace selon les environnements, avec une réduction équivalente de la bande passante après la première sauvegarde complète. Cela permet d’exécuter des sauvegardes plusieurs fois par jour sans impact réseau majeur.

La déduplication opère au niveau multi-sources : un fichier identique présent sur plusieurs serveurs différents n’est stocké qu’une seule fois dans le même dépôt.