La panne d’un disque dur est toujours un événement angoissant. Elle prend aussi souvent un caractère initiatique : il y a ceux à qui s’est déjà arrivé et qui ont appris, souvent douloureusement, à se prémunir puis il y a les autres, les p’tits bleus qui n’ont toujours pas de sauvegarde de leurs données et croient encore aux miracles. Mais si elle est inéluctable, la panne d’un disque dur n’est pas imprévisible. Tous les disques du marché embarquent un système de surveillance interne, le SMART (Self-Monitoring, Analysis, and Reporting Technology) qui peut annoncer leur fin imminente. Les techniciens de BackBlaze, un service de sauvegarde en ligne montrent que certains indicateurs SMART sont particulièrement utiles.
BackBlaze analyse quotidiennement les données SMART de ses 40 000 disques hébergeant plus de 100 pétaoctets. Leurs statistiques sont en accès libre ici. Elles révèlent que certaines données SMART sont à peu près inutiles comme SMART 1, le nombre d’erreurs de lecture. Certes, un disque en parfaite santé ne fait pas d’erreur, mais le taux de panne n’est pas corrélé avec le nombre d’erreurs. La faute en incombe partiellement aux fabricants de disques durs qui ne rapportent pas le nombre d’erreurs de la même manière.
Au contraire, SMART 5, le nombre de secteurs réalloués est à observer avec attention : sa progression est directement liée à la probabilité d’une défaillance du disque.
Encore plus efficace, SMART 187, le nombre d’erreurs de lecture incorrigibles via les codes ECC. Dès que ce nombre est différent de zéro, la panne est proche et BackBlaze prévoit le remplacement du disque.
Si vous possédez un NAS ou avant de réutiliser un vieux disque dur trop petit ou trop lent dans une sauvegarde, jetez donc un oeil à son bilan SMART. De nombreux utilitaires y donnent accès, comme CrystalDiskInfo ou Speedfan.