Introduction
En matière de stockage, les produits utilisés dépendent principalement du profil de l’utilisateur : les amateurs de performances préfèrent les SSD alors que ceux pour qui la capacité prime ne jurent que par les disques durs, pour autant qu’ils offrent un bon rapport volume/prix, qu’ils soient suffisamment rapides, silencieux et économes ; ces deux critères revêtent par contre souvent une importance secondaire dans les serveurs d’entreprises, où les éléments les plus critiques sont généralement la fiabilité et la stabilité des performances.
SSD ou disque dur ?
Plus le temps passe, et plus on entend que les SSD représentent l’avenir du stockage, comme si les disques durs pouvaient d’ores et déjà être relégués au musée de l’informatique. Certes, les SSD offrent des performances en E/S que seules les grappes RAID de disques durs sont capables d’atteindre et des débits qui ne font qu’augmenter (et déjà jusqu’à trois fois supérieurs à ceux des disques durs à l’heure actuelle), mais en termes de fiabilité, de capacité de stockage ou de rapport consommation/capacité, ils sont encore loin de pouvoir rivaliser avec leurs aînés.
En règle générale, les SSD actuels ont une capacité limitée à 256 Go ; les modèles offrant plus sont relativement rares et surtout nettement plus onéreux. Il est pour l’instant impensable d’utiliser ce type de supports pour créer une grappe de stockage servant d’archive ou de sauvegarde réseau (ce qui nécessite souvent plusieurs téraoctets) : leur capacité est trop faible et leur coût bien trop élevé par rapport aux disques durs. Enfin, personne ne peut encore affirmer avec certitude si les SSD sont aussi fiables qu’une grappe de disques durs.
Conclusion : les SSD sont des produits parfaitement adaptés à certains scénarios, mais uniquement si ceux-ci nécessitent des performances élevées et pour autant que vous prévoyiez une certaine redondance.
3,5″ ou 2,5″ ?
Nous avons déjà abordé dans le détail la question du format, le stockage professionnel étant rapidement en train d’abandonner le 3,5 pouces au profit du 2,5 pouces. Cette transition résulte essentiellement d’une amélioration des rapports performances/consommation/capacité par rapport au volume physique occupé dans les racks : un module 1U peut en effet accueillir 12 disques durs 2,5″ contre seulement 4 disques durs 3,5″.
Les modèles 3,5 pouces ne sont toutefois pas prêts de disparaître, dans la mesure où ce sont eux qui offrent les capacités les plus élevées à l’unité. À l’heure où nous publions cet article, un disque dur 3,5″ peut contenir jusqu’à 3 To, et des modèles 4 To sont prévus pour la fin de l’année.
SAS ou SATA ?
Il nous reste donc à passer en revue les interfaces disponibles. Auparavant, il y avait d’une part l’IDE (Integrated Drive Electronics) pour le grand public et le SCSI pour les professionnels, deux interfaces parallèles assez différentes : si la première permettait de connecter deux disques (durs ou optiques) par port, la seconde faisait appel à un protocole plus complexe et permettait de connecter non seulement les disques durs professionnels, mais également d’autres périphériques comme des scanners par exemple. L’IDE a depuis été remplacé par le SATA (Serial ATA), une interface série autorisant la connexion d’autant de lecteurs qu’il y a de ports.
Aujourd’hui, par contre, la ligne qui sépare le monde professionnel de celui du grand public n’est plus uniquement définie par l’interface. Le SCSI a été remplacé par le SAS (Serial Attached SCSI), qui fonctionne en mode série comme le SATA, mais offre, tant sur le plan de l’infrastructure que des lecteurs proprement dits, un certain nombre de fonctions qui ont un intérêt stratégique pour les environnements professionnels, à commencer par la prise en charge des disques SATA sur les contrôleurs SAS.
Il est donc possible de déployer des disques durs grand public dans des grandes grappes de stockage professionnelles ; pour autant que le scénario d’utilisation s’y prête, l’intérêt de la manœuvre peut être d’ordre économique, mais également résider dans la capacité supérieure de ces modèles (au prix toutefois de performances réduites). Sachant que l’interface SAS offre une telle flexibilité, quels disques durs vaut-il mieux choisir : SAS ou SATA ?
Le SATA en détails
Extérieurement, un disque dur SAS ne se différencie d’un modèle SATA que sur un seul point : le SAS possède un connecteur données+alimentation unique, alors que les deux sont séparés sur le SATA. Il est donc possible de brancher des câbles SAS sur du matériel SATA, mais non l’inverse.
Bien que le SATA soit basé sur le protocole ATA, il ne fait plus la différence entre disque maître et disque esclave, au contraire de son ancêtre l’IDE. En SATA, c’est très simple : il suffit de brancher les deux câbles pour que tout fonctionne. Tous les PC vendus actuels sont équipés de deux, quatre, voire six ports SATA ou plus permettant d’utiliser indifféremment disques durs, SSD ou lecteurs optiques.
Le SATA première génération offrait une bande passante de 1,5 Gbit/s, qui a rapidement été doublée (3,0 Gbit/s) avec la deuxième génération, puis quadruplée avec le tout récent SATA 6 Gbit/s, souvent appelé à tort SATA 3.0. En raison de l’encodage sur 10 bits (8 bits de données et 2 bits de vérification de la parité), cela nous donne des débits théoriques de 150, 300 et 600 Mo/s respectivement. En pratique, on se retrouve souvent jusqu’à 15 % en dessous de ces chiffres, mais il faut savoir qu’en règle générale, c’est le disque dur proprement dit, et non l’interface, qui constitue le goulot d’étranglement.
Le SATA prévoit un certain nombre de fonctions optionnelles pouvant ou non être prises en charge par le lecteur :
- NCQ – Native Command Queuing
Le NCQ doit être pris en charge par le disque, le contrôleur et le pilote. Il permet au disque de réorganiser les commandes en attente afin de les exécuter de la manière la plus efficace possible. Cette fonction est particulièrement importante pour les disques, qui possèdent des plateaux rotatifs et doivent par conséquent tout faire pour minimiser le mouvement des têtes de lecture/écriture. Le SATA autorise une « profondeur de file » pouvant atteindre 32 commandes ; s’il est rare d’avoir plus de 8 commandes simultanées sur un ordinateur de bureau, il est assez fréquent d’en avoir entre 16 et 32 sur un serveur. - Hotswap
Les disques sont remplaçables à la volée, sans devoir éteindre le système hôte. - Démarrage décalé
Gérée par le contrôleur SATA, cette fonction permet de lancer les disques les uns après les autres, avec un petit temps mort entre deux, afin d’éviter les pointes de consommation électrique. Cela peut sembler trivial dans les petites structures, mais cette fonction devient vite essentielle dans les centres de données contenant plusieurs dizaines, voire centaines de disques durs. - Multiplication des ports
Il est possible de partager une même liaison SATA entre plusieurs lecteurs au moyen de multiplicateurs de ports. Cette fonction doit toutefois être prise en charge par le contrôleur. - eSATA
Il est enfin possible de brancher des périphériques SATA externes via le ou les ports eSATA, ce qui peut s’avérer intéressant pour les petites entreprises. Notons que cette configuration nécessite des câbles spéciaux fonctionnant à une tension plus élevée.
La norme SATA prévoit une compatibilité ascendante et descendante.
Les avantages supplémentaires du SAS
La norme SAS (Serial Attached SCSI) trouve ses origines dans le protocole SCSI, mais repose sur une interface sérielle de point à point plutôt que sur un bus parallèle. Elle ne se limite par ailleurs pas à la gestion des périphériques de stockage, mais permet au contraire de créer des infrastructures de stockage complètes, appelées domaines de stockage. Dans un domaine de stockage, les connexions SAS peuvent être regroupées et distribuées à l’instar des connexions Ethernet, via des commutateurs nommés « expandeurs ».
Ces expandeurs fonctionnent avec des câbles SAS et peuvent gérer jusqu’à 128 périphériques SAS, lesquels peuvent être d’autres expandeurs. Il est donc possible de créer des domaines de stockage SAS comportant 16 384 périphériques (128 x 128).
L’un des grandes avantages du SAS réside dans le fait que la bande passante (300 ou 600 Mo/s selon qu’il s’agisse de SAS 1.0 ou 2.0) est dédiée à chaque périphérique, alors qu’elle était partagée en SCSI (160 ou 320 Mo/s pour l’ensemble des périphériques connectés au bus). Le SAS fonctionne par ailleurs en mode Full Duplex, ce qui signifie que la bande passante en question est disponible dans chacun des deux sens. La norme prend également en charge deux ports par périphérique, ce qui permet soit de bénéficier d’encore plus de bande passante, soit de mettre en place un mécanisme de redondance ; mieux encore, il est possible dans ce cadre de connecter un même lecteur à deux systèmes différents (par exemple un serveur primaire et un serveur de secours).
La norme SAS accepte plusieurs types de câbles et connecteurs, toujours au format SFF, et la plupart contiennent plusieurs liaisons à la fois (généralement quatre). Il est donc possible de relier un système hôte à une cible quelconque, par exemple une grappe RAID, et de faire en sorte que chaque disque de la grappe bénéficie de sa propre liaison SAS sans pour autant multiplier les câbles. Fiabilité et polyvalence : ce sont ces deux éléments qui font la force du SAS en entreprise. Le nombre total de ports dépend du contrôleur, mais comme il suffit d’ajouter des expandeurs pour multiplier les périphériques connectables, une infrastructure SAS peut très bien se contenter d’un seul et unique contrôleur !
Le SAS gère l’ensemble des fonctionnalités du SATA, mais également trois protocoles différents :
- Le SSP (Serial Attached SCSI Protocol) pour la communication avec les périphériques
- Le STP (SATA Tunneling Protocol) pour la gestion des disques SATA sur infrastructure SAS
- Le SMP (SAS Management Protocol) pour la gestion des expandeurs, dans les grandes infrastructures
Le matériel SAS le plus puissant, comme le commutateur LSI SAS6110 par exemple, permet de créer des infrastructures extrêmement polyvalentes. Les appareils de ce type autorisent ainsi la connexion d’un très grand nombre de disques en RAID (aux fins d’optimisation des performances ou de la redondance), mais également l’utilisation dans un même domaine d’hôtes et de cibles SAS très différentes, allant des simples disques aux boîtiers complets, ce qui réduit considérablement les problèmes de maintenance et offre une flexibilité hors du commun. À titre d’information, il convient de faire la distinction entre les multiplicateurs de ports SAS et les domaines SAS, ces derniers faisant reposer les fonctions nécessitant de la bande passante (découverte et routage des périphériques) sur les périphériques eux-mêmes plutôt que sur le contrôleur, ce qui réduit les besoins en bande passante.
Pour des raisons de robustesse, le SAS a besoin d’une tension plus élevée que le SATA (1600 mV au lieu de 900 mV maximum). Enfin, la fonction NCQ du SATA est remplacée par le TCQ (Tagged Command Queuing), dont la profondeur de file n’est pas limitée à 32 commandes et qui autorise la réorganisation des commandes par le contrôleur afin de donner la priorité à certaines plutôt qu’à d’autres.
Disque SATA : Toshiba MK2002TSKB (2 To)
Disponible en version 1 et 2 To, ce disque dur SATA affiche une vitesse de rotation de 7200 tr/min et possède un cache de 64 Mo. À première vue, rien ne le distingue donc d’un modèle grand public, et pourtant, il coûte deux fois plus cher.
Ce surcoût n’est pas sans raison : le ML2002TSKB est en effet validé pour un fonctionnement en continu (24h/7j) et prend en charge la technologie Enhanced Power Condition State de Toshiba, qui lui permet de réguler sa consommation en faisant varier la fréquence de son contrôleur ou en éteignant son moteur de rotation. Toshiba annonce une consommation minimale de 7 watts au repos, ce que nous avons effectivement vérifié lors de nos tests.
Ce disque dur propose un coût par gigaoctet nettement inférieur aux modèles professionnels à vitesse de rotation plus élevée. Si le scénario d’utilisation prévu implique la conservation de données à long terme et met plus l’accent sur la capacité que sur les performances, il peut constituer une possibilité tout à fait viable.
Son interface SATA le qualifie pour les applications de « stockage de proximité », où les performances doivent être bonnes, mais où les principaux critères sont la fiabilité et la capacité de stockage.
Disque SAS : Toshiba MK2001TSKB (2 To)
Notre deuxième candidat ressemble furieusement au premier, à ceci près qu’il possède une interface SAS et un firmware différent. Le matériel est identique à l’exception du cache, qui descend à 16 Mo. La vitesse de rotation reste de 7200 tr/min et les capacités disponibles sont toujours de 1 et 2 To, ce qui est assez exceptionnel : en règle générale, la capacité maximale des disques durs SAS est de 600 ou 900 Go. Évidemment, ceux-ci affichent une vitesse de rotation plus élevée et sont au format 2,5″, contre 3,5″ ici.
Même les spécifications thermiques sont identiques : la plage de fonctionnement conseillée va de 5 à 55 °C. Il existe des disques durs permettant de travailler dans des conditions plus extrêmes, mais ils sont généralement spécialement prévus pour ce type d’utilisation et coûtent bien entendu plus cher. Notons que le respect de cette plage de températures est important, car il conditionne la validation du fonctionnement en continu pendant 5 ans, voire plus.
Par rapport au MK2002, l’interface SAS confère au MK2001 plus de flexibilité et lui permet d’être utilisé dans les systèmes à plus haute disponibilité : n’oublions pas que le SAS permet de raccorder le disque dur à deux hôtes, ce qui signifie que si un serveur doit être mis hors ligne pour maintenance, le disque reste accessible via le serveur de secours.
Il convient toutefois de souligner qu’en termes de performances, nous n’avons noté que très peu de différences entre ce modèle et son homologue SATA : il est tout au plus légèrement meilleur dans les opérations d’E/S. Mais si vous avez tout lu jusqu’ici, vous vous doutez probablement déjà que ce ne sont pas les performances qui doivent constituer le principal facteur de choix entre les deux technologies.
Configuration de test
Matériel | |
Composants | Détails |
Processeur | Intel Core i7-920 (45 nm, 2,66 GHz, 1 Mo de cache L2, 8 Mo de cache L3) |
Carte-mère | Supermicro X8SAX |
RAM | 3 x 1 Go de DDR3-1333 Corsair CM3X1024-1333C9DHX |
Disque dur système | Samsung Spinpoint F4 HD322GJ 320 Go |
Contrôleur | LSI MegaRAID 9265-8i |
Alimentation | OCZ EliteXstream 800 watts |
Benchmarks | |
Mesure des performances | h2benchw 3.16 |
Performances en E/S | IOMeter 2006.07.27 |
OS et pilotes | |
Pilotes | Détails |
OS | Windows 7 x64 Édition Intégrale SP1 (à jour en date du 12/07/2011) |
Intel INF | 9.2.0.1030 |
Intel Rapid Storage | 10.5.0.1027 |
Temps d’accès et performances en E/S
Temps d’accès (ms)
Le temps d’accès est légèrement plus bas sur le modèle SAS ainsi que sur la grappe RAID composée de disques SAS. Les temps d’accès en écriture sont tous plus faibles en raison des capacités de mise en cache du contrôleur.
Performances en E/S (IOPS)
La charge de travail de type « serveur de base de données » se déroule plus rapidement sur le disque SAS que sur le SATA, mais nous sommes loin des performances d’un SSD.
Le test en mode « serveur de fichiers » fait appel à une taille de blocs plus élevées ; le disque SAS s’y montre également plus rapide.
Le benchmark en mode « serveur web », par contre, n’implique aucune opération d’écriture, ce qui explique probablement pourquoi le disque dur SAS s’y fait dépasser par le SATA.
Il faut par ailleurs noter que les tests ci-dessus sont optimisés pour un environnement orienté « performances », ce qui n’est pas l’objectif principal des deux disques durs que nous avons sélectionnés. Au vu de leur vitesse de rotation de 7200 tr/min, ils sont plus adaptés à la sauvegarde, à l’archivage et aux autres applications mettant l’accent sur la capacité de stockage. Pour les performances, mieux vaut des SSD ou des disques durs affichant une vitesse de rotation plus élevée.
Lecture/écriture aléatoire de blocs de 4 Ko
IOMeter (IOPS)
Le disque SAS affiche des performances plus élevées en lecture aléatoire de blocs de 4 Ko, notamment en raison des capacités de mise en cache du contrôleur.
CrystalDiskMark (Mo/s)
En lecture aléatoire de blocs de 4 Ko, les disques SAS sont nettement plus performants que leurs équivalents SATA lorsque la profondeur de file est de 32 commandes.
Même chose en écriture, sauf en RAID, curieusement.
Lecture/écriture aléatoire et séquentielle de blocs de 512 Ko
Lecture aléatoire (Mo/s)
Écriture aléatoire (Mo/s)
Lecture séquentielle (Mo/s)
Écriture séquentielle (Mo/s)
Lecture/écriture en streaming
Lecture en streaming (Mo/s)
Écriture en streaming (Mo/s)
Les opérations de lecture/écriture en streaming sont, de manière générale, effectuées plus rapidement sur les disques SAS, mais l’écart reste négligeable.
Conclusion
Au vu des résultats de nos tests, il apparaît clairement qu’il serait ridicule de choisir entre disques SATA et disques SAS sur la seule base des performances. Celles-ci ne rendent tout simplement pas justice aux éléments qui différencient réellement les deux technologies.
Le TCQ permet peut-être aux modèles SAS de prendre l’avantage dans la plupart des benchmarks, mais les écarts sont suffisamment faibles pour que les disques SATA parviennent à retourner la situation dans une poignée de cas, notamment lorsque la charge de travail est essentiellement séquentielle. À l’inverse, plus l’application et la configuration sont complexes, plus le SAS est bénéfique. Sachant que les deux disques durs testés sont garantis cinq ans pour une utilisation en continu, on comprend qu’il puisse être difficile de choisir.
Nous devons cependant prendre en considération les avantages de l’architecture SAS. Grâce aux faits que celle-ci permette de multiplier les disques à l’aide d’expandeurs et que les disques SAS gèrent deux ports, il est en effet possible de créer des infrastructures très disponibles et ne nécessitant qu’un minimum de maintenance physique. La gestion des grappes JBOD de plusieurs dizaines de disques durs devient un véritable jeu d’enfant : en SAS, il suffit d’affecter un disque à une grappe donnée et de laisser la gestion du stockage au système hôte ou au contrôleur. Le zoning, le basculement et l’agrégation des liaisons sont autant de forces de la norme SAS.
Disons pour conclure que ces deux disques constituent des options viables si vous êtes à la recherche de supports de stockage définitifs ou semi-définitifs pour vos données importantes. Vous pourriez investir dans des modèles 10 000 ou 15 000 tr/min, voire dans des SSD, pour obtenir de meilleures performances, mais cela constituerait un surcoût inutile si vous n’avez besoin que de stockage professionnel fiable.