Espacio bruto vs espacio neto
Uno de los aspectos más peliagudos de justificar a los clientes cuando se aborda un proyecto de almacenamiento, es la diferencia existente entre el espacio anunciado por el maravilloso departamento de marketing de cada fabricante, y la cruda realidad, tras el formateo, protección RAID, redondeo en base 2, y otros mecanismos que aplican las cabinas de almacenamiento a los discos que en ellas residen.
Para este análisis, voy a comparar el funcionamiento de las cabinas iSCSI de tres conocidos fabricantes:
- NetApp FAS
- Dell EqualLogic
- HP LeftHand
En muchos de los casos, variará el nivel de protección propuesto por defecto por el fabricante, así que utilizaremos en los tres un tipo de RAID de paridad simple con un disco de Hot Spare.
Empecemos con NetApp. Aunque el nivel sugerido por el fabricante en todos los modelos de la familia FAS es el RAID DP (con dos discos de paridad) analizaremos el espacio con RAID4 (paridad simple), por comparar situaciones similares. Supongamos que disponemos de una cabina “entry level”, FAS2020, con capacidad para 12 discos internos y doble controladora, o lo que es igual: sin punto único de fallo. Estas cabinas, por su peculiar modo de funcionamiento en clúster, requieren espacios independientes para albergar el sistema de cada una de las controladoras, por lo que es necesario crear dos grupos agregados de discos con su correspondiente protección. Así pues, de los 12 discos, podríamos asignar por software 6 discos a cada controladora, de los que se utilizarían 1 para la paridad del RAID4 y otro como hot spare, que en el caso de NetApp se asignan por cada controladora y tamaño o tecnología de disco.
El resultado que obtenemos es de 4 discos utilizables para datos, por cada controladora. Una vez disponemos de los discos, alrededor del 10% se utilizará para el sistema Data ONTAP, propio de NetApp. Así una fórmula con la que podríamos calcular el espacio utilizando RAID4, sería:
Espacio = (Nº de discos - (Nº de controladoras x 2) ) x 0,9 x Tamaño de los discos
Continuemos analizando la Dell EqualLogic. En principio uno de los niveles de protección propuesto por el fabricante de esta cabina es el RAID50. Si tomamos también la “entry level” Dell EqualLogic PS4000, tendremos un cajón de 16 discos, de los cuales utilizaremos 2 para paridad y uno como hot spare. En comparación con la anterior, ahorramos un disco de hot spare, ya que el funcionamiento de la EqualLogic es Activo/Pasivo, y no se ha de asignar un hot spare a cada controladora, ni se ha de disponer del sistema propio de la cabina dos veces en los discos. De este modo, tenemos una configuración sin punto único de fallo y un cierto ahorro en disco respecto a la NetApp.
Una fórmula para calcular el espacio aproximado con RAID50, sería:
Espacio = (Nº de discos - 3 ) x 0,95 x Tamaño de los discos
Por último, hagamos lo mismo con la HP LeftHand P4300, que es la “entry level” de LeftHand. Hay que considerar que para no tener punto único de fallo, como esta cabina es un servidor Proliant con discos, no puede tener doble controladora y se han de montar 2 nodos y un mirror de los datos por red, conocido como NetRAID2. Pongamos en cada uno de los nodos 12 discos, es decir un total de 24. Estos discos los protegeríamos por defecto con un RAID5 y un hot spare en cada nodo, y posteriormente haríamos un mirror (NetRAID2) por red. Por tanto, de los 24 discos, nos quedaría un total utilizable de (24 - 4) / 2 = 10 discos. Probablemente el peor ratio de uso de disco que conozco. La fórmula generalizada para el RAID5 + NetRAID es:
Espacio = ((Nº de discos total - (Nº de nodos x 2) ) x 0,95) x (1 - (1/ Nº de nodos))


En cuanto a NetApp, si vas a mirar RAW storage, incluye un estimado de un 20% de espacio para los snapshots. Y si es net, la deduplicación algo hará no?
Efectivamente! La verdad es que en el artículo no he valorado la utilización de ningún mecanismo adicional que pueda penalizar, como el uso de SnapShots, o ayudar como la deduplicación. Precisamente ayer hice una demo a un cliente y en un volumen deduplicado ahorrábamos el 75% del espacio. La deduplicación de NetApp es una funcionalidad brutal.