EMC VMAX All Flash: La nueva dimensión en storage flash (es)

Questo post è anche disponibile in italiano

Algunos de ustedes recordarán un proyecto de desarrollo en el mundo IT, varios años atrás llamado ICDA. Me refiero a cuando existían solamente los servidores y los discos, en el sentido que los servidores eran conectados directamente a los discos. La gran innovación del proyecto ICDA (Integrated Cache Disk Array) fue hacer posible “la presentación” de los discos al server a través de una caché o memoria, una memoria donde era posible desarrollar software específico, algoritmos que hacían el conjunto más evolucionado e inteligente. ICDA era el nombre con el que se conocía al primer Symmetrix y esta innovación permitió a EMC de tener un gran éxito. Esta inteligencia ha evolucionado en los últimos 30 años hasta a ser hoy el tema de este post: VMAX All Flash

EMC es el líder del All Flash, en este mercado, sólo XtremIO tiene cerca de 40% de market share según los analistas. Ahora EMC está ampliando el portfolio tanto en el área high-end como en el área midrange y esta expansión la hace usando exclusivamente tecnología flash. Todos nuevos array, todos flash.

En el High-End EMC tiene ahora dos productos, XtremIO y VMAX AF

Los “Big 3”

Cuando se habla de VMAX AF se hace referencia a enormes valores de escalabilidad. El nuevo VMAX AF es un sistema capaz de generar 150 GB/s de ancho de banda y alcanzar los 4 millones de I/Os manteniendo una latencia de 0,5 milisegundos.

EMC VMAX All Flash The Big 3
EMC VMAX All Flash The Big 3

Estas métricas son conocidas como los “3 BIG” y dan una idea de la capacidad de un array de generar valor de business y tienen significado sólo si se consideran en conjunto. Sabemos por la teoría de las restricciones que ninguna cadena es más fuerte que su eslabón más débil. En un sistema de almacenamiento de datos, el acceso a los discos, aunque si son flash, representa la parte más lenta en comparación al acceso a otros componentes importantes como CPU, memoria, etc.

La mayoría, si no todo el hardware y el software en ejecución esperan datos de los dispositivos de almacenamiento mucho más que de cualquier otra fuente.

Los IOPs o el número de operaciones de lectura/escritura posibles en la unidad de tiempo, dan una idea de la cantidad de “trabajo” que un array puede hacer. La banda (bandwidth o throughput) medida en GB/s, identifica la velocidad de transferencia de los datos. Por último, la latencia (Response Time), o sea cuánto se tarda para que la transferencia de los datos pueda iniciar, es la medida más importante.

Gli IOPs o il numero di operazioni di lettura/scrittura che è possibile fare nella unità di tempo, danno un’idea della quantità di “lavoro” che un array può fare. La banda (bandwith o throughput) misurata in GB/s, identifica la velocità di trasferimento dei dati. Infine, la latenza (tempo di risposta), o quanto tempo ci vuole per il trasferimento dei dati può iniziare, è la misura più importante.

Un movimiento de datos lento de un componente a otro degrada el rendimiento. Un disco flash, cuando es accedido a través de FC tiene un tiempo de respuesta (RT) de aproximadamente 1ms, en un VMAX AF en vez es la mitad, ¿cómo es posible? Veremos la respuesta a este punto un poco más adelante en el post.

VMAX AF: productividad

En un sistema de tipo “mission critical” cualquier disminución del rendimiento representa un costo. En los negocios, existe un tiempo fijo para procesar los datos.

Mientras es intuitivo entender que a una disminución del rendimiento sigue un costo para el negocio, es más difícil imaginar lo que ocurre al reducir el tiempo de respuesta. Un buen punto de partida para entender este paradigma es un estudio publicado en un artículo titulado “The Economic Impact of Rapid Response Time”

EMC VMAX All Flash Productivity
EMC VMAX All Flash Productivity

Los puntos salientes de este artículo son:

  • Reducir a la mitad el tiempo de respuesta permite de disminuir de un 20% el tiempo global de ejecución
  • El mejoramiento de la productividad continúa a aumentar a medida que el RT cae por debajo del milisegundo
  • Todo el sistema se vuelve más eficiente, hay necesidad de menos “tasks (threads)”, memoria, CPU
  • Un RT constante en el tiempo es crucial para lograr aumentos de productividad
  • Reduciendo el RT de un factor de 10 aumenta la productividad de un 106%

Teniendo en cuenta estas consideraciones, probemos a dar un valor numérico, en euros, a la cantidad de tareas que se realizan en el data center cada hora y cada día.  Esto será útil para tener una idea de la productividad actual del data center. Ahora bien, dijimos que un VMAX AF puede reducir el RT de cada tarea, disminuyendo el RT de 3-5ms (típico de un array tradicional) a 0,5ms (10x).  Esto significa un aumento en la productividad del 100%.   Tal es el valor de business que puede generar el nuevo VMAX AF.

Si todos estos beneficios se pudieran obtener simplemente añadiendo discos flash todo sería muy fácil, en vez no es tan simple. Lo que se necesita es una arquitectura completamente diseñada para flash.

VMAX AF: Arquitectura diseñada para el flash

¿En el nuevo VMAX AF, qué es lo que se ha hecho “under the covers” para mejorar el soporte a la tecnología flash?  Veamos algunos puntos claves para entender mejor el VMAX AF.

 

EMC VMAX All Flash Architected for Flash
EMC VMAX All Flash Architected for Flash

ENORME ESCALABILIDAD: Para una gran escalabilidad se necesita una excepcional potencia de cálculo. Hay 384 CPU cores dentro el VMAX AF. Estos no son “simples” cores, son en realidad “pool” o grupos de recursos che pueden desplazarse libremente desde el front-end hasta el back-end, de un puerto a un otro dependiendo de la carga y del tipo de carga que recibe el array. Ya no será necesario preocuparse si una aplicación en particular insiste más sobre algunos puertos que otros y la carga no está equilibrada. Es posible mover parte de los grupos de recursos hacia los puertos que más lo requieren. Imaginemos que estamos trabajando con una aplicación de tipo OLTP y por lo tanto se requiere un mayor rendimiento (número de iops); los cores se mueven hacia el front-end. La carga de trabajo es de tipo DSS (secuencial) y se requiere más bandwith?; los cores se mueven hacia el back-end.

SSD TLC: el sistema utiliza los discos flash más densos del mercado. Algunas innovaciones a nivel de software (código), no sólo permiten obtener un menor tiempo de latencia, sino que sirven también para reducir el consumo de las unidades flash.

BAJA LATENCIA: ya he hablado de la latencia, pero no olvidemos que el sistema tiene una enorme memoria que utiliza para minimizar el tiempo de servicio, algo que siempre VMAX ha podido demostrar gracias al uso de avanzados algoritmos de cache.

BANDWITH: en términos de ancho de banda, el número de front-end y back-end que conectan los V-Bricks permiten al VMAX de soportar un impresionante ancho de banda para aplicaciones que necesitan mover grandes cantidades de datos.

SIMPLE: con el nuevo VMAX AF, EMC ha hecho un sistema sumamente fácil de usar. La interacción del usuario con el array, la GUI de administración, el nivel de automatización hacen del VMAX AF un sistema mucho más fácil de usar en comparación a muchas otras actividades que se realizan en un centro de datos.

VMAX AF: Memoria cache y uso de los discos flash

En 25 de evolución el “proyecto ICDA” ha tenido un entrenamiento continuo para hacer el mejor uso de su memoria.  El nuevo VMAX puede llegar a 16 TB de MEMORIA global, esto es un enorme buffer para el manejo de los 4 millones de iops que puede generar el sistema. ¿Por qué este enorme buffer es importante?

EMC VMAX All Flash Hughe Cache
EMC VMAX All Flash Hughe Cache

Como se sabe, los discos flash “mueren” un poco cada vez que escribimos. No se puede escribir (sobre-escribir) en una unidad flash, antes de escribir primero hay que eliminar/borrar la información presente. Un array flash necesita mecanismos evolucionados para manejar estas tareas, principalmente para disminuir el número de escrituras en el back-end.

En el VMAX AF dos algoritmos de cache juegan un papel importante en la reducción de las escrituras y por lo tanto el aumento del rendimiento: “write coalescing” e “write folding”.

Write folding:  permite al VMAX AF de mantener los datos en caché durante largos períodos de tiempo para aumentar la posibilidad de que el mismo dato pueda ser escrito (en cache) más de una vez. Para muchas aplicaciones, considerando 100 accesos, típicamente entre el 30% – 50% son reescrituras, de manera que este mecanismo evita el acceso innecesario a las unidades flash mientras al mismo tiempo aumenta el rendimiento.

Write coalescing:  permite al VMAX AF de “unir” escrituras hechas en momentos diversos sobre direcciones diversas en un único bloque grande de escrituras reduciendo al mínimo el número de accesos de disco.

Gracias a estas medidas, el VMAX AF puede reducir el tráfico hacia el back-end alrededor de un 80%

¿Cómo es posible obtener un valor de RT tan bajo?

Cuando movemos los datos del front-end hacia el back-end lo hacemos siempre a través de la memoria. VMAX AF es un sistema basado en la memoria cache, las escrituras se hacen siempre en la cache y esto nos da un RT de aproximadamente 0,2 – 0,3 ms (es memoria). Con respecto a las lecturas sabemos, gracias a la base de storage instalados a nivel mundial, que en promedio el 54% de las lecturas se realizarán con datos que ya se encuentran en cache (read hits), o sea nuevamente 0,2 – 03 ms, mientras que el resto serán lecturas desde los discos flash (read miss) con un RT de 1ms. Si tenemos en cuenta el valor agregado, se obtiene un RT de 0,5 ms.

VMAX AF: Data Services

Para un array di tipo enterprise, un servicio de datos en particular es de suma importancia; el nivel de resiliencia con el que se puede contar.  VMAX AF utiliza el software SRDF con réplicas hasta 4 sitios, sync async y metro ofreciendo una “availability” disponibilidad de 6 9 ‘s.  El nivel de resiliencia es clave.  Imaginemos lo que ocurriría si los VMAX dejaran de funcionar. En Italia muchas de las principales instituciones financieras y bancos usan VMAX por lo tanto, no sería posible el comercio, conseguir dinero del cajero automático, incluso pagar con la tarjeta de crédito. También, al menos en Italia, los trenes y aviones no funcionarían.

VMAX AF no sería un VMAX sin servicios de datos confiables. Además de SRDF el VMAX AF cuenta con todos los servicios de datos que uno podría esperarse en un array de tipo enterprise.

EMC VMAX All Flash Data Services
EMC VMAX All Flash Data Services

Compresión: para aumentar la eficiencia

vVOLS: para facilitar la provisión de datos en VMWARE

Encryption (D@Rest): para proteger la información contenida en el array

Con respecto a los data services que se refieren a la protección de datos, EMC ha sido siempre reconocida como el proveedor más confiable para entornos mission critical. Me refiero a la capacidad del array de efectuar copias de datos dentro del array, dentro el datacenter o fuera del centro de datos.

Dentro del array; SnapVX es el software de copias locales que le permite crear miles de copias sin impactos en el rendimiento y con un mínimo consumo de espacio. SnapVX es un componente clave de la estrategia de administración de copia de datos de EMC, iCMD o “Integrated Copy Data Management” que ya he mencionado en un post anterior.

Dentro el data center (backup): VMAX AF permite de realizar una estrategia de backup de nueva generación (EMC ProtectPoint) integrándose con Data Domain (DD), la plataforma de storage “deduplicable”. Storage “deduplicable” se refiere a la capacidad de Data Domain de reducir los datos mientras estos se copian con factores de reducción de 10 – 30x. Con un rendimiento de alrededor de 58TB/h (sobre una escalabilidad de hasta 86PB) los sistema Data Domain permiten copias de backup completas en tiempos sumamente breves. Con esta integración, SnapVX hace las copias (snaps) directamente en el VMAX AF. Además de las copia de seguridad, resulta también muy interesante el “restore” que es prácticamente instantáneo.

Por último, VMAX AF proporciona la capacidad de migrar datos de otras plataformas VMAX de generaciones precedentes sin interrupciones del servicio.

VMAX AF: licensing

Con el VMAX AF se puede iniciar por ejemplo con una infraestructura con sólo 2 controladores y una capacidad útil de 53TB, esto se llama un V-Brick.  En el caso que se necesite añadir más capacidad, esto puede hacerse simplemente añadiendo “flash pack” de 13TB hasta llegar a 500TB de capacidad flash en un solo V-Brick.

Uno de los pilares de un centro de datos moderno es la capacidad de escalar horizontalmente (“scale-out”). VMAX AF puede escalar desde 1 hasta 8 V-Bricks per 4PB de capacidad en solo 4 racks aumentando enormemente la densidad y disminuyendo de este modo la ocupación de espacio dentro del Data Center.

EMC VMAX All Flash Models
EMC VMAX All Flash Models

Como se mencionó anteriormente, tenemos a disposición un enorme rendimiento – 4M iops y una capacidad de 4PB. Consideremos una máquina virtual típica que consume 100 GB y 100 iops, esto significa que en un solo VMAX AF es posible deployare 40.000 VMs. Esto hace del VMAX AF una plataforma ideal para la consolidación de cargas de trabajo mixtas.

Pero no sólo hay que tener en cuenta la capacidad y el rendimiento,   pensemos por ejemplo, al número de servidores que podemos conectar (256 FC), pensamos a la diversidad de conectividad disponible; FC, iSCSI, SAN, NAS y file. Desde el punto de vista de los protocolos soportados, VMAX AF es el sistema más flexible en el mercado.

EMC VMAX All Flash Software Packages
EMC VMAX All Flash Software Packages

Para entender fácilmente cuáles son los nuevos modelos de VMAX AF se adoptó un esquema muy simple; 2 modelos, VMAX AF 450 y VMAX AF 850. Dado que no siempre es requerido todo el software y todos los servicios que el VMAX AF es en grado de ofrecer, para simplificar aún más la oferta con el nuevo VMAX AF hay solo dos paquetes de software; F o FX.

450 es el modelo más pequeño, F o FX, escalable de 1 a 4 V-Brick y hasta 2000TB.

F paquete (básico, starter package). El paquete F incluye el software para las copias locales (SnapVX), el software necesario para implementar la estrategia de iCDM (AppSync). Este paquete también incluye el software de gestión, la compresión y el software necesario para la data mobility.

FX (completo, full package). El paquete FX añade una serie de funcionalidades como la replicación remota (SRDF), encriptación de datos, NAS integrado (e-NAS), el “Cloud Tiering”, ViPR SRM (Storage Resource Manager) para la automatización de los recursos de almacenamiento y otros software más.

Un pilar importante de cualquier centro de datos moderno es el flash, pero también lo es la nube (cloud). Por lo tanto un dilema podría ser cómo hacer para que trabajen juntos en el mismo entorno combinando la potencia del flash con la economía y la flexibilidad del cloud. VMAX AF resuelve este problema con la integración de CloudArray. Gracias a CloudArray, el VMAX AF puede integrarse perfección con clouds como Virtustream, Google o Azure para almacenar y / o mover los datos desde el VMAX AF al cloud o viceversa, todo orquestado en línea y desde un único punto de control.

EMC VMAX All Flash Big Picture
EMC VMAX All Flash Big Picture

 

Con VMAX AF Ahora se puede competir a todos los niveles

 


Para mayor información:

Sistemas de Almacenamiento VMAX All Flash