VPLEX, Storage Federation y sistemas AFA en un data center moderno (es)

Questo post è anche disponibile in italiano

Durante los últimos años una práctica común en muchos centros de datos ha sido el uso de “appliances” en grado de virtualizar sistemas almacenamientos de datos. Esta virtualización, cuyo principal objetivo era poder realizar una plataforma o punto común de gestión para los sistemas de almacenamiento virtualizados, se ha evolucionado en el tiempo para ofrecer nuevas capacidades. Por ejemplo, estos appliances son utilizados para la creación de cluster di storage que sirven a aumentar la disponibilidad y para la realización di datacenters de tipo activo/activo.

La mayoría de los datacenter utilizan hoy infraestructuras de tipo All Flash que ofrecen a su vez nuevas funcionalidades a los centros de datos.  Más allá del aumento de performance debido al uso de tecnología flash, los storage de tipo AFA garantizan una mayor eficiencia en términos de consumo, reducción de espacio físico y de datos gracias a técnicas de data reduction (compresión e reduplicación).

Dadas las particulares características de un storage AFA, es lecito preguntarse sobre las posibles implicaciones de encapsular un AFA bajo un appliance como un virtualizador y si esta práctica puede ser considerada una “best practice”.

En este post analizaremos, además,  las diferencias entre “storage virtualization” vs “storage federation”, veremos algunos casos de uso de estas arquitecturas y examinaremos sus beneficios en un datacenter moderno.

Storage Virtualization vs Storage Federation

Hay una precisión importante que hay que hacer para comprender la tecnología VPLEX y es que VPLEX no es un virtualizador de storage. Cuando se habla de VPLEX se habla de “federation” y no de “virtualization”. ¿Cuál es la diferencia fundamental?  Los virtualizadores aparecieron en el mercado hace muchos años con el objetivo principal de agregar sistemas de storage heterogéneos para crear un sistema homogéneo. Propio en este término homogéneo está la diferencia.  Para poder realizar un sistema homogéneo a partir de otros sistemas, un virtualizador tiene necesidad de gestionar su cache en un modo particular. Existen dos modos posibles para la gestión de la cache: write-back y write-through.

vplex-federation-vs-virtualization
vplex-federation-vs-virtualization

Write-back: esta modalidad de gestión de la cache significa que la gestión del I/O está completamente a cargo del appliance o virtualizador. La respuesta (acknowledge) al host viene dada una vez que el dato llega a la cache del virtualizador y todas las siguientes operaciones, como por ejemplo, eventuales copia de los datos (locales o remotas), compresión, deduplicación, etc. son efectuadas exclusivamente a nivel del appliance. De este modo, la cache del virtualizador es capaz de mantener una completa abstracción e independencia con respecto a los varios storage virtualizados que se encuentran bajo su control. El efecto final de esta modalidad write-back es que no importa cuanto sea veloz o evolucionado el array que se está virtualizando, cuanta cache o cuales funcionalidades importantes tenga. Todas estas funcionalidades se pierden. Propio porque la función de virtualizador es hacer homogéneo todo lo que se encuentra bajo su control, un storage AFA high-end di tipo mission-critical o un JBOD reciben el mismo tratamiento bajo un appliance de este tipo.

Write-through: esta es la modalidad de gestión de la cache exclusiva de VPLEX. Como el nombre indica, el write-through significa “escribir a través”, en otras palabras en VPLEX un I/O en escritura atraviesa la cache del appliance  y simplemente “señala” en esta última cual host es el propietario de ese I/O mientras la verdadera gestión del I/O es a cargo del array que se encuentra virtualizado bajo VPLEX. Este pasaje del I/O a través de la cache del VPLEX no comporta ningún impacto de performance, son necesarios solamente 200 us (micro-segundos) para realizar esta operación. Son varias las ventajas de este tipo de implementación. Por ejemplo, todos los sistemas de storage han desarrollado durante las sucesivas generaciones siempre nuevas funcionalidades, nuevos algoritmos para la protección de los datos y para aumentar el rendimiento. Contrariamente a cuanto sucede con las implementaciones basadas en la modalidad de gestión de la cache de tipo write-back, VPLEX permite a los arrays subyacentes de continuar a utilizar todas sus funcionalidades nativas, su cache mientras al mismo tiempo proporciona ulteriores ventajas.

VPLEX es en grado de “encapsular” o virtualizar sistemas de storage, pero dado sus peculiares características únicas de gestión de la cache, con VPLEX se habla de un sistema de Storage Federation, donde la “virtualization” constituye solo una parte de sus posibilidades.

De cuanto expuesto hasta ahora resulta claro que en un datacenter moderno, donde los storage de tipo AFA son cada vez más presentes, utilizar una tecnología como VPLEX en grado de preservar las características de elevado rendimiento de los sistemas subyacentes, representa una enorme ventaja con respecto a arquitecturas basadas en un virtualizador tradicional.

VPLEX 101

En pocas palabras, VPLEX es una solución hardware y software (un appliance) que al interno de una SAN se presenta como un storage para los servidores y como servidor para los storage. VPLEX es una solución enterprise, o sea, multi-controller,  scale-out  y con una disponibilidad superior a 6 9’s.

vplex-federation-101
vplex-federation-101
Analicemos ahora algunos posibles casos de uso de VPLEX

Todos los ambientes modernos de negocios son ambientes basados en la tecnología. Si hay un problema con la tecnología, esta impacta negativamente los negocios. Hoy en día las expectativas son que la tecnología no debe fallar. VPLEX ha estado desarrollado con ese objetivo, proporcionar una continua disponibilidad al ambiente de la TI. Aumentar y asegurar la disponibilidad de la TI es, de hecho, uno de los principales casos de uso de VPLEX.

En el mismo modo como las necesidades del negocio están cambiando rápidamente, también la tecnología lo hace para adaptarse y soportar mejor esos cambios. Desde este punto de vista, la agilidad se convierte en un atributo importante de un centro de datos modernos.  VPLEX proporciona la flexibilidad necesaria para transferir datos entre ambientes determinados o balancear las cargas de trabajo en base a nuestras exigencias. Más allá de esto, cuando es necesario efectuar un tech refresh, VPLEX facilita la movilidad de un array tanto al interno de un datacenter como desde un datancenter a un otro.

vplex-federation-use-cases
vplex-federation-use-cases
Disponibilidad continua de los datos

VPLEX es una solución de tipo enterprise con un mercado de más de 10000 clusters instalados, 260 millones de horas de funcionamiento, una disponibilidad superior a los 6 9’s y ha sido adoptado por el 50% de los clientes de Fortune 500 ayudando mantener las aplicaciones mission-critical siempre disponibles.

La arquitectura única de VPLEX implementa una coherencia de caché distribuida lo que permite que exactamente los mismos datos se encuentren al mismo tiempo en dos ubicaciones diferentes y puedan ser accesibles tanto en lectura como en escritura.

VPLEX ofrece dos opciones de implementación: LOCAL y METRO.

VPLEX local crea un mirror entre dos o más arrays al interno de un datacenter protegiendo las aplicaciones en el caso de un fallo de uno de los sistemas de storage.

VPLEX Metro crea un mirror remoto entre arrays ubicados en dos datacenters diversos separados por una distancia campus realizando de este modo datacenters de tipo activo / activo protegiendo las aplicaciones en caso de pérdida de uno de ellos. La distancia entre los centros de datos depende de la latencia máxima. Un latencia de unos 5 ms de RTT (round trip time) puede ser considerado un número máximo para una aplicación aunque si VPLEX Metro soporta latencias mucho mayores.

Movilidad extendida (estática) de los datos

Una actividad muy común dentro un centro de datos es mover información entre diferentes sistemas de almacenamiento para balancear las cargas de trabajo o cuando es necesario migrar un array existente a uno nuevo (tech refresh).  Estas son tareas que el VPLEX desarrolla en modo eficaz y han siempre constituido uno de sus puntos de fuerza.

Un aspecto menos conocido del VPLEX es su capacidad de realizar lo que podríamos llamar “Movilidad extendida estática de los datos”.

Imaginemos un datacenter con un ambiente VPLEX al que llamaremos “VPLEX Domain”, donde algunos sistemas de storage han sido “encapsulados” y un segundo ambiente al que llamaremos “Outside VPLEX Domain” donde se encuentran otros storage que no están bajo el control de VPLEX. En un datacenter de este tipo sería un valor adicional tener la posibilidad de mover datos entre los sistemas de storage que se encuentran en el dominio “Outside VPLEX Domain” del mismo modo como es posible hacerlo al interno del “Dominio VPLEX”.

vplex-federation-domains
vplex-federation-domains

En este entorno podemos en realidad considerar un tercer dominio, dominio que no requiere y no se encuentra bajo el control de VPLEX y al que llamaremos “VPLEX Extended Data Mobility Domain”. Con la idea en mente de la existencia virtual de este tercer domino, veamos ahora como mover datos del ambiente “Prod” al ambiente de “Test & Dev” presentes en el dominio “Outside VPLEX Domain”. Podemos hacer esto simplemente creando una snap del ambiente Prod, presentar solo esa snap al VPLEX sin ninguna implicación para el host de Prod, configurar un volumen de destinación en el ambiente de Test & Dev y permitir a VPLEX que realice la copia de los datos.

vplex-federation-extended-domain
vplex-federation-extended-domain

Con esta modalidad es posible mover datos entre cualquier array al interno del datacenter sin necesidad de que estos sean bajo el control de VPLEX. Los datos que se están moviendo son estáticos (una snap) y por este motivo denominamos a esta técnica “extended static data mobility”. ¿Qué otras posibilidades nos ofrece esta técnica? Podemos mover datos entre cualquier tipo de array (presentes en la matriz de compatibilidad), cualquier capacidad (no excediendo nuestra licencia durante cada movimentación), un enorme número de volúmenes (no excediendo los 12.000 volúmenes simultáneamente). Mover datos en esta modalidad no impone límites de distancia. Los datos que estamos moviendo son estáticos, no se trata de una “live migration” y por este motivo podemos mover datos a una “distancia extendida”. El valor de RTTs de 5ms mencionado antes no se aplica en este caso, el “VPLEX timeout” es un valor que se mide en segundos y no en mili-segundos lo que nos permite de mover datos a grandes distancias.

Otros aspectos interesantes de la “Movilidad extendida estática de los datos” son: 1) ningún impacto sobre la CPU de los servidores ya que las copias son a cargo de VPLEX, 2) VPLEX no se encuentra en el “data path”, lo que implica ningún impacto para la aplicación mientras se mueven los datos, 3) un único proceso para todas las movimentaciones completamente independiente del tipo de aplicación.

vplex-federation-leading-edge-technology
vplex-federation-leading-edge-technology
Para concluir

VPLEX es una solución única en su tipo que ofrece la “storage federation” incorporando y superando la virtualización.

VPLEX permite de continuar a utilizar las funcionalidades y potencialidades nativas de los sistemas de almacenamiento subyacentes.

VPLEX asegura una disponibilidad continua de los datos, proporciona una enorme flexibilidad en los procesos de movilidad de la información y facilita los procesos de tech refresh de los sistemas de almacenamiento y migración de los centros de datos.

vplex-federation-big-picture
vplex-federation-big-picture

 


Para mayor información:

Almacenamiento de Dell EMC VPLEX

#IWork4Dell


Este post también está disponible en: Italiano