Database machine, soluciones de tipo “open” (es)

10 minutos tiempo de lectura

Questo post è disponibile anche in Italiano

El soporte a las cargas de trabajo generadas de las grandes bases de datos requiere muchas veces de arquitecturas especializadas o DB machine.
Consideremos la siguiente definición de DB machine según Wikipedia
“Un database machine (máquina de base de datos) o procesador de back-end es un hardware especial que almacena y recupera datos de una base de datos. Un database machine está especialmente diseñado para el acceso a la base de datos con los servidores de front-end estrechamente acoplados (tighly coupled) por un canal de alta velocidad mientras que el servidor de la base de datos está acoplado libremente (loosely coupled) a través de la red. El front-end recibe los datos y los muestra, el back-end, por otro lado, analiza y almacena los datos de los procesadores de front-end. Los database machine dan como resultado un mayor rendimiento, un aumento de la memoria principal del host, un aumento de la seguridad de la base de datos y una disminución del costo de fabricación”.

Es claro que el término clave para definir un DB machine es “solución integrada” hardware (server, network, storage) y software (DBMS). Según esta definición existen 2 implementaciones posibles: un appliance software preconfigurado con el hardware necesario para ejecutar dicho software (propuesta típica del DBMS vendor) o un appliance hardware preconfigurado con el software necesario para ser ejecutado en ese hardware (propuesta típica del hardware vendor).
Aunque a primera vista las dos arquitecturas pueden parecer similares, cada una de ellas presenta ventajas y desventajas y las implicaciones sobre su implementación en un datacenter son bien diferentes.

db machine open - definition
db machine open – definition

En este post analizaremos ambas arquitecturas con la idea de proporcionar algunos puntos de reflexión para orientarse en la decisión de cual “appliance” representa una arquitectura valida según exigencias aplicativas y de business.

Continuar leyendo “Database machine, soluciones de tipo “open” (es)”

CloudIQ, monitoreo proactivo y analítica predictiva con el Machine Learning (es)

Questo post è anche disponibile in italiano

No es ninguna novedad que en lo que se refiere a la gestión de un sistema de storage, uno de los factores más importantes de tener en consideración es, después de la simplicidad de uso, la cualidad y capacidades del monitoring.

La cantidad de métricas generada internamente a un sistema de almacenamiento es enorme. Muchas veces todas estas variables de comportamiento e indicadores de performance no son fáciles de relacionar entre si para obtener una visión inmediata sobre el real estado del sistema. El motivo principal de esta dificultad está en que se basa en los conocimientos del responsable del sistema de storage y en el tiempo en que este análisis puede ser llevado adelante a fin que las conclusiones sean lo más precisas posibles.

La clave para obtener valor de esta información es a través de un análisis inteligente. El sistema debe ser capaz de analizar en modo autónomo los datos y generar, en modo preventivo, indicadores en grado de anticipar futuros requisitos de capacidad o rendimiento mientras, al mismo tiempo, anticipar posibles anomalías.

En un post precedente había tratado el uso del Machine Learning “al interno” de un sistema de storage (PowerMax, la definición de un array Tier 0 con uso de ML). En este post examinaremos en vez un software “externo”  al sistema de sistema de almacenamiento. Veremos como este software, CloudIQ, gracias al uso del ML nos permite pasar de un monitoring reactivo a un enfoque predictivo.

Continuar leyendo “CloudIQ, monitoreo proactivo y analítica predictiva con el Machine Learning (es)”

PowerMax, la definición de un array Tier 0 con uso de ML (es)

Questo post è disponibile anche in Italiano

No cabe duda que las aplicaciones han evolucionado en el tiempo para generar siempre más valor de los datos. Hoy en día mucho del software se desarrolla para obtener “insights” al interno de los datos, utilizando técnicas de AI (Inteligencia Artificial) que permitan de ofrecer ventajas competitivas al business.

Las nuevas aplicaciones inteligentes de tipo “heavy analytics” con análisis de datos en tiempo real representarán,  según los analistas de mercado, una parte siempre más importante dentro el datacenter. Se estima que para el 2020 el 60-70% de los centros de datos tendrán al menos una aplicación de este tipo. Los datacenter deberán encontrar un modo para gestionar aplicaciones de tipo tradicional junto con este nuevo tipo de aplicaciones.

Debido a la siempre mayor creciente capacidad de los sistemas de storage actuales, una práctica común podría ser hacer convivir los dos tipos de aplicaciones en un único sistema. De hecho, la respuesta del mercado a este tipo de problemática ha sido la consolidación de los datos en un único storage. En particular, los sistemas de tipo AFA se presentan como una buena opción ya que cuando se realiza una consolidación de datos se obtiene un “I/O blend”. Un “I/O blend” es un tipo de workload de tipo random,  donde, los storage de tipo AFA, son los más indicados.

Sin embargo, no será posible predecir el workload de las nuevas aplicaciones que requerirán un altísimo rendimiento y tendrán necesidad de “aprender” de los datos y adaptarse automáticamente a ellos.  En este escenario, los array AFA tradicionales tendrán dificultad a mantener niveles di servicio (SLA) adecuados. Será necesario un tipo de storage, un storage Tier 0 capaz de satisfacer los nuevos requisitos aplicativos. Más allá de la criticidad de mantener los SLA, existe un segundo aspecto de tener en consideración: para poder obtener el máximo beneficio de aplicaciones inteligentes basadas en el uso de algoritmos de Machine Learning (ML) el sistema de storage debe a su vez ser capaz de interactuar al mismo modo.

En este post veremos cosa significa un array de tipo “Tier 0”, el rol del ML en una arquitectura Tier 0,  y cuáles son los desafíos en la realización de un sistema de storage de este tipo.

Continuar leyendo “PowerMax, la definición de un array Tier 0 con uso de ML (es)”

La replicación de datos en Xtremio X2, mecanismos evolucionados de copia remota (es)

Questo post è anche disponibile in Italiano

Uno de los motivos principales por los cuales nos orientamos a la compra de un array de tipo AFA es el rendimiento. Sin embargo, el business tiene también otras exigencias, entre ellas de particular importancia es la protección del dato.

Como protección del dato me refiero a la posibilidad de realizar copias remotas del sitio de producción en un segundo array. Una vez que implementamos un mecanismo de copia remota, el rendimiento de un array AFA disminuye.

Con una replicación síncrona, agregamos el tiempo de latencia de la distancia. En el caso de una replicación asíncrona debemos considerar cuidadosamente el “bandwidth” del link para permitir al array de producción de no “estar demasiado atrás” con las escrituras, caso contrario, el array de producción deberá realizar un trabajo adicional para mantener el RPO.

En este post examinaremos como XtremIO X2, gracias a una implementación única y particular del mecanismo de copia asíncrona, es en grado de mantener un bajísimo RPO disminuyendo al mismo tiempo el bandwidth necesario para realizar las copias.

Continuar leyendo “La replicación de datos en Xtremio X2, mecanismos evolucionados de copia remota (es)”

VPLEX, Storage Federation y sistemas AFA en un data center moderno (es)

Questo post è anche disponibile in italiano

Durante los últimos años una práctica común en muchos centros de datos ha sido el uso de “appliances” en grado de virtualizar sistemas almacenamientos de datos. Esta virtualización, cuyo principal objetivo era poder realizar una plataforma o punto común de gestión para los sistemas de almacenamiento virtualizados, se ha evolucionado en el tiempo para ofrecer nuevas capacidades. Por ejemplo, estos appliances son utilizados para la creación de cluster di storage que sirven a aumentar la disponibilidad y para la realización di datacenters de tipo activo/activo.

La mayoría de los datacenter utilizan hoy infraestructuras de tipo All Flash que ofrecen a su vez nuevas funcionalidades a los centros de datos.  Más allá del aumento de performance debido al uso de tecnología flash, los storage de tipo AFA garantizan una mayor eficiencia en términos de consumo, reducción de espacio físico y de datos gracias a técnicas de data reduction (compresión e reduplicación).

Dadas las particulares características de un storage AFA, es lecito preguntarse sobre las posibles implicaciones de encapsular un AFA bajo un appliance como un virtualizador y si esta práctica puede ser considerada una “best practice”.

En este post analizaremos, además,  las diferencias entre “storage virtualization” vs “storage federation”, veremos algunos casos de uso de estas arquitecturas y examinaremos sus beneficios en un datacenter moderno. Continuar leyendo “VPLEX, Storage Federation y sistemas AFA en un data center moderno (es)”