EMC VMAX All Flash: La nuova dimensione in storage flash (it)

Este post también está disponible en Español

Qualcuno di voi forse ricorderà un progetto di sviluppo nel mondo dell’IT di diversi anni fa chiamato ICDA. Mi riferisco a quando esistevano solo i server e i dischi, nel senso che i server venivano direttamente collegati ai dischi.

La grande innovazione del progetto ICDA (Integrated Cache Disk Array) fu quella di consentire ai dischi di essere presentati ai server attraverso una cache o memoria,  memoria che permetteva ora di sviluppare software specifico, quindi nuovi metodi (algoritmi)  per rendere l’insieme sempre più intelligente ed evoluto. ICDA era il nome con cui è stato conosciuto il primo Symmetrix e questa innovazione permise a EMC di avere un enorme successo. Tale intelligenza  si è evoluta negli ultimi 30 anni fino a diventare oggi l’oggetto di questo post: VMAX All Flash

EMC è leader di mercato dei flash array , per quanto riguarda gli AFA, solo XtremIO ha circa il 40% di market share secondo gli analisti.

Ora EMC sta espandendo il portfolio tanto nel mercato high-end come in tutte le altre fasce de mercato e questa espansione la fa utilizzando tecnologia flash. Quindi non solo nuovi array, ma tutti All Flash.

Nel settore high-end ora EMC ha due prodotti, XtremIO e VMAX AF.

I “Big 3”

Quando di parla di VMAX AF, si parla di enormi valori di scalabilità. Il sistema è in grado di generare 150GB/s bandwith e di arrivare a 4M di iops mantenendo in ogni momento una latenza di 0.5 millisecondi.

 

EMC VMAX All Flash The Big 3
EMC VMAX All Flash The Big 3

Queste metriche sono conosciute come i big 3 e danno una misura delle capacità di uno storage di generare valore di business ed acquisiscono un significato soltanto se vengono considerate insieme.

Sappiamo dalla teoria dei vincoli che nessuna catena è più forte del suo anello più debole.

In un sistema di memorizzazione dati, l’accesso ai dischi, anche si sono flash,  rappresenta la parte più lenta rispetto all’accesso a qualsiasi altro componente importante come CPU , memoria, ecc.

La maggior parte, se non tutto l’hardware e il software in esecuzione attendono i dati dai dispositivi di archiviazione molto più a lungo rispetto a qualsiasi altra fonte.

Gli IOPs o il numero di operazioni di lettura/scrittura che è possibile fare nella unità di tempo, danno un’idea della quantità di “lavoro” che un array può fare. La banda (bandwith o throughput) misurata in GB/s, identifica la velocità di trasferimento dei dati. Infine, la latenza (tempo di risposta), o quanto tempo ci vuole perchè un trasferimento di dati possa iniziare, è la misura più importante.

Un lento spostamento dei dati da un componente a un altro riduce le prestazioni.  Un disco flash ha un Response Time (RT) di circa 1ms, un VMAX AF circa la mettà, come è possibile? Vedremo la risposta a questo punto un po’ più avanti nel post.

VMAX AF: produttività

Una cosa è certa, nei sistemi mission critical una qualsiasi diminuzione di performance rappresenta un costo per il business. C’è un tempo fisso che il business ha per processare i dati.

Mentre è intuitivo capire che ad una diminuzione di performance segue un costo per il business, è più difficile immaginare cosa succede al diminuire il Response Time.

Un ottimo punto di partenza per capire questo paradigma è uno studio pubblicato in un articolo chiamato “The Economic Impact of Rapid Response Time”

EMC VMAX All Flash Productivity
EMC VMAX All Flash Productivity

 

I punti salienti di questo articolo sono:

  • Dimezzare il tempo di risposta del sistema serve a diminuire di un 20% il tempo globale di esecuzione
  • Il miglioramento della produttività continua ad aumentare man mano che il RT scende sotto il millisecondo
  • L’intero sistema diventa più efficiente, c’è bisogno di minori task (thread), memoria, CPU.
  • Un RT constante nel tempo è fondamentale per conseguire gli incrementi di produttività
  • Riducendo il RT con un fattore di 10 incrementa la produttività di un 106%

Tenendo in mente queste considerazioni, proviamo a dare un valore numerico, in euro, alla quantità di task che vengono eseguite nel data center ogni ora e ogni giorno. Questo ci darà un’idea della produttività attuale del data center. Ora, abbiamo detto che un VMAX AF è in grado di ridurre il RT di ogni task, portandolo dai 3-5ms (tipico di un array tradizionale) a 0.5ms (10x).  Questo significa un incremento della produttività del 100%.  Tale è il valore di business che il nuovo VMAX AF è in grado di generare.

Se tutto questo fosse possibile ottenerlo solo grazie all’utilizzo di dischi flash sarebbe semplice, invece non è così. Quello che serve è un’intera architettura pensata per il flash.

Architettura disegnata per il flash

Nel nuovo VMAX AF, cosa è stato fatto “sotto le coperte” per supportare al meglio la tecnologia flash?  Qual è la scienza sotto? Ecco alcuni termini chiavi per capire il VMAX AF.

EMC VMAX All Flash Architected for Flash
EMC VMAX All Flash Architected for Flash

 

ENORME SCALABILITÀ:  Per avere una cosi grande scalabilità il sistema ha bisogno di un’eccezionale potenza di calcolo. Ci sono 384 core all’interno del VMAX AF. Ma non sono semplici core, essi sono in realtà pool di risorse che possono muoversi liberamente dal front-end al back-end, da un port a un altro a seconda del carico e della tipologia di workload che riceve l’array. Non dobbiamo più preoccuparci se un particolare applicativo insiste solo su alcune porte e quindi il carico non è bilanciato. I pool di core possono muoverci verso le porte che in quel momento richiedono più risorse. Siamo di fronte ad un carico di tipo OLTP e quindi è richiesto un maggior numero di IOPs?  i core si muovono verso il front-end, il carico è di tipo DSS?, cioè bandwith, i core si muovono verso il backend.

SSD TLC: Il sistema utilizza i più densi dischi flash presenti sul mercato. Alcune innovazioni a livello del software (codice), non solo permettono ora di ottenere una latenza minore, ma servono per ridurre il consumo dei dischi flash.

BASSISSIMA LATENZA: Ho già parlato della latenza ma non dimentichiamoci che il sistema ha un’enorme cache che viene utilizzata per minimizzare i service time, un qualcosa che VMAX ha potuto sempre dimostrare  grazie all’utilizzo di evoluti algoritmi di cache.

BANDWITH: Dal punto di vista del bandwith, il numero di front-end e back-end che connettono i v-brick insieme, dalla possibilità al VMAX di supportare un’impressionante larghezza di banda per le applicazioni che hanno bisogno di movimentare moltissimi dati.

SEMPLICITÀ: con il nuovo VMAX AF, EMC non ha voluto fare un sistema più semplice da utilizzare, ha fatto un sistema SEMPLICE da utilizzare. L’interazione dell’utente con l’array, l’amministrazione,  il livello di automazione  possibile,  fanno del VMAX AF un sistema molto più semplice da utilizzare di molte altre attività che vengono fatte in un datacenter.

 VMAX AF: cache e utilizzo dei dischi flash

In 25 di evoluzione il “progetto ICDA” ha avuto un continuo training per usare al meglio la sua memoria.

Il nuovo VMAX ha 16TB di global DRAM, questo è un immenso buffer per la gestione dei 4 milioni di iops che il sistema è in grado di generare. Perché avere questo enorme buffer è importante?

EMC VMAX All Flash Hughe Cache
EMC VMAX All Flash Hughe Cache

 

Come sapete, i dischi flash muoiono un po’ ogni volta che ci scriviamo. Non è possibile scrivere (sovrascrivvere)  su un disco flash, prima di scrivere bisogna cancellare le informazioni presenti. Quindi, è necessario un meccanismo che possa gestire queste attività soprattutto per diminuire il numero di scritture sul back-end.

Nel VMAX AF due algoritmi di cache giocano un ruolo fondamentale nella riduzione delle scritture e quindi anche nell’aumento delle performance: write coalescing e write folding.

Write folding: consente al VMAX AF di mantenere i dati in cache per lunghi periodi di tempo per accrescere la possibilità che un dato sia sovrascritto. Siccome per molte applicazioni, fatto 100 il numero di accessi, tipicamente tra un 30% – 50% sono riscritture, questo meccanismo evita inutili accessi ai dischi flash.

Write coalescing: consente al VMAX AF di “unire” indirizzi di scritture fatti in momenti diversi in un unico grande blocco di scritture minimizzando ulteriormente il numero di accessi ai dischi.

Grazie a questi accorgimenti, il VMAX AF può ridurre il traffico verso il back-end di circa un 80%

Come otteniamo un valore di RT così basso?

Quando muoviamo i dati dal front-end al back-end muoviamo questa informazione attraverso la memoria. Siccome il sistema è cache based, i write sono sempre in cache, e questo ci da un RT di circa 02 – 0.3 millisecondi (è memoria). Per quanto riguarda le letture, e considerando la nostra base d’installato, sappiamo che in media il 54% de tutte le letture saranno in cache, quindi un RT per le letture di circa 0.2 0.3 ms. Per le restanti letture, che saranno delle read miss, dovremmo andare sul disco e la risposta sarà di 1ms. Se consideriamo il valore aggregato,  otteniamo un service time di circa 0.5 millisecondi.

 Data services

Quando si ha uno storage di tipo enterprise, un data service in particolare è di fondamentale importanza e riguarda il livello di resilienza con cui è possibile contare. VMAX AF utilizza il software SRDF con repliche fino a 4 siti, sync, async e metro fornendo una resilienza (availability) di 6 9’s. Il livello di resiliency è fondamentale. Immaginiamo cosa succederebbe se tutti i VMAX smettessero di funzionare (al meno in Italia). I principali istituti finanziari e banche utilizzano VMAX quindi, non sarebbe possibile fare trading, prelevare soldi al bancomat, neanche pagare con le carte di credito. Inoltre, al meno in Italia, i treni e gli aerei non funzionerebbero.

VMAX AF non sarebbe un VMAX senza data services affidabili. Oltre a SRDF nel VMAX AF ci sono tutti i data services che uno potrebbe aspettarsi in un array di tipo enterprise.

EMC VMAX All Flash Data Services
EMC VMAX All Flash Data Services

 

Compressione: per aumentare la efficienza

vVOLS: per rendere più facile il provisioning di VMware

Data a rest encryption: per proteggere le informazioni contenute nell’array

Per quanto concerne i data services che riguardano la protezione dei dati, EMC è stata da sempre riconosciuta come il fornitore più affidabile per gli ambienti di tipo mission critical. Mi riferisco alla capacità del array di effettuare copie di dati dentro l’array, dentro il datacenter o fuori dal datacenter.

Dentro l’array: SnapVX è il software di copie locali che permette di creare miglia di snap senza impatti prestazionali ne consumo di spazio. SnapVX è una componente fondamentale della strategia iCDM (“Integrated Copy Data Management”) di EMC di cui ho già parlato in un post precedente.

Dentro il data center (backup): il VMAX AF, permette di progettare una strategia di backup di nuova generazione (EMC ProtecPoint) integrandosi con Data Domain (DD), la piattaforma EMC di storage di backup “deduplicabile”. Per Storage deduplicabile si intende la capacità di Data Domain di ridurre i dati quando vengono copiati con fattori di data reduction da 10 a 30 volte. Con un throughput di circa 58TB ora (e una scalabilità fino a 86PB), VMAX AF + i sistemi Data Domain permettono di completare i backup in tempi veramente ridotti. Con questa integrazione, in pratica, SnapVX effettua le copie direttamente su VMAX AF. Oltre al backup, risulta anche molto interessante il restore che diventa pressoché istantaneo.

Per ultimo, VMAX AF offre la capacità di eseguire la migrazione dei dati da altre piattaforme VMAX di precedenti generazioni senza interruzioni di servizio.

VMAX AF: licensing

Con il VMAX AF è possibile per esempio cominciare con un’ infrastruttura con solo 2 controller e una capacità utilizzabile di 53TB, questo viene chiamato un V-Brick.

Nel caso sia necessario aggiungere più capacità, questo può semplicemente essere fatto aggiungendo dei “flash pack” di 13TB fino ad arrivare a 500TB di capacità flash in ½ rack in un solo V-Brick.

Uno dei pilastri di un modern datacenter è la capacità  di scalare orizzontalmente (“scale-out”). VMAX AF può scalare da 1 a 8 V-Brick e fino a 4PB di capacità in 4 rack incrementando enormemente la densità e diminuendo in questo modo la occupazione di spazio all’interno del Data Center.

EMC VMAX All Flash Models
EMC VMAX All Flash Models

 

Come detto in precedenza, abbiamo a disposizione a tantissima performance – 4M iops e una capacità di 4PB. Come possiamo utilizzare tutto questo? Consideriamo una tipica VM che consuma 100GB e 100 iops, ciò significa che in un solo VMAX ALL FLASH possiamo deployare 40.000 VMs.  Questo fa del VMAX AF una piattaforma ideale per il mixed workload consolidation.

Ma non solo dobbiamo considerare la capacità e le performance, pensiamo per esempio al numero di host che possono essere collegati (256 FC), pensiamo alla diversità di connettività a disposizione;  FC, Iscsi,  SAN, embedded NAS & file. Dal punto di vista dei protocolli supportati, VMAX AF è il sistema più flessibile sul mercato.

EMC VMAX All Flash Software Packages
EMC VMAX All Flash Software Packages

Per facilmente capire quali sono i nuovi modelli di VMAX AF è stato adottato uno schema molto semplice; 2 modelli, VMAX AF 450 e VMAX AF 850. Siccome non sempre c’è bisogno di avere tutto il software per tutti i data services che il VMAX AF e capace di offrire, per semplificare ancora di più l’offering nel nuovo VMAX AF ci sono 2 software packages; F o FX.

450 è il modello più piccolo, F o FX, scalabile da 1 a 4 vbrick e fino a 2000TB.

850 è il modello più grande, F o FX, scalabile da 1 a 8 vbrick e fino a 4000TB.

F package (starter or base). Il package F include il software per le copie locali (SnapVX), il software necessario per implementare la strategia di ICDM (AppSync). Nel pacchetto F è incluso anche il software di management, compressione e il software necessario per la data mobility.

FX package (full). Il software package FX aggiunge numerose funzionalità tra cui la replica remota (SRDF), la crittografia dei dati, il NAS integrato (eNAS), il “Cloud Tiering”, ViPR SRM (Storage Resource Manager) per l’automazione delle risorse di storage e altro ancora.

Un importante pilastro di ogni datacenter moderno è il Flash, ma lo è anche il cloud. Quindi un dilemma potrebbe essere come avere entrambi e come far funzionare insieme nello stesso environment per avere la potenza del flash con la economia e flessibilità del cloud.  VMAX risolve questo problema con l’integrazione di CloudArray. Grazie a CloudArray, con VMAX All Flash è possibile integrare perfettamente cloud storage come Virtustream, Google o Azure per memorizzare e/o movimentare dati dal VMAX AF verso il cloud e viceversa, il tutto orchestrato on-line e da un unico punto di controllo.

EMC VMAX All Flash Big Picture
EMC VMAX All Flash Big Picture

 

Con VMAX AF ora voi potete competere a qualsiasi livello.

 


Per ulteriori informazioni:

Sistemi di Storage VMAX All Flash