Flash Storage Archivi - FLASHDNABLOG

Database machine, soluzioni di tipo “open” (it)

10 minuti tempo di lettura

Este post también está disponible en Español

Il supporto per i workload generati da database di grandi dimensioni richiede spesso architetture specializzate o DB machine.
Consideriamo la seguente definizione di DB machine secondo Wikipedia
“Un DB machine o processore di back-end è un hardware specializzato che memorizza e recupera dati da un database. Un DB machine è appositamente progettato per l’accesso al database con i server di front-end strettamente accoppiati (tighly coupled) da un canale ad alta velocità mentre i server di database sono accoppiati liberamente (loosely coupled) attraverso la rete. Il front-end riceve i dati e li visualizza, il back-end, d’altra parte, analizza e memorizza i dati provenienti dai processori di front-end. Un DB machine fornisce prestazioni superiori, incremento della memoria host, maggiore sicurezza per i database e costi di produzione ridotti”.

È chiaro che il termine chiave che definisce un DB machine è “soluzione integrata” hardware (server, rete, storage) e software (DBMS). Secondo questa definizione, ci sono 2 possibili implementazioni: un appliance software preconfigurato con l’hardware necessario per eseguire tale software (proposta tipica del fornitore DBMS) o un appliance hardware preconfigurato con il software necessario per essere eseguito su tale hardware (tipica proposta hardware del fornitore).

Anche se a prima vista le due architetture possono sembrare simili, ognuna di esse presenta vantaggi e svantaggi e le implicazioni della loro implementazione in un data center sono molto diverse.

db machine open - definition — db machine open – definition

In questo post analizzeremo entrambe le architetture con l’idea di fornire alcuni spunti di riflessione per orientarsi nella decisione di quale “appliance” rappresenta un’architettura valida in base ai requisiti applicativi e di business.

Leggi tutto “Database machine, soluzioni di tipo “open” (it)”

CloudIQ, monitoraggio proattivo e analisi predittiva con il Machine Learning (it)

Este post también está disponible en Español

Non è una novità che, quando si prende in considerazione la gestione di un sistema di storage, uno dei fattori più importanti da esaminare sia, dopo la semplicità di utilizzo, la qualità e le sue capacità del monitoraggio.

La quantità di metriche generate internamente da un’array è enorme. Molte volte tutte queste variabili comportamentali e gli indicatori di prestazione non sono facili da relazionare tra loro per ottenere una visione immediata dello stato reale del sistema.

Il motivo principale di questa difficoltà è che si basa sulla conoscenza della persona responsabile dello storage e sulla durata di tale analisi in modo che le conclusioni siano le più accurate possibili.

La chiave per ottenere valore da queste informazioni è attraverso l’analisi intelligente. Il sistema deve essere in grado di analizzare autonomamente i dati e generare, in modalità preventiva, indicatori in grado di anticipare i futuri requisiti di capacità o prestazioni e, allo stesso tempo, anticipare possibili anomalie.

In un post precedente avevo discusso l’uso del Machine Learning “all’interno” di un sistema di storage (PowerMax, la definizione di un array di Tier 0 con l’uso di ML).

In questo post esamineremo invece un software “esterno” all’array. Vedremo come questo software, CloudIQ, grazie all’uso di ML ci consenta di passare da un monitoraggio reattivo ad un approccio predittivo.

Leggi tutto “CloudIQ, monitoraggio proattivo e analisi predittiva con il Machine Learning (it)”

PowerMax, la definizione di un array di Tier 0 con l’uso di ML (it)

Este post también está disponible en Español

Non c’è dubbio che le applicazioni si siano evolute nel tempo per generare sempre più valore dai dati. Oggigiorno gran parte del software viene sviluppato per ottenere “insight” (approfondimenti) all’interno dei dati, utilizzando tecniche di intelligenza artificiale (AI) che consentono di offrire vantaggi competitivi alle imprese. Le nuove applicazioni intelligenti di “heavy analytics” (con analisi dei dati in tempo reale) rappresenteranno, secondo gli analisti di mercato, una parte sempre più importante all’interno del datacenter. Si stima che entro il 2020 il 60-70% dei data center avrà almeno un’applicazione di questo tipo. I datacenter dovrebbero trovare un modo per gestire le applicazioni tradizionali insieme a questo nuovo tipo di applicazioni.

Dovuto alla sempre maggiore capacità degli attuali sistemi di storage, una pratica comune potrebbe essere quella di far coesistere i due tipi di applicazioni in un unico sistema. Di fatto, la risposta del mercato a questo tipo di problematica è stato il consolidamento dei dati in un unico sottosistema di storage. In particolare, i sistemi di tipo AFA si presentano come una buona opzione poiché quando si esegue un consolidamento dei dati si ottiene un “mix di I/O”. Questo “mix” è un tipo di carico di lavoro casuale, (random workload) per il quale gli storage AFA sono i più indicati. Tuttavia, non sarà possibile prevedere il carico di lavoro delle nuove applicazioni che richiederanno prestazioni molto elevate e dovranno “apprendere” dai dati e adattarsi automaticamente a loro. In questo scenario, gli array AFA tradizionali avranno difficoltà a mantenere livelli di servizio adeguati (SLA). Sarà necessario un tipo di archiviazione, uno storage di livello 0 in grado di soddisfare i nuovi requisiti applicativi. Al di là della criticità del mantenimento degli SLA, vi è un secondo aspetto da considerare: al fine di ottenere il massimo beneficio dalle applicazioni intelligenti basate sull’uso di algoritmi di Machine Learning il sistema di storage deve essere in grado di interagire allo stesso modo.

In questo post scopriremo cosa significa un array “Tier 0”, il ruolo del ML in un’architettura Tier 0 e quali sono le sfide nella realizzazione di un sistema di storage di questo tipo.

Leggi tutto “PowerMax, la definizione di un array di Tier 0 con l’uso di ML (it)”

La replica dei dati in XtremIO X2, meccanismi evoluti di copia remota (it)

Este post también está disponible en Español

Uno dei driver principali nell’acquisto di uno storage di tipo AFA riguarda le prestazioni. Tuttavia, l’azienda ha anche altre esigenze tra cui, di particolare importanza, vi è la protezione dei dati.

Come protezione dei dati, mi riferisco alla possibilità di creare copie remote del sito di produzione in un secondo array. Una volta implementato un meccanismo di copia remota, le prestazioni di un array AFA inevitabilmente diminuiscono.

Nel caso delle replica sincrona, aggiungiamo il tempo di latenza della distanza. Nel caso di una replica asincrona, è necessario considerare attentamente la “larghezza di banda” del collegamento per consentire all’array di produzione di non “essere troppo indietro” con le scritture, altrimenti l’array di produzione deve svolgere un lavoro aggiuntivo per mantenere l’RPO.

In questo post esamineremo come XtremIO X2, grazie ad un’unica e particolare implementazione del meccanismo di replica asincrona, è in grado di mantenere un RPO molto basso riducendo al contempo la larghezza di banda necessaria per realizzare le copie.

Leggi tutto “La replica dei dati in XtremIO X2, meccanismi evoluti di copia remota (it)”

VPLEX, Storage Federation e sistemi AFA in un data center moderno (it)

Este post también está disponible en Español

Negli ultimi anni una pratica comune in molti data center è stata l’uso di “appliance” in grado di virtualizzare i sistemi di storage. Questa virtualizzazione, il cui obiettivo principale è stato la creazione di una piattaforma o un punto di gestione comune per i sistemi di storage virtualizzati, si è evoluta nel tempo per offrire nuove funzionalità. Ad esempio, queste “appliance” sono utilizzate per la creazione di cluster di storage che servono ad aumentare la disponibilità con la realizzazione di datacenter di tipo attivo / attivo.

La maggior parte dei data center utilizza oggi infrastrutture di tipo All Flash che offrono nuove funzionalità ai centri di elaborazione dati. Oltre all’aumento delle prestazioni, dovuto all’uso della tecnologia flash, gli storage di tipo AFA garantiscono una maggiore efficienza in termini di consumo, riduzione dello spazio fisico e dei dati grazie alle tecniche di “data reduction” (compressione e deduplica).

Date le particolari caratteristiche di uno storage AFA, è lecito chiedersi quali siano le possibili implicazioni dell’incapsulamento di un array All Flash sotto un’appliance che opera come virtualizzatore e se questa operazione possa essere considerata una “best practice”.

Inoltre, in questo post analizzeremo le differenze tra “storage virtualization” e “storage federation”, vedremo alcuni casi di utilizzo di queste architetture e ne esamineremo i benefici in un datacenter moderno.

Leggi tutto “VPLEX, Storage Federation e sistemi AFA in un data center moderno (it)”