Comprendere l’alta disponibilità
Che cos'è l'alta disponibilità?
In termini semplici, l'alta disponibilità (HA) è la capacità di garantire la continuità operativa di un sistema o di un servizio. Ciò significa che, in caso di guasto di un componente o di un servizio, il sistema è in grado di ripristinare automaticamente il capacità di un servizio di continuare a funzionare nonostante i guasti all'interno del proprio ambienteÈ possibile ottenere l'alta disponibilità progettando un sistema senza singoli punti di errore. In un sistema ad alta disponibilità, i carichi di lavoro sono distribuiti su un cluster di nodi server. Se un nodo server si guasta, i carichi di lavoro in esecuzione su di esso vengono automaticamente trasferiti ad altri server. Ciò contribuisce a garantire che le applicazioni critiche continuino a funzionare anche quando si verificano problemi in altre parti del sistema.
L'obiettivo principale dell'alta disponibilità è quello di ridurre al minimo l'impatto dei tempi di inattività e delle interruzioni avere sui processi aziendali di un'organizzazione.
Un comune malinteso L'obiettivo principale dell'alta disponibilità è garantire che un sistema IT sia disponibile 24 ore su 24, 7 giorni su 7. Anche al massimo livello di HA, un'organizzazione dovrebbe comunque prepararsi a una piccola percentuale di tempi di inattività pianificati o non pianificati, che uno SLA definisce solitamente con "cinque nove" come livello massimo di disponibilità.
Di quale livello di alta disponibilità avete bisogno?
Se si chiedesse alle persone quanto dovrebbero essere protetti i loro sistemi IT dai tempi di inattività, la risposta ovvia sarebbe 24 ore su 24, 7 giorni su 7, sempre disponibili; tuttavia, ciò è estremamente impegnativo e costoso da realizzare.
Prima che qualsiasi organizzazione possa prendere in considerazione una strategia per l'alta disponibilità, è necessario un adeguato analisi dell'impatto sul business è necessario per identificare i processi aziendali critici e i rischi correlati ai tempi di inattività pianificati e non pianificati dei sistemi IT interconnessi.
Sebbene alcune organizzazioni possano richiedere il massimo livello di disponibilità, molte altre non lo necessitano. Inoltre, Non tutti i servizi IT sono fondamentali per l'azienda.Pertanto, per alcune organizzazioni potrebbe essere più accettabile ed economico avere uno SLA di alta disponibilità del 99% anziché del 99,999%.
📓 Un esempio semplice potrebbe essere quello di un supermercato che richiede che il proprio sistema di pagamento online sia disponibile al massimo livello di disponibilità. L'impatto della mancata disponibilità di questo servizio può comportare una perdita per l'azienda, poiché i clienti non saranno in grado di effettuare acquisti se non dispongono di contanti. Lo stesso supermercato, tuttavia, risentirà meno dell'impatto se il sistema di stampa nel back office dovesse rimanere offline per alcuni minuti a causa di un'interruzione pianificata o non pianificata.
Determinare i requisiti di alta disponibilità con un'analisi dell'impatto sul business (BIA)
Prima di adottare una strategia di alta disponibilità, un'organizzazione dovrebbe condurre un'analisi dell'impatto sul business (BIA) per determinare la gravità dell'impatto che le interruzioni e i tempi di inattività legati all'IT hanno sui processi aziendali critici e per identificare i requisiti necessari a garantire la continuità delle operazioni.
A analisi dell'impatto sul business può variare da un'organizzazione all'altra, ma solitamente comprende quanto segue:
Identifica i processi aziendali critici.
Calcola il rischio misurabile di perdita dovuto a interruzioni e tempi di inattività dei sistemi informatici.
Considera le funzioni aziendali essenziali, le persone e le dipendenze aziendali.
Si basa sui dati raccolti tramite interviste BIA con i dipendenti.
In definitiva, la BIA consentirà all'organizzazione di valutare l'impatto che avrebbe sulla propria attività l'interruzione dei processi aziendali in caso di guasti/interruzioni dei sistemi IT. Aiuta l'organizzazione a determinare quali processi aziendali sono più critici per la continuità operativa e contribuisce alla creazione di un piano di ripristino.
Obiettivi chiave di recupero
Quando si considera l'alta disponibilità, occorre considerare due parametri fondamentali che definiscono per quanto tempo la vostra organizzazione può permettersi di rimanere offline e quanta perdita di dati può tollerare. Questi parametri sono il Recovery Time Objective (RTO) e il Recovery Point Objective (RPO).
Come misurare l'alta disponibilità
L'alta disponibilità è misurata in percentuale di tempo in cui un servizio è accessibile agli utenti, spesso indicata dal numero di nove nelle cifre. Cinque nove è utilizzato per descrivere un sistema informatico continuità con un tempo di attività del 99,999%In altre parole, il sistema o il servizio IT è indisponibile solo per 5,39 minuti durante tutto l'anno a causa di interruzioni pianificate o non pianificate.

Raggiungere un livello di alta disponibilità pari al 99,999% nel tempo rappresenta una sfida considerevole.È costoso a causa dei costi di gestione dell'infrastruttura hardware fisica e dei componenti software, e i componenti aggiuntivi aumentano la complessità e il rischio. Per molti servizi o reti, tre o quattro nove sarebbero più efficaci e giustificati in termini di risorse e costi coinvolti.

