Comprender la alta disponibilidad
¿Qué es la alta disponibilidad?
En términos sencillos, la alta disponibilidad (HA) es la capacidad de un servicio para seguir funcionando a pesar de los fallos que se produzcan en su entorno. Puede lograr la alta disponibilidad diseñando un sistema sin un único punto de fallo. En un sistema de alta disponibilidad, las cargas de trabajo se distribuyen entre un clúster de nodos de servidor. Si un nodo de servidor falla, las cargas de trabajo que se ejecutan en él se trasladan automáticamente a otros servidores. Esto ayuda a garantizar que las aplicaciones críticas sigan funcionando incluso cuando se producen problemas en otras partes del sistema.
El objetivo principal de la alta disponibilidad es minimizar el impacto que el tiempo de inactividad y las interrupciones del servicio tienen en los procesos empresariales de una organización.
Un común concepto erróneo de alta disponibilidad es que un sistema informático estará disponible las 24 horas del día, los 7 días de la semana. Incluso en el nivel más alto de alta disponibilidad, una organización debe prepararse para un pequeño porcentaje de tiempo de inactividad planificado o no planificado, que un acuerdo de nivel de servicio (SLA) suele definir con «cinco nueves» como el nivel más alto de disponibilidad.
¿Cuánta alta disponibilidad necesita?
Si preguntara a la gente cuánto deben protegerse sus sistemas informáticos contra el tiempo de inactividad, la respuesta obvia sería 24 horas al día, 7 días a la semana, siempre disponibles; sin embargo, esto es increíblemente difícil y costoso de lograr.
Antes de que cualquier organización pueda plantearse una estrategia de alta disponibilidad, es necesario análisis del impacto en el negocio Es necesario identificar los procesos empresariales críticos y el riesgo relacionado con el tiempo de inactividad planificado y no planificado de los sistemas informáticos interconectados.
Aunque algunas organizaciones pueden requerir el nivel más alto de disponibilidad, muchas no lo hacen. Además, No todos los servicios de TI son críticos para el negocio.Por lo tanto, para algunas organizaciones puede resultar más aceptable y económico contar con un SLA de alta disponibilidad del 99 % en lugar de uno del 99,999 %.
📓 Un ejemplo sencillo podría ser un supermercado que requiere que su sistema de pago en línea esté disponible al más alto nivel de disponibilidad. El impacto de no disponer de este servicio puede suponer pérdidas para el negocio, ya que los clientes no podrán realizar ninguna compra si no llevan dinero en efectivo. Sin embargo, el mismo supermercado se vería menos afectado si el sistema de impresión de la trastienda dejara de funcionar durante unos minutos debido a una interrupción planificada o imprevista.
Determine los requisitos de alta disponibilidad con un análisis del impacto en el negocio (BIA).
Antes de decidir una estrategia de alta disponibilidad, una organización debe llevar a cabo un análisis del impacto en el negocio (BIA) para determinar la gravedad del impacto que las interrupciones y el tiempo de inactividad relacionados con la TI tienen en los procesos críticos del negocio e identificar los requisitos necesarios para garantizar la continuidad de las operaciones.
A análisis del impacto en el negocio puede variar de una organización a otra, pero normalmente incluye lo siguiente:
Identifica los procesos empresariales críticos.
Calcula el riesgo cuantificable de pérdidas debidas a interrupciones y tiempos de inactividad de los sistemas informáticos.
Tiene en cuenta las funciones empresariales esenciales, las personas y las dependencias empresariales.
Se basa en datos recopilados a través de entrevistas BIA con los empleados.
En última instancia, el BIA permitirá a la organización ver cómo se vería afectada una empresa si se eliminaran los procesos empresariales durante las interrupciones o el tiempo de inactividad de los sistemas informáticos. Ayuda a la organización a determinar qué procesos empresariales son los más críticos para el funcionamiento continuo y contribuye a la creación de un plan de recuperación.
Objetivos clave de recuperación
Al considerar la alta disponibilidad, hay que tener en cuenta lo siguiente: dos parámetros clave que definen cuánto tiempo puede permitirse su organización estar fuera de línea y cuánta pérdida de datos puede tolerar. Estos parámetros son el objetivo de tiempo de recuperación (RTO) y el objetivo de punto de recuperación (RPO).
Cómo medir la alta disponibilidad
La alta disponibilidad se mide en porcentaje del tiempo que un servicio está disponible para los usuarios, y a menudo se expresa mediante el número de nueves en los dígitos. Cinco nueves se utiliza para describir un sistema informático continuidad con un tiempo de actividad del 99,999 %En otras palabras, el sistema o servicio informático solo está indisponible durante 5,39 minutos al año por paradas programadas o no programadas.

Lograr una alta disponibilidad del 99,999 % a lo largo del tiempo es un reto increíblemente difícil.Es caro debido a los costes de funcionamiento de la infraestructura física de hardware y los componentes de software, y los componentes adicionales aumentan la complejidad y el riesgo. Para muchos servicios o redes, tres o cuatro nueves serían más eficaces y justificados en cuanto a los recursos y los costes que implican.

