Por: Oscar Valverde

|

21 Ago, 2015

Desde sus orígenes, la corriente principal al problema de recuperación de desastres ha sido implementar un Data Center alterno en un lugar distante. En los años 60 surgieron proveedores que ofrecían como servicio un Data Center especializado en recuperación de desastres, para usarse en caso de una eventualidad en el cliente. Otras organizaciones, en lugar de contratar un servicio, optaron por la solución de construir su propio Data Center alterno. Ambas modalidades se siguen usando hoy en día.

La Computación en la Nube crea nuevas posibilidades para recuperarse. En lugar de contratar los servicios tradicionales de un proveedor o de construir su propio Data Center alterno, las empresas tienen hoy la posibilidad de usar la Nube para recuperarse de un desastre.

Es importante conocer cómo se puede usar la Nube para recuperación de desastres. Las inversiones asociadas a la recuperación de desastres son altas y la Nube promete reducir costos. Sin embargo, recuperarse en la Nube también conlleva nuevos riesgos y en algunos casos también desventajas. Entender las diferencias ayudará a tomar mejores decisiones de dónde y cómo invertir.

Este artículo busca ayudar a las empresas a mejorar sus decisiones de inversión en recuperación de desastres. El artículo repasa el enfoque tradicional usado y analiza las nuevas posibilidades que ofrece la Nube, sus ventajas y riesgos. Al final presenta elementos clave que las empresas deben tomar en cuenta al valorar la Nube como una opción para la recuperación de desastres.

El enfoque tradicional

La mayoría de las empresas siguen un mismo camino para resolver su problema de recuperación de desastres. La solución tradicional ha sido contar con una infraestructura de TI redundante en un sitio remoto (ver figura 1).

La solución se construye a partir de cinco componentes primarios. La forma en que estos se seleccionan determina el costo y el tiempo de recuperación. Esto hace que cada solución sea particular.

  • El Data Center alterno
  • El aprovisionamiento de los equipos
  • La replicación de la información
  • La replicación de las configuraciones
  • Las comunicaciones para el acceso de los usuarios al Data Center alterno

 Dos modelos principales

Al implementar el enfoque tradicional, las empresas deben decidir entre dos modelos posibles.

La decisión dependerá de si se comparten los recursos o no. Por ejemplo, los cinco componentes mencionados pueden ser compartidos con otras organizaciones y así reducir costos. De igual forma los equipos pueden compartirse, e inclusive, aunque en menor grado, algunos elementos de los mecanismos de replicación.

Estos modelos se conocen como:

  • El modelo dedicado donde los componentes son dedicados exclusivamente a una única organización.
  • El modelo compartido en el que algunos o todos los componentes son compartidos con múltiples organizaciones.

No necesariamente una solución pertenece 100% al modelo dedicado o 100% al modelo compartido, más bien podría tener un poco de cada modelo.

Los dos problemas del enfoque tradicional 

1. El problema de la relación tiempo-costo:

En el enfoque tradicional el tiempo de recuperación y el costo tienen una relación inversamente proporcional. Por tiempo de recuperación nos referimos al tiempo que demora la infraestructura redundante en estar lista para soportar al negocio en el evento de un desastre. Decimos que la relación es inversamente proporcional porque si se necesita que la infraestructura redundante esté lista rápidamente, se deberá pagar el costo más alto.

Por el contrario, si es necesario reducir el costo, se deberá sacrificar el tiempo de recuperación. Este es el problema más evidente y común al diseñar soluciones de recuperación de desastres (ver figura 2) ¿Sabe por qué es tan difícil justificarle al CFO las inversiones para recuperación de desastres? No, no es sólo por el costo. El costo siempre es importante, pero lo que realmente es difícil es justificar una inversión que estará ociosa, esperando a que suceda un desastre poco probable.

2. El problema de la cobertura

¿Sabe por qué a pesar de haber implementado un DRP (Disaster Recovery Plan) los servicios de TI se siguen cayendo? La razón es que el enfoque tradicional no soluciona la totalidad del problema.

Este segundo problema es posiblemente más grave que el primero, aunque no necesariamente tan evidente. Dice un refrán que “las sonrisas son como las curitas, cubren la herida pero no calman el dolor”. Cuando se usa el enfoque tradicional, la curita ni siquiera cubre la herida apropiadamente.

Los desastres no son la causa más frecuente de interrupción en los negocios. En la figura 3 se muestra el resultado de una investigación reciente de Gartner sobre la causa raíz de las interrupciones. Existen otras investigaciones, pero la mayoría coinciden en identificar a las personas y a los procesos como el lugar dónde se encuentra la causa raíz principal.

El problema que las empresas necesitan resolver es reducir las interrupciones, sin importar su causa.

Cuando el problema se reduce a desastres naturales o fallas técnicas, se está dejando por fuera la causa principal de las interrupciones en los negocios. No pareciera ser de sentido común continuar gastando el presupuesto completo en una medicina que no cura la enfermedad.

Recuperación de Desastres basado en la Nube

La Nube ofrece tres tipos de servicios para recuperarse de un desastre. La diferencia entre ellos radica en cuáles responsabilidades asume el cliente y cuáles el proveedor de servicios. Cada empresa deberá valorar cuál de estos, o combinación de ellos, se ajusta más a sus necesidades específicas.

Los servicios se describen a continuación:

  1. Infraestructura como Servicio (IaaS)
    El proveedor de servicios se encarga de los backups de las VM desde el Data Center de producción hasta el cloud, el cliente solicita la restauración de las VM (adentro o fuera de la nube) y el cliente gestiona los ejercicios de recuperación (adentro o fuera de la nube)
  2. Backup como Servicio (BaaS)
    El proveedor de servicios se encarga de los backups de las VM desde el Data Center de producción hasta el cloud, el cliente solicita la restauración de las VM (adentro o fuera de la nube) y el cliente gestiona los ejercicios de recuperación (adentro o fuera de la nube)
  3. Recuperación de Desastres como Servicio (DRaaS)
    El proveedor de servicios se encarga de la replicación de las máquinas virtuales (VM), y opcionalmente, la replicación de las máquinas físicas (PM) del Data Center de producción a la nube, la activación de las VM/PM dentro de la nube y los ejercicios de recuperación en la nube.

 Las oportunidades de la Nube

La principal oportunidad de la Nube es el costo ya que promete costos reducidos consistentes con el modelo compartido, pero con los tiempos de recuperación del modelo dedicado (ver figura 4 ).

Además, la Nube ofrece otros beneficios, entre los cuáles se encuentran los siguientes:

  • Simplifica la gestión de la recuperación de desastres al delegar tareas en el proveedor.
  • El cliente obtiene una infraestructura dedicada, aunque de forma virtual.
  • El formato de pagar por uso ayuda a reducir el CAPEX (gastos de capital) y da mayor flexibilidad.
  • Permite escalar cuando las condiciones lo requieran, ya sea durante una prueba o un desastre real.
  • Al tener la Nube mayor diversidad geográfica reduce de forma natural el riesgo de que un mismo evento afecte los dos sitios a la vez.

 

Desafíos de la Nube

Recuperarse en la Nube podría ser complejo para operaciones grandes. Si bien hay implementaciones y pilotos para ambientes pequeños y medianos, todavía hay poca experiencia para ambientes grandes de más de 100 máquinas virtuales.

Sin embargo, esta limitación podría no ser válida pronto en algún momento, conforme se adquiera madurez y experiencia en este tipo de implementaciones.

La replicación exige buena latencia y ancho de banda. Esta condición podría encarecer el proyecto o hacerlo no factible técnicamente. Los requerimientos de latencia y ancho de banda deben ser abordados desde muy temprano en el proyecto.

Si tiene Sistemas Heredados (Legacy Systems), considere que estos sistemas podrían no estar listos para el Cloud. Por su antigüedad, estos sistemas tal vez no puedan virtualizarse. Si es así, va a requerir máquinas físicas para estos sistemas y esto puede impactar el costo.

Cumplir con los requerimientos regulatorios y de seguridad puede ser una limitante. Si bien es cierto que los proveedores líderes en Cloud cumplen con las principales regulaciones y estándares de seguridad, no necesariamente cumplen con una regulación específica de un cliente o de un país.

Otro aspecto a considerar son los costos ocultos, antes de contratar el servicio, revise costos ocultos en ejercicios, declaraciones y colocación de máquinas físicas (PM), entre otros.

Si está considerando opciones para recuperarse de un desastre, no olvide incorporar la Nube dentro de su análisis. La Nube no le ayudará con el problema de cobertura. Pero los ahorros que consiga sí.

Puede aprovechar los ahorros y dirigirlos a remediar las interrupciones causadas por las personas y los procesos. Así al fin podrá resolver el 100% del problema de las interrupciones en su organización.


Edición #63

Business transformation Edicion #63

Contenido

  • Programa GBM Education Technology (GET)
  • Power 8 instalado en sistema financiero de Honduras
  • GBM Informe Social-Ambiental
  • GBM completa adquisición de LatCapital
  • Business Transformation: Una revolución en TI
  • Cobertura especial
  • ¿Cómo recuperarse en la Nube?
  • Convirtiendo los datos en un activo estratégico
  • Rediseñando la empresa y el internet of things
  • Cinco pasos para obtener visibilidad operativa
  • ¿Estamos administrando las decisiones de la manera correcta?
  • Predecir o perecer
  • Outsourcing: ¿una estrategia de innovación o moda?
  • Liderazgo de TI en el mundo digital: retos y oportunidades
  • Crowdfunding: dinero para los emprendedores e innovadores
  • Big Data ya no está limitado a las grandes empresas
  • Geek