El sueño inalcanzable de los ejecutivos es poder llevar a cabo sus operaciones sin problemas. Para que eso suceda, las cosas tienen que salir siempre de manera uniforme y sin dificultad. Sin embargo, no suele ser así.
Las empresas a menudo experimentan desafíos que interrumpen las operaciones y causan tiempos fuera de servicio costosos. Las investigaciones muestran que el tiempo fuera de servicio ha impactado al 82 % de las organizaciones en los últimos años. Teniendo en cuenta que el costo promedio del tiempo fuera de servicio es de 300 000 USD por hora, puede destruir empresas.
En el mundo digital, las empresas de todos los tamaños deben prepararse para lo peor. Los ataques de ransomware, las fugas de datos y los desastres naturales pueden causar daños irreparables a su negocio si no tiene un plan.
Sin un plan efectivo de copias de seguridad y recuperación después de un desastre, podría tomar días o semanas volver a funcionar después de un incidente. Esto significa una pérdida de ingresos y productividad que nunca podrá recuperar.
Afortunadamente, existe una manera de garantizar que su negocio esté protegido de interrupciones: el Objetivo de Tiempo de Recuperación (RTO). El RTO ayuda a las organizaciones a establecer objetivos realistas para restaurar sus sistemas después de una interrupción o ataque y minimizar el tiempo de inactividad. Si tiene un RTO como parte de su plan de copias de seguridad y recuperación después de un desastre, tendrá la tranquilidad de saber que pase lo que pase, está preparado.
Definición de Objetivo de Tiempo de Recuperación
Como se mencionó, las interrupciones y el tiempo fuera de servicio pueden ser altamente disruptivos para una empresa. Además, los sistemas y la infraestructura de TI tardan tiempo en recuperarse y volver a funcionar cuando suceden esos eventos. Y en algunos casos, pueden fallar y requerir de intervención para volver a funcionar.
Comprender esto es clave para reducir el impacto de esos incidentes. Debe saber cuánto tiempo tiene para que los sistemas vuelvan a funcionar antes de que interrumpan las operaciones. Y aquí es donde entran en juego los Objetivos de Tiempo de Recuperación.
El RTO es una métrica esencial que le ayudará a calcular el tiempo que toma restaurar su sistema o aplicación después de un período de tiempo fuera de servicio con una interrupción mínima de las operaciones comerciales. En resumen, es la cantidad de tiempo fuera de servicio que su empresa puede manejar cómodamente.
Cada sistema tiene un rol distinto e impacta operaciones diferentes, por lo que cada uno necesita un RTO único. Una vez que haya definido el RTO de cada sistema, podrá desarrollar una estrategia de recuperación para restaurar el sistema rápidamente.
Entonces, si el RTO es de una hora, el encargado de restaurar los sistemas deberá hacerlo dentro de ese plazo.
El Objetivo de Tiempo de Recuperación que establezca debe alinearse con las necesidades de su negocio. Por ejemplo, el RTO de un sistema de pagos en línea debería ser más corto que el de un sitio web de gestión de contenido. Esto le ayuda a asegurar que la estrategia de recuperación que establezca esté a la par con los riesgos a los que se enfrenta.
Por otro lado, una empresa que puede usar facturas manuales puede tener un RTO más largo, de 1 a 2 días o más.
Idealmente, los sistemas deberían volver a funcionar dentro del RTO previsto. No obstante, a veces eso no se logra.
Suele suceder en circunstancias extremas, como cuando los sistemas del proveedor de servicios se caen o después de un desastre natural.
En esos casos, considere externalizar las funciones críticas de TI en lugar de esperar a que los costos del tiempo fuera de servicio dejen a su empresa en quiebra. Así puede mantener su RTO bajo control, minimizar el tiempo fuera de servicio y, en última instancia, salvar a la compañía de posibles pérdidas.
¿Qué es el Objetivo de Punto de Recuperación?
El Objetivo de Punto de Recuperación (RPO) es una métrica similar al RTO. El RPO mide la cantidad máxima de datos que una organización está dispuesta a perder después de un incidente o interrupción.
Mientras el RTO se enfoca en el tiempo de recuperación del sistema, el RPO se enfoca en los objetivos de protección y recuperación de datos. El RPO mide la cantidad de datos que puede perder antes de que las operaciones comerciales se vean afectadas.
¿Cómo se comparan el RTO y el RPO?
El RTO y el RPO son dos métricas utilizadas en la planificación de copias de seguridad y recuperación después de un desastre. Si bien miden cosas diferentes, debe establecer ambas métricas con el mismo nivel de atención y consideración para las necesidades de su organización.
Similitudes entre el RTO y el RPO
Ambos se utilizan para medir la cantidad de tiempo que tarda un negocio en recuperarse después de un incidente o interrupción. Al establecer estas métricas, considere las necesidades de la organización, el perfil de riesgo, el presupuesto y otros factores.
Diferencias entre el RTO y el RPO
Se diferencian porque los RTO se centran en el tiempo que lleva poner los sistemas en marcha nuevamente, mientras que los RPO miden la cantidad de datos que una empresa puede perder antes de que las operaciones se vean impactadas.
¿Por qué es importante el Objetivo de Tiempo de Recuperación?
Hoy en día, un diferenciador clave entre los negocios es la tecnología que impulsa los procesos. Sin duda, la digitalización ha mejorado la eficiencia y la experiencia del cliente y ha transformado las operaciones comerciales.
Sin embargo, las empresas se han vuelto excesivamente dependientes de la tecnología, lo que solo es problemático cuando los sistemas se caen. Esto se debe a que el tiempo fuera de servicio es muy costoso. Por lo tanto, es esencial contar con RTO apropiados.
Además de los ingresos directos que perderá, el tiempo fuera de servicio también hace que deba comprometer horas no laborales para resolver el problema y gastar para reemplazar los sistemas de TI. Los costos totales pueden superar el millón de dólares si necesita reemplazar los sistemas de TI. Por eso es esencial estar preparado para el tiempo fuera de servicio y la recuperación.
Los RTO pueden ayudarle a hacer precisamente eso. Ayudan a las empresas mantener actualizado su proceso de recuperación y a reducir los retrasos causados por las interrupciones. También proporcionan un plan en caso de que haya un tiempo fuera de servicio inesperado, lo que permite que el negocio vuelva a funcionar y al mismo tiempo minimiza las pérdidas rápidamente.
Cómo calcular el RTO
Calcular el RTO puede ser complicado e involucra múltiples componentes, como el costo del tiempo fuera de servicio, inversiones en soluciones de recuperación ante desastres y copias de seguridad, costos de personal para reactivar los sistemas, requisitos normativos y otros factores.
Para determinar el RTO, es importante considerar todos estos componentes y establecer un cronograma basado en el perfil de riesgo y presupuesto de una organización. Además, debe tomar en cuenta lo siguiente:
- Frecuencia de la interrupción: con qué frecuencia ocurre un tipo particular de interrupción
- Severidad de la interrupción: cuán graves son las consecuencias de una interrupción
- Costo de la interrupción: cuánto dinero le costará una interrupción a la organización
- Duración de la interrupción: cuánto durará la interrupción
- Impacto de la interrupción: el impacto económico y social del tiempo fuera de servicio en su negocio
Con esto en mente, ahora puede calcular el RTO. Estos son los pasos que debe seguir:
- Calcule el tiempo fuera de servicio máximo aceptable para cada proceso esencial
- Determine los recursos necesarios para cada proceso clave
- Calcule la cantidad de tiempo necesario para adquirir o fabricar las herramientas esenciales para cada procedimiento fundamental
- Para determinar su Objetivo de Tiempo de Recuperación, agregue el período de tiempo fuera de servicio máximo aceptable y el tiempo requerido para adquirir o crear recursos
Muchos factores pueden influir en el logro del RTO. Por lo tanto, es crucial contar con los planes adecuados de copias de seguridad y recuperación después de un desastre.
Cómo los planes de copias de seguridad y recuperación después de un desastre le ayudan a lograr el RTO
Las soluciones de copias de seguridad y los planes de recuperación después de un desastre son esenciales para lograr el RTO. Estas soluciones permiten que una organización se recupere rápidamente del tiempo fuera de servicio, la pérdida de datos u otras interrupciones.
Su plan de copias de seguridad debe tener un RTO asegurado en los Acuerdos de Nivel de Servicio (SLA) con su proveedor. También debe proporcionarle las siguientes capacidades:
Lograr los Objetivos de Tiempo de Recuperación de su negocio es posible gracias a las soluciones de copias de seguridad y recuperación después de un desastre, que vienen con diversas funcionalidades. Para sacar el máximo provecho de dichas soluciones y obtener resultados de RTO cercanos a cero, preste atención a estas importantes funciones.
Capacidades de recuperación instantánea
Para alcanzar sus ambiciosos objetivos de RTO cercanos a cero, debe tener una opción de recuperación que proporcione resultados instantáneos. Es por eso que debería tener una capacidad de restauración instantánea como parte de su estrategia de recuperación después de un desastre. Esto le permite iniciar la máquina guardada directamente desde el almacenamiento de las copias de seguridad y operarla virtualmente en una condición lista para usar, como en el almacenamiento en la nube.
Esto es indispensable para las empresas que necesitan mantenerse al día con las operaciones durante un tiempo fuera de servicio inesperado. También beneficia a las empresas que necesitan restaurar datos específicos rápidamente, como las del sector salud.
Políticas de programación flexibles
Tener políticas de RPO flexibles y ajustables es esencial para alcanzar el RTO. Puede ajustar su RPO de acuerdo a las necesidades actuales de la organización.
Por ejemplo, puede ajustar las políticas de RPO si hay un cambio en los requisitos del RTO. Además, dado que los RPO se configuran típicamente para procesos o aplicaciones específicos, ajustarlos es más fácil y eficiente.
i) Protección de datos continua
Tener objetivos de RTO establecidos requiere protección de datos continua (Continuous Data protection, CDP). Esto asegura que todos sus datos tengan copias de seguridad y estén protegidos, sin importar la frecuencia con que cambien. La CDP también le permite restaurar datos perdidos o corruptos rápidamente.
Aunque la CDP se puede usar para cargas de trabajo críticas, puede causar problemas de rendimiento y estabilidad debido a su alto uso de recursos. Por lo tanto, la CDP se implementa principalmente en copias de seguridad a nivel archivo.
ii) Protección casi continua de datos
La protección casi continua de datos (Near Continuous Data Protection, NCDP) es una política de RPO que garantiza copias de seguridad y restauraciones casi en tiempo real. También proporciona un RTO limitado de unos minutos con un impacto mínimo en el rendimiento. Esto significa que puede restaurar fácilmente los datos tan pronto como se pierden.
Las soluciones de NCDP son perfectas para organizaciones que necesitan mantener objetivos de RTO cercanos a cero. Sin embargo, al igual que el CDP, el NCDP aún puede causar impactos adversos en el rendimiento y la estabilidad debido a sus requerimientos de consumo de recursos.
Recuperación granular
Tener capacidades de recuperación granular le permite recuperar archivos individuales de una copia de seguridad en lugar de restaurar un conjunto de datos completo. Esto puede ser extremadamente útil en escenarios de RTO, ya que le permite restaurar rápidamente archivos u objetos individuales sin esperar a que se restaure todo el conjunto de datos.
La recuperación granular también ayuda con las políticas de RTO que dependen de los resultados específicos de ciertos procesos. Asegura que solo se restauren los componentes afectados de estos procesos y no otros.
Copia fuera del sitio para recuperación después de un desastre
A medida que se prepara para lograr sus objetivos de RTO, es esencial contar con una copia de sus datos fuera del sitio. Esto se debe a que un repositorio de datos secundario le permitirá recuperarse rápidamente de desastres o interrupciones en su ubicación de almacenamiento principal.
Replicación en vivo con conmutación por error
La replicación en vivo con capacidades de conmutación por error es otra funcionalidad relacionada con el RTO que debe considerar. Esto le permite mantener sus datos disponibles en tiempo real y elimina la necesidad de intervención manual al restaurar datos perdidos.
También permite a las organizaciones cambiar rápidamente entre sitios primarios y secundarios en caso de falla o interrupción en una ubicación. La replicación en vivo con conmutación por error ayuda a las organizaciones a mantener los objetivos del RTO con interrupciones y tiempo fuera de servicio mínimos.
Consejos para planear la recuperación después de un desastre
Una estrategia de RTO es esencial para las organizaciones que deben garantizar la continuidad operativa durante las interrupciones. Aquí hay algunos consejos para planificar estrategias de RTO:
Asegúrese de que la empresa y el departamento de TI están vinculados
Elaborar un plan de recuperación después de un desastre es complicado, y, aun si se conocen las prácticas recomendadas para hacerlo, ajustarse a un presupuesto tiende a ser la prioridad. Al crear estos planes, el costo debería tomar el segundo lugar en la lista de prioridades, y la primera debería ser apegarse a las prácticas recomendadas del sector.
Por último, pero no menos importante, debe sincronizar las capacidades de la empresa y sus expectativas.
Tenga un plan de recuperación después de un desastre
Su estrategia de RTO debe incluir un plan exhaustivo de recuperación después de un desastre. El plan debe listar los pasos que debe seguir el personal para recuperarse en caso de interrupciones y enumerar los roles y responsabilidades de los diferentes equipos.
El plan de recuperación después de un desastre también debe incluir información sobre el RPO, el RTO, las copias de seguridad de datos, cronogramas de replicación y el proceso para poner el plan a prueba.
Ponga a prueba el plan de recuperación después de un desastre
Poner a prueba el plan de recuperación después de un desastre es esencial para que la empresa opere de nuevo de forma puntual y sin problemas. Si bien este proceso puede ser complicado para muchos departamentos de TI, las pruebas del plan de recuperación se deben hacer hasta el nivel de aplicación. De lo contrario, los problemas serán inevitables. Para estar completamente preparado para un desastre, se necesita tener en cuenta cualquier problema posible antes de que ocurra.
Las pruebas de recuperación después de un desastre no deben tomarse a la ligera, sino que se debe hacer una prueba exhaustiva de extremo a extremo hasta el nivel de producción. El enfoque principal de la recuperación después de un desastre no debe ser solo los servidores sino las aplicaciones, pues hay complejidades como los servidores de clientes de múltiples niveles y estructuras basadas en la web con dependencias entre sí.
Si no hay una buena preparación, es más probable que surjan problemas. Por lo tanto, estas pruebas deben hacerse correctamente hasta alcanzar el nivel de aplicación para asegurar que la empresa pueda soportar cualquier posible desastre.
Están surgiendo nuevas amenazas y las existentes están evolucionando, por lo que su plan de recuperación después de un desastre no puede seguir siendo el mismo. Debe ponerse a prueba y actualizarse periódicamente para cumplir con las tendencias y amenazas actuales.
Defina las responsabilidades de recuperación después de un desastre
Tener objetivos de tiempo de recuperación definidos es un factor crítico para el éxito de cualquier plan de RTO. Es esencial asignar responsabilidades a ciertos departamentos o equipos y asegurar que comprendan sus funciones específicas.
También es importante asegurarse de que todos estén al tanto de cualquier cambio o actualización del plan de RTO para que puedan actuar rápidamente en caso de un desastre. Esto es especialmente importante a la hora de tomar decisiones y determinar quién debe ser responsable de ciertas tareas durante una interrupción o pérdida de datos.
Actualice el plan de RTO regularmente
Otro paso clave es actualizar su plan regularmente. Esto incluye actualizarlo con nueva información de RPO, RTO y copia de seguridad de datos y cambiar los procesos o procedimientos existentes que ya no son pertinentes. Además, si actualizó recientemente alguna de sus aplicaciones o sistemas, estos cambios también deben reflejarse en el plan de RTO.
Establezca metas realistas
Es importante tener objetivos realistas a la hora de crear su plan de RTO. Estos objetivos deben incluir metas a corto y largo plazo, como restaurar operaciones críticas dentro de una ventana de tiempo particular o hacer que un sistema vuelva a su operación completa en un cierto período de tiempo.
Para garantizar que los objetivos de RTO sean realistas y asequibles, es importante considerar el estado actual de la tecnología, los recursos disponibles y cualquier amenaza o riesgo potencial que pueda encontrar durante una interrupción o pérdida de datos. Una vez que establezca los objetivos de tiempo de recuperación, pruébelos periódicamente para asegurarse de que aún sean viables.
Tenga buenas copias de seguridad
Cuando se trata de RTO, es esencial contar con copias de seguridad confiables y actualizadas. Para mayor protección, se deben hacer copias de seguridad de los datos con regularidad, preferiblemente en múltiples plataformas. Además, al hacer una copia de seguridad de los datos, asegúrese de que se guarde la versión más reciente de los datos para reducir cualquier pérdida.
Las copias de seguridad también pueden ayudar a las empresas a recuperarse más rápido en caso de una brecha de RTO o RPO. Tener las copias de seguridad adecuadas hará que sea más fácil restaurar los datos y los sistemas con un tiempo fuera de servicio e interrupciones mínimas.
¿En qué puede ayudarle Veritas?
Las empresas que buscan soluciones confiables para su objetivo de tiempo de recuperación deben considerar a Veritas. Las soluciones de Veritas ayudan a las empresas a restaurar las operaciones de manera rápida y efectiva si hay brechas de RTO y RPO. Cuentan con una amplia gama de herramientas automatizadas, análisis y capacidades de RTO de extremo a extremo que permiten a las empresas planificar y responder a las amenazas de manera proactiva.
Estos son algunos de los beneficios de trabajar con Veritas:
- Planificación automatizada de RTO y RPO: Nuestras soluciones proporcionan una planificación automatizada, lo que garantiza que las empresas estén preparadas para cualquier amenaza de RTO o incumplimientos de RPO. Esto puede ayudar a las empresas a evitar amenazas potenciales y minimizar la interrupción en caso de una infracción.
- Capacidades de RTO de extremo a extremo: las capacidades integrales de Veritas incluyen copias de seguridad de datos, pruebas de recuperación y planificación de RPO y RTO, lo que garantiza que las empresas tengan un plan integral de objetivos de tiempo de recuperación.
- Análisis e informes: ofrecemos análisis e informes, que pueden ayudar a las empresas a monitorear las tendencias de RTO e identificar posibles amenazas de RTO. Esto puede ayudar a las empresas a anticipar las fugas y disminuir las interrupciones si sucediera una.
- Análisis avanzado: las soluciones de Veritas para el RTO también proporcionan análisis avanzados que ayudan a las empresas a analizar las tendencias de RTO y RPO para obtener mejores conocimientos sobre su estrategia.
Un plan RTO es esencial para las empresas que desean reducir el tiempo fuera de servicio y las interrupciones en caso de incumplimientos de RTO o RPO. Es importante tener objetivos realistas y viables, así como copias de seguridad confiables y capacidades de objetivo de tiempo de recuperación de extremo a extremo.
Las soluciones de objetivo de tiempo de recuperación de Veritas pueden ayudar a las empresas a prepararse para las amenazas de RTO y minimizar las interrupciones en caso de una fuga. Con las soluciones de Veritas, puede planificar proactivamente el RTO y el RPO y usar análisis para rastrear tendencias e identificar amenazas potenciales.
Entonces, ponte en contacto con nosotros hoy para obtener más información sobre nuestras soluciones y aprender cómo podemos ayudarte a preparar una estrategia integral.
Los clientes de Veritas incluyen el 95 % de la lista Fortune 100, y NetBackup™ es la opción número uno para las empresas que buscan proteger grandes cantidades de datos.
Descubra cómo Veritas mantiene sus datos completamente protegidos a través de cargas de trabajo virtuales, físicas, en la nube y heredadas con los servicios de protección de datos para grandes empresas.
Preguntas más frecuentes