정보 센터

RTO 이해: RTO를 계산하고 최적의 결과를 위해 백업 및 재해 복구 계획을 활용하는 방법

모든 기업 임원이 최소한 바라는 것은 원활한 운영입니다. 순조로운 상황에서는 큰 문제가 없기 때문입니다. 하지만 그런 경우는 드뭅니다.

기업에서는 운영에 차질을 빚고 결국 막대한 비용이 드는 다운타임으로 이어지는 문제가 종종 발생합니다. 연구에 의하면, 지난 몇 년간 다운타임의 영향을 받은 기업이 82%에 달했습니다. 다운타임 때문에 치러야 하는 비용이 평균 30만 달러에 이르는 만큼 비즈니스에 큰 타격이 될 수 있습니다.

오늘날의 디지털 세계에서는 규모에 관계없이 모든 기업이 최악의 상황에 대비해야 합니다. 랜섬웨어 공격, 데이터 유출, 자연 재해는 무방비 상태의 기업에 돌이킬 수 없는 피해를 줄 수 있습니다.

효과적인 백업 및 재해 복구 계획이 없으면 사고 이후 운영을 정상화하기까지 며칠, 심지어 몇 주가 걸릴 수도 있습니다. 그로 인한 수익 및 생산성 손실은 결코 회복할 수 없습니다.

다행히 그러한 위험으로부터 비즈니스를 보호할 방법이 있습니다. 바로 복구 시간 목표(RTO)입니다. 기업은 RTO를 통해 장애나 공격이 발생하더라도 시스템을 복원하여 다운타임을 최소화하기 위한 현실적인 목표를 세울 수 있습니다. 백업 및 재해 복구 계획의 일부로 RTO를 사용함으로써 어떤 일이 벌어져도 복구 가능하다는 것을 확신하면서 안심할 수 있습니다.

복구 시간 목표(RTO)의 정의

앞서 언급한 대로, 장애 및 다운타임이 비즈니스에 큰 타격을 줄 수 있습니다. 게다가 이러한 문제가 발생하면 IT 시스템과 인프라스트럭처가 다시 가동하고 최적의 상태로 운영될 때까지 시간이 걸립니다. 물론 실패할 때도 있습니다. 그러면 재작동하기 위한 개입이 필요합니다.

이러한 점을 알고 있어야 사고의 영향을 최소화할 수 있습니다. 운영에 차질을 빚기 전에 시스템을 다시 가동하고 실행하는 데 사용할 수 있는 시간을 알아야 합니다. 여기에 RTO의 역할이 있습니다.

RTO는 다운타임이 발생한 후 비즈니스 운영에 대한 차질을 최소화하면서 시스템 또는 애플리케이션을 복원하는 데 걸리는 시간을 계산하는 데 도움이 되는 필수 메트릭입니다. 즉, 해당 기업이 감당할 수 있는 다운타임의 양입니다.

서로 다른 시스템은 운영에 영향을 미치는 역할도 다르기 때문에 각각 고유한 RTO가 필요합니다. 각 시스템에 대해 RTO를 정의한 다음 신속한 시스템 복원을 위한 복구 전략을 개발할 수 있습니다.

따라서 RTO가 1시간이라면, 담당자는 이 기간 내에 시스템을 정상화해야 합니다.

RTO는 비즈니스 니즈에 부합하도록 설정해야 합니다. 이를테면 온라인 결제 시스템의 RTO는 컨텐트 관리 웹사이트의 RTO보다 짧아야 합니다. 이러한 방식으로 해당 기업이 직면한 리스크에 따라 복구 전략을 수립할 수 있습니다.

한편 수동으로 인보이스를 발행하면서 버틸 수 있는 회사라면 RTO를 1-2일 또는 그 이상으로 설정해도 좋습니다.

원칙적으로는 설정된 RTO 내에서 시스템을 다시 가동하고 실행하려고 합니다. 하지만 그러지 못할 때도 있습니다.

서비스 제공업체의 시스템이 자동을 멈추거나 자연 재해가 발생한 것처럼 극단적인 상황에서는 특히 그렇습니다.

그럴 때는 무작정 기다리다가 다운타임 비용으로 비즈니스가 심각한 상황에 처하게 두지 않고 중요 IT 기능을 아웃소싱하는 것이 좋습니다. 이러한 노력으로 RTO를 계속 점검하면서 다운타임을 최소화하고 궁극적으로는 잠재적 손실로부터 회사를 구할 수 있습니다.

복구 시점 목표란?

복구 시점 목표(RPO)는 RTO와 유사한 메트릭입니다. RPO는 어떤 사고나 장애가 발생한 이후에 해당 회사가 감당할 수 있는 최대 데이터 손실량을 측정합니다.

RTO가 시스템 복구 시간에 초점을 맞춘다면, RPO는 데이터 보호 및 복구 목표에 중점을 둡니다. RPO는 비즈니스 운영에 차질이 생기기 전까지 감당할 수 있는 데이터 에 손실량을 측정합니다.

RTO와 RPO의 차이점

RTO와 RPO는 백업 및 재해 복구 계획에 사용되는 두 가지 메트릭입니다. 측정 대상은 서로 다르지만, 해당 기업의 니즈에 따라 심사숙고하여 설정해야 합니다.

RTO와 RPO의 유사점

둘 다 사고나 장애 이후에 해당 기업이 복구하는 데 걸리는 시간을 측정하는 데 사용됩니다. 이러한 메트릭을 설정할 때 기업의 니즈, 리스크 프로필, 예산 및 기타 요소를 고려합니다.

RTO와 RPO의 차이점

RTO는 시스템을 다시 가동하고 실행하는 데 걸리는 시간에 초점을 맞추는 반면, RPO는 운영에 차질을 빚기 전까지 해당 기업이 감당할 수 있는 데이터 손실량을 측정한다는 점에서 다릅니다.

RTO가 중요한 이유

오늘날 기업의 주요 차별화 요소 중 하나가 프로세스를 뒷받침하는 기술입니다. 디지털화는 의심할 여지 없이 효율성을 높였고 고객 경험을 향상하며 비즈니스 운영을 혁신했습니다.

하지만 기업의 기술에 대한 의존도가 매우 높아졌는데, 만약 시스템이 멈추면 이는 심각한 문제가 됩니다. 다운타임에 막대한 비용이 들기 때문입니다. 따라서 적절한 RTO를 설정하는 것이 중요합니다.

다운타임은 직접적인 수익 손실은 물론 문제를 해결을 위한 추가 작업 시간, 그리고 IT 시스템을 교체하는 비용의 부담도 유발합니다. IT 시스템을 교체해야 하는 경우 총 비용이 1백만 달러를 넘어설 수도 있습니다. 따라서 다운타임 및 복구에 대비하는 것이 중요합니다.

바로 RTO가 그러한 활동을 뒷받침할 수 있습니다. 기업이 복구 프로세스를 철저히 파악하면서 장애로 인한 지연을 줄이는 데 도움이 됩니다. 또한 예기치 않은 다운타임이 일어날 때에 대비한 계획으로 신속히 정상화하고 재가동하면서 손실을 최소화하게 합니다.

RTO 계산

RTO 계산은 복잡할 수 있습니다. 다운타임 비용, 재해 복구 및 백업 솔루션에 대한 투자, 시스템을 다시 온라인 상태로 복원하는 데 드는 인건비, 규제 요건 등 여러 요인이 작용합니다.

RTO를 결정하려면, 이러한 모든 구성 요소를 고려하고 해당 기업의 리스크 프로필 및 예산을 토대로 타임라인을 설정하는 것이 중요합니다. 다음 사항도 고려하십시오.

  • 장애 빈도 - 특정 유형의 장애가 얼마나 자주 발생하는가?
  • 장애 심각도 - 장애의 결과가 얼마나 심각한가?
  • 장애 비용 - 장애로 인해 얼마나 많은 비용을 부담해야 하는가?
  • 장애 기간 - 장애가 얼마나 지속되는가?
  • 장애의 영향 - 다운타임이 해당 기업에 비치는 경제적 및 사회적 영향

이러한 요소를 염두에 두고 이제 RTO 계산을 진행할 수 있습니다. 다음 단계를 따라야 합니다.

  • 필수 프로세스별 최대 허용 다운타임 계산
  • 주요 프로세스에 필요한 리소스 파악
  • 모든 중요 절차에 필요한 툴을 확보하거나 개발하는 데 드는 시간 계산
  • RTO를 결정하기 위해 최대 허용 다운타임과 리소스 확보/개발에 필요한 시간 합산

RTO 달성 여부에는 여러 가지 요인이 작용할 수 있습니다. 따라서 올바른 백업 및 재해 복구 계획을 수립하는 것이 중요합니다.

백업 및 재해 복구 계획이 RTO 달성에 도움이 되는 이유

백업 솔루션 및 재해 복구 계획은 RTO를 달성하는 데 꼭 필요합니다. 이러한 솔루션을 통해 다운타임, 데이터 유출, 기타 위기로부터 신속하게 복구할 수 있습니다.

백업 계획에는 제공업체와 체결한 서비스 수준 계약(SLA)상의 보장된 RTO가 있어야 합니다. 또한 다음과 같은 기능을 제공해야 합니다.

해당 기업의 RTO는 다양한 기능과 함께 제공되는 백업 및 재해 복구 솔루션을 통해 달성할 수 있습니다. 그러한 솔루션을 활용하여 제로에 가까운 RTO 결과를 얻으려면, 다음과 같은 중요 기능에 관심을 기울이는 것이 좋습니다.

1. 즉각적인 복구 기능

제로에 가까운 RTO 목표를 달성하려면 즉각적인 결과를 제공하는 복구 옵션이 있어야 합니다. 이는 재해 복구 전략의 일부로 즉각적인 복원 기능을 갖추어야 하는 이유이기도 합니다. 그러면 저장된 시스템을 백업 스토리지에서 곧바로 부팅하고, 클라우드 스토리지와 같이 바로 사용 가능한 가상 모드에서 작동할 수 있습니다.

뜻하지 않은 다운타임 상황에서도 중단 없이 운영해야 하는 기업에는 없어서는 안 될 기능입니다. 그리고 의료 분야와 같이 특정 데이터를 신속하게 복원해야 하는 기업에도 도움이 됩니다.

2. 탄력적 스케줄링 정책

탄력적이고 조정 가능한 RPO 정책이 있어야 RTO를 성공적으로 달성할 수 있습니다. 기업의 현재 니즈에 따라 RPO를 조정할 수 있습니다.

예를 들어 RTO 요구 사항이 바뀌면 그에 따라 RPO 정책을 조정할 수 있습니다. 게다가 일반적으로 RPO는 특정 프로세스 또는 애플리케이션에 대해 설정되므로, 각각에 맞게 조정하는 것이 더 쉽고 효율적입니다.

i) CDP(Continuous Data Protection)

RTO 목표를 설정하려면 지속적인 데이터 보호(CDP)가 필요합니다. 그러면 변경 주기에 상관없이 모든 데이터가 백업되고 보호됩니다. CDP를 사용하면 사라졌거나 손상된 데이터를 신속하게 복원할 수도 있습니다.

CDP는 중요 워크로드에 사용할 수 있으나, 리소스 사용량이 많아 성능 및 안정성 문제가 발생할 수 있습니다. 따라서 대개 CDP는 파일 수준 백업으로 구현됩니다.

ii) NCDP(Near Continuous Data Protection)

NCDP는 실시간에 가까운 백업 및 복원을 보장하는 RPO 정책입니다. 또한 성능에 미치는 영향을 최소화하면서 몇 분 단위의 제한적 RTO도 제공합니다. 그러면 데이터가 사라지더라도 즉시 손쉽게 복원할 수 있습니다.

NCDP 솔루션은 제로에 가깝게 RTO 목표를 유지해야 하는 곳에 적합합니다. 그러나 CDP와 마찬가지로 NCDP도 리소스 사용량 때문에 성능 및 안정성에 부정적인 영향을 미칠 수 있습니다.

개별 단위 복구

개별 단위 복구 기능이 있으면 데이터 세트 전체를 복원하지 않고 개별 파일을 백업에서 복구할 수 있습니다. 이는 RTO 시나리오에서 대단히 유용합니다. 데이터 센트 전체가 복원될 때까지 기다리지 않고 개별 파일이나 객체를 신속하게 복원할 수 있기 때문입니다.

개별 단위 복구는 특정 프로세스의 구체적인 결과에 따라 RTO 정책에도 도움이 됩니다. 이러한 절차의 영향을 받는 구성 요소만 복원하면 됩니다. 다른 구성 요소는 복원할 필요 없습니다.

4. 재해 복구를 위한 오프사이트 카피본

RTO 목표를 이루려면 데이터의 오프사이트 카피본이 꼭 필요합니다. 이는 보조 데이터 리포지토리를 사용하면 기본 스토리지 위치에 재해나 장애가 발생하더라도 신속하게 복구할 수 있기 때문입니다.

5. 페일오버를 통한 실시간 복제

페일오버 기능을 활용하는 실시간 복제도 고려해야 할 RTO 관련 기능입니다. 이를 통해 데이터를 실시간으로 사용 가능한 상태로 유지할 수 있으며, 사라진 데이터를 복원할 때 수작업이 필요하지 않습니다.

아울러 기본 사이트와 보조 사이트 중 한쪽에 오류나 장애가 발생하더라도 다른 한쪽으로 신속하게 전환할 수 있습니다. 페일오버 기반 실시간 복제는 장애 및 다운타임을 최소화하면서 RTO 목표를 계속 달성하는 데 도움이 됩니다.

재해 복구 계획을 위한 팁

RTO 전략은 장애 상황에도 중단 없는 운영을 보장해야 하는 기업에 꼭 필요합니다. RTO 전략을 수립할 때 도움이 될 몇 가지 팁을 소개합니다.

1. 비즈니스와 IT의 연계 확인

재해 복구 계획 수립은 까다로운 과제입니다. 관계자들에게 이에 관한 베스트 프랙티스를 전달할 수 있으나, 예산 문제가 우선시되곤 합니다. 이러한 계획을 세울 때는 업계 표준 베스트 프랙티스 준수를 최우선에 두고 비용은 그 다음에 고려해야 합니다.

그리고 무엇보다도 역량과 기대치가 부합하는 것이 중요합니다.

2. 통합 재해 복구 계획 수립

RTO 전략에는 통합 재해 복구 계획이 포함되어야 합니다. 직원이 각종 장애로부터 복구하기 위해 수행해야 할 단계를 제시하고 각기 다른 팀의 역할과 책임을 정리해야 합니다.

재해 복구 계획에는 RPO, RTO, 데이터 백업, 복제 일정, 재해 복구 계획 테스트 프로세스에 관한 정보도 포함해야 합니다.

3. 재해 복구 계획 테스트

기업이 적시에 원활하게 운영 환경을 복구하려면 정기적으로 재해 복구 계획을 테스트해야 합니다. 이는 많은 IT 부서에서 까다로운 프로세스가 될 수 있으나, 애플리케이션 레벨까지 복구 테스트가 필요합니다. 그렇지 않으면 문제가 발생하기 마련입니다. 성공적으로 재해에 대비하려면 잠재적인 문제가 일어나기 전에 철저히 파악할 수 있어야 합니다.

재해 복구 테스트를 가볍게 여겨서는 안 됩니다. 프로덕션 레벨까지 포괄하는 종합적인 엔드투엔드 테스트 절차가 되어야 합니다. 이제 재해 복구의 초점이 서버에서 애플리케이션으로 이동해야 합니다. 다계층 클라이언트 서버 및 웹 기반 구조, 그리고 이들 간의 상호 종속성과 같은 복잡한 속성 때문입니다.

준비가 소홀하면 문제가 발생할 가능성이 높아집니다. 따라서 이러한 테스트는 해당 기업이 만일의 재해를 견딜 수 있는지 알아보는 차원에서 애플리케이션 레벨까지 무사히 수행해야 합니다!

새로운 위협이 등장하고 기존 위협도 진화를 거듭하는 만큼 재해 복구 계획에도 변화가 필요합니다. 현재의 트렌드와 위협 요소를 제대로 다루도록 정기적으로 테스트하고 업데이트해야 합니다.

4. 재해 복구의 책임 정의

복구 시간 목표를 정의하는 것은 모든 RTO 계획에서 성공을 좌우하는 중요한 요소입니다. 특정 부서 또는 팀에 책임을 부여하고 각자의 구체적인 역할을 이해하게 하는 것이 필요합니다.

재해 발생 시 신속하게 조치할 수 있도록 모든 관계자에게 RTO 계획의 변동이나 업데이트를 알리는 것도 중요합니다. 특히 장애나 데이터 유출 사고 상황에서 구체적인 임무를 완수해야 하는 담당자를 결정하고 임명할 때에도 이 점에 유의해야 합니다.

5. 정기적으로 RTO 계획 업데이트

또 다른 핵심 단계는 정기적으로 계획을 업데이트하는 것입니다. 여기에는 새로운 RPO, RTO, 데이터 백업 정보로 업데이트하고 더는 의미 없는 기존 프로세스 또는 절차를 변경하는 것이 포함됩니다. 그리고 최근에 애플리케이션이나 시스템을 업그레이드한 경우 이러한 변경 내용도 RTO 계획에 반영해야 합니다.

6. 현실적인 목표 설정

RTO 계획을 세울 때는 현실적인 목표를 갖는 것이 중요합니다. 여기에는 장단기 목표가 모두 이러한 포함되어야 합니다. 지정된 시간 내에 주요 운영 환경을 복원하거나, 특정 기간 내에 시스템을 완전 정상 작동 상태로 복구하는 것 등이 해당합니다.

현실적이고 달성 가능한 RTO 목표를 세우려면 현재 기술 상황, 가용 리소스, 그리고 장애나 데이터 유출 사고 상황에서 발생할 만한 잠재적 위협이나 리스크를 고려해야 합니다. 복구 시간 목표를 세웠다면 정기적으로 테스트하여 아직도 달성 가능한지 확인하십시오.

7.  안전한 백업 유지

RTO와 관련해서는 믿을 수 있는 최신 버전의 백업이 꼭 필요합니다. 한층 더 강력한 보안을 위해 정기적으로, 가급적 여러 플랫폼에 데이터를 백업해야 합니다. 또한 데이터를 백업할 때 데이터 손실을 줄이는 차원에서 최신 버전의 데이터를 저장해야 합니다.

백업은 RTO 또는 RPO를 달성하지 못한 상황에서 더 빠르게 복구하는 데 도움이 될 수 있습니다. 안전한 백업이 있으면 다운타임과 장애를 최소화하면서 데이터와 시스템을 복원하는 일이 더 수월해집니다.

베리타스의 해결 방법

믿을 만한 RTO 솔루션을 찾는 기업이라면 베리타스를 고려해야 합니다. 베리타스 솔루션은 RTO 또는 RPO 위반 상황에서 빠르고 효과적으로 운영 환경을 복원하도록 지원합니다. 다양한 자동화 툴, 분석, 엔드투엔드 통합 RTO 기능으로 해당 기업이 위협에 미리 대비하고 대응할 수 있게 합니다.

베리타스와 함께할 경우 다음과 같은 이점을 누릴 수 있습니다.

  • 자동화된 RTO 및 RPO 계획 - 베리타스 솔루션은 계획 프로세스를 자동화하여 RTO 또는 RPO와 관련된 각종 위협이나 위반에 대비할 수 있게 합니다. 그러면 기업은 잠재적인 위협을 방지하고 보안 위반이 발생하더라도 가동 중단을 최소화할 수 있습니다.
  • 엔드투엔드 통합 RTO 기능 - 베리타스의 엔드투엔드 통합 기능에는 데이터 백업, 복구 테스트, RPO 및 RTO 계획 등이 포함되어 있어 통합 복구 시간 목표 계획을 수립할 수 있습니다.
  • 분석 및 리포트 - RTO 추이를 모니터링하고 잠재적 RTO 위협을 파악하는 데 도움이 될 분석 및 리포트를 제공합니다. 이를 활용하여 각종 보안 위반에 대비하고 실제 상황에서도 가동 중단을 최소화할 수 있습니다.
  • 첨단 분석- 베리타스 RTO 솔루션은 첨단 분석 기능도 제공하면서 기업의 RTO 및 RPO 추이를 분석하면서 각자의 전략에 관한 더 나은 인사이트를 확보할 수 있게 합니다.

RTO 계획은 RTO 또는 RPO 위반에 따른 다운타임과 혼란을 줄이려는 기업에 필수 조건입니다. 현실적이고 달성 가능한 목표 수립은 안전한 백업 및 엔드투엔드 통합 RTO 기능을 갖추는 것만큼이나 중요합니다.

베리타스 RTO 솔루션은 기업에서 RTO 관련 위협에 대비하고 실제 상황에서 혼란을 최소화하도록 지원합니다. 베리타스 솔루션으로 RTO 및 RPO에 미리 대비하는 것은 물론 분석을 활용하여 추이를 통해 파악하고 잠재적 위협을 식별할 수 있습니다.

그러므로 바로 지금 베리타스에 문의하여 베리타스 솔루션, 그리고 베리타스와 함께 통합 전략을 수립할 방법도 알아보십시오.

 

Fortune지 선정 100대 기업의 95%가 베리타스 제품을 사용하고 있으며 NetBackup™은 방대한 데이터를 보호할 방법을 찾는 기업들 사이에서 선택 1순위에 오른 제품입니다.

베리타스 데이터 보호 솔루션이 가상 워크로드, 물리적 워크로드, 클라우드 워크로드, 레거시 워크로드를 어떻게 완벽하게 보호하는지 궁금하다면 엔터프라이즈 비즈니스를 위한 데이터 보호 서비스에서 확인하십시오.

 

FAQ

RTO는 복구 시간 목표(Recovery Time Objective)를 의미합니다. 기업에 장애나 유출 사고가 발생한 후 시스템 또는 데이터 세트를 복원하는 데 걸리는 시간을 나타냅니다. RTO 목표는 재해 복구 계획의 장단기 목표를 설정하는 데 사용됩니다.

RTO 목표는 여전히 달성 가능한지 확인하기 위해 정기적으로 테스트해야 합니다. 여기에는 RTO 시나리오를 시뮬레이션하고, RTO 위반 시 시스템 또는 데이터 세트를 복원하기까지 걸리는 시간을 테스트하는 것도 포함됩니다.

베리타스 RTO 솔루션은 자동화된 RTO 및 RPO 계획, 엔드투엔드 통합 RTO 기능, 분석 및 리포팅 기능, 첨단 분석 기능을 제공합니다. 이를 통해 RTO 위협에 대비하고 RTO 위반 상황에서도 혼란을 최소화할 수 있습니다.