많은 기업이 컴퓨팅 민첩성과 효율성을 높이고자 클라우드 플랫폼을 채택했고, 이러한 흐름은 글로벌 팬데믹 상황에서 더욱 가속화되었습니다. 실제로 현재 클라우드 서비스 플랜을 이용하면서 클라우드 지출을 늘리는 기업이 70%에 육박합니다. 결과적으로, 클라우드 기술은 재해 복구(DR)에 관한 세상의 인식을 완전히 바꾸어 놓았습니다.
클라우드 컴퓨팅은 디지털 자산을 효율적으로 관리하는 방법이지만 재해로부터 안전하지는 않습니다. 데이터는 모든 기업에 소중한 자산이므로, 각종 인재 및 자연 재해로부터 데이터를 보호해야 합니다.
그러나 다음 재해가 언제 발생할지 예측하고 통제하기란 불가능하므로, 그 피해를 줄이고 복구하는 프로세스에 대한 관리 감독이 필요합니다. 따라서 홍수와 같은 개별 자연 재해에 의한 피해를 줄이도록 확실한 시스템 백업 그리고 여러 대의 서버를 각기 다른 위치에 두고 사용하는 전략 등의 조치를 마련함으로써 클라우드 재해 복구(클라우드 DR)를 수행할 수 있습니다.
다행히 오늘날에는 기존 DR 접근 방식보다 더 빠르고 비용 효과적이며 안전하고 더 우수한 확장성과 유연성을 제공하는 옵션이 있습니다. 그러나 클라우드 컴퓨팅의 재해 복구에 단 하나의 접근 방식을 적용할 수는 없습니다.
여기서는 클라우드 재해 복구에 주목하면서 그 작동 방식, 이점과 한계, 클라우드 컴퓨팅에서의 재해 복구 계획에 관해 알아봅니다. 아울러 DRaaS(Disaster Recovery-as-a-service)와 기존 DR을 조명합니다. 클라우드 DR과 비교하면서 적합한 옵션을 선택하는 방법, 그리고 이와 관련된 베리타스의 역할도 설명합니다.
클라우드 재해 복구(클라우드 DR)는 기업의 미션 크리티컬 데이터 및 원격 시스템을 백업하고 복구할 수 있습니다. 여러 전략과 서비스를 조합하여 데이터, 애플리케이션, 기타 컴퓨팅 리소스를 전용 서비스 제공업체 및 퍼블릭 클라우드에 백업합니다.
IaaS(Infrastructure-as-a-Service) 형태로 제공되는 방식으로, 중요한 엔터프라이즈 리소스를 오프사이트 서버에 원격으로 저장하여 보호할 수 있습니다. 아울러 재해가 발생하더라도 신속하게 복구할 수 있게 하여 비즈니스 연속성을 유지합니다.
클라우드 기술은 클라우드 컴퓨팅의 재해 복구를 지원하면서 더 빠른 복구, 고가용성, 탁월한 유연성을 실현합니다. 각 기업의 고유한 비즈니스 요구 사항에 따라 클라우드 재해 복구 솔루션을 맞춤 구성할 수 있습니다.
클라우드 재해 복구는 기존 재해 복구 방식보다 구성, 사용, 관리하기 더 용이합니다. IT 부서는 클라우드 기술을 활용하여 즉각적인 가동 및 페일오버를 수행할 수 있습니다. 아울러 클라우드 재해 복구는 시스템 복원 또는 재해 상황에서 업데이트된 복구 시간 목표(RTO) 및 복구 시점 목표(RPO)를 제공합니다.
또한 다양한 프로세스를 자동화하고, 기업의 비즈니스 요구 사항에 맞춰 솔루션을 확장 또는 축소할 수 있게 지원합니다.
비즈니스에 영향을 미치는 재해를 다음 3가지 카테고리로 나눌 수 있습니다.
· 자연 재해: 지진, 홍수 등이 포함됩니다. 클라우드 서비스를 호스팅하는 기업의 서버가 위치한 지역에 이러한 재해가 발생할 경우, 서비스가 중단되고 즉각적인 재해 복구 작업이 필요할 수 있습니다.
· 인재: 우발적인 데이터 유출 사고, 부주의에 의한 구성 오류, 악의적 의도를 가진 제3자의 액세스 등 사람과 관련된 모든 재해가 포함됩니다.
· 기술 재해: 네트워크 연결 유실, 정전 등 기술과 관련하여 발생할 수 있는 문제가 포함됩니다.
클라우드 제공업체는 직접적인 제어가 가능한 모든 대상에 대해 책임을 집니다. 이를테면 시설, 하드웨어, 네트워크, 소프트웨어와 같은 일반적인 기술 인프라스트럭처의 레질리언스가 여기에 포함됩니다. 한편 고객은 그밖의 영역, 즉 안전한 데이터 백업, 클라우드 구성, 워크로드 아키텍처, 가용성 등에 대한 책임이 있습니다. 클라우드 컴퓨팅 재해의 전후 및 그 과정에 이 모든 요소가 복합적으로 작용합니다.
클라우드 재해 복구는 필수 애플리케이션과 데이터를 오프사이트 데이터 센터에 저장하고, 위기 상황에서 보조 사이트나 가상 호스트로 페일오버합니다. 기업이 신속하게 재해로부터 복구하고, 백업 및 재가동으로 재해의 영향을 최소화할 수 있게 지원합니다.
클라우드 재해 복구는 기존 재해 복구와 다릅니다. 서버에 애플리케이션 소프트웨어 및 운영 체제를 로드하고 최근에 사용된 구성으로 패치를 적용하던 방식과 달리, 클라우드 재해 복구는 애플리케이션, 운영 체제, 패치, 데이터를 포함하여 서버 전체를 하나의 소프트웨어 번들이나 가상 서버로 캡슐화합니다.
그런 다음 벤더에서 가상 서버를 오프사이트 데이터 센터에 복사하거나 백업합니다. 가상 서버는 하드웨어에 의존하지 않으므로, 벤더에서 기존 재해 복구 접근 방식보다 빠른 속도로 데이터 센터 간에 OS, 애플리케이션, 데이터, 패치를 마이그레이션할 수 있습니다.
클라우드 벤더는 애플리케이션과 시스템이 업데이트되고 정기적으로 패치가 적용되게 해야 합니다. 그뿐만 아니라 벤더에서 클라우드 재해 복구 기능 대부분을 자동화할 수 있어 오류가 줄고 사용자의 개입 필요성이 최소화됩니다.
클라우드 재해 복구 기능 대부분은 PAYGO(pay-as-you-go) 서비스 방식입니다. 즉, 실제로 사용된 소프트웨어 라이센스 수와 스토리지 용량에 대해서만 비용을 지불합니다.
이러한 클라우드 기반 재해 복구 프로세스는 세부적입니다. 따라서 성공적인 복구를 위해서는 해당 방법론을 면밀하게 살펴봐야 합니다. 이를테면 아래와 같습니다.
· 백업 및 복원: 클라우드 컴퓨팅 재해로부터 복구하는 가장 쉽고 빠르고 저렴한 방법입니다. 또한 지리적으로 다른 위치에 데이터를 복제하고 저장함으로써 자연 재해와 같은 국지적 사건을 완화하는 데 도움이 됩니다.
· 파일럿 테스트: 조직의 기능 및 요구 사항에 중요한 코어 서비스만 복제하는 방식입니다. 따라서 IT 환경의 작은 코어 영역만 복제해두고, 재해 상황에서는 최소한의 기능적 대체만 수행합니다.
· 예열 대기 방식(Warm standby): 완전한 기능 환경의 축소 버전을 사용하는 경우입니다. 항상 중앙 서버와 다른 위치에서 실행됩니다. 그러면 재해가 발생하더라도 다른 지역에 백업 버전이 있습니다.
· 멀티사이트 구축: 가장 많은 비용이 드는 방법론이며, 가장 포괄적인 솔루션이기도 제공합니다. 여러 지역을 포괄하는 범위에서 전체 워크로드를 동시에 실행합니다.
클라우드 컴퓨팅 기반 재해 복구 계획을 수립할 때 다음 단계를 수행합니다.
이 분석 단계에는 조직의 기존 IT 인프라스트럭처 및 워크로드를 대상으로 하는 포괄적인 리스크 평가 및 영향 분석이 포함됩니다. IT 부서는 리스크를 식별한 다음 잠재적인 취약점과 재해를 파악할 수 있습니다.
그런 다음 파악된 문제점을 기준으로 현재 인프라스트럭처를 평가하고, 워크로드의 RTO 및 RPO를 결정할 수 있습니다.
구현 단계는 해당 조직에서 재해 해결에 필요한 단계와 기술을 개략적으로 정리하는 데 도움이 됩니다. 조직 차원에서 재난에 대응하면서 모든 필수 조치를 신속하게 이행할 계획을 구상하는 것이 목표입니다. 다음 단계로 구성됩니다.
클라우드 기반 재해 복구 전략 및 계획을 테스트하고 정기적으로 업데이트해야 합니다. 그러면 직원이 계속 적절한 교육을 받고 합당한 계획이 운영되는 데 도움이 됩니다. 아울러 테스트를 통해 자동화된 프로세스와 기술이 올바르게 작동하고 사용 가능한 상태임을 확인합니다. 또한 재해 복구 솔루션의 허점을 발견하는 데 도움이 됩니다.
재해 복구 계획을 마련하는 조직이라면 다음 사항을 고려해야 합니다.
재해 복구 계획은 더 큰 비즈니스 연속성 전략의 일부이므로, 완벽한 백업 및 복구 프로세스를 위해 순조롭게 진행되어야 합니다.
클라우드 컴퓨팅 환경에서 재해가 발생하는 경우는 드물지만, AWS와 같은 거대 클라우드 서비스 제공업체도 겪고 영향을 받을 수 있습니다. 클라우드 재해의 2가지 사례를 그 결과와 함께 소개합니다.
2017년 Amazon 가동 중단 사태는 클라우드 재해 복구의 취약점, 그리고 재해 복구에 퍼블릭 클라우드만 사용할 경우 감수해야 할 리스크를 여실히 보여주었습니다. 2017년에 발생한 이 클라우드 컴퓨팅 재해는 한 Amazon 직원이 청구 시스템 문제를 디버깅하려 했으나 필요 이상으로 많은 서버를 오프라인화하는 실수를 저지르면서 시작되었습니다.
결국 도미노 효과를 일으켜 다른 2대의 서버 서브시스템으로 확산되었고, 나머지 시스템에도 퍼지면서 그 규모가 눈덩이처럼 커졌습니다. 그 결과, 수천 명의 사용자가 문제의 Amazon 서버에 몇 시간 동안 액세스하지 못했습니다.
지난 2016년, 호주 시드니의 Amazon Web Services(AWS)가 최장 10시간 동안 멈추는 사태가 벌어졌습니다. 이 회사의 협력업체인 한 공익사업체의 지역 변전소에서 발생한, 악천후에 의한 정전이 원인이었습니다. 이로 인해 많은 거대 기업의 중요 워크로드를 호스팅하는 여러 Elastic Block Store 볼륨 및 Elastic Compute Cloud 인스턴스가 제대로 작동하지 못했습니다.
치열한 경쟁이 벌어지는 오늘날의 비즈니스 환경에서는 소프트웨어 또는 하드웨어 오류, 자연 재해 또는 사이버 공격으로 인한 장애 및 다운타임이 허용되지 않습니다. 따라서 연중무휴 24시간 가동되는 글로벌 경제 환경에서 증가하는 요구 사항을 충족하려면, 상시 온라인 상태를 유지해야 합니다.
사이버 범죄가 더욱 가파르게 증가하는 가운데, FBI는 2020년 팬데믹 이후 범죄 리포팅 건수가 무려 300% 증가했다고 밝혔습니다. Cybersecurity Ventures에 따르면, 매년 사이버 범죄로 인해 치르는 비용이 2025년에 10조 5천억 달러를 돌파할 것입니다. 게다가 사이버 범죄는 이전보다 더 복잡하고 예측하기 어려워집니다. 결국 비즈니스 연속성을 보장하기 위해 통합적인 데이터 백업 및 재해 복구 솔루션을 개발해야 합니다.
사이버 범죄 외에도 거대 규모의 가동 중단이 비즈니스에 큰 타격을 주곤 합니다. 예를 들어, Uptime Institute의 설문 조사에서 44%의 기업이 2020년에 정전으로 인해 가동 중단을 경험했다고 밝혔습니다.
클라우드 재해 복구는 조직이 재해에 대한 레질리언스를 확보하는 데 기여합니다. 그리고 온프레미스, 클라우드 스토리지, 하이브리드 클라우드, 멀티 클라우드 환경 등 모든 스토리지에서 필수 워크로드를 보호합니다. 강력한 클라우드 재해 복구 계획은 사이버 위협 및 기타 재해로부터 보호하는 데 도움이 되며, 다운타임 및 관련 비용을 최소화합니다. 또한 중요 데이터, 애플리케이션, 시스템의 가용성과 보안을 보장하여 비즈니스 연속성을 실현합니다.
재해 복구에 클라우드 환경을 사용할 경우, 물리적 하드 드라이브나 디스크에 데이터 백업을 둘 필요가 없습니다. 아울러 분산화가 특징인 클라우드 플랫폼에서는 제공업체가 서로 다른 지리적 위치에 있는 서로 다른 서버에 서비스를 분산시켜 국지적인 자연 재해로부터 보호할 수 있습니다.
클라우드 재해 복구의 또 다른 이점은 기업이 클라우드 제공업체와 책임을 나눌 수 있다는 것입니다. 클라우드 제공업체는 데이터 센터, 서버, 운영 체제 및 애플리케이션을 비롯한 인프라스트럭처에서 핵심 레질리언스를 확보하고 유지할 책임이 있습니다.
클라우드 재해 복구는 비용 효과적이기도 합니다. 제공업체가 실제로 사용된 서비스에 대해서만 비용을 청구하기 때문입니다. 따라서 기업에 필요한 서비스를 선택하고 비용을 지불하면 되므로, 개별 맞춤형 패키지 구성으로 상당한 비용을 절감할 수 있습니다.
클라우드 재해 복구는 다음과 같은 이점도 제공합니다.
클라우드 스토리지가 백업 및 복구에 여러모로 유익하지만, 이 기술에는 몇 가지 단점이 있습니다.
종합적으로 보면, 클라우드 재해 복구의 이점이 단점을 능가합니다. 게다가 거대 기업에서는 온프레미스 및 클라우드 기반 재해 복구 옵션을 모두 사용하면서 일부 단점을 상쇄합니다.
클라우드 컴퓨팅과 함께 클라우드 재해 복구 및 DRaaS(Disaster Recovery-as-a-Service)가 부상하면서 중소기업도 재해 복구 기능을 갖출 수 있게 되었습니다. 다른 한편으로, 기존 재해 복구 방식은 클라우드 기반 재해 복구 솔루션보다 앞선 세대입니다. 양쪽 모두 비즈니스 연속성을 보장한다는 같은 목적을 가지고 있습니다. 하지만 그 차이점도 제대로 알아야 합니다.
워크로드를 클라우드 기반 인스턴스나 가상 시스템에 페일오버함으로써, 장애가 발생한 워크로드의 작업을 재개할 수 있는 기능입니다. 이는 최종 사용자(기업)가 솔루션의 소유권을 갖고 퍼블릭 클라우드와 관련된 리스크도 부담하는 DIY(do-it-by-yourself) 접근 방식입니다.
회사에서 관리하는 보조 데이터 센터(코로케이션) 대신 Microsoft Azure 또는 Amazon Web Services 등의 하이퍼스케일 클라우드 환경을 사용하는 경우가 많습니다. 해당 기업이 최상의 데이터 복제/백업 방식, 그리고 가동 중단 시 페일오버를 시작하는 방법을 결정합니다.
재해 복구를 전문으로 하는 공급업체가 제공하는 aaS(as-a-service) 솔루션입니다. 클라우드 기반 DRaaS 벤더는 재해 복구 목적으로 기성 플랫폼을 운영하지만, 각 기업은 제공업체의 전문성을 활용하여 페일오버에 적합하게 클라우드 운영을 조정하고 중요 워크로드를 호스팅합니다.
클라우드 컴퓨팅에서 DRaaS를 선택하면, 클라우드 재해 복구와 달리 서비스 제공업체가 설치, 페일오버, 복구 등을 모두 해결하므로 큰 부담을 덜 수 있습니다. 게다가 가능한 경우 가동 중인 데이터 센터에 대한 페일백까지 처리합니다. 따라서 IT 관리자는 부담을 줄이고 보다 전략적인 이니셔티브에 시간을 할애할 수 있습니다.
기존 재해 복구 솔루션에서는 기업의 기존 환경 내에 또는 인근에 전용 데이터 센터를 운영합니다. 해당 기업은 데이터 센터 구축, 인력 배치, 운영, 유지 관리에 드는 설비 투자 비용(CapEx)을 부담합니다. 소프트웨어 유지 보수, 전원, 냉각, 연결, 기타 인프라스트럭처 관리도 기업의 몫입니다.
기존 재해 복구의 핵심 요소는 다음과 같습니다.
기업은 나머지 IT 인프라스트럭처와 함께 재해 복구 시설을 정기적으로 업그레이드하는 책임도 맡습니다. 결과적으로, 기존 재해 복구에는 상당한 설비 투자 비용 및 운영 비용이 발생합니다.
클라우드 컴퓨팅의 클라우드 재해 복구와 DRaaS는 기업에 수많은 이점을 제공합니다. 이를테면 복잡한 재해 복구 절차나 막대한 자본 투자 없이도 위기 상황에서 안전한 데이터 백업과 빠른 복구를 가능하게 합니다. 그러나 클라우드 재해 복구 또는 DRaaS에 투자하려는 기업은 먼저 허용 수준을 고려해야 합니다.
둘 중에서 최상의 옵션을 결정하는 데 있어 기업의 RTO와 RPO가 중요한 역할을 합니다. 허용 수준이 높은 기업은 클라우드 재해 복구를 선호하는 반면, 상대적으로 허용 수준이 낮고 RTO/RPO 요구 사항이 엄격한 기업은 DRaaS를 선택합니다.
Creative ITC 백서에 따르면, 기존 복제 및 재해 복구 솔루션으로는 현재의 IT 복잡성을 효과적으로 처리할 수 없습니다. 결국 최신 IT 환경의 복잡성과 범위가 계속 증가함에 따라, DRaaS 및 클라우드 재해 복구와 같은 클라우드 기반 솔루션이 더욱 호평받고 있습니다.
베리타스는 각 기업에서 비즈니스 크리티컬 데이터를 효과적으로 관리하고 보호하도록 돕기 위해 통합 제품 포트폴리오를 통해 통합 데이터 관리 경험을 제공하고 탁월한 성능과 다양성을 실현합니다.
베리타스는 클라우드 컴퓨팅, 시스템 복구, 사이버 보안 보호, 데이터 레질리언스, 컴플라이언스 등을 비롯한 다양한 서비스를 제공합니다.
Veritas System Recovery 솔루션은 서버, 랩톱, 데스크톱을 포괄하는 탁월한 통합 백업 및 재해 복구 경험을 제공하면서 각종 재해 및 다운타임으로부터 수분 내로 복구하도록 지원합니다. 아울러 특허받은 Restore Anyware 기술을 적용하여 IT 관리자가 필요한 경우 언제 어디서나 필요한 데이터를 신속하게 복원하도록 지원합니다. 여기에는 물리적/가상 시스템, 애플리케이션, 파일, 폴더를 확실하게 복원하는 것이 포함됩니다.
Veritas System Recovery는 크로스 플랫폼 P2V(Physical to Virtual), V2P(Virtual to Physical), V2V(Virtual to Virtual) 복구 기능을 제공하면서 물리적 환경과 가상 환경을 완벽하게 보완합니다.
각 조직에서는 클라우드 컴퓨팅의 재해 복구 계획에 계속 관심을 기울여야 합니다. 이는 데이터 백업 및 재해 복구 프로세스의 유연성, 확장성, 효율성을 강화합니다. 더 나아가 RTO 및 RPO를 염두에 두고 정확한 사양에 부합하는 복구 계획을 설계함으로써 클라우드 재해 복구를 위한 철저한 계획을 수립할 수 있습니다.
많은 중소기업이 비용 절감과 효율성을 위해 DRaaS를 선호합니다. 한편 거대 기업은 종합적인 재해 복구 및 비즈니스 연속성 계획을 위해 하이브리드 클라우드, 그리고 때로는 온프레미스 데이터 센터도 활용하는 클라우드 재해 복구를 선호합니다.
각 기업은 IT 서비스를 제공하기 위한 우선적인 대안으로 클라우드를 계속 받아들이고 탐구합니다. 클라우드 기반 재해 복구 전략 덕분에 이제 통제되고 예측 가능한 투자를 통해 데이터와 애플리케이션을 보호할 수 있습니다. 게다가 저렴한 가격, 확장성, 유연한 계약 기간 및 향상된 비즈니스 레질리언스의 이점도 누릴 수 있습니다.