![[사진=AWS]](https://image.ajunews.com/content/image/2025/10/21/20251021101843148812.jpg)
아마존웹서비스(AWS) 클라우드 장애로 전 세계적으로 금융 결제, 항공 예약, 게임, 인공지능(AI) 챗봇 등 주요 일상 서비스가 먹통 되는 사태가 발생했다. 장애 발생 3시간 만에 대부분 복구됐으나 하나의 클라우드 인프라에 의존하는 현실의 한계가 여실히 드러났다.
지난해 마이크로소프트(MS)발 IT 대란에 이어 이번 AWS 장애까지 발생하자 복수의 클라우드를 활용하는 '멀티 클라우드' 전략이 대두하고 있다.
21일 AWS는 엔지니어들이 대체적인 문제를 해결하는 데 약 3시간 걸렸고, 한국 시간으로 이날 오후 7시 35분께 복구가 완료됐다고 공지했다. 현재 대부분 AWS 서비스가 정상적으로 운영되고 있고, 일부 서비스에선 간헐적으로 오류가 발생하고 있는 것으로 전해졌다.
AWS 데이터센터 핵심 중 하나인 미국 동부 리전에서 오류가 발생하면서 광범위한 서비스 장애가 나타났다. 도메인 이름 시스템(DNS) 해석 오류로 AWS 다이나모 데이터베이스에서 문제가 발생한 것으로 보고 있다. 데이터 저장 서비스인 다이나모DB와 연결되는 과정에서 컴퓨터가 웹사이트 주소를 제대로 해석하지 못해 오류가 났다는 설명이다.
이번 장애로 AI 챗봇 검색 퍼플렉시티, 아마존 프라임, 소셜미디어(SNS) 스냅챗과 왓츠앱, 닌텐도, 스타벅스, 영국 국세청과 증권거래소 등 전 세계 수많은 서비스가 중단됐다. 이날 6000건 넘는 오류 신고가 접수된 것으로 전해진다. 국내에서는 삼성월렛(삼성페이) 결제 서비스와 크래프톤 대표 게임인 '펍지: 배틀그라운드'도 서버 장애를 겪은 것으로 알려졌다.
이러한 문제의 배경으로 시장 지배적 지위를 점하고 있는 AW 클라우드에 대한 지나친 의존도를 꼽는다. AWS는 전 세계 클라우드 인프라 가운데 3분의 1가량을 차지하고 있다. AWS 데이터센터 한 곳의 문제로 인해 전 세계 수많은 온라인 서비스 장애로 이어질 수 있는 구조적 한계가 있다.
지난해에도 MS 클라우드 장애로 전 세계 항공기 운항과 금융·병원 시스템 등 주요 일상 서비스가 대거 중단되는 사태가 발생했다. 이로 인해 당시 클라우드 시스템의 허점이 부각됐다. 클라우드 인프라가 관리의 편리성과 비용 효율적인 측면에서 이점이 있지만 한 회사의 중앙 시스템에 문제가 생기면 전 세계 인프라가 동시다발로 갑자기 마비될 수 있다는 것이다.
단일 클라우드에 대한 의존도가 높을수록 대규모 피해 발생 가능성이 크다는 점에서 업계는 여러 클라우드를 활용하는 방식인 '멀티 클라우드' 전략이 대안이 될 수 있다는 의견을 내놓고 있다. 클라우드에 장애가 발생했을 때 다른 클라우드로 신속히 전환해 서비스를 안정적으로 제공할 수 있다는 강점이 있다.
국내 멀티 클라우드 비중은 40%대에 달한다. 과학기술정보통신부 '2023년 부가통신사업 실태조사 결과'에 따르면 2개 이상 클라우드 서비스를 이용하는 비율은 44.7%로 나타났다. 1개 클라우드만 사용하는 비중(55.3%)이 가장 높았고 2개(28.8%) 또는 3개(13.5%) 클라우드를 사용하는 비중도 큰 편이었다.
정부는 지난해 MS 클라우드 대란을 계기로 네이버, 카카오 등 부가통신사업자에 단일 클라우드 기반이 아닌 2개 이상 클라우드 기반 주요 서비스의 다중화 권고 등을 담은 통신재난관리기본계획 수립지침을 의결한 바 있다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지