이중화(High Availability) 실패 사례
2022.10.15 카카오 서비스 장애 발생 사례
2022년 10월 15일 오후, 한국의 대표적인 IT 기업 카카오는 SK C&C 판교 데이터센터에서 발생한 화재로 인해 서비스에 대규모 장애가 발생했었다.
카카오톡, 카카오페이, 티스토리와 같은 필수적인 서비스가 중단되었고, 네이버 일부 서비스 또한 정상적인 운영이 불가능했다. 이 사건은 한국 IT 역사상 가장 심각한 서비스 장애 중 하나로 기록되었다. 관련 기사에 따르면, 화재는 데이터센터 전력 시스템에 심각한 손상을 입혔고, 이로 인해 카카오가 관리하는 주요 서버들이 중단되었다(동아일보).
카카오는 국내에서 가장 많은 사용자를 보유한 플랫폼 기업 중 하나로, 하루에도 수백만 명이 카카오톡을 비롯한 다양한 서비스를 사용한다. 따라서 이번 서버 장애는 일상 생활뿐 아니라, 비즈니스 운영에도 큰 타격을 주었다. 처음에는 하루 이내로 복구될 것이라 예상되었으나, 일부 서비스는 여러 날 동안 정상적인 기능을 하지 못했고, 사용자는 큰 불편을 겪었다. 본인 역시 그날 오후 커피숍에 앉아 티스토리 콘텐츠를 작성하려고 했지만, 여전히 서비스에 접속할 수 없어 당황스러웠다.
이중화의 필요성
그 날 사건은 "High Availability", 이중화의 필요성을 다시금 환기시켰다.
IT 인프라에서 이중화는 한 시스템에 장애가 발생했을 때, 다른 백업 시스템으로 즉시 전환할 수 있게 해주는 중요한 전략이다. 카카오와 같은 대기업은 분명 서버 이중화 작업을 수행했을 것이다. 그러나, 데이터 양이 방대하고, 이중화된 서버 역시 같은 물리적 장소에 있어 화재로 인한 피해를 같이 입었을 가능성도 배제할 수 없다. 즉, 데이터센터의 물리적 위치가 동일하다면, 한쪽에서 발생한 사고가 백업 시스템에도 영향을 미칠 수 있다는 것이다.
반사이익
재미있게도 이 카카오톡 장애로 인해 라인(LINE) 서비스 사용자가 급증한 현상이 있었다. 당시 라인에서 갑자기 친구 요청이 여러 건 들어온 경험이 있었는데, 이는 카카오톡을 사용하지 못한 사용자가 대체 서비스로 라인을 선택했기 때문이다. 이러한 상황을 통해 네이버는 반사 이익을 얻었고, 카카오 서비스 장애가 다른 국내 SNS에 미치는 영향을 보여주었다.
클라우드 서비스
현재 많은 기업들은 온프레미스 데이터센터 대신, 아마존 웹 서비스(AWS)나 마이크로소프트 애저(MS Azure) 같은 클라우드 서비스를 통해 시스템을 운영하고 있다. 이러한 클라우드 인프라는 물리적 리스크를 줄일 수 있는 장점이 있다.
클라우드 서비스 제공업체들은 여러 지역(Region)에 서버를 분산하여 운영하기 때문에, 특정 지역에 발생한 문제는 다른 지역에 영향을 미치지 않도록 설계되어 있다. 예를 들어, 미국, 브라질, 싱가포르 등지에 서버를 두고 운영하는 경우, 한 곳에서 발생한 문제는 다른 지역으로 즉시 전환되어 서비스의 지속성을 보장할 수 있는 것이다. 그러나, 많은 기업들이 아직도 비용 문제나 데이터 주권 문제로 인해 특정 지역(특히 아시아-태평양) 내에서만 서버를 운영하는 경우가 많아, 이러한 리스크는 여전히 존재한다.
개개인의 이중화
현대 사회는 전화보다 소셜미디어를 통한 소통이 더 활성화되고 개인 블로거들도 서비스 이중화를 항상 염두해 두어야 한다. 카카오톡과 네이버 라인, 티스토리와 네이버 블로그, 다음 카페와 네이버 카페 등 동일한 기능을 제공하는 다양한 서비스들이 존재하기에 우리는 항상 대체할 수 있는 옵션을 마련해 두어야 카카오 서비스 장애와 같은 위기 상황이 다시 발생했을 때 쉽게 다른 서비스로 전환할 수 있을 것이다.
마무리
IT 인프라도 그렇고 우리 인생도 그렇고 무엇이든 대체방안, Second Plan 을 마련하여 예상치 못한 위기에 대응하자!
'IT' 카테고리의 다른 글
IDMZ Network (1) | 2024.10.24 |
---|---|
HAProxy란? (1) | 2024.10.24 |
티스토리를 네이버에 검색되게 하는 방법 (5) | 2024.10.23 |
HMI와 SCADA (1) | 2024.10.23 |
FILE SHARING (2) | 2024.10.18 |