클라우드 보안사고 등 마비 사태, 네트워크 담당자들이 할 수 있는 일
인간은 아무리 애를 써도 자연 재해를 막을 수 없다. 불가항력의 일이다. 그런데 클라우드라는 것도 점점 그런 식으로 인식되고 있다. 클라우드에서 일어나는 사고는 누구도 예측할 수 없고 막을 수도 없다는 게 대세의 여론이다. 그러면 클라우드로의 이전이 자꾸만 이뤄지는 이 때, 우리가 할 수 있는 일은 없는 걸까?
[보안뉴스 문정후 기자] 지난 한 해 클라우드, 인터넷, CDN 업체들에서 발생한 대규모 마비 때문에 수많은 기업들의 사업 활동이 중단됐다. 동네에서 작은 가게를 운영하는 업체나, 전 세계 곳곳에 사무실을 두고 천문학적인 규모의 거래를 하는 기업이나 마비된 인프라 앞에서 속수무책일 수밖에 없었다.
최근 네트워크 담당자 300여 명을 대상으로 조사한 결과 상당히 많은 수의 현장 전문가들 사이에서 ‘클라우드 마비’ 혹은 ‘클라우드 정전’에 대한 불안감이 존재한다는 사실이 드러났다. 클라우드가 작동하지 않을 때, 현재 자신들이 담당하고 있는 네트워크에 미칠 일이 너무나 걱정된다고 응답한 사람이 절반 이상이었던 것이다. 그도 그럴 것이 작년에 이런 식의 사고가 분명히 일어났던 것을 아직 기억하고 있기 때문이다.
클라우드가 갑자기 접속되지 않을 때 일부지만 기업들이 손해를 줄이기 위해 할 수 있는 일이 있긴 하다. 예를 들어 2022년 6월 마이크로소프트의 애저와 MS 365가 12시간 동안 작동을 멈춘 일이 있었다. 버지니아 주의 데이터센터가 문제의 중심에 있었는데, 이 데이터센터와 연계되어 있던 기업들 거의 대부분 사업 진행에 어려움을 겪었다. 하지만 ‘항시 가용(always-available)’ 혹은 ‘지역 구분 없음(zone-redundant)’이라는 프리미엄 서비스를 이용하던 기업들은 멀쩡했다.
결국 안정적인 클라우드 서비스를 사용하려면 가격을 더 지불해야 한다는 것이고, 저렴한 서비스를 선택하면 안정성을 어느 정도 포기해야 한다는 뜻이다. 더불어 속도 역시 마찬가지다. 속도를 중시한다면 가격이나 안정성 중 하나는 내려놓아야 한다. 속도, 안정성, 가격 중 한 가지는 항상 포기해야 하고, 셋을 다 가질 수는 없다는 게 현재 클라우드 서비스의 현실이다.
따라서 대부분의 클라우드 사용 기업들에 있어 클라우드가 갑자기 마비되었을 때의 대책은 없는 것이나 다름이 없다. 실제 지난 수년 동안 발생한 클라우드 마비 사건에서 ‘우리는 잘 버텼다’라고 자랑한 기업은 하나도 없었다. 클라우드 업체의 업데이트 및 설정 오류 등으로 인한 서비스 마비는 고스란히 고객사의 피해로 이어졌다. 클라우드 업체에서는 사용 기간을 늘려주는 등의 보상을 제공했을 뿐이다.
그러면 기업 내 네트워크 관리인들은 클라우드가 마비되는 것을 불가항력적인 재난으로 인식한 채 손 놓고 있어야 하는 걸까? 이 질문에 대한 답은 솔직히 ‘그렇다’에 가까운 게 지금의 상황이다. 다만 어떤 클라우드 서비스가 어떤 상황에서 마비될 때 어떤 대책을 마련할 수 있는지 미리 알아두는 것은 가능하다. 마비라는 게 다 똑같은 건 아니기 때문이다. 또, 고객으로서 클라우드 업체에 지속적으로 압박을 넣어 서비스가 마비되지 않도록 유도하는 것도 할 수 있다.
클라우드 마비의 유형에 따라 대책을 마련한다는 것은 무슨 뜻일까? 현대의 앱들은 매우 복잡하게 구성되어 있다. 그렇기 때문에 클라우드 마비로 인해 벌어질 일을 정확히 예측한다는 게 점점 어려워지고 있다. 다양한 요소들과 서비스, 특히 외부에서 수급해 온 것들이 다양하게 탑재된 상태로 앱이 개발되는 것이 보통이다. 예를 들어 은행 앱의 경우 온프레미스 시스템을 통해 잔금을 확인할 수 있게 해 주기도 하지만, 클라우드와 연계하여 신용 관련 DB에 접속한 후 온라인 대출 서비스를 받을 수 있게도 해 준다. 이 때 관련 클라우드 서비스가 마비되면 대출과 관련된 업무가 마비되고, 은행 고객의 상황에 따라 큰 일이 벌어질 수도 있다. 작년 페이스북이 여섯 시간 동안 마비되었을 때 페이스북 계정으로 로그인을 하도록 설정된 서비스들과 앱들이 일제히 마비되었던 것도 참고할 만한 사례다.
이렇게 복잡하게 얽혀 있는 앱과 서비스이기 때문에 최근 앱과 서비스의 내부가 어떤 식으로 외부 서비스와 연결되어 있는지를 볼 수 있게 해 주는 도구들에 대한 수요가 점점 높아지고 있다. 이런 시장을 미리 조사하고, 각 솔루션들의 성능과 사용 타당성을 검토하여 적절하게 투자를 한다면 문제 발생 시 근본적인 요인을 파악하는 게 수월해진다.
(클라우드 업체에 압력을 넣는다는 것도 현재로서는 그리 쉬운 일은 아니다. 이는 업체 하나가 단독으로 할 수 있는 일이라기보다 모두가 같이 해야 하는 일이기 때문이다. 지금은 클라우드 업체의 힘이 막강하지만 모든 고객사와 잠재적 고객사가 클라우드 관련 사고들에 대한 대비책을 강력하게 요구하기 시작한다면 클라우드 회사들도 움직일 수밖에 없다.)
근본적인 요인 이야기가 나온 김에 짚고 넘어가자면, 작년에 발생한 페이스북, 클라우드플레어, 구글 클라우드의 일시적인 마비 사태의 원인은 잘못된 설정 변경 때문이었다. 페이스북의 경우 원인을 파악한 후 다음과 같이 발표했다. “데이터센터들 간의 네트워크 트래픽을 제어하는 라우터들의 설정이 변경되는 일이 있었습니다. 이 때문에 도미노 효과가 야기됐고, 특히 데이터센터들 간 통신과 소통에 심각한 문제가 생겨났습니다. 그리고 결국 서비스 전체가 마비됐습니다.” 이 사건으로 외부 컴퓨터와 모바일 장비로는 페이스북, 인스타그램, 왓츠앱에 접속할 수가 없게 됐었다.
IT 기업 NS1의 CTO인 크리스 부이스(Chris Buijs)는 “해당 사건을 통해 클라우드 사용자 기업이 배울 수 있는 가장 큰 교훈은 ‘모든 자산을 한 곳에 몰아두면 안 된다’는 것”이라고 짚는다. “DNS는 물론 각종 앱들과 기능, 데이터를 단일 네트워크에 두면 안 된다는 겁니다. 분산 배치가 꼭 필요하죠. 특히 클라우드나 데이터센터와는 독립적으로 작동하는 DNS 솔루션을 사용하는 게 중요합니다. 클라우드 서비스가 마비되더라도 DNS가 기능할 수 있도록 말이죠.”
이런 주장들이 나오기 시작하면서 핵심 DNS 시스템에 대한 업계의 관심도가 높아졌다. 그러면서 밝혀진 사실이 하나 있는데, 세계의 DNS 서비스 13개에서 뭔가 일이 발생하면 모든 인터넷과 클라우드 서비스가 크게 망가진다는 것이다. 이는 전 세계 인터넷 도메인 관리와 정책을 결정하는 비영리 기구인 아이칸(ICANN)에서도 인정하고 있는 내용이다.
(그러나 DNS는 기술적이기도 하지만 지정학적인 문제와도 관련이 깊기 때문에 개선을 쉽게 할 수 없다. 우크라이나를 러시아가 침공했을 때, DNS 시스템을 사용해 러시아를 고립시키고 공공 인터넷에서부터 러시아의 웹사이트들을 전부 차단하자는 이야기가 나왔었다. 하지만 이 요청은 받아들여지지 않았다. 아이칸 측에서 “인터넷을 정치적 무기로 사용하지 않게 하는 것이 우리의 존재 목적 중 하나”라고 선을 그었기 때문이다. “아이칸은 인터넷에 제대로 작동하도록 하는 기구이지 안 되도록 하는 기구가 아닙니다.” DNS를 지금 상태에서 변경한다는 건 여러 모로 힘들 수 있다.)
기업들은 인터넷과 클라우드 없이 사업을 진행하기가 힘들다. 그래서 클라우드와 통신사, 인터넷 서비스 공급 업체의 힘이 세고, 그래서 사용 기업들 입장에서 클라우드 마비 시 할 수 있는 일이 그리 많지 않다. 클라우드 서비스 업체가 설정을 잘못해서 생기는 전 세계적인 마비 현상에도 사용자 기업이 손해를 감내해야 한다.
이런 상황에서 네트워크 담당자가 할 수 있는 최선은 가시성 및 모니터링 도구/서비스를 활용해 클라우드와 연계된 서비스나 앱들에서 발생하는 문제의 근원을 최대한 명확히 확인하는 것이다. 또한 사건이 발생하기 전부터도 이런 도구들을 이용해 어떤 클라우드 서비스가 어떤 식으로 마비됐을 때 어떤 리스크가 있을 수 있다는 걸 미리 계산해 두는 것도 현명한 방법이다. 여기에 더해 당장 성과가 없더라도 클라우드 업체에 이런 저런 손해 배상과 사고 방비책을 강력히 요구하는 것도 꾸준히 할 필요가 있다.
글 : 살바토어 살라몬(Salvatore Salamone), IT 칼럼니스트
출처 : 보안뉴스
https://www.boannews.com/media/view.asp?idx=109076
'[IT 알아보기] > IT 소식' 카테고리의 다른 글
[IT 소식] SKT, 청정 우도 위해 팔 걷었다…다회용컵 순환시스템 도입 (0) | 2022.08.19 |
---|---|
[IT 소식] 자율주행 로봇이 24시간 순찰하는 시대 임박 (0) | 2022.08.18 |
[IT 소식] LG전자, KT와 손잡고 '서비스 로봇' 사업 확대 (0) | 2022.08.17 |
[IT 소식] 업비트 의존 낮춰가는 케이뱅크…상반기 최대 순이익 달성 (0) | 2022.08.17 |
[IT 소식] 틱톡, 텍스트로 이미지 만드는 'AI 그린스크린' 도입 (0) | 2022.08.17 |