상세 컨텐츠

본문 제목

IT 블랙아웃, 항공, 금융, 통신 등 주요 시스템 마비

카테고리 없음

by 늦둥이아빠 2024. 7. 20. 10:36

본문

IT 블랙아웃 정의

IT 블랙아웃은 정보통신(IT) 시스템의 광범위하고 갑작스러운 중단을 의미합니다. 이로 인해 항공, 금융, 통신 등 여러 산업에서 주요 시스템이 마비되며, 기업과 개인 모두에게 막대한 영향을 미칩니다. IT 블랙아웃은 보통 기술적 오류, 시스템 충돌, 사이버 공격 등으로 인해 발생하며, 복구 작업이 복잡하고 시간이 많이 소요될 수 있습니다.

IT 블랙아웃, 항공, 금융, 통신 등 주요 시스템 마비

IT 블랙아웃 사례

1. 2024년 MS 애저 IT 블랙아웃

  • 사건 개요: 2024년 마이크로소프트(MS)의 클라우드 서비스인 '애저'의 보안 프로그램 업데이트 과정에서 발생한 시스템 충돌로 인해 전 세계 항공, 금융, 미디어 기업들의 IT 시스템이 마비되었습니다.
  • 원인:  사이버 보안업체 '크라우드 스트라이크'의 보안 프로그램 '팰컨 센서'가 윈도 시스템과 충돌하여 발생한 이번 사건은 특히 클라우드 기술의 광범위한 사용으로 인해 피해가 확산되었습니다.
  • 복구 과정: 많은 시스템이 수동으로 재부팅이 필요하여 복구에 수주일이 소요될 수 있으며, 특히 IT 담당 직원을 줄이거나 아웃소싱한 기업들은 복구에 더욱 어려움을 겪고 있습니다. MS와 크라우드 스트라이크는 긴급 복구 패치를 개발 중이며, 완전 정상화까지 시간이 필요합니다.

2. 2022년 오크타(Okta) 보안 인증 서비스 장애

  • 사건 개요: 2022년 3월, 보안 인증 서비스 업체 오크타의 시스템 장애로 인해 많은 기업의 인증 서비스가 중단되었습니다. 이로 인해 직원들이 회사 시스템에 접속하지 못하는 상황이 발생했습니다.
  • 원인: 오크타는 클라우드 인프라에서의 구성 변경 중 발생한 오류가 원인이라고 밝혔습니다. 이 오류로 인해 인증 서버 간의 통신이 차단되었습니다.
  • 복구 과정: 오크타는 시스템 구성을 원상태로 복구하고 인증 서버를 재부팅하여 문제를 해결했습니다. 이후 오크타는 시스템 구성 변경 절차를 개선하고, 모니터링 시스템을 강화했습니다.

3. 2021년 패스트리 CDN 장애

  • 사건 개요: 2021년 6월, 콘텐츠 배달 네트워크(CDN) 업체 패스트리(Fastly)의 시스템 장애로 인해 전 세계적으로 많은 웹사이트가 중단되는 사태가 발생했습니다. 이로 인해 뉴욕 타임스, CNN, 아마존, 레딧 등 많은 주요 웹사이트가 접속 불가능해졌습니다.
  • 원인: 패스트리는 소프트웨어 버그로 인해 특정 설정이 잘못 적용되면서 전 세계적으로 많은 서버가 동시다발적으로 중단된 것이라고 밝혔습니다.
  • 복구 과정: 패스트리는 즉시 문제를 해결하기 위해 소프트웨어 패치를 배포하고, 시스템을 재부팅하여 서비스를 정상화했습니다. 이후 패스트리는 유사한 문제를 방지하기 위해 소프트웨어 검증 절차를 강화하고 모니터링 시스템을 개선했습니다.

4. 2019년 페이스북 서비스 장애

  • 사건 개요: 2019년 3월, 페이스북은 14시간 동안 전 세계적으로 서비스가 중단되는 대규모 장애를 겪었습니다. 이로 인해 페이스북, 인스타그램, 왓츠앱 등의 서비스 이용이 불가능해졌습니다.
  • 원인: 페이스북은 서버 설정 변경 작업 중 발생한 오류가 원인이라고 밝혔습니다. 이로 인해 데이터베이스 서버 간의 통신이 차단되어 서비스에 장애가 발생했습니다.
  • 복구 과정: 페이스북은 서버 설정을 원상태로 복구하고 데이터베이스 서버를 재부팅하여 문제를 해결했습니다. 페이스북은 이후 서버 설정 변경 절차를 개선하고 재발 방지를 위한 대책을 마련했습니다.

5. 2018년 구글 클라우드 서비스 장애

  • 사건 개요: 2018년 3월, 구글 클라우드 서비스가 약 4시간 동안 중단되어 전 세계 많은 기업과 사용자가 영향을 받았습니다. 이 장애로 인해 구글 드라이브, 구글 문서, 구글 스프레드시트 등 여러 서비스가 사용 불가능해졌습니다.
  • 원인: 장애의 원인은 네트워크 구성 변경 중에 발생한 오류로, 일부 서버 간의 통신이 차단되면서 발생했습니다.
  • 복구 과정: 구글은 즉시 네트워크 구성을 원상태로 복구하고 시스템을 재부팅하여 서비스를 정상화했습니다. 구글은 이후 비슷한 사고를 방지하기 위해 네트워크 구성 변경 절차를 개선하고 모니터링 시스템을 강화했습니다.

6. 2017년 브리티시 에어웨이즈(BA) IT 블랙아웃

  • 사건 개요: 2017년 5월, 브리티시 에어웨이즈는 전산 시스템 장애로 인해 전 세계적으로 항공편이 취소되고 지연되는 사태를 겪었습니다. 이로 인해 약 75,000명의 승객이 영향을 받았고, 히드로 및 개트윅 공항은 대혼란에 빠졌습니다.
  • 원인: 이 사건은 데이터 센터의 전원 공급 문제로 인해 발생했습니다. 데이터 센터의 전원이 꺼졌다가 갑자기 복구되는 과정에서 전산 시스템이 충돌하여 문제가 발생했습니다.
  • 복구 과정: 시스템 복구에는 수일이 걸렸으며, BA는 수동으로 시스템을 재부팅하고 데이터를 복구하는 작업을 진행했습니다. 이 사건으로 BA는 약 1억 파운드의 손실을 입었습니다.

IT 블랙아웃 피해 규모

IT 블랙아웃은 광범위한 산업과 지역에 걸쳐 큰 피해를 초래합니다. 2024년 MS 애저 IT 블랙아웃의 경우, 주요 피해는 다음과 같습니다:

  1. 항공업계: 항공편 취소 및 지연, 예약 시스템 장애로 인해 여행객들이 큰 불편을 겪었습니다.
  2. 금융업계: 은행 및 금융 서비스의 중단으로 인해 거래 지연 및 금융 서비스 이용에 차질이 발생했습니다.
  3. 미디어업계: 방송 및 온라인 콘텐츠 제공에 차질이 생겨 사용자들이 서비스 이용에 불편을 겪었습니다.
  4. 기업 전반: 다수의 기업이 클라우드 기반 서비스에 의존하고 있어, 운영 중단과 데이터 접근 불가능으로 인한 막대한 손실을 입었습니다.

방지 대책

IT 블랙아웃을 방지하고 피해를 최소화하기 위한 주요 대책은 다음과 같습니다:

  1. 다양한 보안 테스트: 시스템 업데이트나 새로운 보안 프로그램 도입 전에 다양한 시나리오를 가정한 보안 테스트를 실시하여 문제 발생 가능성을 사전에 확인해야 합니다.
  2. 백업 시스템 구축: 주요 시스템의 백업을 정기적으로 실시하고, 백업 시스템을 구축하여 문제가 발생했을 때 신속히 대체할 수 있도록 합니다.
  3. 자동화된 복구 시스템: IT 시스템의 자동 복구 기능을 강화하여, 문제가 발생했을 때 최소한의 인력으로 신속히 복구할 수 있도록 합니다.
  4. 직원 교육 및 훈련: IT 담당 직원들에게 정기적인 교육과 훈련을 실시하여, 문제 발생 시 신속하고 효과적으로 대응할 수 있도록 합니다.
  5. 외부 전문가와의 협력: 사이버 보안 전문 기업과 협력하여 최신 보안 위협에 대비하고, 긴급 상황 시 신속히 대응할 수 있는 협력 체계를 구축합니다.
  6. 모니터링 및 경고 시스템 강화: 시스템 모니터링을 강화하고, 문제가 발생할 조짐이 보일 때 즉시 경고를 발령하여 조기 대응이 가능하도록 합니다.

결론

IT 블랙아웃은 현대 사회의 정보통신 기반을 위협하는 큰 사건입니다. 이를 방지하기 위해서는 다양한 보안 대책을 철저히 마련하고, 문제가 발생했을 때 신속히 대응할 수 있는 시스템을 구축하는 것이 중요합니다. 2024년 MS 애저 IT 블랙아웃 사례는 이러한 준비의 중요성을 다시 한 번 상기시키며, 모든 기업과 기관이 이에 대한 대비를 강화해야 함을 보여줍니다.

 

관련된 글이 궁금하시면 아래 링크를 클릭하세요.

 

초연결 사회로 인한, 국내 IT 중단 피해 수차례 발생

초연결 사회의 위기: 국내 IT 피해 사례초연결 사회에서 IT 시스템은 우리의 일상과 비즈니스 운영의 중심입니다. 하지만, 이러한 시스템이 중단되면 광범위한 피해가 발생할 수 있습니다. 국내

rinfo.tistory.com

 

클라우드 시스템의 단점과 해결책

최근 글로벌 2위 클라우드 서비스 제공업체인 마이크로소프트의 클라우드 시스템이 대규모 장애를 일으키며 전 세계에 큰 혼란을 야기했습니다. 이 사건은 클라우드 시스템의 단점과 이에 대한

rinfo.tistory.com

 

하이브리드 및 멀티 클라우드 시장 현황 및 전망

최근 몇 년간 클라우드 컴퓨팅 시장은 급속한 성장을 이루었으며, 특히 하이브리드 및 멀티 클라우드 전략이 주목받고 있습니다. 하이브리드 및 멀티 클라우드의 정의, 현재 시장 현황, 주요 동

rinfo.tistory.com

 

클라우드 컴퓨팅의 최신 동향과 활용법

서론 최신의 클라우드 컴퓨팅 동향과 활용법은 계속해서 진화하고 있습니다. 아래는 몇 가지 주요한 동향과 활용법에 대한 내용을 알아보도록 하겠습니다. 클라우드 컴퓨팅의 최신 동향 1. 다중

rinfo.tistory.com

 

클라우드 컴퓨팅의 중요성과 기업 혁신에 미치는 영향

클라우드 컴퓨팅은 현대 기업이 디지털 혁신과 경쟁에서 성공하기 위해 필수적인 역할을 하고 있습니다. 이 기술은 기업의 IT 인프라를 개선하고 유연성을 제공함으로써 기업의 성과를 향상시

rinfo.tistory.com