AI 추론 수요 급증으로 데이터센터 전력·네트워크 부담 확대
'탈중앙화 인프라', 위험 분산을 위한 현실적 대안으로 재조명
[블록미디어 오수환 기자] 인공지능(AI) 서비스 확산으로 대규모 언어모델(LLM) 운영 트래픽과 연산 부담이 중앙화 클라우드 인프라에 집중되면서, 대규모 장애가 반복되는 구조적 문제가 부각되고 있다. 업계에서는 클라우드 중심 구조의 한계가 드러난 만큼 탈중앙화 인프라가 현실적인 대안으로 떠오르고 있다는 분석이 나온다.
5일 정보통신(IT) 업계에 따르면 지난해 하반기 동안 인터넷 인프라 서비스 클라우드플레어(Cloudflare)와 마이크로소프트 애저(Microsoft Azure) 등 주요 클라우드 서비스에서 총 세 차례의 장애가 발생한 것으로 확인됐다. 이 과정에서 글로벌 웹 트래픽을 비롯해 서비스형 소프트웨어(SaaS), 개발 도구, 인증 서비스 등 다수의 하위 서비스가 연쇄적으로 영향을 받으며, 인프라 계층에 위치한 서비스일수록 장애의 파급 범위가 기하급수적으로 확대되는 문제가 다시 한 번 나타났다.
이 같은 문제는 지난해 11월 발생한 클라우드플레어의 대규모 네트워크 장애 사례에서도 뚜렷하게 드러났다. 당시 사고로 전 세계 웹사이트 트래픽의 약 20%가 일시적으로 영향을 받았으며, 인공지능 플랫폼인 챗지피티(ChatGPT)와 퍼플렉시티(Perplexity)를 비롯해 X(옛 트위터), 디스코드(Discord) 등 주요 글로벌 소셜 미디어 전반에서 접속 장애가 발생했다. 디지털자산(가상자산) 시장도 예외는 아니었다. 국내 디지털자산 거래소 업비트 역시 지난달 일부 서비스에서 접속 지연 등의 영향을 받았다.
AI 수요 급증, 클라우드 인프라에 쏠리는 부담
클라우드 장애의 원인은 네트워크 오류, 소프트웨어 결함, 설정 미스, 전력 문제 등으로 다양하지만 최근 AI 서비스 대중화로 트래픽과 연산 수요가 급증하면서 장애 발생 빈도가 더욱 높아지고 있다. AI 모델의 학습 과정은 막대한 비용과 전력을 소모한다. 예를 들어 AI의 추론 단계는 학습이 완료된 모델을 실제 서비스에 배포해 운영하는 과정으로, 검색·챗봇·추천 엔진 등 실시간 애플리케이션을 구동하는 핵심 역할을 맡는다.
이 과정에서는 서버 장비 한 대 또는 서버 묶음 기준으로 30~150킬로와트(kW)에 달하는 전력이 요구되며, 일부 구형 하드웨어는 여러 개의 세분화된 작업을 동시에 처리하는 용도로 재활용될 수 있다. 모델 학습 비용이 대규모 자본 투자를 필요로 하고 상업적 효과와의 직접적인 연결이 상대적으로 불분명한 반면, 추론 과정에서 발생하는 비용은 지속적으로 발생하며 매출 창출과 직접적으로 맞닿아 있는 경우가 많다.
컨설팅 업체 맥킨지는 지난달 보고서를 통해 “2030년까지 AI 데이터센터에서는 추론 단계가 모델 학습을 넘어 주요 연산 형태로 자리 잡아, 전체 AI 연산의 절반 이상을 차지하고 데이터센터 전체 수요의 약 30~40%에 이를 것”이라며 “일회성 모델 학습 중심 구조에서 지속적인 추론 중심 구조로 전환되면서, 네트워크 설계와 전력 공급 방식 전반에 더욱 큰 영향을 미칠 것으로 예상한다”고 밝혔다.
트래픽 증가는 클라우드 서비스 장애를 유발하는 주요 요인 중 하나로 작용하고 있다. 스탠포드 연구진은 “대규모 LLM을 향한 방대한 이용자 질문과 명령이 대부분 중앙화된 클라우드 인프라에서 구동되는 최신 모델에 집중되고 있다”며 “수요 증가 속도가 인프라 확장 속도를 앞지르면서 클라우드 사업자들의 대응 여력이 한계에 이르고 있다”고 설명했다. 이어 “LLM 수요가 급증할수록 중앙 집중형 클라우드 인프라에 가해지는 부담도 함께 커지고 있다”고 덧붙였다.
AI 시대 인프라 해법으로 다시 떠오른 탈중앙화
이러한 흐름 속에서 클라우드 의존도를 낮추기 위한 해법으로 탈중앙화를 보다 현실적인 인프라 전략으로 바라봐야 한다는 주장이 힘을 얻고 있다. 탈중앙화를 추상적인 이념이나 철학의 문제로 보기보다, AI 확산으로 복잡해진 디지털 인프라 환경에서 위험을 분산하기 위한 실용적인 수단으로 활용해야 한다는 분석이다.
비탈릭 부테린 이더리움 공동 설립자는 지난 1일(현지시각) X를 통해 탈중앙화가 형식적인 수준에 머물러서는 안 된다고 지적했다. 그는 “블록체인 네트워크만 탈중앙화돼서는 충분하지 않다”며 “네트워크를 운영하는 소프트웨어와 관련 인프라 전반에서 탈중앙화가 함께 이뤄져야 한다”고 밝혔다.
특히 그는 사용자가 실제로 체감할 수 있는 수준의 탈중앙화가 중요하다고 강조했다. 부테린은 “사용자가 직접 이용하는 애플리케이션 역시 특정 기업이나 플랫폼에 의존하지 않고 독립적으로 작동해야 한다”며 “사용자 입장에서는 클라우드가 다운되더라도 아무 일도 일어나지 않는 애플리케이션이 필요하다”고 설명했다.
이어 “이 같은 특성은 다소 급진적으로 들릴 수 있지만, 한 세대 전만 해도 지갑이나 책, 가전제품, 자동차 등 우리 일상 속 대부분의 제품에는 이미 적용돼 왔다”며 “구독형 서비스가 본격화되면서 중앙화된 통제가 보편화된 것이 오히려 최근의 변화”라고 덧붙였다.



![[위클리 핫 키워드] 유가·AI·자금 ‘삼각 구도’ ⋯ 시장 흔드는 복합 변수 [위클리 핫 키워드] 유가·AI·자금 ‘삼각 구도’ ⋯ 시장 흔드는 복합 변수](https://cdn.blockmedia.co.kr/wp-content/uploads/2026/04/20260412-112749-560x373.png)


![[VC동향] “밈코인 말고 기술력”…VC 자금, 디파이·RWA·AI 결합 인프라로 몰린다 [VC동향] “밈코인 말고 기술력”…VC 자금, 디파이·RWA·AI 결합 인프라로 몰린다](https://cdn.blockmedia.co.kr/wp-content/uploads/2026/04/20260410-161917-560x305.jpg)