[블록미디어 명정선 기자] 인공지능(AI) 스타트업 앤스로픽(Anthropic)이 개발 중인 최신 AI 모델 ‘미토스(Mythos)’가 공식 출시 전 외부 비인가 사용자들에게 유출되는 사고가 발생했다. 미토스는 사이버 공격에 악용될 수 있을 만큼 강력한 성능을 지닌 것으로 알려져 있어, AI 업계의 보안 관리 체계에 대한 우려가 커지고 있다.
‘프로젝트 글래스윙’ 베일 벗기도 전에 보안 뚫려
21일(현지시각) 블룸버그 통신 등 외신에 따르면 소수의 비인가 사용자들이 앤스로픽의 차세대 AI 모델인 미토스에 접근해 이를 사용해온 것으로 드러났다. 앤스로픽은 최근 ‘프로젝트 글래스윙(Project Glasswing)’이라는 이름 아래 애플, 아마존, 시스코 등 극소수의 협력사에만 보안 점검용으로 이 모델을 선공개하겠다고 발표했으나, 발표 당일 이미 외부 유출이 이뤄진 것으로 파악됐다.
미토스는 앤스로픽 스스로도 “위험할 정도로 강력하다”고 평가하는 모델이다. 사용자 지시에 따라 주요 운영체제(OS)와 웹 브라우저의 보안 취약점을 식별하고 이를 공략할 수 있는 능력을 갖췄기 때문이다. 이 때문에 앤스로픽은 엄격한 심사를 거친 기업들에만 제한적으로 접근 권한을 부여해왔다.
협력사 관리 소홀이 원인… “데이터 유출 사고 여파인 듯”
이번 유출은 앤스로픽의 직접적인 서버 해킹보다는 제3자 협력업체 및 위탁 인력을 통한 우회 접근이 원인이 된 것으로 분석된다.
취재원에 따르면, 비인가 사용자들은 앤스로픽의 모델 평가 업무를 수행하던 외주 업체 소속 인력의 접근 권한을 이용했다. 또한 최근 AI 트레이닝 스타트업 ‘머커(Mercor)’에서 발생한 데이터 유출 사고 당시 노출된 정보를 바탕으로 미토스의 서버 위치를 추측해 접속에 성공한 것으로 알려졌다. 이들은 비공개 디스코드 채널을 통해 정보를 공유하며 앤스로픽이 깃허브(GitHub) 등에 게시한 미공개 정보를 봇(Bot)으로 추적해온 것으로 전해졌다.
앤스로픽 대변인은 “제3자 벤더 환경을 통한 ‘클로드 미토스 프리뷰’에 대한 비인가 접근 보고를 조사 중”이라며 “현재까지 앤스로픽 자체 시스템이 침해되거나 벤더 외부로 정보가 확산됐다는 증거는 발견되지 않았다”고 밝혔다.
“단순 호기심” 해명에도 업계는 ‘긴장’
해당 모델에 접근한 사용자들은 자신들의 행위가 사이버 공격을 위한 것이 아니라 신규 모델을 먼저 체험해보기 위한 ‘호기심’ 차원이라고 주장하고 있다. 앤스로픽의 탐지를 피하기 위해 사이버 보안 관련 프롬프트 대신 단순한 웹사이트 제작 등 일상적인 작업에만 모델을 활용했다는 설명이다.
하지만 전문가들은 이번 사건이 AI 개발사의 보안 통제력을 시험대에 올렸다고 지적한다. 아무리 강력한 안전 가이드라인을 세우더라도, 개발 과정에 참여하는 수많은 협력업체와 위탁 인력이라는 ‘공급망의 약점’을 통해 기술이 유출될 수 있다는 점이 증명됐기 때문이다.
현재 미토스는 아마존의 AI 플랫폼 ‘베드록’ 등을 통해 일부 금융 기관과 정부 기관에도 제공되고 있다. 이번 유출 사고로 인해 AI 모델의 조기 도입을 검토하던 기관들의 보안 심사도 한층 까다로워질 전망이다.






