[블록미디어 박현재] 데이터는 AI 개발의 핵심 자원이다. 사용자는 일상 속에서 수많은 데이터를 생성한다. 스마트워치가 측정하는 심박수, 헬스앱의 걸음 수, 소셜미디어 게시글 모두 AI에게는 귀중한 훈련 자원이 된다. 하지만 지금까지 데이터의 소유권은 대부분 대형 플랫폼이 쥐고 있었다.
외신 코인데스크와의 인터뷰에서 안나 카즐라우스카스(Anna Kazlauskas) 바나(Vana) 공동 창업자 겸 오픈데이터랩스(Open Data Labs) 대표는 “사용자는 자신의 데이터 소유권을 갖고 있지만 이를 인식하지 못하고 있다”며 “사용자들이 힘을 모으면 AI 시장에서 데이터 주권을 되찾을 수 있다”고 말했다.
바나는 △데이터DAO(탈중앙형 자율조직) △분산형 데이터 마켓플레이스 △VRC-20 토큰 △분산 AI 모델 훈련 협업 등을 통해 사용자 중심 데이터 생태계를 만들고 있다. 카즐라우스카스는 오는 5월 16일 캐나다 토론토에서 열리는 ‘컨센서스 2025’ AI 서밋 기조연설자로 나서 이 같은 비전을 발표할 예정이다.
데이터DAO와 사용자 협력 생태계로 ‘사용자 소유’ AI 모델 구축 시도
카즐라우스카스는 “데이터DAO는 일종의 데이터 노동조합”이라고 표현했다. 개개인의 데이터는 가치가 제한적이지만 수많은 사용자가 데이터를 모으면 AI 모델 훈련에 필요한 규모의 자원이 된다. DAO를 통해 사용자는 데이터 활용 방식을 직접 결정하고 보상을 받을 수 있다.
현재 의료 분야에서 △바이오메트릭 △수면 데이터 △운전 정보 등을 다루는 다양한 DAO들이 등장하고 있다. 그중 운전자 데이터 프로젝트인 DLP 랩스에서는 테슬라 이용자의 주행 데이터를 바탕으로 새로운 연구와 모델 구축이 이뤄지고 있다.
바나는 최근 플라워랩스(Flower Labs)와 함께 ‘콜렉티브-1(COLLECTIVE-1)’ 프로젝트를 시작했다. 이는 세계 최초 사용자 소유 기반 AI 기초 모델을 목표로 한다. 플라워랩스는 분산형 AI 훈련 기술을 보유한 기업이다. 플라워랩스가 훈련 알고리즘과 시스템을 담당하고, 바나가 사용자 데이터 확보와 관리 역할을 맡는다. AI 모델 훈련에 필요한 데이터를 제공한 사용자가 해당 모델의 소유권을 갖는 구조다.
카즐라우스카스는 “중앙화된 기업보다 더 뛰어난 모델을 만들 수 있는 열쇠는 바로 데이터”라며 “사용자 데이터는 다양한 플랫폼을 넘나들 수 있어 기존 기업보다 풍부하고 다양성 있는 데이터셋을 확보할 수 있다”고 말했다. 그는 향후 수년 내 1억 명 이상의 사용자가 바나 생태계에 참여할 것으로 예상하며, “10년 안에 전 세계 인구가 사용자 데이터 주권을 가질 수 있는 세상이 올 것”이라고 전망했다.