[블록미디어 박현재] AI 산업 성장의 핵심 동력인 데이터가 고갈되고 있다. 거대 언어 모델(LLM)과 생성형 AI의 발전은 막대한 양의 훈련 데이터에 의존해 왔지만, 인터넷상 고품질 데이터는 한계에 도달했다.
일론 머스크는 “AI 훈련에 활용할 수 있는 인간 지식은 이미 고갈됐다”고 말했다. 페이스북 전 임원 샘 레진(Sam Lessin)은 이 상황을 “챗봇들이 인간을 상대로 프래킹(fracking)을 하는 셈”이라며, AI가 저품질 대용량 콘텐츠까지 긁어모아 정보를 추출하는 현실을 꼬집었다.
# 인터넷 데이터 독점과 개인 소유권 부재
데이터 고갈 문제 이면에는 인터넷 데이터 생태계의 비효율적 구조가 자리한다. 거대 플랫폼 기업들은 사용자가 생성한 데이터를 독점하고, 이를 AI 기업에 판매해 수익을 올린다.
예컨대 2024년 초 레딧(Reddit)은 사용자 데이터를 구글에 AI 학습용으로 제공하며 6000만 달러 규모 거래를 체결했다. 그러나 데이터 생성 당사자인 사용자들은 거래에서 배제됐다.
법적으로 개인은 자신의 데이터에 권리를 가진다. 하지만 현실에서는 플랫폼들이 데이터의 경제적 가치를 대부분 회수해왔다. 데이터 가격을 투명하게 매길 시장이나 체계도 부재하다. 결국 개인 데이터의 잠재적 가치는 실현되지 못하고 있다.
# 마이트릭스(Maitrix)와 데이터 담보 스테이블코인 실험
개인이 데이터를 소유하고 거래할 수 있는 생태계를 조성하기 위해서, 바나는 AI 생태계를 위한 차세대 스테이블코인 프로토콜 마이트릭스(Maitrix)와 협력하며 데이터 금융화 실험도 시작했다.
마이트릭스는 AI 프로젝트가 자체 토큰이나 자산을 담보로 스테이블코인을 발행할 수 있도록 지원한다. 바나 데이터DAO가 축적한 의료 데이터 등 집단 데이터 풀은 향후 생성할 수익을 담보로 스테이블코인을 발행할 수 있다.
이는 데이터 제공자가 향후 가치에 대한 선대출을 받는 개념이다. 발행된 스테이블코인은 실제 화폐처럼 유통되며 데이터 자산의 가치를 반영한다. 마이트릭스는 이러한 구조를 기술적으로 지원해 AI 데이터 생태계를 위한 금융 인프라를 구축하고 있다.
# 데이터 금융화가 여는 새로운 경제
데이터의 금융화와 자산화는 AI 중심 사회에서 새로운 경제적 가능성을 제시한다. 데이터 가치가 공식적으로 평가되고 거래되면 △양질의 데이터 생산 △AI 발전 촉진 △사용자 보상 구조 정립이 가능하다.
개인은 데이터를 통해 배당소득을 얻거나 담보 금융 서비스를 이용할 수 있으며, 데이터 소유권 강화로 프라이버시 보호도 자연스럽게 이루어진다.
바나와 마이트릭스의 실험은 개인과 커뮤니티가 데이터 가치를 발견하고 AI 발전에 기여하며 보상받는 새로운 생태계 모델을 제시한다. 데이터는 정적인 자산이 아니라 동적 금융 도구로 자리매김하며, 기존 빅테크 중심 데이터 경제를 대체하는 ‘데이터 르네상스’로의 전환 가능성을 보여준다.
같이 보면 좋은 기사
플라워AI·바나(VANA), 데이터센터 없는 AI 개발…미국 유명 테크 매거진 “AI 패러다임 변화 가능성”