简体中文

繁體中文

English

Tiếng Việt

한국어

日本語

ภาษาไทย

Türkçe

바나: AI 시대에 토큰처럼 데이터를 자유롭게 흐르게 하여 가치를 창출하세요

思维怪怪

2024-09-24 10:30

이 글을 읽으려면 27 분

Vana는 "데이터 DAO"와 "기여 증명"을 활용하여 AI 시대의 데이터 가치 사슬을 어떻게 재구성합니까?

Reddit이나 X(구 Twitter)와 같은 소셜 미디어가 왜 무료로 이용 가능한지 생각해 본 적 있으신가요? 그 답은 여러분이 올리는 게시물, 클릭하는 좋아요, 심지어 매일 접속하는 시간에서 찾을 수 있습니다.

옛날에는 이러한 플랫폼들이 여러분의 관심을 상품처럼 광고주에게 팔았습니다. 이제 그들은 더 큰 구매자, 바로 AI 기업을 찾았습니다. Reddit과 Google 간의 데이터 라이선스 계약만으로도 Reddit은 연간 6천만 달러의 수익을 올릴 수 있다고 합니다. 그리고 이 엄청난 부는 데이터 생성자인 여러분과 저와는 아무런 상관이 없습니다.

더욱 우려스러운 것은 우리의 데이터로 훈련된 AI가 미래에 우리의 일자리를 대체할 수도 있다는 것입니다. AI가 새로운 일자리를 창출할 수도 있지만, 이러한 데이터 독점으로 인한 부의 집중 현상은 의심할 여지 없이 사회적 불평등을 심화시켰습니다. 우리는 소수의 기술 대기업이 지배하는 사이버펑크 세계로 빠져드는 듯합니다.

그렇다면 평범한 사람으로서 이 AI 시대에 우리의 이익을 어떻게 보호할 수 있을까요? AI의 등장 이후 많은 사람들은 블록체인을 AI에 저항하는 인간의 최후의 방어선으로 여겼습니다. 이러한 사고방식을 바탕으로 일부 혁신가들은 해결책을 모색하기 시작했습니다. 그들은 다음과 같이 제안했습니다. 첫째, 우리는 자신의 데이터에 대한 소유권과 통제권을 되찾아야 합니다. 둘째, 이 데이터를 활용하여 일반인에게 진정으로 도움이 되는 AI 모델을 공동으로 학습시켜야 합니다.

이 아이디어는 이상적으로 보일 수 있지만, 역사를 돌이켜보면 모든 기술 혁명은 "미친" 아이디어에서 시작됩니다. 오늘, "바나(Vana)"라는 새로운 퍼블릭 체인 프로젝트가 이 아이디어를 현실로 만들고 있습니다. 최초의 탈중앙화 데이터 유동성 네트워크인 바나(Vana)는 사용자의 데이터를 자유롭게 유통되는 토큰으로 변환하여 사용자가 진정으로 제어하는 탈중앙화 인공지능의 실현을 촉진하고자 합니다.

바나의 창립자이자 프로젝트 기원

사실, 바나의 탄생은 매사추세츠 공과대학교(MIT) 미디어랩의 한 교실로 거슬러 올라갑니다. 그곳에서 세상을 바꾸고 싶었던 두 젊은이, 안나 카즐라우스카스와 아트 아발이 만났습니다.

왼쪽: 안나 카즐라우스카스; 오른쪽: 아트 아발

애나 카즈라우스카스는 MIT에서 컴퓨터 과학과 경제학을 전공했으며, 2015년부터 데이터와 암호화폐에 관심을 갖기 시작했습니다. 당시 그녀는 이더리움 초기 채굴에 참여하면서 탈중앙화 기술의 잠재력을 깊이 인식하게 되었습니다. 이후 연방준비제도, 유럽중앙은행, 세계은행 등 국제 금융 기관에서 데이터 연구를 수행하면서 미래 사회에서 데이터가 새로운 형태의 화폐가 될 것이라는 사실을 깨달았습니다.

동시에 아트 아발은 하버드 대학교에서 공공정책 석사 학위를 취득했으며, 벨퍼 과학국제관계센터에서 데이터 영향평가에 대한 심층 연구를 수행했습니다. 바나에 합류하기 전, 아트는 AI 교육 데이터 제공업체인 아펜(Appen)에서 혁신적인 데이터 수집 방법을 주도했으며, 이는 오늘날 많은 생성적 AI 도구의 탄생에 중요한 기여를 했습니다. 데이터 윤리와 AI 책임에 대한 그의 통찰력은 바나에게 강한 사회적 책임감을 불어넣었습니다.

애나와 아트는 MIT 미디어랩 수업에서 만나 데이터 민주화와 사용자 데이터 권리에 대한 공통된 열정을 공유한다는 것을 금방 깨달았습니다. 데이터 소유권과 AI 공정성 문제를 진정으로 해결하기 위해서는 사용자가 자신의 데이터를 진정으로 제어할 수 있는 시스템, 즉 새로운 패러다임이 필요하다는 것을 깨달았습니다.

이러한 공통된 비전을 바탕으로 두 사람은 Vana를 공동 설립했습니다. 그들의 목표는 사용자의 데이터 주권을 위해 싸우는 것뿐만 아니라 사용자가 자신의 데이터에서 경제적 이익을 얻을 수 있도록 보장하는 혁신적인 플랫폼을 구축하는 것입니다. Vana는 혁신적인 DLP(데이터 유동성 풀) 메커니즘과 기여 증명(Proof of Contribution) 시스템을 통해 사용자가 개인 데이터를 안전하게 제공하고, 이 데이터로 학습된 AI 모델을 공동으로 소유하고 그로부터 이익을 얻을 수 있도록 지원하여 사용자 주도 AI 개발을 촉진합니다.

Vana의 비전은 업계에서 빠르게 인정받았습니다. 현재 Vana는 Coinbase Ventures가 주도한 500만 달러 규모의 전략적 투자 라운드, Paradigm이 주도한 1,800만 달러 규모의 시리즈 A 투자 라운드, 그리고 Polychain이 주도한 200만 달러 규모의 시드 투자 라운드를 포함하여 총 2,500만 달러의 투자 유치를 완료했다고 발표했습니다. 그 외에도 Casey Caruso, Packy McCormick, Manifold, GSR, DeFiance Capital 등의 유명 투자자들이 투자했습니다.

데이터가 새로운 석유와 같은 세상에서 Vana의 등장은 데이터 주권을 되찾을 수 있는 중요한 기회를 제공합니다. 그렇다면 이 유망한 프로젝트는 어떻게 작동할까요? Vana의 기술 아키텍처와 혁신적인 아이디어를 자세히 살펴보겠습니다.

Vana의 기술 아키텍처와 혁신적인 아이디어

Vana의 기술 아키텍처는 데이터를 민주화하고 그 가치를 극대화하도록 세심하게 설계된 생태계입니다. 핵심 구성 요소는 데이터 유동성 풀(DLP), 기여 증명 메커니즘, 나고야 컨센서스, 사용자 셀프 호스팅 데이터, 그리고 분산 애플리케이션 계층입니다. 이러한 요소들이 결합되어 사용자 개인 정보를 보호하고 데이터의 잠재적 가치를 극대화하는 혁신적인 플랫폼을 구축합니다.

1. 데이터 유동성 풀(DLP): 데이터 가치의 초석

데이터 유동성 풀은 Vana 네트워크의 기본 단위로, "유동성 마이닝"의 데이터 버전으로 이해될 수 있습니다. 각 DLP는 특정 유형의 데이터 자산을 집계하도록 특별히 설계된 스마트 계약입니다. 예를 들어, Reddit Data DAO(r/datadao)는 14만 명 이상의 Reddit 사용자를 유치한 성공적인 DLP 사례입니다. DLP는 사용자의 Reddit 게시물, 댓글, 투표 내역을 집계합니다.

사용자가 DLP에 데이터를 제출하면 DLP의 특정 토큰에 대한 보상을 받을 수 있습니다. 예를 들어, Reddit Data DAO(r/datadao)의 특정 토큰은 RDAT입니다. 이러한 토큰은 사용자가 데이터 풀에 기여한 정도를 나타낼 뿐만 아니라, DLP를 관리하고 향후 수익 분배에 대한 권리를 부여합니다. Vana는 각 DLP가 자체 토큰을 발행할 수 있도록 허용하여 다양한 유형의 데이터 자산에 대해 더욱 유연한 가치 확보 메커니즘을 제공한다는 점에 주목할 만합니다.

Vana 생태계에서 상위 16개 DLP는 VANA 토큰 발행에 대한 추가 보상을 받을 수 있으며, 이는 고품질 데이터 풀의 형성 및 경쟁을 더욱 촉진합니다. 이러한 방식으로 Vana는 분산된 개인 데이터를 유동적인 디지털 자산으로 변환하여 데이터의 가치와 유동성을 위한 기반을 마련합니다.

2. 기여 증명: 데이터 가치의 정확한 측정

기여 증명은 Vana가 데이터 품질을 보장하는 핵심 메커니즘입니다. 각 DLP는 자체 특성에 따라 고유한 기여 증명 기능을 맞춤 설정할 수 있습니다. 이 기능은 데이터의 진위성과 무결성을 검증할 뿐만 아니라, AI 모델의 성능 향상에 대한 데이터의 기여도를 평가합니다.

ChatGPT Data DAO를 예로 들면, 기여 증명은 진위성, 소유권, 품질, 고유성이라는 네 가지 핵심 차원을 포괄합니다. 진위성은 OpenAI가 제공하는 데이터 내보내기 링크 확인을 통해 보장되고, 소유권은 사용자 이메일로 확인되며, 품질 평가는 무작위로 샘플링된 대화에 대해 LLM으로 점수를 매깁니다. 고유성은 데이터의 특징 벡터를 계산하여 기존 데이터와 비교하여 결정됩니다.

이러한 다차원적 평가를 통해 고품질의 가치 있는 데이터만 수용되고 보상받을 수 있습니다. 기여 증명은 데이터 가격 책정의 기준일 뿐만 아니라 전체 생태계의 데이터 품질을 유지하는 핵심 보장 요소입니다.

3. 나고야 컨센서스: 탈중앙화 데이터 품질 보증

나고야 컨센서스는 Bittensor의 Yuma 컨센서스를 기반으로 개선된 Vana 네트워크의 핵심입니다. 이 메커니즘의 핵심 아이디어는 검증 노드 그룹을 통해 데이터 품질을 종합적으로 평가하고 가중 평균을 사용하여 최종 점수를 얻는 것입니다.

더욱 혁신적인 점은 검증 노드가 데이터 평가뿐만 아니라 다른 검증 노드의 점수 매기기 행동에도 점수를 매긴다는 것입니다. 이 "2단계 평가" 메커니즘은 시스템의 공정성과 정확성을 크게 향상시킵니다. 예를 들어, 한 검증 노드가 명백히 품질이 낮은 데이터에 높은 점수를 주면 다른 노드들은 이러한 부적절한 행동에 가중 점수를 부여합니다.

1,800블록(약 3시간) 주기마다 시스템은 이 기간 동안의 종합 점수를 기반으로 검증 노드에 상응하는 보상을 할당합니다. 이 메커니즘은 검증 노드가 정직하게 행동하도록 유도할 뿐만 아니라, 부적절한 행동을 신속하게 식별하고 제거하여 전체 네트워크의 원활한 운영을 유지합니다.

4. 비수탁형 데이터 저장: 개인정보 보호를 위한 최후의 방어선

Vana의 주요 혁신 중 하나는 고유한 데이터 관리 방식입니다. Vana 네트워크에서 사용자의 원본 데이터는 실제로 "온체인"에 저장된 적이 없으며, 사용자는 Google Drive, Dropbox 또는 Macbook에서 실행되는 개인 서버 등 저장 위치를 직접 선택합니다.

사용자가 DLP에 데이터를 제출할 때, 실제로는 암호화된 데이터를 가리키는 URL과 선택적 콘텐츠 무결성 해시 값만 제공합니다. 이 정보는 Vana의 데이터 레지스트리 계약에 기록됩니다. 검증자가 데이터에 접근해야 할 때, 복호화 키를 요청한 후, 검증을 위해 데이터를 다운로드하고 복호화합니다.

이러한 설계는 데이터 개인정보 보호 및 통제 문제를 현명하게 해결합니다. 사용자는 데이터 경제에 참여하는 동시에 항상 자신의 데이터에 대한 완전한 통제권을 유지합니다. 이는 데이터 보안을 보장할 뿐만 아니라, 향후 더욱 다양한 데이터 적용 시나리오의 가능성을 열어줍니다.

5. 탈중앙화 애플리케이션 계층: 데이터 가치의 다각화 실현

Vana의 최상위 계층은 개방형 애플리케이션 생태계입니다. 여기에서 개발자는 DLP를 통해 축적된 데이터 유동성을 활용하여 다양하고 혁신적인 애플리케이션을 구축할 수 있으며, 데이터 기여자는 이러한 애플리케이션에서 실질적인 경제적 가치를 얻을 수 있습니다.

예를 들어, 개발팀은 Reddit Data DAO의 데이터를 기반으로 특화된 AI 모델을 학습시킬 수 있습니다. 데이터 기여에 참여하는 사용자는 학습 후 모델을 사용할 수 있을 뿐만 아니라, 각자의 기여 비율에 따라 모델에서 발생하는 수익을 얻을 수 있습니다. 실제로 이러한 AI 모델이 개발되었습니다. 자세한 내용은 "결국, 기존 AI 추적 화폐인 r/datadao가 부활한 이유는 무엇일까요?"를 참조하세요.

이 모델은 더 많은 고품질 데이터 제공을 장려할 뿐만 아니라, 진정한 사용자 주도 AI 개발 생태계를 구축합니다. 사용자는 단순한 데이터 제공자에서 AI 제품의 공동 소유자이자 수혜자로 변모했습니다.

이러한 방식으로 Vana는 데이터 경제를 혁신하고 있습니다. 이 새로운 패러다임에서 사용자는 수동적인 데이터 제공자에서 적극적이고 참여적이며 공동의 이익을 추구하는 생태계 구축자로 변모했습니다. 이는 개인이 가치를 창출할 수 있는 새로운 채널을 창출할 뿐만 아니라, AI 산업 전체에 새로운 활력과 혁신을 불어넣습니다.

Vana의 기술 아키텍처는 데이터 소유권, 개인정보 보호, 가치 분배와 같은 현재 데이터 경제의 핵심 문제를 해결할 뿐만 아니라, 미래의 데이터 기반 혁신을 위한 토대를 마련합니다. 더 많은 데이터 DAO가 네트워크에 참여하고 플랫폼에 더 많은 애플리케이션이 구축됨에 따라, Vana는 차세대 탈중앙화 AI 및 데이터 경제의 인프라가 될 잠재력을 가지고 있습니다.

Satori 테스트넷: Vana의 공개 테스트 그라운드

6월 11일 Satori 테스트넷 출시와 함께 Vana는 생태계 프로토타입을 공개했습니다. 이는 기술 검증 플랫폼일 뿐만 아니라 향후 메인넷 운영 방식을 미리 보여주는 것이기도 합니다. 현재 Vana 생태계는 참여자에게 DLP 검증 노드 실행, 새로운 DLP 생성, 기존 DLP에 데이터를 제출하여 "데이터 마이닝"에 참여하는 세 가지 주요 경로를 제공합니다.

DLP 검증 노드 실행

검증 노드는 Vana 네트워크의 게이트키퍼로서 DLP에 제출된 데이터의 품질을 검증하는 역할을 합니다. 검증 노드를 실행하려면 기술적 역량뿐만 아니라 충분한 컴퓨팅 리소스도 필요합니다. Vana 기술 문서에 따르면 검증 노드의 최소 하드웨어 요구 사항은 CPU 코어 1개, RAM 8GB, 고속 SSD 저장 공간 10GB입니다.

검증자가 되고 싶은 사용자는 먼저 DLP를 선택한 후 해당 DLP의 스마트 계약을 통해 검증자로 등록해야 합니다. 등록이 승인되면 검증자는 해당 DLP에 맞는 검증 노드를 운영할 수 있습니다. 검증자는 여러 DLP의 노드를 동시에 운영할 수 있지만, 각 DLP마다 고유한 최소 스테이킹 요구 사항이 있습니다.

새로운 DLP 생성

새로운 DLP 생성은 고유한 데이터 리소스나 혁신적인 아이디어를 가진 사용자에게 매력적인 옵션입니다. DLP를 생성하려면 Vana의 기술 아키텍처, 특히 기여 증명(Proof of Contribution)과 나고야 합의 메커니즘에 대한 깊은 이해가 필요합니다.

새로운 DLP 생성자는 구체적인 데이터 기여 목표, 검증 방법 및 보상 매개변수를 설계해야 합니다. 동시에 데이터의 가치를 정확하게 평가할 수 있는 기여 증명 기능도 구현해야 합니다. 이 프로세스는 복잡하지만 Vana는 상세한 템플릿과 문서 지원을 제공합니다.

데이터 마이닝 참여

대부분의 사용자에게는 기존 DLP에 데이터를 제출하여 "데이터 마이닝"에 참여하는 것이 가장 직접적인 참여 방법일 수 있습니다. 현재 공식적으로 권장되는 DLP는 13개이며, 소셜 미디어 데이터부터 금융 예측 데이터까지 다양한 분야를 포괄합니다.

· Finquarium: 금융 예측 데이터 수집.

· GPT Data DAO: ChatGPT 채팅 데이터 내보내기에 집중.

· Reddit Data DAO: Reddit 사용자 데이터에 중점을 두고 공식 출시.

· Volara: Twitter 데이터 수집 및 활용에 집중.

· Flirtual: 데이트 데이터 수집.

· ResumeDataDAO: LinkedIn 데이터 내보내기에 집중합니다.

· SixGPT: LLM 채팅 데이터를 수집하고 관리합니다.

· YKYR: Google Analytics 데이터를 수집합니다.

· Sydintel: 크라우드소싱 인텔리전스를 통해 인터넷의 어두운 구석을 파헤칩니다.

· MindDAO: 사용자 만족도와 관련된 시계열 데이터를 수집합니다.

· Kleo: 세계에서 가장 포괄적인 검색 기록 데이터 세트를 구축합니다.

· DataPIG: 토큰 투자 선호도 데이터에 집중합니다.

· ScrollDAO: Instagram 데이터를 수집하고 활용합니다.

이러한 DLP 중 일부는 아직 개발 중이고, 일부는 이미 출시되었지만 모두 사전 채굴 단계에 있습니다. 메인넷이 출시된 후에야 사용자가 공식적으로 채굴 데이터를 제출할 수 있기 때문입니다. 그러나 이제 사용자는 다양한 방식으로 참여 자격을 미리 확보할 수 있습니다. 예를 들어, 사용자는 Vana 텔레그램 앱에서 관련 챌린지 활동에 참여하거나 다양한 DLP 공식 웹사이트에서 사전 등록할 수 있습니다.

요약

Vana의 등장은 데이터 경제의 패러다임 전환을 의미합니다. 현재 AI 시대에서 데이터는 새로운 시대의 "석유"가 되었으며, Vana는 이 자원의 채굴, 정제 및 유통 모델을 혁신하고자 합니다.

본질적으로 Vana는 "공유지의 비극" 솔루션의 데이터 버전을 구축하고 있습니다. 기발한 인센티브 설계와 기술 혁신을 통해, 겉보기에는 무한하지만 수익화하기 어려운 자원인 개인 데이터를 관리, 가격 책정 및 거래가 가능한 디지털 자산으로 전환합니다. 이는 일반 사용자가 AI 배당금 분배에 참여할 수 있는 새로운 방법을 제공할 뿐만 아니라, 분산형 AI 개발을 위한 청사진을 제공합니다.

그러나 Vana의 성공은 여전히 많은 불확실성에 직면해 있습니다. 기술적으로 Vana는 개방성과 보안 간의 균형을 찾아야 하고, 경제적으로는 Vana 모델이 지속 가능한 가치를 창출할 수 있음을 입증해야 하며, 사회적으로는 잠재적인 데이터 윤리 및 규제 과제를 해결해야 합니다.

더 깊은 차원에서 Vana는 기존 데이터 독점 및 AI 개발 모델에 대한 반성이자 도전 과제를 나타냅니다. 이는 중요한 질문을 제기합니다. AI 시대에 우리는 기존 데이터 과점 체제를 계속 강화할 것인가, 아니면 더욱 개방적이고 공정하며 다양한 데이터 생태계를 구축할 것인가?

Vana가 궁극적으로 성공할지 여부와 관계없이, Vana의 등장은 데이터 가치, AI 윤리, 그리고 기술 혁신에 대해 다시 생각해 볼 수 있는 기회를 제공합니다. 앞으로 Vana와 같은 프로젝트는 Web 3의 이상과 AI의 현실을 연결하는 중요한 다리가 되어 디지털 경제 발전의 다음 단계를 제시할 것입니다.

BlockBeats 공식 커뮤니티에 참여하세요:

Telegram 구독 그룹：https://t.me/theblockbeats

Telegram 토론 그룹：https://t.me/BlockBeats_App

Twitter 공식 계정：https://twitter.com/BlockBeatsAsia

#AI #데이터

오류 신고/제보