출처: 토큰포스트
오픈 데이터가 진정한 가치를 실현하려면 중앙화된 데이터 인프라에서 탈피해 분산형 구조로 전환해야 한다는 주장이 제기됐다. 전문가들은 이를 통해 비용 효율적인 대형 언어 모델(LLM) 훈련, 연구 데이터 공유 활성화, 디앱(DApp)의 안정적인 운영이 가능할 것이라고 분석했다.
현재 오픈 데이터 시장은 3,500억 달러(약 511조 원) 규모에 달할 정도로 성장하고 있지만, 많은 데이터가 중앙화된 플랫폼에서 관리되면서 검열 위험과 독점적 통제가 발생하는 문제가 있다. 이에 따라 기업과 개발자들은 오픈 데이터를 블록체인 기반의 분산형 인프라로 옮기는 것이 필수적이라는 입장이다.
대표적인 예로, 오픈소스 AI 모델 ‘DeepSeek’은 5백50만 달러(약 80억 원)의 비용으로 최종 훈련을 마친 반면 OpenAI의 GPT-4는 1억 달러(약 1,460억 원) 이상이 소요됐다. 이는 분산형 네트워크가 AI 훈련의 비용을 절감할 수 있는 가능성을 보여준다. 중앙화 AI 기업들은 독점적인 모델을 제공하며 비용을 크게 부과하지만, 분산형 네트워크에서는 누구나 자유롭게 접근하고 활용할 수 있다.
연구 데이터 공유의 경우도 마찬가지다. 현재 많은 연구 데이터가 유료 저널과 특정 기관의 승인 하에 제한적으로 공개되고 있어 접근성이 낮다. 그러나 블록체인과 영지식 증명(Zero-knowledge proof)을 활용하면 프라이버시를 보호하면서도 투명한 데이터 공유가 가능해진다. 연구자는 데이터를 분산형 네트워크에 등록하고, 이에 대한 보상을 받을 수도 있다.
더 나아가 디앱(H함수 게g 플랫폼의 예처럼 기존 중앙화된 인프라는 특정 지역의 사용자를 차단하거나 외부 요인에 의해 중단될 위험이 있다. 실제로 2022년 메타마스크가 미국 제재 조치 때문에 특정 지역에서 차단된 사례가 있다. 반면, 분산형 네트워크는 검열에 영향을 받지 않고 지속적인 운영이 가능하다.
업계 관계자들은 이러한 변화를 통해 블록체인 네트워크가 기존 중앙화 플랫폼을 대체할 것이라고 전망한다. 솔라나는 이미 자체 데이터를 분산형 저장 네트워크인 아르위브(Arweave)에 저장하며 탈중앙화를 선도하고 있다. 앞으로 데이터 인프라가 더욱 개방형으로 발전하면서 블록체인 기반의 미들웨어가 필수적인 요소로 자리 잡을 가능성이 크다.
분산형 인프라는 비용 절감, 보안 강화, 탈검열이라는 강력한 장점을 제공한다. 이러한 특성 때문에 다가오는 미래에는 중앙화 데이터 인프라보다 분산형 네트워크가 더욱 중요한 역할을 하게 될 것이라는 분석이 지배적이다.