Grass 带来数据革命

12/9/2024, 8:36:13 AM
Grass是一个去中心化数据共享平台,通过分布式网络收集互联网数据,为AI模型训练提供支持。该平台让用户贡献闲置带宽获得代币奖励,解决了传统网络抓取成本高、IP封锁、资源浪费等问题。Grass拥有超过250万用户,通过数据访问民主化和规模经济效应,为AI行业带来更高效、更新鲜的数据服务。该项目展现出良好发展势头,为数据共享和AI发展开辟了新途径。

执行摘要

生成式人工智能是近年来最重要的创新,并且随着时间的推移变得更加重要。 生成式人工智能基本上是三个要素的产物:

算法+数据+计算=智能

这意味着数据和计算可能会成为世界上最重要的两种资产,而对它们的获取将非常重要。

生成式人工智能模型需要大量数据。 最重要的生成式人工智能模型运行的数据是互联网上的数据,它是所有人类知识总和的近似值。

加密货币就是让人们能够访问世界各地的新数字资源,并通过代币将以前不是资产的东西资产化。 Gras 为数据做到了这一点。

Grass 让人工智能模型和应用能够实时访问整个互联网数据集,这些数据由遍布全球的节点网络收集,这些节点贡献了闲置的互联网带宽。Grass 最初拥有超过 250 万用户,具有很强的吸引力。[1]

Grass 的长期潜在市场是巨大的,并且与人工智能市场的规模及其未来的增长相关。过去,只有最大的科技巨头才能收集如此规模的数据集。 Grass 为数据带来了新的经济效益,降低了成本。 这使得数据访问民主化,不仅为精英大公司服务,还服务于人工智能行业的长尾。

问题

AI模型的训练和微调需要大量的数据。 从历史上看,大部分数据都是通过人工智能模型创建者从网站上抓取数据来收集的。这个抓取过程存在许多挑战:

  • 网络抓取的成本很高。 只有少数大型组织能够定期抓取整个网络。 这使得规模较小的人工智能开发人员无法访问数据。
  • IP封锁。 这些抓取服务和内容创建者之间存在着一场猫捉老鼠的游戏。 阻止 IP 地址以停止抓取是相当简单的,这使得实现抓取目标和收集 AI 训练和微调所需的数据变得困难。
  • 浪费资源。 抓取网络是一项可以让许多客户受益的任务。 如果由单个客户完成,则所需的硬件、带宽和计算能力效率很低。
  • 数据新鲜度。 扫描整个互联网既麻烦又昂贵。这使得大多数用户无法经常扫描,从而导致数据不够新鲜,影响 AI 模型的质量。

Grass 的解决方案

Grass 旨在通过创建网络爬虫联合网络来解决这些问题。 参与 Grass 网络的每个人都会贡献一部分未使用的互联网带宽,以从其 IP 地址中获取少量内容。 然后,Grass 将来自每个节点的数据组合起来,形成一个组合数据集,可用于人工智能训练和微调。 这是对由加密货币支持的分布式网络的优雅而恰当的使用。

对于未使用的互联网还有其他商业用例,例如:

  • 收集本地/地理数据,例如广告
  • 进行学术研究
  • 查看当地价格

如今,Grass 使用现有硬件(笔记本电脑、台式机等)收集数据。 未来,Grass 计划提供数据收集设备, 这是一种专门用于数据收集的定制硬件设备,由于该设备针对特定任务进行了优化,因此可以提高效率。

Grass 的好处

使用分布式网络进行数据收集有几个好处:

  • 网络数据的访问民主化,规模化变得更加便宜。 Grass 不是单个客户根据自己的需求收集数据,而是代表许多客户收集数据。 这些数据可以多次转售,从而创造数据规模经济,降低抓取的经济成本,并使市场更加高效。 理论上,Grass 可以成为客户最具成本效益的数据收集解决方案,围绕其协议创造经济网络效应。 这意味着现在任何人都可以收集数据,而不仅仅是少数拥有网络资源的大公司。
  • IP 封锁变得不可行。 通过分布式抓取,检测和停止抓取变得更加困难,因为每个节点仅进行相对少量的数据捕获,并且很难与典型的互联网流量区分开。 这会产生更完整的训练数据集。
  • 互联网带宽的使用效率更高。 由于 Grass 实际上是对未使用的互联网带宽的协作消耗,因此它比仅仅为了抓取而配置新带宽更有效。
  • 数据更加准确且最新。 与典型客户自己进行的刮擦相比,更频繁地刮擦变得更具成本效益。 这会减少陈旧数据。 这很重要,因为生成的人工智能模型更加最新。

挑战:通过数据变现的内容创作者

抓取数据时需要处理的棘手问题之一是内容创建者。 其中包括《纽约时报》和 Reddit 等网站,它们已开始通过将数据授权给第三方来训练人工智能模型,从而将其数据货币化。 他们自然会保护其网站上的数据,因为这些数据对他们来说代表着高利润的收入来源。 事实上,Reddit 已禁止其开发者 API 用于机器学习,以保护其将数据授权给 AI 模型创建者的商业模式(请参阅 这里 得服务条款)。

内容创作者的未来会怎样? 好吧,考虑一下对于用户生成的内容 (UGC),例如 Reddit,有一种观点认为用户拥有自己的数据(而不是平台),因为内容是由用户创建的,应该由这些用户拥有。 这一论点还有待从法律角度进行充分探讨。 未来关注这一进展将会很有趣。 然而,如果用户确实拥有自己贡献的数据,那么 Grass 可以代表一种假设的途径,帮助这些用户将自己贡献的数据货币化。 例如,Grass 可以奖励 Reddit 贡献者本人自愿贡献他们在 Reddit 上创建的数据。

对于《纽约时报》等付费内容创作者而言,内容由付费作者创作,因此不涉及用户数据所有权的问题。基于此,Grass 可以直接将这类网站排除在数据采集范围之外。另一种方案是,Grass 可以通过扩大规模,成为这些网站的客户并支付许可费用。从理论上讲,Grass 的用户可以支付数据费用,而 Grass 则将收入按比例返还给内容创作者,这样就能以灵活的预算开发 AI 模型。此外,Grass 还可以发展到足够的规模,代表所有客户与内容方谈判批量许可协议。

Grass 的发布

Grass 在今年早些时候推出了一款令人印象深刻的产品:

  • Grass 拥有 Solana 历史上分布最广泛的空投。[2]
  • 超过 200 万个钱包领取了空投,导致 Solana 的网络不堪重负。
  • 全球 Grass 总用户超过 250 万。[3]
  • Grass 已经拥有训练 OpenAI 的 ChatGPT 3.5 模型的能力和数据。
  • 作为其平台的演示,Grass 开源了一个数据集,其中包含 2024 年 Reddit 上的 6 亿条帖子和评论(公告请参阅 这里,数据集请参与 这里)。

截至撰写本文时,Grass 代币在发布后价格走势良好(+115%),这很不寻常,因为大多数代币在上市后的几天/几周内都会下跌。这可能反映了他们对空投分配的明智方法,以及对 Grass 未来和潜力的信心。总的来说,这是网络的一个良好开端,我们相信它为未来许多年的繁荣铺平了道路。

Grass 自 2024 年 10 月 28 日推出以来的代币表现

资料来源:TradingView。

通过连接您的 Solana 钱包并赚取 Grass 代币,开始贡献您未使用的互联网带宽。

想要将 Grass 的数据集用于您的业务、研究或项目?请联系discover@grassfoundation.io团队。

脚注

[1] 来源: https://www.getgrass.io/
[2] 来源: https://www.google.com/url?q=https://www.theblock.co/post/323805/grass-becomes-most-distributed-solana-airdrop-as-nearly-1-5-million-addresses-claim-tokens&sa=D&source=docs&ust=1732646335082707&usg=AOvVaw0oVvhJL661rmE1ABmJqOyP
[3] 来源: https://www.getgrass.io/

免责声明:

  1. 本文转载自【黑客VC】,所有版权归原作者所有【埃德·罗曼】。若对本次转载有异议,请联系 Gate Learn 团队,他们会及时处理。
  2. 免责声明:本文所表达的观点和意见仅代表作者个人观点,不构成任何投资建议。
  3. Gate Learn 团队将文章翻译成其他语言。除非另有说明,否则禁止复制、分发或抄袭翻译文章。

分享

币圈日历

项目进展
Etherex 将于 8 月 6 日推出代币 REX。
REX
22.27%
2025-08-06
拉斯维加斯的稀有开发与治理日
Cardano将在拉斯维加斯举办稀有开发与治理日,时间为8月6日至7日,活动包括研讨会、黑客马拉松和以技术开发及治理主题为重点的小组讨论。
ADA
-3.44%
2025-08-06
区块链.Rio在里约热内卢
Stellar 将参加定于 8 月 5 日至 7 日在里约热内卢举行的 Blockchain.Rio 大会。该节目将包括主题演讲和小组讨论,届时将邀请 Stellar 生态系统的代表与合作伙伴 Cheesecake Labs 和 NearX 共同参与。
XLM
-3.18%
2025-08-06
网络研讨会
Circle 宣布将于 2025 年 8 月 7 日 14:00 UTC 举办名为“GENIUS Act 时代开始”的实时高管见解网络研讨会。此次会议将探讨新通过的 GENIUS Act 的影响——这是美国第一个针对支付稳定币的联邦监管框架。Circle 的 Dante Disparte 和 Corey Then 将主导讨论该立法如何影响数字资产创新、监管透明度,以及美国在全球金融基础设施中的领导地位.
USDC
-0.03%
2025-08-06
X 上的 AMA
Ankr将在8月7日16:00 UTC于X平台举办一次AMA,重点讨论DogeOS在为狗狗币构建应用层方面的工作。
ANKR
-3.23%
2025-08-06

相关文章

解读 Vana 的野心:实现数据货币化,构建由用户主导的 AI 开发生态
新手

解读 Vana 的野心:实现数据货币化,构建由用户主导的 AI 开发生态

通过将数据民主化和货币化,Vana 正试图从根本上重新定义个人私有数据的归属和价值分配,创建一个真正由用户主导,并收益的 AI 开发生态系统。本文将从 Vana 的核心技术架构、测试网生态建设、团队背景及融资等方面解读该项目,并附上用户参与 Vana 生态的交互指南。
12/9/2024, 10:02:27 AM
一文盘点 Top 10 AI Agents
中级

一文盘点 Top 10 AI Agents

纵观市场上的诸多 AI Agents,尽管在功能上同质化现象严重,但也会在某些方面独辟蹊径,为用户带来独特体验。本文将基于市场热度、项目创新、代币市值和交易量等多个维度总结出目前市场上的 Top10 AI Agents(排名不分前后),以供用户参考。
1/7/2025, 2:30:21 PM
Sentient AGI:社区构建的开放 AGI
中级

Sentient AGI:社区构建的开放 AGI

了解 Sentient AGI 如何通过其社区构建的去中心化方法,革新 AI 行业。了解开放、可盈利和忠诚(OML)模型,以及它如何促进 AI 开发中的创新与合作。
12/20/2024, 1:23:04 AM
一文读懂 Eliza 和它背后的价值逻辑
中级

一文读懂 Eliza 和它背后的价值逻辑

Eliza 不仅是一个可爱女孩 AI 角色,更是一个功能强大、轻量级的 AI 代理框架,可以帮助用户简单、快速的创建、部署和管理 AI 代理。本文将围绕 Eliza 团队背景、市场表现、模块化架构、代币经济模型、未来规划等,深入解析该项目和其背后的 ai16z 生态,以供用户参考
1/21/2025, 9:12:57 AM
什么是去中心化金融(DeFi)和去中心化金融人工智能(DeFAI)?
新手

什么是去中心化金融(DeFi)和去中心化金融人工智能(DeFAI)?

随着区块链技术的发展,DeFi和DeFAI正成为金融领域的热点。DeFAI结合人工智能与去中心化金融,正在重塑传统金融模式。本文将探讨两者的概念、区别及未来潜力。
2/19/2025, 3:24:42 AM
探究 Smart Agent Hub 背后: Sonic SVM 及其扩容框架 HyperGrid
中级

探究 Smart Agent Hub 背后: Sonic SVM 及其扩容框架 HyperGrid

Smart Agent Hub 基于 Sonic HyperGrid 框架构建,该架构采用半自治多网格方法,既能够保持与 Solana 主网的兼容性,也能够为开发人员提供更多的灵活性和性能优化选项,特别是针对游戏等高性能要求的应用。
2/21/2025, 4:49:52 AM
即刻开始交易
注册并交易即可获得
$100
和价值
$5500
理财体验金奖励!