近期AI技术的发展如GPT-4、Gemini 1.5和微软AI PC等令人印象深刻,但AI发展仍面临问题。AppWorks的研究员Bill深入探讨了AI面临的问题,并提出了Crypto为AI赋能的7个方向。其中,数据代币化是关键方向,但私有数据标准化仍是挑战。分布式计算能力和资源分配也是问题。通过RLHF提升大型模型,区块链技术可解决深度造假问题。通过可验证性和AI代理改进资产管理和服务,区块链技术有望解决金融机构管理挑战。重点在于开源AI,以确保技术发展公平和透明,有效管理数据和信任问题。
GPT-4、Gemini 1.5 和微软 AI PC 等 AI 技术的进步令人印象深刻,但目前 AI 的发展也还超出了一些问题,AppWorks 的 Web3 研究员 Bill 深入研究了其中的问题,并且探讨了 加密货币如何为 AI 赋能的 7 个方向。
数据代币化
传统的AI训练主要依赖于互联网上提供的公开数据,或者更确切地说,是公共领域的数据。除了少数公司提供开放的API接口外,大多数数据仍未被开发。由于确保隐私被保护的前提下,使更多数据持有者能够贡献或授权他们的数据用于AI训练是一个关键方向。
然而,这一领域面临着最大的挑战是数据很难像计算能力一样标准化。虽然分布式的计算能力可以通过 GPU 类型来量化,但私有数据的数量、质量和使用情况却难以衡量。如果分布式的计算能力像 ERC 20,那么数据集的代币化则类似于 ERC 721,并且其流动性和债券形成比 ERC 20 更具挑战性。
Ocean Protocol 的 Compute-to-Data 功能允许数据所有者在保护隐私的同时出售私人数据。vana 为 Reddit 用户提供了聚合数据并将其出售给训练 AI 大模型的公司的方法。
资源分配
目前,GPU算力供需很大,大公司垄断了大部分GPU资源,这使得公司训练模型的成本非常高。很多团队都在努力通过去中心化网络化小型规模、使用率低的GPU资源来降低成本,并且在保证算力稳定和容量充足方面仍面临较大的挑战。
激发性 RLHF
RLHF(基于人类反馈的强化学习)对于改进大型模型至关重要,但需要专业人员培训。随着市场竞争的加剧,招募这些专业人员的成本也在增加。为了在保持高质量标注的同时降低成本,可以使用质和罚金系统。数据标注的最大开支之一是需要员检查质量。然而,到目前为止,区块链已经成功地利用经济激励机制来确保工作质量(PoW、PoS),相信创建一个良好的代币经济系统可以有效降低 RLHF 成本。
例如, Sapien AI已引入Tag 2 Earn并与多家gamefi公会合作;Hivemapper通过代币激励机制,已有200万公里道路的训练数据; QuillAudits计划推出开源智能合约审计代理,允许所有审计人员共同培训代理并获得奖励。
可验证性
如何验证算力提供商是否按照特定需求或模型推理任务?用户无法验证AI模型及其输出的准确性。这种可验证性的缺乏意味着金融、医疗和法律遵循的不信任、错误甚至利益损害。
在步骤3中,我们可以通过特定模型验证过程来证明输出。使用模型验证优点包括模型提供商可以维护模型的机密性、用户能够验证模型是否正确以及将证明模型执行到智能合约中可以规避区块链的计算能力。同时还可以考虑在设备端运行AI来解决性能问题,但是首先还没有看到满意的答案,在这一领域进行建设的项目有Ritual、ORA、Aizel Network。
大陸造
随着生产式AI的出现,人们越来越重视深度造假(DeepFake)问题。然而,深度造假技术的进步迅速于检测技术,因此检测深度可疑。虽然数字水印技术(如C 2 PA)表明有迹象表明,加工过的图像会被修改,公众无法验证原始图像上的签名,但通过加工后的图像,验证将变得非常困难。
区块链技术可以通过多种方式解决深度问题。区块链认证可以使用防篡改芯片相机在每张原始照片中嵌入加密货币证明,以验证图像的真实性。区块链具有不可篡改的特性,允许将带有元数据添加到带有时间戳的区块中,验证源代码来源。此外,可以使用钱包签名附在发布的帖子上,以验证发布内容的作者身份,基于 zk 技术 KYC 服务器上可以为钱包与验证身份进行绑定,同时保护用户隐私。从经济激发的角度来讲,作者应为释放虚假信息而受到惩罚,用户则可以通过验证了虚假信息而获得奖励。
Numbers Protocol 一直以来都在这个领域深耕;Fox News 的验证工具和 Polygon区块链基础,一直以来都从区块链中查找文章并检索相关数据。
還
当AI模型输入涉及金融、医疗保健和法律遵循的敏感信息时,通过使用LLM模型时保护数据隐私也重要。同态加密货币(FHE)可以在不解密的情况下对数据进行处理,从而使用LLM模型时保护隐私,过程中需要:
- 用户在本地设备上开始推理过程并在完成初始层后停止。该初始层不包含在与共享的模型中;
- 客户端对中间操作进行加密,将数据包发送给服务器;
- 服务器端对数据进行部分中心化处理(注意机制)处理,并将结果发送回客户端;
- 客户端在继续传输数据时应确保数据隐私得到保护。
Zama 正在筹资 100 万美元,用于开发全同轴电缆(FHE)解决方案。
AI 代理
AI代理能够帮助客户实现资产管理和服务价值,从而帮助客户实现价值。
区块链技术可以帮助金融机构更好地管理其金融资产,从而帮助金融机构更好地管理其金融资产。区块链技术可以帮助金融机构更好地管理其金融资产,从而帮助金融机构更好地管理其金融资产。
结语
大多数问题实际上与开源AI。为了确保未来十年的技术以避免少数公司垄断,减少开源和AI资源差距。区块链可以跟踪AI训练和推理,从而更好地管理数据,而技术可以确保后AI信任,应对深度造假和隐私保护问题。
资讯来源:由a0资讯编译自THECOINREPUBLIC。版权归作者A0资讯所有,未经许可,不得转载