Pantera 合伙人:全面解析 Sahara AI
撰文:Paul Veradittakit ,Pantera Capital 合伙人
编译:xiaozou,金色财经
Sahara AI 的使命是创造一个更加开放、公平和协同的人工智能经济,让人们尽可能容易地参与其中。利用区块链,Sahara 确保所有贡献者(数据贡献者、labelers、模型开发人员等)得到公平的补偿,数据和模型保持主权,人工智能资产具有安全性,权限可以创建、共享和交易。
1、AI 堆栈现状
当前的 AI 堆栈可分为以下几层:
数据收集和标注
数据是从各种来源收集的(例如网络抓取、公共数据集、用户生成的数据),必须遵守许可要求以避免法律问题。数据根据手头的任务进行标注(例如分类、对象识别)。
模型训练及服务
数据被输入到模型中,模型调整其内部参数(权重)以最小化误差。这需要相当昂贵且耗时的计算。
AI 智能体的创建和部署
创建 AI 智能体的用户体验通常涉及使用 TensorFlow 等工具,需要有技术专长。
计算资源
模型训练需要昂贵的处理。
每一层都竞争激烈且多样化,在很大程度上,有一种执行方式被证明是最有效的。例如,数据收集最好使用大型公共数据集(如书籍),并使用专门数据(研究论文)进行微调。模型训练最好在专门的硬件上完成,AI 智能体应该很容易使用即插即用的资源来建立一个开发者社区,计算资源应是分布式的,以便精准奖励计算资源提供者。这些结合在一起将带来更好的 AI 模型和更强大的社区。
Web2 公司正朝着这个方向努力,但由于他们的设计师集中式的,所以面临着严重的限制。从企业和技术的角度来看,这些公司旨在限制访问并隔离堆栈的各个不同部分,从而导致不同的安全标准、数据库设计、后端集成和货币化策略。实际上,这样的设计很糟糕,是无法应对人工智能经济模式的转变的。
举例来说,OpenAI 已经构建了一个非常强大的基础模型,并开始通过其无需许可的 GPT wrapper 市场吸引社区 builders,但只允许表面的提示定制,不支持底层模型的重构。该公司所有的计算资源都是用投资者的钱购买的,预计今年年底将亏损 50 亿美元。
2、AI 协同经济
Sahara 平台在整个人工智能生命周期中为所有人工智能开发需求提供一站式服务:从数据收集和标注,到模型训练和服务,AI 智能体的创建和部署,多智能体通信,人工智能资产交易,以及人工智能资源的众包等。通过使人工智能开发过程民主化以及降低现有系统的进入壁垒,Sahara AI 为个人、企业和社区提供了平等的访问权限,共同建设人工智能的未来。
上图概括了用户旅程,描绘了在 Sahara AI 生态系统中,人工智能资产是如何从创建到使用再到实现用户粘性的过程。值得注意的是,平台内的所有交易都是不可变且可追踪的,所有权受到保护,资产来源也被记录下来。这支持透明和公平的收益分享模式,确保开发者和数据提供者都能因产生收益而获得适当的补偿。
Sahara 的目标是让人们更加轻松地参与到人工智能经济中来。开发者和用户可以这样使用 Sahara:
经验丰富的 AI 开发人员:
开发人员可以使用 Sahara SDK 和 API 与 Sahara 区块链及其 AI 堆栈的任意层进行交互,例如个性化算力、数据存储和激励结构,以形成他们自己的 Sahara AI 智能体,可被授权和货币化,以供其他人使用。
AI 开发新手:
通过无代码 / 低代码环境,开发人员可以通过直观的界面和预构建模板创建和部署 AI 资产。
AI 训练:
要参与人工智能模型训练,用户只需访问一个网站,在那里他们可以完成人工智能训练任务然后获得可交易代币的补偿,任务范围从解决基本数学问题到短视频描述。
AI 用户:
用户可以通过直观的 UI 轻松使用 AI 智能体。用户可以灵活购买访问及进一步开发的许可权限,甚至可以交易 AI 资产 shares。
用户将能够创建自己的个性化数据「知识库」,并使用用户自己的数据创建专门的人工智能。就像其他人工智能一样,这将允许他人访问,而训练数据仍然是完全私密安全的。
公司:
公司也可以创建 AI 智能体(或「商业代理」),训练他们自己的专有数据,由于系统运行在 Sahara 区块链上,得益于去中心化 AI 智能体生成和服务,成本要低得多。
企业也可以付费生成 Sahara 数据,它融合了 AI 自动标注和人工标注,有效地创建了高质量、保护隐私的多模型数据集。
除了面向企业的产品已经被一些知名客户使用之外,其他所有功能都还没有发布,但都有了发布计划。
3、技术概况
Sahara 团队将系统设计得尽可能简单易用,抽象出了确保 AI 堆栈各部分的兼容性、盈利性和安全性所需的复杂性。在幕后,Sahara 团队开发了无数创新来实现这一目标。举几个例子:
Sahara 区块链最大限度地降低了 gas 费,完全兼容 EVM,Sahara 跨链通信(SCC)协议实现了跨区块链的安全、无需许可的数据传输,促进了无需信任的互操作性。
Sahara AI-Native Precompiles(SAPs)是预编译的智能合约,用于优化 AI 任务的性能,以减少计算开销,包括训练执行 SAPs 和推理执行 SAPs。
Sahara 区块链协议(SBPs)管理人工智能资产以确保会计责任,如 AI Attribution 跟踪贡献和分配奖励,AI Asset Registry 来管理 AI 资产、AI 许可和 AI 所有权的注册和来源。
数据管理在链上和链下进行,AI 资产元数据、承诺和证明在链上,而重要的数据集、AI 模型和补充信息在链下进行,以优化数据检索、安全性和数据可用性。
Collaborative Execution Protocols(协作执行协议)支持跨 AI 训练、聚合和服务的联合 AI 模型开发和部署。像 PEFT 这样的其他模型允许技术微调,Privacy Preserving Compute(隐私保护计算)支持差分隐私、同态加密和秘密共享,Fraud Proofs(欺诈证明)的功能如其名所示。
4、完全集成的 AI 堆栈
该团队由南加州大学终身教授 Sean Ren 和加州大学伯克利分校校友 Tyler Z 掌舵,前者曾被在《麻省理工科技评论》科技创新 35 人之列,并荣获 2023 年度三星研究员,后者曾担任 Binance Labs 的投资总监。团队的其他成员具有斯坦福大学、加州大学伯克利分校、AI2、Toloka、Stability AI、微软、币安、谷歌、Chainlink、LinkedIn、Avalanche 等公司的背景或经验,贡献了宝贵的专业知识。
Sahara 还有顶级 AI 原生研究人员和企业客户提供建议:
Laksh Vaaman Sehgal(Motherson Group 副主席)
Rohan Taori(人类研究科学家)
Teknium(Nous Research 联合创始人)
Vipul Prakash(Together AI 首席执行官)
Elvis Zhang(Midjourney 创始成员)
Sahara AI 目前被超过 35 家领先的技术创新项目和研究机构使用,包括微软、亚马逊、麻省理工学院、Motherson 集团和 Snap,用于各种人工智能服务,如 Shara Data 用于数据收集 / 标注,Sahara Agents 用于个性化领域智能体。
生成式 AI 在技术和市场规模方面仍处于起步阶段;由于难以将整个 AI 堆栈集成到一个产品中,因此今天的集中式聊天和视频工具的覆盖范围有限。Sahara AI 是唯一一家通过模块化设计解决这一瓶颈的公司,该设计使用区块链作为无需许可访问、代币分配和安全性的支柱。为了让所有人都能参与其中,人工智能的未来必须是易于访问且公平的,而 Sahara AI 是唯一一家朝着这一愿景前进的公司。
(责任编辑:金店)
-
毕竟,真的勇士,敢于把自己变成IP。...[详细]
-
天生不甘平凡的张兰,为了改善生活,也在1989年底以探亲为名,投奔加拿大的舅舅,去“打黑工”,哪怕当时儿子只有8岁。...[详细]
-
从融资顾问转型成为职业风投,一年的时间,签了5份投资条款书,我现在想说一句话:作为一名风投在谈判桌上出现,没有什么比这种感觉更糟糕的了。...[详细]
-
ouyi稳定币APPv6.5.8下载-芝麻交易所ouyi交易所2023抢先下载
而且小商家根本没有自然流量也得不到天猫的照顾和关注。...[详细]
-
但目前全美在线还没有可以流通的股份,发起的定增也尚未完成,所以暂时在“僵尸股”的队伍里。...[详细]
-
document.writeln('关注创业、电商、站长,扫描A5创业网微信二维码,定期抽大奖。...[详细]
-
金数据提供的开箱即用的报表,为普通用户提供了便利。...[详细]
-
理由:「我认为这家公司在2020年会以超过1亿欧的价格被收购,所以我愿意在500万欧的基础上,选择至少4倍的系数来计算估值。...[详细]
-
这个员工是行业内的技术大牛,前东家在BAT之列,之所以离职就是因为公司不接受他在沈阳办工。...[详细]
-
对于媒体来说,如果是渠道型媒体,天花板就是用户量和在线市场,比如今日头条的天花板是中国用户人数及其每天用多长时间。...[详细]