长推：去中心化算力与AI的未来

本文讨论了去中心化算力项目选择AI推理的原因，英伟达在算力方面的优势，以及去中心化算力和算法模型的终局。目前难以实现大模型训练，但对于算力要求较低的需求，如AI推理和边缘计算，仍有潜力。未来可能会有少数闭源模型巨头，但多个大模型合作的模式也有潜力。

Fred 2024年04月05日 12:24

热度 ...

原文作者：Fred

原文来源：Twitter@Dacongfred

核心讨论四个问题：

1、为什么大部分去中心化算力项目都选择做AI推理而不是AI训练？

2、英伟达究竟牛在哪里？去中心化算力训练难做的原因在哪？

3、去中心化算力（Render、Akash等）的终局会是什么样？

4、去中心化算法（Bittensor）的终局会是什么样？

接下来咱们层层抽丝剥茧：

1）纵观这个赛道，除了Gensyn之外，大部分的去中心化算力项目都选择做AI推理而不是训练，核心在于对于算力和带宽的要求不同。

为了帮助大家的简单理解，我们来把AI比作一个学生：

- AI训练：如果我们把人工智能比作一个学生，那么训练就类似于给人工智能提供了大量知识、示例也可以理解为我们常说的数据，人工智能从这些知识示例中进行学习。由于学习的本质需要理解和记忆大量的信息，这个过程需要大量的计算能力和时间。

- AI推理：那什么是推理呢？可以理解为利用所学的知识去解决问题或者参加考试，在推理的阶段中人工智能是利用学到的知识去解答，而不是活动新知识，所以在推理过程所需要的计算量是较小的。

容易发现，两者的难度差本质上在于大模型AI训练需要极大的数据量，以及对数据高速通信需要的带宽需求极高，所以目前去中心化算力用作训练的实现难度极大。而推理对于数据和带宽的需求小的多，实现可能性更大。

2）那么数据和带宽的卡点究竟在哪？为什么去中心化训练难以实现？

这就涉及到大模型训练的两个关键要素：单卡算力和多卡并联。

关于【长推：去中心化算力与AI的未来】的延伸阅读

重新理解Marlin：AI下半场的可验证计算L0「新基建」
Marlin是一种可验证云计算服务，利用加密技术保证数据安全，为AI+Web3应用提供低延迟、低成本的解决方案。它基于TEE和ZKP技术，为用户提供通用化的云计算方案，并通过激励机制吸引节点为网络贡献资源。Marlin的愿景是成为AI世界的可验证通用L0，为Oracle预言机、ZK Prover系统、AI人工智能等应用场景提供节点算力和存储等网络资源服务。它可以为AI大模型训练提供安全的计算环境，并为多元化应用场景提供可验证计算中间件。在AI+Web3时代，Marlin有巨大的价值潜力，可能成为未来AI+Web3应用的关键基础设施。
Sam Altman 围绕 OpenAI 打造出一个致富帝国
OpenAI首席执行官奥特曼同时经营副业，但只有一份工作让他发了财。他投资了多家想抓住人工智能风口的公司，包括网络安全软件公司和清洁能源公司。他最成功的投资是支付处理初创公司Stripe。奥特曼也投资了使用OpenAI技术的初创公司。他曾因投资引发利益冲突而被罢免职务，但重新担任首席执行官后制定了新的利益冲突政策。董事会正在进行改革，包括强化利益冲突政策和独立审计委员会。奥特曼计划通过全面披露和董事会管理来解决利益冲突问题。

- 单卡算力：目前所有的需要训练大模型的中心，我们把它叫做超算中心。为了方便大家的理解，我们可以以人体作为比喻，超算中心就是人体的组织，底层单元GPU就是细胞。如果单个细胞（GPU）的算力很强，那么整体的算力（单个细胞×数量）也可能会很强。

- 多卡并联：而一个大模型的训练动辄就是千亿GB，对于训练大模型的超算中心来说，至少需要万级别个A100打底。所以就需要调动这几万张卡来进行训练，然而大模型的训练并不是简单的串联，并不是在第一个A100卡上训练完之后再在第二张卡上训练，而是模型的不同部分，在不同的显卡上训练，训练A的时候可能需要B的结果，所以涉及到多卡并行。

为什么英伟达这么厉害，市值一路腾飞，而AMD和国内的华为、地平线目前很难追上。核心并不是单卡算力本身，而是在于两个方面：CUDA软件环境和NVLink多卡通信。

- 一方面，有没有软件生态能适配硬件是非常重要的，如英伟达的CUDA系统，而构建一个新的系统是很难的，就像构建了一个新的语言，替换成本非常高。

- 另一方面，就是多卡通信，本质上多卡之间的传输就是信息的输入和输出，怎么并联，怎么传输。因为NVLink的存在，没有办法把英伟达和AMD卡打通；另外，NVLink会限制显卡之间的物理距离，需要显卡在同一个超算中心中，这就导致去中心化的算力如果分布在世界各地就比较难实现。

第一点解释了为什么AMD和国内的华为、地平线目前很难追上；第二点解释了为什么去中心化训练很难实现。

3）去中心化算力的终局会是什么样？

- 去中心化算力目前难以进行大模型训练，核心在于大模型训练最看重的是稳定性，如果训练中断，需要重新训练，沉没成本很高。其对于多卡并联的要求是很高的，而带宽是受物理距离的限制的。英伟达通过NVLink来实现多卡通信，然而在一个超算中心里面，NVLink会限制显卡之间的物理距离，因此分散的算力无法形成一个算力集群去进行大模型训练。

- 但另一方面，对于算力要求相对较低的需求是可以实现的，例如AI推理，或者是一些特定场景的垂类中小型的模型训练是有可能实现的，在去中心化算力网络中有一些相对大的节点服务商时，是有潜力为这些相对大的算力需求服务的。以及像渲染这类边缘计算的场景也是相对容易实现的。

4）去中心化算法模型的终局会是什么样？

去中心化算法模型的终局取决于对未来AI的终局，我认为未来AI之战可能会是有1-2个闭源模型巨头（如ChatGPT），再加上百花齐放的模型，在这种背景下，应用层产品没有必要和一个大模型绑定，而是与多个大模型合作，在这种背景下来看，Bittensor的这种模式潜力还是非常大的。

免责声明：本文仅代表作者个人观点，不代表链观CHAINLOOK立场，不承担法律责任。文章及观点也不构成投资意见。请用户理性看待市场风险，以及遵守所在国家和地区的相关法律法规。
图文来源：Fred，如有侵权请联系删除。转载或引用请注明文章出处！

标签：AI以太坊去中心化算力

分享至

https://www.chainlook.cn/toutiao/1712299804.html

长推：去中心化算力与AI的未来

关于【长推：去中心化算力与AI的未来】的延伸阅读

重新理解Marlin：AI下半场的可验证计算L0「新基建」

Sam Altman 围绕 OpenAI 打造出一个致富帝国

Solana联创回应交易失败率剧增：补丁即将发布

相关文章推荐