AI 资讯

返回首页播客摘要节目时长 · 43:19

5月8日周五 · 20:27

克劳德平台背后的秘密——来自其构建团队

Original title · The Secrets of Claude's Platform From the Team Who Built It

播客中文摘要全文翻译

TL;DR

这期讲了什么

Anthropic的Angela和Caitlin讨论了AI平台从简单补全端点到有状态智能体系统的演进。他们解释了Cloud Managed Agents如何建立在Messages API之上，整合代码执行和网络搜索等工具，帮助开发者以更少的工作量获得更好的结果。对话回应了关于灵活性与托管服务之间权衡的担忧，以及Anthropic内部团队如何与外部开发者使用相同的平台，确保功能随时间推移保持一致。他们还讨论了平台未来的发展方向，即Claude可能能够足够好地理解自身以实现自我配置，智能体可以动态适应用户的需求。

本期你会听到

Cloud Managed Agents建立在Messages API之上，整合代码执行和网络搜索等工具，帮助开发者以更少的工作量获得更好的结果。
Anthropic的内部产品与外部开发者使用相同的平台，确保Cloud Code和Cloud Managed Agents之间的功能随时间推移保持一致。
团队承认了关于模型锁定和灵活性的合理担忧，指出对于下一代模型，框架变得更与特定模型配对，以提供最佳结果。
平台未来的演进方向可能是Claude足够了解自身以实现自我配置，智能体可以动态适应用户想要完成的任务。
基础设施复杂性是Cloud Managed Agents旨在解决的真正挑战，让开发者能够专注于实际的产品需求。
两位都曾在Mac Mini上运行Claude进行测试，这体现了开发者自建基础设施的实际做法。

对话时间线

00:00→ 00:03Speaker 1
A year from now, where do you think the platform will be?
09:11→ 09:55Speaker 1
I think that's to the to the point you just made, that's something that's that's coming…
17:56→ 18:06Speaker 3
Right?
26:36→ 26:46Speaker 1
Mhmm.
35:23→ 35:50Speaker 2
And there are others that are like, these are, like, the kind of ones where they all so…
43:19→ 43:19Speaker 1
with you.

对话逐字稿

中文逐字稿

00:00→ 00:03Speaker 1

一年后，你觉得平台会发展到什么程度？Speaker 2 | 00:03 - 00:18 我们想要探索一些方向，让Cloud真正能够在理解自身方面做得足够好。它能弄清楚你应该使用什么模型，能弄清楚如何启动所有子智能体。你不需要过多考虑架构问题，因为Claude实际上已经足够了解自身，可以即时自我配置。Speaker 3 | 00:18 - 00:26 在那个世界里，如果Claude可以即时自我配置，你那些即时生成的智能体正在成为完成你任务所需的样子，平台必须大幅扩展规模。Speaker 1 | 00:26 - 00:47 我们离实现十亿美元营收还有多近？这其实才是我真正在问的问题。Angela、Caitlin，欢迎来到节目。Speaker 3 | 00:47 - 00:48 谢谢邀请。Speaker 2 | 00:48 - 谢谢。Speaker 1 | 00:48 - 01:07 对于不了解的人，你们都在Anthropic的平台团队工作。所以Angela，你是云平台的产品负责人，Caitlin，你是云平台的工程负责人。我非常期待和你们交流，因为你们发布了很多东西。你们最近推出了Cloud Managed Agents，也在为它发布新功能。Speaker 1 | 01:08 - 01:37 我觉得这发生在非常有趣的时刻，让我想思考一个问题：对于模型公司来说，AI平台到底是什么？因为在GPT-3时代，平台就是一个补全端点。你发送提示词，获得回复。之后，它变成了带有工具调用和对话会话等功能的补全端点。而现在，有了Cloud Managed Agents，你基本上获得了一台云端计算机，带有记忆和所有其他功能。Speaker 1 | 01:38 - 01:47 所以我很想请你们帮我理清这个发展轨迹，以及在AI领域构建平台意味着什么。Speaker 2 | 01:47 - 02:06 是的。我觉得你的描述非常准确。我认为随着这些技术的演进，特别是随着LLM的发展，把它放在API后面是非常有趣的事情。很多人都觉得太酷了，「哇，我可以这样做」，在当时我觉得确实很酷。现在回头看，可能会觉得「哦，那真的很基础」。Speaker 2 | 02:08 - 02:53 然后，我认为我们更多地走向了一个稍微有状态的世界，因为你想要保持会话状态的持久化，确保模型的性能越来越好。我认为这实际上是一条主线。随着我们对Claude的改进，它变得越来越自主，我们发现自己基本上需要将平台演进到越来越高层级的抽象，但这都是为了帮助你从某些东西中获得最佳结果。我认为在最初，大家都在探索。我们完全不知道人们会用什么来构建这些LLM，你希望尽可能多的可能性。Speaker 2 | 02:53 - 03:09 然后随着这些用例开始收窄，人们开始用它构建产品，人们开始用它构建智能体。越来越多的客户来找我们，问「我如何从Claude获得最佳效果？我如何设置我的工具？我如何运行这个循环？」等等。Speaker 2 | 03:09 - 03:45 有一些人在真正做实验，他们在边缘探索，这很棒。然后还有一大堆其他人，他们会说「我想要开箱即用的这些东西」。在我们追求确保Claude能产生最佳结果的过程中，我们发现自己让平台变得越来越丰富。这包括状态，包括我们开始添加的工具，也包括很多这类东西的云端组件。但这一切都服务于同一个使命：让事情尽可能简单。Speaker 2 | 03:45 - 04:09 我认为在这些事情的未来状态方面——可能关于平台最终会做什么的哲学——它最终可能只是成为一套原语和基础设施，让你尽可能快地、以尽可能少的工作量获得结果。我认为这往往遵循某种形态，至少在当前状态下是这样。Speaker 1 | 04:09 - 04:15 你们如何描述今天的原语？所以也许我可以问，Cloud Managed Agents中的原语是什么？Speaker 3 | 04:16 - 04:42 是的。Cloud Managed Agents建立在与我们所有相同的原语上，否则你也可以直接构建在它上面，所以是Messages API。在Messages API中，我们构建了一整套创新。比如，如果你真的想的话，你只能进出了获得令牌，但我们有一些内置工具。比如代码执行，生成一个沙盒并执行工作。Speaker 3 | 04:43 - 05:00 你可以使用网络搜索和各种其他东西。我认为我们已经把我们认为最强大的东西组合成一个框架和一套基础设施，这正是获得我们认为的Claude最佳结果的方式。Speaker 1 | 05:01 - 05:35 所以我坐在这里，感受到了我一直在思考的东西——我觉得它像是一种时间通缩。我的时间在未来会变得更值钱，而不是相反——不管相反是什么。而原因是因为我们非常——例如，对我们内部来说，我们正在构建一个智能体。我们正在构建一些我们自己使用的智能体产品，然后希望也能为客户服务。在这个过程中，我们——你知道，我们在几台Mac Mini上运行着Claude的循环。Speaker 1 | 05:35 - 06:00 对吧？很多这样的东西——那是一个一千行的Python文件或者什么的。很多这样的东西镜像了你们在Claude Managed Agents中构建的东西。所以对于我，对于很多在Cloud或云平台或生态系统上构建的人来说，至少我有这种感觉。也许我们应该等你们来构建，但我不知道边界在哪里。Speaker 1 | 06:00 - 06:11 而且我——是的。我想知道，如果我想构建一个智能体，什么是最佳路径，能与你们正在做的事情保持一致？Speaker 2 | 06:12 - 06:32 是的。我认为这部分平台业务实际上在某些方面类似于任何其他形式的平台业务，你确实有像你这样的客户在构建，你在想——我应该继续做吗？因为也许我有这个即时需求，但同时，我不想重复工作，你本可以免费从平台获得它。Speaker 1 | 06:33 - 06:40 而且基础设施也很糟糕。真的很糟糕。Speaker 1 | 06:40 - 06:40 那是——Speaker 3 | 06:42 - 07:17 ——必须是一个大问题。每个人都说「那太好了」。但我实际上要说，我们最终构建Cloud Managed Agents的部分原因是Anthropic自己已经经历了足够多的这些迭代，我们构建了可以在云中自主运行的智能体产品。我们建立了基础设施，让它工作得足够好，足够多次，以至于我们自己都觉得「好了，我们为 ourselves完成这个构建了。我们要一次做好，基于我们学到的一切，但也是为了所有在做这件事的人」。Speaker 3 | 07:17 - 07:32 像，你可以在几台Mac Mini上运行你现在运行的任何东西。可能对很多人来说这可以工作。但我认为如果你把智能体构建到你的产品中，而且你在真正规模化地运行某些东西，对吧，那真的开始变得越来越难以正确处理那个基础设施。Speaker 1 | 07:32 - 07:33 这真的很有趣。Speaker 2 | 07:33 - 07:56 是的。然后也许回答你问题的另一部分，我认为我们在这里的哲学有两个部分。一个是在某种程度上我们设计Managed Agents的方式，我们试图让它足够模块化。我们希望在某些我们觉得应该与Claude模型非常紧密联系的部分有观点。比如，我们希望Claude非常具体地使用文件系统。Speaker 2 | 07:56 - 07:58 那是一个非常特定的——Speaker 1 | 07:58 - 08:00 以特定方式使用还是一般意义上的文件系统？Speaker 2 | 08:00 - 08:13 一般意义上的文件系统。我们也真的想深入技能。我知道很多人喜欢技能，但这是我们真的希望用心的地方。所以我们对这些原语非常讲究——比如使用文件系统，使用技能。Speaker 2 | 08:13 - 08:35 它们真的很基础。但与此同时，我们仍然发现人们在尝试其他方法来做到这一点。我们想帮助你在开始构建时——第一步就走得最好。所以这是一部分，在一些更有倾向性的方面。但我们拥有的每个端点或API，作为套件的一部分，我们试图在某些领域开放一点。Speaker 2 | 08:35 - 09:11 所以有些事情——你知道，我们期待的事情，可能今天还不可用，但在我们的设计中，我们试图让它足够灵活，让人们可以添加不同的部分，因为我们认识到这个API或API套件不一定在其原始结构中解决所有问题，会有需要开放的部件。然后第二部分是，你知道，我们对此很公开——当我们设计很多东西时，我们确实会发布博客文章和参考实现。所以如果你真的想至少受那个结构的启发，可能还是在Messages API上做自己的，你绝对可以那样做。Speaker 1 | 09:11 - 09:55 我认为这——对你刚才说的观点——这是我们正在出现的事情。再说一次，我们有Cloud在Mac Mini上运行，一个Python文件和一些其他的，像我们在更大的更认真的实现上——比如在云基础设施上——我们正在试图弄清楚该怎么办。我认为我告诉团队我们要今天谈话，我认为他们有的问题之一，或者他们感到困惑的感觉，考虑使用Cloud Managed Agents来处理这类事情——为客户启动智能体——只是现在——它有点像——我们有一个操场。我们只有——我们有一台服务器或一台Mac Mini。我们可以——我们只是可以——管道东西到Cloud。Speaker 1 | 09:55 - 10:06 Cloud可以做Cloud Code能做的任何事情。它有文件系统。它有浏览器。它有所有东西。如果我们想切换到——切换到——比如GPT 5.5或Gemini或其他什么，那真的很——很容易做到。Speaker 1 | 10:08 - 10:37 所以这是那种——而且我觉得他们觉得——他们觉得他们会——如果使用Cloud Managed Agent，我们会进去，而且不会——不会有做所有我们想做的事情的灵活性。而且还有一种担心，功能会来到Cloud Code本身，而不会很快来到Cloud Managed Agent，而它会阻止我们保持在前沿，那是——这是我们向客户承诺的，也是向我们自己承诺的。像，我们只是喜欢——做新事物。，你怎么看？Speaker 3 | 10:37 - 11:04 是的。所以我觉得我们内部工作的方式有一个很好的地方——所以我们运营平台，对大多数人来说，平台是他们认为的，是我们面向外部的API和API套件。我们团队实际上做的其他事情是内部平台，从某种意义上说，我们所有的第一方产品都直接构建在与所有人相同的平台之上。所以有趣的是，我们花了很多时间——不是全部时间，但很多时间——与内部在平台之上构建的团队合作，启用他们将构建的功能，分享想法和诸如此类的事情。所以我认为随着时间的推移，你可能会看到Cloud Managed Agents中可用的内容与可能位于同一基础设施之上的Coworker Cloud Code之间越来越少的分歧，对吧？这是一种思考方式。Speaker 1 | 11:04 - 11:05 我们很多时间——Speaker 3 | 11:05 - 11:33 很多我们的时间与内部团队合作，他们在平台之上构建，启用他们将构建的功能，分享想法，诸如此类。所以我认为随着时间的推移，你可能会看到Cloud Managed Agents和可能位于同一基础设施之上的Cloud Code之间越来越少的分歧，对吧？这是思考方式之一。是的。然后我认为，Speaker 2 | 11:33 - 12:01 在你和你的团队关于模型锁定的恐惧的观点上，我认为这是有效的。很多人在这些困惑中有这种感觉。我认为我们正处于一个有点进化的地步，如果你回看——可能只是几个月前，构建一个非常通用的框架是非常标准的。它超级通用，然后你可以在所有这些东西上热切换模型。我认为对于老一代的模型，在实验室之间，那种方式运作得还算可以。Speaker 2 | 12:01 - 12:30 很多事情以我相信那种方式还算合理的速度发展。我认为现在，对于下一代的模型，随着我们向前看，我认为你有点看到了每个实验室的这种情况。每个人都在采取稍微不同的技术和你想要推进他们特定形式的模型的方式。所以理论上，我认为你可以做所有那些东西的超集。但更常见的是，我认为，你知道，当你为你的公司或你的客户构建智能体时，你确实想要为他们提供最终结果。Speaker 2 | 12:30 - 12:53 所以我认为这种抽象级别——你实际热切换的东西不再是这个非常通用的框架和热切换模型，而是变得更接近——框架和模型变得非常配对。你仍然需要冗余，你可能仍然想用其他模型做事情，但你可能在……层做它。