AI 资讯

返回首页播客摘要节目时长 · 30:32

5月21日周四 · 07:00

Cerebras 630亿美元IPO背后的故事——联合创始人兼CEO安德鲁·费尔德曼专访

Original title · The Story Behind Cerebras’ $63 Billion IPO with Founder and CEO Andrew Feldman

播客中文摘要全文翻译

TL;DR

这期讲了什么

Cerebras联合创始人兼CEO安德鲁·费尔德曼（Andrew Feldman）讨论了公司从2010年代中期创立到最近630亿美元IPO的历程。Cerebras生产专为机器学习工作负载优化的AI计算机，通过独特的晶圆级工程方法——制造面积达46000平方毫米、相当于餐盘大小的芯片——实现了比GPU快15-20倍的推理速度。经过2017年至2019年每月支出800万美元、艰难突破产品制造的挑战期后，公司终于在2019年取得技术突破。费尔德曼解释说，2025年当AI变得足够智能、能够用于日常工作时，需求开始爆发。重要里程碑包括与OpenAI达成的超过200亿美元的协议以及与AWS的合作伙伴关系。公司从第一代仅售出十几台增长到第三代售出数万台，通过早期超级计算客户（如阿贡国家实验室）和主权客户G42来扩大供应链、验证技术，最终实现主流市场应用。

本期你会听到

Cerebras的晶圆级芯片方案——制造相当于餐盘大小的芯片——实现了比传统GPU快15-20倍的AI推理速度，克服了行业数十年来对该架构可行性的质疑。
在技术领先市场多年后，2025年当AI模型变得足够智能、可以用于日常工作时，需求开始爆发，验证了Cerebras十年押注的正确性。
公司在超级计算和主权客户G42验证技术后，获得了OpenAI超过200亿美元的协议和AWS合作伙伴关系等重大订单。
费尔德曼描述了团队在2017-2019年技术失败期每月支出800万美元的困境，到如今850名员工、630亿美元市值公司的历程。

对话时间线

00:00→ 00:12Speaker 1
Netflix used to deliver DVDs and envelopes.
06:26→ 07:02Speaker 1
But, you know, when graphics emerged, you got the discrete GPU, and you you you got NVI…
12:34→ 12:49Speaker 3
Can I ask you as an aside, actually, just because you have, for more than a decade, bel…
18:48→ 19:18Speaker 1
And I think sometimes having other former CEOs or other really seasoned entrepreneurs w…
25:04→ 25:12Speaker 3
I actually think that's like a crazy characteristic of this market that I've not person…
30:16→ 30:32Speaker 3
Find us on Twitter at no priors pod.

对话逐字稿

中文逐字稿

00:00→ 00:12演讲者1

Netflix过去是靠递送DVD和信封为生的。当互联网速度变快后，他们变成了电影制片厂。对吧？这开辟了全新的业务，一些本质不同的东西。这就是速度带来的变化。演讲者1 | 00:12 - 00:30 我认为这就是快速AI的作用。现在，我们正在取代那些每个人都看得见的东西，比如编程、设计、SaaS工具。但一旦我们开始围绕这个进行根本性的重组，你就会看到这些全新的商业模式和生产力根本性的飞跃。我很期待。那太酷了。演讲者2 | 00:37 - 01:01 今天在No Priors节目中，我们邀请到了Andrew Feldman，Cerebras的联合创始人兼CEO。Cerebras成立于2010年代中期，专注于AI的新工作负载，特别是机器学习世界，然后在这个我们今天所处的基础模型世界中迅速转型为极速推理。Cerebras最近上市了，目前在股票市场上价值约630亿美元。Andrew，感谢你参加No Priors节目。演讲者1 | 01:01 - 01:03 哦，非常荣幸。很高兴再次见到你们。演讲者2 | 01:03 - 01:12 是的。首先，恭喜你。你的公司Cerebras刚刚上市。截至今天，市值600亿美元，这相当了不起。相当了不起。演讲者2 | 01:12 - 01:27 是的。我想你一两年前在我们的节目中出现过，在早期的一集中，很高兴那时和你交谈。显然，我们非常兴奋今天能再次邀请到你。你能告诉我们自那以来业务是如何发展的吗？给我们观众提醒一下你们做什么，专注什么，如何前进？演讲者1 | 01:28 - 01:43 我们制造AI计算机。对吧？为加速AI工作负载而设计和优化的计算机。现在，我们是推理速度最快的，不是快一点点，而是快很多。15倍、18倍、20倍，比GPU快。演讲者1 | 01:44 - 02:08 所以发生的事情是，从2025年左右开始，AI模型变得足够智能，可以被使用了。人们开始使用它们，你知道，我们用AI进行训练，我们用它进行推理。所以当人们开始使用它，它开始被整合到他们的日常工作中。速度变得至关重要，而我们被需求淹没了。演讲者2 | 02:08 - 02:13 这是全面的加速，还是特定的使用案例？全面加速。演讲者1 | 02:13 - 02:48 大模型、小模型、美国模型、中国模型、万亿参数模型、十亿参数模型，全面加速。然后在年底，我们与OpenAI签署了一项协议，这是硅谷有史以来最大的交易之一，金额超过200亿美元。然后在三月，我们与AWS签署了一项协议，我们将在他们的数据中心中部署。所以这一年半就是追逐供应、试图满足需求的旋风般的一年半。演讲者2 | 02:48 - 02:54 在过去一年半中发生了什么变化？是制造产能的提升吗？新芯片设计？还是其他什么？演讲者2 | 02:54 - 02:55 你能帮我们科普一下演讲者1 | 02:57 - 03:07 发生的事情是我们制造了一台非常非常快的机器，但很长时间没有人关心。对吧？那是因为实际上，演讲者3 | 03:07 - 03:14 请原谅我这么说，但很多人反对，说这只是奇怪的架构。他们说Cerebras做错了。演讲者1 | 03:14 - 03:25 是的。是的。他们确实这么说过。我认为要达到根本性的更好，对吧，你不能建造一个类似架构的东西。对吧？演讲者1 | 03:25 - 03:52 你不会通过对他们的架构进行小的修改就比GPU好15或20倍。这可能在各个领域都是如此，如果你要追求根本性的改进，你的设计必须不同。从一开始，我们就选择了晶圆级，这意味着我们制造一个46000平方毫米的芯片，一个餐盘大小的芯片，而其他人正在制造的芯片只有邮票大小。他们说我们疯了。这永远不会成功。演讲者1 | 03:53 - 04:14 他们列出了不可能的原因。但在2019年，我们证明了这是可能的。我们开始交付它，我们改进它，我们不断改进。但当AI还是个新奇事物时，我们是快速的。当它还是个新奇事物时，没有人在意你有多快，因为它还没有被使用。演讲者1 | 04:14 - 04:30 所以从2023年左右到2025年初，人们指着AI，但没有人每天在工作中使用它。是的。而一旦你在工作中每天使用某样东西，它就不能慢。我的意思是，你们会等多久让一个网站加载？演讲者3 | 04:30 - 04:31 你不会有耐心的。演讲者1 | 04:31 - 04:37 对。这完全正确。这就是事实。我的意思是，慢速搜索的市场有多大？为零。演讲者1 | 04:37 - 05:00 拨号上网的市场有多大？为零。慢速推理的市场就这么大，但我们必须等到它足够智能、足够有用。那发生在2025年。这就是为什么你看到需求的爆发，像Cognition、Cursor、Lovable这样的公司，以及所有其他开始快速增长的公司。演讲者1 | 05:00 - 05:11 你们投资的许多公司都在疯狂增长，OpenAI和其他公司。而我们正好拥有正确的产品。演讲者2 | 05:11 - 05:26 我想我第一次见到你是在2016年左右。那时候，人们不像现在这样说AI，对吧？你在谈论机器学习，当时的模型是卷积神经网络和循环神经网络，还有GANs的出现等等演讲者1 | 05:26 - 05:34 我们试图区分一把椅子和一只猫。对吧？那时Quackley的人脸识别很火。像猫和...或一把椅子。演讲者1 | 05:34 - 05:38 像，哇。我们走了多远。真是不可思议。演讲者2 | 05:38 - 05:57 是的。是的。你认为是什么给了你当时押注这个市场的远见？因为你的观点，我认为我们很多人都相信这个市场会非常重要，而你比其他大多数人更相信，对吧？毕竟你真的在这个市场中创办了一家公司。但市场花了一些时间才真正扩展到你所说的现在是巨大的使用案例，人们真的关心推理速度和其他事情。演讲者2 | 05:58 - 06:00 当时是什么给了你这样做的信念？演讲者1 | 06:00 - 06:25 愿景的正确结合，正确的联合创始人，还有一点傲慢，一点运气。我们看到AI作为新工作负载出现在地平线上。作为计算机架构师，新工作负载就是机会。对吧？进入x86世界非常困难，那里没有什么新发生的事情，已经好几代没有进展了。演讲者1 | 06:26 - 07:02 但是，当图形处理出现时，你得到了独立GPU，你得到了NVIDIA，当移动计算出现时，你得到了ARM。有趣的是，你认为会非常有能力赢得那个业务的人——不是英特尔，不是AMD，不是所有你会认为的人——他们都颗粒无收。所以我们知道这个新工作负载会消耗大量计算。它需要新的架构，专用架构，而且应该非常不同。架构不可能是现有东西的衍生物。演讲者1 | 07:03 - 07:06 这些是我们的大赌注，它们百分之百是逆向的。演讲者2 | 07:06 - 07:07 是的。演讲者1 | 07:07 - 07:09 结果证明完全正确。演讲者2 | 07:09 - 07:12 有没有那么一刻你怀疑这是否可行，考虑到演讲者1 | 07:12 - 07:34 当然有。肯定有。我们有一段时间，你知道，我们正在解决一个从未被解决过的问题。我的意思是，在计算行业七十年的整个历史中，有过在整个行业范围内构建晶圆级产品的努力。事实上，Gene Amdahl，我们领域的创始人之一，计算领域的先驱之一，非常惨地失败了。演讲者1 | 07:34 - 07:53 我们在2017年中期和2019年中期之间有一个时期，我们无法制造它。我们每月花费约800万美元。你每六周举行一次董事会会议，说，我无法制造它。不，它还是不行。哎呀，确实。演讲者1 | 07:53 - 08:23 我的意思是，那是大量的金钱，你的投资者有大量的信念。每次我们做失败分析，我们都在这方面做得更好一点。更好一点。然后在19年夏天，我们开始产出了，它开始工作了。第一次，我们坐在Los Altos市中心一个临时搭建的办公室里，在一个不是为硬件人员设计的大楼里，我们盯着电脑，这和看 paint dry一样令人兴奋。是的。演讲者1 | 08:23 - 08:31 它工作了。我们半小时都说不出话来。对吧？没有人能够做到这一点，它工作了。我们做到了。演讲者2 | 08:31 - 08:42 太神奇了。因为那是技术方面，然后还有市场方面。对吧？而且在市场方面，你的观点是，需要时间才能让这些工作负载真正重要。那么有没有那么一刻你怀疑市场是否存在？演讲者1 | 08:42 - 09:08 你知道，我们解决了它，我们解决了计算机行业中最难的问题，没有人关心。没有人。好像是，你知道的，第一代，我们可能只卖了几十台。第二代，我们可能卖了300台，现在我们第三代卖了几万台。我们有两三年的时间领先于市场，绝对没有人在乎我们有多快。演讲者3 | 09:08 - 09:21 你发现了一些先驱客户，这些客户在起点上是非典型的，对吧？有一些主权国家，他们真的提前购买了。像，你如何看待在这种领先需求时期的弹性？演讲者1 | 09:21 - 09:54 我认为有一条由新计算机架构铺设的道路。通常你首先进入超级计算世界，因为那些家伙喜欢速度，他们不在乎你的软件是否不成熟。所以我们在这方面占据了主导地位。我们赢得了阿贡国家实验室、劳伦斯利弗莫尔、桑迪亚，在欧洲赢得了欧洲并行计算中心LRZ。所以我们在这方面占据主导地位，然后我们赢得了一些石油和天然气领域的公司，我们赢得了一些制药公司，所有这些公司都有使用大量计算的历史。演讲者1 | 09:55 - 10:25 但从历史上看，有一个巨大的鸿沟，因为他们都没有提供进入主流的数量。我们赢得了一个主权客户，G42，他们成为了战略合作伙伴和亲密朋友，他们向我们下了一个10亿美元的订单。有了这个，我们能够改造公司。我们能够改变我们的供应链。我们能够部署足够大的集群设备，这样我们就可以大规模地进行实战测试。演讲者1 | 10:25 - 10:42 硬件的挑战之一是你的QA实验室不可能像你的一些客户想要部署的那样大。是的。对吧？但是你不能在你的QA实验室里放价值1亿美元的设备。他们与我们合作，我们开始为他们训练模型。演讲者1 | 10:42 - 10:59 我们开始为他们做推理。他们是非常出色的合作伙伴。这是G42的CEO Peng和他的董事长Shi Tak Nun。我们找不到更好的合作伙伴了。所以当OpenAI出现时，当AWS出现时，我们有产能了。演讲者1 | 10:59 - 11:09 我们准备好了。对吧？我们已经经过实战测试了。我们已经跨越了鸿沟。我们有了一座桥梁，所以我们能够满足需求。演讲者1 | 11:09 - 11:09 是的。演讲者3 | 11:09 - 11:24 我认为这种路径依赖在这个领域有时被低估了，因为你能够从...就像，从1000万美元的订单到200亿美元的积压订单，像，必须有...演讲者3 | 11:24 - 11:42 必须有中间的东西。是啊。多年工作的结果。我的意思是，而且，你知道，我认为通常，而且我确信你们很多听众都在软件世界，你们可以快速扩展。是的。对吧？但是当你建造东西时，对吧，你想要翻倍，你得打电话给你的制造合作伙伴，你的Centimers。演讲者1 | 11:42 - 11:49 你得他们必须找到电力。他们必须赢得建筑。他们必须增加更多生产线。他们必须制造测试夹具。对吧？演讲者1 | 11:49 - 12:00 每一步都需要时间和精力来增长。我们今年要尝试将制造能力提高10倍。是的。这大概是硬件史上最快的发展速度了。演讲者3 | 12:01 - 12:04 这也是你们软件栈的大部分。这是更多扩展。对吧？演讲者1 | 12:04 - 12:18 你知道，当我们创办公司时，Sarah，我们的联合创始人之一，我记得。我知道的。我们，我们向你展示过。我的联合创始人之一说，Andrew，建造一个编译器大约需要十年。我说，不。演讲者1 | 12:18 - 12:23 那太疯狂了。那是大公司说的话。我们五年就能做到。大概需要十年。结果证明。演讲者1 | 12:23 - 12:34 建造编译器确实需要很长时间。这是一个非常困难的软件。现在我们有一个好的软件栈了。演讲者3 | 12:34 - 12:49 实际上我能问你一个题外话吗？因为你已经超过十年相信这场革命会发生？Cerebras内部有多少人在使用AI编程？非常重要。演讲者1 | 12:49 - 13:08 我会说，八个月前，我们在工程上不花一分钱买token，现在我们大概在25或30000左右，而且增长很快。我认为它不是对每个人都有用。我认为这是事实。我认为有一些人的思维方式非常适合它。对吧？演讲者1 | 13:08 - 13:25 他们运行8个或10个代理，全天候7x24。他们已经改变了编码风格，变成他们管理代理的方式，他们考虑如何进行QA。所以他们有一个QA代理在运行。他们考虑如何解决编码模型的一些弱点。对吧？演讲者1 | 13:25 - 13:42 它们通常很冗长。它们经常删除注释。他们真的考虑过了，这是一类非常适合他们思维的难题。他们已经从10倍的人变成了100倍的人。我认为我们其他人，包括我自己，都在艰难前行。演讲者1 | 13:42 - 14:02 我们在努力弄清楚如何让它为我们的不同工作发挥作用，作为CEO，作为CFO，作为会计，作为营销。但对于一小部分人来说，它是如此完美的工具。然后我们其他人，我们尝试向他们展示其他人在做什么，最好的实践是什么。演讲者3 | 14:02 - 14:04 你们现在大概800人了吧？演讲者1 | 14:04 - 14:05 800，850左右，是的。演讲者3 | 14:05 - 14:07 这是每人很高的市值。演讲者1 | 14:07 - 14:08 我喜欢这个。是啊。演讲者3 | 14:08 - 14:22 太好了。当你想从这里走向何方，把业务做大，战略方向，你预测什么，你能去哪里...