Netflix过去是靠递送DVD和信封为生的。当互联网速度变快后,他们变成了电影制片厂。对吧?这开辟了全新的业务,一些本质不同的东西。这就是速度带来的变化。演讲者1 | 00:12 - 00:30 我认为这就是快速AI的作用。现在,我们正在取代那些每个人都看得见的东西,比如编程、设计、SaaS工具。但一旦我们开始围绕这个进行根本性的重组,你就会看到这些全新的商业模式和生产力根本性的飞跃。我很期待。那太酷了。演讲者2 | 00:37 - 01:01 今天在No Priors节目中,我们邀请到了Andrew Feldman,Cerebras的联合创始人兼CEO。Cerebras成立于2010年代中期,专注于AI的新工作负载,特别是机器学习世界,然后在这个我们今天所处的基础模型世界中迅速转型为极速推理。Cerebras最近上市了,目前在股票市场上价值约630亿美元。Andrew,感谢你参加No Priors节目。演讲者1 | 01:01 - 01:03 哦,非常荣幸。很高兴再次见到你们。演讲者2 | 01:03 - 01:12 是的。首先,恭喜你。你的公司Cerebras刚刚上市。截至今天,市值600亿美元,这相当了不起。相当了不起。演讲者2 | 01:12 - 01:27 是的。我想你一两年前在我们的节目中出现过,在早期的一集中,很高兴那时和你交谈。显然,我们非常兴奋今天能再次邀请到你。你能告诉我们自那以来业务是如何发展的吗?给我们观众提醒一下你们做什么,专注什么,如何前进?演讲者1 | 01:28 - 01:43 我们制造AI计算机。对吧?为加速AI工作负载而设计和优化的计算机。现在,我们是推理速度最快的,不是快一点点,而是快很多。15倍、18倍、20倍,比GPU快。演讲者1 | 01:44 - 02:08 所以发生的事情是,从2025年左右开始,AI模型变得足够智能,可以被使用了。人们开始使用它们,你知道,我们用AI进行训练,我们用它进行推理。所以当人们开始使用它,它开始被整合到他们的日常工作中。速度变得至关重要,而我们被需求淹没了。演讲者2 | 02:08 - 02:13 这是全面的加速,还是特定的使用案例?全面加速。演讲者1 | 02:13 - 02:48 大模型、小模型、美国模型、中国模型、万亿参数模型、十亿参数模型,全面加速。然后在年底,我们与OpenAI签署了一项协议,这是硅谷有史以来最大的交易之一,金额超过200亿美元。然后在三月,我们与AWS签署了一项协议,我们将在他们的数据中心中部署。所以这一年半就是追逐供应、试图满足需求的旋风般的一年半。演讲者2 | 02:48 - 02:54 在过去一年半中发生了什么变化?是制造产能的提升吗?新芯片设计?还是其他什么?演讲者2 | 02:54 - 02:55 你能帮我们科普一下演讲者1 | 02:57 - 03:07 发生的事情是我们制造了一台非常非常快的机器,但很长时间没有人关心。对吧?那是因为实际上,演讲者3 | 03:07 - 03:14 请原谅我这么说,但很多人反对,说这只是奇怪的架构。他们说Cerebras做错了。演讲者1 | 03:14 - 03:25 是的。是的。他们确实这么说过。我认为要达到根本性的更好,对吧,你不能建造一个类似架构的东西。对吧?演讲者1 | 03:25 - 03:52 你不会通过对他们的架构进行小的修改就比GPU好15或20倍。这可能在各个领域都是如此,如果你要追求根本性的改进,你的设计必须不同。从一开始,我们就选择了晶圆级,这意味着我们制造一个46000平方毫米的芯片,一个餐盘大小的芯片,而其他人正在制造的芯片只有邮票大小。他们说我们疯了。这永远不会成功。演讲者1 | 03:53 - 04:14 他们列出了不可能的原因。但在2019年,我们证明了这是可能的。我们开始交付它,我们改进它,我们不断改进。但当AI还是个新奇事物时,我们是快速的。当它还是个新奇事物时,没有人在意你有多快,因为它还没有被使用。演讲者1 | 04:14 - 04:30 所以从2023年左右到2025年初,人们指着AI,但没有人每天在工作中使用它。是的。而一旦你在工作中每天使用某样东西,它就不能慢。我的意思是,你们会等多久让一个网站加载?演讲者3 | 04:30 - 04:31 你不会有耐心的。演讲者1 | 04:31 - 04:37 对。这完全正确。这就是事实。我的意思是,慢速搜索的市场有多大?为零。演讲者1 | 04:37 - 05:00 拨号上网的市场有多大?为零。慢速推理的市场就这么大,但我们必须等到它足够智能、足够有用。那发生在2025年。这就是为什么你看到需求的爆发,像Cognition、Cursor、Lovable这样的公司,以及所有其他开始快速增长的公司。演讲者1 | 05:00 - 05:11 你们投资的许多公司都在疯狂增长,OpenAI和其他公司。而我们正好拥有正确的产品。演讲者2 | 05:11 - 05:26 我想我第一次见到你是在2016年左右。那时候,人们不像现在这样说AI,对吧?你在谈论机器学习,当时的模型是卷积神经网络和循环神经网络,还有GANs的出现等等演讲者1 | 05:26 - 05:34 我们试图区分一把椅子和一只猫。对吧?那时Quackley的人脸识别很火。像猫和...或一把椅子。演讲者1 | 05:34 - 05:38 像,哇。我们走了多远。真是不可思议。演讲者2 | 05:38 - 05:57 是的。是的。你认为是什么给了你当时押注这个市场的远见?因为你的观点,我认为我们很多人都相信这个市场会非常重要,而你比其他大多数人更相信,对吧?毕竟你真的在这个市场中创办了一家公司。但市场花了一些时间才真正扩展到你所说的现在是巨大的使用案例,人们真的关心推理速度和其他事情。演讲者2 | 05:58 - 06:00 当时是什么给了你这样做的信念?演讲者1 | 06:00 - 06:25 愿景的正确结合,正确的联合创始人,还有一点傲慢,一点运气。我们看到AI作为新工作负载出现在地平线上。作为计算机架构师,新工作负载就是机会。对吧?进入x86世界非常困难,那里没有什么新发生的事情,已经好几代没有进展了。演讲者1 | 06:26 - 07:02 但是,当图形处理出现时,你得到了独立GPU,你得到了NVIDIA,当移动计算出现时,你得到了ARM。有趣的是,你认为会非常有能力赢得那个业务的人——不是英特尔,不是AMD,不是所有你会认为的人——他们都颗粒无收。所以我们知道这个新工作负载会消耗大量计算。它需要新的架构,专用架构,而且应该非常不同。架构不可能是现有东西的衍生物。演讲者1 | 07:03 - 07:06 这些是我们的大赌注,它们百分之百是逆向的。演讲者2 | 07:06 - 07:07 是的。演讲者1 | 07:07 - 07:09 结果证明完全正确。演讲者2 | 07:09 - 07:12 有没有那么一刻你怀疑这是否可行,考虑到演讲者1 | 07:12 - 07:34 当然有。肯定有。我们有一段时间,你知道,我们正在解决一个从未被解决过的问题。我的意思是,在计算行业七十年的整个历史中,有过在整个行业范围内构建晶圆级产品的努力。事实上,Gene Amdahl,我们领域的创始人之一,计算领域的先驱之一,非常惨地失败了。演讲者1 | 07:34 - 07:53 我们在2017年中期和2019年中期之间有一个时期,我们无法制造它。我们每月花费约800万美元。你每六周举行一次董事会会议,说,我无法制造它。不,它还是不行。哎呀,确实。演讲者1 | 07:53 - 08:23 我的意思是,那是大量的金钱,你的投资者有大量的信念。每次我们做失败分析,我们都在这方面做得更好一点。更好一点。然后在19年夏天,我们开始产出了,它开始工作了。第一次,我们坐在Los Altos市中心一个临时搭建的办公室里,在一个不是为硬件人员设计的大楼里,我们盯着电脑,这和看 paint dry一样令人兴奋。是的。演讲者1 | 08:23 - 08:31 它工作了。我们半小时都说不出话来。对吧?没有人能够做到这一点,它工作了。我们做到了。演讲者2 | 08:31 - 08:42 太神奇了。因为那是技术方面,然后还有市场方面。对吧?而且在市场方面,你的观点是,需要时间才能让这些工作负载真正重要。那么有没有那么一刻你怀疑市场是否存在?演讲者1 | 08:42 - 09:08 你知道,我们解决了它,我们解决了计算机行业中最难的问题,没有人关心。没有人。好像是,你知道的,第一代,我们可能只卖了几十台。第二代,我们可能卖了300台,现在我们第三代卖了几万台。我们有两三年的时间领先于市场,绝对没有人在乎我们有多快。演讲者3 | 09:08 - 09:21 你发现了一些先驱客户,这些客户在起点上是非典型的,对吧?有一些主权国家,他们真的提前购买了。像,你如何看待在这种领先需求时期的弹性?演讲者1 | 09:21 - 09:54 我认为有一条由新计算机架构铺设的道路。通常你首先进入超级计算世界,因为那些家伙喜欢速度,他们不在乎你的软件是否不成熟。所以我们在这方面占据了主导地位。我们赢得了阿贡国家实验室、劳伦斯利弗莫尔、桑迪亚,在欧洲赢得了欧洲并行计算中心LRZ。所以我们在这方面占据主导地位,然后我们赢得了一些石油和天然气领域的公司,我们赢得了一些制药公司,所有这些公司都有使用大量计算的历史。演讲者1 | 09:55 - 10:25 但从历史上看,有一个巨大的鸿沟,因为他们都没有提供进入主流的数量。我们赢得了一个主权客户,G42,他们成为了战略合作伙伴和亲密朋友,他们向我们下了一个10亿美元的订单。有了这个,我们能够改造公司。我们能够改变我们的供应链。我们能够部署足够大的集群设备,这样我们就可以大规模地进行实战测试。演讲者1 | 10:25 - 10:42 硬件的挑战之一是你的QA实验室不可能像你的一些客户想要部署的那样大。是的。对吧?但是你不能在你的QA实验室里放价值1亿美元的设备。他们与我们合作,我们开始为他们训练模型。演讲者1 | 10:42 - 10:59 我们开始为他们做推理。他们是非常出色的合作伙伴。这是G42的CEO Peng和他的董事长Shi Tak Nun。我们找不到更好的合作伙伴了。所以当OpenAI出现时,当AWS出现时,我们有产能了。演讲者1 | 10:59 - 11:09 我们准备好了。对吧?我们已经经过实战测试了。我们已经跨越了鸿沟。我们有了一座桥梁,所以我们能够满足需求。演讲者1 | 11:09 - 11:09 是的。演讲者3 | 11:09 - 11:24 我认为这种路径依赖在这个领域有时被低估了,因为你能够从...就像,从1000万美元的订单到200亿美元的积压订单,像,必须有...演讲者3 | 11:24 - 11:42 必须有中间的东西。是啊。多年工作的结果。我的意思是,而且,你知道,我认为通常,而且我确信你们很多听众都在软件世界,你们可以快速扩展。是的。对吧?但是当你建造东西时,对吧,你想要翻倍,你得打电话给你的制造合作伙伴,你的Centimers。演讲者1 | 11:42 - 11:49 你得他们必须找到电力。他们必须赢得建筑。他们必须增加更多生产线。他们必须制造测试夹具。对吧?演讲者1 | 11:49 - 12:00 每一步都需要时间和精力来增长。我们今年要尝试将制造能力提高10倍。是的。这大概是硬件史上最快的发展速度了。演讲者3 | 12:01 - 12:04 这也是你们软件栈的大部分。这是更多扩展。对吧?演讲者1 | 12:04 - 12:18 你知道,当我们创办公司时,Sarah,我们的联合创始人之一,我记得。我知道的。我们,我们向你展示过。我的联合创始人之一说,Andrew,建造一个编译器大约需要十年。我说,不。演讲者1 | 12:18 - 12:23 那太疯狂了。那是大公司说的话。我们五年就能做到。大概需要十年。结果证明。演讲者1 | 12:23 - 12:34 建造编译器确实需要很长时间。这是一个非常困难的软件。现在我们有一个好的软件栈了。演讲者3 | 12:34 - 12:49 实际上我能问你一个题外话吗?因为你已经超过十年相信这场革命会发生?Cerebras内部有多少人在使用AI编程?非常重要。演讲者1 | 12:49 - 13:08 我会说,八个月前,我们在工程上不花一分钱买token,现在我们大概在25或30000左右,而且增长很快。我认为它不是对每个人都有用。我认为这是事实。我认为有一些人的思维方式非常适合它。对吧?演讲者1 | 13:08 - 13:25 他们运行8个或10个代理,全天候7x24。他们已经改变了编码风格,变成他们管理代理的方式,他们考虑如何进行QA。所以他们有一个QA代理在运行。他们考虑如何解决编码模型的一些弱点。对吧?演讲者1 | 13:25 - 13:42 它们通常很冗长。它们经常删除注释。他们真的考虑过了,这是一类非常适合他们思维的难题。他们已经从10倍的人变成了100倍的人。我认为我们其他人,包括我自己,都在艰难前行。演讲者1 | 13:42 - 14:02 我们在努力弄清楚如何让它为我们的不同工作发挥作用,作为CEO,作为CFO,作为会计,作为营销。但对于一小部分人来说,它是如此完美的工具。然后我们其他人,我们尝试向他们展示其他人在做什么,最好的实践是什么。演讲者3 | 14:02 - 14:04 你们现在大概800人了吧?演讲者1 | 14:04 - 14:05 800,850左右,是的。演讲者3 | 14:05 - 14:07 这是每人很高的市值。演讲者1 | 14:07 - 14:08 我喜欢这个。是啊。演讲者3 | 14:08 - 14:22 太好了。当你想从这里走向何方,把业务做大,战略方向,你预测什么,你能去哪里...
Cerebras联合创始人兼CEO安德鲁·费尔德曼(Andrew Feldman)讨论了公司从2010年代中期创立到最近630亿美元IPO的历程。Cerebras生产专为机器学习工作负载优化的AI计算机,通过独特的晶圆级工程方法——制造面积达46000平方毫米、相当于餐盘大小的芯片——实现了比GPU快15-20倍的推理速度。经过2017年至2019年每月支出800万美元、艰难突破产品制造的挑战期后,公司终于在2019年取得技术突破。费尔德曼解释说,2025年当AI变得足够智能、能够用于日常工作时,需求开始爆发。重要里程碑包括与OpenAI达成的超过200亿美元的协议以及与AWS的合作伙伴关系。公司从第一代仅售出十几台增长到第三代售出数万台,通过早期超级计算客户(如阿贡国家实验室)和主权客户G42来扩大供应链、验证技术,最终实现主流市场应用。
- Cerebras的晶圆级芯片方案——制造相当于餐盘大小的芯片——实现了比传统GPU快15-20倍的AI推理速度,克服了行业数十年来对该架构可行性的质疑。
- 在技术领先市场多年后,2025年当AI模型变得足够智能、可以用于日常工作时,需求开始爆发,验证了Cerebras十年押注的正确性。
- 公司在超级计算和主权客户G42验证技术后,获得了OpenAI超过200亿美元的协议和AWS合作伙伴关系等重大订单。
- 费尔德曼描述了团队在2017-2019年技术失败期每月支出800万美元的困境,到如今850名员工、630亿美元市值公司的历程。
- 00:00→ 00:12Speaker 1
Netflix used to deliver DVDs and envelopes.
- 06:26→ 07:02Speaker 1
But, you know, when graphics emerged, you got the discrete GPU, and you you you got NVI…
- 12:34→ 12:49Speaker 3
Can I ask you as an aside, actually, just because you have, for more than a decade, bel…
- 18:48→ 19:18Speaker 1
And I think sometimes having other former CEOs or other really seasoned entrepreneurs w…
- 25:04→ 25:12Speaker 3
I actually think that's like a crazy characteristic of this market that I've not person…
- 30:16→ 30:32Speaker 3
Find us on Twitter at no priors pod.
中文逐字稿