深度内容

只留下更值得花时间的内容

这里优先看摘要卡、播客、博客和观点型内容,节奏更像编辑精选。

摘要198 分钟摘要
Box首席执行官亚伦·列维在MAD播客上讨论2026年企业AI现状。尽管AI发展已历经三四年,企业部署仍处于极早期阶段。聊天式AI仍在推广中,企业现已着手应对代理式AI的部署难题。最突出的问题是Token成本从每月20美元/用户的订阅模式飙升至单个高级代理任务可能消耗1000美元。企业普遍乐观但面临预算、人才和部署策略等现实挑战。
  • 企业代理式AI部署仍处于第一天阶段,许多组织的聊天式AI仍在推广中
  • Token成本从订阅模式暴涨至单个任务1000美元以上,令企业措手不及

The MAD Podcast with Matt Turck

11:30 ·

查看摘要

延伸阅读

摘要97 分钟摘要
本期播客中,Every联合创始人兼CEO丹·西克与COO布兰登讨论了丹发表的文章《自动化之后》。尽管Every是典型的AI原生公司,大量使用AI代理,但公司规模从GPT-3发布时的4人增长到现在的30人并继续招聘。丹认为,AI使专家能力变得廉价和普及,产生了大量"接近但不正确"的内容,这反而增加了对专家的需求——需要专家来完善和指导这些工作。核心观点是:AI代理离人类越远,价值越低。代理需要人类不断指引"下一步该做什么",即使达到AGI,这一基本动态也不会改变,因为AI代理本质上是为人类服务的工具。
  • 尽管高度依赖AI代理,Every的团队规模从GPT-3时代的4人扩大到30人,证明自动化并未取代人类工作
  • AI使专家能力变得廉价普及,产生了大量"接近但不完美"的内容,反而增加了对专家的需求

AI & I by Every

16:28 ·

查看摘要
摘要132 分钟摘要
本期播客邀请了Cursor的Federico和Fireworks的Dima,讨论Cursor如何训练其Agentic编程模型Composer 2。Federico解释称,Cursor选择自研模型是为了将所有模型权重专门用于编程任务,以更低的成本实现更好的质量。Composer 2采用双轴训练方法:首先在代码token上进行持续预训练,然后在Cursor测试环境上进行大规模强化学习。Dima详细介绍了大规模RL训练的基础设施挑战,包括需要编排异构的Rollout(模拟Agent会话)和训练流程。
  • Cursor训练Composer 2是为了将所有模型权重专门用于编程任务,以通用模型一小部分的成本实现更好的质量
  • Composer 2采用双轴训练方法:在代码token上进行持续预训练,然后在Cursor任务上进行大规模强化学习

Training Data

09:00 ·

查看摘要
摘要155 分钟摘要
本期节目中,谷歌Gemini联合负责人Oriol Vinyals深入探讨了世界模型、多模态学习的未来及AI发展方向。他解释了谷歌如何独特地专注于能够同时理解视觉和语言信息的世界模型。Vinyals概述了从视频和图像中纯粹提取知识(无需文本标注)所面临的主要挑战,并讨论了世界模型如何通过精确模拟和预测来革新机器人领域。他还反思了测试模型是否真正理解重力等物理原理的评估方法。
  • 谷歌的世界模型通过联合理解视频、图像和语言来实现差异化,而非仅专注于代码生成
  • 视频和图像的「GPT时刻」——不依赖文本直接从视觉数据训练——尚未完全实现,尽管已取得重大进展

Unsupervised Learning

12:50 ·

查看摘要
摘要174 分钟摘要
OpenAI的Yann Dubois探讨了为什么AI进步虽然底层是连续的,却给人突然跃升的感觉。他将此归因于三个因素:去年12月前后可靠性阈值的确立、模型通过编程自我加速发展,以及强化学习从竞赛类任务向实际应用场景的转变。Dubois强调了GPT 5.5的效率提升以及全公司围绕共同目标协作的重要性。他的团队专注于指令遵循、思考时长等横向改进,以及整合模型中的纵向改进。
  • AI可靠性在去年12月左右达到临界阈值,实现了从竞争到实用的跨越
  • 强化学习已从数学竞赛等可验证奖励任务转向实际编码等复杂场景

The MAD Podcast with Matt Turck

11:30 ·

查看摘要
摘要79 分钟摘要
Cerebras联合创始人兼CEO安德鲁·费尔德曼(Andrew Feldman)讨论了公司从2010年代中期创立到最近630亿美元IPO的历程。Cerebras生产专为机器学习工作负载优化的AI计算机,通过独特的晶圆级工程方法——制造面积达46000平方毫米、相当于餐盘大小的芯片——实现了比GPU快15-20倍的推理速度。经过2017年至2019年每月支出800万美元、艰难突破产品制造的挑战期后,公司终于在2019年取得技术突破。费尔德曼解释说,2025年当AI变得足够智能、能够用于日常工作时,需求开始爆发。重要里程碑包括与OpenAI达成的超过200亿美元的协议以及与AWS的合作伙伴关系。公司从第一代仅售出十几台增长到第三代售出数万台,通过早期超级计算客户(如阿贡国家实验室)和主权客户G42来扩大供应链、验证技术,最终实现主流市场应用。
  • Cerebras的晶圆级芯片方案——制造相当于餐盘大小的芯片——实现了比传统GPU快15-20倍的AI推理速度,克服了行业数十年来对该架构可行性的质疑。
  • 在技术领先市场多年后,2025年当AI模型变得足够智能、可以用于日常工作时,需求开始爆发,验证了Cerebras十年押注的正确性。

No Priors

07:00 ·

查看摘要
摘要122 分钟摘要
Alex Rattray是Stainless(最近被Anthropic以3亿美元收购)的创始人兼CEO,他在节目中讨论了MCP(模型上下文协议)以及AI连接互联网的未来。他解释说,MCP的定位是让AI模型能够像人类一样与软件和API交互的"仪表板",但目前的实现方式在规模上存在挑战——暴露数百个端点会迅速耗尽上下文预算并使模型困惑。对话探讨了AI与互联网交互的更好模式,强调API是互联网的"树突",使计算机之间能够相互通信,而MCP代表了这种通信的新范式。
  • Stainless为OpenAI和Anthropic等大型AI公司提供API和SDK,帮助计算机之间实现通信。
  • MCP(模型上下文协议)旨在为AI模型提供原生接口来与网络服务交互,类似于人类使用仪表板的方式。

AI & I by Every

15:00 ·

查看摘要
摘要110 分钟摘要
Serval创始人兼CEO杰克·斯托奇探讨如何构建AI原生的企业服务管理平台。Serval保留了ServiceNow成功的工作流+数据库抽象层,但通过AI驱动的代码生成引擎自动化工作流创建和数据库更新。这解决了传统企业自动化的局限性——传统方式构建工作流需要数周甚至数月。Serval采用双智能体架构,将管理员控制与运维智能体能力分离,在保持企业安全边界的同时实现AI灵活性。斯托奇强调深度客户沉浸作为竞争优势,主动参与超过100个客户Slack频道的日常沟通。
  • Serval的代码生成引擎将自然语言描述转换为代码,实现近乎即时的工作流创建,相比传统平台数周至数月的周期
  • 双智能体架构通过管理员控制与运维智能体分离,平衡AI能力与企业安全、权限和审计需求

Training Data

09:00 ·

查看摘要
摘要9 分钟摘要
Claude Managed Agents 现已支持自托管沙箱和 MCP 隧道两项新功能。自托管沙箱允许代理在您自己的基础设施或 Cloudflare、Daytona、Modal、Vercel 等托管提供商处执行工具,确保敏感数据始终在您的安全边界内。MCP 隧道则可安全连接至私有 MCP 服务器,无需将其暴露在公共互联网上。自托管沙箱目前处于公开测试阶段,MCP 隧道处于研究预览阶段。
  • 自托管沙箱支持在您的基础设施或受支持的提供商处运行,确保文件、包和服务不离开您的安全边界
  • 支持的沙箱客户端包括 Cloudflare(微虚拟机)、Daytona(有状态可组合计算机)、Modal(AI优化)和 Vercel(毫秒级启动)

Claude Blog

00:00 ·

查看摘要
摘要207 分钟摘要
图灵奖得主、人工智能先驱杨立昆讨论了他在Meta工作5年后离职的经历,以及他新创立的公司AMI(高级机器智能)。他认为LLM在语言任务上表现出色,但无法实现人类水平智能,转而倡导基于JEPA架构的世界模型。他解释说,世界模型使智能体能够预测行动后果并通过优化和搜索进行规划,这与LLM的下一个token预测方式形成对比。他认为Meta将重心转向追赶竞争对手而非探索性研究,使这里不再适合他的工作方向。他受认知科学启发的研究方法强调非生成式架构在学习抽象表征方面的优势。
  • 杨立昆于2023年离开Meta,创立AMI Labs,专注于世界模型和JEPA架构,他认为这对于实现人类或动物级智能至关重要。
  • 他批评LLM仅限于语言处理,无法预测行动后果或通过优化进行规划——而他认为这些能力对智能行为至关重要。

Unsupervised Learning

12:50 ·

查看摘要
摘要171 分钟摘要
Daytona首席执行官Ivan Burazin解释了为什么每个AI Agent都需要自己的电脑(沙盒)。他认为,Agent本质上是数字知识工作者,需要自己的机器才能提高生产力。沙盒提供隔离的、有状态的执行环境,让Agent可以安全地安装工具、访问网络、运行脚本和执行复杂任务。Burazin区分了超大规模云服务商的无状态架构(为部署应用程序而构建)与AI Agent所需的有状态特性。Daytona不得不从头构建自己的调度器,而不是使用Kubernetes,因为现有基础设施并非为此设计。他将沙盒的四大用例归纳为:代码/命令执行、浏览器/电脑使用、RL环境基础设施以及评估基准测试。
  • 沙盒是AI Agent的'可组合计算机',提供隔离的有状态环境以确保安全和提高效率
  • Agent需要配备独立账户和访问限制的专属机器,而非共享人类用户的电脑

The MAD Podcast with Matt Turck

11:30 ·

查看摘要
摘要91 分钟摘要
本期播客邀请美国国务院负责经济事务的副国务卿雅各布·赫尔伯格,讨论“硅业和平”计划——一个由14个国家组成的经济安全联盟,旨在确保人工智能供应链安全。赫尔伯格解释,该战略通过利用美国私营部门的优势而非政府运营的供应链,与中国的“一带一路”倡议形成对比。一个关键进展是在美国在亚洲最古老的盟友菲律宾建立了4000英亩的前沿部署工业基地,作为私人投资平台。该方法强调以产品为基础、商业可行的外交政策,与合作伙伴国家共担风险、共享收益。赫尔伯格强调了对目前由中国主导的机器人供应链的兴趣,并强调伙伴关系的双赢性质——各国可从人工智能驱动的经济增长中获益。
  • “硅业和平”是一个由14个国家组成的联盟,采用生态系统方法确保人工智能供应链安全,包括政策路线图和前沿部署工业基地
  • 美国在菲律宾获得了4000英亩外交用地,用于多阶段工业开发,有两年时间谈判长期投资者保护条款

No Priors

10:00 ·

查看摘要
摘要92 分钟摘要
Suno创始人兼CEO Mikey Shulman分享了他从物理学博士到构建领先AI音乐平台的不寻常旅程。Suno让任何人都能创作音乐,90%的日活跃用户会主动创作内容,主要是为了娱乐而非商业目的。核心突破在于将音乐建模为原始声波,而非教导模型12音阶或乐器等音乐概念,这反而赋予了模型更大的创作自由。Shulman强调,音乐生成不同于大语言模型——它不是一个规模问题——因为没有基准测试或标准答案,人类偏好数据对于将模型与创意品味对齐至关重要。
  • Suno的核心创新:将音频建模为原始声波,而非教授音乐结构,从而实现了前所未有的创作自由和流派融合
  • 与大语言模型不同,由于缺乏基准测试,音乐生成从研究和偏好数据中获益更多,而非单纯扩展计算规模

Training Data

18:55 ·

查看摘要
摘要179 分钟摘要
诺亚·布雷尔(Noah Breyer)是Every早期的超级整理者之一,他展示了自己如何将Claude Code打造为"第二大脑"。他在地下室搭建了家用服务器,在Obsidian笔记库上运行Claude Code,实现从手机上随时思考、研究、写作甚至编码。他分享了使用PARA方法的工作流程、每日笔记习惯和研究方式。布雷尔还推崇Grok语音模式,认为其在工具调用和Research能力上优于其他AI语音助手,尤其是集成到特斯拉汽车中后更是如虎添翼。
  • 布雷尔在地下室搭建了家用服务器,在Obsidian笔记库上运行Claude Code,实现从手机端完成全部工作
  • 他将Claude Code作为思维伙伴,用来提问深入问题、从笔记和网络调取Research资料,并保持学习日志

AI & I by Every

15:02 ·

查看摘要
摘要67 分钟摘要
Long Lake Management由首席执行官亚历山大·陶布曼领导,宣布以63亿美元收购美国运通全球商务旅行公司,他们称之为全球首个AI私有化交易。该公司已完成30次收购,通过名为Nexus的专有AI平台改造企业。约80%的基础设施在各业务板块间共享,使其能在收购后数日内快速部署AI解决方案。Long Lake专注于增长和客户体验而非削减成本,收购的企业通常从0-5%的增长率提升至20%以上。其方法吸引了顶尖人才,他们变得更加高效且不愿跳槽到竞争对手,从而创造了增长和留任的自我强化飞轮。
  • Long Lake以63亿美元收购Amex全球商务旅行公司,成为全球首个AI私有化交易
  • 其Nexus AI平台80%基础设施跨业务板块共享,收购后数日内即可快速部署

No Priors

10:00 ·

查看摘要
摘要132 分钟摘要
Anthropic的Angela和Caitlin讨论了AI平台从简单补全端点到有状态智能体系统的演进。他们解释了Cloud Managed Agents如何建立在Messages API之上,整合代码执行和网络搜索等工具,帮助开发者以更少的工作量获得更好的结果。对话回应了关于灵活性与托管服务之间权衡的担忧,以及Anthropic内部团队如何与外部开发者使用相同的平台,确保功能随时间推移保持一致。他们还讨论了平台未来的发展方向,即Claude可能能够足够好地理解自身以实现自我配置,智能体可以动态适应用户的需求。
  • Cloud Managed Agents建立在Messages API之上,整合代码执行和网络搜索等工具,帮助开发者以更少的工作量获得更好的结果。
  • Anthropic的内部产品与外部开发者使用相同的平台,确保Cloud Code和Cloud Managed Agents之间的功能随时间推移保持一致。

AI & I by Every

20:27 ·

查看摘要
摘要70 分钟摘要
ElevenLabs联合创始人Mati Staniszewski分享了公司起源——与童年好友Piotr共同创立,灵感来源于波兰糟糕的配音体验。ElevenLabs成立于2022年音频AI仍是小众领域的时期,采取了非常规发展路径——从较小规模起步,通过GitHub远程招聘,并快速实现商业化。公司目前涵盖完整的音频技术栈,包括语音合成、语音转文字、配音、语音代理和音乐生成。重要里程碑包括AI笑声功能和名人配音(麦康奈希、莫迪、泽连斯基)。Mati认为语音代理的情感智能和公民服务、教育等被忽视的应用领域存在重大机会。
  • 两位波兰童年好友于2022年创立ElevenLabs,灵感来源于波兰外国电影只有单一配音的糟糕体验。
  • 语音代理正从客户支持扩展到创收型销售、咨询业务,以及公民服务(如乌克兰政府热线)。

Training Data

17:05 ·

查看摘要

已加载全部内容