返回首页播客摘要节目时长 · 41:11

5月27日 周三 · 16:28

我们用AI实现全面自动化,员工规模却扩大了三倍

Original title · We Automated Everything With AI and Tripled Our Headcount

播客中文摘要全文翻译
TL;DR
这期讲了什么

本期播客中,Every联合创始人兼CEO丹·西克与COO布兰登讨论了丹发表的文章《自动化之后》。尽管Every是典型的AI原生公司,大量使用AI代理,但公司规模从GPT-3发布时的4人增长到现在的30人并继续招聘。丹认为,AI使专家能力变得廉价和普及,产生了大量"接近但不正确"的内容,这反而增加了对专家的需求——需要专家来完善和指导这些工作。核心观点是:AI代理离人类越远,价值越低。代理需要人类不断指引"下一步该做什么",即使达到AGI,这一基本动态也不会改变,因为AI代理本质上是为人类服务的工具。

本期你会听到
本期你会听到
  • 尽管高度依赖AI代理,Every的团队规模从GPT-3时代的4人扩大到30人,证明自动化并未取代人类工作
  • AI使专家能力变得廉价普及,产生了大量"接近但不完美"的内容,反而增加了对专家的需求
  • 人机协作循环至关重要——AI代理需要人类不断指引"下一步该做什么"
  • 即使达到AGI,AI代理仍将是被人类定义的工具,人类判断什么是真正有价值的这一核心不会改变
对话逐字稿
对话逐字稿

中文逐字稿

00:0000:06Speaker 1

你让AI去做某件事,它超出了你的预期。你感到自己很渺小。你觉得,天哪,这家伙要抢走我的工作了。Speaker 1 | 00:07 - 00:11 然后它突然不工作了,看着你说,接下来我该做什么?Speaker 2 | 00:11 - 00:47 AI代理离人类越远,它的价值就越低。如果你就依赖模型本身,你会没事的。如果你关心的是领导一个真正有野心的人生,我真的认为这会让更多人有可能做到这一点。Every是你保持在AI前沿所需要的唯一订阅。如果你关心掌握最新的模型和使用最新的工具,你必须订阅Every,从噪音中分离出真正的信号。Speaker 1 | 00:47 - 00:55 访问every.com今天就订阅。所以我们在这里是因为我们要换一种方式。我要来采访丹Speaker 2 | 00:55 - 00:55 Sick。Speaker 1 | 00:56 - 01:08 关于他昨天5月21日发表的文章,我们要试着理解他为什么写这篇文章,理解他背后的逻辑。这里面会有一些冲突。我要在这一点上和他争论。Speaker 2 | 01:08 - 01:09 好的,让我们开始争论吧。Speaker 1 | 01:09 - 01:21 然后带入一些我的观点,这些观点或多或少是相似的,但我们试着理解,这篇文章在十年后、五年后能否反映未来?Speaker 2 | 01:21 - 01:22 等等,你是谁来着?Speaker 1 | 01:23 - 01:29 我是布兰登。我是COO,就这些。Speaker 2 | 01:29 - 02:25 所以这篇文章叫《自动化之后》,它来自我的一种感觉,有一个视频讲这个,也有一篇文章,但只是给没看过的人说一下,它来自我的这种感觉,在Every,我们是最接近AI原生、代理原生的公司。你在Slack里随便挥个棒子,打中的人和打中的代理概率一样高。每个人每天都在使用Cloud Code、Codex和所有这些工具来工作。但感觉有更多的人工工作要做,而且实际上,自GPT-3发布以来,我们从4个人增长到30个人,现在还在招聘。所以这来自我观察这个情况,然后看看外部环境,心想,到底是怎么回事?Speaker 2 | 02:25 - 03:14 因为整个信息环境,如果你看看达里奥,他到处说大约一半的入门级白领工作可能会消失。甚至像Ken Griffin这样的人物,你能看出他刚经历了一个时刻,有人向他展示了一个AI在做高级数据分析或金融问题。他当时的表情像是,天哪,这是我愿意付博士工资让他们做的事情。而它就这么完成了。我感觉自己看到很多人,他们可能没有太多与代理打交道的经验,也不太了解我们三年来一直在报道的这条改进曲线,现在他们第一次遇到了(AI的这些能力),然后就得出了各种结论:哦天哪,所有工作都要消失了,我们不会有工作了。Speaker 2 | 03:14 - 04:12 我只是坐在这里想,实际上,你第一次看到这种技术时的直觉通常是非常不准确的。我们多年来一次又一次地看到这种情况,EVRI是风向标的好去处,因为它是早期采用者的聚集地,我们内部有各种岗位在做各种工作,如果某件事在这里有效,那么它很可能会传播到与我们业务相邻的其他企业。所以当我环顾Every,我看到大量的自动化,我也看到更多的人类工作。所以我真的想说的是,这篇文章在说:这是代理时代工作的现状,然后拆解这个悖论——更多的自动化是否意味着更多的工作?Speaker 1 | 04:13 - 04:54 是的,当我读这篇文章时,里面没有明确的行动号召,但我感觉到了这种号召:在一个充满悲观论者的世界里,实际上有大量的希望,这就是原因。但我一开始就问你一个反方问题,就在文章发表前几个小时,ClickUp的CEO发了一条长推文,说他为什么裁员了8000人还是3000人来着。Speaker 2 | 04:54 - 04:56 我觉得不是8000。Speaker 1 | 04:56 - 05:04 是20000。我觉得是3000,好像是他员工总数的22%。Speaker 2 | 05:04 - 05:08 我觉得不是几千人,但确实是他很大一部分员工。Speaker 1 | 05:08 - 05:50 所以我的问题是:在一个像Every这样飞速增长的公司里,你写的东西对我来说很有意义。你写的在理论上也很有意义,AI现在还不是自主的,它必须被告知该做什么,而且需要被检查,我们需要你说的文章里描述的那种"三明治"模式。但在一个8000人、10000人的成熟企业里,他们已经建立了管理SOP、管理业务的方式,这篇文章和这个论点仍然成立吗?Speaker 2 | 05:50 - 06:00 这是个很好的问题。这里有几个不同的问题。首先我想做的是阐明论点。为什么自动化会产生更多工作?Speaker 1 | 06:00 - 06:06 我相信很多听的人也没读过,所以花点时间详细解释一下。Speaker 2 | 06:06 - 06:53 我会的。基本上,这个想法是AI的工作方式和它在职场中的运作方式是:AI让昨天的专家能力变得廉价。我的意思是,AI是根据我们所有的产出训练的——所有写过的代码、文章、设计、决策,所有写过的东西。它让每个人都能以非常便宜的价格获取这些。以前需要专家解决的问题,现在任何会提示词的人都能用它来解决编程问题、构建应用、写文章像我这样、写报告、做YouTube缩略图。Speaker 2 | 06:54 - 07:08 有趣的是,当你这样做的时候,专家能力变得廉价,它会被广泛采用。所以每个人都开始这样做。我们在公司内部看到这种情况。每个人都在做很烂的请求。Speaker 1 | 07:08 - 07:08 有很多垃圾请求。Speaker 2 | 07:08 - 07:09 是的。工程师们在写文章,非专家在做以前只有专家才能做的事情。这对专家来说感觉很威胁。他们想,好吧,那我的工作会变成什么?Speaker 2 | 07:28 - 08:08 有趣的是,因为这些工具是根据产出训练的,根据昨天的数据训练的,它们用默认提示词生成的东西看起来都差不多,而且对于当前情况来说都有点对,但并不完全对。所以发生的事情是你用大量接近但不太正确的东西淹没了这个领域,然后你需要基本上Speaker 1 | 08:09 - 08:19 Every也有很多这种情况。很多人看起来在做很棒的工作,但当你深入了解时,你会说,这不完全正确,也许专家应该做Speaker 2 | 08:19 - 08:22 没错。举个例子。Speaker 1 | 08:26 - 08:37 我从没见过这种情况。我们所有人。我推了多少PR?我个人经历。我推了那么多PR,我说,Willie,我真的不知道这能不能工作,但给你了,他说Speaker 2 | 08:37 - 08:38 闭嘴。Speaker 1 | 08:38 - 08:42 嗯,他像是在说,这是个好主意,但我完全重写了Speaker 2 | 08:42 - 08:43 是的。是的。是的。完全是这样。Speaker 2 | 08:43 - 09:16 所以这就是我说的那种情况。有点像对了,接近了,但实际不完全对,你需要一个人,一个专家来真正搞清楚。但有趣的是,当你用所有这些类似的东西淹没了领域,以前因为是专家能力所以很昂贵的东西现在变得廉价了,现在它看起来都一样,所以一切都贬值了。你得到这种以前非常昂贵的东西的过剩,看起来像是工作——代码、文章之类的——但它都很相似,而且都不太适合具体情况,所以它的价值低了很多。是直接变低了。Speaker 2 | 09:18 - 10:17 然后发生的事情是你实际上需要更多专家进来帮助处理这些非专家正在产生的东西,你有好的想法,例如,但现在非常需要专家来帮忙把这些东西推进到最终完成。这通常看起来像是专家们被需求来构建系统,把那些现在每个人都能产生的初级工作塑造成真正有用的东西。举个例子,我们有仓库规则和审查指南之类的东西,所以在你看到PR之前,在Willie看到PR之前,希望它已经通过了很多流程来确保它实际上是相当不错的。在编辑方面我们也有同样的东西——为这些系统建设。然后也有很多专家需求,因为现在门槛高了很多,专家可以使用这些工具,用这些工具创造出以前根本不可能创造的东西。我们一直在这样做。Speaker 2 | 10:17 - 11:04 就像我们有Kieran,他在一两个月内从头到尾构建了整个收件箱,那完全是不可能的事情。所以发生的事情是,即使你在自动化,自动化产生了一堆工作,这些工作都是还行的,都相当不错。但所有这些工作都非常非常相似,而且都不太适合实际情况,这增加了对专家的需求,专家可以让它真正变好,让它真正不同,让它真正适合现在的实际情况。我觉得这是人们不太理解的事情,特别是当他们第一次遇到一个能做某事的语言模型或代理时,他们看到了它,他们说,天哪。它就是能做到一切。Speaker 2 | 11:04 - 11:26 最后的事实是,它非常非常好。太神奇了。它完全改变了我们的工作方式。我们目前在Everi的经验是,AI代理离人类越远,它的价值就越低。人类与代理的联系,实际上是做工作最重要的东西,这是让它良好运作的关键。Speaker 1 | 11:28 - 12:23 专家比以往任何时候都更重要,因为他们为代理做惊人的工作奠定了基础,然后你才能让其他人真正利用那个代理,做能让他们提升的工作。有那么一刻,我们在思考这篇文章,丹在起草这篇文章时,标题是《潮水在上涨》,那是在试图传达这个想法——潮水在上涨。我们都能做更多工作,做更好的工作,但我们的眼睛,不管你是不是某个领域的专家,总是略高于那条水位线。在文章结尾你描述的地方我很欣赏,呃。是阿基里斯吗?Speaker 1 | 12:23 - 12:48 是阿基里斯。阿基里斯。根据芝诺悖论,这不应该发生。但在这种情况下,实际上确实发生了。提示AI做某事,它超出了你的预期,你觉得自己很渺小,你觉得,天哪,这家伙要抢走我的工作了,然后它停止工作了,它看着你说,接下来我该做什么?Speaker 1 | 12:49 - 13:04 我认为这是直到我们弄清楚AGI,而且可能即使在那之后,很长很长一段时间以后,它可能仍然会看着我们,问我们要方向。Speaker 2 | 13:04 - 13:44 这基本上就是论点的核心,因为我想你可以说,哦是的,哦是的,丹,也许现在专家需求增加是真的,但这些东西会变得足够好,以至于不会。你看看基准测试就知道了。文章有一大段关于,如果你真的看基准测试,它们在指数级改进。但同时,当你仔细看时,一旦你让一个基准饱和了,你很容易就能超越它。你很容易找到一个新框架,让模型做某种稍微更大一点、更宽一点的问题,这样就能把之前的饱和基准清零。Speaker 2 | 13:44 - 14:10 所以虽然它确实在指数级进步,但这并不意味着它等同于人类能力。这实际上是一个非常困难的问题。其中一个原因是,任何你说自己能做到而模型做不到的事情,一旦被说出来,一旦被具体说明,模型就可以逐步改进它。模型会在这方面做得更好。Speaker 2 | 14:11 - 15:24 我们犯了一个奇怪而微妙的错误,我们确定了一组任务,我们说,这就是人类能做的全部,这就是人类能做的而模型不能做的,然后模型做得更好了,然后你说,天哪,我该怎么办?错误在于,实际上你做的很多事情是无法被表达的,无法用清晰的框架来阐述的,所以每次你试图这样做,你就会有点慌张和困惑。如果你退后一步看,区分人类和代理的根本事情是,我们构建代理是为了做我们想让它们做的事情。无论它们变得多强大,所有的经济、心理和其他方面的以及技术力量都在推动AI的进步,朝着一个方向发展——无论它做什么,它都会回头看你,决定你想做什么,什么是有价值的。即使我们达到AGI,理论上AGI也会这样做。Speaker 2 | 15:24 - 15:59 我们以为它不会,所以我们不会构建它。而这保持了人类和AI之间的差距。我认为一个很好的例子是,能非常好地做一项任务的东西和有自己的自我驱动想要做的事情的东西之间的区别。养个孩子。Codex可以。Speaker 2 | 16:00 - 16:29 我不知道,Codex写报告比Isaiah强多了。但Isaiah有非常强烈的欲望和需求。你可以试着让他做你想让他做的事,有时会有效。但同时,他就是这样一个人,他会自我生成过程,做他想做的事,如果你用过这些工具,你知道它们不是被设计成那样工作的。它们可以稍微推回来一点,但它们没有这种。Speaker 2 | 16:29 - 17:03 这和人类的那种'我就想做这个因为我喜欢'的调皮实验精神差得很远,而且,再说一次,我们进入了我说人类和模型是不同的领域。Again,这些是你一旦清楚地表达它们,模型就能做的事情,但你必须接受一个事实:你有一些你能做的事情,有一些你是这样的人,但你无法完全表达。嘿,我是Dan。我们都同意住房很贵。无论你是租房还是付房贷,不管你付哪种,每个月都让人心疼。Speaker 2 | 17:03 - 17:20 但Built可以让这感觉好一点。让我解释一下。Built让你在房租上赚取奖励,现在你也可以在房贷上赚取奖励了。每次住房支付都会给你积分,你可以用积分换机票、Lyft乘车。机票你可以兑换...