2026-06-11

Sloppenheimer:亚马逊员工群嘲自家 AI,才是落地最诚实的信号

员工在 Slack 把公司 AI 的产出叫「slop」、给它起外号「Sloppenheimer」。这不是抱怨,是自上而下强推 AI 的公司在批量制造合规式假用的证据。

概述

亚马逊员工在 Slack 上有一个专门的频道,用来吐槽和互相调侃公司的 AI 编程工具,把它的产出直接叫「slop」(糊弄出来的垃圾),还给它起了个外号「Sloppenheimer」。这是 404 Media 的报道。同一篇报道的对照是:创始人贝索斯相信 AI 会带来空前的生产力跃升,让食物、住房更便宜,甚至让双职工家庭觉得不再需要两份收入。

顶上是宏大叙事,底下是群嘲。这条裂缝才是值得读的东西。我的判断是:在一家自上而下强推 AI 的公司里,员工的群嘲不是负能量噪音,而是落地质量最诚实的反馈信号,它比任何官方采用率数字都可信。当推动 AI 的动力来自管理层的指标、而非工具本身好用,公司收获的往往就不是真实采用,只是合规式的假用:为了过线去点一下,产出照旧是 slop。把「Sloppenheimer」读成员工觉悟低,会错过真正的信息;把它读成产品和推法都出了问题,才读对了。

这步棋

要看清这步棋,先分清三层事实,严格区分哪些有据、哪些是社区说法。

有公开报道支撑的部分很短:亚马逊员工建了吐槽 AI 的 Slack meme 频道,把公司 AI 编程产品的产出称作 slop,并嘲笑公司「激励员工有效使用 AI 工具」的尝试失败了。报道的措辞点出了关键动作:公司这一侧是在「激励员工去用」,也就是采用是被推动的,而不是自发的。报道同时摆出贝索斯的生产力愿景作为对照,落差是这篇报道的主轴。

来自 Hacker News(196 赞)的部分是社区自述,只能当参考、不能当定论。几位自称在 AWS 工作的人描述了内部工具的混乱现状:曾有一个很难用的内部自研大模型工具;不少人转用亚马逊自家的 Kiro,有人说它已是内部事实标准;Claude Code 是近期才拿到;还在弄一个不回传数据的定制 Codex 变体;全公司没有统一规定该用哪个工具,各团队采用程度和技术栈都不一样。有人抱怨有 token 预算限制要找老板申请,也有人说没遇到预算限制。对 Kiro 的评价两极:有人用得顺,有人骂它是用过最差的 harness、却被当印钞机硬卖给不懂行的企业客户。

把这两层叠起来,这步棋的形状就清楚了:一家公司在最高层把 AI 定成生产力革命的旗帜,在执行层却没有统一好用的工具、把「用起来」当成要去激励的任务,结果在最底层收获了一个 meme 频道。这不是某个工具的孤立失败,是「先定目标、再让现实来对齐目标」这种推法的典型产物。

真实动机

表面理由很体面:公司希望员工用上 AI、提高生产力,这听起来天经地义。但报道里那个细节出卖了真实动机,公司是在「激励员工去有效使用」AI 工具。需要被激励的采用,本身就说明工具没有靠好用赢得采用。

真实动机是采用率本身成了目标。当一家公司把 AI 当成战略叙事对外讲、对内推,采用数字就变成必须好看的 KPI。一旦如此,激励、考核、甚至软性施压就会跟上,而员工的理性反应是用最低成本满足指标:开一次工具、跑一个 prompt、留下一条使用记录,数字达标,产出还是 slop。这就是合规式假用,采用率上去了,真实价值没上去。群嘲频道恰恰是这种错配憋出来的出口:被要求假装一个不好用的东西好用,人会用调侃来消化这种别扭。

更深一层的动机,Hacker News 上有人说得直白:股东想让公司搞清楚怎么少雇人、怎么给现有的人降技能、压薪资。这是社区观点不是事实,但它点出了为什么强推会让人本能抵触,当员工怀疑这套工具的终点是替代或贬低自己时,「用起来」就不再是中性的效率工具,而成了一件政治化的事。技术上好不好用,和情绪上愿不愿用,在这里被绑在了一起。

谁被威胁

第一个被威胁的是官方采用率指标的可信度。只要存在一个员工自发建立的群嘲频道,任何漂亮的内部采用数字都得打个问号:那些使用记录里,有多少是真在干活,有多少是为了过线点一下?对任何一家把内部 AI 采用率当成进度汇报的公司,「Sloppenheimer」都是个提醒,你的仪表盘可能正在测量合规,而不是价值。

第二个被威胁的是亚马逊把 AI 当生产力革命的对外叙事。贝索斯描绘的是食物住房更便宜、家庭可以不靠两份收入的图景;员工交付的现实是一个吐槽产出质量的频道。这种内外背离一旦被报道出来,叙事的说服力就受损,因为最有资格评判工具好不好用的,恰恰是天天被要求用它的那批人。

第三个被威胁的,是把「内部强推」当默认打法的整个管理思路,这一点超出亚马逊。404 Media 此前还报道过谷歌员工内部分享吐槽自家 AI 不行的 meme,而谷歌 CEO 对外说公司 75% 的代码由 AI 生成。两家公司、同一种裂缝:高层对外报喜,基层私下吐槽。被威胁的不是某一家,是「自上而下下指标、用激励催采用」这套打法的有效性本身。

该忽略什么

别把这件事读成员工懒、抵触新技术、跟不上时代。会建专门的 meme 频道、会精准吐槽产出质量的工程师,通常恰恰是对工具最在行、要求最高的那群人。把群嘲解读成觉悟问题,是管理层最舒服、也最危险的误读,它让你忽略真正的信号:产品不够好,推法有问题。

也别把它过度解读成「亚马逊的 AI 全面失败」或「企业 AI 不行」。报道确认的是一个内部编程产品的产出被叫 slop、缺统一标准、采用要靠激励,这是落地和管理的问题,不等于 AI 在亚马逊毫无价值,也不等于别家公司必然如此。Hacker News 上同一拨人里,既有人骂 Kiro,也有人说 Claude Code 在内部用得不错。工具之间差别很大,把个案上升成对整个企业 AI 的判决,是另一种偷懒。

最后,别只把它当成一条好笑的八卦。「Sloppenheimer」这个外号会传播,但真正值钱的不是段子,是它暴露的机制,当采用被设成目标、由激励驱动,你大概率买到的是假用,不是采用。这条机制对每一家正在内部强推 AI 的公司都成立。

对建设者的影响

如果你在公司内部负责推 AI 工具,最该改的一件事是别把采用率设成 KPI。一旦采用本身成了被考核、被激励的目标,你测到的就是合规,不是价值;员工会用最低成本满足数字,产出仍是 slop。把指标换成结果,某个真实任务的耗时、返工率、交付质量,有变化才算数,而不是有多少人开过工具。

第二,把群嘲当成最高优先级的产品反馈,而不是要压下去的负面情绪。一个员工自发的吐槽频道,是你能拿到的最便宜、最诚实的可用性测试。去读他们具体在骂什么,产出质量、上下文不够、还是流程不顺,那里有明确的修复清单。压制只会让信号转入地下,问题不会消失。

第三,先解决工具好不好用,再谈推广。亚马逊的教训不是不该用 AI,而是在没有统一、靠谱、真能省事的工具之前就开始催采用,顺序反了。给工程师一个用了真省事的东西,采用根本不需要激励,他们会自己用,自己安利。需要被激励才肯用的工具,问题在工具,不在人。

常见问题

员工为什么会抵触公司强推的内部 AI 工具?

因为推动力来自管理层的采用率目标,不来自工具真能省事。当公司「努力激励员工有效使用 AI 工具」却失败、产出被员工自己叫 slop 时,抵触的就不是 AI 本身,而是被要求假装一个不好用的东西好用。亚马逊内部还没有全公司统一的工具标准,各团队各用各的,被迫用的那部分人怨气最重。

企业 AI 采用率指标可信吗?

当采用本身被设成 KPI 时,指标会先于体验被满足。员工可以为了过线去开一次工具、跑一个 prompt,数字漂亮,实际产出仍是 slop。亚马逊这个案例里,官方叙事是贝索斯式的生产力跃升,内部信号是群嘲频道,两者背离时,后者更接近真相。

Kiro 在亚马逊内部口碑到底如何?

公开报道只确认了产出被叫 slop、有专门吐槽频道。Hacker News 上几位自称 AWS 员工的说法不一致:有人说 Kiro 是内部事实标准、用得还行,也有人骂它是「用过最差的 harness」、却被当成印钞机卖给不懂行的企业客户。结论是内部口碑分裂,别把任何单一说法当定论。

来源

无官方一手源；本文基于可靠二手报道（具名媒体、交叉印证）写成。