2026-06-13

AI 没省掉活,只是把「做」换成了「盯」:botsitting 与生产力悖论

Glean 报告说白领每周花 6.4 小时看管 AI。87% 的人在用、75% 觉得更高效,只有 13% 说公司因此表现更好。这道缺口被谁吃掉了。

ai-productivity future-of-work enterprise-ai ai-adoption

AI 没省掉活,只是把「做」换成了「盯」:botsitting 与生产力悖论 — 图 / Unsplash

概述

Glean 旗下 Work AI Institute 联合 Notre Dame、Stanford、UC Berkeley 等校的研究者，在 2025 年 12 月到 2026 年 1 月调查了美、英、澳三国 6000 名以电脑或数字工具为主要工作方式的全职员工。报告抛出一个新词 botsitting，指为了让 AI 真正有用而必须做、却常被忽视的工作：喂上下文、核对输出、调试错误、清理残局。测算下来，白领平均每周花 6.4 小时在这件事上，接近一个完整工作日。

报告同时摆出一组拧巴的数字：87% 的受访者说自己在工作中用 AI，75% 说 AI 让他们更高效，但只有 13% 说所在组织因为 AI 显著表现更好。个人口径一片向好，组织口径几乎没动。这就是它要讲的生产力悖论。

我的判断是：这份报告的信号值得认真对待，但别把它当成「AI 没用」的判决书。它真正有价值的地方，是给出了一个被普遍忽略的解释变量：省下来的时间没有凭空消失，而是被一类没人计入的隐形工作吃掉了。对正在评估 AI 投入产出的团队来说，该改的不是用不用 AI，而是用哪个口径算账、以及把哪些活摆到台面上。

争的是什么

表面上争的是一个老问题：AI 到底有没有提升生产力。但这份报告的价值恰恰在于它把这个笼统的问题拆成了三层，而争论往往卡在不同层上各说各话。

第一层是口径之争：个人 vs 组织。75% 的人体感更高效，这是真的；只有 13% 的组织表现显著更好，这也是真的。两个数字不矛盾，它们量的根本是不同的东西。个人口径量的是「我完成单个任务是不是更快了」，组织口径量的是「公司的产出、营收、交付是不是更好了」。乐观派抓着前者说 AI 已经兑现，怀疑派抓着后者说投入打了水漂。真正的问题是中间的传导环节断在哪。

第二层就是 botsitting 要回答的：省下来的时间去哪了。报告的解释是，它被新冒出来的看管工作消化掉了。员工现在花大量时间在不互通的 AI 系统之间搬运信息、修错、补上本该内置的上下文，用报告的话说，成了「彼此配合不好的技术之间的人肉中间件」。任务层面省下的每一分钟，可能在系统层面又被吐了回去。

第三层是该不该计入：botsitting 算不算正经工作量。报告作者之一、Work AI Institute 负责人 Rebecca Hinds 在播客上把这类活描述为「常常枯燥」「累人」，而且「组织内部既不奖励、也不被珍惜、不被追踪、不被衡量，当然也不被激励」。这是最尖锐的一刀：一份占掉近一个工作日的劳动，在所有管理指标里是隐形的。它不进绩效、不进排期、不进成本核算，于是从账面上看，AI 既省了时间又没增加成本，组织绩效却莫名不动。悖论由此而来。

谁更有理

我的判断：报告在解释「缺口去哪了」这件事上更有理，但它给的还是一个机制假说，不是已经证实的因果定论。

先说为什么它更有理。生产力悖论本身不是新鲜事，上世纪八九十年代 IT 投资和企业产出对不上时就被反复讨论过。这份报告的贡献，是为当下这一轮 AI 版本提供了一个具体、可操作的解释变量：隐形的看管劳动。它不靠「AI 不行」这种情绪化结论，而是指出价值传导链上有一个被系统性漏算的环节。这比单纯唱多或唱空都更接近建设者的真实处境。很多团队确实感觉「人人都说 AI 提效，可季度数字没反应」，botsitting 给了这种困惑一个落点。

报告里有两个细节让这个机制更可信。一是它把矛头指向了人员流失：花在看管上的时间占比异常高的员工，主动找下家的概率高出 73%。隐形劳动不只是吃掉效率，还在悄悄赶走人。二是 Hinds 提到的一个反讽：有些岗位被要求把自己最享受的部分自动化掉，比如本来靠建立关系获得意义的客服，现在被要求转去盯 AI agent。如果这成立，那 AI 不只是没提升组织产出，还在腐蚀让人留下来的那部分工作。

再说为什么要保留余地。这是一份由 AI 公司旗下机构主导的调查，而它给出的解药，恰好是「在 AI 周围做更多功课」，帮员工接上对的上下文、定清楚「什么算好」、建立判断力。这套话术和 Glean 自己卖的企业 AI 平台高度同构，利益相关不能不提。6.4 小时这个数字是自报告问卷估算出来的，不是客观计时；87%、75%、13% 都来自同一份样本的主观回答。把它当成「行业正在发生什么」的强信号合理，把它当成「AI 不提升组织生产力」的铁证则过头了。单份报告说明不了因果，它只圈出了一个值得查的嫌疑人。

为何重要

对正在评估 AI 投入产出的 founder 和团队负责人，这份报告的实际用处不在那几个百分点，而在它逼你换一个算账口径。

如果你只用个人口径衡量 AI 收益，比如「工程师说写代码快了」「客服说回复快了」，你大概率会高估回报，因为你没把省下的时间在系统层面又被 botsitting 吃回去的部分扣掉。真正该测的是组织口径：交付周期、单位产出、营收，有没有因为 AI 动起来。两个口径之间的差，就是被隐形劳动吞掉的部分。

更实际的一步，是把 botsitting 显性化。它现在不进任何指标，所以你既看不到它的规模，也无法判断某个 AI 工具是净省时间还是净增负担。把「为这个工具喂上下文、核对、修错」的时间真的记下来，哪怕粗略估，你才有依据判断这笔投入到底划不划算。报告里那个反直觉结论值得抄作业：收益最大的组织，往往不是 AI 用得最多的，而是在 AI 周围功课做得最足的，尤其是肯花力气判断「哪些事压根不该交给模型」。

还有一条容易被忽略的成本：人。如果看管负担确实和离职意愿相关，那它就不是一次性效率损失，而是持续性的人才流失风险。一个被默默压上大量清理工作、还不被计入和奖励的团队，迟早会用脚投票。这部分代价不会出现在 AI 工具的账单上，但会出现在招聘和交接的账单上。

该忽略什么

忽略「AI 没用」这种被这份报告引出来、却不被它支持的结论。报告恰恰承认 75% 的人体感更高效、87% 的人在用，它质疑的是传导环节，不是 AI 本身。拿它去论证「别上 AI」是误读。

忽略 6.4 小时这个数字的精确度。它是问卷估算的群体平均，对你的团队没有直接参考意义，不同岗位、不同工具、不同成熟度差别会很大。该记住的是它指向的现象：看管成本真实存在且常被漏算，而不是这个具体数。

也忽略「botsitting」这个标签本身的新鲜感。给一类一直存在的隐形劳动起个名字有传播价值，但名字不改变事情的本质。重要的不是有没有这个词，而是你有没有在自己的口径里把这部分活算进去。当一家 AI 公司同时定义了问题（botsitting）和解药（在 AI 周围做更多功课、用更好的上下文平台），你接受问题诊断的同时，对解药要多留一分独立判断。

常见问题

botsitting 是什么意思

Glean 报告作者造的词，指为了让 AI 真正可用而必须做、却常被忽视的工作：喂上下文、核对输出、调试错误、清理残局。报告测算白领平均每周花 6.4 小时在这件事上，接近一个完整工作日。它的特点是没人计、没人奖、没人测。

AI 真的提升组织的生产力了吗

按这份报告，个人和组织两个口径对不上。75% 的受访者说 AI 让自己更高效，但只有 13% 说所在组织因 AI 显著表现更好。换句话说，个人体感的效率提升，目前大面积没能转化成公司层面的绩效。这道缺口正是生产力悖论。

为什么用了 AI 公司绩效却没起色

报告给的解释是：省下来的时间被新冒出来的看管工作吃掉了。员工在不互通的 AI 系统之间搬运信息、修错、补本该内置的上下文，成了工具之间的人肉中间件。这部分劳动不进任何指标，于是账面上看不到回报。

该怎么减少 botsitting

报告的反直觉结论是：收益最大的组织不是用更多 AI，而是在 AI 周围做更多功课，帮员工拿到对的上下文、教会怎么用、把「什么算好」的标准定清楚，并判断哪些事压根不该交给模型。先把看管工作显性化、计入工作量，再决定投不投更多模型。

来源

“看管 AI 的人”兴起：打工人每周花 6.4 小时 botsitting（Business Insider） / news

无官方一手源；本文基于可靠二手报道（具名媒体、交叉印证）写成。