AI 没省掉活,只是把「做」换成了「盯」:botsitting 与生产力悖论

Glean 报告说白领每周花 6.4 小时看管 AI。87% 的人在用、75% 觉得更高效,只有 13% 说公司因此表现更好。这道缺口被谁吃掉了。

AI 没省掉活,只是把「做」换成了「盯」:botsitting 与生产力悖论
图 / Unsplash

概述

Glean 旗下 Work AI Institute 联合 Notre Dame、Stanford、UC Berkeley 等校的研究者,在 2025 年 12 月到 2026 年 1 月调查了美、英、澳三国 6000 名以电脑或数字工具为主要工作方式的全职员工。报告抛出一个新词 botsitting,指为了让 AI 真正有用而必须做、却常被忽视的工作:喂上下文、核对输出、调试错误、清理残局。测算下来,白领平均每周花 6.4 小时在这件事上,接近一个完整工作日。

报告同时摆出一组拧巴的数字:87% 的受访者说自己在工作中用 AI,75% 说 AI 让他们更高效,但只有 13% 说所在组织因为 AI 显著表现更好。个人口径一片向好,组织口径几乎没动。这就是它要讲的生产力悖论。

我的判断是:这份报告的信号值得认真对待,但别把它当成「AI 没用」的判决书。它真正有价值的地方,是给出了一个被普遍忽略的解释变量:省下来的时间没有凭空消失,而是被一类没人计入的隐形工作吃掉了。对正在评估 AI 投入产出的团队来说,该改的不是用不用 AI,而是用哪个口径算账、以及把哪些活摆到台面上。

争的是什么

表面上争的是一个老问题:AI 到底有没有提升生产力。但这份报告的价值恰恰在于它把这个笼统的问题拆成了三层,而争论往往卡在不同层上各说各话。

第一层是口径之争:个人 vs 组织。75% 的人体感更高效,这是真的;只有 13% 的组织表现显著更好,这也是真的。两个数字不矛盾,它们量的根本是不同的东西。个人口径量的是「我完成单个任务是不是更快了」,组织口径量的是「公司的产出、营收、交付是不是更好了」。乐观派抓着前者说 AI 已经兑现,怀疑派抓着后者说投入打了水漂。真正的问题是中间的传导环节断在哪。

第二层就是 botsitting 要回答的:省下来的时间去哪了。报告的解释是,它被新冒出来的看管工作消化掉了。员工现在花大量时间在不互通的 AI 系统之间搬运信息、修错、补上本该内置的上下文,用报告的话说,成了「彼此配合不好的技术之间的人肉中间件」。任务层面省下的每一分钟,可能在系统层面又被吐了回去。

第三层是该不该计入:botsitting 算不算正经工作量。报告作者之一、Work AI Institute 负责人 Rebecca Hinds 在播客上把这类活描述为「常常枯燥」「累人」,而且「组织内部既不奖励、也不被珍惜、不被追踪、不被衡量,当然也不被激励」。这是最尖锐的一刀:一份占掉近一个工作日的劳动,在所有管理指标里是隐形的。它不进绩效、不进排期、不进成本核算,于是从账面上看,AI 既省了时间又没增加成本,组织绩效却莫名不动。悖论由此而来。

谁更有理

我的判断:报告在解释「缺口去哪了」这件事上更有理,但它给的还是一个机制假说,不是已经证实的因果定论。

先说为什么它更有理。生产力悖论本身不是新鲜事,上世纪八九十年代 IT 投资和企业产出对不上时就被反复讨论过。这份报告的贡献,是为当下这一轮 AI 版本提供了一个具体、可操作的解释变量:隐形的看管劳动。它不靠「AI 不行」这种情绪化结论,而是指出价值传导链上有一个被系统性漏算的环节。这比单纯唱多或唱空都更接近建设者的真实处境。很多团队确实感觉「人人都说 AI 提效,可季度数字没反应」,botsitting 给了这种困惑一个落点。

报告里有两个细节让这个机制更可信。一是它把矛头指向了人员流失:花在看管上的时间占比异常高的员工,主动找下家的概率高出 73%。隐形劳动不只是吃掉效率,还在悄悄赶走人。二是 Hinds 提到的一个反讽:有些岗位被要求把自己最享受的部分自动化掉,比如本来靠建立关系获得意义的客服,现在被要求转去盯 AI agent。如果这成立,那 AI 不只是没提升组织产出,还在腐蚀让人留下来的那部分工作。

再说为什么要保留余地。这是一份由 AI 公司旗下机构主导的调查,而它给出的解药,恰好是「在 AI 周围做更多功课」,帮员工接上对的上下文、定清楚「什么算好」、建立判断力。这套话术和 Glean 自己卖的企业 AI 平台高度同构,利益相关不能不提。6.4 小时这个数字是自报告问卷估算出来的,不是客观计时;87%、75%、13% 都来自同一份样本的主观回答。把它当成「行业正在发生什么」的强信号合理,把它当成「AI 不提升组织生产力」的铁证则过头了。单份报告说明不了因果,它只圈出了一个值得查的嫌疑人。

为何重要

对正在评估 AI 投入产出的 founder 和团队负责人,这份报告的实际用处不在那几个百分点,而在它逼你换一个算账口径。

如果你只用个人口径衡量 AI 收益,比如「工程师说写代码快了」「客服说回复快了」,你大概率会高估回报,因为你没把省下的时间在系统层面又被 botsitting 吃回去的部分扣掉。真正该测的是组织口径:交付周期、单位产出、营收,有没有因为 AI 动起来。两个口径之间的差,就是被隐形劳动吞掉的部分。

更实际的一步,是把 botsitting 显性化。它现在不进任何指标,所以你既看不到它的规模,也无法判断某个 AI 工具是净省时间还是净增负担。把「为这个工具喂上下文、核对、修错」的时间真的记下来,哪怕粗略估,你才有依据判断这笔投入到底划不划算。报告里那个反直觉结论值得抄作业:收益最大的组织,往往不是 AI 用得最多的,而是在 AI 周围功课做得最足的,尤其是肯花力气判断「哪些事压根不该交给模型」。

还有一条容易被忽略的成本:人。如果看管负担确实和离职意愿相关,那它就不是一次性效率损失,而是持续性的人才流失风险。一个被默默压上大量清理工作、还不被计入和奖励的团队,迟早会用脚投票。这部分代价不会出现在 AI 工具的账单上,但会出现在招聘和交接的账单上。

该忽略什么

忽略「AI 没用」这种被这份报告引出来、却不被它支持的结论。报告恰恰承认 75% 的人体感更高效、87% 的人在用,它质疑的是传导环节,不是 AI 本身。拿它去论证「别上 AI」是误读。

忽略 6.4 小时这个数字的精确度。它是问卷估算的群体平均,对你的团队没有直接参考意义,不同岗位、不同工具、不同成熟度差别会很大。该记住的是它指向的现象:看管成本真实存在且常被漏算,而不是这个具体数。

也忽略「botsitting」这个标签本身的新鲜感。给一类一直存在的隐形劳动起个名字有传播价值,但名字不改变事情的本质。重要的不是有没有这个词,而是你有没有在自己的口径里把这部分活算进去。当一家 AI 公司同时定义了问题(botsitting)和解药(在 AI 周围做更多功课、用更好的上下文平台),你接受问题诊断的同时,对解药要多留一分独立判断。

常见问题

botsitting 是什么意思

Glean 报告作者造的词,指为了让 AI 真正可用而必须做、却常被忽视的工作:喂上下文、核对输出、调试错误、清理残局。报告测算白领平均每周花 6.4 小时在这件事上,接近一个完整工作日。它的特点是没人计、没人奖、没人测。

AI 真的提升组织的生产力了吗

按这份报告,个人和组织两个口径对不上。75% 的受访者说 AI 让自己更高效,但只有 13% 说所在组织因 AI 显著表现更好。换句话说,个人体感的效率提升,目前大面积没能转化成公司层面的绩效。这道缺口正是生产力悖论。

为什么用了 AI 公司绩效却没起色

报告给的解释是:省下来的时间被新冒出来的看管工作吃掉了。员工在不互通的 AI 系统之间搬运信息、修错、补本该内置的上下文,成了工具之间的人肉中间件。这部分劳动不进任何指标,于是账面上看不到回报。

该怎么减少 botsitting

报告的反直觉结论是:收益最大的组织不是用更多 AI,而是在 AI 周围做更多功课,帮员工拿到对的上下文、教会怎么用、把「什么算好」的标准定清楚,并判断哪些事压根不该交给模型。先把看管工作显性化、计入工作量,再决定投不投更多模型。

来源

  1. “看管 AI 的人”兴起:打工人每周花 6.4 小时 botsitting(Business Insider) / news

无官方一手源;本文基于可靠二手报道(具名媒体、交叉印证)写成。