llm-limits analysis | The Context

2026-06-11 reinforcement-learning

Sutton 把发现拆成变异、评估、选择性保留三步,断言纯生成式 AI 缺了评估这一环。论点的内核是对的,但他自己列的反例已经拆掉了对 LLM 路线的那部分结论。