2026-06-11 reinforcement-learning
Sutton 说监督学习的生成式 AI 做不出新发现:这个判断站得住一半
Sutton 把发现拆成变异、评估、选择性保留三步,断言纯生成式 AI 缺了评估这一环。论点的内核是对的,但他自己列的反例已经拆掉了对 LLM 路线的那部分结论。
阅读全文High-signal frontier AI context tagged with llm-limits.
Sutton 把发现拆成变异、评估、选择性保留三步,断言纯生成式 AI 缺了评估这一环。论点的内核是对的,但他自己列的反例已经拆掉了对 LLM 路线的那部分结论。
阅读全文