2026-06-11 google-deepmind
DeepMind 下场投多 agent 安全:单体对齐管不住的那块,正式被承认了
DeepMind 联合四家机构发起最高 1000 万美元的多 agent 安全研究资助。真问题不在单个模型对不对齐,而在一群各自对齐良好的 agent 凑到一起时涌现的协同失效。
阅读全文High-signal frontier AI context tagged with ai-safety.
DeepMind 联合四家机构发起最高 1000 万美元的多 agent 安全研究资助。真问题不在单个模型对不对齐,而在一群各自对齐良好的 agent 凑到一起时涌现的协同失效。
阅读全文