ai-safety analysis | The Context

2026-06-11 google-deepmind

DeepMind 联合四家机构发起最高 1000 万美元的多 agent 安全研究资助。真问题不在单个模型对不对齐,而在一群各自对齐良好的 agent 凑到一起时涌现的协同失效。