AI will soon be running large parts of our lives, autonomously and sometimes without human guidance or ownership. How do we ...
验证:这是最核心的一步。让写代码的AI给自己打分,它只会盲目自我赞美。因此,必须引入一个完全独立的、默认持怀疑态度的「评估者」智能体来挑错。 让 AI 自己给自己打分,它几乎总会夸自己,因为它脑子里装着自我说服链条。而解法,就是引入一个独立的评估 Agent,默认假设代码是坏的。