STAR-PólyaMath 在八大顶级数学竞赛基准上全部取得最优成绩,其中 AIME 2025/2026、Putnam 2025、HMMT 2026 获得满分,在最难的 MathArena Apex 2025 上领先同基座的 GPT-5.5 模型达 ...
清华大学与微软亚洲研究院的研究团队提出了一个推理多智能体系统 STAR-PólyaMath,在 LLM 外部构建了一套完整的探索-推理-验证框架(harness),通过协调 Reasoner、Verifier 和 Meta-Strategist 三个智能体角色,循环驱动长程证明,使推理过程变得可验证、可回溯,实现 ...
搭配 “all but” 的用法 Episode 251008 / 08 Oct 2025 Listen to this programme and your English problems will be all but solved!