中国科学技术大学团队针对上述评估盲区提出了PTE(Prefill Token Equivalents)指标。该指标从硬件执行特性出发,将内部推理与外部工具调用的成本统一到同一物理单位,并基于该指标识别出四种典型的低效推理模式。实验结果表明,准确率与推理成本并非正相关,错误推理路径的硬件成本往往高于正确路径。该成果已收录至 ACL 2026。
这项由密苏里科技大学与德雷塞尔大学联合开展的研究,于2026年6月以预印本形式发布在arXiv平台,编号为arXiv:2606.06843。研究团队系统性地分析了GitHub上超过三万五千条与AI工具相关的代码注释,时间跨度从2022年12月(ChatGPT首次发布)延续至2026年3月,是目前规模最大、时间跨度最长的AI辅助编程实证研究之一。说到AI写 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果