谷歌 GKE Labs 推出了开源项目 OpenRL,为在标准 Kubernetes 集群上对大型语言模型(LLM)进行后训练和微调提供一个自托管 API。 谷歌表示,OpenRL 将强化学习(RL)基础设施从 AI ...
大厂研发组织正在出现新的调整信号。 大厂研发组织正在出现新的调整信号。 根据“大厂日爆”,本周,美团 CLC 食杂零售 Keemart 研发团队完成架构调整,前端与后端团队正式合并,新组织架构已生效。据报道,相关前端人员已提前一个多月进行后端开发训练。与此同时,蚂蚁网商也宣布推动测试岗位整体转向研发岗位,并为相关人员设置半年缓冲期。过渡期结束后,原测试人员将转型为全栈工程师。 Claude Cod ...
2026年6月23日,亚马逊云科技中国峰会在上海世博中心举办。期间,亚马逊云科技数据库服务副总裁Ganapathy “G2” ...
CEO-Bench 主要面向企业经营场景,用于评估智能体在长期、多变量环境中的管理能力。该测试模拟创业公司运行 500 天,启动资金为 100 万美元(IT之家注:现汇率约合 680.4 万元人民币),要求模型连续处理定价、预算、竞争分析和战略制定等复杂关联事务。
Agent Skills 本质上是一类 SKILL.md 文件。它们可以扩展 Claude Code 和其他 AI 编程助手的能力。安装一个 skill,就相当于给 agent 增加了一份专门的工作手册。 Agent Skills 本质上是一类 SKILL.md 文件。 它们可以扩展 Claude Code 和其他 AI 编程助手的能力。安装一个 skill,就 ...
随着 Forge、verl、AgentGym-RL 等成熟框架的出现,以及 GLM-5.2、MiniMax M2.5 等产品的落地验证,Agentic RL 正从学术研究走向工业实践。 如果 ChatGPT 的横空出世让世界第一次意识到 AI 的“语言天赋”,那么近年来的 Agentic RL(智能体强化学习)正在让 AI 学会的第二件事 ...