Claude、Codex 这类 Agent 能看页面、能识别按钮和输入框,能点击、输入、跳转、提交。真正卡住它们的,是另一个问题:每接一个新任务、每换一个新网站,几乎都要让最强、也最贵的那个模型,从零开始再把整个流程摸索一遍。 Agent 从来不是不会用浏览器,只是浪费太多时间在探索 ——BrowserBC 把人类轨迹蒸馏成可复用 Skill 来完成 Behaviour Cloning,用户点一遍 ...
网购的快递被人偷了,联系客服,客服系统显示,预计等待时间 25 分钟。 换作以前,这意味着我们要么盯着聊天窗口发呆,要么开着网页干别的事,同时隔几分钟切回来看看排到没有,不然一不小心退出去又要重新排队。 新加入 OpenAI 的开发者体验工程师 Jason ...
谷歌近日宣布,WebMCP 已进入 Chrome 149 的 Origin Trial 阶段。WebMCP 是一项新的标准提案,它允许网站向浏览器内的 AI 智能体暴露可调用工具,例如 JavaScript 函数或 HTML ...