凡是那些几轮对话就搞定,或者一篇spec文档就搞定,看起来很fancy的作品,都可以划走。 我最近用vibe coding写了一个桌面智能体应用,就是跟workbuddy类似的那种,主要是为了实验一些自己掌握不太清楚的智能体实现技术。
大模型到底是真的掌握了通用编程能力,还是更擅长那些在训练数据里出现过无数次的语言? 对于Python、Java、JavaScript这些语言,大模型通常能给出相当成熟的答案。 但如果换做小众的、样例不足的年轻语言呢? 大模型到底是真的掌握了通用编程能力,还是更擅长那些在训练数据里出现过无数次的语言? 一篇新论文把这个问题拉到了台前。 论文题为《No Resource, No Benchmarks, ...
一个值得关注的变化是,Coding 正在从眼花缭乱的 Benchmark 榜单中脱颖而出,成为一种模型竞争的基础设施级指标。无论 OpenAI、Anthropic、Google 还是其他厂商,在发布新模型时几乎都会将 Coding ...
AI 的时代,时间真的过得飞快—— 指挥大语言模型编程的「vibe coding」仿佛就兴起于昨天,实际上它被《柯林斯英语词典》评为年度词汇都过去半年多了。 图|Cycode 只是在 AI 遍地之后,「用 AI 写程序」逐渐不是那么让人兴奋了,和养龙虾一起变成了那些「AI 极客」们日常生活的一部分。 但在今年的 Google I/O 和 WWDC ...
望得到Claude Code的背影吗? 过去半年,以 Claude Code/Cowork、Codex 为代表的 Agent 产品毫无疑问是整个 AI 行业最清晰的一条主线。 6 月 30 日Anthropic 低调推出了 Claude ...
如果你正在用 Claude API 做聊天机器人、AI 助手、代码生成或知识库问答,可能会发现一个问题:有时候总耗时还能接受,但前几秒没有任何输出, ...
PandaWiki 是一款 AI 大模型驱动的开源知识库搭建系统,帮助你快速构建智能化的 产品文档、技术文档、FAQ、博客系统,借助大模型的力量为你提供 AI 创作、AI 问答、AI 搜索等能力。 一个轻量级工具库,提供 AI 模型发现与 API 密钥验证功能,助你快速集成各大 ...
DAG 不是 Agent 编排的答案,它是 Agent 最简单的特例。无环图天生不能循环、反思、重试、恢复。LangGraph 的 StateGraph + Pregel 引擎 = Agent 的操作系统内核:调度、持久化、恢复三个原语 DAG 一个都没有。 1.为什么你的 Agent 跑着跑着就卡住了? 去年我在一个项目里写了这样一个 Agent:让它调研一个 GitHub 仓库,读 READM ...
研发、产品、设计、数据科学家都会消失,未来是属于这5种职业的。 Claude Code之父,Boris Cherny的最新暴论,刷屏硅谷。 直接把所有传统职能扔进了垃圾桶,提出了一套AI时代「职场MBTI」—— ...
深夜调试接口、凌晨修复线上Bug、连续数小时盯屏写算法——程序员的屏幕,不只是窗口,更是战友。它要扛得住12小时连续编码,容得下IDE、终端、浏览器、文档四开不卡顿,看得清每一行缩进与符号差异,更得在蓝光与眩光之间守住视力底线。面对高频刷新、广色域、 ...
经过半个多月的极限拉扯,Anthropic 今天终于重新恢复了 Fable 5 的访问权限,并且还部分解禁了 Mythos 5。 目前,Fable 5 可在 Claude Platform、Claude.ai、Claude Code 和 Claude ...
AI大模型领域迎来重要人事变动,技术专家孙天祥已正式加入百度,出任基础模型研发部(BMU)负责人,并同步进入百度模型委员会(BMC)。 这一核心人才的加盟,标志着百度在AI组织架构和系统性人才梯队上的迭代布局更进一步,有望加速文心基础模型的研发与技术攻坚。 当前,百度已将大模型研发体系拆分为基础模型研发部(BMU)和应用模型研发部(AMU),其中应用模型部由贾磊负责。这种“双轨驱动”的架构调整,旨 ...