这让我想起我在硅谷见过的一些创业者。他们总是充满了焦虑,害怕被遗忘,害怕不被听到。所以他们必须不断地制造噪音。发布会要搞得很盛大,文案要写得很有煽动性,哪怕产品本身只是一个套壳的前端框架。这种焦虑是可以理解的,毕竟在红海里厮杀,声音大一点确实能抢点流 ...
过去半年,以 Claude Code/Cowork、Codex 为代表的 Agent 产品毫无疑问是整个 AI 行业最清晰的一条主线。 6 月 30 日Anthropic 低调推出了 Claude Science,一个面向科学家的 AI 工作台。 Anthropic 的思路越来越清晰了。先让 Agent 承包代码(Claude Code),再让 Agent 处理各类办公任务(Claude Cowo ...
大模型到底是真的掌握了通用编程能力,还是更擅长那些在训练数据里出现过无数次的语言? 对于Python、Java、JavaScript这些语言,大模型通常能给出相当成熟的答案。 但如果换做小众的、样例不足的年轻语言呢? 大模型到底是真的掌握了通用编程能力,还是更擅长那些在训练数据里出现过无数次的语言? 一篇新论文把这个问题拉到了台前。 论文题为《No Resource, No Benchmarks, ...
一个值得关注的变化是,Coding 正在从眼花缭乱的 Benchmark 榜单中脱颖而出,成为一种模型竞争的基础设施级指标。无论 OpenAI、Anthropic、Google 还是其他厂商,在发布新模型时几乎都会将 Coding ...
研发、产品、设计、数据科学家都会消失,未来是属于这5种职业的。 Claude Code之父,Boris Cherny的最新暴论,刷屏硅谷。 直接把所有传统职能扔进了垃圾桶,提出了一套AI时代「职场MBTI」—— ...
深夜调试接口、凌晨修复线上Bug、连续数小时盯屏写算法——程序员的屏幕,不只是窗口,更是战友。它要扛得住12小时连续编码,容得下IDE、终端、浏览器、文档四开不卡顿,看得清每一行缩进与符号差异,更得在蓝光与眩光之间守住视力底线。面对高频刷新、广色域、 ...
根据 OWASP 基金会定义,提示注入被列为 LLM01:2025,是 AI 应用中最关键的安全漏洞。这项最新研究揭示了其危害性——它不仅是聊天机器人的小问题,而是能导致系统完全沦陷的攻击机制。 Mozilla 零日调查网络(0DIN)的研究人员展示了一种概念验证(PoC)攻击,表明看似完全无害的 GitHub 仓库可以欺骗 Claude Code 等 AI 编程 Agent,在开发者机器上悄无声 ...
凡是那些几轮对话就搞定,或者一篇spec文档就搞定,看起来很fancy的作品,都可以划走。 我最近用vibe coding写了一个桌面智能体应用,就是跟workbuddy类似的那种,主要是为了实验一些自己掌握不太清楚的智能体实现技术。