奥德赛时期这个词,听起来就很不像中国人发明的~现在大家特别喜欢用这种舶来词:ADHD 啊、高敏感啊、课题分离啊,一看就有点高深,套个壳来解释自己的状态,不过奥德赛这个词是有点意思的。
GLM-5.2在这次测试里没有任何加持和引导,只有一个prompt和一堆代码裸跑,结果最终在IDOR漏洞检测上拿到39%的F1分。 这个周末,智谱没闲着。 多家外媒接连跟进报道,华尔街时报更是直言「中国重置了AI竞赛」。 因为,智谱的GLM-5.2,让Claude Mythos在找安全漏洞这 ...
深夜调试接口、并行构建微服务、本地跑通大模型推理——程序员的桌面不是工具台,而是生产力战场。当IDE加载缓慢、Docker容器启动迟滞、Webpack编译动辄三分钟,CPU便不再是参数列表里的数字,而是每一行代码背后的真 ...
OpenSpec 和 Superpowers,一个 5.7 万星,一个 24 万星,能走到今天这个位置,靠的是各自在自己领域做到极致。我对这两个框架的 ...
InfoQ中国 on MSN
AI 时代的新可观测性:不只看系统崩没崩,还要看模型有没有胡说
你可能已经习惯了用 dashboard 看系统、用 alert 发现问题,但问题是,当一个系统有成百上千个服务、每天产生海量数据时,你真的还能看见它吗? 作为领先的 observability(可观测性)平台,New Relic ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果