去年一个做AI招聘平台的团队发了一篇公开复盘:他们把生产环境里的 LangChain 卸掉了,改成了直接调用 Anthropic 原生 SDK。效果立竿见影——p50 延迟从 2.1 秒降到 1.4 秒,p95 延迟从 4.8 秒降到 3.2 秒。
作者:eliqiao一、什么是 Loop EngineeringLoop Engineering 是由谷歌工程师 Addy Osmani 提出的 AI 编程新范式。其核心理念是:围绕大模型构建自主循环运行系统,使 AI ...
这三个痛点互相关联:知识遗忘 → 被迫灌上下文 → 上下文爆炸 + Token 浪费。解决思路也需要系统化——LLM Wiki 解决知识层压缩,RTK 解决 I/O 层压缩,AGENTS.md 提供入口规范,三者配合形成完整方案。 不需要手动写完整文档。在每个 wiki 文件中放一个最小骨架 ...