在人工智能的蛮荒时代,我们习惯于将大模型视为一个黑箱。我们往里面投入语料、算力和电力,然后期待它吐出智能。然而,随着OpenAI从非营利实验室蜕变为估值数万亿美元的科技巨兽,其内部运转的逻辑早已超越了简单的“训练-推理”模型。如今,驱动这个庞然大物的,是一种更为隐秘、更为暴烈的力量——Token的重新分配。 Token,这个在自然语言处理中微不足道的计量单位,此刻正扮演着“数字石油”的角色。谁掌握 ...
针对当前AI生态中普遍存在的“记忆孤岛”痛点,一项名为开放记忆协议(Open Memory Protocol,简称OMP)的新标准正式亮相。该协议旨在通过建立一套跨工具、跨会话且可互操作的开放标准,实现AI记忆数据的便携式存储与共享。
普林斯顿大学近期开展了一项引人注目的实验:让AI担任虚拟SaaS公司的CEO,在500天的模拟运营中接受市场考验。这场名为CEO-Bench的竞赛吸引了14个AI模型参与角逐,最终仅有4个成功保住初始资金,其中表现最优异的竟是一个基于固定规则的传统算法。 实验设定极具挑战性:每个AI从100万美元本金和零客户起步,需在动态变化的商业环境中做出定价、研发、营销等全方位决策。系统提供的Python A ...
继今年5月OpenAI推出AI网络安全项目Daybreak,希望通过将模型能力、智能体工作流与行业伙伴体系整合为一体,推动网络防御建设提速后。日前,OpenAI方面宣布进一步扩展Daybreak项目,包括发布满血版GPT-5.5-Cyber模型、Co ...
过去一年,大模型公司的竞争几乎都围绕着几个热门方向展开:谁的编程能力更强、谁的搜索体验更好、谁能率先做出真正有用的 AI Agent。 但最近,一个新的战场正在快速升温——网络安全。 前不久,Anthropic 推出了 系列模型,希望让 Claude ...
在大模型兴起后,本地模型运行缓慢、难以使用是常态,而且对于大多数编程任务来说准确率不高。本地模型严重落后的观点在很大程度上是正确的,直到 2025 年 8 月 OpenAI GPT-OSS 的发布才让我们改变了这种看法。我没有确凿的科学证据 —— ...
其实,早在今年三、四月,就有过一轮AI智能体的大爆发,仿佛巧合一样,在短短两周内,斯坦福西部世界小镇、BabyAGI、AutoGPT等多个智能体,就如雨后春笋一般冒出来。
做个横向对比就更清楚了。Anthropic 最新的旗舰模型输入 10 美元、输出 50 美元,Sol 的价格只有它的一半。 智谱的 GLM-5.2(MIT 开源)输入 1.4 美元、输出 4.4 美元,和 Luna 处在同一价格带 ,但 Luna ...
Fable 5 是过去半年最受市场期待的模型,而在真正发布之后,它又迅速成为“最具争议”的模型。除了安全禁令外,它的使用体验反差也相当明显:在一些任务里,Fable 5 ...