把这个战场抬到新高度的,是小米。 小米发布了全新的MiMo-V2.5-Pro-UltraSpeed模型,也就是MiMo-V2.5-Pro的高速版本。 它拥有1T总参数,支持1M上下文,单API推理速度直接拉到1000+ TPS,刷新旗舰模型全球最快推理速度。 而且不像Groq那样依靠定制芯片,用通用GPU就能实现。 这也意味着,小米这次的新模型,打破了“快、强、通用GPU无法兼得”的行业不可能三角 ...