98%降本！xAI新模型Grok 4 Fast上线，推理性能接近Grok 4

阅读预计 2 分钟

丸美小沐9月20日消息，xAI推出新一代高性价比推理模型Grok 4 Fast，主打“更小更快、推理不降级”。官方称其以更高的“智能密度”在多数前沿基准上接近Grok 4，同时平均减少40%思考token，面向企业与消费两端开放。

从功能看，Grok 4 Fast整合推理/非推理于同一模型权重，标配200万token上下文、原生Web与X搜索、多工具调用，并在API侧以“推理、非推理”双SKU上线，定价显著下探，意在把高质量推理普惠给更多开发者。

Grok 4 Fast采用统一架构，将推理（长链路思考）与非推理（快速响应）融合到同一模型权重中。此前需要分开调用的多模型模式，如今可在同一环境下自适应切换，从而降低端到端时延和token消耗。在用户侧表现为：简单问答即时响应，复杂问题则进入深度推理。

上下文长度提升至200万token，适配长文档审阅和企业检索问答场景。模型还原生支持Web与X的多跳搜索，能自动调用工具进行代码执行或浏览网页，并实现跨媒体内容（含图片、视频）理解与整合。轻点评：统一架构与原生检索有助于提升使用体验和通用性。

在多项学术与竞赛类基准上，Grok 4 Fast展现出接近甚至超越Grok 4的表现：

AIME 2025：92.0%，与Grok 4（91.7%）持平，高于Grok 3 Mini（83.0%）
HMMT 2025：93.3%，优于Grok 4（90.0%）与GPT-5 Mini（87.8%）
GPQA Diamond：85.7%，与GPT-5（85.7%）相当
LiveCodeBench：80.0%，略高于Grok 4（79.0%）

在“智能密度”方面，Grok 4 Fast平均少用40%的思考token即可达到Grok 4同等性能。这种高效用法意味着用户在相同任务上所需的token更少，结合低单价，整体成本下降至Grok 4的2%（即便宜47倍）。第三方Artificial Analysis的“智能指数”亦确认其性价比处于SOTA梯队。轻点评：在数理推理等硬指标上已具备足够竞争力。

Grok 4 Fast的搜索与浏览性能在多项评测中显著领先：

BrowseComp：44.9%，高于Grok 4的43.0%
SimpleQA：95.0%，优于Grok 4的94.0%
BrowseComp(中文)：51.2%，远高于Grok 4的45.0%与Grok 3 Mini的10.8%
X Bench Deepsearch(中文)：74.0%，显著高于Grok 4的66.0%

其内部评测还显示，在X平台多跳搜索（X Browse）中准确率达58.0%，优于Grok 4的53.2%。轻点评：中文搜索能力提升明显，有望改善本地化应用体验。

在LMArena的Search Arena中，grok-4-fast-search（代号menlo）以1163 Elo排名第一，领先o3-search 17分；在Text Arena中，grok-4-fast（代号tahoe）位列第8，显著高于同体量模型的平均水平（通常排在18名之后）。轻点评：以“小体量”拿下“大模型”场景，突显其智能密度优势。

API提供两档SKU：

小于128k tokens：输入0.20美元/百万token（约合人民币1.42元），输出0.50美元/百万token（约合人民币3.56元），缓存输入0.05美元/百万token（约合人民币0.36元）。
大于等于128k tokens：输入0.40美元/百万token（约合人民币2.85元），输出1.00美元/百万token（约合人民币7.11元）。

此外，Grok 4 Fast已在grok.com、iOS和Android端同步上线，Fast与Auto模式均将优先调用该模型。值得注意的是，官方首次允许免费用户直接使用最新模型。轻点评：通过低价与开放策略，意图加速渗透开发者与用户市场。

从生态角度看，其直接对标o3、Claude 4.x、Gemini 2.5、DeepSeek V3.1等前沿模型，核心竞争点集中在“长上下文+原生检索+极致性价比”。Grok 4 Fast以“智能密度+价格效率”为核心卖点，已在多项公开评测中展现强劲竞争力。若第三方评测与实际生产验证能持续印证，未来在企业检索、搜索类应用及消费端问答场景的渗透率有望提升，但开放问答与长期安全稳态仍需进一步观察。

相关推荐: AI数据标注创企拿下2.5亿新融资！ARR超3.6亿，或趁势承接OpenAI谷歌订单

智东西（公众号：zhidxcom）编译 | 许丙南编辑 | 程茜智东西9月15日消息，9月12日，美国AI数据标注初创公司Micro1宣布完成3500万美元（折合人民币约2.5亿元）A轮融资，投后估值达5亿美元（折合人民币约35亿元）。本轮融资由01 A…