阅读预计 2 分钟
丸美小沐9月20日消息,xAI推出新一代高性价比推理模型Grok 4 Fast,主打“更小更快、推理不降级”。官方称其以更高的“智能密度”在多数前沿基准上接近Grok 4,同时平均减少40%思考token,面向企业与消费两端开放。
从功能看,Grok 4 Fast整合推理/非推理于同一模型权重,标配200万token上下文、原生Web与X搜索、多工具调用,并在API侧以“推理、非推理”双SKU上线,定价显著下探,意在把高质量推理普惠给更多开发者。
Grok 4 Fast采用统一架构,将推理(长链路思考)与非推理(快速响应)融合到同一模型权重中。此前需要分开调用的多模型模式,如今可在同一环境下自适应切换,从而降低端到端时延和token消耗。在用户侧表现为:简单问答即时响应,复杂问题则进入深度推理。
上下文长度提升至200万token,适配长文档审阅和企业检索问答场景。模型还原生支持Web与X的多跳搜索,能自动调用工具进行代码执行或浏览网页,并实现跨媒体内容(含图片、视频)理解与整合。轻点评:统一架构与原生检索有助于提升使用体验和通用性。
在多项学术与竞赛类基准上,Grok 4 Fast展现出接近甚至超越Grok 4的表现:
- AIME 2025:92.0%,与Grok 4(91.7%)持平,高于Grok 3 Mini(83.0%)
- HMMT 2025:93.3%,优于Grok 4(90.0%)与GPT-5 Mini(87.8%)
- GPQA Diamond:85.7%,与GPT-5(85.7%)相当
- LiveCodeBench:80.0%,略高于Grok 4(79.0%)
在“智能密度”方面,Grok 4 Fast平均少用40%的思考token即可达到Grok 4同等性能。这种高效用法意味着用户在相同任务上所需的token更少,结合低单价,整体成本下降至Grok 4的2%(即便宜47倍)。第三方Artificial Analysis的“智能指数”亦确认其性价比处于SOTA梯队。轻点评:在数理推理等硬指标上已具备足够竞争力。
Grok 4 Fast的搜索与浏览性能在多项评测中显著领先:
- BrowseComp:44.9%,高于Grok 4的43.0%
- SimpleQA:95.0%,优于Grok 4的94.0%
- BrowseComp(中文):51.2%,远高于Grok 4的45.0%与Grok 3 Mini的10.8%
- X Bench Deepsearch(中文):74.0%,显著高于Grok 4的66.0%
其内部评测还显示,在X平台多跳搜索(X Browse)中准确率达58.0%,优于Grok 4的53.2%。轻点评:中文搜索能力提升明显,有望改善本地化应用体验。
在LMArena的Search Arena中,grok-4-fast-search(代号menlo)以1163 Elo排名第一,领先o3-search 17分;在Text Arena中,grok-4-fast(代号tahoe)位列第8,显著高于同体量模型的平均水平(通常排在18名之后)。轻点评:以“小体量”拿下“大模型”场景,突显其智能密度优势。
API提供两档SKU:
- 小于128k tokens:输入0.20美元/百万token(约合人民币1.42元),输出0.50美元/百万token(约合人民币3.56元),缓存输入0.05美元/百万token(约合人民币0.36元)。
- 大于等于128k tokens:输入0.40美元/百万token(约合人民币2.85元),输出1.00美元/百万token(约合人民币7.11元)。
此外,Grok 4 Fast已在grok.com、iOS和Android端同步上线,Fast与Auto模式均将优先调用该模型。值得注意的是,官方首次允许免费用户直接使用最新模型。轻点评:通过低价与开放策略,意图加速渗透开发者与用户市场。
从生态角度看,其直接对标o3、Claude 4.x、Gemini 2.5、DeepSeek V3.1等前沿模型,核心竞争点集中在“长上下文+原生检索+极致性价比”。Grok 4 Fast以“智能密度+价格效率”为核心卖点,已在多项公开评测中展现强劲竞争力。若第三方评测与实际生产验证能持续印证,未来在企业检索、搜索类应用及消费端问答场景的渗透率有望提升,但开放问答与长期安全稳态仍需进一步观察。
相关推荐: AI数据标注创企拿下2.5亿新融资!ARR超3.6亿,或趁势承接OpenAI谷歌订单
智东西(公众号:zhidxcom) 编译 | 许丙南 编辑 | 程茜 智东西9月15日消息,9月12日,美国AI数据标注初创公司Micro1宣布完成3500万美元(折合人民币约2.5亿元)A轮融资,投后估值达5亿美元(折合人民币约35亿元)。本轮融资由01 A…