产品发布与核心特性 - xAI公司推出新模型Grok 4.1 Fast及智能体工具xAI Agent Tools API两大更新[2] - Grok 4.1 Fast是公司迄今性能最佳的工具调用模型,支持200万token上下文窗口,擅长处理客户支持和财务等复杂应用场景[2] - 该模型在人工智能分析智能指数中跃升4位至第六位,在智能体调用测评Telecom排行榜以93.3%得分位居榜首,超越GPT-5.1等模型[3] - Grok 4.1 Fast幻觉率比Grok 4 Fast降低一半,事实性更准确[3] 性能表现与基准测试 - 在τ²-bench Telecom测试中,Grok 4.1 Fast以更低成本超越GPT-5.1、Gemini 3 Pro、Claude 4.5 Sonnet等模型性能[9] - 通过长时域强化学习训练,模型在长达200万token的上下文窗口中保持稳定性能[13] - 实测显示,Grok 4.1 Fast在实时信息检索效果上比Grok 4 Fast明显提升,但在经典编程案例上表现不如前代版本[7][14][17][19][21] - 在X Browse内部基准测试中,Grok 4.1 Fast得分56.3,平均成本0.091美元,优于GPT-5和Claude Sonnet 4.5[33] 工具功能与集成 - Agent Tools API使智能体能访问实时X数据、网络搜索、远程代码执行等功能[6] - 结合使用Grok 4.1 Fast和Agent Tools API,开发人员可构建生产级智能体,用于工具调用和智能体搜索[7] - API主要功能包括搜索工具、文件搜索、代码执行和MCP工具连接,所有工具运行在xAI基础架构上,简化开发流程[28][31] 定价策略与市场推广 - Grok 4.1 Fast输入定价为0.2美元/百万tokens,缓存输入0.05美元/百万tokens,输出价格0.5美元/百万tokens[8] - Agent Tools API调用价格5美元起/1000次成功调用,在12月3日前用户可免费体验以上服务[8][34] - xAI与OpenRouter合作,免费提供Grok 4.1 Fast,公司将在API上发布推理和非推理两个模型变体[34]
低成本叫板GPT-5.1,马斯克杀入智能体
36氪·2025-11-20 16:56