Workflow
GPT‑5.3 Instant
icon
搜索文档
谷歌、OpenAI同日发布模型,一个最快最具性价比,一个主打「人情味」
机器之心· 2026-03-04 11:58
行业竞争动态 - 谷歌与OpenAI在短时间内相继发布新一代大模型,分别是Gemini 3.1 Flash-Lite和GPT‑5.3 Instant,显示出行业竞争激烈,迭代速度加快 [1] - OpenAI在发布GPT-5.3 Instant后随即暗示GPT-5.4即将到来,表明行业技术更新周期极快,模型生命周期可能缩短 [5] 谷歌 Gemini 3.1 Flash-Lite 核心特点 - 该模型是Gemini 3系列中速度最快、成本效率最高的模型,专为大规模开发者工作负载设计 [6][7] - 定价极具竞争力,输入为0.25美元/百万tokens,输出为1.50美元/百万tokens,旨在以远低于更大模型的成本提供显著增强的性能 [1][9] - 在保持高质量的前提下,其首token响应时间比Gemini 2.5 Flash快2.5倍,输出速度提升45% [1][9] - 在Arena.ai排行榜上获得1432的Elo评分,在多项基准测试中表现优于同级别模型,例如在GPQA Diamond测试中达到86.9%,在MMMU Pro测试中达到76.8% [12] - 模型支持可调节的“思考等级”,允许开发者平衡成本、速度和推理能力,适用于高频任务 [14] - 能够处理大规模任务和复杂工作流,例如大规模翻译、内容审核、生成用户界面、创建模拟环境等 [19] - 已通过Gemini API向开发者开放预览,企业用户可通过Vertex AI访问 [8] - 早期测试者反馈显示,该模型在效率与推理能力之间取得了良好平衡,能精确处理复杂输入并保持输出一致性 [20][21] OpenAI GPT‑5.3 Instant 核心特点 - 该模型专注于优化日常对话体验,旨在提供更顺畅、更实用的交互,而非追求基准分数 [22][23] - 在语气、相关性和对话性方面有所提升,拒绝率更低,减少了不必要的免责声明和武断表述 [3][22][24] - 在使用联网功能时,能更好地整合网络信息与自身知识,提供更有用、语境更充分的答案,避免简单罗列搜索结果 [25] - 与之前模型相比,幻觉率显著降低:在高风险领域评估中,使用联网功能时幻觉率降低26.8%,仅依赖内部知识时降低19.7% [40] - 在基于用户反馈的评估中,使用联网功能时幻觉率下降22.5%,未使用联网功能时下降9.6% [41] - 提供了更流畅、更自然的对话风格,减少了尴尬或强势的语气以及不必要的宣告式表达 [31][32] - 写作能力出色,更擅长创作有感染力、富有想象力且沉浸感强的文字 [42] - 该模型已向所有ChatGPT用户开放,同时开发者可通过API以gpt-5.3-chat-latest的名称使用 [46] - GPT-5.2 Instant将在未来三个月内继续向付费用户提供,并于2026年6月3日正式下线 [47]