GPT‑5.3 Instant - 财报，业绩电话会，研报，新闻

GPT‑5.3 Instant

搜索文档

机器之心· 2026-03-04 11:58

行业竞争动态 - 谷歌与OpenAI在短时间内相继发布新一代大模型，分别是Gemini 3.1 Flash-Lite和GPT‑5.3 Instant，显示出行业竞争激烈，迭代速度加快 [1] - OpenAI在发布GPT-5.3 Instant后随即暗示GPT-5.4即将到来，表明行业技术更新周期极快，模型生命周期可能缩短 [5] 谷歌 Gemini 3.1 Flash-Lite 核心特点 - 该模型是Gemini 3系列中速度最快、成本效率最高的模型，专为大规模开发者工作负载设计 [6][7] - 定价极具竞争力，输入为0.25美元/百万tokens，输出为1.50美元/百万tokens，旨在以远低于更大模型的成本提供显著增强的性能 [1][9] - 在保持高质量的前提下，其首token响应时间比Gemini 2.5 Flash快2.5倍，输出速度提升45% [1][9] - 在Arena.ai排行榜上获得1432的Elo评分，在多项基准测试中表现优于同级别模型，例如在GPQA Diamond测试中达到86.9%，在MMMU Pro测试中达到76.8% [12] - 模型支持可调节的“思考等级”，允许开发者平衡成本、速度和推理能力，适用于高频任务 [14] - 能够处理大规模任务和复杂工作流，例如大规模翻译、内容审核、生成用户界面、创建模拟环境等 [19] - 已通过Gemini API向开发者开放预览，企业用户可通过Vertex AI访问 [8] - 早期测试者反馈显示，该模型在效率与推理能力之间取得了良好平衡，能精确处理复杂输入并保持输出一致性 [20][21] OpenAI GPT‑5.3 Instant 核心特点 - 该模型专注于优化日常对话体验，旨在提供更顺畅、更实用的交互，而非追求基准分数 [22][23] - 在语气、相关性和对话性方面有所提升，拒绝率更低，减少了不必要的免责声明和武断表述 [3][22][24] - 在使用联网功能时，能更好地整合网络信息与自身知识，提供更有用、语境更充分的答案，避免简单罗列搜索结果 [25] - 与之前模型相比，幻觉率显著降低：在高风险领域评估中，使用联网功能时幻觉率降低26.8%，仅依赖内部知识时降低19.7% [40] - 在基于用户反馈的评估中，使用联网功能时幻觉率下降22.5%，未使用联网功能时下降9.6% [41] - 提供了更流畅、更自然的对话风格，减少了尴尬或强势的语气以及不必要的宣告式表达 [31][32] - 写作能力出色，更擅长创作有感染力、富有想象力且沉浸感强的文字 [42] - 该模型已向所有ChatGPT用户开放，同时开发者可通过API以gpt-5.3-chat-latest的名称使用 [46] - GPT-5.2 Instant将在未来三个月内继续向付费用户提供，并于2026年6月3日正式下线 [47]

Artificial Intelligence

Gemini 3.1 Flash-Lite

GPT‑5.3 Instant

Artificial Intelligence

Gemini 3.1 Flash-Lite

GPT‑5.3 Instant