Workflow
GPT-5来了,微软抢先接入:一键生成网页、博士级智能,所有用户免费使用;马斯克不服
微软微软(HK:04338) 搜狐财经·2025-08-08 12:45

产品发布与性能 - OpenAI推出大型语言模型GPT-5,距离GPT-4发布已过去两年半,公司称其为"世界上最好的模型"并免费提供给用户[1] - GPT-5采用集成模型架构,能自动选择推理深度,无需用户切换模式,对话体验如同与博士级专家交流[3] - 新模型在编码、数学、写作、健康、视觉感知等领域表现卓越,是统一的智能系统,能自动判断响应速度[5] - GPT-5在SWE-bench Verified测试中首次尝试准确率达74.9%,高于GPT-4o的30.8%和o3模型的69.1%[10] - 在HealthBench Hard Hallucinations测试中,GPT-5的错误信息率仅1.6%,远低于GPT-4o的15.8%和o3的12.9%[17] - 启用网络搜索后,GPT-5响应中包含事实错误的可能性比GPT-4o低45%,比o3模型低80%[18] 商业模式与定价 - GPT-5面向所有用户开放,免费用户每天可使用数小时,Plus用户额度更高,Pro会员可访问扩展推理能力的Pro版本[5] - 开发者API定价为每百万token输入1.25美元,输出10美元,价格低于GPT-4o和Claude Opus 4.1,仅为后者的1/15[5] - 微软在发布当日宣布将GPT-5整合至Microsoft 365 Copilot、GitHub Copilot等全线产品中[22] 技术突破与创新 - GPT-5在编程能力上实现突破,能凭单提示创建响应式网站、App和游戏,设计选择更优[10] - 新模型具备"氛围编码"能力,演示中几分钟内生成两个不同法语学习App[15] - 引入"安全补全"训练方法,使模型能更细致地处理敏感问题,减少过度拒绝[20] - 推出四种可选聊天预设性格(愤世嫉俗者、机器人、倾听者、书呆子),可调整交互风格[21] 行业竞争与评价 - 在SWE-bench测试中表现略优于Claude Opus 4.1(74.5%)和Gemini 2.5 Pro(59.6%)[13] - 但在Humanity's Last Exam测试中,GPT-5 Pro得分42%,略低于Grok 4 Heavy的44.4%[13] - 马斯克公开质疑GPT-5性能,称其在ARC-AGI-2测试中未击败Grok 4[3][26] - 有研究员认为GPT-5仅为"渐进式优化",因缩放定律放缓和高质量数据枯竭导致性能提升有限[29] 资本动态与战略 - OpenAI近期获得83亿美元新资本,估值达3000亿美元,投资者包括黑石集团等机构[30] - GPT-5发布将巩固公司技术领先地位,提振投资者信心,助力估值增长和股票二次出售[31]