通用人工智能(AGI)
搜索文档
实测GPT-5:写作“AI味”浓 代码“美而无用” OpenAI为何急于打响价格战
每日经济新闻· 2025-08-09 09:57
GPT-5技术表现 - 官方宣称GPT-5在超高难度科学问题上刷新世界纪录,70%场景表现优于人类专家,并与o系列模型无缝整合,代码生成和写作准确率高于GPT-4系列,部分测试错误率下降80% [2] - 引入更严格事实核查机制:联网搜索时事实错误概率比GPT-4o低45%,独立思考时出错概率比o3模型低80%,开放式测试中"幻觉"数量减少六分之五 [2] - 用户实测显示写作能力被指"退化至GPT-3.5水平",输出文章逻辑清晰但模式化痕迹明显,"AI味"加重 [1][4] - 编程能力未显著领先竞争对手:在SWE-bench测试中与Claude 4.1 Opus差距微弱,Meta工程师实测生成3000行代码但无法正常工作 [11][12] - 第三方基准测试综合得分仅比自家o3高2分,比Grok 4高1分,在Arc Prize竞赛中被Grok 4大幅超越 [14] OpenAI商业战略转向 - 采用激进定价策略:标准版API定价输入1.25美元/百万token、输出10美元/百万token,显著低于GPT-4o及Claude/Gemini竞品 [17][18] - 推出分层产品矩阵:mini版输入0.25美元/百万token,nano版输入0.05美元/百万token,重点吸引B端客户 [18] - 战略重心从C端转向B/G端:免费向美国政府提供ChatGPT Enterprise,通过供应商锁定策略渗透政企市场 [22][23] - 商业模式从"卖算力"转向"卖生态":开源模型作流量入口,高端API为利润中心,企业服务为增长引擎 [22] 公司资本与运营动态 - 计划通过股权交易将估值从3000亿美元提升至5000亿美元,超越SpaceX成为全球最高估值未上市AI公司 [20] - 2024年预计收入120亿美元但成本达280亿美元,收入成本比为1:2.25,主要支出包括微软云服务、"星际之门"数据中心及CoreWeave算力协议 [20] - ChatGPT订阅贡献70%收入,周活用户达7亿但增长接近饱和,核心人才流失加剧运营压力 [21][22] 行业专家观点 - 技术突破进入边际收益递减阶段,进步主要来自工程调优而非智能突破,"数据墙"和算力成本成物理限制 [17] - 估值逻辑基于AGI"期权定价",商业化重点转向寻找"杀手级应用"而非参数竞赛 [19][20] - 公司需平衡技术突破、商业模式创新与风险管控,目标进化为"商业帝国"而非单纯实验室 [19][23]
实测GPT-5:界面更简洁回答更高效,但“不够惊艳”
贝壳财经· 2025-08-09 09:50
GPT-5发布与核心能力 - GPT-5正式发布,OpenAI首席执行官通过77分钟视频展示其多模态、深度思考、联网搜索等集成化能力,但复杂问题回复仍有错误,与市面其他模型未拉开显著差距 [1] - 对话界面更简洁,可依据问题切换回答方式提升用户体验,但"惊艳程度"不及GPT-4和o1模型 [1][3] - 在创意写作、编程、数学、长文本等测评中夺榜首,但行业迭代速度快,领先优势不明显 [3][18] 创意写作实测表现 - 采用集成模型,无需手动切换,自动决定深度思考时机,免费用户也可使用 [3] - 中文写作中规中矩,生成内容包含具体人物、时间线及历史背景细节(如明末四川农民故事),并主动提示补充史料 [3][4] - 与DeepSeek、Kimi对比差距不大,但引导用户提问能力更强,可主动建议生成多模态内容(如兵乱形势图) [7] - 生成图片质量粗陋且与说明矛盾,多模态能力仍有局限 [8][10] 编程能力与商业化 - 编程能力为发布会重点,占一半时间,演示案例包括SVG动图解释伯努利效应、二战主题华容道游戏等 [10][11][14] - 生成速度显著提升(如10秒完成英语学习web应用),但复杂程序存在BUG(如单词报错、隆美尔方块无法移动) [11][16] - SWE-bench测试得分74.9%,略超Claude Opus4.1(74.5%),显著优于GPT-4o(30.8%)和o3(69.1%) [18] - API定价每百万token输入1.25美元/输出10美元,低于GPT-4o和Gemini 2.5 Pro,仅为Claude Opus 4.1的1/15 [20] 产品策略与限制 - 免费开放但限制使用次数(实测9轮对话触及上限),需付费解锁完整功能 [19] - 价格下探反映头部厂商抢占市场份额意图,或加速应用端落地 [20]
OpenAI发布GPT-5后,马斯克却发出警告:OpenAI会把微软生吞了!为什么这样说?
搜狐财经· 2025-08-08 22:32
GPT-5发布与微软合作 - OpenAI发布GPT-5模型,首席执行官奥尔特曼称其为迈向通用人工智能(AGI)的重要一步,与GPT-5交流如同与人类专家交流 [1] - 微软CEO纳德拉宣布GPT-5在Microsoft 365 Copilot、Copilot、GitHub Copilot及Azure AI Foundry等多个平台上线,强调这是OpenAI推出的迄今为止能力最强大的模型,在推理、编码和聊天方面有重大突破,所有训练均在Azure上进行 [1] 马斯克的警告与OpenAI-微软关系 - 马斯克警告称"OpenAI会把微软生吞了",认为OpenAI凭借GPT-5等核心技术已形成"不可替代性",微软过度依赖其技术丧失主导权,可能被架空为"渠道商" [3] - 尽管微软是OpenAI最大投资者,投入超130亿美元并拥有部分知识产权,但双方合作关系面临结构性挑战 [3] - 马斯克对OpenAI权力结构演变有长期担忧,尤其其从非营利组织向营利性公司转型的趋势,曾通过诉讼阻止这一转变并牵头974亿美元收购提案但被拒绝 [3] 微软的应对策略与行业竞争 - 微软正调整AI战略降低对OpenAI依赖,测试将国产大模型DeepSeek作为Copilot候选模型之一,并在Azure平台接入包括Grok在内的多个第三方AI模型 [5] - OpenAI技术主导地位受新兴AI力量挑战,DeepSeek崛起引发模型蒸馏技术争议,微软等科技巨头迅速将DeepSeek纳入生态体系反映行业对技术多元化和成本控制需求 [5] - 马斯克通过xAI免费策略(如Grok 3开放至服务器崩溃)和算力优势(20万GPU集群)直接挑战OpenAI与微软商业模式 [5] 未来格局展望 - OpenAI凭借技术壁垒(如GPT-5)和微软深度集成,短期可能扩大商业影响力,但闭源模式面临伦理与政策风险 [7] - 微软通过技术多元化降低依赖,但若无法平衡合作与控制权,恐沦为OpenAI生态"附庸" [7] - 马斯克既是理念捍卫者(开源伦理)也是竞争者(xAI),其警告实质是对资本侵蚀技术初心的批判,同时为自身阵营争取空间 [7]
行业点评报告:GPT-5推升商业化加速,利好AI应用发展
浙商证券· 2025-08-08 21:48
行业评级 - 行业评级: 看好(维持) [3] 核心观点 - GPT-5 是 GPT-4o 的重大升级,代表 OpenAI 在实现通用人工智能(AGI)路径上的重要一步,提供更智能、更快速和更可靠的响应 [4] - GPT-5 显著减少了幻觉的发生,出现事实错误的概率比 GPT-4o 低约 45%,比 OpenAI o3 低约 80% [2] - GPT-5 在 HELP-Bench 临床测试中得分达到 97%,相比 GPT-4o 的 82%大幅提升 [6] - GPT-5 通过免费开放核心能力、API 价格大幅下降、企业无限次调用的三重策略,实现用户总成本锐减 [7] 产品与技术亮点 - GPT-5 将多个模型统一,按需自动调用工具,提升用户友好度,不再区分推理、多模态和 Agent 模型,而是集成在一个智能系统中 [4] - GPT-5 采用合成课程训练、自验证链、安全完成机制和工具约束强化等方法降低幻觉和减少事实性错误 [5] - GPT-5 在 SWEBench(编码任务,得分 74.9%)、MMMU(推理任务,超越多数人类专家)和 AIME 2025(数学推理)等基准测试中表现优异 [4] 应用场景突破 - 医疗领域:GPT-5 从诊断层面主动发现漏洞,降低误诊风险,并在患者层面利用多模态交互能力生成个性化路径 [6][7] - 金融、教育等领域:GPT-5 帮助加速金融分析和代码教学,推动 AI 从"辅助工具"升级为"可信代理" [4][5] 商业化与成本优化 - API 价格大幅下降,GPT-5 的价格为每百万 token 输入 1.25 美元,输出 10 美元,低于 GPT-4o 和 Gemini 2.5 Pro [7] - 免费用户首次可访问顶级模型,付费用户权益升级,支持"深度思考模式"生成更复杂内容 [7] 投资建议 - 关注 AI Agent、多模态应用和 AI 医疗领域 [7] - 企业服务或 AI Agent 最先落地场景,办公/OA/ERP/营销等 Saas 厂商有望受益 [7] - 行业垂类应用:AI+教育、AI+营销、AI+法律、AI+金融、AI+政府等 [7] - 多模态应用:图片生成和编辑等能力逐步为专业人士提供帮助 [7] - AI 医疗:医疗大数据和大模型开发、医疗信息化龙头、AI 药物研发等领域 [7]
GPT-5发布,这一次OpenAI没有颠覆式创新
新京报· 2025-08-08 14:43
文章核心观点 - OpenAI发布GPT-5,其核心卖点是“更强、更稳、更便宜、更好用”,但此次发布会被视为一次“不得不举办”的产品化与可用性升级汇报,而非颠覆性的技术突破 [1][5][6] - 此次发布标志着OpenAI正面临巨大的竞争压力,其策略从纯粹的技术领先转向包含价格战的务实防守,可能预示着AI行业从高速“奇迹时代”进入增速放缓的“平凡时代” [7][8][9][10] - GPT-5并非AGI产品,通向通用人工智能的道路可能比预期更长,整个行业需要新的架构、训练方法或范式上的突破 [9][11] GPT-5的技术与产品特性 - **能力更强**:在数学、编程、多模态理解和健康等多项基准测试中创下新纪录,采用统一系统架构整合高效基础模型、深度推理模块和实时路由系统,实现“简单问题快答,复杂问题拉长思考”,并具备400K的超长上下文能力 [2] - **稳定性提升**:针对“幻觉”问题进行了显著改进,事实性与安全性比前代进步,更少的幻觉和“编理由”行为,更愿意在不知道时承认 [3] - **价格更具杀伤力**:在编程能力大幅提升的情况下,其API价格比Anthropic的Claude Opus 4.1和谷歌的Gemini 2.5 Pro更便宜,与Claude Opus 4.1相比有数量级的价格差距 [3] - **产品线统一**:发布后实现了产品线的“大一统”,其他命名复杂的大模型消失,只剩下GPT-5系列,改善了用户选择体验 [4] OpenAI面临的竞争与压力 - **竞争压力加剧**:面临来自Anthropic、Google、Meta、xAI以及中国众多大语言模型公司的激烈竞争,在业内的优势越来越不明显 [7] - **人才争夺战**:经历了2024年的安全团队离职潮,人才报告显示有流向Anthropic的净迁移趋势,同时Meta开出天价薪酬挖人,对公司保持优势和团队士气构成压力 [7] - **发布会被迫举行**:因GPT-5已一再推迟发布,外界等待超过2年,时间窗口很窄,为避免叙事从“引领”变为“为何还没发布”而不得不举办 [1][5][7] AI行业发展趋势 - **技术增速放缓**:行业整体在变慢,参数规模定律(Scaling Law)逐渐放缓,即使使用10倍算力强化学习的模型(如Grok-4)表现也不算特别惊艳 [9] - **评估基准接近饱和**:当前评估基准可能已接近饱和,如同“看高中生做初中题目”,当所有模型都能在现有测试中取得90%以上的分数时,其区分意义下降 [9] - **行业进入平台期**:低垂的果实已被摘完,行业需要架构创新、训练方法革命或全新方式的突破才能继续前进,短期难现类似GPT初代发布的巨大颠覆感 [9][10] - **策略转向务实**:当OpenAI这样的先行者开始用价格战来守住阵地,将稳定性、安全性、价格和可用性置于C位,可能是技术快速发展期结束的明显标志 [8][9]
GPT-5来了!可免费使用
天天基金网· 2025-08-08 13:07
产品发布与核心特性 - 公司发布新旗舰AI模型GPT-5,该模型更智能、更快、更实用,尤其在写作、编码和医疗保健领域表现突出 [1] - 模型首次使用推理模型支持ChatGPT免费版本,该技术能花时间思考复杂问题以减少编造内容的出现 [1] - 该技术比之前模型更人性化,新手可通过简短文本提示在几分钟内构建简单的软件应用程序 [1] - 模型幻觉率较低,意味着编造答案的频率较低,开发过程中进行了5000小时的安全测试 [2] - 模型采用安全完成机制,在用户问题有潜在风险时不直接拒绝回答 [2] - 公司首席执行官称GPT-5感觉像是在与任何领域的博士级别专家交谈,是迈向通用人工智能目标的重要一步 [2] 市场定位与用户获取 - 模型面向所有人开放,包括免费用户 [1][2] - Plus会员可获得更多使用量,Pro会员可访问GPT-5 Pro版本,免费用户在配额用完后将被分配到GPT-5 mini模型 [2] 性能表现 - GPT-5在文本、编程、数学等全方面排名第一 [3]
GPT-5登场!国产大模型“扎堆上新”,DeepSeek得加速了
华夏时报· 2025-08-08 13:04
GPT-5发布 - OpenAI正式推出GPT-5,CEO山姆·奥特曼称其为迈向通用人工智能(AGI)的重要一步 [2] - GPT-5在编程能力、创意写作和健康咨询三个关键领域实现显著提升,能够创建网站、应用程序和游戏,处理复杂写作任务,解析医疗结果 [3] - GPT-5共有四款模型:GPT-5、GPT-5 mini、GPT-5 nano和GPT-5 chat,面向普通消费者免费开放但有额度限制,Plus会员每月20美元,Pro会员每月200美元 [5] - 开发者端提供三款模型的API服务,价格比GPT-4更低,输入输出价格分别为每百万token 1.25美元/10美元、0.25美元/2美元、0.05美元/0.4美元 [6] 行业竞争格局 - GPT-5上线后迅速屠榜大模型竞技场LMArena,在所有细分类目中位列第一 [3] - ChatGPT今年7月访问量增速6.14%,月活用户近7亿,月访问量59.1亿,预计9月超过Instagram成为全球第四大网站 [7] - 国内大模型厂商竞争激烈,月之暗面发布Kimi K2,阶跃星辰推出Step-3,阿里发布通义千问3,智谱带来GLM-4.5 [9] DeepSeek现状与挑战 - DeepSeek访问量连续4个月下降,平均每月降低9.63%,6月访问量3.8亿,7月月活用户下降11.87%至8293万 [8] - 字节豆包和腾讯元宝月活用户分别达到1.32亿和4473万,持续增长 [8] - DeepSeek R2模型迟迟未推出,业内期待但面临压力,部分观点认为其已落后OpenAI两步(GPT-4.5和GPT-5) [10] - 创始人梁文锋被指在憋大招,行业认为大模型竞争呈螺旋式上升状态,没有绝对领先者 [9][10]
OpenAI发布GPT-5模型,多模态是升级重点
环球网资讯· 2025-08-08 12:04
产品发布 - OpenAI正式推出GPT-5模型,首席执行官表示这是迈向通用人工智能(AGI)的重要一步,模型交流体验如同与人类专家对话[1] - GPT-5系列包含三款模型:GPT-5、GPT-5 mini及GPT-5 nano,上下文长度均达400K,最大输出为128K tokens[4] - API价格体系公布:GPT-5每百万tokens输入1.25美元、输出10美元;GPT-5 mini输入0.25美元、输出2美元;GPT-5 nano输入0.05美元、输出0.40美元[4] 性能表现 - GPT-5在Swe Bench等多个基准测试中表现亮眼,树立了新的性能标准[3] - 模型核心发展方向聚焦于提升可靠性与事实准确性,在安全框架内为用户提供最大化帮助[3] - 面对无法回答的问题时,GPT-5会详细解释原因并引导用户寻求第三方帮助,而非简单拒绝[3] - 编程能力强大,几分钟内可输出超200行代码,曾成功创建融合多种视觉与音频元素的网站[3] 功能特点 - 用户可在提示中要求模型"深入思考"或"更精确",并能直观看到其思维过程[3] - 语音模式即将上线,演示中展现出用单个单词回应并总结"人际关系"相关内容的能力[4] - 记忆功能支持Pro、Plus及Teams订阅用户连接谷歌账号访问日历,联动Gmail与Google Calendar[4] - 提醒用户回复未回邮件的功能将于下周先向Pro用户开放,随后扩展至Plus和Teams用户[4] 服务推广 - 免费用户今日起可使用GPT-5(有配额限制),Plus及Pro订阅用户享有更高权益[4] - 公司表示将持续聚焦安全性提升与防欺骗机制完善,推动GPT-5在合规前提下更好服务用户[4]
刚刚,奥特曼发布GPT-5,人人免费用“博士级”智能,基准图错误遭全网吐槽
36氪· 2025-08-08 11:05
模型发布与核心功能 - GPT-5作为集成模型发布,无需用户手动切换子模型,系统自动分配最优处理模块(如高效应答、深度推理的"Thinking模式")[3][30] - 采用实时router系统优化模型分配,结合用户反馈及使用量动态调整,未来计划融合为单一终极模型[30] - 三大关键突破:显著降低幻觉生成、提升指令遵循精度、减少迎合性回答,核心场景(文本创作、编程开发、健康咨询)性能全面提升[30] 技术性能与基准测试 - 数学领域无工具辅助下AIME 2025测试达94.6%,编程领域SWE-bench Verified 74.9%/Aider Polyglot 88%,多模态MMMU 84.2%,健康领域HealthBench Hard 46.2%[4][31] - GPT-5 Pro在GPQA基准测试创88.4%新纪录(无工具辅助),内部评估显示其在40多个职业领域综合表现超越人类专家及前代模型[4][61] - 多模态能力覆盖视觉、视频、空间推理,可精准解析非文本输入(图表、演示文稿等)[51] 产品商业化与定价 - 提供免费版、Plus和Pro三档计划,免费版具备"博士级智能"基础推理功能,Pro版开放最高性能模型[4] - API定价:标准版每百万输入Token 1.25美元/输出Token 10美元,mini/nano版更便宜[4] - 微软生态全线接入(Microsoft 365 Copilot、GitHub Copilot、Azure AI Foundry),模型基于Azure AI超算训练[68][69][70] 应用场景演示 - 教育领域可快速生成数百行代码及互动内容(如伯努利效应解释),写作质量优于GPT-4o[7][8] - 编程能力支持全流程开发(如法语学习网页),语音模式升级后支持自然语调调节及长对话,适配语言学习[8][10] - 健康功能优化,现场展示癌症病情解释案例,被定位为"迄今最佳健康模型"[12] 争议与行业对比 - 现场出现跑分图错误及幻觉案例争议,部分观点认为错误源于训练数据本身偏差[13][21][23][24] - 行业评价认为闭源与开源模型差距缩小,GPT-5编程性能仅领先消费级开源模型10%,AGI发展或放缓[26] - 对比前代模型,GPT-5在视觉推理等场景输出token量减少50-80%,效率显著提升[64][65][66] 模型架构与版本迭代 - GPT-5系列包含gpt-5-main(基础版)、gpt-5-thinking(推理版)及Pro版本,全面替代GPT-4o/o3系列[72][74] - GPT-5 Pro取代o3-pro,专攻高复杂度任务,支持并行测试计算,在科学问题(如GPQA)表现领先[72]
GPT-5正式发布 ,Open AI 奥特曼称“是世界上最好的模型”,马斯克“拆台”,A股多只ChatGPT概念股大跌
搜狐财经· 2025-08-08 10:56
GPT-5发布与性能特点 - OpenAI于8月7日正式推出新一代AI模型GPT-5 这是继2022年11月ChatGPT和2023年3月GPT-4后时隔两年半的重大升级 [1] - 公司CEO称GPT-5为"世界上最好的模型" 在实现通用人工智能(AGI)道路上迈出重要一步 且是"迄今为止最强大的编码模型" [1] - 新模型在编码、数学、写作、健康、视觉感知等领域性能卓越 例如仅通过提示即可创建网站、应用程序和游戏 官网展示案例包括网页游戏、像素画图板等工具 [1] 模型优化与开放策略 - GPT-5减少了对人类的"阿谀奉承"行为 通过改进训练使该概率从14.5%降至6%以下 使对话表现更接近人类朋友 [2] - 模型面向所有用户开放 Plus会员可获得更多使用量 Pro会员可访问GPT-5 Pro版本 该版本具有扩展推理能力并提供更全面准确的答案 [2] - 马斯克在X平台称"Grok 4在ARC-AGI上击败了GPT-5" 引发网友对Grok 4推理能力与GPT-5性价比的讨论 [2] 资本市场反应 - A股ChatGPT概念板块指数下跌1.95%至1947.98点 多只成分股出现大幅下跌 [3][4] - 金现代股价下跌11.50%至13.31元 流通市值42亿 鼎捷数智下跌10.66%至59.02元 市值159亿 [3] - 万兴科技下跌9.22%至79.13元(市值136亿) 能科科技下跌8.41%至39.73元(市值97.2亿) 其他成分股如赛意信息、用友网络等均下跌超5% [4]