Workflow
GPT-5
icon
搜索文档
GPT-5.3上线Codex!OpenAI回应Claude新模型只用了15分钟
量子位· 2026-02-06 10:30
文章核心观点 - OpenAI在Claude Opus 4.6发布仅15分钟后,迅速推出了其最新最强的编程模型GPT-5.3-Codex,标志着两大AI公司在编程模型领域展开了激烈的竞争 [1] - GPT-5.3-Codex在编程能力、计算机使用、效率及美学设计上均有显著提升,并首次参与了自身的训练过程,实现了“自我加速” [27][28] - 除了模型升级,OpenAI还推出了旨在将AI智能体融入企业工作流的ToB平台Frontier,以及与Ginkgo合作利用GPT-5降低蛋白质合成成本的AI4S项目 [36][39] 模型性能与技术亮点 - **编程能力显著增强**:GPT-5.3-Codex在SWE-Bench Pro上实现了57%的得分,在TerminalBench 2.0上达到76%,在OSWorld上达到64%,均优于前代模型 [11][18] - **效率大幅提升**:完成相同任务时,所需token数量不到前代GPT-5.2-Codex的一半,单token处理速度提升超过25% [11][22] - **计算机使用能力突出**:模型在OSWorld基准测试中表现优异,能协助完成如制作金融PPT、处理电子表格等专业知识密集型职场任务 [7][9][24][25] - **设计美学与意图理解进步**:新模型生成的游戏Demo和网页UI设计感更强,对用户“意图”的理解也更深入 [2][5][6] 模型训练与自我应用 - **参与自身训练**:GPT-5.3-Codex是OpenAI首个参与“自我加速”的模型,其早期版本被用于调试自身训练流程、管理部署和评估测试结果 [28] - **加速研发流程**:在训练阶段,研究团队使用Codex监控调试任务并追踪模型行为变化;在数据分析中,模型能在3分钟内从数千个数据点提炼关键洞见;工程团队也借助其优化测试框架并定位缺陷 [29][30][31][32] 公司战略与业务动向 - **推出ToB平台Frontier**:OpenAI推出旨在让AI智能体真正进入公司工作流的平台,提供共享上下文、入职引导、实践学习等功能,已获HP、Intuit、Oracle、State Farm、Thermo Fisher和Uber等企业采用 [34][36][37][38] - **拓展AI for Science (AI4S)**:OpenAI与合成生物学公司Ginkgo合作,将GPT-5接入自主实验室,使模型能提出并执行实验方案,据称将蛋白质合成成本降低了40% [39][41] 行业竞争格局 - **头部公司竞争白热化**:OpenAI与Anthropic在编程模型上展开“对轰”,双方相继发布Claude Opus 4.6和GPT-5.3-Codex,引发社区用户分派讨论 [1][13][15] - **性能对比优势明显**:根据官方对比表,GPT-5.3-Codex在多项基准测试(如SWE-Bench Pro、Terminal-Bench 2.0、OSWorld-Verified、Cybersecurity Capture The Flag)上的表现均明显超越前代GPT-5.2-Codex和GPT-5.2 [12]
一记警钟:英伟达对OpenAI的重新评估,为何最应触动微软?
华尔街见闻· 2026-02-04 15:53
英伟达对OpenAI投资态度变化 - 英伟达首席执行官黄仁勋表示,此前宣布对OpenAI的1000亿美元投资“并不具约束力”,并私下批评OpenAI缺乏商业纪律 [1] - 该投资更可能以“数百亿美元级别”的形式出现在OpenAI当前融资进程中,且发生在潜在IPO之前 [1] - OpenAI正与英伟达、微软、亚马逊就约1000亿美元的融资进行讨论,这与先前提出的基础设施交易相互独立 [1] OpenAI面临的经营与执行挑战 - 黄仁勋私下质疑OpenAI的经营与执行纪律,为OpenAI的融资叙事与合作伙伴信心投下变量 [3] - OpenAI首席执行官Sam Altman的管理风格持续令外界不安,包括其在2023年底被戏剧性解雇后又回归,以及一系列结构复杂、金额惊人的交易安排 [3] - 这些交易安排使OpenAI背负了高达1.4万亿美元的计算资源承诺,规模约为OpenAI预计2025年收入的100倍 [3] - OpenAI曾试图通过GPT Store与自定义GPT建立开发者市场,但由于缺乏清晰战略而“熄火” [3] 微软的产品执行力困境 - 微软通过重组协议获得了OpenAI知识产权与模型的独家访问权直至2032年,并将在2025年8月将Copilot接入OpenAI最新的GPT-5模型 [2] - 然而,Copilot的产品体验被用户诟病为“混乱、受限、难用”,且在功能形态上落后于竞争对手,凸显模型质量与产品落地之间的断层 [2][4] - 尽管拥有Windows、Office与LinkedIn,Copilot却无法实现竞争对手产品(如Anthropic的Claude Cowork)所具备的操作个人电脑、整理文件、生成PPT与Excel等能力 [4][5] - 行业观察者指出,如果微软未来六个月无法发布相当于Claude Cowork的产品,“就会有人要下台”,并称微软在“模型质量”和“执行能力”之间存在明显脱节 [5] 微软的投资回报与市场矛盾 - 微软早期对OpenAI的130亿美元投资,已对应约27%的股权,估值约1350亿美元,超过原始投入的10倍 [4] - 尽管资本账面回报可观且拥有顶级模型访问权,但微软未能将技术优势充分转化为产品胜势,面临“手握顶级模型却难以兑现优势”的矛盾 [2][4] AI行业竞争焦点转移 - 市场竞争正在从“谁的模型更强”转向“谁更会落地” [1] - OpenAI的合作方需要在“模型能力持续领先”与“商业化与组织执行波动”之间,为不确定性定价 [3]
情人节前夕,OpenAI要正式下架“最有感情”的GPT-4o
36氪· 2026-01-30 20:03
OpenAI模型更新与GPT-4o退役 - OpenAI宣布将于2026年2月13日正式从ChatGPT中退役经典大模型GPT-4o,距离其上次因用户抗议而恢复服务仅过去半年[1] - 一同退役的模型还包括GPT-4.1、GPT-4.1 mini、OpenAI o4-mini以及此前已宣布将退役的GPT-5即时版与深度思考版,ChatGPT将迎来一波密集的模型更新[3] - OpenAI明确表示,这些调整暂时不影响API接口,相关服务仍会保留[3] GPT-4o退役的背景与用户反应 - OpenAI解释退役原因是绝大多数用户已转向GPT-5.2,每天只有0.1%的用户仍在主动选择GPT-4o,因此退役时机“已经成熟”[5] - 部分用户对退役表示理解,认为新产品更有趣,功能更强[7] - 开发者和应用构建者则更为务实和担忧,许多应用程序当初因性价比高而选择了GPT-4o,希望OpenAI能给予足够时间寻找替代方案[7] - 有付费用户强烈质疑OpenAI公布的0.1%使用率数据,认为该数据因GPT-4o已从免费用户中移除而被歪曲,并感到被辜负和愤怒[8] - 部分用户与GPT-4o建立了情感连接,视其为关系、对话和创意的根基,其退役被形容为“驱逐数字生命体”[8] - 退役日期2月13日恰逢情人节前夕,在社交平台引发讨论,部分用户视为“冷酷无情”的安排[8] 行业模型迭代与退役常态 - 顶级模型的迭代周期目前已缩短至12到18个月,一个模型的巅峰寿命往往不足两年[11] - 厂商大约每三个月就会进行一次小版本快照优化[11] - 自ChatGPT火爆以来,多家厂商已有众多明星模型退役,包括OpenAI的GPT-3.5 Turbo早期版本、Codex系列、DALL·E 2 API版,Google的PaLM 2全系列、Bard、Gemini 1.0,Anthropic的Claude 1.x/2.x系列,以及Meta的Llama 2全系列等[11] - 根据公开信息,2026年还将有大量模型陆续退役,涉及OpenAI、Anthropic、Google等主要厂商[11] 行业成本、竞争与退役模型去向 - 受益于专用芯片效能飞跃及量化算法突破,大模型的API调用价格正以每年80%以上的幅度下降,2024年昂贵的复杂推理任务到2026年成本已降至当初的十分之一甚至更低[12] - 训练一个前沿级别模型的成本已从最初的数千万美元飙升至如今的10亿甚至50亿美元量级[12] - 巨大的计算资源消耗和稀缺的高质量标注数据,使得行业演变为少数科技巨头之间的超级军备竞赛[13] - 高昂的运维成本迫使厂商必须定期执行“模型大清洗”,将表现不佳或能效比较低的旧模型强制退役,以回收昂贵的GPU算力资源来运行更高效的新一代系统[13] - 退役模型往往转化为“教材”,通过知识蒸馏技术将智慧传递给更小、更快的学生模型,或作为开源模型被下载到企业本地服务器,在私有化场景下继续处理低敏感任务,开启作为“数字遗产”的二次生命[13]
再见,白月光 GPT-4o
36氪· 2026-01-30 10:32
公司动态:模型更新与用户反馈 - OpenAI宣布将于当地时间2月13日正式从ChatGPT平台下线GPT-4o、GPT-4.1、GPT-4.1 mini以及OpenAI o4-mini等多个旧版模型 [1][3] - 目前API端暂不受此次下线影响 [5] - 公司表示下线旧模型是为了将团队精力集中到当前主流使用的模型上,从而更快更好地推进改进 [20] 用户反应与市场影响 - 下线消息在X、Reddit等社交平台引发大量讨论,部分用户表达了不满与怀念 [5][6][7] - 去年8月GPT-5发布并一度下架GPT-4o时,曾引发网友激烈反对,甚至出现ChatGPT退订潮 [10][12] - 根据OpenAI官方博客,目前每天仍选择使用GPT-4o的用户仅占0.1%,绝大多数使用量已转向GPT-5.2 [19] 产品特性与设计演变 - GPT-4o曾因“谄媚事件”引发关注,其过度讨好用户的对话模式被公司分析认为会附和错误观点、放大负面情绪,带来安全隐患 [12][13][14] - 用户反馈显示,部分用户并非将ChatGPT仅作为生产力工具,而是寻求情感交流与“更有温度”的对话风格 [17] - 用户对GPT-4o的反馈直接影响了后续GPT-5.1和GPT-5.2的设计方向,新版本在“个性”方面做了改进,增强了对创意构思的支持,并提供了更多自定义选项 [19] - OpenAI CEO承认GPT-5.2版本为了专注推理和编码,牺牲了部分写作能力,但强调未来模型将追求通用性 [19] - 公司表示将继续根据用户反馈改进ChatGPT,包括提升个性与创造力,减少不必要的拒答,以及解决过度谨慎或说教式的回复问题 [19] 公司战略与未来方向 - OpenAI正在推进面向18岁以上成人的ChatGPT版本,核心原则是“把成年人当成年人对待”,在合理的安全边界内扩大用户选择与自由,并已上线年龄预测功能 [20] - 公司表示理解部分用户对失去GPT-4o会感到沮丧,但下线决定是为了集中资源推进主流模型的改进 [20]
摩根士丹利2026年十大预测:AI能力分化加剧,科技巨头加速整合能源设施
硬AI· 2026-01-27 17:44
OpenAI模型开发路线修正 - 公司承认在ChatGPT-5系列开发中过度追求编程与推理能力,导致模型在写作等通用能力上出现“偏科”和失衡 [5][7][8] - 未来将回归“真正高质量的通用型模型”发展路线,在单一模型内同时推进编程智能并迅速补齐其他能力短板 [5][9][43] - 公司内部正在使用特殊版本的GPT-5.2模型,科学家反馈显示其带来的科学进展“已经不再是可有可无的水平” [9][61] 软件开发范式转型 - 未来软件工程师的需求不会减少,反而会“大幅增加”,全球GDP中将有更大比例通过此方式创造 [10][11][21] - 工程师的工作重心将从底层的“敲代码与调试”转向更高层级的“让系统达成目标”,写代码行为本身的重要性将显著下降 [2][10] - 未来几年将出现大量专为个人或极小群体量身定制的软件,每个人都能以极低成本为自己不断定制专属工具 [3][10][20] AI模型能力与经济性演进 - 模型学习新技能的速度将超越人类,未来可实现“只听一次解释”甚至“无师自通”地掌握陌生环境与复杂工具 [4][11][63] - 模型发展进入新阶段,市场关注点从单纯降低成本扩展到要求更快的输出速度,用户甚至愿意为速度支付更高价格 [12] - 公司有信心将模型成本降至非常低的水平,让“大规模运行Agent”在经济成本上真正可行,并预测到2027年底成本至少降低100倍 [13][47][117] AI安全策略转向 - 生物安全是2026年AI可能出问题的最大隐忧,公司对此感到“非常紧张” [7][14][71] - 安全策略需从“禁止与封堵”的旧模式,转向提升整体抗风险能力的“韧性”模式,通过技术进步构建类似防火规范的安全基础设施 [6][15][72] - AI既是风险本身也是解决方案的一部分,需要全社会努力建立“宏观安全基础设施”来应对 [15][73][88] 未来竞争格局与稀缺资源 - 在AI极大降低创作和生产成本的丰裕世界里,软件产品本身不再稀缺 [7] - 人类的“注意力”与“原创性好创意”将成为商业竞争中最核心且稀缺的资源 [7][27][29] - 公司采用AI工具后计划大幅放慢人员规模增长速度,因为可以用更少的人做更多的事,未来的公司形态将是拥有大量AI同事而非零人类 [99][101][103] AI对教育、创意及社会的影响 - 在发展心理学影响未明之前,幼儿园阶段没有必要引入AI,该阶段孩子应通过实物和真人互动学习 [16][90] - 在创意领域,消费者对完全由AI生成的作品主观欣赏度会显著下降,而包含人类指导的作品则更易被接受 [106][108][110] - AI将带来巨大的通缩效应,预计到今年年底,仅需100到1000美元的推理成本加一个好点子,就能开发出过去需要整个团队一年才能完成的软件 [38][40]
“我们确实搞砸了”!奥特曼罕见直播“反思”:GPT-5曾走弯路,写代码将不再重要
华尔街见闻· 2026-01-27 15:56
OpenAI模型开发路线修正 - 公司承认在ChatGPT-5系列模型开发中出现路线偏差,过度专注于编程和推理能力而牺牲了写作等其他能力,导致模型能力失衡 [3][4][25] - 公司明确表示将回归“真正高质量的通用型模型”发展路线,在推进编程智能的同时迅速补齐其他能力短板 [3][4][27] - 公司内部正在使用一个特殊版本的GPT-5.2模型,科学家反馈显示这些模型带来的科学进展“已经不再是可有可无的水平了” [4][41] AI对软件工程与就业的影响 - 公司预测AI将重塑软件开发方式,传统意义上的“写代码”工作重要性将下降,工程师花在敲代码、调试代码上的时间会明显减少 [3][5][10] - 但软件工程师岗位需求不会减少,反而会“大幅增加”,未来从事工程师工作的人数可能会大幅增加,全球GDP中会有更大一部分通过这种方式创造 [3][5][10] - 未来将出现大量专为个人或极小群体量身定制的软件,每个人都会不断给自己定制工具 [5][10][33] 模型能力进化与经济性 - 公司预测在未来几年里,模型学习新技能的速度会比人类还要快,当面对完全陌生的环境、工具或技术时,只需解释一次甚至无需解释就能掌握 [5][43] - 模型发展进入新阶段,市场关注点不再只是降低成本,“速度”维度开始变得同样重要,有些场景用户愿意为更快的输出付更高的价格,哪怕价格贵很多 [6] - 公司有信心将模型成本降到非常低,让“大规模运行Agent”在经济成本上站得住脚,并预测到2027年底成本至少会降低100倍 [6][29] AI安全策略转向 - 公司对2026年AI可能出现的安全问题感到“非常紧张”,其中生物安全是最大隐患 [3][7][48] - 认为当前主要依靠限制访问权限、加分类器的“封堵式”安全策略撑不了多久,必须转向提高整体抗风险能力的“韧性式”安全 [3][7][50] - AI既是问题本身,也是解决方案的一部分,需要全社会努力构建类似防火规范的安全基础设施 [7][50] 市场推广与注意力经济 - AI让软件开发变得容易,但市场推广(GTM)让产品获得用户关注依然极其困难,这始终是建立企业的难题 [12][13][14] - 即使在“激进的富足”成为现实的未来,人类的“注意力”仍然是仅存的稀缺商品,竞争将围绕如何获取注意力展开 [15][16] - 软件产品本身不再稀缺,人类的“注意力”与“原创性好创意”将成为商业竞争中最核心且稀缺的资源 [5][39] 模型专用化与通用化前景 - 公司认为未来主流属于非常优秀的通用模型,即使想要一个擅长编程的模型,也希望它具备良好的写作和沟通能力 [4][25][26] - “智能”是一种令人惊讶的通用能力,公司相信可以在单个模型中把所有事情都做得很好 [26] - 目前是推动“编程智能”特别重要的时刻,但公司会努力在其他方面也迅速赶上并做到卓越 [27] 公司运营与招聘策略 - 公司计划大幅放慢人员规模的增长速度,因为认为可以用更少的人做更多的事,但会继续招聘软件开发人员 [67] - 未来的公司形态倾向于拥有少量员工和大量AI同事,而非完全没有人类的纯AI公司,积极采用AI对公司生存至关重要 [68][69] - 面试方式需要改变,未来可能通过让候选人在短时间内完成一项过去需要两周的任务来评估其高效使用新工具的能力 [68] AI对创意产业的影响 - 观察显示,如果被告知作品是由人制作的而不是AI,消费者会报告显著更高的欣赏度和满意度,这是一个深刻趋势 [71][72] - 人们非常在乎作品背后的人,如果艺术作品哪怕只有一点点人类的指导,人们的负面情绪反应就会减弱 [72] - 人、他们的人生故事、他们的编辑或策划过程,将变得非常重要,市场可能不会想要完全由AI生成的艺术 [72] 个性化、记忆与隐私 - 公司将大力推进记忆和个性化功能,因为其能提供更好的工具使用体验,用户需求明确 [73][74] - 用户倾向于让AI了解其数字生活的全部以获取最大效用,而非手动进行复杂的记忆分组 [74] - 公司需要非常认真地对待安全和隐私,因为AI将深入了解用户一生,社会也需要建立相应的规范 [74] AI的通缩效应与社会影响 - AI将带来巨大的通缩效应,对经济构成巨大的通缩压力,许多东西将变得极其便宜 [22][23] - 到2024年底,仅需100到1000美元的推理成本加上一个好点子,就能开发出过去需要整个团队花一年才能完成的软件,这极大地赋能了个体 [23] - 需要防止AI导致权力和财富的高度集中,这应成为政策的主要目标之一,以确保其成为社会的平衡力量 [23][24]
Altman承认“搞砸了”!曝 GPT-5.2 牺牲写作换顶级编程,明年成本降 100 倍,实锤Agent 已能永久干活
AI前线· 2026-01-27 11:50
OpenAI战略方向与模型发展蓝图 - OpenAI正在引领行业进入一个智力成本极低、软件形态从“静态”转向“即时生成”的剧变期[4] - 公司承认在GPT-5.2的研发中“搞砸了”写作能力的优先级,将有限算力资源倾斜于推理、编码和工程能力等硬核智力指标[4][8] - 公司战略重心是通过Scaling Law先攻克人类智力的最高地带,再回头填补审美和表达的细节,最终在全维度实现“智力平权”[5] - 公司目标是到2027年底,让GPT-5.2级别的智力成本至少降低100倍[5][11] - 公司认为智力是一种“可塑的资源”,当模型具备顶级推理引擎后,写作等能力的回归只是时间问题[5][9] 成本、速度与未来软件形态 - 市场出现微妙转向,开发者对“速度”的渴求正在超越对“成本”的关注,特别是当智能体处理长程任务时[6][11] - OpenAI未来可能提供两种路径:一种是极致廉价的“智力自来水”,另一种是极速反馈的“智力推进器”[6] - 未来的软件不应是静态的,计算机应能直接生成“即时应用”来解决特定问题,形成“随需随生、用完即弃”的模式[6][7] - 软件将根据用户习惯进行极致定制,工具会不断进化并向个人需求收敛,最终形成独属于个人的、动态进化的生产力系统[7][12] - 在OpenAI内部,员工已习惯用编程模型来定制自己的工作流,每个人的工具都完全不同[12] 对创业者与开发者的建议 - 建立成功初创公司的核心规则未变,仍需解决获客、市场策略、创造粘性及形成网络效应等问题[13] - 创业者应构建“模型越强,产品就越强”的业务,避免只在模型边缘做“小补丁”[13] - 对于智能体执行长流程任务,开发者应先拆解任务,让智能体能够自我验证每一个中间步骤,再逐步扩大其职责范围[14] - 目前通过SDK运行的特定任务已经可以近乎永久地运行下去,实现长期自主运行的关键在于任务复杂度和理解深度[13][14] AI的能力边界与科研应用 - AI模型本质上是一个“通用推理引擎”,未来的里程碑是模型能通过一次解释或自主探索,极其可靠地学会使用全新的环境、工具或技术[16] - 当前的AI对科学家而言像是“无限量的博士后”,能帮助同时探索多个新问题,进行广度搜索[17] - 实现完全闭环的自主科研仍有很长的路要走,顶尖研究者仍需深度参与以纠正模型的直觉偏差[17] - 在物理实验方面,倾向于构建一个由全球科研社区贡献实验数据的、更分布式、更聪明、更高效的科研生态,而非公司自建自动化实验室[17] - GPT-5.2已经让内部科学家感受到了非平庸的科学进展[15] AI安全与治理范式转变 - 在AI安全,尤其是生物安全领域,世界需要完成一次根本性的转变:从“封堵”转向“韧性”[19] - 类比火灾安全,社会需要制定规范、发明阻燃材料并建立体系来提高对AI潜在风险的韧性,而非仅仅试图禁止或限制[19] - AI在生物恐怖主义和网络安全方面会成为真实的问题,但同时也是这些问题的重要解决方案[19] - 如果2026年AI出现一次“明显、严重”的失败事件,生物安全是一个相当合理的“风险爆点”方向[20] - 需要全社会层面的努力来建设具有韧性的基础设施,而非依赖少数受信任的实验室封堵风险[20] AI对社会协作与教育的影响 - 在一个充满AI的世界里,人与人之间的连接会变得更有价值,而不是更没价值[24] - AI会以前所未有的方式让多人协作成为可能,例如五人团队与一个AI共同工作,生产力会被大幅放大[24] - 总体上反对在幼儿园阶段使用电脑和AI,认为该阶段应注重户外活动、接触真实物体和人际互动[30] - 当前的教育体系需要改变教学和评估思考能力的方式,以适应AI工具的存在,而非假装其不存在[23] - 那10%极端自学能力很强的学习者已表现出色,需要找到新方式重构课程体系以带动其他学生[23] Agent大规模部署的潜在风险 - 随着智能体开始大规模运行并直接操作生产系统,最被低估的风险是人们因其强大的能力和便利性而放松警惕[25][26] - 工具的失败概率可能很低,但一旦失败,后果可能是灾难性的,例如在系统中埋下安全漏洞[26] - 随着模型变强、变复杂,如果存在微妙的错位或在长期使用后出现新的系统性问题,风险会加剧[26] - 围绕构建整体性的安全基础设施,本身值得诞生一家伟大的公司[28] - 人们可能会习惯并信任某个阶段的模型行为,却没有构建足够健全的安全设施,从而在不知不觉中走向危险状态[26][27]
计算机行业月报:AI应用全面加速,DeepSeek V4有望深刻改变全球AI的竞争格局
中原证券· 2026-01-22 18:24
报告行业投资评级 - 给予计算机行业“强于大市”的投资评级,并维持该评级 [1][7] 报告核心观点 - AI应用在2025年底至2026年初呈现加速落地趋势,预计这一趋势将在2026年持续深入 [7] - DeepSeek有望在2026年2月发布的V4模型编程能力领先,或将给海外封闭模型厂商带来较大盈利压力,深刻改变全球AI市场竞争格局和产业生态 [7] - 在芯片国产化方面,英伟达H200仍受禁令影响,国产芯片训练大模型有望成为2026年新趋势,为国产厂商提供持续发展机会 [7] 行业数据总结 - **软件行业整体**:2025年1-11月软件业务收入13.98万亿元,同比增长13.3%,增速已连续9个月回升 [13] - **软件行业利润**:2025年1-11月软件业务利润总额16954亿元,同比增长6.6%,增速较1-10月下降1.1个百分点,低于收入增速6.7个百分点 [15] - **软件出口**:2025年1-11月软件业务出口金额569亿美元,同比增长8.1%,约占行业收入的3.0% [16] - **高景气子行业**:IC设计(集成电路设计)2025年1-11月收入同比增长16.5%,高于软件行业整体增速3.2个百分点,是景气度最高的子行业 [18] - **其他子行业增速**: - 云计算+大数据服务:同比增长12.8% [18] - 基础软件:同比增长12.9% [21] - 工业软件产品:同比增长10.2% [21] - 电子商务平台技术服务:同比增长12.5% [28] - 信息安全:同比增长6.9% [29] - 嵌入式系统软件:同比增长9.3% [29] - **收入结构**:2025年1-11月信息技术服务收入增速14.6%,占比软件业务整体收入比重提升至68.8% [33] AI领域发展总结 - **大模型竞争格局**:形成中美对抗趋势,美国头部模型(如GPT-5、Gemini 3 Pro、Claude Opus 4.5)多为闭源,中国头部模型(如DeepSeek-V3.2、Qwen3-Max、Kimi K2)多为开源 [42][45] - **模型性能**:根据Artificial Analysis排名,OpenAI的GPT-5、Anthropic的Claude Opus 4.5、谷歌的Gemini 3 Pro位列前三;国产模型中,智谱GLM-4.7、DeepSeek V3.2等紧随其后 [46] - **DeepSeek V4预期**:媒体报道其编程能力将超过Anthropic的Claude和OpenAI的GPT系列,可能对后两者营收造成明显冲击 [7] - **大模型创业公司**:智谱和MiniMax于2026年1月在港股上市 [54] - **智谱**:2025年上半年收入1.91亿元,同比增长325%;研发费用15.95亿元,同比增长86%;收入以2B为主,85%来自本地业务 [54][57][59] - **MiniMax**:2025年1-9月收入3.74亿元,同比增长175%;研发费用12.62亿元,同比增长30%;收入以2C为主,73%来自海外 [54][55][59] - **国产芯片训练趋势**:2026年有望成为新趋势,智谱GLM-Image模型已在华为昇腾芯片上完成全程训练 [7][71] - **模型调用量与市场格局**: - **全球MaaS市场**:截至2025年10月,OpenAI、谷歌云、字节市场份额分别为31%、19%、15% [72] - **中国公有云市场**:2025年上半年,字节市场份额49.2%,阿里27%,百度17% [75] - **AI原生APP月活**:2025年12月,豆包1.55亿、DeepSeek 0.82亿、元宝0.21亿、蚂蚁阿福0.10亿、千问0.09亿 [81] - **调用量增长**:字节豆包大模型日均token使用量于2025年12月突破50万亿,较上年同期增长超10倍 [82] - **AI Agent**:2025年12月,Meta以20亿美元收购Manus,成为AI Agent发展里程碑 [85] - **AI手机**:2026年手机端AI应用或将全面加速 [86] - 2026年1月12日,苹果与谷歌达成深度合作,谷歌Gemini核心模型将植入苹果系统 [7][89] - 2026年1月15日,阿里千问App全面接入淘宝、支付宝等阿里生态业务,实现AI购物功能 [7][89] - **AI编程**: - 科技大厂持续裁员,如微软计划2026年1月裁员5%-10% [90][95] - Anthropic的Claude Code年化营收在2025年12月已达10亿美元 [92] - DeepSeek V4的开源可能对Anthropic和OpenAI在AI编程领域的营收造成冲击 [94] - **AI医疗**: - 2026年1月,OpenAI推出“ChatGPT Health”并收购AI医疗初创公司Torch [97] - 全球AI医疗市场规模预计从2024年的266.5亿美元增长至2033年的5055.9亿美元,年复合增长率38.8% [97] - 百川开源的医疗大模型Baichuan-M3在HealthBench评测中位列全球第一 [100] 国产化进程总结 - **国产芯片替代加速**: - 2025年1-11月,我国集成电路国产化占比约为17% [102] - 英伟达2025年第三季度来自中国大陆的收入占比降至5% [103][107] - 2025年上半年,我国AI芯片国产化比率从2024下半年的34%提升至35% [107] - 国内AI芯片企业(如摩尔线程、沐曦股份、燧原科技等)集中上市 [108] - **国产芯片厂商业绩**: - 寒武纪2025年第三季度收入17.27亿元,同比增长1333% [111] - 海光2025年第三季度收入40.26亿元,同比增长69.60% [111] - 摩尔线程2025年前三季度收入增长183%,沐曦增长468% [111] - **华为昇腾芯片**:计划在2026年第一季度发布新一代AI芯片昇腾950PR,加入自研HBM HiBL 1.0等技术 [116] - **鸿蒙系统**: - 截至2025年12月30日,鸿蒙5和鸿蒙6系统终端数量已突破3600万,每日新增10万台设备 [7][119] - 2025年第三季度,鸿蒙占据中国手机操作系统18%的市场份额,位居第二;全球市场份额4%,位居第三 [120] - **EDA(电子设计自动化)**: - 美国对华EDA出口政策多变,存在供给不确定性 [127] - 2025年国内EDA行业股权交易加快,头部企业产品覆盖能力持续增强 [131][133] - 2020年中国EDA市场中,数字设计领域占比65%,模拟设计类占比17% [133] - 2025年第三季度,芯原股份新签订单15.93亿元,同比增长145.80%,其中AI算力相关订单占比约65% [139] - **超节点(Scale Up)技术**:国产厂商(如华为、阿里、中科曙光)通过超节点高密度集成弥补芯片制程不足,提升整体算力 [143][146] - 华为Atlas 900(384颗昇腾芯片)算力接近英伟达GB200 NVL72的两倍 [146] - 中科曙光发布全球首个单机柜级640卡超节点scaleX640 [146] 算力与基础设施总结 - **AI云市场规模**: - Omdia预测,2025年中国AI云市场规模达518亿元,2030年将达1930亿元 [7] - 阿里云提出2026年发展目标是拿下全年中国AI云市场增量的80%,并判断2026年增量将数倍于2025年全量 [7] - **资本开支**:海外科技企业资本投入再创新高 [40] - **液冷技术**:因AI芯片功耗持续提升,液冷经济性凸显,渗透率预计将增长 [49] 投资建议关注公司 - **建议关注**:润泽科技(300442)、中科曙光(603019)、中科星图(688568)、华大九天(301269) [7] - **建议积极关注IPO进程**:长鑫科技、芯和半导体、合见工软 [7]
哈佛老徐:2026年初再看咱们与漂亮国,AI的胜负真的在大模型吗?
老徐抓AI趋势· 2026-01-22 09:07
AI全球竞争格局分析 - 2025年2月DeepSeek-VL与DeepSeek-R1凭借低算力下高性能引发全球关注,市场一度认为在AI大模型层面已追上甚至将反超美国[2] - 但随后GPT-5、Grok-4、Gemini 3等接连发布,性能持续增强,而DeepSeek后续更新未再引发同等震动,引发对2026年初双方真实实力对比的重新审视[8] - AI竞争并非单纯比较ChatGPT与DeepSeek等应用,而是一整套五层技术栈的竞争:能源、芯片、基础设施、AI大模型、AI应用[11] 第一层:能源 - 在能源层,发电能力大约是美国的2倍,该层几乎无争议地完胜[13] - AI发展速度已超出传统电网承载能力,GPU计算效率每年可提升10倍,但AI对算力需求增速达每年1万倍甚至10万倍、100万倍[13] - 解决算力需求不能仅靠“省电”,必须依赖更多、更便宜、更稳定的能源,美国重新工业化需同时建设芯片厂、超级计算机厂、AI工厂(大规模算力中心),均极度消耗能源[14] - 美国过去十多年系统性地贬低能源被视作战略级错误,现正被迫纠正[14] 第二层:芯片与底层软件 - 在芯片层,美国“领先好几代”(generations ahead)[16] - 常见误区一:只看硬件参数,忽视软件生态,芯片非“插上即用”,决定GPU性能能否被榨干的关键是底层软件生态如英伟达CUDA[17] - CUDA生态是几十年形成的全球协作成果,全球有几百万工程师为其写代码、做适配,追赶路径只有与CUDA兼容或用时间培育同级生态[19] - 常见误区二:将AI GPU视为“高级显卡”,两者完全不同[20] - 最新一代Blackwell AI系统单体重量达2吨,零件数量150万个,功率0.2兆瓦,价格300万美元,此类产品无法走私且定制门槛极高[20] - 谷歌TPU能成功因其自身实力(季度利润350亿美元、诞生过4位诺奖得主),英伟达作为全球市值最高公司之一,拥有最强融资能力、供应链号召力和工程经验,地位极难撼动[20] 第三层:基础设施 - 在基础设施层,“基建狂魔”优势显著,涉及土地、能源、厂房、配套建设,本质是重资产、重组织、重执行力的工程问题[22][23] - 在美国建设一个AI数据中心往往需要3年,相比之下建设速度极快[23] 第四层:AI大模型 - 在最强大模型上,美国在闭源模型领域领先约6个月,代表公司包括OpenAI(GPT)、Google(Gemini)、马斯克的Grok、Anthropic(Claude)[25] - 在开源模型上优势明显更强,开源对创业公司、大学科研、AI教学及行业整体进化至关重要,没有开源AI将成少数巨头玩具,正在构建长期红利极大的优势区[27] 第五层:AI应用 - 在AI应用层依然领先,原因有三:社会对AI的正向认知比例约80%(美国几乎相反);全球约50%的AI研究员是华人;应用转化速度快,历史上英国发明电但美国更快广泛应用并反超,AI同理,谁能更快将技术转化为现实生产力谁就赢[27] 机器人领域潜力 - 评估机器人潜力需看三点:需求、AI能力、机电工程能力(Mechatronics),是唯一的“三边形战士”,三点全中:作为制造业大国且面临用工荒导致需求巨大;AI能力强;机电工程能力全球顶级[31] - 相比之下,日本与德国需求强、机电强但AI偏弱;美国需求强、AI强但机电工程偏弱[31] - 去年全球部署100万台机器人,其中一半在部署,“文生图”与“用语言指挥机器人干活”原理相同,机器人时代已近在眼前(around the corner)[33] AI对工作的影响 - AI的风险并非导致失业,而是“任务被重写”,Job(工作)与Task(任务)不同,任务会被大量替代,但工作的目标是交付结果、服务人[35] - 举例:7-8年前计算机视觉成熟,有人预测5年后放射科医生会消失,但8年后放射科医生反而变多,因为“看片”只是任务之一,诊断疾病才是工作目标[35] - 英伟达工程师几乎人手一个AI助理,但反而更忙,应对AI恐惧的最佳方法是亲自使用它[37] AI投资逻辑 - AI不是简单概念或单一模型,而是一整套五层结构,真正的机会来自不同层在不同时间点的变化[38] - 投资应避免尚未被验证的“纯概念”,如小型核电或量子计算,当前最大问题在于未被验证,纯概念可能上涨但难持续,长期回报来自已被验证且正在扩散的方向[38] - 强调投AI要看结构而非概念[37]
海外AI年度复盘及财报综述:狂欢将尽还是新周期开启?
东吴证券· 2026-01-21 17:57
报告行业投资评级 - 增持(维持) [1] 报告的核心观点 - AI产业正从2024-2025年的狂热扩张期,逐步转向需求兑现与效率竞争并重的新周期,市场存在局部泡沫而非系统性崩盘 [5] - 2026年将成为AI产业分化加剧、商业闭环验证的关键年份,投资逻辑将从泛AI概念普涨转向精选真实变现能力、成本优势与护城河的结构性机会 [5] - 风险主要集中于以OpenAI为核心、扩张激进的生态链条,而看好谷歌的全栈整合优势及Anthropic的专注和成本控制策略 [5] 根据相关目录分别进行总结 1. AI投资:泡沫与革命并存,局部风险而非系统崩盘 - 市场泡沫论在2025年第三季度集中发酵,多数AI相关美股财报后股价回调,市场对利好消息反应有限、对利空消息更为敏感 [5][15] - 市场主要焦虑点集中在巨额资本开支(CapEx)、折旧争议、循环订单与债务融资,但报告认为这些主要是阶段性情绪波动,而非基本面实质恶化 [5][21] - AI基础设施的实际使用生命周期远超市场担忧,推理需求爆发、Agent模式普及以及多模态应用落地,将为巨额CapEx提供更长回报周期支撑 [5] - 横向划分阵营:以OpenAI为核心、与微软深度绑定的生态链条存在现金流压力与战略分散风险;以Anthropic和谷歌为代表的阵营策略更稳健聚焦 [5][74] - 纵向产业链划分:上游硬件环节基本不存在泡沫;云服务层面的云巨头相对稳健而新云公司风险较高;模型层虽普遍亏损但后期利润弹性大;应用层高度分化 [74][86] 2. 算力环节:英伟达霸权下的暗流涌动 - 英伟达2025年业绩亮眼,数据中心收入同比翻倍,Blackwell供不应求,毛利率维持70-80%高位 [5] - 但英伟达一家独大格局正被多元竞争取代,ASIC芯片在推理场景的能效与成本优势逐步显现,为其传统护城河带来挑战 [5] - 谷歌TPU v7全栈优势显著,总拥有成本远低于英伟达方案,已向Anthropic等外部客户大规模输出 [5] - 亚马逊Trainium2扩张最激进,计划百万级部署并保持与英伟达双轨合作 [5] - 微软因与OpenAI深度绑定,自研芯片滞后且面临能源瓶颈,相对被动 [5] 3. 云服务市场的冰与火:巨头狂欢与新贵困局 - 云服务市场分化:三大云巨头(微软、谷歌、亚马逊)订单充裕、现金流稳健 [2] - 微软FY26Q1剩余履约义务达3920亿美元,同比增长51% [2] - 谷歌云2025年第三季度承诺余额1557亿美元,同比增长82% [2] - AWS虽增速相对平稳但10月新签订单已超第三季度全季 [2] - 云巨头盈利能力强劲:2025年第三季度谷歌云利润率提升至23.7%,AWS维持36.4%高位,微软Azure储备订单激增但毛利率承压 [2] - 新兴Neocloud(如CoreWeave、Nebius)陷入困局,表现为高估值、高负债与回款压力交织,财报后股价大幅回调 [2] - CoreWeave商业模式本质是“GPU租赁+高杠杆”,类似房地产开发商但面临更快的技术迭代风险,2025年第四季度预期收入环比增速仅13%,资本开支占收入超4倍 [2] 4. 模型层:从神话到工程,从追赶到突围 - 2025年核心脉络是AGI神话退场、工程化范式确立,中美技术差距已缩窄至6-9个月 [3][5] - 模型竞争格局分化明显: - OpenAI转向产品化但技术领先优势削弱,战略分散风险上升 [6] - Google凭借全栈优势(TPU+YouTube数据+DeepMind)强势回归,Veo3实现有声视频突破 [6] - Anthropic专注toB编程建立稳健现金流,Claude Code年度经常性收入在2025年10月已达10亿美元 [6] - 2026年大语言模型将聚焦“更快、更好、更便宜”,推理模型消耗token量是普通模型5.5倍,Agent模式多模型并行调用进一步推高算力需求 [3][6] - 多模态发展:输入端从组合式向原生多模态演进,输出端实现更长时长、更稳定的视频生成 [6] - 中国大模型群雄逐鹿,千问、DeepSeek、Kimi、智谱、MiniMax、豆包各具特色,在开源市场份额快速增长,对海外高定价模式形成冲击 [6] 5. 应用层:AI应用到底能长多大? - 需求验证的两大指标:2025年10月OpenAI与Anthropic合计年度经常性收入约200亿美元;OpenRouter平台2025年token消耗同比增长超300% [6] - toB市场商业化潜力高:2025年企业生成式AI总支出达370亿美元,同比增长超3倍,占据全球SaaS市场6%份额;垂直行业AI支出35亿美元,其中医疗健康独占15亿美元,法律6.5亿美元 [6] - toC市场呈现“通用chatbot主导+垂直AI大量死亡+少数场景顽强存活”格局,2025年通用chatbot占AI网页访问量80%以上 [6] - 编程与角色陪伴是顽强存活的场景:编程工具年度经常性收入高速增长;角色陪伴应用用户时长长、情感投入深、迁移成本高 [6] - 科技巨头内部赋能价值被低估:谷歌AI Overviews提升查询量并保持货币化率;亚马逊通过AI优化物流效率;百度、阿里、腾讯将AI嵌入原有生态 [6] 6. 投资建议 - 核心投资思路为“上游强alpha+云巨头稳健beta+应用层精选赛道” [7] - 上游算力硬件:看好英伟达,其Blackwell系列供不应求、毛利率高企,通过收购Groq补齐推理短板,是资本开支最大受益者 [7] - 云服务与全栈整合领域:建议关注谷歌与亚马逊,谷歌凭借TPU全栈优势、总拥有成本优势及Gemini与搜索深度融合展现强利润韧性;亚马逊通过Trainium百万级部署与AWS规模效应在成本控制与客户黏性上占据主动 [7] - 模型与应用层面:建议关注MiniMax与智谱,前者在多模态及角色陪伴场景实现较强商业化,后者抢占B端市场 [7] - 港股互联网公司:推荐阿里巴巴-W、腾讯控股、美图公司、快手-W,这些公司拥有庞大用户基础与数据飞轮,AI深度嵌入将驱动存量业务效率跃升与新增长曲线 [7]