行业投资评级 - 行业评级为“看好”,并维持此评级 [3] 报告核心观点 - 本周大模型行业主线延续模型能力迭代、Agent工作流落地、商业化体系重构和应用场景验证,边际变化主要在于商业化路径多元化探索、规模化调用下的资源与成本优化,以及国内MaaS商业化规模验证 [3] 国内厂商动态总结 - 字节跳动:根据IDC数据,2025年中国公有云上大模型调用量达1944万亿Tokens,同比增长16倍,其旗下火山引擎以49.5%的份额占比位居中国第一 [3][4] - 字节跳动:火山引擎大模型服务企业和个人用户超过150万,拥有万亿Token级企业客户超过140家,与全球Top10手机厂商中的9家深度合作,覆盖超过5亿手机终端,豆包大模型搭载超过700万辆智能汽车,覆盖超50个汽车品牌、145个车型 [4] - 字节跳动:发布Doubao-Seed-2.0-lite升级版,成为豆包家族首款全模态理解模型,支持视频、图像、音频、文本统一理解,Agent、Coding与GUI能力同步升级,每百万输入音频输入价格为9.0元 [4] - 字节跳动:将Seed-2.0-Pro模型价格降价50%,官网显示每百万输入/输出价格分别为1.6元/8.0元 [4] - 通义:阿里将于2026年5月13日发布2026财年第四季度和全年业绩,其千问电脑版上线语音输入法,具备修正口误、逻辑纠错、结构化整理及唤醒AI助手完成任务的能力 [4] - Kimi:即将完成新一轮20亿美元融资,投后估值突破200亿美元,由美团龙珠领投,中国移动、CPE源峰等参投 [4] - DeepSeek:据《The Information》报道,正在寻求完成首轮外部融资,目标规模最高达500亿人民币(73.5亿美元),若交易完成,估值或达515亿美元以上(约3500亿人民币) [3] - DeepSeek:计划加快模型发布频率,并准备在6月发布V4.1模型,该模型将加入企业工具和多模态支持,明显指向企业客户和商业收入 [3] 海外厂商动态总结 - Anthropic:公司CEO表示,在第一季度实现了80倍的年化增长 [4] - Anthropic:推出Claude托管代理中的“梦境”功能,可通过回顾过去对话记录发现模式以帮助智能体自我提升 [4] - Anthropic:更新Managed Agents功能,包括outcome(定义成功评分标准)、多智能体协同处理追踪和Webhook(完成后接收通知) [4] - Anthropic:宣布与SpaceX达成Colossus 1算力协议,新增超过300MW、22万块以上NVIDIA GPU的容量,并将提高Claude用量限制 [4] - Anthropic:发布10个可直接运行的金融智能体模板,面向金融服务中的耗时工作,并通过Claude for Microsoft 365插件在Office套件间工作 [4] - Anthropic:与Blackstone、Hellman & Friedman、Goldman Sachs宣布组建新的企业AI服务公司,其应用AI工程师将与工程团队合作,面向中型企业引入Claude [4] - OpenAI:发布Codex for Chrome,可以快速完成重复的浏览器工作 [4] - OpenAI:发布三款API实时语音模型,包括GPT-Realtime-2(具备GPT‑5级推理能力,上下文窗口从32K增至128K)、GPT-Realtime-Translate(支持70+输入语言、13种输出语言)和GPT-Realtime-Whisper(实时语音转文字) [4][5] - OpenAI:为一个新的企业级AI落地合资项目筹集超过40亿美元,项目估值约100亿美元,OpenAI将保持控股和运营控制 [8] - OpenAI:推出“ChatGPT Futures: Class of 2026”项目,支持26名学生创新者使用AI开展项目,每人/团队获1万美元资助 [8] - OpenAI:发布GPT-5.5 Instant模型,在事实准确性方面有显著提升,编造事实的概率比上一代少52.5%,视觉推理、数学和科学评估得分提升,能更有效地利用上下文提供个性化回复,并引入记忆来源功能 [8] - OpenAI:为广告商推出beta自助服务工具,包括自助式广告管理器、CPC按点击付费竞价、Conversions API和像素衡量工具 [3][8] - OpenAI:联合AMD、博通、英特尔、微软、英伟达开源微秒级故障恢复的多路径传输协议MRC,以提升AI训练集群可靠性 [8] - Google:发布Gemini 3.1 Flash Lite模型,主打超低延迟、高容量和成本效益,每百万token输入/输出价格为0.25美元/1.5美元 [8] - Google:更新Workspace Studio自动化能力,增强Meet会议输出触发器,并新增Calendar自动占时功能 [3][8] - Google:在Chrome中推出Skills功能,可将常用Gemini AI提示词保存成可一键重复运行的工具 [3][8] - Google:发布Multi-Token Prediction推测解码架构,使Gemma 4家族推理速度最高提升3倍,输出质量不变 [8]
2026.05.05-2026.05.08周报:OpenAI广告工具落地,火山MaaS份额领先-20260509