Workflow
多模态垂类落地
icon
搜索文档
2026.04.11~2026.04.17周报:工具链加速完善-20260417
浙商证券· 2026-04-17 21:46
行业投资评级 - 行业评级:看好(维持) [2] 报告核心观点 - 本周行业主线继续围绕模型升级、Agent工具链完善及多模态垂类落地展开,行业竞争正由单点模型能力转向Agent基础设施与工作流承载能力,并进一步强化成本控制与探索商业化路径 [2] 行业动态总结 前沿模型持续升级 - **海外方面**:Anthropic发布迄今为止最强大的Claude Opus 4.7,在高级软件工程、长流程任务和多模态处理方面相较Opus 4.6有显著提升 [3] OpenAI推出专为生命科学研究的GPT-Rosalind [3] - **国内方面**:千问开源Qwen3.6-35B-A3B,总参数量为350亿,激活参数仅30亿,在智能体编程方面能力几乎追平Qwen3.5-27B和Gemma4-31B等稠密模型 [2] MiniMax持续推进M2.7生态 [2] Agent工具链与工作流完善 - **海外方面**:Anthropic推出xhigh思考层级、公开测试版任务预算(task budgets)、/ultrareview自动代码审查命令及routines自动化任务功能 [3] OpenAI发布Agents SDK重大更新,引入原生沙盒、文件与计算机操作等核心能力,七家沙盒厂商可一键接入 [5] Google通过Gemini CLI的Subagents功能强化多代理协作 [2] - **国内方面**:MiniMax正式上线全球首个云端沙箱MaxHermes,并发布专为AI Agent设计的工具MMX-CLI [2] 阿里推出AI开发工具Meoo(秒悟),集成多家模型,通过自然语言描述最快1分钟可自动生成完整网站 [2] 多模态能力与终端入口扩张 - **海外方面**:Google推出Gemini Mac桌面应用和具备场景指导功能的Gemini 3.1 Flash TTS文本转语音模型 [2][5] Anthropic上线Claude for Word并与Office套件共享上下文 [2][3] - **国内方面**:字节跳动推进Seedance 2.0 API服务化,预置超过1万个高质量虚拟人像 [2] MiniMax发布Music 2.6并开源3个Music Skill [2] 阿里发布由ATH创新事业部研发的3D世界模型Happy Oyster,支持实时构建可互动的AI数字世界 [2] 成本控制与商业化路径探索 - **行业趋势**:随着Agent场景下调用深度提升,行业定价逻辑或由简单订阅转向更精细的预算控制、权限管理与场景化收费 [2] - **具体举措**:Anthropic通过task budgets与新的推理层级优化成本控制 [2] 千问收紧Qwen OAuth免费层级,每日免费调用额度由1000次下调至100次,并于4月15日正式关闭全部免费入口 [2][3] MiniMax明确M2.7商业使用需获得书面授权 [2] 智谱因算力资源紧张,对Coding Plan套餐开启限时退款 [2] 国内厂商动态总结 字节跳动 - 豆包海外版Dola在26Q1单季下载量达7200万以上,环比增长47%,累计下载量突破2亿,3月平均DAU近1200万 [2] - 火山引擎与BytePlus同步上线Seedance 2.0系列API,建立了肖像与版权安全标准 [2] 通义(阿里) - 开源Qwen3.6-35B-A3B模型 [2] - 发布3D世界模型Happy Oyster,目前处于限量早期体验阶段 [2] - 发布AI开发工具Meoo(秒悟),集成千问、Kimi、GLM、MiniMax等模型及阿里云服务 [2] - 为控制成本,Qwen OAuth取消免费层级 [2][3] MiniMax - 正式上线云端沙箱MaxHermes,MiniMax模型已是Hermes Agent中使用量最高的模型之一 [2] - MiniMax M2.7正式开源,商业用途需获得书面授权 [2] - MiniMax Agent桌面端发布Pocket Beta和Computer Use两项更新,后者可使Agent直接操作用户电脑软件 [2] - 发布MiniMax Music 2.6 [2] - 发布专为AI Agent设计的工具MMX-CLI [2] 海外厂商动态总结 Anthropic - 发布Claude Opus 4.7,并推出Cyber Verification Program,邀请安全专家加入 [3] - 发布重新设计的Claude Code桌面应用程序,支持并行多个会话 [3] - 发布Claude for Word,可与Excel和PowerPoint共享上下文 [3] - 据OpenAI称,Anthropic此前宣布的300亿美元年化收入因会计处理方式存在约80亿美元“高估” [5] - 据OpenAI称,Anthropic在算力投入上存在战略失误,预计到2027年底计算量约为7到8吉瓦,而OpenAI计划到2030年拥有30吉瓦 [5] OpenAI - 发布专为生物学、药物发现等领域打造的GPT-Rosalind [3] - Codex重大更新,增加90+插件,预览版“记忆”功能能记住个人偏好并主动建议后续行动 [3][4] - 将重点转向企业用户,计划推出面向“高价值专业工作”的新模型;目前ChatGPT周活超9亿但约95%用户未付费 [5] - 扩大Trusted Access for Cyber项目,推出基于GPT-5.4微调的GPT-5.4-Cyber模型,仅限受信任的防御方使用 [5] - 强调与Amazon的合作是其企业业务增长的关键动力,并称与Microsoft的合作在一定程度上限制了服务企业客户的能力 [5] Google (Gemini) - 与五角大楼谈判,讨论将Gemini AI模型部署到机密环境用于国防,并提议附加限制条款 [5] - 首次推出Gemini Mac桌面版,支持快捷键唤起 [5] - Gemini CLI推出Subagents功能,支持构建多代理协作工作流 [5] - 发布最新文本转语音模型Gemini 3.1 Flash TTS,支持70+语言 [5]