Workflow
Agent
icon
搜索文档
中金 | Chatbot专题研究:未来已来
中金点睛· 2026-01-09 07:59
文章核心观点 - Chatbot已成为AI时代的“杀手级应用”,其用户活跃度、使用时长和留存率正接近成熟社交平台,在工作、学习与娱乐场景的渗透率不断提升 [5] - 全球市场由ChatGPT领先,其移动端月活用户突破8.7亿,市占率63%;Gemini凭借谷歌生态快速追赶;中国市场字节豆包已确立领先优势,日活用户突破1亿 [2][5][12][22][47] - AI应用正从Chatbot向能自主理解、规划和执行任务的智能体(Agent)演进,类比早期微信从IM工具向一站式服务平台的进化路径 [6][54][56] - 长期来看,随着单位推理成本下降,“免费+交易导向的效果广告”有望成为ToC智能体领域更具潜力的商业模式,现有互联网广告龙头在数据和基础设施上具备优势 [6][74][75] Chatbot作为AI原生“杀手级应用” - **本质变革**:互联网的核心是生产关系革命,催生了社交和UGC平台;而大模型AI的核心是生产力革命,使机器能生成内容、辅助决策与执行任务,扩展了人类生产力边界 [9][10] - **用户规模与粘性**:ChatGPT全球周活用户已突破8亿,其移动端月活用户在2025年上半年超过社交平台X;国内豆包App日活超过1亿,标志着进入大众化增长周期 [12] - **使用行为深化**:ChatGPT用户月均活跃天数达13天,与X、Reddit等社交平台持平;其使用模式从“工作日工具型”演变为“全天候均衡型”,深度融入非工作场景 [14] - **交互范式升级**:Chatbot引入自然语言对话,是对传统多点触控交互的重要升级和补充,降低了使用门槛,但未来将与图形交互形成互补的多模态形态 [21] 全球与中国Chatbot竞争格局 - **全球市场**:ChatGPT凭借全面的规模优势、品牌力和跨平台体验占据领先地位,截至2025年11月移动端月活用户突破8.7亿,月活市占率63%,网页端占全球生成式AI访问量近80% [22] - **主要竞争者**:Gemini全渠道活跃用户达6.5亿,移动端月活3.37亿,通过深度整合Android系统、Google Search及Workspace实现低成本市场渗透;Claude、Perplexity、Grok等则通过聚焦B端、实时搜索或情感智能建立差异化 [22][26] - **中国市场**:国内AI应用整体月活用户移动端规模达7.29亿,延续移动互联网“路径依赖”,其中In-App插件(如微信、抖音内嵌)月活达7.06亿,原生App月活达2.87亿 [36] - **国内领先者**:字节豆包依赖于字节用户生态获客,并通过多模态模型突破及成本下探加强优势,其DAU在2024年9月至2025年5月净增约2700万,DAU/MAU从18%提升至26%,目前日活已突破1亿 [5][42][47] 从Chatbot到智能体(Agent)的演进 - **演进方向**:市场共识认为综合智能体是AI应用的终极目标,Chatbot的潜在进化路径类似“早期微信”,从即时通讯工具演变为连接人、内容、服务的数字生活平台 [6][54][56] - **当前使用分布**:用户对Chatbot的使用中,49%属于“询问”类,40%属于“执行”类任务(如编写代码、起草邮件),11%属于“表达”类互动(如情感陪伴) [51] - **潜在切入方向**:包括追求认知广度的通用Chatbot(如ChatGPT、Gemini、豆包)、情境化执行的端侧AI(如Apple Intelligence)、以及垂直场景专家(如Cursor、Manus) [54] - **发展挑战**:当前智能体面临模型端到端复杂任务可靠性不足、个性化能力缺失、以及工具调用生态(如MCP)建设处于初期等局限性 [57][58] 智能体时代的竞争焦点与博弈 - **通用与垂直智能体的关系**:在ToC市场,通用型智能体因占据高频入口、降低用户边际成本而具有优势,91%的AI用户会优先使用最顺手的通用AI助手;但在B端市场,垂直场景智能体因对效果、可靠性、安全性的高要求而生存逻辑坚实 [59][60][62][64] - **入口与生态的博弈**:综合智能体可能成为下一代超级应用流量入口,与已建立庞大交易生态的垂直服务平台(如亚马逊、美团、淘宝)产生博弈,后者担忧“去中介化”可能拒绝开放核心API或加速自研垂直智能体 [65][66][67] - **中外生态差异**:谷歌和腾讯因已有的搜索统治地位或小程序交易生态,在向智能体演进中具备部分存量优势;但中国互联网市场巨头间更高的“隔离墙”可能使综合智能体的落地面临更强博弈 [68][69] 商业化模式展望 - **当前模式**:海外市场以订阅制为主流,OpenAI约75%的收入来自消费者订阅,其ChatGPT Plus订阅(约20美元/月)占总收入约70%,但付费用户转化率仅为5-6%;国内市场则以免费为主 [72][73] - **长期趋势**:随着单位推理成本降低,“免费+交易导向的效果广告”有望成为ToC智能体领域门槛更低、壁垒更高、天花板更高的商业模式,类比Google Gmail以免费服务颠覆付费邮箱的历史 [74] - **广告优势方**:现有互联网广告巨头(如Meta、Google)在效果广告基础设施和历史用户数据积累上具备明显竞争优势,新进入者重建类似体系需要耗费大量时间和资源 [75] - **实践探索**:OpenAI正在研发基于对话上下文的广告系统并推出“即时结账”功能;谷歌将传统搜索广告升级为整合在AI生成答案中的智能交易推荐;豆包等国内模型则探索在回复中直接嵌入电商商品卡片 [75][76] 市场格局总结 - **Chatbot格局**:海外ChatGPT领先但Gemini紧追,国内豆包凭借亿级日活已确立消费端赢家地位,其用户规模、留存率、增速等指标使其迈向更高门槛的确定性较强 [78] - **智能体格局**:智能体时代仍处于初期,对胜出者的要求在于“大脑”(模型能力)与“手脚”(生态执行)的协同,目前各主要参与者在不同维度具备优势,最终赢家尚未确定 [79]
锦秋被投企业OiiOii创始人闹闹:亲历微信与字节后,如何抓住下一波机会?|Jinqiu Spotlight
锦秋集· 2026-01-07 19:03
文章核心观点 - 2026年将是AI视频应用爆发的关键年份,预计将催生大量新的独角兽公司 [6] - AI视频生成领域的创业公司,特别是采用Agent架构的产品,不仅不会被Sora等大模型“端到端”吃掉,反而会迎来最好的发展时代,与大模型形成互补共生的繁荣生态 [9][11][57] - OiiOii作为AI动画视频生成Agent,其核心价值在于通过“厨师调味”般的深度工作,将底层模型能力转化为面向特定人群和场景的成品,满足从专业创作者到普通用户的广泛需求 [16][57][59] 快问快答 (公司基本情况) - 创始人闹闹毕业于中山大学,MBTI为INTJ,星座是狮子座 [19][20] - 公司核心业务是用AI制作动画 [22] - 公司处于Pre-A轮融资尾声,产品内测发布约一个月,目前需要邀请码 [23][26] - 公司成立约4个月,尚无收入和利润,团队全职规模为18-19人 [25][27] - 创始人创业前拥有丰富的产品经理经验,曾任职于腾讯微信事业群(QQ邮箱)、字节跳动(剪映、抖音特效)以及B站动画业务 [28][29] AI视频的Agent时刻:为什么是现在? - 创始人在2022年DALL-E 2发布时便萌生用AI做动画的想法,但真正的切入时机在2024年上半年,源于观察到多模态模型开始激烈竞争,势头类似语言模型爆发期 [40][43] - Agent架构被确定为最佳产品形态,原因有三:1) 可灵活调用多种模型;2) 动画制作本身是流式、多角色协作的流水线,与Agent工作方式高度契合;3) Agent交互提供高自由度,避免传统GUI工具的功能臃肿 [44][45] - 产品初期采用“首尾帧”生成路线以保证单镜头稳定性,并创新设计Task Agent为不同分镜自动匹配最优模型 [46][47] - Sora 2发布后,其出色的分镜和镜头语言能力促使公司果断放弃原有路线,全面转向接入Sora,首个测试视频(小螃蟹和小猩猩打篮球)一句prompt直出,效果令人兴奋 [47][48][52] 为什么不怕Sora?大模型与Agent的共生关系 - 核心观点:视频模型不可能“大一统”,因各家训练数据、标注标准不同,输出结果各有特色,这为Agent的“组合式创新”留下了巨大空间 [53][166] - 提出“超市与餐馆”理论:大模型如同提供原材料的大型超市,而Agent则是川菜馆、粤菜馆等特色餐馆,为用户提供符合特定口味和场景的成品,两者共存共荣 [16][54][57] - Agent公司约60%-70%的工作是“后厨调味”,即通过建立垂直知识库、优化prompt、调整模型参数等细微工作,将生硬的模型输出转化为符合目标用户需求的佳肴,这是其核心护城河 [16][57][59] - 即使未来Sora发展到4.0/5.0版本,开始提供一些“熟食”(垂直功能),Agent产品也不会消亡,反而会更加繁荣,因为垂直领域的需求深度和专业性是无法穷尽的 [11][63] 目标用户与市场定位 - 初始目标用户定位为“自媒体人”,主要包括三类:1) 围绕IP创作动画的小型工作室(可将内容更新效率从一周一集提升至一天一两集);2) ACG领域的MV创作者;3) 讲历史、科普等非动画领域的自媒体人 [71][72][73] - 内测中发现了三类意料之外的用户:1) 漫剧团队(利用其高效分镜生成能力);2) 从未做过视频但想用动画表达想法的人;3) 为维系社交关系而创作的用户(如家长为孩子、学生为老师、情侣之间制作动画视频) [18][76][77] - 公司未来将采用类似抖音做垂类的策略,针对科普、MV等不同内容类型,深入研究其结构并构建专属知识库,逐个垂直领域进行深度服务 [78][79] - AI视频Agent不会取代剪映等传统工具,而是带来增量市场,两者效率叠加为最优解,用户可在OiiOii生成内容后,再导入剪映进行轻量剪辑等后期处理 [16][87][94][95] 产品设计与技术架构 - 选择Agent架构的重要原因之一是避免传统创作工具(如PS、PR、剪映)从简单走向功能臃肿的必然循环,Agent的能力更多隐藏在后台,而非通过GUI堆叠 [82] - Agent产品具有用户与产品共建的魅力,用户能探索出开发者意想不到的用法,不断拓展产品边界 [83][84] - 为平衡工作流的“稳定性”与用户修改的“自由度”,公司在两个月内重构了四次系统架构,最终采用在严格workflow中嵌入“信号”机制的方案,允许Agent在特定环节跳出接受用户指令后再跳回,技术挑战大且仍在优化稳定性 [85][86] - 产品设计赋予每个Agent(如剧本Agent、角色设计Agent)角色感,模拟“团队服务于导演”的体验,但多Agent交互中的上下文记忆管理是架构难点 [96][97] - 产品的“秘方”在于将影视学的专业知识(如用特定色调、场景表达“孤独”情绪)打包成可调用的元素,使普通用户仅用情绪词也能生成有“感觉”的片子 [98][100] 创始人的产品方法论与行业洞察 - 在微信的工作经历培养了深刻的产品价值观和“被训练出来的直觉”,强调通过大量阅读用户反馈(每天数百上千条)来识别真伪需求,洞察人性 [108][111] - 在字节的工作经历强化了数据驱动和理性策略思维,学会了通过用户行为数据计算概率来指导产品决策(如“造风”),将产品sense与数据科学结合 [112][115][117] - 微信与字节的共同点在于都将自身基因优势发挥到极致:微信将“体验”和“感性”发挥到极致,字节则将“效率”和“数据”发挥到极致 [120][121] - 成为一名优秀产品经理的三个关键能力:1) 移情能力,能迅速切换为用户视角;2) 50%自信与50%自省结合,避免盲区;3) 对技术敏感,理解技术可实现性的边界 [131][132] - 动画行业是商业世界中少数会奖励“纯粹”与“热爱”的领域,创始人长期的动画梦想与AI技术机遇、团队能力实现了完美匹配 [9][128][129][137] 对2026年AI视频领域的预测 - 技术发展将延续质量提升、可编辑性增强的趋势,实时性和互动性也可能提高,但更高的编辑自由度和互动性可能使产品更小众,因为大众已习惯被动接收信息 [158][159][160] - 一些在现有媒介基础上的“小改动”(如Sora 2带来的更自然切镜)可能比巨大的技术革新更能吸引广泛受众 [161] - 视频模型厂商将朝两个方向发展:一是强化自身擅长领域,二是补足短板,同时会继续追求通用性,实时性和可编辑性将是重点增强方向 [168][169] - 视频模型难以大一统,不同模型有先天差异(数据与标注)和后天差异(公司战略),且即使模型相同,调用手法和输入内容的不同也会导致输出结果迥异 [164][165][166]
国泰海通:维持计算机板块“增持”评级 AI应用层获资本押注
智通财经网· 2026-01-06 06:48
汽车行业数字化转型政策 - 工业和信息化部等四部门联合印发《汽车行业数字化转型实施方案》[2] - 方案核心任务是加强关键技术自主攻关以提升产业链供应链韧性与安全水平[2] - 攻关重点覆盖仿真设计、研发测试、车用操作系统等基础软件,智能机器人、智能检测设备等关键装备,以及信息物理系统(CPS)等集成核心技术[2] - 政策鼓励整车及零部件企业优先应用上述自主可控技术产品[2] - 支持重点企业联合高校、科研院所组建创新联合体开展协同技术攻关[2] - 通过加强数据共享和平台共建构建高效的“研发-验证-迭代”协同创新闭环以缩短技术产业化周期[2] AI Agent应用层商业化加速 - AI产业价值重心正加速向能够解决实际问题的Agent应用层迁移[3] - 国内大模型公司月之暗面(Kimi)近期完成5亿美元C轮融资,投后估值达43亿美元,公司现金储备已超百亿元人民币[3] - 融资资金将用于加速训练下一代K3模型并专注于Agent等生产力工具的商业化与付费订阅服务[3] - 国际科技巨头Meta以数十亿美元完成对中国AI应用公司蝴蝶效应的收购,为Meta历史上第三大收购案[3] - 蝴蝶效应的核心产品为智能体应用Manus,其年度经常性收入(ARR)已突破1亿美元,被收购后将保持独立运营[3] 数字人民币制度框架升级与跨境应用 - 数字人民币领域迎来关键性制度安排,政策框架完善推动其发展进入新阶段[4] - 中国人民银行等八部门发布意见提出研究利用数字人民币可编程等特性探索其在跨境通道支付、融资等场景的创新应用[4] - 央行宣布《关于进一步加强数字人民币管理服务体系和相关金融基础设施建设的行动方案》将于2026年1月1日正式实施,标志着数字人民币从“现金型”全面升级至“存款货币型”[4] - 截至2025年11月末,数字人民币交易规模已显著扩大,在多边央行数字货币桥的跨境交易中已成为绝对主导货币[4] - 顶层设计明确预计将全面带动支付收单与跨境业务、银行IT系统改造、以及金融终端与安全硬件等相关产业链的协同发展与需求增长[4]
垂类AI应用专题:Minimax是全球化大模型公司,拥有大语言、视频、音频大模型
国信证券· 2026-01-05 22:54
报告行业投资评级 - 优于大市(维持)[1] 报告核心观点 - 大模型应用的商业化仍处于早期阶段,向Agent的演进是曲线拐点,商业价值将加速释放[2] - 多模态整合成为趋势,MiniMax拥有多模态模型能力,AI音频、视频模型能力突出,将受益于AI陪伴、AI视频、Agent等细分领域爆发[2] 公司概况与战略定位 - MiniMax是全球化的大模型公司,成立于2021年底,已累计服务超过200个国家及地区的超2.12亿名个人用户,以及超过100个国家及地区的10万余名企业客户[2][6] - 公司拥有大语言、视频、音频三模态大模型,AI视频和AI音频是全球第一梯队[2][6] - 公司具有前瞻性战略眼光,于2024年1月推出国内首款MoE大模型,并于2024年第二季度重点布局多模态[2][33] - 公司采用“极简高效”的运营模式,小团队干大事,员工平均年龄不足30岁,研发背景人员占比74%[33] - 创始人闫俊杰团队控股28.25%,阿里巴巴、米哈游、IDG资本、腾讯为主要外部股东[2][27][29] 市场地位与模型能力 - 根据2024年收入,MiniMax是全球第四大纯研发驱动的pureplay大模型技术公司,市占率为0.3%[42][44][46] - **大语言模型**:M系列聚焦高效编码与智能体协作,采用MoE架构和线性注意力机制以提升效率、降低成本[46][53] - 2025年12月底更新的M2.1模型,在多语言场景评测中已超过Claude Sonnet 4.5和Gemini 3 Pro,并接近Claude Opus 4.5[6] - M2.1较M2响应速度提升30%、Token消耗降低25%[53] - **视频生成模型**:海螺AI(Hailuo)定位高精度动态表现与低成本规模化创作[56] - 首创双版本策略,Hailuo2.3Fast生成速度提升3倍,成本降低60%[56] - 截至2026年1月3日,在Artificial Analysis全球文生视频榜单中排行第九,图生视频榜单中排行第五[2][56] - 在精准执行用户指令、处理复杂物理交互(如体操、跳水)方面表现出色[2][68] - **语音生成模型**:Speech系列具有超拟人效果,端到端延迟低于250毫秒,达到行业顶尖水平[2][6][59] - 截至2026年1月3日,在Artificial Analysis全球语音榜单中排行第二[2][59] - 支持40余种语言,具备30秒音色复刻能力[59] 业务模式与收入结构 - 公司以C端消费主导业务模式,AI原生产品收入占总收入比重为71%[2][24] - 海外收入占比73%,主要市场为新加坡(24%)、美国(20%)和中国大陆(27%)[2][7][10] - 主要收入来源为三大产品:Talkie/星野(AI陪伴)、海螺AI(AI视频)、开放平台(API),2025年前9个月收入占比分别为35%、33%、29%[2][20] - **Talkie/星野**:专注于实时人机交互的AI陪伴产品,受到欧美国家喜爱[2][78] - 截至2025年9月,累计用户1.47亿,月活跃用户2000万,同比增长62%[2][81] - 2025年前9个月收入1875万美元,同比增长39%,其中在线营销是主要收入来源[2][83][84] - **海螺AI**:性价比高的视频生成平台,订阅收入是主要来源[2][68] - 2025年前9个月收入1746万美元,活跃用户564万,付费用户31万[2][69] - 每秒视频生成价格约0.1元人民币,具有成本优势[68] - **开放平台**:提供多模态API服务,追求性价比[98] - 2025年前9个月收入1542万美元,同比增长160%[20][98] - 输入价格为0.4–1.3美元/百万Token,输出价格2.2美元/百万Token[98] 财务表现 - **收入高速增长**:2024年收入3052万美元;2025年前9个月收入5344万美元,同比增长175%[2][20][103] - **毛利率转正并提升**:2025年前9个月整体毛利率为23%,同比提升21个百分点[2][108] - AI原生产品毛利率从2024年同期的-24%提升至5%[2][108] - 开放平台毛利率为69%[108] - **亏损率大幅收窄**:2024年调整后净亏损2.44亿美元;2025年前9个月调整后净亏损1.86亿美元,调整后亏损率为349%[2][20][108] - **现金充足**:截至2025年9月,公司现金结余为10.46亿美元[20] - **客户集中度下降**:前五大客户营收占比从2023年的60.5%持续下降至2025年前9个月的21.7%[110][111] 行业市场前景 - 全球大模型市场处于商业化早期,向Agent演进是曲线拐点[2][41] - 根据灼识咨询,基于模型收入口径,全球大模型市场规模预计将从2024年的107亿美元增至2029年的2065亿美元[41] - 其中,大模型应用市场规模预计将从2024年的71亿美元增至2029年的1515亿美元,年复合增长率达84%[41]
AI叙事不断递进,阿里巴巴、中际旭创双双涨超2%!云计算ETF汇添富(159273)大涨超3%!机构:2026拥抱“AI+”投资主线!
搜狐财经· 2026-01-05 17:46
市场表现 - 1月5日,沪指加速上涨超1%,重返4000点,算力板块再度强势 [1] - 云计算ETF汇添富(159273)当日大幅收涨超3%,全天成交额超3000万元,环比放量33% [1] - 该ETF标的指数权重股多数收红,其中金山办公涨超6%,中际旭创、阿里巴巴-W、中科曙光涨超2%,浪潮信息、恒生电子涨近2%,腾讯控股微涨 [2] 机构观点:AI大模型发展趋势 - 复盘美股科技巨头过去三年股价走势,AI叙事不断递进 [4] - 2023年,OpenAI领先开启AI加速度,微软因独家合作受益,估值明显抬升 [4] - 2024年,市场叙事转向推理侧,认为应用公司最优,Meta因社交垄断生态和广告场景,成为除英伟达外PE唯一抬升的巨头;同年云厂商因资本开支大增但供给受限,收入传导延迟,三大CSP(云服务提供商)估值略有回落 [4] - 2025年,模型差距与OpenAI明显收敛,谷歌后来居上,生态优势受市场追逐 [4] - 展望2026年,Scaling Law将持续,模型厂商将打开差异化应用市场,模型推理侧需求或进入放量拐点,模型和算力或为最优投资方向 [4] 资本开支与算力需求 - 2025年北美四家科技巨头资本开支同比增长50%以上,从年初的3200-3300亿美元上修至年末接近4000亿美元 [5] - 测算2026年资本开支将持续实现30%以上增速 [5] - 巨额资本开支投入数据中心建设,可能面临电力瓶颈 [5] - 2024年北美数据中心容量约25GW,据Grid Strategies估计,至2029年的五年将新增80GW需求,但煤电退役、变压器建设周期长等因素可能导致电力缺口成为主要矛盾,算力能耗比成为关键考量因素 [5] 技术演进与架构发展 - 模型架构继续演化,Scaling law延续,多模态与长文本能力为Agent爆发提供基础 [5] - 2023年为Scaling law红利期,2024年多模态、推理模型涌现,2025年算法工程与Scaling Law并进 [5] - 下一代模型架构需解决两大核心痛点:训练阶段Transformer的计算量和内存消耗瓶颈;推理时模型的记忆能力有限且参数无法跟随记忆变化 [5] - 海外已有谷歌的Titans架构及Mamba架构,国内则从成本效率优化角度出发,如Qwen3-Next、DeepSeek V3.2取得明显提升 [5] - 预计2026年Scaling law仍将延续,强化学习将成为重点突破方向 [7] - 多模态、长文本能力更加成熟,为Agent涌现提供技术基础,目前中美模型差距在3-6个月,算力和算法是追赶关键 [7] 应用市场与需求变化 - 人工智能实际上打开了软件需求的天花板,据IDC数据,预计2029年全球SaaS市场将达到近1万亿美元规模,对比2025年的5800亿美元有明显增长 [7] - 市场玩家将重新洗牌,拥有数据壁垒、布局垂类细分场景、工作流程复杂或对准确度要求极高的行业(如医疗、能源、会计、安全)被大模型替代的风险较小 [7] - 大模型厂商开始通过与B端软件服务商合作开发行业需求,或与传统SaaS厂商产生直面竞争 [7] - 2026年推理侧需求有望爆发,一级市场中,编程场景、Agent爆发为主要应用方向 [8] - 当前规模增长较快的行业以AI编程、AI Agent、AI内容创作为主,聚焦生产力提升 [8] - 今年以来诞生多个爆款应用:AI编程软件Cursor年经常性收入已达到10亿美元,AI agent Manus在8个月时间年经常性收入达到1亿美元,AI Perplexity年经常性收入也已达到2亿美元 [8] - 随着模型能力成熟,2026年在端侧的AI手机、AI眼镜,以及协助大模型在企业落地的分销商领域将看到明显增长 [8] 公司动态 - 1月5日,阿里巴巴旗下高德已正式布局"世界模型"技术,并计划基于该模型推出全新产品应用,标志着其在空间智能领域的战略进一步深化 [6] 投资主线 - 华西证券认为,AI大模型的研发从侧重规模,到追求效率,再到追求推理能力,一切朝着更利于应用的方向不断发展 [8] - 2023年及以前,大语言模型发展遵循"Scaling Laws",GPT-4的成功印证了该路径 [8] - 效率追求:传统Transformer架构的注意力机制存在二次方计算复杂度,限制了上下文长度扩展和模型实际部署,催生了对稀疏架构和新型注意力机制(如MoE架构、MLA注意力机制)的需求 [9] - 推理追求:单纯的规模扩张不能赋予模型多步骤逻辑推理能力,催生了思考模型(如CoT)的诞生 [9] - 智能体的诞生:模型基础能力、效率及推理能力的提升,为智能体的诞生奠定基础,智能体在传统大模型基础上引入了与外部工具和环境的交互 [9]
Manus百亿身价背后:Agent统治未来?
财富在线· 2026-01-05 11:23
行业核心观点 - Meta以惊人溢价收购Manus,彻底撕碎了“应用无壁垒”的伪命题,证明在AI时代,能调动底层模型完成复杂工程交付的“调度力”是最值钱的护城河 [1] - 市场对AI的审美正从“调戏对话”转向“真干活”,一场属于Agent概念股的重估风暴已经席卷二级市场 [1] - Manus的被收购宣告了“大模型至上论”的破产,未来的高光将属于那些能把AI包装成即插即用的生产力,并能通过调度能力给客户交出“最终结果”的公司 [6] 迈富时 (02556.HK) - 作为港股Agent赛道的“旗手”,在Manus事件后股价展现出极强的进攻性,资本重新发现其“端到端商业闭环”的价值 [1] - 公司从提供CRM工具升级为通过Marketingforce平台构建庞大的Agent矩阵,核心竞争力在于“懂行”,利用Agent调度模型直接接管企业的获客、营销与转化流程 [2] - 商业模式从SaaS向“结果驱动型Agent”升级,价值从账号订阅费转变为“可量化的增长结果”,估值逻辑脱离传统软件股,向高溢价的AI生产力服务商靠拢 [2] 金山办公 (688111.SH) - WPS正在成为Agent的“操作系统”,其海量的私域文档数据和高频的办公入口是最大杀手锏 [3] - 相比于Manus需要用户寻找场景,金山办公在场景里“守株待兔”,当WPS从“帮人写稿”进化为“代人办公”时,公司将成为企业级Agent的流量分发中心 [3] - 其壁垒深厚到连底层模型厂商也难以逾越 [3] 酷特智能 (300840.SZ) - 公司将Agent真正跑通在充满噪声的工业环境下,在C2M领域证明了物理世界的调度力 [4] - 通过Agent实时指挥成千上万个生产节点,将原本需要大量人工协调的个性化生产变成了自动化指令流 [4] - 在资本眼中,这种能与实体经济深度耦合、解决复杂排产问题的Agent,是最具稀缺性的硬科技资产 [4] 拓尔思 (300229.SZ) - 公司在政府、媒体、金融等垂直行业拥有极深的数据护城河,利用自身的行业知识库为Agent装上“行业大脑” [5] - 公司不追求做全能的Agent,而是在特定领域做最懂业务的Agent调度器,扮演模型厂商的“翻译官” [5] - 通过“垂直数据壁垒”拦截通用模型厂商的策略,使其在AI应用落地的下半场成为极具安全边际的Agent标的 [5]
国信证券:模型架构继续演化 多模态+长文本为Agent爆发提供基础
智通财经· 2026-01-05 10:15
文章核心观点 - 人工智能行业模型架构持续演化,多模态与长文本能力为AI Agent的爆发奠定技术基础 [1][2] - 大模型厂商商业化路径出现分化,推理侧需求预计在2026年进入放量拐点,并驱动SaaS市场格局重塑 [1][5] - 投资方向建议关注算力基础设施及大模型厂商 [5] AI行业演进与市场叙事 - 2023年OpenAI引领AI加速,微软因独家合作估值显著抬升 [1] - 2024年市场叙事转向推理侧,Meta因社交生态和广告场景优势,成为除英伟达外市盈率唯一抬升的巨头 [1] - 2025年谷歌模型能力后来居上,生态优势受市场追捧 [1] - 2026年预计Scaling Law持续,模型厂商将打开差异化应用市场,推理侧需求进入放量拐点,模型和算力为最优投资方向 [1] 资本开支与基础设施 - 2025年北美四大科技巨头资本开支同比增长均超50%,从年初的3200-3300亿美元上修至年末近4000亿美元 [1] - 预计2026年资本开支将持续实现30%以上增速 [1] - 数据中心建设面临电力瓶颈,2024年北美数据中心容量约25GW,预计至2029年将新增80GW需求,电力缺口成为主要矛盾,算力能耗比成为关键考量因素 [1] 模型技术发展趋势 - 模型架构需解决训练阶段Transformer的计算量、内存消耗瓶颈及推理时记忆能力有限等痛点 [2] - 预计2026年Scaling Law仍将延续,强化学习是未来重点突破方向 [2] - 多模态与长文本能力趋于成熟,为AI Agent涌现提供技术基础 [2] - 中美模型能力差距在3-6个月,算力和算法是追赶关键 [2] 主要大模型厂商商业化路径 - OpenAI:拥有8亿C端用户核心壁垒,下一代模型值得期待,明年将发力企业业务 [3] - Gemini:成为当前大模型的SOTA基准,得益于原生多模态路线及自研芯片生态,明年Tokens消耗有望大幅提升 [3] - Anthropic:坚持2B路线,编程能力突出,依靠定价优势有望取得更好利润率,公司估值已达3500亿美元,其2025年初推出的AI编程产品年末年度经常性收入已达10亿美元 [3] - Grok:结合特斯拉独特数据优势,下一代原生多模态模型值得期待 [3] SaaS市场变革与应用前景 - AI打开了软件需求天花板,预计2029年全球SaaS市场规模将达到近1万亿美元,较2025年的5800亿美元有明显增长 [4] - SaaS市场玩家将重新洗牌,拥有数据壁垒、布局垂类细分场景、工作流程复杂或对准确度要求高的行业被替代风险较小 [4] - 大模型厂商正通过与B端软件服务商合作或与传统SaaS厂商竞争来开发行业需求 [4] 推理侧需求与热门应用场景 - 2026年推理侧需求有望爆发,一级市场以AI编程、AI Agent为主要应用方向 [5] - AI编程软件Cursor年度经常性收入已达10亿美元 [5] - AI Agent应用Manus在8个月内年度经常性收入达到1亿美元 [5] - AI搜索工具Perplexity年度经常性收入已达2亿美元,并向Agent拓宽边界 [5] - 随着模型能力成熟,AI手机、AI眼镜及协助企业落地大模型的分销商等领域将看到明显增长 [5]
大模型狂叠 buff、Agent乱战,2025大洗牌预警:96%中国机器人公司恐活不过明年,哪个行业真正被AI改造了?
AI前线· 2026-01-01 13:33
文章核心观点 2025年是全球AI行业格局重新站稳、路径分化的关键年份,竞争焦点正从模型能力本身转向系统能力、生态位置与长期演化能力[5] 行业整体从追逐参数规模和热点概念,转向更强调系统效率、真实场景与可持续的技术积累[6] 大模型正变得“更可用”,而不仅仅是“更聪明”[14] Agent已成为公认的下一阶段核心主赛道,正从概念走向真实业务,重塑软件构建范式[35][37] AI Native应用正在重新定义软件的构建方式,但ToB领域呈现“热度高、落地慢”的特征[63] AI技术在各行业的普及度大幅提升,尤其在金融、医疗、教育等领域实现了规模化落地并带来可量化的成效[74][75] 全球AI竞争格局 - **OpenAI**:维持通用大模型能力上限,在推理、代码、多模态等维度作为行业对标对象,拥有全球最高的C端用户量,短期内保持入口级地位[4] 但GPT-5的发布未带来预期中的代际震撼,后续发布相对平淡[4] - **Google**:在2025年打了一场漂亮的翻身仗,技术能力全面回归,Gemini 3、Nano Banana等赢得众多用户,并通过搜索、办公和云产品形成有效分发和良性联动[4] - **Anthropic**:成为最稳健的玩家之一,Claude系列模型在开发者中口碑持续上升,通过与AWS等云厂商深度合作,其API业务的规模和增速实现了对OpenAI的超越[5] - **国内厂商**:DeepSeek是2025年最具标志性的明星公司,其R1的发布及开源姿态极大地活跃了AI中下游创新生态[5] MiniMax、智谱等公司开始冲击港股上市,但暴露出行业普遍面临的投产比偏低、亏损压力大、商业化仍在探索的现实问题[5] 行业成功与失败的关键 - **能跑出来的公司类型**:第一类是高频刚需场景(如AI社交、短剧、音乐)的公司,其关键不是生成能力,而是持续使用价值[7] 第二类是成本结构被AI彻底改写的公司,AI将内容或服务的边际成本压缩1–2个数量级,直接改变行业定价逻辑,实现商业模型重构[7] - **明显落后的公司类型**:包括只做通用型AI助手但缺乏垂直数据和结果闭环的公司、只做模型不做产品的公司、靠融资续命缺乏付费能力的AI创业公司,以及反应迟缓流程未被Agent化的传统软件公司[9] - **决策层认知是关键**:在同一个行业中,自一号位开始认真拥抱AI的,明显已经在业务流中找到许多落地机会,决策人的认识是未来拉开差距的关键点[10] 中美AI竞赛态势 - **国内AI取得实质性进展**:在基础模型能力、多模态理解、推理效率与工程化落地层面均呈现明显跃升,以DeepSeek-R2、Qwen3系列等为代表,在模型规模、效率与成本之间探索出更具可行性的平衡方案,形成以成本控制、系统优化和应用适配为核心的差异化优势[11] - **差距分层看待**:在部分通用能力与工程执行层面,差距正在迅速缩小,某些特定场景已具备直接竞争力[11] 但在长期基础研究积累、原创智能范式探索及面向下一代智能的系统性布局上,整体仍存在差距[11] 西方在AI算法创新方面优势可能只剩“几个月”,而不是“几年”[11] - **中国AI开始全球影响**:中国AI模型正被真实引入全球生产环境,而不仅停留于试验阶段[12] OpenRouter与a16z报告显示,全球开源模型使用量的显著增长与DeepSeek V3、Kimi K2等国内开放模型的发布高度同步[12] 大模型技术演进趋势 - **从“更聪明”到“更可用”**:大模型在复杂指令理解、多步推理稳定性及跨模态任务一致性上有肉眼可见的进步,尤其是在不依赖极端Prompt情况下完成整个任务链[14] 技术路线从训练时把模型做大,转向运行时让模型用得更好,强化学习、测试时计算、显式推理结构被大规模引入[14] - **性价比系统性重写**:训练一个激活参数规模约10B的模型,其整体能力已经可以超过2024年激活参数在100B以上的模型,一年内实现接近10倍的性价比提升[15] - **Scaling路径分化**:更多数据、参数规模和计算依然是提升基础模型能力最有效的通用路径,但单位成本所换取的收益正在快速下降,经济回报曲线变得平缓[16] 当前瓶颈更多来自模型无法高效利用已有信息,下一步真正拉开差距的是能找到值得Scaling的点,如基于动态应用场景的记忆[16] - **工程能力成为重点**:大模型厂商的工作进入了拼工程化的时代,更依赖集团军作战和组织能力,而非少数超级明星[18] 有传言称Gemini 3的成功有很大一部分归功于修复了若干重大bug[18] - **强化学习(RL)作用关键但有限制**:强化学习在这一轮爆发中发挥了决定性作用,只要具备足够数据和高质量反馈,它几乎可以在任何任务上达到人类前0.1%甚至0.01%的水平[18] 但目前大多数强化学习训练仍停留在几千步量级,距离跑通稳定的RL scaling law还有相当距离[18] - **合成数据成为重要来源**:大规模合成数据替代人工数据正在发生,但并非完全取代[19] 高价值的合成数据是被严格约束、可验证、能放大信息增益的数据[19] 模型架构发展 - **Transformer依然是核心基础**:在可预见的未来,Transformer仍将是大模型的核心基础,多数所谓的新架构本质上是围绕其关键组件所做的工程化改良[20] - **MoE迅速普及**:通过MoE对FFN进行稀疏化,是提升规模效率的关键路径,DeepSeek在大规模实践中证明了MoE可以稳定地扩展到超大模型规模[21] MoE的普及是被成本与规模双重压力逼出来的工程选择,通过“只激活少量专家”的方式,在参数规模与实际算力开销之间找到平衡点[22] - **注意力机制高度活跃**:业界持续探索更高效的注意力结构,例如Gemini系列采用滑动窗口注意力与稠密注意力的混合架构;Qwen3-Next、Kimi Linear引入DeltaNet等线性注意力机制[22] 这些探索主要源于厂商对Agent化与深度思考场景的需求[22] Agent技术发展与影响 - **从“会对话”到“能干活”**:AI的角色从“回答问题”转向“完成事情”,使模型具备了感知外部环境、理解复杂需求并主动调用系统能力的可能性,这是一次软件构建范式的跃迁[36][37] - **协议与标准推动规模化**:以MCP为代表的模型上下文与工具调用协议在今年迎来应用爆发,基于统一协议降低了应用层构建成本[38] Google推出的Agent-to-Agent通信协议,标志着多智能体系统开始走向标准化协同[39] - **技术呈现“上下分化”**:应用层创新异常活跃,在编程、运维、客服等高频场景中已开始创造可量化的业务价值[40] 平台层与基础设施层的竞争正在加剧,对资源调度、安全隔离、成本控制与可观测性的要求迅速上升[40] - **沙箱Infra快速发展**:以E2B为代表的沙箱服务随着Manus的爆火迎来真正爆发[41] 谷歌开源了基于k8s的Agent-sandbox项目,阿里云也宣布开源OpenKruise Agents,云原生技术与Agent沙箱技术的结合将极大推动Agent应用的普及[41] - **商业模式向“结果导向”演进**:单纯售卖“Agent能力”本身正变得越来越困难[42] 企业不再仅仅为一个Agent平台付费,而是为“一个能完成具体工作的数字员工”买单[43] - **多Agent协作的现实挑战**:多个Agent之间无效沟通带来的Token消耗,正在成为企业真实的成本压力,促使业界从“人格化Agent”转向“系统化Agent”[43] - **产业分工清晰化**:大模型厂商在Agent的规划、推理与工具调用层具备优势;云厂商在基础设施、弹性调度、安全隔离与企业集成方面占据关键位置;创业公司则在垂直场景的定制化解决方案与成本优化上寻找空间[44] 具身智能发展现状与挑战 - **行业繁荣但非共识多**:截至2025年11月,中国已有超200家人形机器人本体厂商[48] 但行业对于本体形态、数据类型、模型架构仍存在大量争议,需要更多探索和迭代才能逐步收敛[49] 并未出现ChatGPT时刻或具身数据的ImageNet时刻[50] - **技术取得渐进式进步**:机器人在稳定性、可靠性上有显著提升,正从技术演示阶段朝着产品化方向推进[48] 机器人已经具备100%完成一些简单任务的能力,其他复杂任务的成功率也在稳步提升[49] 视觉语言导航(VLN)方向进展显著,涌现出大量基于视觉语言输入的导航模型,可以解决零样本泛化问题,不再需要预先建图,大幅降低部署成本[50] - **面临多重制约难题**:具身大模型普遍存在“感知不准确”与“决策不靠谱”的问题[51] 机器人硬件成本居高不下,核心部件价格高[51] 软硬件技术路径结合未完全收敛,模型架构和数据的飞轮迭代设计未做好整合[51] 场景化产品定义不清晰,产品完整生命周期的市场和运维体系未建立[52] - **世界模型成为新范式焦点**:世界模型被认为是实现高级推理和规划的关键,已显著提升机器人在动态环境中的任务执行连贯性和长期行为合理性[54] 世界模型是解决数据问题的一个共识,是VLN突破长程规划和动态适应瓶颈的充分非必要条件[54] 技术架构开始把VLA与RL结合起来使用[55] - **未来展望与商业模式**:到2026年,具身智能可能在多任务协同、长时自主运行、人机共融交互等方面实现显著突破[57] 首款大面积铺开的具身智能落地产品很可能在中国出现[60] 除整机销售外,租赁、按使用次数或完成任务量收费的RAAS模式,以及“整机销售 + 每年服务费”的组合模式正在逐步落地[60] AI Native开发范式 - **定义与特征**:AI Native指从设计之初就将AI作为其不可分割的基石和核心驱动力的应用程序、产品或系统[62] 其内部嵌有模型,交互方式更贴近“人与人沟通”的多通道、多模态体验[62] - **ToB领域“热度高、落地慢”**:企业级AI应用数量同比增长超过60%,但超过一半仍集中在编程辅助、内容生成、数据分析与内部效率工具等轻量级场景,真正成为“系统级核心能力”的AI应用仍属少数[63] - **面临工程挑战**:对AI能力高度依赖的行业客户,其系统模型、算力和数据高度耦合,模型版本更新可能直接影响业务逻辑,推理成本变化会反向制约产品形态,这些问题超出了传统软件工程的设计范式[65] 低代码平台上的AI应用开发者则面临企业治理逻辑与AI认知模式之间的结构性冲突[65] - **渐进式“AI化”成为务实路径**:越来越多团队选择不推翻原有系统,而是在其之上通过Agent、插件或工作流逐步“AI化”,使AI更像一个协作层、决策层或增强层[66][67] - **对核心业务系统改造偏慢**:AI对CRM、HR、财务与供应链等核心业务系统的改造仍然偏慢,因其核心逻辑高度稳定,用户迁移成本极高[68] - **资本投入趋于谨慎**:与2023年相比,2024年国内资本对ToB AI的投入明显趋于谨慎,更倾向于支持能快速体现效率收益的AI产品,而非周期更长的系统级重构[68][69] - **重塑研发流程**:在中大型技术团队中,超过70%的工程师已将AI作为日常开发工具,显著提高了开发效率,同时也改变了工程能力结构[69] 随着AI应用规模扩大,上下文压缩、信息筛选和记忆机制将成为AI Native架构的核心竞争力之一[70] AI行业应用落地 - **金融行业**:AI应用已经从工具变为“生产力伙伴”,参与到实际业务流程中,协助和独立承担任务拆解、流程执行[75] 如果以“是否已经尝试或者部署AI”为标准,在金融行业的比例已经非常接近、甚至在部分细分领域已经超过一半[75] 一些机构日均模型调用规模已达亿级token,成为事实上的基础设施[75] - **医疗行业**:AI在医疗领域的角色早已突破单一环节的辅助,正在形成多场景、全链条的格局[77] 传神语联推出的“传神素问”中医大模型,年度使用用户已突破千万,是中国第一个能够像专家一样主动问诊的中医大模型[77] 大模型在医疗领域的应用更广泛渗透到了药物研发环节,行业内会专门构建针对性的大模型[78] - **教育行业**:豆神教育正在独家AI教育大模型的基础上,打通AI教育不同场景间的壁垒,其企业级Agent覆盖了从内容生产、课堂授课到课后服务的全流程[79] - **未来突破方向**:平安将继续在医疗多模态、居家养老具身智能上持续探索,例如利用无线波感知技术监控老人行为轨迹,识别跌倒风险[80] AI+中医将以“场景化智能体”为核心形态,AI的角色将从零散的单点工具进化为适配中医诊疗逻辑的“场景化智能体”[80] AI+中医情志康养是下一步突破的重点,预计在明年1月发布相关推进计划[80]
中兴通讯崔丽:AI应用触及产业深水区 价值闭环走向完备
21世纪经济报道· 2026-01-01 07:07
文章核心观点 - AI大模型发展正从基础设施向上层应用演进,基座大模型将收敛,但垂域模型与应用将极大丰富,成为引发技术变革的关键[1] - 物理AI是重要关注窗口,正加速具身智能、自动驾驶等领域演进,但技术路线存在分歧,软性基础尚在夯实[1] - 2025年进入“Agent元年”,AI技术正从Copilot辅助模式向自主行动的Agent模式迈进,目标是全价值链的业务重构,但规模化落地仍面临挑战[6][7] - 部分行业凭借信息密集、数据结构化程度高、价值闭环快等特征,已率先借力AI完成价值闭环,进入数智化转型“深水区”[1][9][11][12] 物理AI的技术路线与分歧 - 物理AI存在两条核心路线竞争:世界模型与视觉语言模型[2] - Sora等模型标志着AI从“预测者”向“模拟者”进化,是从数据驱动到模型仿真驱动、物理对齐、通用模拟的范式转移[2] - 当前Sora仅是“视觉模拟器”,而非真正的“物理世界模型”,因其缺乏因果推理、反事实推演和物理一致性,常出现违背物理逻辑的“物理幻觉”[2] - 世界模型路线分化为“生成派”与“表征派”:生成派通过海量感官数据归纳世界规律,适合做数据工厂或仿真训练;表征派通过构建内在结构推演世界状态,适合做决策大脑和实时推理[3] - 应用于具身智能的VLA模型将控制问题转化为序列建模,优势在于零样本泛化,但缺乏因果推理且依赖训练数据覆盖度;世界模型主张构建环境内部模型进行虚拟试错,样本效率远超VLA[3] - 产业界正呈现VLA与世界模型融合的趋势,例如利用VLA进行高层策略规划,利用世界模型进行底层动作验证[4] 网络架构向AI原生演进 - 网络架构正从“云原生”向“AI原生”演变[5] - 云原生解决了互联网应用的弹性伸缩和敏捷开发需求,互联网流量以“南北向”为主,数据包小而离散,对时延抖动有一定容忍度[6] - 大模型时代流量特征转向分布式“同步计算”,带来“大象流”、丢包零容忍、微秒级时延敏感等特点,需要网络做到“万无一失”[6] - AI原生网络的核心是极致的性能无损和算网协同,具备内生智能、确定性保障和算网一体等关键特征[6] - 应用层面,云原生应用以K8S为底座,以微服务架构为代表;AI原生应用以“大模型+Agent”为底座,以Agent及Agent间通信为代表;两者将趋于融合成为云智一体原生应用[6] Agent元年的机遇与挑战 - 2025年被称为“Agent元年”,将推动千行百业更彻底转型,从效率提升转向业务重构[6][7] - Agent从实验室走向企业核心生产系统的“最后一公里”面临多重挑战[8] - 在高可靠性行业,需解决随机性模型与确定性业务之间的矛盾、确保长程任务稳定性、构建可信安全边界[8] - 核心业务中,AI“幻觉”是不可接受的风险,企业无法容忍“黑盒”在没有人类审核下做出关键决策[8] - 由于上下文窗口限制,处理跨天、跨周的复杂任务链时,模型易出现记忆丢失或逻辑断裂,导致开发复杂度指数级增长[8] - Agent使用工具可能带来沙箱逃逸、资源耗尽和数据泄露等安全风险[8] - 企业现有IT环境复杂,存在接口标准化缺失、数据孤岛等问题,同时需平衡推理维护成本与投资回报率[8] 行业应用与价值闭环 - 能率先实现AI价值规模化复制的行业具备关键特征:信息密集、数据结构化程度高、具备强反馈机制、价值闭环极快、有一定容错度、具备一定范围泛化能力[9] - 数字化转型较好的行业更容易进行智能化转型[10] - 教育、医疗、软件开发、智能制造、城市治理等行业可能率先完成价值闭环[11] - 制造业凭借高度结构化数据环境和明确效率指标,成为AI价值变现的“排头兵”[11] - 城市治理依托海量多模态数据和公共安全需求,正通过“城市智能体”模式实现从被动响应到主动预防的跨越[11] - 数智化转型进入“深水区”意味着AI从外围辅助系统进入核心生产系统,如网络运营、电网调度、城市应急指挥等[12] - “深水区”将面临“三多”:多模态数据、多厂家设备、多业务场景;“三新”:新技术、新架构、新安全威胁;“三跨”:跨领域知识融合、跨系统数据调用、跨组织流程协同[12] 技术路径:通用大模型与行业小模型的协同 - 驱动行业AI发展并非“通用基础大模型+行业精调”与“从零构建行业专属小模型”的二选一,而应采用“云边协同”的混合路径[12] - “通用基础大模型+行业精调”是构建企业“大脑”的最有效路径,解决了认知层面的通用性与专业性矛盾,能以低成本继承通用逻辑能力,解决知识密集型任务[12] - 从零构建行业专属小模型是构建企业“四肢”的可行方案,在非自然语言、极致边缘和极致隐私场景下不可或缺,解决了感知与执行层面的效率、适配和安全问题[12] - 面对工业领域的振动波谱、雷达信号、基因序列等“非自然语言”数据,通用模型的先验知识可能成为噪音,需从零构建专用的CNN或Transformer模型[13] - 对于极致时延和功耗场景,如矿山无人驾驶卡车或高速贴片机,推理时延需控制在毫秒级,算力受限于嵌入式芯片,训练一个参数量在几百万到几亿的专用小模型是唯一可行方案[13] - 面向对数据隐私和主权有极致要求的场景,如金融或核心基础设施,为确保模型无潜在偏见或后门,会选择完全物理隔离环境下的从零训练[13] - AI本身已在重塑软件工程,高效利用AI代码大模型试错,可在一定程度上加速试错和降低成本[13]
为了让企业用好AI,云厂商们操碎了心
36氪· 2025-12-31 21:35
行业核心驱动力 - AI正在重塑整个云市场,成为云厂商增长的核心驱动力[3] - 越来越多的行业和企业意识到利用AI优化业务效率、创造价值的可行性,并急于付诸实践[3] - 云厂商的核心价值正从基础设施提供者转变为AI能力提供者,卖Token成为关键增长途径[1][6] 市场增长与规模 - 阿里云的AI相关收入已连续9个月实现三位数同比增长[1] - AWS判断未来MaaS平台带来的Token收入将和其EC2计算产品的收入不相上下[1] - 谷歌云的年化收益超过500亿美元,其中大部分增长由AI驱动[1] - 火山引擎将其千亿营收目标(原预计2029-2031年实现)上调了数百亿美元[1] - CoreWeave依靠AI算力租赁业务获得了数百亿美元市值[3] 竞争格局与战略动向 - 新锐云厂商正以更敏捷的动作拥抱AI,冲击原有行业格局[1] - 火山引擎坚持锚定「AI云」,将其视为重要的超车机会[1] - CoreWeave通过收购增强AI算力租赁之外的AI开发能力[1] - 腾讯和百度近期针对基础模型研发进行了团队调整,以加强投入[11] Agent成为价值焦点 - AI对企业的价值体现越来越集中在Agent的打造上[3] - Agent为发挥Token的价值提供了方法论和路径,是让Token产生价值的关键[4][6] - 未来几乎所有与计算世界打交道的软件都可能由大模型产生的Agent构成[4] - 行业对Agent市场给予积极乐观的预期,预计明年将呈现爆发式增长[4] Agent应用案例与效率提升 - AWS借助编程Agent Kiro,将一个原本需要30人工作18个月的项目缩短至6人用76天完成[4] - 火山引擎的一个企业客户在2024年开发了50多个Agent,到2025年增至200多个[4] - Blue Origin构建了超过2700个内部Agent,交付效率提升了75%[4] 企业面临的挑战 - 能够真正开发好、运营好并大规模使用Agent的企业并不多,通常需要深厚的技术积累[6] - 第三方调研数据显示,93%的客户在从概念验证迈向生产阶段时遇到重大障碍[6] - 主要障碍来自数据层面(概念验证数据经过优化)和工程化层面(大规模应用对安全、扩容等要求更高)[6] 云厂商的解决方案布局 - 云厂商正积极布局打造更完备、简便的Agent开发和落地能力[3] - 方向包括提供帮助企业高效搭建Agent的工具包,涉及模型定制化训练、Agent开发、运营和安全治理[3] - 需要一套为Agent开发和运行而设计的AI云原生架构来支持企业[7] 全栈式Agent开发平台 - 火山引擎推出了包含MaaS层易用性提升(Prompt Pilot、Response API)、推理代工、AgentKit全栈开发能力和HiAgent运营能力的完整解决方案[7] - AWS推出了开放式模型训练平台Nova Forge和企业级Agent开发框架AgentCore[7] - 谷歌云的Gemini Enterprise提供基础模型、无代码构建框架、专业Agent等六项核心组件,实现端到端Agent应用[7] - 腾讯云推出智能体开发平台(ADP),支持低代码/无代码构建[10] - 阿里云推出Agent开发框架ModelStudio-ADK,支持开发复杂Agent[10] - 百度云通过千帆平台提供完整的训练调优、推理部署等工具链[10] 平台能力关注重点 - 普遍重视降低Agent开发门槛、提升模型定制化能力和加强Agent安全控制[9] - AWS的Nova Forge允许企业基于自有数据训练模型,知识产权归企业所有[9] - Reddit、Booking和索尼已是Nova Forge的早期用户,Reddit训练的模型能理解小众文化[9] 基础模型演进 - 强大的自研基础模型是企业选择云平台的重要参考项[11] - 进化趋势是让基础模型更适配Agent开发需求[11] - 火山引擎豆包大模型1.8针对多模态Agent场景优化,增强了工具调用和复杂指令遵循能力[11] - 谷歌Gemini 3 Pro具备更强的自主规划、拆解任务和调用工具能力[11] 云厂商理念与指标转变 - MaaS业务的进展正在成为云厂商的一项核心指标[13] - 火山引擎已将AI的Token调用量视为核心指标,有销售因MaaS业务不佳而被淘汰[13] - 阿里云在11月传出提高MaaS业务优先级,将其作为业务长期成功关键指标的消息[13] - 阿里云提出要做「AI时代的Android」和「超级AI云」[13]