Workflow
大模型
icon
搜索文档
独家丨地平线敲定征程 7 目标算力,舱驾一体产品命名 “星空”
晚点Auto· 2026-03-19 16:49
地平线下一代智驾芯片规划 - 地平线正在筹备下一代智驾芯片征程7系列,其最高性能版本J7P目标算力将大幅超越英伟达Thor-X,并计划于2027年量产 [3] - 征程7系列将维持家族化产品形态 [3] - 地平线计划于今年4月发布并年内量产一款面向舱驾一体的新芯片产品“星空”,该芯片支持座舱大模型本地化 [3] 芯片研发与团队动态 - 地平线征程7的产品规划更大程度来自算法团队,由地平线副总裁兼首席架构师苏箐带领,这被视为公司从芯片供应商向整合方案商更靠拢的一步 [5] - 定义地平线J6家族产品的芯片研发负责人陈鹏即将离职 [5] - 地平线CEO余凯此前预告征程7将采用地平线第四代BPU架构“黎曼”,全面对标特斯拉AI5芯片 [5] - 地平线与大众汽车合资公司酷睿程联合打造的C7H芯片同样基于黎曼架构,基于J7打造,使用3-4 nm工艺,单颗芯片AI算力为500-700 TOPS [5] 行业算力竞争与技术趋势 - 当前主流高端智驾芯片多数在2020-2021年前后定义或研发,2025年陆续上车,主要面向模块化算法和早期端到端模型 [6] - 英伟达主流高端智驾芯片Thor X理论算力为1000 TOPS;蔚来自研神玑NX9031被描述为“一颗顶四颗Orin-X”,估算达1000 TOPS;小鹏图灵AI单颗芯片有效算力为750 TOPS;理想马赫100单颗芯片有效算力达1280 TOPS [6] - 行业认为,当前车端芯片的实际瓶颈不仅在于理论算力,内存带宽、数据搬运效率、推理精度都可能限制车端模型的体量 [7] - 地平线CEO余凯曾表示,两三年后可能出现L3级自动驾驶,届时算力需要500-1000 TOPS;L4级自动驾驶实现要到2030年,算力需达2000 TOPS [7] - 特斯拉CEO马斯克称AI5芯片预计2027年量产,曾有媒体预计其算力为2000-2500 TOPS [7] - 华为智驾产品线总裁李文广曾表示,从L2到L4车端算力需要从几百TOPS提升到1500-2000TOPS,云端算力资源需从几十EFLOPS增长到近200 EFLOPS,年租用算力成本从几十亿元到超百亿元 [8] 行业竞争焦点与公司现状 - 在智驾模型尚未彻底拉开代差、芯片技术代际相近的情况下,更深入的软硬件一体优化、对实际算力更高的利用效率,可能比单纯提升峰值算力更重要 [9] - 小鹏和理想等车企强调通过芯片与算法协同研发来提升实际运行效率 [8][9] - 地平线面临部分客户正变成其竞争对手的竞争压力 [9] - 地平线面向高阶智驾场景的J6P及自研智驾模型HSD仍在量产爬坡阶段,今年才开始在奇瑞、长安等车企项目上推进更大规模落地 [9] - 完成规模出货、维持生态和现金流是智驾芯片公司需要面对的现实,下一代平台需提前投入,但当前平台必须先活下来 [9]
邀请函|国泰海通“大模型与OpenClaw”海外科技线下沙龙
活动信息 - 国泰海通证券将于2026年3月20日在深圳举办一场海外科技线下沙龙 [1] - 活动主题为“模型与OpenClaw”,具体议程包括“大模型与 Openclaw 技术演进趋势”以及“OpenClaw 与 Token 工厂: 开源 Agent 运动如何重塑 Al 价值分配结构”两个核心议题 [1] - 活动主持人为国泰海通证券海外科技研究首席分析师秦和平 [1] 演讲嘉宾与议题 - 议题一“大模型与 Openclaw 技术演进趋势”由元始智能联合创始人兼COO罗璇主讲,其背景包括RWKV开源社区资深成员、NVIDIA GTC受邀分享者,并拥有在阿里巴巴、猎豹移动及机器人领域的丰富经验 [1] - 议题二将探讨开源Agent运动如何通过OpenClaw与Token工厂重塑人工智能的价值分配结构 [1]
英伟达首台DGX GB300,老黄亲自登门送给他
量子位· 2026-03-19 15:09
文章核心观点 - 英伟达首席执行官向个人开发者代表Andrej Karpathy赠送首台DGX Station (GB300),标志着AI智能体时代下,个人开发者正成为关键力量,公司此举旨在推广其面向个人开发者的新型算力产品与生态 [1][3][9] - 公司历史上数次亲自赠送首台重要计算设备的行为,均精准押注并引领了AI发展的不同关键阶段,从深度学习工程化、大模型算力竞赛到如今的智能体与个人开发时代 [8][37][38] - 此次赠送的DGX Station (GB300) 是一款为AI智能体量身定制的桌面工作站,旨在将数据中心级算力(748GB统一内存,20 PFLOPS算力)带入个人开发环境,支持千亿乃至万亿参数系统的本地开发与无缝迁移 [24][28][30][31] - 为配合硬件,公司同时推出了开源软件堆栈NVIDIA NemoClaw,提供AI智能体的运行时环境与安全部署方案,构建从硬件到软件的完整Agent基础设施 [34][35][36] 根据相关目录分别进行总结 英伟达的战略性赠送与时代信号 - 约10年前,向初创的OpenAI赠送首台DGX-1,推动了深度学习从实验室走向工程化,被视为AI大模型时代的前夜 [8][39][45][46] - 2024年,向OpenAI的Sam Altman赠送世界首台DGX H200,标志着大模型竞赛进入“深水区”,算力成为决定性因素,公司巩固了其作为底层算力供给者的地位 [8][47][50] - 2025年,向Elon Musk赠送DGX Spark迷你超级计算机,象征着算力形态向更小、更灵活、支持持续运行AI系统的方向演进,目标渗透至自动驾驶、机器人等广泛场景 [8][51][54][56] - 2026年,向个人开发者Andrej Karpathy赠送首台DGX Station (GB300),表明AI智能体时代来临,开发重心向能独立完成从想法到产品闭环的个人开发者转移 [1][9][58] 受赠者Andrej Karpathy的象征意义 - Andrej Karpathy是AI领域的个人开发者代表,其近期工作聚焦于将AI从论文和大公司系统,转变为“一个人就能跑起来的系统” [17][18] - 其职业履历包括斯坦福深度学习研究、OpenAI创始成员、特斯拉自动驾驶视觉团队负责人,最终回归个人开发者身份,体现了独立完成AI想法到产品闭环的能力 [14][15][16][18] - 他被选中接收首台DGX Station (GB300),象征着在算力走向分布式、本地化和具体场景化的趋势下,个人开发者成为最先承接这一变化的关键群体 [9][58][61] DGX Station (GB300) 的产品定位与特性 - 产品本质是将数据中心级AI算力压缩进桌面工作站,为“龙虾”等AI智能体量身定制 [23][24] - 采用与数据中心同源的GB300架构,提供748GB统一内存和20 PFLOPS算力,支持本地开发和运行千亿至万亿参数级别的系统 [29][30] - 核心价值在于解决“让AI一直跑下去”的持续运行需求,而非仅仅“能否跑AI”,并且本地开发环境可与云端或更大集群无缝迁移 [31][32] 英伟达构建的Agent基础设施生态 - 除硬件DGX Station外,公司通过向OpenClaw项目贡献开源堆栈NVIDIA NemoClaw,补齐软件生态 [34] - NemoClaw内置NVIDIA OpenShell运行时环境,可通过一条命令安全部署“随时在线”的AI助手,并利用沙箱机制保证执行过程安全可控 [35] - 此举旨在形成从算力硬件到安装部署软件的完整“产业链”,全面支持AI智能体的开发与部署 [36] 个人开发者时代的拓展与影响 - 除Karpathy外,首批DGX Station (GB300) 还将交付给YouTube博主兼个体开发者Matt Berman,其擅长向普通人传授搭建AI Agent系统的方法论,扮演着“个体开发放大者”的角色 [61] - 这一选择进一步强调了在智能体时代,具备独立开发能力或强大知识传播能力的个人正变得至关重要 [61] - 行业讨论认为,Karpathy未身处前沿AI实验室而作为个人开发者存在,正是当前时代特征的体现 [60][61]
雷军官宣全球开发者热议的“神秘模型”,小米“AI路线图”逐步明晰
硬AI· 2026-03-19 10:37
小米发布万亿参数大模型系列 - 公司于3月19日发布MiMo大模型系列“三连更”,包括旗舰基座大模型MiMo-V2-Pro、全模态Agent模型MiMo-V2-Omni以及语音合成模型MiMo-V2-TTS [5] - 创始人雷军表示,公司在AI领域的实际进展可能比外界看到的要快很多,2025年AI研发与资本投入将超过160亿元人民币 [7] - 此次发布终结了此前关于一款名为“Hunter Alpha”的匿名模型(具备逾1万亿参数及100万token上下文窗口)身份的猜测,该模型被证实为小米所有 [3] 旗舰模型MiMo-V2-Pro性能表现 - MiMo-V2-Pro总参数量超过1万亿(活跃参数为420亿),支持100万token的超长上下文窗口 [13] - 该模型在全球大模型综合智能排行榜Artificial Analysis Intelligence Index上位列全球第八、中国模型第二,超越了xAI的Grok模型 [13][14] - 模型在成本效率上具有显著优势,运行该模型完成Intelligence Index测试的成本为348美元,较同榜单排名靠前的GLM-5低36%,较Claude Sonnet 4.6低90% [16] - 与Claude Opus 4.6和Claude Sonnet 4.6相比,MiMo-V2-Pro的token使用成本最高可低80% [16] 全系列模型特点与集成应用 - MiMo-V2-Pro专为现实世界中高强度的Agent工作场景深度优化,在OpenClaw标准评测榜单PinchBench、ClawEval上效果处于全球顶尖 [17] - MiMo-V2-Omni整合了图像、视频及音频的多模态理解能力与智能体能力,在多项核心指标上达到或超越Gemini 3 Pro、Claude Opus 4.6、GPT-5.2等模型水平 [11] - MiMo-V2-TTS提供高可控的多粒度风格控制、自然韵律复现及歌唱能力,下一步目标包括扩展中英文以外的语言覆盖 [11] - 三款模型已集成至WPS Office、小米手机及电脑上的miclaw智能体系统和小米浏览器 [13] 高盛研报核心观点 - 高盛认为此次发布标志着公司正从AI研发投入阶段迈向成果兑现阶段,“物理AI领导者”的市场定位正逐步获得实质支撑 [9] - 高盛维持对公司的“买入”评级,设定12个月目标价为41港元,较当前股价隐含约14%的上行空间 [2][9] - 高盛预计公司2026年研发支出将达400亿元人民币,高于2025年预估的322亿元,持续的投入可能对近期利润形成拖累 [23] - 高盛预测公司2026年净利润(扣除特殊项目前)约为279亿元人民币,低于2025年预估的395亿元 [23] - 高盛认为,持续的成果交付应推动市场将公司重新定价为拥有自研AI、操作系统及芯片能力的物理AI领导者 [23] 公司AI战略与生态布局 - 此次模型发布是公司系统性推进AI研发成果转化的一部分,此前已发布了面向机器人推理的视觉-语言-动作模型Xiaomi-Robotics-0、AI智能体系统miclaw以及整合了自研跨具身基础模型的升级版辅助驾驶系统HAD [20] - 高盛为三款模型勾勒了迭代方向:MiMo-V2-Pro将攻克高复杂度推理与长周期任务规划;MiMo-V2-Omni将实现跨小时乃至跨天的持续意图规划与实时流感知;MiMo-V2-TTS将向多语言扩展并深化与Omni的融合 [21] - 高盛指出,凭借领先的多模态AI能力及“人车家”生态内丰富的智能体应用场景,公司具备捕获全球AI模型行业巨大市场空间的潜力,并有望打造高溢价、差异化的消费级AI终端 [21] 技术效率与成本优势 - 在训练效率方面,公司近期推出的ARL-Tangram系统已部署用于支持MiMo系列模型训练,该系统实现了平均动作完成时间提升4.3倍、强化学习训练速度最高提升1.5倍,以及外部资源节省最高达71% [16] - MiMo-V2-Pro在底层架构上继承了混合注意力机制,并将混合比例从5:1大幅提升到了7:1,兼顾了超大规模与极高的推理效率 [10]
神秘霸榜模型现真身:小米MiMo-V2 Pro,国内首个万亿参数+1M上下文,为Agent而生!
机器之心· 2026-03-19 09:25
小米新一代大模型MiMo-V2系列发布 - 小米发布全新一代面向智能体(Agent)的大模型家族MiMo-V2系列,包括旗舰基座模型MiMo-V2-Pro、全模态模型MiMo-V2-Omni和语音大模型MiMo-V2-TTS [3][8] - 公司宣布将持续加大AI领域投资,2025年投入将超过160亿元人民币 [4] - 旗舰模型MiMo-V2-Pro在发布前曾以代号Hunter Alpha在OpenRouter平台进行盲测,并取得优异成绩 [1][2] 模型性能与市场表现 - Hunter Alpha(即MiMo-V2-Pro Preview)在OpenRouter平台“趋势榜”排名第一,“周榜”排名第三,并在“日榜”保持领先 [2] - 在OpenRouter日榜中,Hunter Alpha以3100亿(310B)的调用令牌数位列第一,调用量增长131% [3] - 在权威大模型综合智能排行榜Artificial Analysis上,MiMo-V2-Pro位列全球第九,国内第三,进入国内大模型第一梯队 [6][7] 技术规格与架构特点 - MiMo-V2-Pro是面向Agent时代的旗舰基座模型,参数量高达10210亿(1021B),激活参数量为420亿(42B) [8] - 相比前代MiMo-V2-Flash,参数量扩容约3倍 [38] - 模型优化了混合注意力机制(Hybrid Attention),将滑动窗口注意力与全局注意力的混合比例提升至7:1,并搭配轻量级的多令牌预测层以实现高效生成 [38] - 模型针对OpenClaw等通用智能体框架的脚手架进行了深度的监督微调与强化学习,以优化真实应用能力 [38] 智能体(Agent)能力评测 - 在OpenClaw标准评测榜单PinchBench上,MiMo-V2-Pro效果处于全球顶尖水平 [11] - 在Claw-Eval真实世界智能体基准测试中,Hunter Alpha(MiMo-V2-Pro Preview)在PASS@3指标上达到61.5%,平均得分75.7,排名第三,仅次于Claude Sonnet 4.6和Claude Opus 4.6 [13] - 开发者社区反馈显示,在复杂的Agent编排场景中,Hunter Alpha的实际落地效果接近于Claude 4.6 [12] - 有开发者表示,目前构建全端自动开发工作流,只有GPT-5.4、Claude Opus 4.6和Hunter Alpha是可信赖的 [14] 多模态与语音能力 - MiMo-V2-Omni(即Healer Alpha)是全模态模型,专为快速推理和低延迟场景打造,支持文本、图像、音频、视频(最长一小时)输入,具备GUI Agent能力 [8][30] - MiMo-V2-TTS是首款“说唱兼备”的超拟人语音大模型,支持多方言、音色切换及音色克隆能力 [8][35] - 结合MiMo-V2-Omni与MiMo-V2-TTS,小米拥有了现阶段可以同时理解音视频的国内领先Agentic模型,为处理浏览器多窗口、复杂内容联合理解与生成等任务提供支持 [35] 实际应用场景演示 - 在长文本深度研究任务中,模型能自动选择工具并在工具不可用时寻找替代方案完成任务 [16] - 在分析马斯克近期社交动态并关联股票概念的时效性任务中,模型能正确筛选信息并提供有用总结 [20][22] - 模型能完成需要技术和机智的编程任务,例如编写包含多种风格的“疯狂星期四”文案生成Python脚本 [22] - 模型展示了优秀的代码能力,能按要求生成包含介绍、参数对比和社区评价的HTML页面 [26] - MiMo-V2-Omni能协助完成多模态任务,如根据图片生成包含热门话题标签的抖音作品描述 [31][32] - MiMo-V2-TTS可实现拟人化语音合成,例如用刘德华的声音生成叫早语音 [35] 商业化与生态布局 - MiMo-V2-Pro API已全面开放,定价具有竞争力:在接近Claude Opus 4.6能力的同时,API定价仅为其五分之一 [40] - API采取分段计价:256K上下文内,输入每百万令牌1美元,输出每百万令牌3美元;1M上下文内,输入每百万令牌2美元,输出每百万令牌6美元 [43] - 为加速Agent生态繁荣,小米联合OpenClaw、OpenCode等五大主流Agent开发框架团队,向全球开发者提供为期一周的限时免费接口支持 [40] - 模型已作为基础设施在小米多个核心业务和生态伙伴中上线 [42] - 小米版智能体产品MiClaw与小米“人车家全生态”深度集成,推动AI能力从“对话”迈向“系统级执行” [42] - 模型底层推理引擎已与金山办公达成框架级集成,WPS灵犀可直接向搭载了MiMo-V2-Pro的灵犀Claw布置复杂任务 [42] - 小米浏览器已全面接入该模型,提升AI搜索效率 [42] - 公司上线了AI Studio体验页面,提供免费模型体验,其中的MiMo Claw模块打通了金山WebOffice生态,原生支持Word、Excel等格式,覆盖超95%的日常文档类型 [42] 未来计划 - 小米大模型Core团队计划以星期为单位持续迭代MiMo-V2系列大模型,面向真实场景提供更完善的复杂推理与长周期任务规划能力 [44]
山东极视角科技股份有限公司(H0335) - 聆讯后资料集(第一次呈交)
2026-03-19 00:00
业绩总结 - 2022 - 2024年公司收入由1.016亿元显著增至2.573亿元,复合年增长率为59.2%[42] - 2024年9月30日至2025年9月30日九个月收入由7940万元增加71.7%至1.363亿元[42] - 2022 - 2025年收入增长率分别为142.2%、25.7%、101.5%、71.6%[77] - 2022 - 2025年毛利增长率分别为60.4%、6.4%、212.9%、96.2%[77] - 2022 - 2025年毛利率分别为30.6%、25.9%、40.2%、44.9%[77] - 2024年公司录得利润870万元,2025年录得亏损4580万元[95] 用户数据 - 截至2025年9月30日,公司建立由数十万开发者组成的全球社区,向超3000名客户提供服务,自成立交付超6000个项目,产品复购率超80.0%[41] - 2024年推出大模型解决方案后,截至最后实际可行日期,超100家实体主动联系[41] 未来展望 - 预计到2029年,中国新兴企业级计算机视觉解决方案市场规模达970亿元,复合年增长率为54.3%,渗透率提升至53.2%[59] - 2024年中国企业大模型AI解决方案市场规模为58亿元,预计到2029年达527亿元,复合年增长率为55.5%[59] 新产品和新技术研发 - 2025年第四季度公司推出极智,用作大模型解决方案的交付平台[94] - 2025年第四季度公司将AI视觉语言模型命名为星际视觉语言大模型[95] 市场扩张和并购 无 其他新策略 - 公司拟将约[编纂]用于增强研发能力,包括大模型及AI基础设施建设和升级AI - PaaS中间件[91] - 公司拟将约[编纂]用于提升商业化能力,包括建立多元化营销网络和实施全球发展战略[96] - 剩余款项约[编纂]港元用于提供营运资金及一般企业用途[96]
TENCENT(00700) - 2025 Q4 - Earnings Call Transcript
2026-03-18 21:00
财务数据和关键指标变化 - 2025年第四季度总收入为人民币1944亿元,同比增长13% [5][34] - 2025年第四季度毛利润为人民币1083亿元,同比增长19% [5][34] - 2025年第四季度非国际财务报告准则营业利润为人民币695亿元,同比增长17% [5][36] - 2025年第四季度非国际财务报告准则归属于权益持有人的净利润为人民币647亿元,同比增长17% [5][36] - 2025年第四季度整体毛利率为56%,同比提升3个百分点 [37] - 2025年第四季度销售及市场推广开支为人民币130亿元,同比增长26% [37] - 2025年第四季度研发开支为人民币238亿元,同比增长20% [38] - 2025年第四季度经营资本开支为人民币169亿元,环比增长41%,但同比下降51% [38] - 2025年第四季度自由现金流为人民币340亿元,同比增长超过6倍 [39] - 2025年全年回购1.53亿股,总代价为800亿港元 [40] - 提议年度股息为每股5.3港元,同比增长18% [41] 各条业务线数据和关键指标变化 - **增值服务**:第四季度收入为人民币900亿元,同比增长14%,占总收入47% [25] - 社交网络收入为人民币310亿元,同比增长3%,主要由视频号、直播和音乐订阅收入增长驱动 [25] - 音乐订阅收入同比增长13%,得益于ARPU和订阅用户数增长 [26] - 长视频订阅收入同比增长1%,受益于《爱情有约》、《自然嗨:第三季》和《凡人修仙传》等热门内容 [26] - 国内游戏收入同比增长15%,主要由《三角洲行动》、《无畏契约》系列和《鸣潮》驱动 [26] - 国际游戏收入同比增长32%,主要由Supercell旗下游戏、《PUBG Mobile》和《鸣潮》驱动 [26] - **网络广告**:第四季度收入为人民币410亿元,同比增长17%,占总收入21% [25][29] - 2025年全年网络广告收入增长19%,超过中国广告行业14%的整体增速 [12] - **金融科技及企业服务**:第四季度收入为人民币610亿元,同比增长8%,占总收入31% [25][31] - 金融科技服务收入实现个位数同比增长,毛利润增速更高,由财富管理和商业支付服务驱动 [31] - 企业服务收入同比增长22%,由云服务收入增长及因小商店电商交易量增加带来的技术服务费增长驱动 [32] 各个市场数据和关键指标变化 - **国际游戏业务**:2025年全年收入首次突破100亿美元 [4] - **云服务**:2025年实现调整后营业利润人民币50亿元 [23] - 国际云服务收入加速增长,得益于与关键客户扩大合作及旗舰云产品采用率提高 [4] - 第四季度云服务收入同比增长加速,受需求增加及内存和CPU供应紧张下更好的定价环境驱动 [32] - 云媒体服务收入显著增长,因短视频平台和AI视频生成服务越来越多地使用其媒体处理解决方案 [33] 公司战略和发展方向和行业竞争 - **AI作为转型力量**:公司认为AI将影响科技行业各个部分,但现有核心业务具备高韧性,其特征包括网络效应、深度供应链整合、严格的监管许可要求、稀缺资源、低切换成本以及封闭的私有数据 [6][7] - **AI赋能核心业务**:优先利用AI强化核心业务,在各核心业务中均处于行业前沿 [11] - **游戏**:利用生成式AI加速游戏内容生产、促进用户获取与留存、丰富核心玩法体验(如PVP游戏中的虚拟队友) [11] - **网络广告**:升级广告基础模型以提供更精准广告,推出生成式AI广告创意解决方案及自动化广告活动解决方案AiM Plus [12] - **视频号**:部署更长的序列AI模型以增强内容推荐,2025年总使用时长增长超20%,成为中国DAU第二大的短视频服务 [13] - **金融科技**:利用轻量级AI模型增强信用评分流程和欺诈检测,维持优于行业的不良贷款率 [15] - **企业软件**:在WeCom和腾讯会议中提供AI功能,如会议纪要总结和客服历史智能摘要 [14] - **投资新AI产品**:将新AI产品(如混元、元宝)的投资视为类似联营公司投资或资本支出的战略性投资 [20] - 2025年第四季度在混元和元宝上的支出为人民币70亿元,2025年全年为人民币180亿元 [19] - 预计2026年对混元、元宝及其他新AI产品的投资将增加一倍以上 [20] - **新AI产品战略**: - **基础模型**:混元3.0正在进行内部测试,其能力提升幅度大于2.0相对于1.0的提升 [15] - **多模态能力**:公司的3D文生图和世界模型是早期类别领导者 [16] - **AI应用**:专注于为元宝(AI聊天机器人应用)寻找产品市场契合点;在微信内集成AI以增强内容消费、信息检索、商品推荐和客服等体验;构建能在微信功能(尤其是小程序)内代表用户自主交互的AI智能体 [16][17] - **OpenClaw与AI智能体**:推出WorkBuddy、QClaw等AI生产力工具,通过SkillHub提供可下载技能;认为OpenClaw代表了一种去中心化的AI格局,为许多公司提供了参与机会 [18][67][70] - **云计算发展路径**:以腾讯云为例,说明公司通过长期耐心投资、聚焦高质量服务(而非转售和定制项目等低附加值活动),最终实现盈利的业务孵化路径 [21][23][24] - **行业竞争与定位**:不认同AI聊天机器人是AI触达用户的唯一方式;认为AI聊天应用主要与搜索应用竞争,而非与其他所有应用竞争 [16] 管理层对经营环境和未来前景的评论 - **经营环境**: - 网络广告:第四季度来自互联网服务和本地服务类别增长迅速,但电商类别因平台暂时将预算从营销转向补贴而增长放缓,金融服务类别也受季度内影响在线借贷的政策变化影响 [30] - 云服务:近期看到更好的定价环境,尤其是内存和CPU;随着强劲的AI需求和海外扩张,云收入增速加快 [23] - 芯片供应:正在积极配置更多算力,将通过租赁容量、采购重新可用的高端进口GPU以及采购越来越多的中国国产GPU来实现 [49] - **未来前景**: - 由于新AI产品投资加大,2026年收入增速可能快于利润增速,公司对此结果感到满意 [46] - 对新AI产品的长期回报充满信心,相信货币化将跟随使用量而来 [20] - 游戏行业是AI普及的天然受益者,因为人们将有更多空闲时间 [9][90] - AI不会导致游戏开发与发行的价值平衡发生根本改变,关键成功因素仍将青睐行业中最优秀的开发者 [89] 其他重要信息 - 2025年公司游戏收入增长22%,超过全球游戏行业7%的增速 [12] - 微信小程序总用户使用时长同比增长超20% [27] - 移动支付费率已是全球最低之一,使得在价格上竞争非常不经济 [10] - 第四季度末员工约11.6万人,同比增长5%,主要增加在技术平台,包括AI相关岗位 [38] - 苹果宣布在中国区App Store降低佣金费率(应用从30%降至25%,迷你游戏从15%降至12%),公司预计这将带来良好的利润传导,且认为这是多步积极旅程的第一步 [108][110][111] 总结问答环节所有的提问和回答 问题: 关于AI投资增加对2026年利润率的影响,以及在GPU和AI人才约束下的战略优先级 [44][45] - **回答**:2026年因新AI产品投资加大,收入增速可能快于利润增速,公司对此感到满意 [46] - **回答**:在人才方面,已积极组建了顶尖的混元团队,将继续选择性招聘,但对现有团队设置感到满意 [47][48] - **回答**:在GPU方面,正通过租赁、采购进口及国产GPU积极配置更多算力,算力将在今年逐步上线,下半年更快 [49] - **回答**:算力使用优先级是混元和新AI产品,核心产品本身具有分布式性质,可从多种来源获取算力 [50] 问题: 关于AI投资周期的投资回报率评估、回报时机、自建与租赁策略,以及AI技术栈中哪些部分最关键 [52][53] - **回答**:在现有业务中应用AI已看到非常好的投资回报率 [54] - **回答**:对新AI产品的投资将先行,收入会滞后,但长期将产生有吸引力的回报,类似腾讯云的发展路径 [55][58] - **回答**:在自建与租赁上,若条件允许更倾向于购买(因资产负债表强劲),但受供应链和监管限制时也会租赁 [59] - **回答**:目前市场动态快速,难以断言哪一层最重要;公司有资源在所有层面进行投资,尤其在应用层、产品能力、生态系统连接等方面是公司的优势领域 [60][64] 问题: 关于OpenClaw带来的AI智能体机遇,公司与安卓的类比,以及如何在模型层等方面实现差异化 [66] - **回答**:OpenClaw代表了一种去中心化的AI模式,类似于互联网和移动互联网的发展,将出现多种AI智能体和服务 [67][70] - **回答**:公司需要在模型层、产品层、基础设施层等各层面建立专长,每层都需有其独特的价值主张 [71] 问题: 在AI智能体时代,公司的价值主张是什么,以及如何防止其他大语言模型稀释公司自有基础模型的价值 [73] - **回答**:公司横跨PC、移动、云端,运营集中式应用并托管去中心化生态系统(如小程序),这些能力与AI智能体的部署天然契合 [74][75] - **回答**:OpenClaw的魅力在于用户可以选择不同性价比的模型,混元是其中之一;相信随着混元能力快速提升,用户自然会更多选择它,不预期会出现垄断局面 [76][77][78] 问题: 生产力AI智能体的普及是否会加速对3D/世界模型的需求,以及公司在物理AI时代的竞争实力评估 [80] - **回答**:AI确实有望增强乃至超越现有的计算机辅助设计能力,这在工业设计、建筑和游戏中都很重要 [81] - **回答**:公司凭借游戏中广泛而深入的3D图形资产,在提供数据训练相关模型方面处于独特优势地位,但这是一个较大的利基市场,并非眼前最大最直接的机遇 [81][82] 问题: AI对游戏开发质量、成本的影响,是否会改变开发与发行的价值平衡,以及是否会显著增加游戏供给 [84] - **回答**:目前AI主要用于加速和提升现有游戏内的内容创作,尚无法从头创建完整游戏 [85][86] - **回答**:游戏行业本就处于永久性供过于求状态(每年移动端新游戏20万款,Steam新游戏1.8万款),AI是否进一步增加供给影响有限 [87][88] - **回答**:创造并维持长青的最佳游戏仍需顶尖人才与技术的结合,开发与发行的价值平衡将维持现状,关键成功因素仍青睐最佳开发者 [89] 问题: 关于AI云服务在需求强劲和服务器成本上涨环境下的定价权与价值捕获哲学 [93] - **回答**:需求激增不仅限于GPU,也涉及CPU、内存、存储等整个基础设施层面 [94] - **回答**:由于供应被提前预订,供应商优先考虑大型超大规模厂商,中小云提供商需转向超大规模厂商,而后者此前利润率很低,因此在需求上升时几乎别无选择,只能转嫁更高价格,近期中国云市场已出现多次涨价 [95][96] - **回答**:价值捕获的原则是通过“丰富化”交付更多价值:从裸金属租赁(低价低毛利),到虚拟化为代币(更高价和毛利),再到打包为PaaS或SaaS(最佳定价和毛利) [97][98] 问题: 公司作为AI领域的后来者,如何有信心不会落后且能够赶上 [101] - **回答**:AI不是单一竞赛,而是由许多不同竞赛组成的世界,不断有新领域和新前沿出现(如从聊天机器人到编程、多模态,再到OpenClaw) [102][103] - **回答**:公司拥有应用层(如微信)、跨设备生态、基础设施(安全、云、支付)等基础能力,可以在新的AI竞赛中打包组合这些能力 [105] - **回答**:不担心起步晚,更担心创新不够快;目前混元团队重组和产品团队创新正在以令人兴奋的方式推进 [106] 问题: 苹果降低App Store佣金费率对腾讯毛利率的影响程度,以及利益如何分配 [108] - **回答**:苹果降费是已生效的实际举措,预计将有良好的利润传导 [108] - **回答**:在腾讯作为游戏发行商的情况下,绝大多数收入分成是基于总收入(而非扣除苹果分成后的净收入)计算的,因此增量利润将流向腾讯 [109] - **回答**:苹果宣布未来将给予中国开发者与全球其他地区更低的费率同步的待遇,公司认为这是积极多步旅程的第一步 [110][111] 问题: 自研AI芯片在腾讯AI优先级中的位置 [114] - **回答**:目前自研芯片不是最关键的关注点 [115] - **回答**:训练芯片设计制造难度大,且希望尽可能灵活使用最先进的训练芯片;推理芯片方面,中国供应商众多,利润率较低,选择多样 [115][116] - **回答**:当前关键是利用最佳训练芯片训练出最佳模型,并专注于释放产品开发和整合连接能力以设计最吸引用户的AI产品;之后才会考虑如何降低推理成本 [116][118]
百度推动大模型与搜推业务融合
第一财经· 2026-03-18 14:31
公司人事变动 - 百度任命原大模型算法部何径舟自基础模型研发部轮岗至移动生态事业群组,担任百度APP研发中心组织负责人,向罗戎汇报 [1] - 原负责人赵世奇因个人原因离职 [1] 组织架构调整 - 百度移动生态事业群组此前进行了组织架构调整,将PC与移动端所有搜索业务合并,由李小婉负责用户产运业务 [1] - 同步新设了百度APP研发中心和体验与质量保障中心 [1] 战略方向与业务融合 - 此次人事轮岗旨在推动大模型与搜索、推荐业务的融合 [1] - 目标是强化大模型等前沿技术在搜索、推荐等核心场景的应用 [1]
GenAI系列报告之72:OpenClaw会引领Agent元年吗?
申万宏源证券· 2026-03-17 22:53
报告行业投资评级 - 看好 [1] 报告的核心观点 - 2026年将成为Agent(智能体)商业化关键分水岭,标志着AI从“对话式助手”转向“数字员工” [3][4] - Agent技术的成熟是软件系统的全面革新,推动AI从单一“工具”向全面“执行系统”转型 [3][5] - Agent技术并未“吞噬软件”,而是通过优化任务执行和流程自动化,重新定义了软件的价值分配,为嵌入企业核心流程的B端软件平台创造了结构性增量机会 [3][6] 根据相关目录分别进行总结 1. Agent在2026年的变化 - **产品演变**:从“工具”到“数字员工”。以OpenClaw和Claude Cowork为代表的产品实现了AI从“对话式助手”向“执行式代理”的转变 [14]。OpenClaw作为开源“数字员工”,通过Headless架构在用户日常通讯工具(如微信、WhatsApp)中无缝执行高频任务 [26][27]。Claude Cowork则作为商业化“桌面任务执行引擎”,能在0代码环境下处理复杂的跨平台任务 [15][20] - **技术基础**:打造高效、可靠的Agent基础。过去三年,Agent所需的Brain(推理与规划)、Memory(上下文与记忆)、Action(工具调用与执行)三类底层能力已逐步闭环 [37]。技术演进路径为:2023年Reasoning(推理)突破,模型开始具备复杂任务规划能力 [38];2024年Memory(记忆)突破,长上下文与外部记忆体系成熟 [45];2025年Action(行动)突破,工具调用能力实现标准化和平台化 [51];2026年Agent技术进入系统化阶段,竞争重心转向多Agent协作、任务调度等系统级能力 [56] - **交付标准化**:关注成功率、可审计性与风险管理。企业部署Agent的核心约束包括端到端任务成功率、过程可审计与可复盘性、单位任务成本可预测性以及明确的风险边界 [60]。通过能力模块化、标准化工具栈、强约束工作对象来提升任务闭环稳定性 [61];通过对象级、过程级和动作级证据链实现可审计 [63][64];通过上下文成本治理和试错成本约束实现成本可控 [65];通过关键动作许可机制、执行环境隔离和最小权限原则控制风险边界 [66] 2. 模型会吞噬软件吗? - **市场讨论**:Claude Cowork等产品的出现引发了市场对“模型吞噬软件”的担忧,认为大模型可能从提供API能力转向直接切入应用层,冲击现有软件价值 [69] - **实际影响**:Agent实际带来了软件的价值分化,而非吞噬。模型将一部分通用能力(如写作、总结)标准化,降低了为单点功能使用独立软件的需求 [74]。但企业真正持续付费的价值在于数据合规访问、流程稳定执行、结果核验追溯和风险控制,这部分价值不会被模型吞噬,反而会在Agent放量时被重新定价 [74]。低切换成本、弱客户接触的软件形态易被替代,而深度嵌入企业核心流程、管理数据和任务执行的软件则因Agent技术加持实现价值扩展 [3][75]。在中国市场,软件行业具有更强的定制化特色和行业know-how壁垒,大模型难以完全取代应用 [77][78] 3. Agent利好的方向 - **办公软件与协同套件**:成为Agent的“核心入口”。它们占据高频入口、业务对象承载和组织级权限控制面的关键位置 [83]。例如,Microsoft 365 Copilot、Claude in Excel将Agent能力内嵌于工作流,实现“入口即产品”和“对象级可交付变更” [83][86]。协同与会议系统(如Zoom AI Companion)将沟通内容转化为可执行任务 [90] - **企业安全与“沙箱”需求**:Agent的广泛部署拉动了对轻量级、快速启动沙箱技术的需求,以提供安全隔离的执行环境 [95]。沙箱模式(启动速度约150毫秒)相比传统虚拟机更适合高频、短生命周期的Agent任务 [95][99]。头部云厂商(如阿里云、腾讯云、Google Cloud、AWS)均已推出包含沙箱功能的Agent Infra产品 [102][103] - **B端SaaS平台**:成为模型能力交付的“最后一步”,迎来结构性增量。CRM、ERP等平台掌握业务对象、流程引擎和数据语义,能够将行业know-how固化为可调用的actions(动作) [106]。例如,Salesforce的Agentforce、SAP的Joule Agents将Agent产品化为“数字劳动力”,并强调可见性、控制与流程专长 [107][110] - **Token消耗与云计算**:Agent的推理范式(如“思考->行动->观察”循环)推动Token消耗量爆发式增长 [117]。自2026年1月初起,Token调用量已连续2–4周保持高速增长 [119]。IDC预测Agent将带动Token数据爆发 [121]。云厂商通过提供Agent托管服务,吸引用户并增加云资源消耗,直接受益 [123]。边缘计算和网络安全基础设施(如Cloudflare)同样因满足AI代理的低延迟和安全连接需求而受益 [123] - **To C大入口与复杂场景**:复杂Agent入口的竞争向拥有资金、技术和生态优势的头部互联网平台集中 [124]。在中国,腾讯(微信)、阿里巴巴(千问)、字节跳动(豆包)凭借高频入口和丰富的服务生态占据优势 [126]。例如,豆包DAU已破亿,并接入抖音商城和本地生活 [130];千问在2026年1月上线Agent功能,可实现点外卖、行程规划等端到端动作 [136];“对话即交易”可能重塑互联网竞争格局 [139]
河南县城85后,4年狂揽3000亿!
创业家· 2026-03-17 18:15
MiniMax公司发展历程与成就 - 公司成立于2022年1月,创始团队平均年龄32岁,普通员工平均年龄29岁,很多人是人生第一份工作[31] - 2026年1月9日,公司成功登陆港交所,从成立到上市仅用4年时间,刷新AI创业公司最快上市纪录[5] - 截至2026年3月10日,公司市值已攀升至3800亿港元(约合人民币3350亿元),超过百度、京东、携程等互联网巨头[6] - 2025年,公司实现总收入7903万美元(约合人民币5.43亿元),同比增长158%,产品覆盖200多个国家和地区[58] - 公司400多名员工,近乎全员持股,研发人员占比超7成[6][55] 创始人闫俊杰的背景与理念 - 创始人闫俊杰出生于1989年,来自河南商丘,父亲是初中数学老师,从小培养了他的数学兴趣[16] - 2010年考入中国科学院自动化研究所硕博连读,仅用3年达到毕业标准,在顶级期刊发表几十篇学术论文[17] - 博士毕业后加入商汤科技,从实习生一路成长为技术副总裁,曾带领团队在国际视觉识别挑战赛中夺冠[19][21] - 2021年12月,在商汤上市前夕选择离开,投身通用人工智能(AGI)创业[28] - 信奉“MiniMax”原则,即在最坏的条件下寻找最优解,并将其作为公司名和行事准则[6] - 其个人身家已达250亿元,首次登上《2026胡润全球富豪榜》[6] 公司的战略与商业模式 - 创立之初便定下三条原则:服务用户、面向全球、技术驱动,并采取“底层大模型”与“落地应用”双线战略[31] - 坚持全球化布局,不局限国内市场,2024年公司超7成收入来自海外市场[8][46] - 实施“AI全家桶”策略,同时研发文本、语音、视频、音乐等大模型,并尝试打通从底层技术到产品应用的完整闭环[36] - 2023年在海外推出AI社交应用Talkie(国内版为“星野”),通过“赛博伴侣”和游戏机制快速验证产品市场[38] - 不过度追逐产品“日活”、“月活”等虚荣数据,强调技术优先和长期主义[8][55] 核心技术突破与产品迭代 - 2023年下半年,公司押注全新的混合专家模型(MoE),经历两次失败后,于2024年初发布国内首个MoE大模型,性能接近国际领先水平[45] - 2024年4月推出新一代文本模型,5月推出视频生成平台海螺AI,9月推出第一代音乐模型[46] - 2025年6月,为应对竞争对手DeepSeek,发布M1推理模型,其核心算法被硅谷巨头采用[55] - 随后发布具备“边想边做”能力的M2模型,其思路得到国际开发者认可,公司开始在行业扮演“定义者”角色[57] - 公司用美国同行5%的成本,做到了其95%的技术效果,且这个差距还在持续缩小[58] 融资历程与资本认可 - 公司成立一个月后,便拿到3千万美元融资[34] - 2024年12月,完成第6轮融资,公司估值超30亿美元,身后集齐了顶级风险投资机构[46] - 创始人曾为打动高瓴资本进行长达9小时的技术演讲,并获得了米哈游创始人的投资,后者看中其韧性[32] - 投资人评价创始人“看上去很温和,但实际很疯狂。认定目标后,他会投入所有资源去赌”[32] 行业竞争格局与公司定位 - 2022年11月ChatGPT发布后,国内爆发“百模大战”,一年内发布的大模型数量高达230个[35] - 行业最初沉淀出“AI六小龙”,到2025年中仅剩“AI四小强”还在正面竞争,零一万物放弃模型研发,百川智能收缩至医疗领域[55] - 面对字节跳动、阿里巴巴等互联网巨头的竞争,公司选择田忌赛马,在技术上寻找突破[44][45] - 公司认为真正的竞争是一场马拉松,而非短跑,中国创业者凭借独特的效率优势可以参与竞争[58] 公司管理文化与团队建设 - 创始人不用天价薪酬挖硅谷海归,而是启用刚踏入职场的年轻人[8] - 创始人是算法工程师的最终面试官,要求聪明有悟性、对AI有热情、能与他人合作,无法融入团队的天才不会被录用[49] - 为应对竞争和稳定团队,公司内部几乎实现全员持股,并给员工发更多的钱[50] - 当战略调整时,无法认同新方向的高管甚至早期合伙人会被请离团队,以保持整体效率[53] - 公司内部搭建人机混合工作模式,让AI接管写代码、修Bug等消耗时间的“脏活累活”,提高团队运作效率[53]