Agentic Model
搜索文档
年末 AI 回顾:从模型到应用,从技术到商战,拽住洪流中的意义之线
晚点LatePost· 2026-02-12 15:15
模型 - 本轮AI热潮仍处于早期,技术变化是核心驱动力,也是推演产品与商业格局的基点[6] - **Agentic Model成为关键趋势**:指能支持Agent能力的模型,需要具备推理、编程、多模态理解、工具使用和记忆等能力[7] - **推理模型崛起**:以DeepSeek-R1的爆火为标志,其于2025年1月20日与Kimi K1.5同日发布,成为全球首个在大参数规模上复现OpenAI o1的推理模型[8] - DeepSeek-R1影响力巨大,原因包括:完全开源最强旗舰模型、技术报告详尽、高亮仅557万美元的最后一次训练成本[8] - 推理模型的效果提升表现为多步推理能力,推动了ChatBot产品的“深度研究”功能,其背后的新技术范式是“测试时计算”的Scaling[9] - **Coding能力重要性凸显**:编程是数字世界中执行任务的基础,是支撑复杂Agent应用的重要能力[11] - 2025年全球顶尖模型厂商加大Coding投入并下场做应用,如OpenAI的Codex、x.ai的Grok Code Fast、Google的Antigravity[12] - **多模态能力成为标配**:最领先的大模型已演进为原生多模态模型,如OpenAI 4o、Gemini 1.5/3、Kimi 2.5[13] - 同时存在专门的多模态生成模型,如中国的视频生成模型可灵、海螺、SeedDance,以及Google的Veo 3和Nano Banana[13] - **协同设计成为研发组织关键**:大模型训练是系统工程,需要硬件、软件系统和算法的垂直整合与协同优化[15] - Google凭借全面掌握TPU芯片、软件库、Infra到云平台和应用,形成了协同优化的Superpower[15] - 阿里提出“通云哥”(通义-阿里云-平头哥)战略,腾讯和阿里千问团队也都在内部推动Infra与算法的更紧密整合[15][16] - DeepSeek从零开始自然形成协同优化,其Infra团队参与算法设计,展现了超强的工程能力[17] - DeepSeek在2025年2月的“开源周”展示了其Infra成果,并测算其推理系统在24小时内用1800多张卡支持了超6000亿输入Token和近1700亿输出Token,毛利率达84.5%[17][18] - **注意力机制持续改进**:围绕稀疏注意力和线性注意力进行优化,以突破上下文长度瓶颈,如Flash Attention、DeltaNet等[21][22] - **算力趋势转向多芯片互联**:从比拼单颗芯片性能转向优化多芯片互联系统,如华为384 Matrix超节点、英伟达NVL72[23] - **行业开始探索下一个学习范式**:认为当前基于海量数据预训练和微调的方法可能触达瓶颈,未来需向更接近人类的学习机制演进[24] - 研究方向包括持续学习、在线学习、世界模型等,许多研究者从动物与人类智能中获取灵感[25] - 人类大脑功耗仅约20瓦,而当前大模型训练极其耗能,寻求更节能、可解释的新学习范式成为重要议题[26] 应用 - 2025年被普遍认为是Agent应用大规模爆发的元年[27][30] - **通用Agent以Coding为核心手段**:Coding从目的变为手段,使Agent能在数字世界执行各类任务[27][28] - 代表产品包括Claude Code、Claude Cowork、近期风靡的OpenClaw,以及字节的Trae Solo、蚂蚁灵光、马卡龙、Youware等[31] - Anthropic推出的MCP协议和Skills开放标准,降低了构建Agent的门槛,使其变得模块化[32] - **出现Agent Scaling与群体智能趋势**:如Moltbook探索大量智能体聚集后的系统变化,PingCAP CTO黄东旭开发了多角色Agent协作的Minibook[33] - **垂类Agent深度结合行业**:从“卖服务”转向“为结果收费”,例如法律领域的艾语智能直接承接案件并按收回款项收费,AI教育公司爱为舞用AI替代助教[38] - **手机Agent面临存量博弈**:字节豆包手机预览版曾实现自动回微信、比价等功能,但遭超级App封禁;OpenClaw因能部署到手机而流行[35] - 手机Agent的发展涉及手机厂商、超级App与AI公司之间的三方博弈,功能性场景需求强但超级App对开放接口有顾虑[36] - **Agent工具链生态繁荣**:在基础模型与完整Agent产品间的中间地带,涵盖RAG、提示工程、上下文工程、测评等环节,成为关键机会[40] - 工具链的核心机会包括:语音与多模态交互、记忆管理、评估体系等[40][41][42] - **Sora App代表非提效类To C方向**:集中于陪伴、社交、游戏与娱乐领域,其核心功能Cameo允许用户生成数字角色进行创作或合拍[43] - Sora App发布初期热度高但留存挑战大,Sensor Tower数据显示其30天留存率低于8%,远低于TikTok的42%和Instagram的38%[43] - 特定创作者群体在沉淀,如日本创作者Matsumaru粉丝量突破10万,接近Sam Altman的14万[44] - **AI for Science应用深化**:包括利用AI加速第一性原理计算(如深势科技的DeePMD),以及利用生成式AI解决特定科学问题(如AlphaFold)[46] - **AI发明家方向兴起**:探索用AI覆盖完整科研流程,甚至让AI承担人类研究员工作,实现技术的自我繁殖[47] 巨头的AI之战:字节、阿里、腾讯 - **人才和组织是竞争底层**:三家公司采取不同策略构建AI团队[50] - **字节以创业方式做AI**:成立相对独立的Flow、Seed、Stone部门,初期由老将负责,后在2025年2月引入Google DeepMind前研究副总裁吴永辉作为Seed研发一号位,吸纳大量AI原生年轻骨干[51][52] - 内部存在多团队赛马机制,部分人才有流失[52] - **阿里团队相对稳定**:AI一号位为入职十年的周靖人,其下通义实验室包含千问、通义万相、多模态交互三个核心团队[55] - 团队从内部自下而上生长,通过开源形成强社区影响力[55] - **腾讯引入年轻“鲶鱼”**:1998年出生的前OpenAI研究员姚顺雨于2025年秋加入,出任总裁办首席AI科学家,直接向总裁汇报,并带来高频招新、重塑目标、组织调整(强调协同设计)等变化[56] - **中美人才吸引力差异**:在美国,OpenAI等初创公司对人才吸引力最大;在中国,巨头仍是顶尖人才首选[57] - **To C应用大战激烈**:字节豆包、腾讯元宝、阿里通义/夸克展开竞争[61] - **字节模型与产品协作最紧密**:Seed模型团队与Flow产品团队协作频次高,共同为产品服务[59] - 字节定下三大AI目标:探索智能上限、探索新UI交互形式、加强规模效应,其规模效应逻辑基于“数据飞轮”[59] - **腾讯与阿里经历产品团队重组**:腾讯将元宝等应用整合至CSIG,但混元模型团队仍在TEG,考验跨部门协作;微信的参与程度存疑[60] - 阿里将通义To C产品团队从阿里云划归至智能信息事业群,产品与模型团队分离[60] - **阿里应用布局经历轮换**:从通义千问App到主打夸克,再到2025年底通义App更名“千问 App”卷土重来,接通生活服务生态[61] - 千问App近期单日投放峰值达1500万元,但产品力与留存面临挑战[62] - **字节形成“一超多强”布局**:豆包成为中国首个日活过亿的AI产品,并推出海外版Dola;同时有Trae、Coze、豆包爱学等产品[63] - 豆包塑造亲切、生活化的人设,并开始尝试商业化[63] - **腾讯元宝因接入DeepSeek获益**:日活在2025年2月底快速增长了10倍,最新尝试是“元宝派”引入社交关系[63] - **春节之战白热化**:豆包拿下春晚合作;元宝推出10亿元红包;千问宣布发放30亿元红包[63] - DeepSeek-V4的发布成为最大变数,若节前发布可能利好绑定紧密的腾讯元宝[64] 创业公司们 - **大模型公司迎来IPO潮**:2026年1月,智谱AI与MiniMax前后脚上市,揭开财务底牌[67] - 智谱市值约114亿美元,MiniMax约185亿美元;但收入规模远小于美国同行:智谱2025年上半年收入约2700万美元,MiniMax前三季度约5300万美元;对比OpenAI 2025年营收超130亿美元,Anthropic达45亿美元[67] - 基础模型公司普遍巨额亏损,OpenAI仅在2025年第三季度亏损可能高达120亿美元[68] - 中国大模型公司提前上市是为获取续命资金,IPO是“下一轮竞赛的鼓点”和安全网[68] - 中国坚持做基础模型的未上市头部公司已寥寥无几,DeepSeek靠幻方自有资金,Kimi与阶跃星辰近期完成大额融资[68] - **AI应用公司出现高收入代表**:全球ARR超过或等于5000万美元的AI原生企业约有40-70家,集中在AI Coding、内容创作、法律、教育等场景[70] - 中国背景公司中,Manus以超20亿美元被Meta收购;Genspark ARR达5000万美元;OpenArt ARR达7000万美元;PixVerse 2025年总收入超4000万美元;Lovart在2025年10月宣布ARR突破3000万美元[70] - AI应用团队活法多样,可追求极致效率、寻求收购或在巨头缝隙立足[71] - **全球化面临复杂地缘因素**:HeyGen早期注销中国主体;Manus将总部迁至新加坡后被Meta收购,面临中国商务部审查;MiroMind中国团队因法律合规等地缘因素,研发负责人离职,团队寻求独立发展[72] - AI竞争已成为大国博弈核心一环,创业者需在技术主导权、场景匹配度和发展策略上做出抉择[73] 具身智能 - **投资与融资火热**:根据中国信通院报告,截至2025年底,中国具身智能和机器人领域年度融资总额高达735亿元,远超头部大模型公司同期的182亿元融资总额[75] - **中国具身智能公司估值高企**:银河通用2025年底估值达30亿美元;宇树科技IPO市值预期达500亿乃至千亿元人民币;而在美国,最贵的Figure估值390亿美元,仅为OpenAI的1/20[75] - **中国具身智能火热的三大原因**:政策与制造业红利(可落地产线)、供应链成本优势、更明确的二级市场退出路径[77] - **行业关注三大核心要素**:数据、模型和硬件本体,其中数据是当前最重要课题[76] - **数据获取方式多样**:包括真机遥操作、仿真迁移、视频学习、可穿戴设备采集、Self-play等[78] - **主流技术路线**:包括VLA模型、端到端模型,以及生成式的世界模型(如Sora、Genie 3被视为雏形)[82] - **硬件本体是复杂系统工程**:面临灵巧手寿命、关节稳定性、减重、续航等多重挑战,特斯拉Optimus多次延期[80] - **落地应用方向多元**:1) 研发(售予训练场、实验室);2) 表演与展示(如中国移动1.24亿元采购单);3) 商业与家庭服务(挑战大);4) 工业生产(有机会但面临传统竞争);5) 陪伴与娱乐(更接近消费电子,如宇树机器狗Go1累计销量数万台)[80][81][83] - 许多从业者预言2026年将是具身智能规模化应用落地元年[83] AI硬件 - **存在两种发展思路**:一是寻找下一个大规模的硬件入口;二是硬件形态可能分散和多样化[84] - **AI眼镜被视为潜在入口级硬件**:因其具备hands-off(离手操作)和always-on(全天佩戴)的交互特性,能作为接近人感官的传感器平台[85][86] - 做AI眼镜的公司众多,包括Google、Meta、阿里巴巴、小米、理想汽车等[85] - AI眼镜仍处早期,产品形态未收敛,功能选择(如是否带拍摄、显示)对应不同开发路径[87] - **多样化硬件形态并存**:包括手机、汽车,以及利用大模型特性的单功能新硬件[88] - **Plaud是多样化硬件的典型**:一款贴在iPhone背板的录音设备,加入AI总结能力,累计销量已超过100万台[88] - **Looki代表另一种传感器平台思路**:可贴在胸前的便携相机,抓拍生活片段并自动总结,旨在获取物理空间数据[86]