多模态 - 财报，业绩电话会，研报，新闻 - Reportify

多模态

搜索文档

日耗50万亿Token，火山引擎的AI消费品战事

36氪· 2025-12-19 18:55

文｜陆莫斯封面来源｜AI生成如果想知道AI市场到底发展成什么样，火山引擎已经是中国市场当仁不让的风向标。 "截至今年12月，豆包大模型日均token使用量突破50万亿，较去年同期增长超过10倍。"12月18日，在人头攒动的Force大会现场，火山引擎总裁谭待宣布了这一数字。 MaaS（模型即服务），是最直接的观察模型消耗量的指标。单论这一市场，如今火山引擎已经成为国内市场份额第一，全球也能排在第三位。 2025年中旬，云厂商争夺"AI云第一"的硝烟还未停息，到了今年最后一个月，各个大厂又端上了各个新版本——前有谷歌的旗舰模型Gemini 3、视频模型 Veo 3.1炸场，后有OpenAI的GPT-5.2紧追不舍。在国内，包括阿里、腾讯等巨头也纷纷端出了新模型的更新。 "大家可能以为这个很简单，但我们做起来也很不容易！"谭待笑着说，"现在的模型能力其实已经够强了，但是很多企业还是用不起来，问题是Agent的工具和生态还很早期，企业做Agent迭代就会很慢。" 距离2020年火山入局云市场，已经过去了五年。彼时火山还被称为是云市场的"新军"，现在，火山已经凭借大模型的东风，成为AI领域里不可忽视的力量 — ...

MaaS（模型即服务）

Seedance 1.5 pro

MaaS（模型即服务）

Seedance 1.5 pro

AI 产业速递：从字节原动力大会看国内 AI 应用落地趋势

长江证券· 2025-12-19 17:27

报告行业投资评级 - 投资评级：看好，维持 [6] 报告的核心观点 - 从火山引擎原动力大会观察到明确的下游需求爆发趋势和模型能力的持续迭代，供需共振下看好明年行业token用量再上台阶 [2][9] - 重点关注多模态（如生图、生视频）、端侧（如AI玩具、眼镜等）、Agent等赛道的应用机会 [2][9] 事件描述与数据表现 - 2025年12月18日，火山引擎举办冬季Force原动力大会，正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro，同时发布多款新产品 [2][4] - 截至2025年12月，豆包大模型日均token使用量突破50万亿，自发布以来增长471倍，较去年同期增长超过10倍 [9] - 已有超过100家企业客户累计token使用量超过一万亿 [9] 模型能力迭代升级 - **豆包大模型1.8**：拥有更强多模态Agent能力 [9] - 升级多模态理解，单视频理解帧数从640提升至1280 [9] - 更强Agent能力，加强工具调用、长文和多轮指令遵循，同时支持OS Agent落地 [9] - 更灵活的上下文管理：支持256K，具备原生API上下文管理 [9] - **豆包视频生成模型Seedance 1.5 pro**：主要进步在于音画高精同步、支持多人多语言对白及具备影视级叙事张力 [9] 新产品与架构发布 - 全面升级AI云原生架构 [9] - 推出企业级AI Agent平台AgentKit，帮助企业打造多样的Agent，解决权限、集成等工作 [9] - 推出智能体工作站HiAgent，帮助企业管理和调度未来的数字员工 [9] - 发布多款封装完成的通用Agent，如“内容审核Agent”、“内容洞察Agent”、“客服Agent”，以降低企业特定任务的部署难度 [9] 商业模式与定价策略 - 火山引擎推出模型“节省计划”，提供阶梯折扣最高节省47% [2][9] - 模型定价思路从最初的技术调优实现单token降价，演进为根据Context区间定价，再到针对客户使用多款模型解决不同任务的习惯推出整体节省计划 [9] - 定价策略旨在使客户在token用量增大的情况下享受更优惠价格，降低创新成本 [9]

软件与服务

豆包大模型1.8

软件与服务

豆包大模型1.8

谷歌挑战英伟达，摩尔线程、沐曦内部人士怎么看？

第一财经· 2025-12-18 22:06

2025.12. 18 这场由巨头博弈引发的震荡，将一个核心议题推至台前：在以大模型为核心的AI时代，硬件的技术范式是否正在从通用GPU转向专用芯片如TPU？这是否意味着一场结构性的变革已然来临？本文字数：1632，阅读时长大约3分钟作者 | 第一财经刘佳这一悬念不仅关乎国际巨头的战略布局，也紧密牵动着中国AI算力产业链的神经。作为对标英伟达、不久前刚刚上市的中国GPU厂商代表，摩尔线程创始成员、摩尔学院院长李丰与沐曦高级副总裁孙国梁在今日腾讯contech大会上"同框"，并回应了对于两种路线的看法。在李丰看来，争议背后其实是"通才与专才"的分工，而非简单的替代关系。他分析，谷歌能做TPU，本质上是因为它是全栈整合公司。谷歌有强大的 Infra、基础模型与云服务形成闭环，把模型跑在自家芯片上量身优化，实现成本性价比的最大化。"但绝大部分企业不具备这样的垂直整合能力。" 他总结，GPU持续保持优势的原因有三个：灵活度是"甜点"、多模态时代的全功能性、生态的护城河。谷歌新一代AI模型Gemini 3系列的发布，在硬件领域投下一颗"重磅炸弹"——其自研TPU（张量处理器）所展现的性能与成 ...

GPU（图形处理器）

GPU（图形处理器）

阿里妈妈发布MUSE：用多模态搞定十万级超长行为序列，并开源Taobao-MM数据集

机器之心· 2025-12-16 12:11

文章核心观点 - 阿里妈妈与武汉大学团队提出了一种名为MUSE的新型多模态搜索框架，旨在解决推荐系统对用户超长历史行为序列（如10万至百万级）建模能力不足的问题，通过利用图像和文本等多模态信息，系统性提升终身用户兴趣建模的质量与可用长度 [1][4][6] - MUSE框架已在阿里妈妈展示广告精排模型中全量上线，实现了对10万长度用户原始行为序列的建模能力，并在线上A/B实验中带来了显著的CTR提升（+12.6%）和业务收益（RPM +5.1%， ROI +11.4%） [6][36] - 该工作不仅提出了创新的算法与工程协同设计，还开源了首个包含“长行为序列+高质量多模态embedding”的大规模公开数据集Taobao-MM，以推动业界和学界在相关方向的研究 [1][6][41] 技术背景与问题 - 当前主流CTR建模，特别是以SIM/TWIN为代表的两阶段长期行为建模框架，虽将可用历史行为长度扩展至万级别，但收益边际提升已变得困难，尤其在检索精度受限时，序列从万级往上扩展效果提升会明显趋缓 [2] - 用户行为序列极长（在淘宝中轻松达到百万级），但受限于在线延迟、存储和算力，实际部署模型通常只能使用最近几千条行为，或进行粗粒度截断 [3] - 现有ID-based建模方法存在局限：长尾和过期item的ID embedding质量不佳，而它们在“终身历史”中占比很高；模型主要学习“ID共现关系”，而非用户真实的内容兴趣 [3][15] MUSE框架核心洞察与设计 - **核心设计原则**：GSU（通用搜索单元）应保持“简单”，而ESU（精确搜索单元）需要“丰富+融合” [12] - **对GSU的洞察**：在有高质量多模态embedding的前提下，GSU只需要一个轻量的余弦（cosine）相似度检索就足够好，复杂的检索结构收益低且不具性价比 [17] - **对ESU的洞察**：多模态序列建模与ID融合非常关键，ESU对多模态embedding的质量极其敏感，远高于GSU [18][19] - **表征预训练**：底层采用SCL多模态预训练，通过结合用户真实“搜索-购买”行为进行对比学习，使得到的embedding同时具备内容语义和行为相关性 [23] MUSE框架技术详解 - **多模态GSU**：使用SCL embedding进行简单的余弦相似度计算和Top-K检索，从用户10⁵~10⁶级历史行为中筛选出最相关的几十条，过程高效且无复杂Attention [24][26] - **多模态增强ESU**：采用SimTier与SA-TA双路并行建模 [25] - **SimTier路径**：将目标item与历史行为的多模态相似度序列压缩为一个“相似度直方图”，形成紧凑的语义兴趣分布向量，计算开销极小 [26][33] - **SA-TA路径**：在标准的ID-based Target Attention基础上，融合多模态余弦相似度及其与ID打分的交互项，形成最终的attention score，以缓解长尾item打分失真问题 [27][28][30] - **最终输出**：SimTier输出的多模态兴趣向量与SA-TA输出的ID兴趣向量拼接，作为“终身兴趣表示”输入给上层CTR模型 [30] 工程落地与性能 - **延迟控制关键**：将GSU从Ranking关键路径中剥离，进行异步预取，其延迟被Matching阶段遮蔽，从而在引入10万行为序列和多模态信息的同时不增加在线延迟 [32][35] - **具体两阶段设计**： 1. Pre-fetching阶段：与Matching并行，从远端存储拉取用户100K行为的多模态embedding并缓存至GPU显存 [36][42] 2. 相似度计算与Top-K选择阶段：在Ranking前快速计算相似度，得到Top-K行为ID和相似度序列供ESU使用，计算量小且可与特征处理并行 [36][42] - **效果验证**：线上A/B实验显示，相比仅使用5K长度行为的ID-only基线（SIM），MUSE（行为长度100K）带来CTR提升12.6%、RPM提升5.1%、ROI提升11.4% [36] - **离线消融实验**：序列越长，MUSE带来的收益越大；多模态增强ESU在所有长度上都显著优于ID-only ESU，且长度越长优势越明显 [36] 对业界的启发与可复制经验 - **GSU优化**：优先学习高质量的item图文embedding，并用多模态余弦检索替代GSU的ID-only检索，这是性价比最高的第一步，无需在GSU阶段设计复杂结构 [38] - **ESU增强**：将多模态信息引入ESU是关键，可逐步推进：引入轻量的“相似度直方图”模块（如SimTier）；在现有DIN/TWIN的attention中融入多模态相似度作为辅助打分（类似SA-TA） [38] - **工程架构**：解决超长序列和多模态引入的I/O瓶颈是重点，可借鉴MUSE模板：将GSU抽成独立服务与Matching异步并行；将embedding就近缓存；确保Ranking阶段计算轻量 [39] - **落地路线**：对于拥有长行为日志（>> 万条）、丰富内容特征且ID-only模型收益见顶的业务，可先提升表征质量，用多模态支撑GSU检索，再在ESU中融合多模态信号，作为“轻量版MUSE”的起点 [46] 开源数据集Taobao-MM - **数据集价值**：这是首个同时具备“长行为序列+高质量多模态embedding”的大规模公开数据集，旨在支持“长序列 × 多模态”方向的研究，减少业界和学界自建数据的成本 [41][44] - **主要特点**：用户行为序列最长1K（开源版，内部实验支持100K）；提供128维SCL多模态embedding；数据规模约1亿样本、近900万用户、3500万级item [43]

终身兴趣建模

Taobao-MM数据集

终身兴趣建模

Taobao-MM数据集

“2025商汤科技AI论坛”：多模态、具身智能与“AIinX”落地加速

环球网· 2025-12-15 16:16

这些技术推动大模型从"AIforX"（为某领域提供工具）向"AIinX"（深度嵌入业务流程）演进，为构建能与物理环境持续交互、自我演进的智能体奠定基础。【环球网科技报道记者张阳】2025年12月9日，由商汤科技与香港科技园公司联合主办的"2025商汤科技AI论坛"在香港科学园举行。以"模型智未来"为主题，论坛聚焦大模型演进、多模态融合、具身智能落地及AI驱动的产业范式转移，吸引全球AI研究者、企业决策者与生态伙伴共议技术拐点与商业路径。从感知到具身： AI 进入 " 物理世界交互 " 新阶段商汤科技CEO徐立在开场致辞中指出："我们正经历史上最大规模的技术浪潮——AI已从感知走向生成，从云端走向端侧，并加速迈向具身智能与世界模型。"作为一家根植香港、服务全球的AI原生企业，商汤将持续连接国家AI战略与全球创新网络。香港科技园CEO黄秉修则强调，商汤的成长印证了香港具备孕育世界级科技企业的土壤，"其从初创到全球领先的跃迁，正是我们支持硬科技创业的最佳案例。" 多模态大模型进入 " 价值闭环 " 攻坚期商汤联合创始人、首席科学家林达华教授认为：经过三年爆发式发展，行业站在新十字路口。" ...

商汤(HK:00020)

Artificial Intelligence

商汤方舟平台

Artificial Intelligence

商汤方舟平台

商汤科技日日新Seko系列模型与寒武纪完成适配

新浪财经· 2025-12-15 14:10

12月15日，商汤科技正式发布Seko2.0——行业首个多剧集生成智能体。其背后依托的是商汤自研的日日新Seko系列模型。商汤日日新Seko系列模型已完成对国产AI芯片寒武纪的适配，国产算力对AIGC核心场景的支持实现了从语言到多模态的关键跨越。适配完成后，商汤科技与寒武纪还将在多个方向共同进一步展开深度优化。 ...

日日新Seko系列模型

寒武纪AI芯片

日日新Seko系列模型

寒武纪AI芯片

“连姥姥都问我，你知道DeepSeek吗？”

第一财经· 2025-12-12 09:11

文章核心观点 - MiniMax创始人闫俊杰在访谈中反思了公司在面对DeepSeek等竞争对手时的挑战与应对核心在于承认自身认知不足与执行不坚决并强调了坚持技术驱动路线、重视人才激励以及对中国AI人才优势的信心他认为大模型行业参与者将越来越少但市场在扩大未来成功的关键在于想象力与坚持[3][6][8][12][13][14] 创始人反思与竞争认知 - DeepSeek的广泛认知给MiniMax带来巨大触动创始人闫俊杰反思团队在某些关键节点上降低了要求、思考不够深入、选择不够坚定而竞争对手DeepSeek则拥有独特的认知和长期技术积累[3][5][6] - 公司经历的大部分挑战最终都转化为如何提升自身能力的问题团队在受到打击时反而能变得更好是做得比较好的方面[6] 公司治理与人才激励 - 面对士气低迷公司恢复信心的方式包括：拆解问题并用第一性原理论证可行性以鼓舞士气以及通过发钱让员工的努力被看见和反馈发钱被认为是管用的[7] - 2025年9月 MiniMax启动了百万美元期权激励计划根据贡献程度向员工提供几十万美元到几百万美元不等的激励覆盖模型算法、产品、市场、增长、职能等多个岗位并计划对突出贡献者进行即时期权激励[7] 技术路线与产品战略 - DeepSeek的出现可能让MiniMax对技术路线更加坚定公司经历了约半年的迷茫纠结于技术驱动与复制移动互联网经典增长路线之间最终认定在AGI赛道上公司只能选择技术驱动的方式尽管风险更高[8] - MiniMax独特的打法是ToC和出海其角色陪伴类应用Talkie在海外获得了大量用户目前用户量最大的产品是Talkie 而收入方面最大的是视频和API[8] - 针对外界对公司布局大语言模型、语音、视频等多模态业务的“不聚焦”质疑创始人认为真正的AGI一定是多模态输入输出团队计划先将每个模态走通再在接下来几个月整合到下一代模型中并援引OpenAI的Sora2作为多模态融合的成功范例[9][10] 行业格局与中外对比 - 国内大模型与海外顶尖模型的技术差距在缩小但投入成本远低于海外例如谷歌、OpenAI、Anthropic和xAI的估值可能是中国公司的100倍技术或许只领先5% 但投入可能在50至100倍之间[12] - 中国AI人才是重要的优势推动DeepSeek取得成功以及MiniMax内部起到关键作用的人才基本都来自本土且往往是他们的第一份工作创始人认为如果中国年轻人中出现本土技术天才可能成为AI领域的突破点[12] - 根据MacroPolo的报告来自中国的顶尖AI研究人员占比从2019年的29%提升到了2022年的47%[12] 未来展望与行业判断 - 创始人认为明年做大模型的公司会更少行业已从“百模大战”演变为仅剩几家公司在一个越来越大的市场里参与者越来越少只要能持续迭代并证明价值资金就不是最重要的问题[13] - 目前大模型尚未进入存量竞争也不会出现一两家通吃的局面不同模型有不同特点例如OpenAI长于推理对话 Anthropic强于代码和Agent 谷歌在多模态方面领先而中国模型在效果上或许差5% 但成本可能是海外的1/10[13] - AI行业不是互联网的延续大模型时代真正的产品是模型本身未来各岗位边界将变得模糊最核心的竞争力是想象力谁拥有最好的想象力、最能坚持、对社会价值大谁就会成功[14]

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

美团AI转向，前字节视觉模型AI平台负责人潘欣加入｜36氪独家

36氪· 2025-12-11 21:37

美团AI战略与人才布局 - 前闪极AI合伙人、前字节视觉大模型AI平台负责人潘欣近期已加入美团，负责多模态AI创新工作，主导了LongCat App等多个相关应用的开发[4][5] - 2025年美团在AI人才招聘上积极性未减，招聘集中在模型训练方面，标准很高，人才主要来自阿里通义、Seed以及腾讯混元团队[7] - 当前美团金融线、客服线、电商线等业务正在大力招聘AI应用人才，集中在后训练和商业化落地[11] - 原“光年之外”团队（GN06）负责人刘炯已调任至美团，直接向美团平台负责人李树斌汇报，近期该团队招聘力度有所减少[11] 美团AI战略框架 - 公司创始人王兴将美团AI战略定位为“积极进攻而非消极防御”，并首次披露了AI大模型LongCat的相关进展[5] - 公司AI战略建立在三个层面：AI at work（将AI用于员工工作和运营）、AI in products（用AI改造既有2B和2C产品服务并打造AI原生产品）、Building LLM（积极投入资本支出完善自研基座模型能力）[6] - 2025年第二季度起，在外卖大战压力下，公司将有限的资源优先放在了基座模型的训练上[7] 美团AI基座模型与开源进展 - 2025年至今，公司密集发布了一系列基座模型和应用，基本完成了从语言模型到视觉、音频、视频的全模态基座建设[8] - 具体发布包括：6月发布首款AI编程产品Nocode；9月发布并开源大语言模型LongCat-Flash-Chat及推理模型LongCat-Flash-Thinking；10月发布并开源视频生成模型LongCat-Video；11月发布开源全模态模型LongCat-Flash-Omni；12月发布并开源三款图像模型LongCat‑Image、LongCat‑Image‑Dev、LongCat‑Image‑Edit[10] 美团AI业务应用聚焦 - 基座能力建设是为公司主营业务AI化铺路，2025年下半年起，公司在AI应用侧明显提速，并更加聚焦于主线业务的AI化改造[8] - 例如，10月公司向餐饮商家推出了“袋鼠参谋”、“智能掌柜”等AI工具，并向行业所有商家免费开放[9] - 此前公司的AI应用创新以独立的AI To C应用为主（如Wow、妙刷），如今这些To C探索已有所收缩[11]

LongCat-Flash-Chat

LongCat-Flash-Chat

自驾世界模型剩下的论文窗口期没多久了......

自动驾驶之心· 2025-12-11 08:05

行业趋势与研究方向 - 近期自动驾驶世界模型相关论文爆发式增长，涌现出MindDrive、Think Before You Drive、U4D、SparseWorld-TC、AD-R1、Percept-WAM等多项工作 [1] - 根据顶会接收规律，选题多为局部突破与可验证改进，并紧贴当年主旋律，例如2024年为多模态，2025年为视频生成 [1] - 参照2026年各大顶会中稿论文，预测今年年底至明年上半年的主旋律极有可能是世界模型，当前布局该方向具有前瞻性优势 [1] 公司业务与服务定位 - 公司提供自动驾驶、具身智能、机器人等方向的论文辅导服务，旨在帮助学生冲击高区或顶会论文发表 [2] - 服务内容包括掌握技术脉络、复现模型、产出1篇论文初稿及投稿指导 [2] - 公司旗下拥有自动驾驶之心、具身智能之心、3D视觉之心等多个技术自媒体平台，是国内最大的AI类技术自媒体平台之一 [3] - 公司深耕自动驾驶、具身智能、机器人等交叉学科领域多年，拥有国内顶尖的学术资源 [3] 服务团队与过往业绩 - 公司拥有超过300名专职于自动驾驶/具身智能方向的导师，导师来自全球QS排名前100的院校，并发表过多篇顶会、子刊及A/B会论文 [5] - 近3年累计辅导学员超过400名，中稿率高达96% [5] - 过往成功案例显示，学员覆盖博一至在职等不同阶段，辅导周期在2至4个月，成果发表于NEUROCOMPUTING（2区）、CVPR（顶会）、emnlp（顶会）等多种期刊与会议 [6] 服务内容与价值主张 - 服务旨在解决学生科研中的常见痛点，如导师指导不足、知识体系零散、对投稿流程不熟悉等 [4][7] - 具体帮助包括建立科研思维、系统掌握经典与前沿算法、结合模型理论与代码实践、将baseline深化拓展形成个人论文 [7] - 提供个性化论文指导、导师实时互动、录播无限回看、免费课后答疑及24小时无时差上课等服务 [13] - 提供从选题、调研、idea验证、代码、实验、润色、投稿到中稿的一站式科研服务，目标覆盖CCF-A/B/C、SCI1-4区及EI会议 [13] 目标客户与附加价值 - 主要服务方向包括三维重建、relighting、NVS、SLAM、点云处理、VLA、机器人导航、计算机视觉等 [10] - 目标学员需自带简历并具备一定的PyTorch基础 [10] - 服务满足多种需求，包括积累科研经验、提升职称、提高学术成就；提升人工智能领域从业者竞争力以助升职加薪；以及为考研、申博、留学提升简历含金量 [14] - 优秀学员有机会获得清北、MIT等名校推荐信，或被推荐至相关实验室实习；表现突出者可获内推至阿里达摩院、华为诺亚方舟等企业研发岗位 [19] 服务模式与保障 - 服务采用班主任全程督学模式，跟进学习进度 [17] - 提供精准导师匹配系统，根据学员研究方向、目标期刊和基础水平，从300多名导师中筛选3至5位最契合人选供学员选择 [18] - 为零基础学员提供基础课程，通过系统学习，据称6个月可完成一篇小论文 [17] - 提供预收定金后与名师meeting的机会，并承诺若不满意可免费更换老师或退款 [19]

自动驾驶世界模型

自动驾驶之心论文辅导

自动驾驶世界模型

自动驾驶之心论文辅导

AI应用下一个突破口在哪

北京商报· 2025-12-10 23:44

文章核心观点 - AI产业正从“工具时代”迈向“伙伴时代”，发展重点从上半场的想象力转向下半场的执行力 [1] - 量子位智库发布的《2025年度AI十大趋势报告》基于基础设施、模型进化、应用版图等四部分进行总结，其中应用相关趋势占四席，涉及流量入口、多模态、AI硬件和AGI [1] 基础设施与算力经济 - 算力经济是智能产业第一大引擎，全球对AI算力的需求以前所未有的速度增长，直接推动超大规模数据中心建设，这些数据中心演变为由单个AI公司主导的集成了海量计算、存储和网络资源的算力工厂 [3] - 云计算厂商的投资重点从传统通用计算资源向满足AI需求的专用算力基础设施倾斜，与AI企业的合作模式从简单资源租赁演变为深度绑定的战略合作关系 [3] - AI原生需求正在重塑芯片创新：GPU主导地位受挑战，NPU在端侧普及，ASIC/FPGA迎来增长 [3] - 中国正加速构建自主可控的算力生态，国产“芯片+SDK+框架”方案已在千亿级模型训练中得到验证，DeepSeek等模型针对昇腾芯片深度优化，标志着全栈国产化能力迈入新阶段 [3] 模型进化与创新 - 预训练决定大模型格局梯队，架构创新决定预训练水平，在算力约束下，混合专家模型（“大参数、小激活”）成为主流选择，中国头部模型团队普遍采用这一思路 [4] - 2025年大模型落地进入“推理时间”，模型在多模态深度推理、自适应推理、边缘推理加速等方面持续突破，任务复杂度推动推理框架持续进化 [4] - 物理AI与具身智能迎来研发热潮，世界模型与VLA（视觉—语言—动作）框架成为技术焦点，具身智能正从小规模商业订单走向更广泛的应用探索 [4] - 智源研究院发布的多模态模型Emu3.5是世界模型的基座，人工智能正从语言学习进入多模态、世界学习的新阶段 [5] - 自变量机器人自主研发的“Great Wall”模型系列已实现从感知到高精度操作的端到端控制，在复杂任务中展现出强大的泛化能力 [6] 应用版图扩大 - AI正在重塑流量入口，Agent从“人找服务”转向“服务找人”，成为下一代交互范式，AI智能体具备感知、规划、决策、执行的闭环能力，正逐步取代传统App，操作系统亦向超级Agent演进 [7] - 新一代AI系统能够同时处理和理解文本、图像、声音、视频等多种信息类型，实现跨模态的关联理解和生成，为创意内容生成、智能交互等应用开辟新可能 [7] - AI应用的关键价值在于释放高价值劳动力，将人类精力转移到具有实质性价值的核心任务和战略性工作上，报告预测未来2—3年内，随着技术能力成熟，AI会成为相关产业的标准工具 [7] - AI硬件赛道受关注，轻量化模型和边缘计算技术成熟，推动AI能力向手机、汽车、IoT设备等终端普及，端侧AI解决了数据隐私、网络延迟和成本效率三大核心问题 [7] 具身智能的商业化进展 - 优必选与国内AI大模型公司签订人形机器人销售合同，总金额超过5000万元，除了提供机器人硬件，还将开放数据接口与技术能力，支持合作方将其自有AI大模型与机器人本体进行集成与二次开发 [4] - 优必选工业人形机器人Walker S2已启动量产与交付，首批数百台已投入汽车制造、智能制造、智慧物流、具身智能数据中心等产业一线应用，目前Walker S2产能每月已超过300台，预期全年交付量将超过500台 [5]

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence