世界模型
搜索文档
当视频不再被观看,而是被「进入」:谷歌世界模型与教育想象的边界
36氪· 2026-02-06 07:09
核心观点 - 以Google DeepMind的Project Genie为代表的世界模型技术,标志着生成式AI正从生成内容转向生成可交互、可探索的“世界”或“空间”,这正在重新定义视频等媒介的本质,并可能对游戏、教育等多个行业产生深远影响 [1][2][4] 行业前瞻:视频媒介的范式转变 - 行业观点认为,到2026年,视频将不再只是被动观看的内容,而会演变成一种可被进入、操控和持续演化的“空间媒介” [2] - 这一转变的本质在于视频首次具备了环境属性,能够承载规则、因果与反馈,成为一个“活的环境”,可用于机器人训练、游戏演化、原型设计及智能体学习 [2] - 随着技术开放和创作者采用,全新的叙事形式可能出现,例如“生成式Minecraft”,由玩家共同构建不断演进的宇宙,用户将成为动态共享现实的共同作者 [3] - 生成式AI正在逼近由游戏引擎与仿真系统长期垄断的“世界构建”领域 [3] 技术突破:世界模型的核心特征 - 与传统视频生成模型专注于“画面连续”的时间序列预测不同,以Genie为代表的世界模型旨在生成一个能维持状态、规则与因果关系的“环境” [4] - Genie的突破点不在于画质,而在于三点:场景具备基本的时间连续性;用户行为会改变后续状态,形成简单因果链;世界的生成逻辑更接近“状态更新”而非“逐帧预测” [4] - Project Genie证明了自然语言正成为一种定义世界状态与规则的接口,而不仅仅是内容生成指令 [12] - 当前技术仍存在局限,包括世界规则脆弱、复杂交互易崩塌、长时间一致性难以维持以及物理、逻辑与语义间存在缝隙 [12] 潜在应用:教育领域的变革可能 - 世界模型在教育领域的核心价值在于可能大幅降低高质量、沉浸式学习情境的构建成本,使体验式学习得以规模化 [13] - 理想状态下,该技术可使历史学习变为进入可观察的社会结构,使科学学习变为推演规则系统,使职业技能训练在高度仿真环境中完成 [14] - 这种技术将学习从被动“理解”转变为主动“参与”,让学生在规则、反馈与修正中构建认知 [14] - 然而,技术应用面临明确挑战:学习效果评估困难、沉浸式环境可能增加学生认知负担、教师角色面临边缘化风险、以及如何将教学目标有效嵌入世界规则 [14] - 世界模型对教育行业的短期影响有限,它更像是对“教育如何被呈现与参与”的底层假设的一次松动,将讨论起点从“规模化交付内容”转向“构建可参与的学习环境” [15][16] 当前发展阶段与产业影响 - Project Genie仍处于较为早期的实验性原型阶段,是Genie系列研究的阶段性成果 [1] - 行业分析指出,该技术目前对于游戏引擎、游戏开发商的商业模式及竞争格局尚无法形成实质性影响 [15] - 该技术路径为游戏广告等行业带来了潜在利好 [15] - 世界模型目前是一条正在展开的技术路径,而非即刻可兑现的产业变量 [15]
36Kr-2026年具身智能产业发展研究报告:软硬件迭代加速,人形机器人蓄力规模突破
36氪研究院· 2026-02-05 19:09
报告行业投资评级 - 报告未明确给出统一的行业投资评级,但指出中国具身智能产业处于全球第一梯队,并已进入快速发展与产业化攻坚的关键阶段 [6][27][29] 报告核心观点 - 未来,具身智能将实现从技术闭环向生态协同的跨越,转化为可规模部署的通用劳动力,其场景落地将沿技术成熟度与环境复杂度逐级展开,形成多层市场空间 [5] - 中国市场将开启生态层面的综合较量,竞争转向技术底座、盈利能力与供应链体系等 [5] - 人形机器人作为主要载体,正迈入规模化放量和商业落地的关键阶段,2026年是规模化放量的关键年 [2][6][58] - 产业发展的核心突破口在于机器人大脑的演进,尤其是“世界模型”(空间大模型)的技术突破,以实现更高维度的环境理解与自主决策 [6][65][67] 中国具身智能产业发展概况 - **定义与范畴**:具身智能强调智能体通过物理实体与环境交互来实现自主学习和进化,核心在于“感知-理解-行动”的深度融合 [15][16] - **产业载体**:主要载体为机器人,按形态分为人形机器人和非人形机器人,两者在场景、技术成熟度、订单规模上存在差异 [16] - **政策驱动**:已形成国家顶层设计引领、部委专项支持、地方创新实践落地的多层次政策体系,2025年被首次写入《政府工作报告》并纳入“十五五”规划建议 [17][18] - **技术驱动**:发展依托大模型、多模态融合与仿真训练等技术的系统性突破 [21] - 大模型提供通用认知与任务规划能力,使机器人能理解自然语言并自主规划 [21] - 多模态融合与局部运动控制技术提升环境中的稳定性和鲁棒性 [21] - 仿真与硬件协同推动系统迭代,关键硬件持续突破 [21] - **需求驱动**:主要受劳动力结构性短缺、公共服务缺口及对高效率连续作业的需求驱动 [22][24] - 例如,预计到2030年全球护士缺口达1300万人,推动养老陪护机器人落地 [24] - 激光除草机器人可减少约80%除草剂使用量 [24] - **发展现状**:中国处于全球第一梯队,产业链成熟度较高,成本和场景密度优势明显 [6][27] - 企业数量超过230家,其中人形机器人企业超过150家 [27] - 供应链优势明显,中国拥有25家手部零部件供应商(美国7家),30家腿部线性执行器供应商(美国6家),整机成本可控制至海外同类产品的50%左右 [27] - **市场规模**:市场规模从2018年的2133亿元增长至2025年的9150亿元,并有望于2026年突破万亿元关口 [27] - **资本动态**:成为最受关注的战略性赛道之一,融资规模爆发式增长 [28][29] - 2025年融资事件超305起,总额超过380亿元,参与投资机构超600家,融资额是2024年同期的4倍 [29] - 资本构成以产业资本为核心,科技互联网巨头及传统企业CVC积极布局 [29] 中国具身智能产业生态分析 - **产业链结构**:上游为软硬件开发(技术基石),中游为产品制造(传导中枢),下游为应用领域(价值变现) [36] - **上游发展新动向**: - AI大模型与多模态感知是驱动上游发展的关键力量,推动向“感知-认知-决策-执行”完整闭环演进 [38] - 技术路径呈现从专用小模型向“通用大模型+垂直场景微调”方向演进的趋势 [38] - 运动控制系统存在硬件标准化缺失与软硬件协同不足的瓶颈 [39][41] - **中游发展新动向(人形机器人)**: - **技术构成与成本**:本体分为大脑(AI大模型)、小脑(运动控制)、肢体(执行器)三部分 [42][44][45][46] - 一台功能完备的人形机器人成本中,执行器和传感器合计占比60%以上,执行器系统约占45% [46][47] - **国产化程度**:核心部件国产化分化明显,结构件、电池、控制器国产化率较高;但力传感器、丝杠等高端部件国产化率低,依赖进口 [48][50] - 例如,行星滚柱丝杠国内加工良率仅60%(海外超85%),六维力传感器精度为±2%(海外±0.5%) [48] - **灵巧手**:向高自由度和高感知能力发展,是提升通用作业能力的关键 [51][54] - **中游发展新动向(规模化与商业化)**: - **规模化放量**:2026年人形机器人产业迈入规模化放量关键阶段 [58] - 2025年国内出货量达1.8万台,同比增超650%,2026年有望提升至6.25万台,乐观估计达10万-20万台级 [58] - 成本持续下行,例如优必选Walker系列2025年成本较2024年下降25%,宇树科技UnitreeR1起售价仅2.99万元 [58] - **商业化落地**:节奏加快,工业领域成为商业化扩张关键一步 [6][64] - 已出现千台级别订单,如银河通用与百达精工合作部署超1000台,数字华夏意向订单超1500台 [64] - 预计2030年中国人形机器人市场规模将达到254.04亿元,比2025年增长十倍以上 [63][64] - **下游发展新动向(应用场景)**: - **工业领域**:应用最成熟,向柔性制造、自主决策和生态协同方向发展,汽车制造是最大应用领域(2024年占比43.3%) [36][72][73] - **服务领域**:实现场景全覆盖,具有场景细分精准化、交互体验拟人化、产品形态轻量化三大特点 [74][76] - **特种领域**:在灾害救援、能源巡检等极端环境适配能力提升,任务闭环化作业成主流 [77] - **交通出行领域**:向协同化、立体化演进,聚焦自动驾驶、智能补能及低空出行 [77] 典型案例分析 - **银河通用**:具身多模态大模型通用机器人创新企业,确立“合成数据驱动+多模态大模型”技术路径,累计融资超8亿美元 [80][81] - 核心竞争力在于构建了从百亿数据集、具身大模型到机器人本体的全栈自研体系 [81] - 商业化在工业制造、即时零售仓储、智慧城市服务、医疗康养等多场景深度落地,已获数千台订单 [83][85] - **元鼎智能 (Aiper)**:专注庭院智能场景,是无线智能泳池机器人品类开创者,累计出货量近300万台 [86][87] - 形成“泳池机器人+水质治理+庭院灌溉”产品矩阵,并将“认知级AI”引入清洁领域 [87][89] - 在亚马逊无线泳池机器人品类市占率领先,部分型号超50%,并获全球龙头Fluidra战略投资 [89] - **数字华夏**:聚焦多模态交互智能,以“让AI惠及每一个人”为使命 [90][92] - 构建“2+3+N”产品与服务体系,核心为“巨号”交互平台与RAAS场景平台 [92] - 核心竞争力在于全栈自研的仿生交互技术(如微表情识别)和“平台+生态”商业化策略,产品已进入金融、能源等头部客户 [93][96][97] - **擎朗智能**:具身服务机器人领域领跑者,成立于2010年,累计出货量突破10万台,覆盖全球60余国 [98][100] - 构建“通用+专用”多形态机器人矩阵,并发布垂域模型KEENON ProS,走通“通用人形+专用服务”协作模式 [99][100]
世界模型,是自动驾驶的终极答案吗?
36氪· 2026-02-05 12:30
行业核心趋势:世界模型成为智能驾驶新焦点 - 世界模型是继端到端、VLA后,智驾领域最时髦的技术名词,多家公司推出相关概念,如小鹏的“世界基座模型”、蔚来的“端到端世界模型”、华为的“世界行为模型”,地平线、理想、元戎启行、Momenta也在进行相关研发 [2] - 在广义语境中,世界模型本质是在虚拟世界再造真实世界,使AI能理解现实世界的物理规律、因果关系和环境动态,被科学家和科技公司视为实现“物理世界AI”的关键拼图 [3] - 当前智驾行业谈论的“世界模型”在技术路径上差异不大,主要是对传统仿真工具进行范式升级,旨在还原度、颗粒度、场景丰富度和自由度更高的虚拟世界中,解决端到端模型的测试与验证问题,以训练出更拟人化的智驾模型 [4] 技术驱动因素:端到端普及暴露传统仿真短板 - 过去两三年,头部智驾方案从规则栈转向AI驱动的端到端模型,感知、预测、规划被整合进一张网络,配合更大模型和更高算力,旨在使驾驶行为更拟人 [7] - 端到端模型的“黑盒”特性导致新版本OTA可能表现不稳定甚至“退步”,核心问题在于AI驱动使得模型评估和回归验证变得困难,研发人员难以定位错误原因 [8][9] - 端到端的普及凸显了传统仿真器的短板,传统仿真器在规则时代主要用于问题重现和增加特定场景数据,但无法支撑端到端模型所需的大规模、系统性闭环验证 [10] 核心应用定位:世界模型作为云端仿真与验证系统 - 截至目前,智驾行业的世界模型仅应用于云端,尚未部署到车端,其主要作用是充当仿真器,用于测试和验证端到端模型 [6] - 头部玩家如理想和小鹏均将世界模型作为仿真器应用,理想为使其VLA在仿真环境中进行强化学习,提出了包含自车和他车轨迹的驾驶世界模型;小鹏也在采用世界模型进行仿真测试以评测新算法 [10] - 世界模型在工程上被定位为端到端时代的“验证与反证系统”,用于在云端重放、改写、扩增现实驾驶场景,检验车端大模型输出的稳定性和可复现性,并形成可追踪的错误证据链 [14] - 世界模型的核心能力包括对物理世界的数字化建模与抽象,以及基于此对物理世界进行合理的想象和预测,例如通过给定图片预测未来变化 [14] 技术路径与挑战:生成质量、幻觉与算法瓶颈 - 世界模型的好坏取决于其能否在云端生成足够真实和多样性的数据,仅回放真实数据并非真正的世界模型,训练数据的质量会显著影响生成结果的质量 [15] - 世界模型底层是生成式模型,天生存在“幻觉”风险,目前最难的是保证生成内容符合真实世界的物理规律和行为逻辑,否则将导致车端模型学到错误知识,性能变差 [16] - 行业普遍处于早期阶段,国内厂商基于世界模型最长能生成30-60秒视频片段,但动态物体在时空一致性和多视角一致性上存在较大问题 [16] - 前理想汽车辅助驾驶负责人指出,世界模型的瓶颈首先在于算法层面未有突破,图像模型的自监督训练尚未找到像语言模型那样顺畅的范式,图像信息密度低,对驾驶决策有用的信息占比极低,模型需从海量噪声中提取极少有效信号 [17][18] - 由于基础技术尚未明确突破,车企对世界模型的投入更多是研究性质,目前世界模型主要停留在用于训练与验证的第一阶段,而非能支撑决策规划的第二阶段 [18] 效率价值与未来展望 - 基于世界模型,车企在云端仿真时可以无限制地生成所需场景,根据指令生成视频作为训练数据,效率远高于真实数据采集与训练,能带来模型迭代速度的断代式领先 [16] - 特斯拉采用了“世界模拟器”的概念,其基于海量数据集训练,根据当前状态与动作生成未来状态,并与车端端到端模型形成闭环评估,其方法更倾向于用神经网络“拟合”世界,渲染通过计算生成,以增强模型泛化能力 [11][14] - 业内观点认为,如果世界模型足够成熟且算力可支撑,未来有望部署到车端,实现通过预测世界变化并进行有利决策,从而解决自动驾驶和机器人相关问题,但目前尚无公司在车端应用世界模型 [18][19]
中金:2026年大模型将取得更多突破 向实现AGI长期目标更进一步
智通财经· 2026-02-05 09:39
2025年大模型技术进展与2026年展望 - 2025年全球大模型在推理、编程、Agentic以及多模态等能力方向取得明显进步,但模型通用能力在稳定性、幻觉率等方面仍存在短板 [1] - 展望2026年,大模型在强化学习、模型记忆、上下文工程等方面将取得更多突破,并向实现AGI长期目标更进一步 [1] 2026年模型架构与训练范式演进 - 预计2026年预训练Scaling-Law将重现,旗舰模型参数量将更上一个台阶 [1] - 模型架构方面,基于Transformer的架构延续,平衡性能与效率的MoE成为共识,不同注意力机制路线仍在优化与切换 [1] - 训练范式方面,预训练阶段将通过Scaling-Law、高质量数据和强化学习共同提高模型能力 [1] - 随着英伟达GB系列芯片成熟及推广,模型将基于更高性能的万卡集群在预训练阶段重现Scaling-Law,模型参数量和智能上限都将进一步提升 [1] 强化学习的重要性提升 - 强化学习的引入提高了模型的智能上限,让模型可以更有逻辑、更符合人类偏好进行思考和推理 [2] - 强化学习的本质是“自我生成数据+多轮迭代”,关键在于大规模算力与高质量数据 [2] - 海外OpenAI、Gemini等模型厂商以及国内DeepSeek、阿里千问等均重视强化学习 [2] - 预计2026年海内外模型厂商强化学习占比将进一步提升 [2] 持续学习、模型记忆与世界模型的新突破 - 持续学习和模型记忆旨在解决大模型的“灾难性遗忘”问题,让模型具备选择性记忆机制 [3] - Google提出的Titans、MIRAS、Nested Learning等算法和架构核心是让模型可以根据任务的时间跨度和重要性动态调整学习和记忆方式,实现持续学习甚至终身学习 [3] - 聚焦理解物理世界因果规律的世界模型在Genie 3和Marble等不同模型路径的探索下具备突破机遇 [3]
中金 | AI十年展望(二十六):2026关键趋势之模型技术篇
中金点睛· 2026-02-05 07:52
文章核心观点 - 2025年全球大模型在推理、编程、Agentic及多模态等能力上取得明显进步,已能应用于真实生产力场景,但模型在稳定性、幻觉率等方面仍有短板 [1][3] - 展望2026年,预计预训练Scaling-Law将重现,旗舰模型参数量将更上一个台阶,强化学习、模型记忆、上下文工程等领域将取得更多突破,推动模型向AGI目标迈进 [1][2][4] - 中美大模型发展路径不同:海外厂商追求智能上限,国内厂商在有限算力下通过开源和工程优化追求效率与性能平衡,但两者相互借鉴,共同推动AI产业发展 [12][14] 技术视角:模型能力进展与短板 - **2025年能力进展**:海内外模型在推理、编程、Agentic及多模态能力上持续迭代,在文本、搜索、编程、图像&视频多模态任务等多个领域已达到真实生产力水平,进步超过2023年预期 [3] - **现存短板**:模型通用能力在可靠性、幻觉率方面未完全解决,记忆能力有提升空间;细分领域上,强逻辑&数学推理能力稳定性不足,对真实世界的理解和建模能力较弱,智能呈现“锯齿状” [4] - **2026年展望**:模型将在长板层面继续进化,并寻找有效路径补齐短板,从ChatBot到Agent,从短context生成到长思维链任务,从文本交互到原生多模态演进 [4] 模型细分能力复盘 - **推理**:强化学习激励模型形成更长思维链解决复杂任务,“测试时计算”成为主流工程杠杆,模型学会并行思考与反思;模型推理与工具调用结合形成“交错思维链”,以完成更复杂的Agent任务,但产业也开始优化思维链效率以控制成本与延迟 [6] - **编程**:在模型推理能力提升驱动下,AI编程从代码补全进化为具备工程闭环能力的开发者代理,能拆需求、搭框架、调接口、跑测试;前端追求极致视觉还原与即时预览,后端模型已具备架构思维,通过“慢思考”推演降低幻觉率,预计2026年编程仍是落地最快场景之一 [6] - **Agentic**:2025年工具调用能力成为标配,核心技术突破之一是交错思维链的使用,让智能体在思考与行动间无缝高频切换,提升实时修正能力并降低幻觉与记忆遗忘,能自主拆解数十个子任务并实现复杂长程任务闭环 [9] - **多模态**:图片生成在质量、理解与控制能力上大幅跃升,迈入可控、可用、可规模化生产阶段;以Gemini-3为代表的原生多模态架构普及,统一token化训练,并将强化学习引入视觉和音频领域以加强时空逻辑和动作因果理解 [9][10] 海内外头部模型竞争格局 - **海外头部玩家**:OpenAI、Anthropic、Gemini以AGI为远期目标,从不同维度加速探索;OpenAI文本类推理实力突出,同步提升多维度能力维持领跑;Gemini后来居上,基于预训练高质量数据与Scaling Law及后训练强化学习,基础与多模态能力大幅提升;Anthropic聚焦代码及Agent领域,走出别具一格变现路径 [11] - **国产大模型**:整体能力与海外头部模型维持约半年静态差距,在海外模型推出3个月到半年后,国内头部厂商能推出能力相当的模型并达到SOTA水准;第一梯队包括阿里Qwen-3、字节豆包1.8、DeepSeek-V-3.2、Kimi-K2、智谱GLM-4.7、MiniMax-M2 [12] - **发展路径差异**:海外厂商算力资源丰富,通过算力Scaling Law+算法优化+高质量数据齐头并进迭代基座模型,追求智能上限;国内厂商在有限资源下,通过开源路线、工程及算法优化追求效率与性能平衡,并在应用端开拓更具创新思维 [14] 模型架构:优化与创新 - **架构延续与优化**:主流模型参数规模已达万亿以上,厂商更聚焦模型架构、算法、工程共同优化,在扩大参数规模的同时提升参数利用效率 [14] - **MoE架构成为共识**:MoE架构采用稀疏激活模式,通常仅激活模型总参数的10-20%,显著降低计算量,实现计算需求与模型规模的有效解耦;国产模型如DeepSeek-V3.2、MiniMax-M2、Qwen-2.5均使用MoE架构 [17] - **MoE优化挑战**:面临计算效率、专家负载不均、参数通信等问题,需通过更复杂算法和硬件基础设施解决,例如通过辅助损失函数实现负载均衡,并通过芯片与算法协同设计提升效率 [18] - **注意力机制优化**:模型厂商基于效果在不同注意力机制(Full-Attention、Linear-Attention、Hybrid-Attention)间优化与切换,以平衡精度与效率,例如阿里千问深耕Linear-Attention,DeepSeek-V3.2引入Sparse-Attention将计算复杂度从O(N^2)降至O(Nk) [20] 工程优化:降本提速与规模化 - **核心目标**:工程侧优化聚焦降本提速与规模化生产,包括推理侧思考链工程化、实时路由机制分配模型类型、长上下文规模化落地等 [21] - **具体实践**:GPT-5引入实时路由模式,根据用户提示词自动分发请求;海内外厂商通过混合注意力机制、KV Cache压缩、算子优化、上下文重写与压缩等不同路径提升上下文处理效率 [21][22] 训练范式演进 - **预训练Scaling-Law重现**:预计2026年预训练阶段在算法和工程优化下仍有提升空间,随着英伟达GB系列芯片成熟及推广,模型将基于更高性能的万卡集群实现Scaling Law,模型参数量和智能上限将进一步提升 [1][22] - **强化学习重要性提升**:强化学习成为解锁模型高级能力的关键,其本质是“自我生成数据+多轮迭代”,依赖大规模算力与高质量数据;预计2026年强化学习在训练阶段占比将进一步提升 [2][23] - **强化学习占比数据**:DeepSeek V3.2后训练计算预算占预训练成本的10%+,估计海外模型厂商相关比重更高,可能在30%左右 [23] - **强化学习路径演进**:正从静态离线向动态在线演进,长期趋势是模型持续向半自动验证甚至不可验证的场景中进行在线学习 [26] 前沿技术路线展望 - **持续学习与模型记忆**:旨在解决大模型“灾难性遗忘”问题,让模型具备选择性记忆机制;Google提出的MIRAS、Titans、Nested Learning、HOPE等算法和架构是让模型根据任务时间跨度和重要性动态调整学习和记忆方式的关键 [2][28] - **嵌套学习(Nested Learning)**:模仿人脑处理记忆的方式,通过分层学习和优化机制实现持续学习新范式 [29] - **HOPE架构**:作为嵌套学习的工程实现,是基于自修改Titans+连续记忆系统的多层次记忆系统,通过“快”“慢”系统协作对抗灾难性遗忘 [32] - **模型记忆成为Agent刚需**:ChatGPT通过四层上下文堆栈工程化优化记忆,未来技术演进路径包括分层记忆、将长期记忆更新至模型参数 [35] - **世界模型**:聚焦理解物理世界因果规律,是实现AGI的重要拼图;主要技术路径包括李飞飞团队的3D物理空间(Marble模型)、LeCun的基于控制理论的JEPA架构、Google DeepMind的交互式视频引擎(Genie 3) [36][40] 海外头部模型厂商巡礼 - **OpenAI**:2025年模型在推理、Agentic、多模态、代码方面全方位提升,发布GPT-4.1、o4-mini、GPT-5、Sora-2等;预计2026年将加速商业兑现,拓展企业端和广告市场 [41][42] - **Gemini**:2025年能力大幅跃升,Gemini-3发布使Google成为世界第一梯队;原生多模态图像生成模型Nano banana Pro具备空间推理和光影控制能力;预计2026年将聚焦综合能力提升并加速探索世界模型 [43][45][47] - **Anthropic**:2025年延续在编程领域优势,加强代码和Agent体验;推出Claude Code(截至25年底ARR已突破10亿美元)和Cowork,探索企业场景;预计2026年将提升记忆能力并探索更多Agent泛化场景 [48][49][52] - **商业化与IPO前景**:截至26年1月,OpenAI估值达8,300亿美元,25年收入预计200亿美元,计划26年Q4启动IPO;Anthropic估值达3,500亿美元,25年收入90亿美元,也将在26年启动IPO [61] 国内头部模型厂商巡礼 - **阿里通义千问**:2025年推出Qwen-3等模型提升全模态能力,领跑中国市场;预计2026年将探索B端Agent市场机遇,让Qwen Agent作为“Orchestrator”编排垂类Agent,并可能探索世界模型技术 [53] - **字节豆包**:2025年提升基座模型能力,豆包1.8具备超长上下文与多模态、Agent能力;截至25年12月底,豆包大模型日均使用量达50万亿+(自发布以来提升417倍),日活用户突破1亿;预计2026年将延续多模态优势并深挖Agent机会 [54][55] - **DeepSeek**:2025年引领大模型走向开源普惠,发布R1、DeepSeek-Janus-Pro、DeepSeek-V3.2等;架构上采取稀疏注意力机制降低计算复杂度;预计2026年将持续追求技术优化与提升多模态能力 [56][57]
昆仑万维(300418):A股稀缺大模型及出海应用龙头,从纯投入期到兑现期
浙商证券· 2026-02-04 16:40
报告投资评级 - 首次覆盖给予“买入”评级,目标价74.3元,对应目标市值932亿元 [7][9][67] 报告核心观点 - 公司已完成“算力—模型—AI应用”的AI全产业链布局,正从纯投入期转向兑现期 [1] - 短剧业务商业化强度超预期,已成为核心现金流引擎,AI智能体业务有望开启第二增长曲线 [1][2] - 市场估值应反映公司从“流量”到“智能”的质变,可采用分部加总法进行重估,而非传统互联网平台估值 [5] 短剧出海业务 - **行业空间巨大且高速增长**:海外微短剧月活用户约1亿,相较于全球短视频18亿用户体量,渗透率仍低,行业处于放量扩张期。2025年海外微短剧总体规模达40亿美元,其中内购收入22.79亿美元,同比增长129%,下载量18.55亿次,同比激增超300%,预计2026年规模将突破50亿美元 [19] - **竞争格局与公司地位**:行业呈现双巨头领跑格局,2025年上半年ReelShort与DramaBox共占近45.68%收入。公司旗下DramaWave平台快速崛起,2025年8月已跃居海外短剧收入榜第三位,12月收入环比增长35.4%,位列收入榜第四;12月下载量环比上涨超90%,成为Top 15中涨幅最高的产品 [2][26][29][32] - **商业化表现与预测**:预计2025年公司短剧收入同比增长900%至16.8亿元人民币,2025年年化流水突破2.4亿美元,成为核心现金流引擎,并预计2026-27年持续加速增长 [1][2][18] - **产品与运营策略**:DramaWave采用“付费+免费”混合变现模式,通过分层付费和广告激励覆盖全层级用户。其官方TikTok账号粉丝量达170万,位居行业第二,广告受众在TikTok上的曝光率较普通用户高200%。投放策略上,欧美市场聚焦获客,而新兴市场如印尼以13%的收入占比成为最大单一收入来源市场 [33][34][38] - **AI赋能内容**:平台引入AI生成视频作为广告素材,结合高清画质卖点提升投放效率,12月中旬单日活跃广告素材约3000条 [39] AI应用生态布局 - **全链路产品矩阵**:公司以天工超级智能体为核心,搭建了联动AI Developer、AI视频、AI音乐、AI游戏与AI社交产品的全链路AI应用矩阵,覆盖C端与B端需求。2025年上半年AI软件技术收入已达6500万元,验证商业化雏形 [2][43] - **技术实力领先**:天工超级智能体在GAIA评测中以82.42分位列全球榜首。公司2026年1月发布的Mureka V8音乐大模型盲测评分已超越Suno V5,达到可直接发布的工业化水准 [43][48] - **商业化进展与潜力**:AI音乐业务Mureka采用“免费+广告分成”模式,2025年11月首次实现毛利为正,年化流水约1200万美元,已服务超8000家企业客户。AI应用业务(Skywork、AI音乐、AI社交)在2025年12月合计产生约600万美元的月度经常性收入,预计2026年底提升至1000万美元 [48][52][64] - **生态协同与入口**:通过Opera浏览器构建AI生态入口,截至2025年上半年,Opera全球月活跃用户达2.89亿,年化ARPU升至1.97美元(同比+35%)。2025年上半年Opera实现营收2.86亿美元(同比+35%),为AI产品提供战略级分发渠道 [57][59] 世界模型技术 - **技术卡位领先**:公司于2025年8月开源Matrix-3D模型,并发布升级版本Matrix-Game 2.0,是业内首个在通用场景下实现实时长序列交互生成的开源方案,技术可复用于游戏、影视、具身智能等领域 [2][62] - **战略意义**:世界模型被视为通往具身智能与AGI的重要技术里程碑,其“单张图片生成可交互3D场景”的能力可将3D建模周期从数周压缩至数分钟,有望大幅降低游戏和短剧等内容的生产成本,为未来增长打开非线性期权 [61][62] 其他业务与控股公司 - **游戏业务**:预计利润为3.5亿元,作为估值组成部分之一 [65] - **投资业务**:截至2025年三季度,公司投资性资产合计115.4亿元,包括交易性金融资产25.7亿元、长期股权投资12.7亿元及其他非流动金融资产77.0亿元 [65] - **控股芯片公司**:公司于2023年控股(持股58%)AI芯片公司艾捷科芯,为业务提供弹性 [3] 财务预测与估值 - **盈利预测**:预计2025-2027年营业收入分别为82亿元、117亿元、148亿元,归母净利润分别为-16.1亿元、-0.94亿元、4.38亿元 [7][67] - **估值方法**:采用分部加总估值法,将公司业务分为五部分: - 短剧平台:预计年化收入42亿元,参考奈飞给予8倍PS,估值336亿元。 - Opera:参考彭博一致预期其2026年经调整利润9925万美元,给予20倍PE,按公司持股69%计算,估值90亿元。 - AI应用:预计年化收入6.72亿元,对标同业给予50倍PS,估值336亿元。 - 游戏业务:预计利润3.5亿元,给予20倍PE,估值70亿元。 - 投资业务:对账面资产115.4亿元给予10%流动性折价,估值约100亿元。 - **估值结论**:各部分加总得到目标市值932亿元,对应目标价74.3元 [63][65][66][67]
SpaceX股东独家发声!合并突然且迅速,源于马斯克的巨大野心
第一财经资讯· 2026-02-04 10:24
交易概览与战略意图 - SpaceX正式收购人工智能初创公司xAI,将公司两大核心未上市板块合并,旨在构建一个估值可能突破1.25万亿美元的超级商业实体 [2] - 此次合并是SpaceX计划于今年IPO前最激进的一次资本与战略重组,旨在同时吸纳看好太空科技和人工智能的资本,为公司定义更广阔、多样化的前景 [2] - 合并决定突然且迅速,目前已得到董事会批准,合并后上市进程突然加速 [4] 交易背景与股东结构 - SpaceX与xAI的股东存在相当程度的重合,许多同时持有两家公司股份的投资人成为此次合并的重要支持者 [5] - 合并前SpaceX私募市场估值约8000亿美元,xAI在2026年1月融资时估值已达2300亿美元,二者合并后直接突破1.25万亿美元 [7] - 若叠加IPO溢价,新公司估值有望冲击1.5万亿美元,直接空降全球科技巨头市值前列 [7] 战略协同与商业叙事 - 合并逻辑是打造从地面智能到太空智能、从算力到数据的全链条故事,构建物理与数字基础设施的终极整合 [2][6] - SpaceX的叙事内核从“太空运输”转变为“太空AI”帝国,旨在打造地球上及地球外最具雄心、垂直整合的创新引擎 [8] - 公司将覆盖AI、火箭、天基互联网、直连通信等领域,目标是规模化打造一个有感知的人工太阳,探索宇宙奥秘 [8] 业务互补性与数据价值 - SpaceX本身盈利强劲,现金流充沛,星链业务堪称“现金奶牛”,而xAI的大模型竞赛仍需持续投入巨资 [9] - 合并后,SpaceX可为xAI“输血”,同时xAI能为SpaceX赋予更强的AI叙事,但现阶段仍是SpaceX对xAI的托举更多 [9] - SpaceX是AI原生公司,从火箭回收到星链运行都引入了大量自动化与AI算法,它不仅是商业航天公司,更是数据的拥有者 [9] - SpaceX提供火箭发射、在轨运行、太空环境模拟等极其稀缺的“世界数据”,这些真实、动态、多维的数据可能成为训练下一代AI模型的宝贵“燃料” [10] 成本优势与未来愿景 - SpaceX的单次发射成本已经降至1亿美元以下,未来甚至可能降至几千万美金 [10] - 随着发射成本降低,卫星将成为太空边缘计算的节点,不仅能以低成本获取高质量卫星数据反哺地球AI应用,更为太空工厂、无重力制药等前沿产业提供了物理基础 [10] - 公司预计在未来2-3年内,太空将成为生成式AI计算成本最低的场所 [8] - AI的深度嵌入将加速整个行业的智能化进程,从火箭发射路径优化到卫星网络自主管理,有望实现突破性降本增效 [11] 市场竞争与资本考量 - 合并时机耐人寻味,当前xAI的竞争对手如OpenAI、Anthropic等AI巨头同样在冲刺上市 [6] - 将xAI与SpaceX捆绑上市,能让xAI在上市时间线上抢得先机,并对其他冲击上市的AI对手形成打击 [6] - 马斯克或许希望抢在竞争对手OpenAI之前IPO,这不仅是商业节奏的考量,也透着与OpenAI创始人之间微妙的竞争关系 [2][4]
SpaceX股东独家发声!合并突然且迅速,源于马斯克的巨大野心
第一财经· 2026-02-04 10:16
文章核心观点 - 埃隆·马斯克旗下SpaceX正式收购人工智能初创公司xAI,这是一次旨在整合物理与数字基础设施、构建估值可能突破1.25万亿美元超级商业实体的战略重组,意图同时吸纳太空科技与人工智能领域的资本,并为计划中的IPO创造更广阔的前景 [3][8] 合并的背景与过程 - 合并决定非常突然且迅速,此前并未向SpaceX股东透露,目前已获董事会批准 [3][6] - 合并前,SpaceX与xAI的股东存在相当程度的重合,许多投资人同时持有两家公司股份,这成为合并的重要支持基础 [7] - 此次合并与上市进程突然加速,时间相当紧凑,改变了此前关于是否让星链业务剥离或让SpaceX做更长时间上市准备的讨论 [7] 合并的战略意图与资本考量 - 马斯克希望通过合并,同时吸纳看好太空科技和看好人工智能的资本,给公司定下更广阔、多样化的前景 [3] - 合并可能意在抢在竞争对手OpenAI之前进行IPO,这不仅是商业节奏的考量,也体现了马斯克与OpenAI创始人之间的微妙竞争关系 [3][6] - 将xAI与SpaceX捆绑上市,能让xAI在上市时间线上抢得先机,并对其他冲击上市的AI对手形成打击 [8] - 若SpaceX单独上市,吸引的是太空科技资本;合并后则能一并吸纳人工智能赛道的资本,形成一场史无前例的资本“虹吸” [8] - 合并前SpaceX私募市场估值约8000亿美元,xAI在2026年1月融资时估值达2300亿美元,二者合并后直接突破1.25万亿美元,叠加IPO溢价后估值有望冲击1.5万亿美元 [9] 合并后的业务协同与叙事转变 - 合并后,SpaceX的叙事内核从“太空运输”转变为打造“地球上及地球外最具雄心、垂直整合的创新引擎”,覆盖AI、火箭、天基互联网、直连通信等 [11] - SpaceX可为仍需巨资投入研发的xAI“输血”,而xAI能为SpaceX赋予更强的AI叙事,但现阶段SpaceX对xAI的托举更多 [12][13] - SpaceX天生是一家AI原生公司,其火箭回收控制、星链卫星运行等大量依赖自动化与AI算法,它不仅是商业航天公司,更是数据的拥有者 [13] - SpaceX的单次发射成本已降至1亿美元以下,未来可能降至几千万美元,低成本发射能力为将计算设备部署到太空、实现太空算力布局提供了重要一环 [11][13] - xAI的核心方向“世界模型”需要理解物理世界规律,而SpaceX提供的火箭发射、在轨运行、太空环境等真实动态数据,可能成为训练下一代AI模型的宝贵“燃料” [13] - AI的深度嵌入有望加速火箭发射路径优化、卫星网络自主管理、太空工厂自动化等环节,实现突破性降本增效,但目前这类协同仍处于早期构想阶段 [14] 公司基本面与市场地位 - SpaceX本身盈利强劲,现金流充沛,尤其是星链业务堪称“现金奶牛”,公司早已实现盈利 [6][12] - SpaceX正在成为太空领域的“AWS”(亚马逊云服务),随着发射成本降低,卫星可能成为太空边缘计算节点,为前沿产业提供物理基础 [13] - 马斯克的操作风格是打破边界、重组叙事,此次合并类似于当年特斯拉收购SolarCity,旨在打造从能源生产、存储到消费的完整闭环 [8]
SpaceX股东独家回应:合并突然且迅速,源于马斯克的巨大野心
第一财经· 2026-02-04 09:55
交易概览与战略意图 - SpaceX宣布收购人工智能初创公司xAI,交易已获董事会批准,过程突然且迅速 [1][4] - 此次合并将公司商业版图中两大核心未上市板块整合,旨在构建一个估值可能突破1.25万亿美元的超级商业实体 [1] - 此次合并是SpaceX计划于今年进行首次公开募股前,最激进的一次资本与战略重组 [1] 交易背景与驱动因素 - 合并时机耐人寻味,当前xAI的竞争对手如OpenAI、Anthropic等AI巨头同样在冲刺上市,市场竞争已演变为资本与叙事之战 [7] - 公司创始人埃隆·马斯克或许希望抢在竞争对手OpenAI之前进行IPO,这不仅是商业节奏的考量,也涉及微妙的竞争关系 [1][5] - 合并前,SpaceX私募市场估值约8000亿美元,xAI在2026年1月融资时估值已达2300亿美元,二者合并后直接突破1.25万亿美元 [7] - 若叠加IPO溢价,新公司估值有望冲击1.5万亿美元,直接空降全球科技巨头市值前列 [7] 协同效应与战略叙事 - 合并后公司的叙事内核发生转变,旨在打造地球上及地球外最具雄心、垂直整合的创新引擎,覆盖AI、火箭、天基互联网、直连通信等 [9] - 公司预计在未来2-3年内,太空将成为生成式AI计算成本最低的场所,有必要将部分计算设备部署到太空 [9] - SpaceX可为xAI“输血”,同时xAI能为SpaceX赋予更强的AI叙事,但现阶段SpaceX对xAI的托举会更多一些 [10][11] - SpaceX提供极其稀缺的“世界数据”,如火箭发射、在轨运行等真实动态数据,可能成为训练下一代AI模型的宝贵“燃料” [11] - AI的深度嵌入将加速整个行业的智能化进程,有望在火箭发射路径优化、卫星网络自主管理等关键环节实现突破性降本增效 [12] 公司基本面与运营状况 - SpaceX本身盈利强劲,现金流充沛,尤其是星链业务堪称“现金奶牛” [10] - SpaceX的单次发射成本已经降至1亿美元以下,未来甚至可能降至几千万美金 [11] - 公司正在成为太空领域的AWS,卫星将成为太空边缘计算的节点,为太空工厂、无重力制药等前沿产业提供物理基础 [11] - 大模型竞赛仍是一场极度烧钱的游戏,xAI仍需持续投入巨资进行研发和基础设施建设 [10] 资本结构与股东情况 - SpaceX与xAI的股东存在相当程度的重合,许多同时持有两家公司股份的投资人成为此次合并的重要支持者 [6] - 公司创始人希望通过合并及未来的IPO,同时吸纳看好太空科技和看好人工智能的资本,给公司定一个更加广阔、多样化的前景 [1] - 若SpaceX单独上市,吸引的是投资太空科技的资本,而合并后能把瞄准人工智能赛道的资本也一并吸纳进来,形成一场史无前例的资本“虹吸” [7]
2026开局Update:锦秋与创业者的“全速前进”
锦秋集· 2026-02-03 18:44
锦秋基金及其被投企业动态 - 锦秋基金是一家活跃的早期科技投资机构,在2025年获得多项荣誉,包括网易新闻“2025年度人工智能活跃投资机构TOP 10”、投中网“投中2025年度中国最佳早期投资人TOP 50”等 [11] - 公司投资组合覆盖AI应用、AI硬件、具身智能/机器人等多个前沿领域,并在这些领域获得行业奖项认可 [11] - 公司旗下被投企业在2026年国际消费电子展上集体亮相,展示在机器人、人机交互及智能硬件领域的突破 [17] 视频播客栏目「锦供参考」核心观点 - 第二期探讨AI如何降低动画创作门槛,OiiOii公司构建了一套由AI编剧、分镜、音效组成的智能协作Agent系统,旨在让180万个“动画超级个体”成为可能 [1] - 第一期探讨2026年中美AI创业生态,邀请硅谷投资人及中国创业者,从硅谷VC尽调真相、非母语创业者融资攻略、OpenAI忽视的市场缝隙等角度,拆解中国创业者的定位与机会 [2] 行业交流活动「锦秋小饭桌」讨论要点 - 在CES展会期间举办近40人规模的交流活动,参与者来自AI硬件、AI Agent领域创业者及Meta、苹果、微软、字节等大厂从业者,围绕CES见闻与行业趋势交流 [3] - 以“预言2026”为主题的活动讨论了AI行业共识,包括供给侧变化、内容生产、产品护城河、定价方式、交互入口以及信任的稀缺性等话题 [5] - 活动聚焦AI应用落地的卡点与前景,汇集了AI手机、影像、浏览器、合成数据、硬件、社交等多个方向的从业者,复盘各赛道的生长阵痛与破局关键 [7] - 与Top1 AI漫剧公司的交流聚焦多模态内容,讨论指出AI漫剧正进入由投放规模驱动的大盘阶段,内容生产走向工业化,技术瓶颈在情绪表达与文戏质量,变现方式从分账与投流延展至品牌植入,并探讨低成本出海可能 [8][9] 被投企业融资与业务进展 - 人形机器人核心零部件企业**因克斯**完成近2亿元人民币新一轮融资,由华控基金、深创投集团共同领投,锦秋资本作为老股东持续追加投资,这是该公司年内完成的第三轮融资 [12] - 存算一体技术公司**铭芯启睿**完成超亿元Pre-A轮融资,由国开科创、联想创投领投,该公司此前于2025年3月完成近亿元天使轮融资,由锦秋基金领投 [12] - 世界模型与具身智能公司**Manifold AI流形空间**完成超亿元天使+轮融资,由君联资本领投,老股东锦秋基金持续加注,半年内累计已获得数亿元融资 [13] - 多智能体系统公司**atoms.dev**连续完成A轮与A+轮融资,共计3100万美元,A+轮由凯辉基金领投,锦秋基金等机构跟投 [13] - 具身智能公司**首形科技**宣布完成新一轮融资,由中网投与蚂蚁集团联合领投,这是该公司今年完成的第四轮融资 [13] 被投企业产品、技术与市场表现 - **宇树科技**2025年人形机器人出货量超5500台,根据市场推算位居行业出货量第一,其海外销售占总销量比例约为50% [14][17] - 宇树科技官宣成为“中央广播电视总台2026年春晚机器人合作伙伴”,这是其第三度与春晚结缘 [14] - **星尘智能**提出端到端全身VLA模型Lumo-1,旨在将大模型“心智”转化为机器人的丝滑操作,并与清华、港大、MIT联合提出基于对比学习的隐空间动作预训练框架,使机器人能从视频中直接学习技能 [15] - **生数科技**推出全球首个支持16秒音视频直出的多模态模型Vidu Q3,具备多镜头自由切换、多语言对话与文字渲染能力,专为漫剧、短剧、影视剧创作设计 [15] - **乐享科技**揭晓具身智能品牌Zeroth元点智能,携多款家庭机器人新品进军海外市场,聚焦提升机器人在复杂家庭环境中的移动性能、负载极限及持续交互能力 [16] - **Isoform**公司核心产品Yansu定位于“行动系统”,主张“意图即源代码”,通过AI驱动实现从“任务补全”向“产出驱动”的跨越,致力于解决复杂成熟系统中的开发与集成难题 [16][17] 被投企业在CES 2026的展示 - **宇树科技**携人形机器人H2、R1、G1及四足机器人A2、Go2等超过15台全系列产品亮相,已是第七年参展,并计划推出软件开发工具和训练平台给客户 [17] - **Zeroth元点智能**在CES期间完成全线产品的全球亮相,涵盖1.65米人形机器人Jupiter、家庭机器人M1、履带式机器人W1等多款产品 [19] - **清闲智能**在CES首秀旗舰新品“清闲动态人机工学椅生息绿限定款”,主打动态支撑技术,将于2026年1月16日开启海外预售 [19] - **庞伯特**的智能网球训练设备Pace S Pro在CES获得多项奖项,包括CES Picks奖项等,获得国际科技媒体认可 [21] - **因克斯**在CES展示20自由度等比例灵巧手EC-DexHand-5F及超小行星模组EC-A2806等机器人核心零部件新产品 [23]