Workflow
世界模型
icon
搜索文档
对话原力灵机周而进:模型2.4B就够用,关键是“具身原生”;能闭环才是最高效方法
量子位· 2026-02-13 13:42
公司及产品发布 - 具身智能创企原力灵机推出了其首个具身原生大模型产品DM0,参数量仅为24亿(2.4B)[5] - 同时发布的还有开源具身原生框架Dexbotic 2.0,以及解锁具身应用量产的工作流DFOL,共同构成“具身软件三件套”[8] - 在RoboChallenge大规模真机评测中,DM0取得了单任务和多任务双料第一,综合得分72.25,成功率为62.00%[31][32] 技术路线与核心特点 - 公司追求“具身原生”路线,强调从数据采集、推理到控制都应源自物理世界反馈,而非数字世界的派生模态[21] - DM0模型从底层将感知、推理、控制整合为闭环,并通过空间推理思维链内生出具身智能[23] - 模型训练从零开始,融合了互联网、智能驾驶和具身多传感数据,旨在让模型从初始阶段就理解物理世界[27][28][40][42] - 模型采用多源、多任务、多机型训练,目前使用了8种不同本体的机器人数据,以学习通用操作逻辑而非特定机器参数[25][55][56] - 模型能够实时处理三视角的728x728画面,推理延迟仅60毫秒,并可通过强化学习在真机上试错进化[4] 数据策略 - 训练数据主要来自三个来源:互联网数据、智能辅助驾驶数据和具身智能数据,三者角色不同,混合比例根据实验动态调整[62][66][68] - 数据采集遵循“全身全时全域”原则:“全身”指包含底盘移动、躯干协调及所有传感器反馈;“全时”强调记录从意图产生到动作执行及修正的连续因果链;“全域”是未来在空间场景覆盖上的规划[82][83][85][88] - 数据采集策略是“熵在哪里,数据就投向哪里”,针对模型表现不佳的高不确定性任务进行针对性数据补充,实现以需定采的反馈闭环[72][75][76] - 在物理规则确定的低熵场景,通过算力生成仿真数据;在物理或语义模糊的高熵场景,则依赖真机采集真实交互数据[78][79][80] 模型能力与效果 - DM0的核心设计引入了空间推理思维链,这是一种三维物理世界的推演能力,能将视觉特征转化为精确的空间坐标和轨迹,以应对如“收拾桌面”等模糊指令[104][105][106][107] - 结合高分辨率输入,空间推理思维链能让模型处理毫米级精度的任务,识别并执行微小的位置差异[112][113] - 模型设计中借鉴了世界模型的范式,将其视为一种模型内的世界理解方式,用于在不执行动作的前提下推理动作后果,以支持决策和规划[158][159][162] 应用场景与商业化 - 公司选择物流场景作为首要落地切入点,因其场景明确、具备高度可复制性,且能带来规模化数据回流[125][147][150] - 在物流场景中,公司专注于物料分拣等任务,其复杂性体现在需要处理柔性/刚性混杂、随意摆放的物体,并实现精细操作[127] - 公司认为精细动作是真正的挑战,其前提是精细感知,因此模型设计非常看重高分辨率输入下的稳定性[131][135][136] - 公司的商业化路线图是:从物流场景开始,先做专项能力产品进入仓储环境,然后逐步推向ToB靠近ToC的场景(如门店导购),最终在技术、成本、安全性成熟后走向家庭场景[154][155][156] 团队背景 - 公司核心团队由前旷视成员组成,包括合伙人周而进(负责大模型)、范浩强、汪天才,以及担任CEO的前旷视联合创始人唐文斌[16][17][177] - 周而进是信息学竞赛金牌选手,拥有深厚的AI背景,早在2013年就以实习生身份在ICCV比赛中获得冠军[12][14] 行业观点与公司理念 - 公司认为当前行业主流方案是“VLM+Action Head”思路,即大模型负责识别推理,动作头负责执行[18][19] - 公司强调机器人必须尽早实现7×24小时真实环境运行,只有这样才能暴露工程问题、获得真实数据回流,形成数据飞轮[115][116][117][121] - 公司对具身智能的终极展望是机器人能够拥有广泛的社会身份,例如具备独立的支付和结算能力,成为社会化的接口[168][170][172]
视觉强≠能干活!清北普林斯顿等开源WorldArena,世界模型评测被颠覆
机器之心· 2026-02-13 13:08
文章核心观点 - 由全球顶尖学术机构联合推出的WorldArena评测体系,标志着具身智能领域评测范式的根本性转变,其核心观点在于揭示当前世界模型存在“视觉质量”与“任务执行功能”之间的巨大鸿沟,视觉生成的高质量并不等同于对物理世界的理解和可靠应用[1][4][45] - 文章通过系统性实验数据指出,许多世界模型生成的视频在视觉上已近乎完美,但在支撑真实的机器人具身任务时表现糟糕,视觉质量与任务执行能力的相关性仅为0.36,表明行业技术发展正从追求“视觉真实”转向追求“功能可靠”[4][32][42] WorldArena评测体系的核心创新 - **评测范式重构**:该体系并非对现有视觉评测的修补,而是一次根本性重构,旨在将评测焦点从“看起来真实”转向“用起来可靠”[5] - **六维视觉评测**:创新性地将视频质量评估拆解为六个维度,包括视觉质量、动作质量、内容一致性、物理遵循性、3D准确性和可控性,尤其将物理遵循性与3D空间理解提升到与画质同等重要的地位[5][14] - **三大具身任务评估**:在全球范围内首次将世界模型置于真实的具身任务流水线中进行压力测试,从**数据生成引擎**、**策略评估器**和**行动规划器**三个关键角色评估其功能性能力[5][27][34] - **EWMScore综合评分**:推出统一的EWMScore综合评分体系,将多维客观指标映射为一个可横向对比的分数,并且该分数与人类主观评估高度正相关,成为一个能反映真实人类感知的标尺[5][6][30] 当前世界模型的能力现状与挑战 - **视觉与功能的巨大差距**:系统性评估揭示,尽管许多模型能生成高度逼真的视频,但在复杂物理环境中的一致性、稳定性以及长时序多步交互任务中存在本质短板,尚不具备支撑真实具身应用的能力[32][33][40] - **作为数据生成引擎表现有限**:实验显示,用世界模型生成的合成轨迹训练下游策略模型,其性能提升整体显著落后于使用真实数据训练的模型,多数模型难以为下游学习提供稳定可靠的增益[35][36] - **作为策略评估器表现分化**:在策略评估任务中,以动作条件建模为核心的模型(如CtrlWorld)与真实物理仿真环境的相关性高达0.986,而其他模型(如Cosmos-Predict 2.5)相关性则较低,表明动作建模是准确刻画环境动态的关键[37] - **作为行动规划器能力不足**:在动作规划任务中,世界模型在支持闭环控制,尤其是长时序复杂任务时的性能,显著落后于成熟的策略模型(如Pi 0.5),表明其尚不足以支撑稳定可靠的自主控制行为[39][40] 评测结果的关键数据洞察 - **视觉与任务相关性低**:WorldArena数据显示,视觉质量与任务执行能力的总体相关性仅为0.36[4] - **EWMScore与任务相关性分析**:EWMScore与数据引擎任务的相关性为0.600,与动作规划任务的相关性仅为0.360,进一步证实“视觉真实不等于功能真实”[42] - **具体模型性能对比**:在数据引擎任务中,表现最好的WoW模型在Task 1和Task 2上分别达到45%和71%的性能,但仍远低于使用真实数据训练的基线模型(77%和66%)[36] - **人类评估与模型指标对齐**:人工评估证实,商业化大型视频模型(如Veo 3.1, Wan 2.6)在整体质量、指令遵循和物理符合性上表现优异,而EWMScore与人类主观评估高度正相关,验证了其有效性[41] 对行业发展的意义与方向 - **指引技术进化方向**:WorldArena的发布标志着具身智能评测正从“审美导向”走向“功能导向”,从论文对比实验走向真实场景的能力验证,这将引导世界模型研发不再比拼谁更“像电影”,而是谁更“懂物理、能干活、靠得住”[45] - **明确技术发展阶段**:文章结论指出,世界模型的“iPhone时刻”尚未到来,视觉生成能力已逼近天花板,但功能智能才刚刚破土,行业离真正可用的具身世界模型还有关键路程要走[7][8][41] - **建立开放社区标准**:WorldArena作为一个完全开源、可复现、持续迭代的社区平台,旨在为具身智能建立一套类似“驾照考试系统”的评测标准,其开放共建模式将评测权交给全球社区[9][10][12]
CVPR 2026 Workshop征稿|从感知到推理,ViSCALE 2.0 邀你重塑计算机视觉的 System 2
机器之心· 2026-02-13 12:19
当大语言模型通过 Test-time Scaling(推理时计算扩展)在逻辑推理上不仅 "读万卷书",更能 "行万里路" 时,计算机视觉的 "System 2" 时刻也已悄然 降临。 从单纯的像素感知,到构建符合物理规律的世界模型(World Models);从平面的模式识别,到复杂的空间推理(Spatial Reasoning)—— 视觉智能正站 在新范式的路口。 2026 年 6 月,CVPR 第二届计算机视觉推理扩展研讨会(ViSCALE 2026) 将在美国重磅回归!继首届研讨会成功开启 TTS 在视觉领域的无限可能后, 本届 ViSCALE 由来自 清华、普林斯顿、UC Santa Cruz、NUS 等全球顶尖机构的学者联合举办,将汇聚全球顶尖学者,共同探索如何让视觉模型通过计 算扩展突破现有模型的能力瓶颈。 研讨会亮点:重新定义 "看" 与 "想" 如果说上一代视觉模型是 "直觉反应",ViSCALE 关注的则是深度推理。我们不再满足于静态的输出,而是探索模型如何在测试时动态分配计算资源,实现 从 "看懂画面" 到 "模拟世界" 的跃迁。 核心议题包括但不限于: 世界模型与视频生成: 如何利用 T ...
不卷通用大模型,网易AI的“错位”生存法则
搜狐财经· 2026-02-13 04:08
核心观点 - 网易在AI时代并未掉队,而是选择了一条避开底层通用大模型和算力竞争、聚焦于垂直领域AI应用与工业化落地的“实用主义”路线 [2][3][20] 行业竞争格局与网易的战略定位 - 2025年马年春节,阿里、腾讯、字节、百度四家公司在“红包大战”中投入超过45亿元,但网易并未参与 [2] - 行业存在“大模型=AI”的狭隘视角,但商业价值分配呈现三级分化:训练大模型的“造电机”公司、提供算力底座的“建电厂”公司、以及打磨AI应用的“造灯泡”公司 [3] - 网易的战略定位属于第三种,即聚焦于AI应用层,而非通用大模型底座或底层算力基础设施 [3][8] 研发投入与AI应用策略 - 网易过去五年研发费用占比长期维持在15%以上,2025年研发费用高达177亿元 [4] - 公司研发预算重点投向应用层,而非通用底座模型训练 [4] - 公司策略是不盲目追求通用大模型,而是致力于打造“最懂游戏的AI专家”,实现AI与业务的深度整合 [8] - 公司拥有超过1400亿元的现金储备,为其战略选择提供了财务支撑 [8] 游戏业务:AI工业化与效率革命 - 游戏产业存在成本、质量、效率的“不可能三角”,3A游戏开发周期常需3-5年,成本达数亿美元 [4] - 网易在游戏AI原生研发方面搭建了数千条AI新质生产管线,覆盖开发全流程 [6] - 在美术创作环节,AI覆盖90%生产场景,设计效率提升70%,动画产能综合提效30%,部分场景效率提升高达300% [6] - 在技术研发环节,AI代码生成工具提升开发效率50%,且AI逻辑质量可达专家级水平 [6] - AI对游戏产业的重塑分为三个阶段:辅助生产、改变交互、生成原生游戏,网易已处于第二阶段向第三阶段的过渡期 [8] 游戏业务:AI驱动的产品创新与用户生成内容 - 《逆水寒》手游推出“AI门客系统”,赋予NPC独立性格与决策机制,将游戏从“通关体验”变为“社交体验” [9] - 《燕云十六声》部署上万个智能NPC,利用自然语言处理等技术丰富游戏体验与内容供给 [9] - 《蛋仔派对》上线“AI模型生成”功能,降低创作门槛,已聚集5000万创作者,单张爆款地图月收入超过百亿元 [11] - 《逆水寒》手游“剧组模式”允许玩家一键生成视频内容,上线一个月诞生上百万个玩家作品 [11] 游戏业务:财务表现与未来展望 - 网易2025年全年总营收达1126亿元,营业利润为358亿元 [13] - 游戏及相关增值服务收入为921亿元,其中在线游戏净收入达896亿元,同比增长11% [13] - 开源证券预测,AI原生游戏在2027年的收入规模有望超过300亿元,为游戏市场带来10%的增量 [13] - AI原生游戏将颠覆开发流程、交互方式与商业模式,满足玩家个性化体验需求 [13] - 公司认为,在AI时代,对顶层玩法的判断力、用户需求洞察及游戏审美品位等“软实力”是关键的护城河 [13] 教育与音乐业务的AI应用 - 网易有道聚焦翻译和辅导,将有道词典、答疑笔等产品AI化,提升学习体验与运营效率,采取“做减法,做闭环”的打法 [6] - 网易云音乐上线AI音乐创作工具“网易天音”,提供创作辅助功能,一场“百万奖金AI音乐创作大赛”沉淀了5万首AI音乐作品 [6] - 网易有道推出桌面级Agent“LobsterAI”(有道龙虾),定位为全场景个人助理 [18] AI能力外溢与实体业务探索 - 网易通过伏羲实验室孵化的网易灵动,尝试将游戏中的3D建模、数字孪生、AI Agent等能力向物理世界迁移 [14] - 网易灵动在2025年推出全球首款面向全域场景的具身智能无人装载机“灵载”,与中铁二十局、水电五局等企业合作,在多个基建场景实现规模化应用,作业效率提升30%,运营成本下降20% [16] - 网易智企以Agent为核心构建多场景化Agent矩阵,已服务数千家知名企业,赋能数十万员工 [16] - 世界模型(如谷歌的Project Genie)的发展为游戏AI能力向物理世界迁移提供了新的可能性 [19] 商业模式与长期愿景 - 网易的创新业务具有强烈的实用主义色彩,先找到清晰的商业化场景,再深入发展,这一模式在移动互联网时代催生了网易云音乐、严选、有道等产品 [18] - 公司AI时代策略是避开底层算力竞争,聚焦中上层应用,再通过能力外溢寻找商业增量 [20] - 该策略为行业提供了另一种路径:在自身擅长领域先将AI“固化”为能力,再将能力外溢,在不确定的环境中确保生存与发展 [21]
星海图合伙人、CFO罗天奇:具身智能尚处于技术竞赛早期阶段
每日经济新闻· 2026-02-12 18:47
文章核心观点 - 具身智能行业正处于由规模定律驱动的早期技术竞赛阶段 行业竞争的本质是资金使用效率 即每一元钱能换回多少智能 而非短期的融资额或硬件成本 [1][2] - 行业正经历结构性转折 资本逻辑从“广撒网”转向“押头部” 企业需储备资金以应对未来算力与数据成本激增 胜负关键在于智能水平和由智能定义的反向硬件能力 [2][5] - 中国具身智能公司在全球竞争中拥有显著的数据供应链优势 其高质量数据采集成本可能仅为美国公司的十分之一 这构成了长期竞争的重要基础 [6] 行业现状与竞争格局 - 行业持续受资本与产业关注 但稳定落地、规模复制及成本控制仍是现实挑战 [1] - 行业处于“百团大战”式的早期阶段 类比互联网发展初期 部分友商正在疯狂烧钱 [2] - 行业正经历重要的结构性转折 从早期技术探索迈向资源密集型竞争阶段 [2] - 头部具身智能企业在算力和数据投入规模上 约为头部大语言模型创业公司的十分之一 但这一差距可能迅速缩小 [2] - 随着规模定律进一步发挥作用 行业将出现明显的格局收敛 [2] 公司融资与战略 - 星海图于2月11日完成10亿元人民币B轮融资 累计融资额近30亿元人民币 估值达百亿元 成为行业新晋“独角兽” [1] - 公司在融资节奏和支出上相对审慎 强调需保留足够资金以应对未来成本激增 [2] - 公司认为行业竞争的本质是资金使用效率 在中国具身智能公司里 谁花钱效率最高 谁就最值得获得资本投资 [2] 技术发展与商业化路径 - 具身智能的“ChatGPT时刻”不一定在一两年内很快到来 但这不妨碍商业化的率先开启 [3] - 从技术驱动角度看 当前能跑通的商业化场景需满足三个硬性边界:厘米级精度、接近人类80%的作业速度以及99%准确率 [4] - 符合上述边界的场景包括料箱搬运、物流分拣及末端配送的“最后一公里”操作 这些场景在当前产业中具有较大数量基础 [4] - 具身智能对容错率更友好 不需要达到99.99%的成功率即可落地 会“润物细无声”地进入千行百业 [4] - 应避免将资源过早投入由商务驱动的商业化 技术基础未稳时大规模市场扩张容易导致头重脚轻 [4] 商业模式与财务视角 - 面向企业端的生意在营收规模上极具潜力 向一个大客户销售数十至上百台机器人可实现数亿元人民币营收 [5] - 相比营收绝对数量 更应关注营收质量 如开机使用比例和毛利率等指标 [5] - 行业中长期的商业模式是卖“物理世界的Token” 当供应链成熟到年产10万台以上规模时 硬件成本将不再有实质性差别 [5] - 真正的长期壁垒在于两点:一是智能水平 二是由智能水平反向定义的硬件设计和生产制造能力 [5] - 硬件成本最终不会是行业比拼的关键 [5] 全球竞争与技术架构 - 中国具身智能公司拥有比硬件供应链更夸张的数据供应链优势 中国最高质量的数据采集成本可能只有美国公司的十分之一 这意味着花相同的钱可采集到10倍数量的数据 [6] - 在技术架构上 世界模型短期内更适合拥有算力与多模态积累优势的大厂推进 创业公司无需重复“造轮子” [6] - 具身智能公司真正独特、必须从零开始研发的部分是具身基础模型 即负责物理世界执行能力的视觉语言动作模型 [7] - 视觉语言模型与视觉语言动作模型是互补关系 前者负责理解与推理 后者负责行动与执行 公司需要将资源集中在物理世界智能的构建上 [7]
老黄苏妈投了同一家世界模型公司
36氪· 2026-02-12 17:52
公司融资与估值 - AI视频公司Runway完成E轮融资,融资金额为3.15亿美元(约合人民币21.7亿元),资金将用于预训练下一代世界模型并将其落地到产品中 [2] - 本轮融资由General Atlantic领投,英伟达和AMD也参与投资 [2] - 本轮融资后,Runway投后估值相比之前几乎翻了一倍,达到53亿美元(约合人民币365.8亿元) [4] - 公司目前只有140名员工,却支撑起53亿美元的估值 [1] 公司发展历程与转型 - Runway成立于2018年,由三位纽约大学艺术学院交互设计专业的毕业生创立 [4] - 公司创立之初获得200万美元种子轮融资,主要做视频剪辑工具,并在2020年底推出爆款“绿幕”功能 [6] - 2021年完成B轮融资3500万美元,并将资金投入文生图模型Stable Diffusion的研发,为入局生成式AI奠定基础 [6] - 2022年12月,在ChatGPT掀起AI浪潮后,Runway完成C轮融资5000万美元,并迅速转向生成式AI [6] - 2023年2月发布AI视频模型Gen-1,一个月后发布支持文生视频的Gen-2,后者是当时行业第一个大规模商业化的文生视频模型 [8] - 英伟达首次押注Runway是在其C+轮融资,当时公司投后估值超过15亿美元,成为独角兽 [8] - 2025年4月发布Gen-4模型,引入了物理规律理解,为进军世界模型埋下伏笔,并同步完成3.08亿美元的D轮融资,由General Atlantic领投,英伟达再次参投 [8] - 2025年12月,公司将模型升级至Gen-4.5以提高真实感,随后发布了首个世界模型GWM-1 [10] - GWM-1是基于Gen-4.5的自回归模型,可逐帧生成图像并实时运行,包含三个独立后训练的变体:GWM Worlds(生成可探索模拟环境)、GWM Avatar(生成可对话虚拟角色)、GWM Robotics(生成用于机器人训练的合成数据) [10] - 在Runway转向世界模型后,英伟达进行了第三次投资 [12] 行业趋势:世界模型 - 世界模型已成为落地物理AI的关键路径,从自动驾驶到机器人领域均有应用 [22] - 早在2024年,英伟达在42天内两次出手投资应用世界模型技术的自动驾驶公司Waabi和Wayve [13] - Waabi专注于无人卡车,打造了AI闭环模拟器Waabi World用于生成交通场景训练算法 [13] - Wayve在测试Robotaxi,其开发了GAIA系列模型,通过生成视频来训练AI司机 [13] - 英伟达在2025年1月CES期间亲自下场,发布了支持多模态输入的世界模型NVIDIA Cosmos,用于生成遵守物理定律的逼真视频以训练机器人算法 [15] - 特斯拉开发了世界模拟器,让开发者可以用提示词生成或修改视频,以输出数据训练FSD系统,其FSD副总裁透露,尽管有海量真实数据,但其中99%是简单场景,缺乏极端场景数据 [17] - 理想汽车已将云端生成式世界模型与车端VLA结合,实现训练闭环,以此迈向L4 [17] - 2026年初,“Robotaxi第一股”文远知行发布世界模型WeRide GENESIS,可用于无限生成、回放和调整各种边缘场景 [18] - Waymo基于谷歌Genie3打造了世界模型,不仅能生成各种驾驶场景视频,还能生成激光雷达点云 [19]
Seedance2.0:AI视频第一阶段的比赛,结束了
36氪· 2026-02-12 08:00
文章核心观点 - Seedance2.0是一款在AI视频生成领域具有突破性意义的模型,其综合能力被评价为“杀死比赛”,可能标志着AI视频竞争进入新阶段 [5][10][35][69] - 该模型在多个关键能力上实现质变,为用户提供了接近“导演级”的控制精度,显著降低了视频创作门槛和成本 [18][55][57] - 模型展现出的对物理规律、因果关系和情绪的理解,使其被认为是第一个展现出“世界模型”雏形的AI视频产品 [62][63][64] - 技术的成熟将竞争焦点从技术本身转向了“好故事”和“好审美”,工具民主化将凸显核心创作能力的价值 [67][70][78] Seedance2.0的核心能力突破 - **自分镜和自运镜**:模型可根据情节描述自动规划分镜和运镜,用户只需提供故事,无需精确描述镜头运动 [14] - **全方位多模态参考**:支持同时输入最多9张图片、3段视频和3段音频(共12个参考文件),用以指定动作、风格、外貌、氛围等,上限极高 [15] - **音画同步生成**:生成视频时可同步生成匹配的音效和配乐,并支持口型同步与情绪匹配 [16] - **多镜头叙事能力**:能在多个镜头间维持角色和场景的一致性,支持生成包含镜头切换的完整叙事片段 [17] - **高可用率**:根据测试及从业者反馈,生成视频的可用率超过90%,远高于行业平均不到20%的水平 [54][55] 实测效果展示 - **电影感镜头生成**:使用简单提示词(樱花树下女孩与猫)一次生成成功,细节处理出色,如花瓣飘落有层次、毛发有质感、动态连贯、光影电影化 [23][24] - **复杂动漫特效生成**:包含情绪转变、特效爆发、动作衔接的复杂提示词,模型能良好把控节奏感,生成结果可直接用于动漫短视频 [26][27] - **AI动漫短剧制作**:通过引用多张图片保证一致性,仅用四次生成和简单拼接,在15分钟内完成一段60秒、镜头连贯、角色一致的短剧,效率远超传统流程 [30][31][33][34] 对视频行业的影响与冲击 - **冲击视频/漫剧Agent商业模式**:模型能力跨过门槛后,依赖工程优化和API差价的中介模式价值减弱,幸存者需围绕对Seedance2.0的深度理解重构产品 [51][52] - **大幅降低制作成本**:高可用率使实际成本无限逼近理论成本,例如制作90分钟片子的成本可从近一万块降至两千多块,节省约五分之四 [54][55] - **颠覆传统影视制作流程**:特效镜头制作成本可能下降数千倍,效率提升上万倍;短剧领域的演员、场地等主要成本可能被削减90%以上,并实现数据驱动的快速A/B测试 [57] 技术意义与行业阶段判断 - **展现“世界模型”雏形**:模型表现出对物理规律、因果关系和情绪的理解,并能融合文字、图片、视频、音频多模态信息,超越了简单的模式匹配 [63][64] - **竞争逻辑发生转移**:当技术不再是瓶颈,竞争壁垒将转向“好故事”和“好审美”,创作能力变得前所未有的值钱 [66][67] - **标志着行业进入新阶段**:Seedance2.0将AI视频第一阶段(比拼画面、连贯性、稳定性)的天花板拉得很高,竞争已进入以创意和审美为核心的第二阶段 [68][69][70] 工具进化对创作思维的改变 - **工具成为思考背景**:模型强大到让用户不再思考“能不能做到”,而是直接思考“要讲什么故事”,工具从思考对象退居幕后 [74][75][76] - **技术已能支撑大部分创意**:当前技术成熟度足以让创作者将重心放在稀缺的、未被讲出的故事和独特的审美视角上 [77][78][79]
网易美股盘前下跌
第一财经资讯· 2026-02-12 04:51
2025年第四季度及全年财务表现 - 2025年第四季度,公司营收为275亿元人民币,同比增长3%,但归属于公司股东的净利润为62亿元人民币,相比去年同期的88亿元下降近30%,不及市场预期[2] - 第四季度净利润下滑主要由于销售及市场费用同比增加约10.7亿元,达到38.9亿元;同时,投资亏损达到16.7亿元,同比大增约12亿元;此外,汇兑损失超过5亿元[3] - 2025年全年,公司总营收为1126亿元人民币,同比增长约7%;全年归属于公司股东的净利润为338亿元人民币,同比增长13.8%[4] 业务分部收入情况 - 游戏及相关增值服务是公司核心支柱,第四季度收入为220亿元人民币,同比增长3.4%,占总营收比例为80%[4] - 网易有道第四季度收入为16亿元人民币,同比增加16.8%[4] - 网易云音乐第四季度收入为20亿元人民币,同比增加4.7%[4] - 创新及其他业务第四季度净收入为20亿元人民币,同比减少10.4%[4] 产品与运营动态 - 老牌旗舰游戏《梦幻西游》及《第五人格》等长线产品支撑了业绩底座[4] - 新游戏《燕云十六声》和《漫威争锋》的上线为收入增长提供了增量[4] - 暴雪系列游戏回归中国市场后创下了年度收入新高[4] - 年底《燕云十六声》手游周年庆表现亮眼、《蛋仔派对》热度反弹,其递延收入预计将对2026年第一季度的收入形成超预期的支撑[4] 管理层对AI影响游戏行业的观点 - 管理层认为市场很大程度上误解了谷歌生成式世界模型Genie 3对游戏行业的影响,该模型发布曾导致Unity、Roblox等公司股价单日跌幅高达17%–24%[5][6] - AI技术降低了游戏制作的准入门槛,但同时极大拔高了头部产品的成功门槛;对于商业化大作,核心壁垒已从产能转化为整合能力,例如将AI技术与复杂的数值体系、经济系统及社交生态融合,这需要游戏设计底蕴和运营经验[6] - 世界模型更大的意义在于可能催生区别于传统游戏的全新娱乐类型,但离实际应用尚远;当前游戏基于确定性构建,而世界模型是概率性的,具有高度不确定性和控制难度,目前并不适合于传统游戏[6] 现金流与财务状况 - 截至2025年12月31日,公司净现金余额为1635亿元人民币,2024年同期为1315亿元人民币[7] - 2025年全年,公司经营活动净现金流入为507亿元人民币,2024年为397亿元人民币[7]
网易美股盘前下跌
第一财经· 2026-02-11 22:35
2025年第四季度及全年财务表现 - 2025年第四季度营收为275亿元人民币,同比增长3% [3] - 2025年第四季度归股净利润为62亿元人民币,相比去年同期的88亿元下降近30%,不及市场预期 [3] - 2025年全年总营收为1126亿元人民币,同比增长约7% [5] - 2025年全年归股净利润为338亿元人民币,同比增长13.8% [5] - 第四季度净利润下滑原因包括:销售及市场费用同比增加约10.7亿元,达38.9亿元;投资亏损达到16.7亿元,大增约12亿元;汇兑损失超5亿元 [4] - 截至2025年12月31日,公司净现金余额为1635亿元人民币,较2024年的1315亿元增加 [7] - 2025年经营活动净现金流入为507亿元人民币,2024年为397亿元 [7] 业务分部表现 - 游戏及相关增值服务是核心支柱,第四季度收入220亿元人民币,同比增长3.4%,占总营收比例为80% [5] - 老牌旗舰《梦幻西游》及《第五人格》等长线产品支撑业绩底座 [5] - 新游《燕云十六声》和《漫威争锋》的上线为收入增长提供增量 [5] - 暴雪系列游戏回归中国市场后创下年度收入新高 [5] - 网易有道第四季度收入为16亿元人民币,同比增加16.8% [6] - 网易云音乐第四季度收入为20亿元人民币,同比增加4.7% [6] - 创新及其他业务第四季度净收入为20亿元人民币,同比减少10.4% [6] 业绩分析与市场观点 - 海豚投研认为第四季度核心盈利能力有所提升,销售费用同比增长主要因前一年反腐特殊期基数较低及当期新游戏上线宣发需求 [5] - 海豚投研猜测第四季度业绩主要因手游较弱,这也是近期股价持续回调的原因之一 [5] - 研报肯定公司递延收入,对应年底《燕云十六声》手游周年庆表现亮眼、《蛋仔派对》热度反弹,预计将对第一季度收入有超预期支撑 [5] 管理层对AI影响的观点 - 管理层认为市场很大程度上误解了谷歌生成式世界模型Genie 3对游戏行业的影响,该模型引发行业震动并导致美股相关公司股价单日跌幅高达17%–24% [6] - 管理层认为AI降低了游戏制作准入门槛,但同时极大拔高了头部产品的成功门槛 [6] - 对于商业化大作,核心壁垒已从单纯产能转化为整合能力,即如何将AI技术与复杂数值体系、长线经济系统及深度社交生态融合,这需要游戏设计底蕴和运营经验 [7] - 管理层认为世界模型更大的意义在于催生区别于传统游戏的全新娱乐类型,但离实际应用还有很远距离 [7] - 当今游戏基于确定性构建,而世界模型是概率性的,具有高度不确定性和控制难度,目前并不适合于传统游戏 [7]
中金:人工智能十年展望:2026关键趋势之模型技术篇
中金· 2026-02-11 13:58
报告投资评级 - 报告未明确给出具体的行业或公司投资评级 [2] 报告核心观点 - 回顾2025年,全球大模型在推理、编程、Agentic及多模态等能力上取得明显进步,但通用能力在稳定性、幻觉率等方面仍有短板 [2] - 展望2026年,大模型将在强化学习、模型记忆、上下文工程等方面取得更多突破,从短文本生成向长思维链任务、从文本交互向原生多模态演进,向实现AGI的长期目标更进一步 [2] 技术视角:模型架构优化与提升智能上限 模型能力:聚焦推理、编程、Agentic与多模态 - **推理能力**:2025年模型推理能力上限和思维链利用效率均得到优化,强化学习激励模型形成更长思维链解决复杂任务,“测试时计算”成为主流工程杠杆,模型学会并行思考与反思,并与工具调用结合形成“交错思维链” [17][18]。在MMLU-Pro测试中,头部模型如Gemini-3-Pro-Preview得分为90.5%,Claude-Opus-4.1为87.9%,GPT-5为87.1% [19] - **编程能力**:AI编程已进化为具备工程闭环能力的开发者代理,从代码补全到全栈自主构建。2025年约84%的全球开发者使用AI编程工具 [20]。在Code Arena测试中,Claude-opus-4-5-20251101-thinking-32k得分为1510,GPT-5.2-high为1478,Gemini-3-pro为1477 [22] - **Agentic能力**:核心技术突破之一是交错思维链的使用,使智能体能在思考与行动间高频切换,提升实时修正能力并降低幻觉。在HLE测试中,Gemini-3-pro-preview准确率为37.5%,GPT-5-pro为31.6%,GPT-5.2为27.8% [24][25] - **多模态能力**:图片生成在质量、理解与控制能力上实现大幅跃升,进入可控、可用、可规模化生产阶段。原生多模态架构(统一token化)普及,以Gemini-3为代表 [28]。在OpenCompass测试中,Gemini-3-Pro得分为66.4,Seed1.6-vision为61.1,Qwen3-VL-235B-A22B-Thinking为60.2 [30] - **能力差距**:国产大模型整体能力与海外头部模型维持约半年的静态差距,在海外模型推出3到6个月后,国内头部厂商能推出能力相当的模型并达到SOTA水准 [32][33] - **发展路径**:海外模型厂商追求模型智能上限,国内模型厂商在有限资源下通过开源路线、工程及算法优化追求效率与性能的平衡 [37] 模型架构:基于Transformer的优化延续 - **主流架构**:Transformer架构延续,优化聚焦于模型架构、算法和工程,以提升参数利用效率和模型智能潜力 [40] - **MoE架构**:平衡性能与效率的稀疏专家混合网络(MoE)成为共识,通常仅激活模型总参数的10-20%,显著降低计算量。国产模型如DeepSeek-V3.2、MiniMax-M2、Qwen-2.5均使用MoE架构 [41] - **注意力机制**:基于算法和工程优化提升效率,主要分为全注意力(Full-Attention,复杂度O(N^2))、线性注意力(Linear-Attention,复杂度O(N))和混合注意力(Hybrid-Attention)。模型厂商根据效果持续优化选择,如阿里千问深耕Linear-Attention,DeepSeek-V3.2引入稀疏注意力将计算复杂度降至O(Nk) [49][50] - **工程优化**:核心是降本提速与规模化生产,包括推理侧思考链工程化、实时路由机制、长上下文优化等。通过线性注意力、稀疏注意力、MLA内存优化等技术降低计算复杂度和显存占用 [54][55] 训练范式:预训练与强化学习 - **预训练 Scaling-Law**:预计2026年预训练阶段的Scaling-Law将重现,旗舰模型参数量将更上一个台阶。预训练通过算法和工程优化仍有提升空间,随着英伟达GB系列芯片成熟,模型将基于更高性能的万卡集群进一步突破智能上限 [3][61] - **强化学习重要性**:强化学习成为解锁模型高级能力的关键,其本质是“自我生成数据+多轮迭代”。海外模型厂商非常重视,国内厂商如DeepSeek、阿里千问也在跟进。预计2026年海内外模型厂商强化学习占比将进一步提升 [3][61] - **算力与数据基础**:强化学习需要大规模算力提供稳定性,并高度依赖高质量数据。高质量数据用于奖励模型训练和SFT冷启动 [62] - **算法演进**:强化学习路径从RLHF、PPO、DPO演进至推理导向的强化学习(如GRPO),并正从静态离线向动态在线演进 [64][66] 路线展望:持续学习、模型记忆与世界模型 - **持续学习与模型记忆**:旨在解决大模型“灾难性遗忘”问题,让模型具备选择性记忆机制,实现持续甚至终身学习。Google提出的MIRAS、Titans、Nested Learning、HOPE等算法和架构是落地的关键 [4][70] - **世界模型**:聚焦理解物理世界因果规律,是实现AGI的重要拼图。当前主要有三条技术路径:李飞飞团队World Labs的Marble模型(创建持久3D世界)、LeCun的JEPA架构(认知预测)、Google DeepMind的Genie 3(交互仿真) [87][90] - **短期与中长期焦点**:2026年模型厂商短期将聚焦强化学习和上下文工程,中长期围绕持续学习、模型记忆和世界模型等创新路线 [67] 回顾与展望:海内外头部大模型巡礼 OpenAI - **2025年进展**:在推理、Agentic、多模态、代码能力上全方位提升,发布了GPT-4.1、o4-mini、GPT-5、Sora-2等模型。开始探索商业化,如在ChatGPT中插入推荐广告,与软件厂商合作探索企业智能代理 [93] - **2026年展望**:预计将加速商业兑现,拓展企业端和广告市场,借鉴Cowork和Moltbot等企业端Agent案例打造新产品 [95] Gemini (Google) - **2025年进展**:Gemini-3的发布使Google跻身第一梯队,其原生多模态能力突出。Nano banana Pro图像生成模型具备空间推理和光影控制能力。商业化上更聚焦产品提效,Gemini月活达6.5亿,API每分钟消耗70亿tokens [98] - **2026年展望**:预计将延续原生多模态优势,推进Scaling-law,提升长链推理和端到端编程能力,并加速探索世界模型 [99] Anthropic - **2025年进展**:延续在编程领域的优势,发布了Claude Opus-4.5等模型,加强了代码与长任务处理能力。推出了面向开发者的Claude Code(ARR已突破10亿美元)和面向泛化用户的Cowork,探索企业Agent场景 [101][102] - **2026年展望**:预计将提升记忆能力,探索更多Agent泛化场景,让Cowork等产品具备“永久记忆”,成为理解用户的专属智能体 [103][104] 阿里通义千问 - **布局**:布局全模态模型矩阵,打开Agent市场空间 [105]