视频生成
搜索文档
世界模型的GPT时刻:距离物理AGI出圈,还有多远?
AI前线· 2026-06-18 12:24
文章核心观点 世界模型在2025-2026年成为AI领域最热方向之一,其核心目标是从视频生成迈向对物理世界的真正理解与交互。行业专家认为,当前世界模型仍处于学术界和工业界内部探索阶段,尚未“出圈”,其发展受到数据、算力、评测等多方面挑战。技术路线尚未收敛,但生成与表征的融合、以及面向物理世界的专用基模型预训练被认为是关键方向。未来格局可能类似于大语言模型,由少数通用基模型与大量垂类精调模型共同构成[4][7][12][13][37][38]。 世界模型的定义与范畴 - **世界模型包含三大范畴**:渲染器(视频生成内容)、仿真器(强化学习环境)、规划器(产生动作策略的World Action Model)[7][8] - **与视频生成模型的本质区别**在于**可交互性**和**世界状态的维护**。视频生成关注画面美学,而世界模型需能根据指令影响未来演变,并理解物体形状、物理量等状态[8] - **核心定义**:基于对现实世界的观测和交互指令,实现像素级场景还原和物理状态的精准预测,输出背后的物理规律而不仅是表观现象[9] 世界模型兴起的原因 - **技术突破**:以DiT为代表的生成模型技术突破,使模型能从海量数据中学到物理直觉和时空动态规律[10] - **资源溢出**:大语言模型热潮带来的资金、人才、算力和基础设施溢出,推动了其他AI模态的发展[10] - **需求驱动**: - **数据生成引擎**:解决具身智能等领域数据缺口巨大的瓶颈,作为互联网数据、仿真数据、真机数据三层金字塔的结构性补充[11] - **具身大脑**:弥补视觉-语言-动作模型泛化性不足的短板,利用从海量互联网视频中学到的时空模式提供更强泛化能力[11] - **垂类应用推动**:如自动驾驶为解决corner case数据收集困难,率先应用世界模型作为仿真器或数据生成器[10] 当前发展阶段与挑战 - **尚未到达“出圈”里程碑**:无论是面向消费者的内容生成还是具身场景,都仍在学术界和工业界内部探索,大众感知弱,尚未出现类似ChatGPT的清晰技术节点[12] - **处于“尺度定律”发展阶段**:数据规模扩大能持续提升模型精度,例如从100兆到500兆训练数据时精度曲线明显提升,但尚未观察到类似大语言模型的“智能涌现”[13][14] - **面临多重挑战**: - **数据瓶颈**:高质量真机数据稀缺,开源最大真机数据仅约1-2万小时,远不够高质量二次预训练,易过拟合[16] - **算力消耗**:纯视频生成路线做实时推理控制机器人时,效率瓶颈致命[4][29] - **跨任务/机型泛化困难**:面对训练中未见的机型或任务,模型容易出现严重幻觉,未完全学会物理规律[17][18] - **评测体系缺失**:缺乏统一、直接的评测标准,当前多借用视频生成标准,但世界模型更核心的可交互性等维度评测困难且共识未形成[33][34] 技术路线与范式 - **主要技术路线**: - **纯生成式(视频生成)**:优势是基建成熟、数据可得性高,但存在算力消耗大、缺乏持久状态导致生成长视频时易漂移穿模等问题[28][29] - **表征式(如JEPA)**:理论优雅,适合机器人内部推理,但难以输出人眼可读的像素[28] - **神经-物理混合式**:结合显式3D、物理引擎与生成模型,强调可交互性、几何约束与物理可控,被视为有潜力的方向[28] - **未来趋势**:专家认为最终会走向**表征与生成的融合**,以及**世界模型与VLA的融合**,在一个统一架构下容纳各自长处[29][32][33] - **架构设计关键**: - **理解模块**:至关重要,是将互联网知识继承到垂类场景的关键抓手[25] - **记忆机制**:对于长视频生成和交互至关重要,常采用以智能体为中心的局部表示[25] - **训练策略**:常用生成加重建作为折中探索,重建技术可弥补纯生成的幻觉;训练时联合预测动作和视频,推理时可只输出动作[4][21][23][29] 数据层面的关键问题 - **数据金字塔共识**:底层互联网视频、中层仿真数据、顶层遥操作真机数据[16] - **世界模型的作用**:主要是**数据增广与价值放大**,而非替代某一层。例如生成仿真资产缩小Sim-to-Real差距,或对真机数据做多视角渲染生成变体以扩充数据量[16][20] - **数据质量瓶颈**:顶层遥操作数据的力学信息(如力反馈)难以被合成,视觉效果可逼近,但物理层面合成非常困难[21] - **第一人称与第三人称数据差异**:第一人称数据携带“意图-动作-结果”因果链,与真机数据天然对齐,价值更高,泛化性可能更强,但采集噪声问题更复杂[22] 行业展望与关键挑战 - **未来市场格局**:预计与语言模型类似,**少数通用基模型**与大量在基模型上做**垂类精调**的模型并存。物理世界场景复杂度高,垂类模型有独立生存空间[38] - **最被低估的挑战**: - **自进化能力**:让模型能从失败案例中学习,并与智能体调度系统结合实现持续运行[36] - **评测体系本身**:好的评测维度能直接驱动模型能力提升,但目前严重缺失[37] - **专用基模型缺失**:当前依赖为“拍好画面”设计的视频生成基模型,与物理世界建模的核心诉求存在错配,需要专门面向物理世界的基模型预训练[37] - **成功世界模型的关键维度**:可概括为**快**(推理效率)、**准**(预测精度)、**稳**(输出可复现性)[34]
2026年第98期:晨会纪要-20260618
国海证券· 2026-06-18 09:04
MiniMax (0100.HK) 深度报告核心观点 - 报告认为MiniMax是全模态智能领军企业,正迈向Tokens时代的基础设施,其投资亮点在于全模态布局的稀缺性、高性价比与高端化兼具的模型能力以及高效率的原生AI研发组织 [3] - MiniMax推出了M3文本模型、Hailuo视频生成模型、MiniMax Speech音频模型等一系列全球具备竞争力的模型,有望在原生多模态领域构筑竞争优势 [3] - MiniMax M2.7模型在同等基础设施下Token吞吐速率更优,海外推理毛利率在2026年6月已突破40%,而M3模型支持百万上下文和原生多模态理解,实现了高端领域突破 [4] - 公司具备精简、扁平化且协同高效的研发组织,建立了灵活敏捷的模型迭代机制,有望借助全栈优势实现新一代模型能力突破,跻身全球大模型Top Player [4] - 生产力Agent和视频生成赛道市场空间巨大,生产力Agent市场规模有望突破万亿美元,视频生成市场空间有望突破200亿美元 [5] - 与市场观点存在预期差,报告认为原生多模态模型具备竞争优势,如引入多模态数据能实现远超文本数据的Scaling,突破预训练数据墙,全模态能力厂商更有希望构筑竞争优势 [6] - 报告预测MiniMax 2026-2028年收入分别为3.62亿美元、8.05亿美元、15.64亿美元,首次覆盖给予“买入”评级 [7] 债券市场周报核心观点 - 报告核心议题是资金面收紧对债市的影响,梳理了近期卖方与买方的观点情绪变化 [8] - 多数卖方机构认为资金面收紧主要是央行引导隔夜利率向1.4%的政策利率靠拢,是流动性回归常态,而非货币政策转向,因此大概率不会形成债市拐点 [8][10] - 少数机构探讨了资金收紧的根本原因,包括银行体系超储水位偏低、同业活期存款稳定性下降、财政资金入库、银行季末信贷冲量、同业存单集中到期高峰等多因素共振 [9] - 对于后续资金面,机构观点包括:资金利率或已调整到位;流动性短期维持中性偏紧直至季末,之后缓慢宽松;未来流动性可能维持中性或小幅渐进宽松 [10] - 2026年6月15日缴税截止日,DR001资金利率升至1.4356%,DR007升至1.4671%,十年期中债国债到期收益率升至1.7446% [11] - 报告认为当前十债利率或已逐步接近阶段性顶部,即使考虑后续扰动,十年期国债调整的最高点大概率在1.76%左右 [11][12] - 卖方情绪有所上升,基于对28家机构的统计,46%持偏多态度,50%持中性态度,4%持偏空态度 [12] - 买方情绪指数有所下降,基于对22家机构的梳理,27%持偏多态度,32%持中性态度,41%持偏空态度 [13] 绿联科技 (301606.SZ) 专题报告核心观点 - 报告核心关注充电宝行业政策变革下,公司如何建立先发优势 [14] - 政策推动行业加速洗牌,低端出清打开增量空间,预计全球移动电源市场从2023年150亿美元扩容至2033年329亿美元,CAGR为8.4% [14] - 3C认证向新国标迭代推动单台合规成本逐级抬升10%-30%,带动低端白牌加速出清约20%,2026年4月移动电源线上CR10已接近50% [14] - 以电动自行车行业为鉴,合规化推动集中度显著提升,行业CR5从2019年约50%提升至2023年68%,2024年锂电池新国标实施后CR5进一步提升至75% [15][16] - 公司通过分散化供应链减少召回风险,与多家中小供应商长期合作,生态式供应链模式有效分散单一供应商依赖与产品安全风险 [16] - 公司于2025年7月率先推出充电宝以旧换新计划,并于2026年4月与ATL、比亚迪电池签署战略合作协议,围绕新国标电芯开展联合研发与量产 [16] 煤炭行业动态研究核心观点 - 报告认为在供需缺口延续及安监加码背景下,煤价将偏强运行 [18] - 2026年5月,规上工业原煤产量4.0亿吨,同比下降1.7%;日均产量1281万吨,同比减少19.5万吨/天 [18] - 2026年5月,我国进口煤炭3326.5万吨,同比下降7.7% [20] - 综合测算,2026年5月国内煤炭供应同比减少2.2% [20] - 需求端,2026年5月规上工业火电发电量同比增长2.1%;甲醇周均产量同比增长1.6%;焦炭产量同比增长1.1% [21] - 综合测算,2026年5月四大行业(电力、化工、建材、钢铁)带动煤炭消费同比增长1.2% [21] - 2026年5月末,北方港口动力煤库存较月初上升201.70万吨至2832.80万吨 [22] - 2026年5月,北方港口动力煤月均价格837.63元/吨,同比上涨35.35%(上涨219元/吨),环比上涨8.72%(上涨67元/吨);港口主焦煤月均价格1758.42元/吨,同比上涨33.27%(上涨439元/吨),环比上涨6.02%(上涨100元/吨) [23] - 报告总结5月供需缺口仍存,供给同比减少2.2%,需求同比增长1.2%,港口煤价同环比均上涨 [24] - 预计旺季到来、日耗上行有望带动电厂补库、港口去库,在供应有约束的背景下,夏季煤价或将偏强运行 [24] - 报告维持煤炭开采行业“推荐”评级,并列出三类重点关注标的 [26] 安井食品 (603345.SH) 公司点评核心观点 - 报告认为公司新品加速,增长动能充足 [27] - 产品端,公司战略重心已切换为“新品驱动”,火锅料制品、米面制品、烤肠类新品销售良好,市场反馈积极 [27] - 渠道方面,B端以餐饮流通与小B为主,C端持续聚焦质价比营销,强化消费者粘性 [28] - 展望2026年,公司经营有望反转加速,驱动因素包括餐饮场景需求改善、行业格局有望改善、公司新品轮动加速、海外市场及“安斋”业务等增量拓展 [28] - 报告预测公司2026-2028年营业收入分别为184亿元、203亿元、224亿元,同比分别增长14%、10%、10%;归母净利润分别为18亿元、21亿元、23亿元,同比分别增长36%、13%、12% [29] - 首次覆盖,给予“买入”评级 [29] 航空运输行业专题研究核心观点 - 报告核心观点:6月上半月油价大幅回落,静待需求回升 [31] - 2026年6月月中布伦特原油期货结算价已跌破90美元/桶,月度均价环比5月全月中枢价下降10.9%,国内航油出厂价及燃油附加费也在6月环比下降 [31] - 2026年5月,受高油价成本压力影响,航司运力投放缩减,三大航国内线ASK同比降幅均超过7%,行业周转量同比下降5.9% [31][33] - 2026年5月行业国内线经济舱平均含税价822元,同比上涨17.0%,但扣油价同比微降0.8% [34] - 2026年6月初至6月15日,国内线经济舱平均含税票价同比上涨19.9%,扣油票价同比下降1.5% [34] - 油价方面,5月平均布油价达103.7美元/桶,同比增长62.0%;6月初至6月15日平均布油价回落至92.4美元/桶 [35] - 汇率方面,至2026年6月16日,中间价美元兑人民币汇率为6.811元,较2025年末升值3.10% [35] - 报告认为后续随油价下降,航司成本减负,运力及周转量有望恢复稳增,高位客座率将支撑票价,维持航空运输行业“推荐”评级 [32] AI模型行业专题研究核心观点 - 报告核心观点:头部模型厂正从规模增长进入价值兑现的新盈利阶段 [38] - Anthropic于2026年6月9日发布最新旗舰模型Claude Fable 5与Mythos 5,支持100万token上下文窗口,具备复杂任务处理优势 [39] - Anthropic业务主要由B端驱动,预计2026年公司超过80%收入来自企业客户,其AI编程产品Claude Code的ARR至2026年2月已超25亿美元,市场份额达54% [40] - 2026年5月底,Anthropic的年度经常性收入(ARR)已达470亿美元,毛利率提升至70%,预计2026年第二季度首次实现盈利,营收预计109亿美元,营业利润5.59亿美元 [42] - 对比来看,OpenAI 2026年全年营收预计300亿美元,但调整后毛利率从2024年的40%被压缩至约33%,目前尚未实现盈利 [42] - 报告认为模型厂/云厂商算力投入具备可持续性,景气有望传导至算力链,垂类AI应用公司有望率先突破,维持对计算机行业“推荐”评级 [43] 摩托车行业数据更新核心观点 - 报告提供了2026年1-5月摩托车行业及主要公司的销售数据更新 [44] - 2026年1-5月,燃油摩托车总销量767万辆,同比增长12%;其中外销587万辆,同比增长18%;内销180万辆,同比下降3% [44][45] - 分排量看,1-5月150cc<排量≤250cc车型销售92万辆,同比增长15%;排量>250cc车型销售39万辆,同比下降2% [44] - 春风动力1-5月燃油摩托车总销售13.9万辆,同比增长18%;其中外销6.9万辆,同比增长21%;内销7.1万辆,同比增长15% [46] - 钱江摩托1-5月燃油摩托车总销售13.5万辆,同比下降20%;其中外销8.6万辆,同比增长18%;内销4.9万辆,同比下降49% [48] - 隆鑫通用1-5月燃油摩托车总销售48.0万辆,同比下降25%;其中外销44.0万辆,同比下降27%;内销4.0万辆,同比下降2% [49] - 报告认为摩托车出口仍然保持较高景气度,维持摩托车行业“推荐”评级 [50]