Workflow
世界模型
icon
搜索文档
老黄苏妈投了同一家世界模型公司
36氪· 2026-02-12 17:52
公司融资与估值 - AI视频公司Runway完成E轮融资,融资金额为3.15亿美元(约合人民币21.7亿元),资金将用于预训练下一代世界模型并将其落地到产品中 [2] - 本轮融资由General Atlantic领投,英伟达和AMD也参与投资 [2] - 本轮融资后,Runway投后估值相比之前几乎翻了一倍,达到53亿美元(约合人民币365.8亿元) [4] - 公司目前只有140名员工,却支撑起53亿美元的估值 [1] 公司发展历程与转型 - Runway成立于2018年,由三位纽约大学艺术学院交互设计专业的毕业生创立 [4] - 公司创立之初获得200万美元种子轮融资,主要做视频剪辑工具,并在2020年底推出爆款“绿幕”功能 [6] - 2021年完成B轮融资3500万美元,并将资金投入文生图模型Stable Diffusion的研发,为入局生成式AI奠定基础 [6] - 2022年12月,在ChatGPT掀起AI浪潮后,Runway完成C轮融资5000万美元,并迅速转向生成式AI [6] - 2023年2月发布AI视频模型Gen-1,一个月后发布支持文生视频的Gen-2,后者是当时行业第一个大规模商业化的文生视频模型 [8] - 英伟达首次押注Runway是在其C+轮融资,当时公司投后估值超过15亿美元,成为独角兽 [8] - 2025年4月发布Gen-4模型,引入了物理规律理解,为进军世界模型埋下伏笔,并同步完成3.08亿美元的D轮融资,由General Atlantic领投,英伟达再次参投 [8] - 2025年12月,公司将模型升级至Gen-4.5以提高真实感,随后发布了首个世界模型GWM-1 [10] - GWM-1是基于Gen-4.5的自回归模型,可逐帧生成图像并实时运行,包含三个独立后训练的变体:GWM Worlds(生成可探索模拟环境)、GWM Avatar(生成可对话虚拟角色)、GWM Robotics(生成用于机器人训练的合成数据) [10] - 在Runway转向世界模型后,英伟达进行了第三次投资 [12] 行业趋势:世界模型 - 世界模型已成为落地物理AI的关键路径,从自动驾驶到机器人领域均有应用 [22] - 早在2024年,英伟达在42天内两次出手投资应用世界模型技术的自动驾驶公司Waabi和Wayve [13] - Waabi专注于无人卡车,打造了AI闭环模拟器Waabi World用于生成交通场景训练算法 [13] - Wayve在测试Robotaxi,其开发了GAIA系列模型,通过生成视频来训练AI司机 [13] - 英伟达在2025年1月CES期间亲自下场,发布了支持多模态输入的世界模型NVIDIA Cosmos,用于生成遵守物理定律的逼真视频以训练机器人算法 [15] - 特斯拉开发了世界模拟器,让开发者可以用提示词生成或修改视频,以输出数据训练FSD系统,其FSD副总裁透露,尽管有海量真实数据,但其中99%是简单场景,缺乏极端场景数据 [17] - 理想汽车已将云端生成式世界模型与车端VLA结合,实现训练闭环,以此迈向L4 [17] - 2026年初,“Robotaxi第一股”文远知行发布世界模型WeRide GENESIS,可用于无限生成、回放和调整各种边缘场景 [18] - Waymo基于谷歌Genie3打造了世界模型,不仅能生成各种驾驶场景视频,还能生成激光雷达点云 [19]
Seedance2.0:AI视频第一阶段的比赛,结束了
36氪· 2026-02-12 08:00
文章核心观点 - Seedance2.0是一款在AI视频生成领域具有突破性意义的模型,其综合能力被评价为“杀死比赛”,可能标志着AI视频竞争进入新阶段 [5][10][35][69] - 该模型在多个关键能力上实现质变,为用户提供了接近“导演级”的控制精度,显著降低了视频创作门槛和成本 [18][55][57] - 模型展现出的对物理规律、因果关系和情绪的理解,使其被认为是第一个展现出“世界模型”雏形的AI视频产品 [62][63][64] - 技术的成熟将竞争焦点从技术本身转向了“好故事”和“好审美”,工具民主化将凸显核心创作能力的价值 [67][70][78] Seedance2.0的核心能力突破 - **自分镜和自运镜**:模型可根据情节描述自动规划分镜和运镜,用户只需提供故事,无需精确描述镜头运动 [14] - **全方位多模态参考**:支持同时输入最多9张图片、3段视频和3段音频(共12个参考文件),用以指定动作、风格、外貌、氛围等,上限极高 [15] - **音画同步生成**:生成视频时可同步生成匹配的音效和配乐,并支持口型同步与情绪匹配 [16] - **多镜头叙事能力**:能在多个镜头间维持角色和场景的一致性,支持生成包含镜头切换的完整叙事片段 [17] - **高可用率**:根据测试及从业者反馈,生成视频的可用率超过90%,远高于行业平均不到20%的水平 [54][55] 实测效果展示 - **电影感镜头生成**:使用简单提示词(樱花树下女孩与猫)一次生成成功,细节处理出色,如花瓣飘落有层次、毛发有质感、动态连贯、光影电影化 [23][24] - **复杂动漫特效生成**:包含情绪转变、特效爆发、动作衔接的复杂提示词,模型能良好把控节奏感,生成结果可直接用于动漫短视频 [26][27] - **AI动漫短剧制作**:通过引用多张图片保证一致性,仅用四次生成和简单拼接,在15分钟内完成一段60秒、镜头连贯、角色一致的短剧,效率远超传统流程 [30][31][33][34] 对视频行业的影响与冲击 - **冲击视频/漫剧Agent商业模式**:模型能力跨过门槛后,依赖工程优化和API差价的中介模式价值减弱,幸存者需围绕对Seedance2.0的深度理解重构产品 [51][52] - **大幅降低制作成本**:高可用率使实际成本无限逼近理论成本,例如制作90分钟片子的成本可从近一万块降至两千多块,节省约五分之四 [54][55] - **颠覆传统影视制作流程**:特效镜头制作成本可能下降数千倍,效率提升上万倍;短剧领域的演员、场地等主要成本可能被削减90%以上,并实现数据驱动的快速A/B测试 [57] 技术意义与行业阶段判断 - **展现“世界模型”雏形**:模型表现出对物理规律、因果关系和情绪的理解,并能融合文字、图片、视频、音频多模态信息,超越了简单的模式匹配 [63][64] - **竞争逻辑发生转移**:当技术不再是瓶颈,竞争壁垒将转向“好故事”和“好审美”,创作能力变得前所未有的值钱 [66][67] - **标志着行业进入新阶段**:Seedance2.0将AI视频第一阶段(比拼画面、连贯性、稳定性)的天花板拉得很高,竞争已进入以创意和审美为核心的第二阶段 [68][69][70] 工具进化对创作思维的改变 - **工具成为思考背景**:模型强大到让用户不再思考“能不能做到”,而是直接思考“要讲什么故事”,工具从思考对象退居幕后 [74][75][76] - **技术已能支撑大部分创意**:当前技术成熟度足以让创作者将重心放在稀缺的、未被讲出的故事和独特的审美视角上 [77][78][79]
网易美股盘前下跌
第一财经资讯· 2026-02-12 04:51
2025年第四季度及全年财务表现 - 2025年第四季度,公司营收为275亿元人民币,同比增长3%,但归属于公司股东的净利润为62亿元人民币,相比去年同期的88亿元下降近30%,不及市场预期[2] - 第四季度净利润下滑主要由于销售及市场费用同比增加约10.7亿元,达到38.9亿元;同时,投资亏损达到16.7亿元,同比大增约12亿元;此外,汇兑损失超过5亿元[3] - 2025年全年,公司总营收为1126亿元人民币,同比增长约7%;全年归属于公司股东的净利润为338亿元人民币,同比增长13.8%[4] 业务分部收入情况 - 游戏及相关增值服务是公司核心支柱,第四季度收入为220亿元人民币,同比增长3.4%,占总营收比例为80%[4] - 网易有道第四季度收入为16亿元人民币,同比增加16.8%[4] - 网易云音乐第四季度收入为20亿元人民币,同比增加4.7%[4] - 创新及其他业务第四季度净收入为20亿元人民币,同比减少10.4%[4] 产品与运营动态 - 老牌旗舰游戏《梦幻西游》及《第五人格》等长线产品支撑了业绩底座[4] - 新游戏《燕云十六声》和《漫威争锋》的上线为收入增长提供了增量[4] - 暴雪系列游戏回归中国市场后创下了年度收入新高[4] - 年底《燕云十六声》手游周年庆表现亮眼、《蛋仔派对》热度反弹,其递延收入预计将对2026年第一季度的收入形成超预期的支撑[4] 管理层对AI影响游戏行业的观点 - 管理层认为市场很大程度上误解了谷歌生成式世界模型Genie 3对游戏行业的影响,该模型发布曾导致Unity、Roblox等公司股价单日跌幅高达17%–24%[5][6] - AI技术降低了游戏制作的准入门槛,但同时极大拔高了头部产品的成功门槛;对于商业化大作,核心壁垒已从产能转化为整合能力,例如将AI技术与复杂的数值体系、经济系统及社交生态融合,这需要游戏设计底蕴和运营经验[6] - 世界模型更大的意义在于可能催生区别于传统游戏的全新娱乐类型,但离实际应用尚远;当前游戏基于确定性构建,而世界模型是概率性的,具有高度不确定性和控制难度,目前并不适合于传统游戏[6] 现金流与财务状况 - 截至2025年12月31日,公司净现金余额为1635亿元人民币,2024年同期为1315亿元人民币[7] - 2025年全年,公司经营活动净现金流入为507亿元人民币,2024年为397亿元人民币[7]
网易美股盘前下跌
第一财经· 2026-02-11 22:35
2025年第四季度及全年财务表现 - 2025年第四季度营收为275亿元人民币,同比增长3% [3] - 2025年第四季度归股净利润为62亿元人民币,相比去年同期的88亿元下降近30%,不及市场预期 [3] - 2025年全年总营收为1126亿元人民币,同比增长约7% [5] - 2025年全年归股净利润为338亿元人民币,同比增长13.8% [5] - 第四季度净利润下滑原因包括:销售及市场费用同比增加约10.7亿元,达38.9亿元;投资亏损达到16.7亿元,大增约12亿元;汇兑损失超5亿元 [4] - 截至2025年12月31日,公司净现金余额为1635亿元人民币,较2024年的1315亿元增加 [7] - 2025年经营活动净现金流入为507亿元人民币,2024年为397亿元 [7] 业务分部表现 - 游戏及相关增值服务是核心支柱,第四季度收入220亿元人民币,同比增长3.4%,占总营收比例为80% [5] - 老牌旗舰《梦幻西游》及《第五人格》等长线产品支撑业绩底座 [5] - 新游《燕云十六声》和《漫威争锋》的上线为收入增长提供增量 [5] - 暴雪系列游戏回归中国市场后创下年度收入新高 [5] - 网易有道第四季度收入为16亿元人民币,同比增加16.8% [6] - 网易云音乐第四季度收入为20亿元人民币,同比增加4.7% [6] - 创新及其他业务第四季度净收入为20亿元人民币,同比减少10.4% [6] 业绩分析与市场观点 - 海豚投研认为第四季度核心盈利能力有所提升,销售费用同比增长主要因前一年反腐特殊期基数较低及当期新游戏上线宣发需求 [5] - 海豚投研猜测第四季度业绩主要因手游较弱,这也是近期股价持续回调的原因之一 [5] - 研报肯定公司递延收入,对应年底《燕云十六声》手游周年庆表现亮眼、《蛋仔派对》热度反弹,预计将对第一季度收入有超预期支撑 [5] 管理层对AI影响的观点 - 管理层认为市场很大程度上误解了谷歌生成式世界模型Genie 3对游戏行业的影响,该模型引发行业震动并导致美股相关公司股价单日跌幅高达17%–24% [6] - 管理层认为AI降低了游戏制作准入门槛,但同时极大拔高了头部产品的成功门槛 [6] - 对于商业化大作,核心壁垒已从单纯产能转化为整合能力,即如何将AI技术与复杂数值体系、长线经济系统及深度社交生态融合,这需要游戏设计底蕴和运营经验 [7] - 管理层认为世界模型更大的意义在于催生区别于传统游戏的全新娱乐类型,但离实际应用还有很远距离 [7] - 当今游戏基于确定性构建,而世界模型是概率性的,具有高度不确定性和控制难度,目前并不适合于传统游戏 [7]
中金:人工智能十年展望:2026关键趋势之模型技术篇
中金· 2026-02-11 13:58
报告投资评级 - 报告未明确给出具体的行业或公司投资评级 [2] 报告核心观点 - 回顾2025年,全球大模型在推理、编程、Agentic及多模态等能力上取得明显进步,但通用能力在稳定性、幻觉率等方面仍有短板 [2] - 展望2026年,大模型将在强化学习、模型记忆、上下文工程等方面取得更多突破,从短文本生成向长思维链任务、从文本交互向原生多模态演进,向实现AGI的长期目标更进一步 [2] 技术视角:模型架构优化与提升智能上限 模型能力:聚焦推理、编程、Agentic与多模态 - **推理能力**:2025年模型推理能力上限和思维链利用效率均得到优化,强化学习激励模型形成更长思维链解决复杂任务,“测试时计算”成为主流工程杠杆,模型学会并行思考与反思,并与工具调用结合形成“交错思维链” [17][18]。在MMLU-Pro测试中,头部模型如Gemini-3-Pro-Preview得分为90.5%,Claude-Opus-4.1为87.9%,GPT-5为87.1% [19] - **编程能力**:AI编程已进化为具备工程闭环能力的开发者代理,从代码补全到全栈自主构建。2025年约84%的全球开发者使用AI编程工具 [20]。在Code Arena测试中,Claude-opus-4-5-20251101-thinking-32k得分为1510,GPT-5.2-high为1478,Gemini-3-pro为1477 [22] - **Agentic能力**:核心技术突破之一是交错思维链的使用,使智能体能在思考与行动间高频切换,提升实时修正能力并降低幻觉。在HLE测试中,Gemini-3-pro-preview准确率为37.5%,GPT-5-pro为31.6%,GPT-5.2为27.8% [24][25] - **多模态能力**:图片生成在质量、理解与控制能力上实现大幅跃升,进入可控、可用、可规模化生产阶段。原生多模态架构(统一token化)普及,以Gemini-3为代表 [28]。在OpenCompass测试中,Gemini-3-Pro得分为66.4,Seed1.6-vision为61.1,Qwen3-VL-235B-A22B-Thinking为60.2 [30] - **能力差距**:国产大模型整体能力与海外头部模型维持约半年的静态差距,在海外模型推出3到6个月后,国内头部厂商能推出能力相当的模型并达到SOTA水准 [32][33] - **发展路径**:海外模型厂商追求模型智能上限,国内模型厂商在有限资源下通过开源路线、工程及算法优化追求效率与性能的平衡 [37] 模型架构:基于Transformer的优化延续 - **主流架构**:Transformer架构延续,优化聚焦于模型架构、算法和工程,以提升参数利用效率和模型智能潜力 [40] - **MoE架构**:平衡性能与效率的稀疏专家混合网络(MoE)成为共识,通常仅激活模型总参数的10-20%,显著降低计算量。国产模型如DeepSeek-V3.2、MiniMax-M2、Qwen-2.5均使用MoE架构 [41] - **注意力机制**:基于算法和工程优化提升效率,主要分为全注意力(Full-Attention,复杂度O(N^2))、线性注意力(Linear-Attention,复杂度O(N))和混合注意力(Hybrid-Attention)。模型厂商根据效果持续优化选择,如阿里千问深耕Linear-Attention,DeepSeek-V3.2引入稀疏注意力将计算复杂度降至O(Nk) [49][50] - **工程优化**:核心是降本提速与规模化生产,包括推理侧思考链工程化、实时路由机制、长上下文优化等。通过线性注意力、稀疏注意力、MLA内存优化等技术降低计算复杂度和显存占用 [54][55] 训练范式:预训练与强化学习 - **预训练 Scaling-Law**:预计2026年预训练阶段的Scaling-Law将重现,旗舰模型参数量将更上一个台阶。预训练通过算法和工程优化仍有提升空间,随着英伟达GB系列芯片成熟,模型将基于更高性能的万卡集群进一步突破智能上限 [3][61] - **强化学习重要性**:强化学习成为解锁模型高级能力的关键,其本质是“自我生成数据+多轮迭代”。海外模型厂商非常重视,国内厂商如DeepSeek、阿里千问也在跟进。预计2026年海内外模型厂商强化学习占比将进一步提升 [3][61] - **算力与数据基础**:强化学习需要大规模算力提供稳定性,并高度依赖高质量数据。高质量数据用于奖励模型训练和SFT冷启动 [62] - **算法演进**:强化学习路径从RLHF、PPO、DPO演进至推理导向的强化学习(如GRPO),并正从静态离线向动态在线演进 [64][66] 路线展望:持续学习、模型记忆与世界模型 - **持续学习与模型记忆**:旨在解决大模型“灾难性遗忘”问题,让模型具备选择性记忆机制,实现持续甚至终身学习。Google提出的MIRAS、Titans、Nested Learning、HOPE等算法和架构是落地的关键 [4][70] - **世界模型**:聚焦理解物理世界因果规律,是实现AGI的重要拼图。当前主要有三条技术路径:李飞飞团队World Labs的Marble模型(创建持久3D世界)、LeCun的JEPA架构(认知预测)、Google DeepMind的Genie 3(交互仿真) [87][90] - **短期与中长期焦点**:2026年模型厂商短期将聚焦强化学习和上下文工程,中长期围绕持续学习、模型记忆和世界模型等创新路线 [67] 回顾与展望:海内外头部大模型巡礼 OpenAI - **2025年进展**:在推理、Agentic、多模态、代码能力上全方位提升,发布了GPT-4.1、o4-mini、GPT-5、Sora-2等模型。开始探索商业化,如在ChatGPT中插入推荐广告,与软件厂商合作探索企业智能代理 [93] - **2026年展望**:预计将加速商业兑现,拓展企业端和广告市场,借鉴Cowork和Moltbot等企业端Agent案例打造新产品 [95] Gemini (Google) - **2025年进展**:Gemini-3的发布使Google跻身第一梯队,其原生多模态能力突出。Nano banana Pro图像生成模型具备空间推理和光影控制能力。商业化上更聚焦产品提效,Gemini月活达6.5亿,API每分钟消耗70亿tokens [98] - **2026年展望**:预计将延续原生多模态优势,推进Scaling-law,提升长链推理和端到端编程能力,并加速探索世界模型 [99] Anthropic - **2025年进展**:延续在编程领域的优势,发布了Claude Opus-4.5等模型,加强了代码与长任务处理能力。推出了面向开发者的Claude Code(ARR已突破10亿美元)和面向泛化用户的Cowork,探索企业Agent场景 [101][102] - **2026年展望**:预计将提升记忆能力,探索更多Agent泛化场景,让Cowork等产品具备“永久记忆”,成为理解用户的专属智能体 [103][104] 阿里通义千问 - **布局**:布局全模态模型矩阵,打开Agent市场空间 [105]
速递|冲刺“世界模型”:Runway获E轮3.15亿美金弹药,英伟达、Adobe共同押注
Z Potentials· 2026-02-11 12:08
融资与估值 - AI视频生成初创公司Runway完成3.15亿美元E轮融资,公司估值飙升至53亿美元,较之前水平近乎翻倍 [2] - 本轮融资由General Atlantic领投,参投方包括英伟达、富达管理与研究公司、AllianceBernstein、Adobe Ventures、未来资产、Emphatic Capital、Felicis、Premji以及AMD Ventures [4] 战略与资金用途 - 新资金将使Runway能够预训练下一代世界模型,并将其引入新产品和行业 [2] - 公司计划运用新资金将其约140人的团队在研发、工程和市场拓展等岗位进行快速扩容 [4] - 公司近期与CoreWeave签署协议以扩大算力规模,此举可能增强了投资者对其在算力密集型领域运营能力的信心 [3] 技术发展与产品 - Runway以具备物理感知能力的AI视频生成模型闻名,于去年12月发布了其首款世界模型 [2] - 世界模型是一种能够构建环境内部表征的人工智能系统,从而能够对未来事件进行规划,许多顶尖学者认为这类模型对突破大语言模型的局限至关重要 [2] - 公司最新视频生成模型Gen 4.5支持用户通过文本提示生成高清视频,并引入了原生音频生成、长视频生成、多镜头生成、角色一致性保持以及高级编辑工具等功能 [3] - Gen 4.5模型在多项基准测试中表现优于谷歌和OpenAI的视频生成产品,为Runway在人工智能行业赢得了重要信誉 [3] 市场定位与行业竞争 - Runway历史上在传媒、娱乐和广告行业建立了坚实的客户基础,包括近期与Adobe建立合作关系 [2] - 公司在游戏和机器人领域的应用正日益增长 [2] - Runway的战略转型正值世界模型研发竞赛白热化之际,竞争对手包括李飞飞创立的World Labs与Google DeepMind,两家机构近期均已向公众开放其模型 [2] - 公司将世界模型技术视为攻克医药、气候、能源及机器人等领域重大挑战的核心 [2]
22亿,黄仁勋苏姿丰联手,投了一家“世界模型”公司
36氪· 2026-02-11 11:05
公司概况与融资历史 - Runway成立于2018年,由三位纽约大学校友联合创立 [3] - 公司已累计筹集资金8.15亿美元(约合人民币56亿元) [5] - 最近一轮融资发生在2025年4月,规模为3.08亿美元(约合人民币21亿元),参投方包括软银、英伟达等,此轮融资后公司估值突破30亿美元(约合人民币207亿元) [5] 核心产品与技术进展 - Runway以视频生成产品闻名,于2025年12月发布了最新一代视频生成模型Gen-4.5 [5] - Gen-4.5能够生成电影级高逼真度输出,可渲染复杂场景及逼真的物理效果 [5] - 在AI文生视频模型性能排行榜(Artificial Analysis Text to Video Leaderboard)上,Gen-4.5目前排名第三,ELO评分为1,236,超过了谷歌Veo 3、OpenAI Sora 2 Pro、快手可灵2.5 Turbo等模型 [5][6] - 公司在Gen-4.5发布10天后,推出了通用世界模型GWM-1,旨在实现实时模拟现实,并做到交互式、可控、通用 [7] - GWM-1包含三个变体:用于可探索环境的GWM Worlds、用于对话角色的GWM Avatars以及用于机器人操作的GWM Robotics [7] 战略方向与行业竞争 - 公司宣布将新融资用于训练下一代世界模型,并计划将世界模型技术带到新的产品和行业中 [7] - Runway正致力于将许多不同领域和动作空间统一到一个基础世界模型之下 [7] - 世界模型赛道竞争激烈,参与者包括斯坦福大学教授李飞飞创办的World Labs和谷歌DeepMind等 [10] - 行业顶尖研究者认为,世界模型对于突破大语言模型的现有局限至关重要,因其能够构建环境内部表征并对未来事件进行规划 [10] 基础设施与合作伙伴 - 2025年12月,Runway与美国AI云服务提供商CoreWeave达成协议,以扩展其基础设施并扩大计算能力 [9] - 英伟达是CoreWeave的重要财务支持者、主要供应商与主要客户 [9] - 2025年1月,公司借助英伟达Rubin平台推进视频生成和世界模型技术,并且是首批在该平台上展示视频生成模型的团队之一 [9]
Runway完成3.15亿美元E轮融资,估值飙升至53亿美元,推动下一代AI世界模型
钛媒体APP· 2026-02-11 10:14
公司融资与估值 - 2026年2月10日,人工智能视频生成初创公司Runway完成3.15亿美元的E轮融资 [2] - 本轮融资后公司估值达到约53亿美元,较上一轮融资几乎翻倍 [2] - 融资由General Atlantic领投,NVIDIA、Adobe Ventures、AllianceBernstein、AMD Ventures、Fidelity Management & Research Company、Mirae Asset、Emphatic Capital、Felicis及Premji Invest等多家重量级投资者参与 [2] 资金用途与战略方向 - 计划利用本轮融资加速下一代“世界模型”的预训练与产品化进程 [2] - 世界模型是一类能够理解、预测并规划未来事件的AI系统,具备模拟现实世界环境的能力 [2] - 公司正从传统的媒体与广告领域扩展至游戏、机器人等更广泛的应用场景 [3] - 依托与CoreWeave的计算资源合作,持续扩充研发和市场团队,强化基础设施建设,提升模型训练与推理能力 [3] 技术产品进展 - 于2025年12月首次发布其世界模型 [3] - 近期推出了Gen 4.5视频生成模型,支持高分辨率视频的文本驱动生成,具备原生音频、多镜头生成、角色一致性及高级编辑功能 [3] - 正与谷歌DeepMind、李飞飞创立的World Labs等AI巨头展开直接竞争 [3] 行业趋势与市场潜力 - Runway的进展代表了生成式AI向更高层次智能演进的趋势 [4] - 世界模型通过构建对环境的深层理解和预测能力,突破了传统生成模型的局限,推动AI从被动响应向主动规划转变 [4] - 全球AI生成内容市场预计2026年将达到数百亿美元规模,世界模型技术的成熟将进一步催化这一市场爆发 [4] 技术应用前景 - 世界模型在医疗诊断、气候预测、能源管理及机器人控制等多个关键行业拥有颠覆潜力 [2] - 在医疗领域,具备世界模型的AI可模拟疾病发展路径,辅助个性化治疗方案设计 [4] - 在气候领域,可实现更精准的气象预测和环境风险评估 [4] - 在能源管理和机器人领域,则可通过智能调度和自主决策提升效率和安全性 [4] - 随着计算力成本下降和算法突破,世界模型有望成为智能体系统的核心引擎,推动自动驾驶、智能制造、虚拟现实等领域实现质的飞跃 [5] 行业影响与竞争格局 - 此次融资反映了资本市场对Runway技术实力和市场前景的高度认可,也凸显了AI世界模型作为下一代人工智能核心技术的战略价值 [3] - Runway的成功将激励更多创业公司和资本投入到AI基础模型和应用生态建设,促进整个行业的良性竞争与协同发展 [5] - 通过本轮巨额融资加速世界模型研发,Runway正站在AI技术革新的前沿,未来有望引领多行业智能化转型浪潮 [5] - 此次融资标志着AI世界模型技术进入快速商业化和规模化应用的新阶段 [5]
腾讯心动谷歌齐下阵,新一轮AI抢人大战开启
36氪· 2026-02-10 21:04
行业事件与市场反应 - 微信官方发布公告打击第三方诱导分享行为,并屏蔽了元宝红包链接,该话题登上热搜 [1] - 谷歌DeepMind的Genie3模型发布后,引发游戏行业震动,导致Take Two股价暴跌10%、Unity股价重挫27%、Roblox股价大跌13% [2] AI生成游戏工具的技术能力与现状 - Genie3目前生成的内容仅能维持一分钟左右,互动性局限于基本移动和视角转换,且无法导出为可复用的3D资产,本质上是一种“可交互视频” [4] - 该工具最基础的功能是图像生成三维场景,用户上传一张图片,AI即可自动构建完整的3D环境 [8] - 用户可以通过提示词实时修改生成的世界,例如在场景中添加“任意门”等元素,实现“所想即所见” [14] - 该工具现阶段并未向全民开放,访问门槛为每月250美元 [21] AI工具对游戏开发流程的潜在影响 - 对于99%的业余爱好者而言,Genie3提供了“手搓GTA”式的即兴创作乐趣,降低了游戏创作门槛 [6] - 对于专业开发,该工具能帮助策划快速验证想法,传统需协调多部门花费数天制作demo的流程,现在可能缩短至1小时内生成数十个可交互雏形,有助于节约早期沟通与试错成本 [23] - 尽管能快速生成demo,但将demo转化为完整、稳定、能被市场接受的成熟产品仍是主要挑战 [27] 行业竞争与国内探索 - 国内公司正积极布局AI生成游戏领域,心动公司发布了通过自然语言对话辅助创作游戏的Taptap Maker原型 [25] - 蚂蚁集团推出了与Genie3思路类似的“灵波”,聚焦生成可交互场景 [25] - 腾讯推出了“混元3D世界模型”,其优势在于能导出点云文件进行二次编辑 [25] 技术原理与行业意义 - Genie3等工具涉及“世界模型”概念,即AI能对虚拟环境的状态、变化与互动进行推演和生成 [28] - 其技术路径并非追求像素级还原真实物理规律,而是更接近游戏开发逻辑,即构建一个符合自身规则、能让玩家信服的世界 [28] - 与Sora等生成不可交互视频的模型相比,Genie3允许用户实时进入生成的世界并进行修改,在构建可互动虚拟世界上更进一步 [29] - 围绕Genie3的讨论,深层反映了行业对创作方式变迁的敏感,资本的反应是对趋势的试探与布局,而工具民主化为普通用户带来了新的创作可能 [32]
独家对话极映科技高鑫:我们为什么要做一个比Sora难10倍的物理世界模型?
新浪财经· 2026-02-10 20:40
行业趋势与资本动态 - 资本正就AI时代预测物理世界的能力重新定价达成共识,这体现在2025年7月新思科技以350亿美元收购仿真巨头ANSYS,以及同期PhysicsX、Neural Concept等AI工业软件公司完成1亿美元级融资 [2][3][74][75] - 在半导体、航空航天等关键领域,传统物理仿真范式效率低下,一轮复杂计算往往耗时数日,工程师大量时间被困在网格划分与参数调试中 [4][76] 公司概况与融资情况 - 物理世界模型公司极映科技连续完成了数千万元的种子轮及天使轮融资,种子轮由奇绩创坛投资,天使轮由元禾璞华领投,未来光锥跟投 [5][77] - 公司由三位技术老兵创立,团队积累了超过30年的物理仿真与软件研发经验,配置精准覆盖了对仿真要求最苛刻的半导体与航空航天领域 [6][78] 技术路径与核心创新 - 公司选择了一条更窄、更硬的路径:跳出传统流体、结构、热学等物理场割裂的体系,回归质量与能量守恒的底层定律,让AI直接学习偏微分方程的共性,以补上世界模型中缺失的物理内核 [8][80] - 相比传统仿真数值方法,公司的物理世界模型将反馈周期从“天”压缩至“秒”,响应速度百倍于传统仿真 [9][82] - 公司技术路线的本质是范式替换,即用神经网络直接完成物理求解过程,而非像传统仿真巨头那样仅将AI作为提升易用性的“副驾驶”或“使用助手” [52][125] 产品性能与验证 - 在FDA血流泵案例中,AI仿真与传统数值仿真的结果R²大于0.99,在统计意义上高度一致,具备一定程度的可替代基础 [30][31][103][104] - 公司最推荐的落地场景是设计方案的快速比选与筛选,可先用AI模型从上百种候选方案中快速筛选出三到五种更优方案,再用传统软件进行最终精细验证 [26][99] - 模型的速度优势主要来自神经网络前向推理的范式本身,而准确性则依赖于自研的模型架构和极高的数据质量 [33][106] 发展阶段与未来目标 - 公司模型正从1.0版本的小样本微调阶段,走向2.0版本的零样本通用阶段,2.0版本目标是覆盖90%以上的常见物理仿真场景,实现开箱即用 [38][39][111][112] - 创始人认为物理仿真领域目前大约处于GPT-3.0水平,公司计划在年底发布的2.0版本目标是将之推进到接近GPT-3.5的水平,迎来工程领域的“GPT-3.5时刻” [40][113] 商业化战略与进展 - 公司不将自己定义为“卖软件的公司”,而是提供仿真能力的基础设施,商业模式类似大模型,包括按次付费或API调用 [58][131] - 公司判断在仿真赛道盈利的时间窗口会明显早于通用大模型,原因是工业客户付费能力强、客单价高,且模型算力消耗远低于通用大语言模型 [59][60][132][133] - 商业化落地首选半导体行业,目前已经产生了一些收入,主要是按项目收取的验证费用,单价在几十万元量级 [62][135] 团队与竞争壁垒 - 公司的核心壁垒在于在“AI+物理仿真”方向上接近十年的认知和判断积累,这是难以被快速复制的核心资产 [54][127] - 跨学科的团队组合(AI与仿真背景结合)具备快速定位和判断问题的能力,支撑了公司在早期推倒重来、完全自研算法架构的关键决策 [50][123]