世界模型

搜索文档
模型持续进步,世界模型概念逐步成型
国联证券· 2025-06-08 18:25
报告行业投资评级 - 强于大市(维持)[8] 报告的核心观点 - AI正从“人类数据时代”迈入“体验时代”,未来或进入以智能体为代表、通过与世界直接交互获取经验的阶段 [5][9] - 大模型从大语言模型 - 原生态模型 - 世界模型演变,AGI分为数字世界与物理世界,未来物理世界或出现更多细分垂类模型 [10] - 现阶段大模型能力持续提升,但AI应用未产生大量实际生产应用,AI技术与现实世界应用结合是重点,Agent + 物理世界模型或成趋势主导 [11] - AI技术进步带动模型平权,有望带来算力基础设施建设、端侧AI软件开发、生产力工具革新、行业信息化创新四方面投资机遇 [12] 根据相关目录分别进行总结 图灵奖得主分享 - 2024ACM图灵奖得主Richard Sutton称当前AI大模型训练依赖互联网与人类生成数据,通过人类微调优化,ChatGPT是成功产物,但高质量人类数据几乎耗尽,AI进入“体验时代”,未来或从第一人称经验中学习 [5][9] 大模型演变 - 智源研究院认为大模型从大语言模型 - 原生态模型 - 世界模型演变,AGI分为数字世界与物理世界,传统语言、推理等模型属数字世界,原生多模态、具身智能等属物理世界 [10] 大模型能力与趋势 - 现阶段大模型能力持续提升,在多项测试中展现超越人类的推理能力,但AI应用未大量落地,随着高质量数据枯竭,Agent + 物理世界模型或成趋势主导 [11] 投资建议 - 建议关注AI技术进步带动的产业链机会,包括算力基础设施建设(中科曙光、紫光股份、浪潮信息等)、端侧AI软件开发(中科创达等)、生产力工具革新(金山办公、用友网络、泛微网络等)、行业信息化创新(恒生电子、宇信科技、中控技术、卫宁健康等) [12]
从预训练到世界模型,智源借具身智能重构AI进化路径
第一财经· 2025-06-07 20:41
AI发展趋势 - AI发展速度被低估 技术进步呈现非线性特征 大模型作为基础设施未来将更关注上层应用 [1] - AI重点从大语言模型预训练转向世界模型培育 智源研究院宣布进入"具身智能"探索阶段 [1][3] - 大模型与机器本体深度耦合 推动机器人从1.0时代迈向2.0时代 加速数字与物理世界融合 [3] 世界模型技术 - 世界模型尚无统一定义 智源通过"悟界"系列产品体现技术理解 包括Emu3/Brainμ/RoboOS 2.0等 [3][4] - Emu3实现多模态技术突破 通过视觉tokenizer统一处理图像/视频/文本 简化跨模态知识迁移 [4] - 大模型需突破时空感知隔阂 才能实现数字世界向物理世界的跨越 [4] 底座大模型发展 - 大语言模型性能提升放缓 突破路径包括强化学习/数据合成/多模态数据 [5] - 多模态数据规模可达文字数据百倍至万倍 但利用率低下 成为技术突破重点 [5] - 原生多模态世界模型本质是让AI感知物理世界 通过与硬件结合解决实际问题 [5] 具身智能挑战 - 存在"数据-能力"循环悖论:具身能力不足限制数据采集 数据稀缺又制约模型发展 [6] - 技术路线尚未收敛 不同厂商采用差异化探索方式 智源方案仅为"一家之言" [6] - 跨本体小脑技能未达共识 需通过产业迭代实现硬件标准化 [8] 机器人行业痛点 - 场景泛化能力差 单一机器人难以适应多场景工作需求 [9] - 任务泛化能力差 需搭载不同程序完成同类场景不同任务 [9] - 本体泛化能力差 机器人设计高度依赖特定工作场景 [9] 控制技术现状 - MPC控制技术存在三大局限:仅适用结构化环境/固定流程/预编程任务 [10] - 具身大模型处于GPT-3前探索期 技术路径未统一 产业落地需突破多模态融合等基础问题 [10]
李飞飞的世界模型,大厂在反向操作?
虎嗅APP· 2025-06-06 21:56
公司概况 - 李飞飞创办的World Labs专注于开发具备"空间智能"的下一代AI系统,探索AI对三维世界的理解与重建能力[2] - 公司在短短三个月内完成两轮融资,累计筹集资金约2.3亿美元,估值突破10亿美元,成为AI领域新晋独角兽[2] - 投资方包括a16z、Radical Ventures、NEA、英伟达NVentures、AMD Ventures和Intel Capital等科技与风投界重量级机构[2] 技术方向 - 公司致力于从语言模型向世界建模转变,认为真正的智能需要能理解和构建三维世界[5][8] - 核心技术包括NeRF(从二维图像到三维重建)、高斯平面表示法(快速描绘三维场景)、扩散模型(提升三维内容精细度)以及多视角数据融合技术[17][19][20][21] - 物理仿真与动态建模是另一关键技术方向,使AI能预测物体运动变化[23] - 这些技术组合旨在让AI获得类似人类的空间感知能力[24] 应用场景 - 游戏行业:AI可根据照片或视频自动生成逼真三维世界,替代传统手工建模[25] - 建筑行业:几分钟内生成完整空间立体结构,模拟不同光照效果[26] - 机器人领域:赋予机器人三维视觉,解决二维视觉下的空间判断问题[26] - 数字孪生:为工厂、建筑或城市建立虚拟世界进行预测测试[27] - 创意产业:辅助艺术家、设计师进行空间理解和创作[28][29] 行业挑战 - 数据问题:获取足够多包含深度信息、空间结构的真实场景数据成本高[31] - 算力限制:NeRF等技术计算资源需求大,难以大规模落地应用[32] - 泛化能力:现有模型在陌生场景中表现不佳,需要更强适应性[33] - 需要硬件、软件、数据、应用场景的全链路打通,非单一公司能完成[33] 团队优势 - 团队汇聚计算机视觉、图形学、扩散模型、物理仿真和机器人控制等多领域专家[34] - 采用多学科融合的研究范式,探索AI理解三维世界的新路径[35] - 团队背景多元,能从技术、人文、社会等多角度思考AI发展[37] 未来愿景 - AI终极目标是成为人类在物理世界中的智能延伸,而非替代人类[43] - 医疗、建筑、教育等领域将受益于AI的空间理解和操作能力[44] - 世界模型被视为实现通用人工智能(AGI)的第一步,需具备空间感知、动态推理等能力[46] - 代表AI从语言到世界、从二维到三维的演进方向,重新定义人机关系[47]
“AI教母”李飞飞揭秘“世界模型”:要让AI像人类一样理解三维空间
36氪· 2025-06-06 20:31
公司概况 - World Labs由李飞飞创办,专注于研究前所未有的深度技术,目标是构建能够理解和推理三维物理世界的AI系统[4] - 公司寻找的投资者需具备计算机科学、人工智能、市场和产品等多方面专业知识,并能与创始人展开深度知识对话[4] - 李飞飞认为当前是集结行业资源(计算能力、数据、人才)实现"世界模型"理想的最佳时机[9] 技术方向 - World Labs致力于解决"空间智能"挑战,这是AI理解三维物理世界和虚拟数字宇宙的核心能力[2] - "世界模型"指能全面理解三维世界结构、形态和组成的AI系统,超越语言局限[4][6] - 技术突破点在于让AI具备类人的空间感知能力,这是实现"具身智能"的关键[11] 行业应用 - 创造力领域:将改变设计、电影、建筑和工业产品设计等视觉化和空间化的工作方式[12] - 机器人领域:赋能各类"具身智能机器"在三维环境中与人类协作[12] - 虚拟宇宙:结合生成模型和重建模型,创造"无限宇宙"的新体验[12][13] 技术比较 - 大语言模型存在局限性,无法完美捕捉三维世界的复杂性[6][7] - 3D计算机视觉相比2D具有显著优势,能解决机器人空间操作等实际问题[14] - 空间感知系统在进化史上早于语言系统出现,是更基础的智能组成部分[11] 发展前景 - "世界模型"将重新定义机器人、创意产业和计算本身[2] - 技术成熟后将推动人类突破二维思维框架,进入三维智能新时代[13] - 应用场景涵盖生产力、制造业、工程、社交、旅行等多个领域[12][13]
智源研究院发布“悟界”系列大模型,推动AI迈向物理世界
新京报· 2025-06-06 18:43
智源研究院发布"悟界"系列大模型 - 公司推出"悟界"系列大模型 包括原生多模态世界模型Emu3 脑科学多模态通用基础模型见微Brainμ 跨本体具身大小脑协作框架RoboOS 2 0与具身大脑RoboBrain 2 0以及全原子微观生命模型OpenComplex2 [1][4] - "悟界"模型代表对虚实世界边界的突破 推动人工智能从数字世界迈向物理世界 [3] 大模型技术发展趋势 - 大模型正从大语言模型向原生多模态大模型 世界模型方向演进 目标是让AI感知和理解物理世界 [2] - 提升大语言模型性能的三大路径 强化学习后训练和推理提升 数据合成突破 多模态数据利用 [2] - 多模态数据是文字数据的千万倍以上 目前远未被有效利用 [2] 脑科学多模态模型应用 - Brainμ整合超过100万单位神经信号预训练 支持从基础研究到临床研究和脑机接口应用 [4] - Brainμ在抑郁症 阿尔茨海默病 帕金森综合征预测上超越专用模型 [5] - 公司正与神经科学实验室 脑疾病研究团队和脑机接口企业合作 包括在便携式消费级脑电系统上重建感觉信号 [5] 具身智能发展突破 - RoboBrain 2 0任务规划准确率较1 0提升74% 全链路平均响应时延低于3毫秒 端云通信效率提升27倍 [8] - RoboOS 2 0实现无服务器一站式轻量化部署 机器人部署时间从天级降至小时级 [8] - 当前具身智能面临硬件不成熟 数据短缺 模型能力弱等挑战 形成发展循环悖论 [7] 微观生命模型创新 - OpenComplex2实现生物分子研究从静态结构预测到动态构象分布建模的突破 [9] - 该模型可预测蛋白质构型分布 助力新型治疗方案研发 缩短生物医药研发周期 [9] - 公司构建全球首个高速跨尺度心脏药物安全性评价平台 将药物评价时间从90天缩短至1天 [9]
刚刚,智源全新「悟界」系列大模型炸场!AI第一次真正「看见」宏观-微观双宇宙
机器之心· 2025-06-06 17:36
AI技术发展趋势 - AI技术从理解文字进化到建模世界、操控实体、模拟大脑、解构分子 [1] - 2025年AI领域热点包括DeepSeek R1、OpenAI o3、智能体Manus、英伟达Cosmos世界基础模型等 [2] - 智源大会聚集四位图灵奖得主、三十余位大模型企业创始人及CEO、一百多位青年科学家探讨AI前景 [3] 智源「悟界」系列大模型 - 智源推出全新「悟界」系列大模型,突破虚实边界,向物理AGI迈进 [4] - 「悟界」系列包含原生多模态世界模型Emu3、脑科学模型见微Brainμ、具身智能框架RoboOS 2.0/RoboBrain 2.0、全原子微观生命模型OpenComplex2 [6] - 大模型发展从文图视频主导的数字世界进入物理世界,理解尺度从宏观跨越到微观 [8] 原生多模态世界模型Emu3 - Emu3是全球首个原生多模态世界模型,支持文本、图像、视频、声音、脑信号等多模态统一建模 [12] - 通过新型视觉tokenizer实现多模态同构表征,支持端到端多模态输入输出映射 [14] - Emu3推动AI从单一模态理解向多模态协同跃迁,加速创意生成、智能搜索等应用落地 [14] 脑科学多模态通用基础模型见微Brainμ - 见微Brainμ基于Emu3架构,统一处理MRI、EEG、双光子成像等神经信号,累计处理超100万单位数据 [15] - 支持跨任务、跨模态、跨个体建模,性能超越专用模型,成为神经科学领域的AlphaFold [15] - 具备跨物种能力,兼容人类、小鼠、狨猴、猕猴数据,推动脑机接口技术实用化 [17] 具身智能框架RoboOS 2.0与RoboBrain 2.0 - RoboOS 2.0是全球首个具身智能SaaS平台,支持无服务器轻量化部署,性能提升30%,响应时延压缩至3毫秒以下 [22][24] - RoboBrain 2.0任务规划准确率提升74%,空间推理能力提升17%,新增深度思考与闭环反馈能力 [27][28] - 开源框架降低开发门槛,代码量仅为传统方式的1/10,与全球20多家具身智能企业合作 [24][31] 全原子微观生命模型OpenComplex2 - OpenComplex2突破生命尺度,可预测生物分子静态结构及动态构象分布 [34][35] - 基于FloydNetwork图扩散框架与多尺度原子级精度表示,精准捕捉分子动态特性 [35] - 在CASP16竞赛中唯一成功预测蛋白质T1200/T1300构象分布,推动生物医药研发加速 [36][38] 行业影响与未来展望 - 智源「悟界」系列从语言建模转向世界建模,为多模态、具身智能、AI for Science注入活力 [40] - 四大方向协同布局是认知智能走向具身智能与科学智能的关键一步 [40] - 大模型时代将深入理解与改变世界的系统,不止于提示框 [41]
世界模型有新进展,算力成本、数据质量成关键!数据ETF(516000)多空博弈激烈
每日经济新闻· 2025-06-06 15:11
指数及成分股表现 - 中证大数据产业指数(930902)盘中震荡 成分股石基信息涨停 科华数据上涨2.43% 神州泰岳上涨1.91% 神州信息领跌3.04% 拓维信息下跌2.51% 税友股份下跌1.99% [1] - 数据ETF(516000)最新报价0.92元 近1周累计上涨1.89% 涨幅排名可比基金第一 盘中换手率6.44% 成交额2853.13万元 [1] 人工智能技术进展 - 北京智源人工智能研究院发布"悟界"系列大模型 包含原生多模态世界模型Emu3 脑科学多模态通用基础模型Brainμ 具身大脑RoboBrain 2.0 全原子微观生命模型OpenComplex2 [1] - Emu3为全球首个原生多模态世界模型 基于世界模型的多模态和推理能力 可实现更自然智能的AI交互 [1] 行业应用动态 - 造车新势力积极布局世界模型技术 小鹏 理想 华为 地平线等企业将世界模型作为智能驾驶系统核心技术 [2] - 智能驾驶竞争焦点从车端算力转向云端世界模型构建能力 需提升车载芯片算力 传感器精度 算法研发能力 [2] - 世界模型采用云端训练+车端蒸馏技术提升泛化能力 但规模化落地受算力成本与数据质量限制 [2] 产品跟踪标的 - 数据ETF紧密跟踪中证大数据产业指数 该指数覆盖大数据存储设备 分析技术 运营平台 生产应用等领域上市公司 [2] - 数据ETF场外联接基金包括华夏中证大数据产业ETF发起式联接A/C/D类份额(代码020335/020336/023779) [2]
李飞飞的世界模型,大厂在反向操作?
虎嗅· 2025-06-06 14:26
公司概况 - 李飞飞创办的World Labs专注于开发具备"空间智能"的下一代AI系统,探索AI对三维世界的理解与建模能力[2] - 公司在2024年成立后三个月内完成两轮融资,累计筹集2.3亿美元,估值突破10亿美元成为AI领域独角兽[3] - 投资方包括a16z、英伟达NVentures、AMD Ventures、Intel Capital等科技与风投机构[4] 技术方向 - 核心研究方向为"世界模型",即AI对现实世界的三维理解能力,需结合视觉、空间感、动作等多维度信息[15][18] - 关键技术包括:NeRF(神经辐射场)实现二维图像到三维重建、高斯平面表示法提升实时渲染效率、扩散模型优化空间数据细节[30][33][38] - 需突破多视角数据融合与物理动态建模,使AI能预测物体运动(如风吹树叶、球体滚动)[41][46] 应用场景 - 游戏行业:AI根据照片或视频自动生成逼真三维场景,替代传统手工建模[51] - 建筑行业:几分钟内生成立体结构并模拟光照效果,大幅提升设计效率[53] - 机器人领域:赋予三维视觉能力,解决二维视觉导致的距离判断与导航问题[54] - 数字孪生:构建工厂/城市的虚拟副本用于灾害模拟与优化[56] - 创意产业:辅助艺术家进行空间化创作,成为"创作者伙伴"[59] 行业挑战 - 数据瓶颈:需大量带深度信息与空间结构的真实场景数据,目前获取成本高[63][64] - 算力限制:NeRF等技术计算资源需求大,难以大规模商业化落地[66] - 泛化能力:模型在陌生场景中易失效,需提升适应性[67] - 需跨学科协作整合硬件、软件、数据与应用生态[69] 团队与行业趋势 - World Labs团队涵盖计算机视觉、图形学、扩散模型、物理仿真与机器人控制等多领域专家[73][75] - AI研究范式从单一学科转向多学科融合,需集体智慧推动系统工程[77] - 空间智能被视为实现通用人工智能(AGI)的第一步,需具备空间感知与动态推理能力[94][95]
对话智源研究院院长王仲远:人工智能正加速从数字世界走向物理世界
每日经济新闻· 2025-06-06 13:15
每经记者|可杨 每经编辑|董兴生 6月6日,智源研究院在"2025智源大会"上发布"悟界"系列大模型,宣告其从"悟道"时代迈入"具身智能"探索阶段。 智源研究院院长王仲远在接受《每日经济新闻》记者在内的媒体采访时表示,"AI(人工智能)正加速从数字世界走向物理世界",这是推动其战略升级的根 本逻辑。 王仲远 图片来源:主办方供图 这一判断背后,是AI技术与应用边界的重构。当前,主流大模型大多聚焦在C端文本生成、语言对话等"数字智能"场景,而智源试图将AI推向更具挑战性也 更具想象空间的"现实世界"——包括机器人、操作系统与世界模型的构建。在王仲远看来:"这个世界不需要那么多'博士',更需要能执行任务、能落地的 AI。" "具身智能"正成为下一场AI竞赛的起点。王仲远判断,具身智能的"小组赛"还没结束,远没有到"淘汰赛"。但谁能在这一新赛道率先跑通技术路径、突破数 据瓶颈,谁或将定义人工智能的下一个十年。 从早期的"悟道"系列到如今的"悟界"系列,智源研究院的战略转向并非突如其来,而是"水到渠成"。王仲远坦言:"我们认为人工智能最终要造福人类社 会,要帮助大家摆脱繁琐的、重复的、简单的劳动,使得大家能够更多地享 ...
蔚来-SW(09866.HK):将迎来多款新车交付;改革成效有望逐步兑现
格隆汇· 2025-06-06 10:06
1Q25业绩表现 - 公司1Q25营收120亿元,Non-GAAP净亏损62.8亿元,符合市场预期 [1] - 1Q25交付42,094辆汽车,环比下滑,汽车毛利率环比下降至10.2% [1] - 研发费用31.8亿元,销管费用44.0亿元,环比均有所下滑 [1] - 净亏损主要受季节性因素及产品迭代期影响 [1] 2Q25及全年展望 - 2Q25计划交付7.2-7.5万辆汽车 [1] - 2025年将推出多款新车型,包括ET9、萤火虫首款车型及乐道两款SUV [1] - 公司指引部分车型毛利率有望超过20% [1] - 全年自由现金流有望实现正向流入 [2] CBU改革与费用优化 - 公司启动CBU改革,通过拆分经营单元提升组织效率和销量 [2] - 2Q25研发费用目标控制在20-25亿元,效率提升15% [2] - 销管费用率目标4Q25降至10%左右 [2] 技术进展与产品升级 - 5月30日推出蔚来世界模型NWM首个版本,升级主动安全、高速领航等功能 [3] - 智能硬件预埋为技术迭代提供空间,不同版本车主均可享受最新技术成果 [3] 市场估值与目标价 - 当前美股及港股对应2025年0.6x P/S [3] - 下调港美股目标价15%至41港币/5.3美元,对应2025年0.9x P/S [3] - 港股和美股较当前股价分别有47%/41%上行空间 [3]