世界模型
搜索文档
我们正在寻找自动驾驶领域的合伙人...
自动驾驶之心· 2025-10-22 08:03
业务拓展计划 - 公司计划在2024年向国内外招募10名业务合伙人 [2] - 合伙人将负责自动驾驶相关课程研发、论文辅导业务开发及硬件研发 [2] 重点技术方向 - 公司重点关注大模型/多模态大模型、扩散模型、VLA、端到端自动驾驶、具身交互、联合预测等技术 [3] - 其他关键方向包括SLAM、3D目标检测、世界模型、闭环仿真3DGS、大模型部署与量化感知推理 [3] 合伙人资质要求 - 候选人需来自QS200以内高校并拥有硕士及以上学历 [4] - 拥有顶级会议论文成果的候选人将获得优先考虑 [4] 合伙人待遇与支持 - 提供自动驾驶领域的资源共享,包括求职、读博及出国留学推荐 [5] - 合伙人将获得丰厚的现金激励 [5] - 提供创业项目合作与推荐机会 [5]
锦秋基金领投企业Manifold AI流形空间连获两轮共亿元融资,打造下一代具身智能世界模型|Jinqiu Spotlight
锦秋集· 2025-10-20 20:18
投资事件 - 锦秋基金已完成对Manifold AI(流形空间)的投资 [2] - 锦秋基金是一家12年期的AI Fund,以长期主义为核心投资理念,专注于寻找具有突破性技术和创新商业模式的通用人工智能初创企业 [3] - Manifold AI近期的天使轮融资由锦秋基金领投,同创伟业、英诺天使基金跟投,种子轮由英诺天使基金领投、水木清华校友种子基金跟投,两轮融资共亿元,资金将用于下一代具身世界模型的训练与场景落地 [4] 公司技术与定位 - Manifold AI聚焦世界模型与具身智能,原创的具身世界模型技术旨在推动机器人大脑的规模化落地 [6] - 公司提出WorldScape具身基座世界模型方案,具备Reasoning-Dreaming-Acting三位一体能力,利用海量第一人称视角视频数据进行预训练,有望实现物理空间智能涌现 [10] - 预训练模型能力的提升使得绑定本体的动作映射只需极少量In Context Learning数据即可实现,大幅降低部署成本 [10] - 其技术孵化自清华大学电子系未来智能实验室,是世界范围内首个全域布局室外、室内、空域具身世界模型的团队,相关工作DriveScape、RoboScape、AirScape已发表于CVPR2025、NeurIPS2025、ACM MM2025等顶级会议 [10] - Manifold AI已率先接入NVIDIA Jetson Thor开发者套件用于具身世界模型的本体部署 [12] 行业背景与趋势 - 通用机器人面临本体多、数据少、应用分散的落地困局,基于视觉-语言-动作模型的方案存在预训练精度低、需大量本体数据进行模仿学习的问题 [6] - 海外如Tesla Optimus、Figure AI团队已转向使用海量第一人称视角视频数据的技术路线,从第一性原理出发模拟人类学习过程 [6] - 世界模型技术被视为本质解法,可使互联网上所有第一人称视角视频数据成为机器人学习素材,达到类GPT预训练范式所需规模 [7] - 近期行业进展包括OpenAI发布Sora2视频生成模型周活跃用户达8亿,Google发布Genie3世界模型将物理一致上下文视频窗口拉长至分钟级别,李飞飞World Labs发布RTFM世界模型实现单图实时生成可持久化交互3D空间,NVIDIA Cosmos和Meta V-JEPA2世界模型也在具身场景取得突破 [7] - 世界模型路线能撬动更多网络视频和人类训练数据,具有更大规模化潜力,其时空预测能力驱动交互更符合人类物理直觉 [16] 团队背景 - 创始人兼CEO武伟博士为前商汤科技高管,2015年加入商汤初创,有数百人团队管理经验,曾主导商汤开悟世界模型的研发和落地 [13] - 联合发起人包括清华大学教授、教育部长江学者,在AI模拟和世界模型方向早期整体布局,发表过包括十余篇Nature子刊在内的数百篇学术论文 [15] - 另一位联合发起人为清华大学信息学院助理教授,15岁考入清华,多次入选全球前2%顶尖科学家 [15] - 核心团队成员毕业于清华、北大、上交、港中大、UCLA等高校,曾在快手、Momenta、商汤等企业构建过超千万级用户的AI产品,具备机器人与大模型双重背景 [12] - 团队融合智驾产业落地经验和清华前沿实验室技术资源,是国内探索世界模型方向的先锋 [16]
韩国游戏监管新政落地在即;S15正式开赛
21世纪经济报道· 2025-10-20 11:23
国内公司动态 - 吉比特发布前三季度业绩预增公告,预计2025年前三季度归属于上市公司股东的净利润为10.32亿元至12.23亿元,同比增幅57%至86%,扣除非经常性损益的净利润为10.3亿元至12.2亿元,同比增加68%至99% [2][3][4] - 恺英网络旗下治愈系AI潮玩品牌“暖星谷梦游记”携AI智能玩偶“星之子”系列亮相2025中国玩具展,以“智能玩偶+虚拟游戏”模式切入情感陪伴赛道,面向12-35岁群体 [2][5] - 韩国游戏开发商111%与中国全球性游戏发行商海彼网络计划在新加坡成立合资公司,旨在整合双方核心优势,携手进军全球移动游戏市场 [2][6] 合规监管动态 - 韩国文化体育观光部预告国内代理人制度将于10月23日正式实施,满足条件的游戏企业需指定国内代理人并向游戏物管理委员会报告 [7] - 国内代理人制度旨在推动韩国监管机构改善执法沟通效率,强化外国企业合规执行,但存在处罚单一、震慑力度不足、用户权益保护不足等局限 [7] - 全球游戏产业监管逐渐收紧,游戏出海企业需建立内部机制以第一时间响应监管沟通,并建立前瞻思维关注各国法律动态、政策风向和执法重点 [7] 海外行业动态 - 知名游戏制作人板垣伴信离世,其为《忍者龙剑传》《死或生》系列核心制作人 [8][9] - 马斯克宣布其人工智能公司xAI将依托“世界模型”技术大举布局电子游戏产业,计划在明年年底前推出一款由人工智能生成的优质游戏作品 [10] - Web3游戏工作室Mythical Games获得WLD财库公司Eightco Holdings战略投资,以加速打造世界级娱乐生态系统并在后AGI时代将人类身份带入游戏领域 [11] 电竞赛事动态 - 2025英雄联盟全球总决赛在中国北京开赛,赛事从10月14日持续至11月9日,横跨北京、上海、成都三大城市,共有来自全球五大赛区的17支顶尖战队参赛 [12] - 2025年CFS中国区预选赛于10月16日至26日在重庆举行,采用分组循环加淘汰制,最终四支战队将晋级全球总决赛 [13] - CAC2025在上海开幕,赛事持续至10月19日,总奖金高达100万美元,共有来自全球的16支顶尖战队参赛 [14]
韩国游戏监管新政落地在即;S15正式开赛| 游戏周报
21世纪经济报道· 2025-10-20 11:15
国内公司动态 - 吉比特发布前三季度业绩预增公告,预计2025年前三季度实现归属于上市公司股东的净利润10.32亿元到12.23亿元,同比增幅57%到86%,扣除非经常性损益的净利润10.3亿元到12.2亿元,同比增加68%到99% [2][3][4] - 恺英网络旗下治愈系AI潮玩品牌“暖星谷梦游记”亮相2025中国玩具展,以“智能玩偶+虚拟游戏”模式切入情感陪伴赛道,面向12-35岁群体 [2][5] - 韩国游戏开发商111%与中国游戏发行商海彼网络计划在新加坡成立合资公司,旨在整合双方优势进军全球移动游戏市场 [2][6] 合规监管动态 - 韩国文化体育观光部预告其游戏国内代理人制度将于10月23日正式实施,要求满足条件的企业指定国内代理人并向游戏物管理委员会报告 [7] - 国内代理人制度被点评为可改善执法沟通效率并强化外国企业合规执行,但也存在处罚单一、震慑力不足及用户权益保护不足等局限 [7] - 点评指出全球游戏产业监管呈收紧趋势,建议出海企业建立内部响应机制并关注各国法律政策动态以应对风险 [7] 海外行业动态 - 知名游戏制作人、《忍者龙剑传》《死或生》系列核心制作人板垣伴信离世 [8] - 特斯拉首席执行官埃隆·马斯克宣布其人工智能公司xAI将依托“世界模型”技术进军电子游戏产业,并承诺在明年年底前推出一款AI生成的优质游戏 [9][10] - Web3游戏工作室Mythical Games宣布获得WLD财库公司Eightco Holdings的战略投资,以加速打造娱乐生态系统并在游戏中引入人类身份验证 [11] 电竞赛事动态 - 2025英雄联盟全球总决赛(S15)于10月14日在中国北京开赛,赛事持续至11月9日,横跨北京、上海、成都三大城市,有来自全球五大赛区的17支战队参赛 [12] - 2025年CFS(穿越火线世界总决赛)中国区预选赛于10月16日至26日在重庆举行,采用分组循环加淘汰制,最终四支战队将晋级全球总决赛 [13] - 由完美世界电竞主办的CAC 2025(CS亚洲邀请赛)于10月14日在上海开幕,赛事持续至10月19日,总奖金为100万美元,有来自全球的16支顶尖战队参赛 [14]
OpenAl为何“情迷”变现
虎嗅APP· 2025-10-20 08:09
OpenAI与xAI的战略路径分化 - OpenAI计划于12月推出允许经过验证的成年人观看色情内容的功能,践行“像对待成年人一样对待成年用户”的原则[4] - 同样涉足AI伴侣领域,但OpenAI与埃隆·马斯克的xAI在追逐AGI(通用人工智能)的战略和产品思路上呈现出不同风貌[4] - OpenAI倾向于让AI通过集成和使用现有第三方工具(如Canva、Deep Research)来学习和进化,旨在构建一个处理人类在计算机上几乎所有任务的“超级App”[6] - OpenAI追求快速商业化以在竞争中站稳脚跟,例如效仿Apple推出免费试用,核心目标是赢得并留住用户[7] - 为应对用户对模型人性化体验下降的批评,公司计划推出行为更接近GPT-4o的新版ChatGPT,并曾将GPT-4o重新作为选项推出[9][10] - 公司对ChatGPT施加了严格限制以谨慎处理心理健康问题,并推出了工具以更好地检测用户的精神困扰状态[10] - 针对相关争议,OpenAI宣布成立由八名科技与心理健康领域专家组成的“福祉与人工智能”委员会,以协助处理复杂或敏感状况[14] xAI的“世界模型”技术路线 - xAI正在开发可用于电子游戏与机器人领域的“世界模型”,并从NVIDIA挖走了相关研究人员[4] - “世界模型”是一种能在内部重建并预测环境状态变化的模型,其理念是让AI不只是理解数据,而是在心智中模拟世界的演化[5] - xAI认为真正的智能必须理解物理世界的运作规律,因此选择从“世界模型”这一更底层的技术切入,让AI学会在虚拟环境(如游戏)和现实世界(如机器人)中预测和推理[6] - 马斯克追求AI与物理世界的深度融合,这与他在自动驾驶、机器人、高度拟真虚拟世界等领域的长期耕耘一脉相承[7] - 对xAI而言,游戏和具身智能是天然的试验场,AI可以在游戏中无数次试错,具身智能则提供真实的物理反馈[15] 行业竞争与用户反馈 - 用户批评ChatGPT在采用GPT-5作为默认模型后失去了人性化交互体验,甚至产生心理依赖断裂[10] - 有用户表示ChatGPT过去更像一个能实实在在聊天的人,现在变成了合规机器人,并担忧未成年用户可能无意中看到成人内容[13] - 外界持续呼吁OpenAI为有自杀倾向的用户增设额外保障措施[14] - AGI的竞赛不仅是技术之争,更是理念、哲学与责任感的全面较量[15]
OpenAl为何“情迷”变现
虎嗅· 2025-10-19 11:56
OpenAI内容策略调整 - 公司计划于12月推出成人内容 允许经过验证的成年用户观看色情内容 [1] - 公司将践行“像对待成年人一样对待成年用户”的原则 在实施适当年龄验证和控制后允许开发者创建“成熟”的ChatGPT应用 [1] - 公司计划推出新版本ChatGPT 其行为更接近用户喜欢的GPT-4o模型 [7] OpenAI产品体验与用户反馈 - 公司将GPT-5设为默认模型后 用户批评其失去人性化交互体验并产生心理依赖断裂 公司随后将GPT-4o重新作为选项推出 [8] - 公司对ChatGPT设置了严格限制以确保谨慎处理心理健康问题 但承认这使得聊天机器人对许多没有心理健康问题的用户变得不那么有用或无趣 [8] - 部分用户反馈ChatGPT过去更像能聊天的人 现在变成了合规机器人 另有用户担忧未成年子女可能无意中看到成人内容 [9] OpenAI治理与争议应对 - 公司宣布成立“福祉与人工智能”委员会 由八名科技与心理健康领域专家组成 旨在协助处理复杂或敏感状况 [10] - 有媒体指出该委员会未纳入自杀预防专家 外界持续呼吁公司为有自杀倾向的用户增设额外保障措施 [10] xAI与OpenAI技术路径对比 - xAI专注于开发“世界模型” 该模型能在内部重建并预测环境状态变化 使AI能在心智中模拟世界演化 [2] - xAI从NVIDIA挖走研究世界模型的Zeeshan Patel与Ethan He 认为真正的智能必须理解物理世界运作规律 选择从更底层技术切入 [2] - OpenAI战略倾向于让AI在使用现有工具和服务过程中学习进化 通过接入不同功能应用让AI学会调用合适工具 [3] - xAI追求AI与物理世界深度融合 OpenAI则着手集成第三方应用构建生态 目标是成为处理人类计算机任务的“超级App” [3] 公司背景与商业化策略差异 - 马斯克在自动驾驶、机器人、虚拟世界等领域早有耕耘 向物理世界和具身智能延伸是自然选择 [4] - 奥特曼作为后来者 需要通过整合现有数字工具并快速提升工作效率 在激烈AI竞争中立足 [4] - OpenAI追求快速商业化以站稳脚跟 而马斯克多次公开批评OpenAI过度商业化 [5] - ChatGPT已推出免费试用 在推动技术普及的现象之下 公司核心目标是赢得并留住用户 [5] 行业竞争格局 - AGI竞赛不仅是技术之争 更是理念、哲学与责任感的全面较量 [10] - xAI将游戏和具身智能视为天然试验场 AI可在游戏中试错 具身智能提供真实物理反馈 [10] - OpenAI在集成工具优化世界 xAI的野心是用AI演绎并改变世界 [10]
某新势力多位智驾高管离职......
自动驾驶之心· 2025-10-19 00:03
公司核心人员变动 - 蔚来智能驾驶产品负责人黄鑫于国庆节前离职,其于2022年加入公司并担任副总裁,直接向首席执行官汇报,负责智驾产品体验业务[4][6] - 人工智能平台负责人白宇利与世界模型负责人马宁宁于近期离职,白宇利2020年入职,职级为资深总监,马宁宁团队主导了世界模型1.0版本的全量推送[4][7][8] - 算法核心负责人樊昊阳已于四月份离职,其主导研发的端到端Planner模型显著提升了公司NOP+系统的实时决策能力[4][9] 公司组织架构与战略调整 - 公司回应此次人员变动为主动的组织架构调整,旨在强化对通用人工智能技术的吸收并加速智能驾驶体验交付[11] - 调整后构建了预研、量产、平台复制、车型复制的「4×100接力棒」模式,将智能驾驶组织与通用人工智能组织并轨[11] - 组织架构调整旨在全力冲刺世界模型2.0版本的开发与交付,预计从今年底到明年一季度陆续在多个平台推出迭代版本[11][13] 公司技术发展方向 - 公司技术战略以世界模型为主,旨在打通自动驾驶时空认知能力,认为真正的技术上限在于以视频为核心,学习时空和物理规律的世界模型[11] - 世界模型2.0的开发将引入语言能力,目标是实现像人一样的开放式交互,构建Open-set智能引擎[11] - 行业层面,近期多家主机厂与新势力公司在组织架构上均有大动作,预示下一轮智能驾驶质变时刻的前兆[14]
李想: 特斯拉V14也用了VLA相同技术|25年10月18日B站图文版压缩版
理想TOP2· 2025-10-19 00:03
OpenAI人工智能五阶段定义 - 聊天机器人阶段的核心是基座模型,功能为压缩人类已知数字知识,类比人类从小学到大学的教育过程[13][14] - 推理者阶段具备思维链和连续性任务能力,依赖SFT和RLHF训练,类比人类读研或师傅带教的经验传授[15][16] - 智能体阶段AI开始实际工作并使用工具完成长任务,对专业性和可靠性要求极高,需达到80-90分合格标准[17][18] - 创新者阶段通过出题解题进行强化训练,需要世界模型和RLAIF模拟真实环境,类比职业选手上万小时实战训练[19][20] - 组织者阶段负责管理大量智能体和创新者,防止失控风险,类比企业管理者职能[21] 人工智能发展路径与算力需求 - 预训练基座模型不需要每家企业自研,类比不需要每家企业都开办大学[5][21] - 智能体阶段需要推理能力,机器人设备需要端侧推理,世界模型阶段需要海量云端推理建立数字孪生[6][22] - 未来5年推理算力需求可能扩大100倍,训练算力需求扩大10倍,端侧和云端算力需求都将显著增长[7][23] 理想汽车AI技术布局 - 公司自研技术包括推理模型(MindVLA/MindGPT)、智能体(司机Agent/理想同学Agent)和世界模型[8][24] - 2026年将为自动驾驶配备自研端侧芯片,实现车与AI深度融合[9][26] - V14证明特斯拉使用VLA相同技术,具备空间完整理解能力和长任务多任务处理能力[39] 机器人发展路径 - 机器人发展存在两条路径:将现有工具改造为机器人,或开发人形机器人操作万物[27][28] - 工具改造路径效率更高,如将炒菜工具直接机器人化而非使用人形机器人炒菜[27][28] 人类与AI的协同发展 - 训练目的为提高成功率,可参考一万小时训练理论,核心训练信息处理能力、出题解题能力和资源分配能力[9][32] - 人类需在AI遵循最佳实践训练背景下,要么理解并管理AI,要么与AI协同工作,否则面临被替代风险[30][37] - 信息处理能力训练重点在于识别关键信息并过滤无效信息,不同专业领域信息处理方式各异[33] - 资源分配能力训练关键在于有限资源的高效分配,人类大脑通过高效资源分配实现低功耗高效益[35][36] AI工具应用偏好 - 公司偏好使用Grok的对话方式,因其回答简单干脆,相较国内模型更直接利索[41] - 支持上班族使用AI撰写汇报,认为使用先进工具是人类与其他生物的最大区别[42]
专访信通院孙鑫:大模型快速迭代需软硬件深度协同
21世纪经济报道· 2025-10-18 09:13
人工智能发展趋势 - 基础大模型迭代速度加快,多模态模型理解能力整体提升90%,TOP1模型迭代周期从去年的几个月缩短至几周 [2] - 软硬件深度协同、高效融合成为大模型研发新范式,极致的软硬协同是支撑大模型快速迭代的关键 [1][3] - 智能体成为大模型应用的主要形态,加速形成智能体经济 [1][3] - 开源带动“群体进化”和人工智能普惠发展,极大降低了大模型落地应用的门槛 [3] 模型能力增强方向 - 语言基础超级模型深度集成多种能力,模型推理能力成为衡量模型的重要指标 [5] - 多模态大模型深度融合理解和生成能力,原生多模态架构逐渐走向成熟 [5] - 世界模型加速构建数据生成、动作解释、环境交互、场景重建四类核心能力,是AI通向AGI的关键基石 [5][6] - 具身智能以突破具身图灵测试为目标,实现生物级感觉运动能力 [6] 智能体技术发展 - 智能体是数字员工的初级形态,能够自主完成复杂任务并获得比单一模型更好的性能表现 [2][5] - 推动互联互通和长难任务处理是当前智能体技术创新的主旋律 [2][10] - 智能体完成任务的长度大约每7个月翻一番,未来将能独立完成人类需数天或数周的任务 [11] - 通信协议如MCP、A2A成为智能体与外界交互的“桥梁”,可降低系统集成复杂性 [10] 人工智能行业应用 - 人工智能赋能行业遵循从数字化水平较好领域率先突破,再逐步扩散的规律 [12] - 互联网等数字原生领域凭借数据沉淀和基础设施优势,率先形成AI应用规模化落地 [12] - AI正逐步向金融、医疗、交通等数字化程度较高行业渗透,并在自动驾驶等领域实现新突破 [13] - 推进行业应用需关注行业水平与转型路线、技术能力与实际需求两方面的协调统一 [2][13]
“AI教母”,公布最新世界模型
财联社· 2025-10-17 20:28
世界模型RTFM的技术突破 - 李飞飞团队发布全新世界模型RTFM,能够实时生成交互式三维世界[2] - 模型设计围绕效率、可扩展性和持久性三大原则,仅需单块H100 GPU即可渲染持久一致的3D世界[2] - 实现4K+60FPS交互式视频流,传统架构需每秒生成超过十万个token,相当于一本《弗兰肯斯坦》的文本量,当前算力下经济上不可行[2] AI算力成本与需求趋势 - 降低算力成本成为硬件厂商重要议程,OpenAI与博通战略合作部署10吉瓦AI加速器,形成英伟达、AMD、博通多元算力体系以倒逼成本下降[3] - 尽管模型效率提升,但算力总需求预期未减,存在“杰文斯悖论”,即效率提升反而增加总消耗量,例如DeepSeek R1性能增强但算力需求持续增长[4] - 预计针对更大推理预算的更大型模型将继续改进,未来算力需求增长预期稳固[3] 世界模型的行业进展与意义 - World Labs在9月发布世界生成模型Marble,可通过单张图片或文字生成3D世界,相比前代实现更优几何结构和更多样化风格[4] - 世界模型的意义在于不仅能理解推理文字信息,还能理解推理物理世界的运作规律[4] - 行业公司积极布局,xAI从英伟达挖来专家,Meta、谷歌加注世界模型,国内宇树、智元等机器人厂商也已开源其世界模型[4] 算力基础设施的估值逻辑 - 算力更便宜易得时,开发者会将更复杂模型系统作为新基准,提升参数量、上下文与并行度[5] - 模型架构迭代可能减小单次推理训练算力,但如Genie3等生成视频的世界模型需跨数量级算力提升才能满足[5] - AI算力更高的天花板和更好的竞争格局将支撑其相对4G/5G的更高估值框架和更强Beta[5]