Workflow
强化学习
icon
搜索文档
对话小马智行王皓俊:Robotaxi正进入1到1000的阶段
华尔街见闻· 2025-12-20 13:31
作者 | 周智宇 编辑 | 张晓玲 2025年,全球智驾行业正经历一场范式转移。过去十年,自动驾驶是实验室里的代码游戏,是靠Demo 和PPT堆砌的幻梦;而现在,这门生意正式从虚空坠入实地,开始在财务报表上硬碰硬。 当曾经光环满身的L4独角兽因无法跨越规模生死线而陷入停摆,先行者们已经悄然扣响了盈利的大 门。2025年二季度,百度萝卜快跑在武汉实现收支平衡;11月,小马智行宣布其第七代Robotaxi在广州 实现单位经济模型(UE)转正。 小马智行联合创始人、CFO王皓俊在近期的采访中对华尔街见闻表示,能够在广州实现UE转正,意味 着小马智行在规模上量的过程中,逐渐打磨出一个标准的运营流程,能够赋能给小马智行的合作伙伴。 王皓俊认为,前几年Robotaxi的商业化还更多处于0到1的阶段,现在已经逐渐进入到了一个1到100、1 到1000的阶段。 一张清晰的商业化时间表已经浮出水面:从2025年底冲击千辆级车队,2026年提升至3000辆,到2030年 迈向10万辆规模,Robotaxi将成为人们日常生活的一部分。 商业闭环 这意味着,Robotaxi的竞争主战场已经转移。当单车硬件成本下探至25万人民币的生死 ...
「一脑多形」圆桌:世界模型、空间智能在具身智能出现了哪些具体进展?丨GAIR 2025
雷峰网· 2025-12-20 12:07
" 世界模型解决具身智能相关问题,会不会距离太远? " 作者丨张进 编辑丨 林觉民 在 12 月 13 日举行的第八届GAIR全球人工智能与机器人大会"数据&一脑多形"分论坛上,一场有关"一 脑多形"的圆桌论坛,将整个会场气氛推向高潮,在英诺天使基金 ED 王建明的主持下,浙江大学控制学 院副教授,微分智飞创始人高飞,宁波东方理工大学助理教授金鑫,上海人工智能实验室青年科学家王靖 博三位嘉宾围绕着具身智能、空间智能、世界模型等话题进行了热烈讨论。 通过主持人特有的投资人式、抽丝剥茧的提问,围绕着几位学者的研究和创业方向,我们可以了解到当下 最火热的世界模型、空间智能在具身智能领域的研究进展和细节,从而得以穿透资本笼罩在世界模型、空 间智能的迷雾,看到具身智能当下遇到的挑战与机遇。 01 具身智能技术路线仍未收敛 王建明: 三位学者研究的方向都非常不一样,开场先问一个共性的问题热热场,大家怎么看过去两年具身 智能的发展? 高飞: 现在还没到技术路线收敛的时候,还属于探索阶段,这是好事,有发散才有机会。这波具身智能的 热潮,大家本质期待的还是 AI 结合本体能带来的智能性的飞跃。我认为从发散探索到技术路线收敛、到 ...
最近收到了很多同学关于自驾方向选择的咨询......
自动驾驶之心· 2025-12-19 17:25
自动驾驶领域研究方向与人才需求 - 行业收到大量来自计算机、车辆、自动化和机械方向学生的咨询,显示该领域人才需求旺盛且背景多元 [2] - 对于计算机与自动化背景的学生,行业建议主攻深度学习方向,包括视觉语言模型、端到端自动驾驶和世界模型等前沿领域,这些方向被认为从入门到就业乃至深造均有广阔空间 [2] - 对于机械与车辆工程背景的学生,行业建议可从传统规划与控制、3D高斯泼溅等方向入手,这些方向对算力要求相对较低且更易入门 [2] - 行业指出,新人研究者需要经历大量实践与试错才能形成有价值的创新想法,方法论提升的关键在于广泛阅读论文和积极交流 [2] 前沿与细分技术赛道 - 行业关注的前沿研究方向包括视觉语言模型、端到端自动驾驶、强化学习、3D高斯泼溅和世界模型 [2] - 行业认为开集目标检测、占用网络、小样本/零样本学习等是相对竞争不那么激烈的细分赛道 [2] - 行业提供的论文辅导服务覆盖了广泛的技术方向,包括但不限于端到端、视觉语言模型、世界模型、强化学习、3D目标检测、多传感器融合、3D高斯泼溅、鸟瞰图感知、占用网络、多任务学习、语义分割、轨迹预测、运动规划、扩散模型、流匹配、点云感知、毫米波雷达、单目感知以及车道线/在线高精地图 [3] 学术成果与发表支持服务 - 行业提供的论文辅导服务声称具有很高的中稿率,并已有成果被计算机视觉、人工智能、机器人、自然语言处理等领域的顶级会议和期刊收录,例如CVPR、AAAI、ECCV、CoRL、ICLR、IROS、ICRA、ACL [7] - 服务支持发表的论文级别多样,涵盖自动驾驶顶会/顶刊、中国计算机学会推荐的A/B/C类会议期刊、科学引文索引的一至四区期刊、中科院分区的一至四区期刊、以及工程索引和中文核心期刊 [10] - 服务内容全面,包括论文选题、全流程指导以及实验指导 [6] - 服务范围不仅限于学术论文发表,还扩展至毕业设计论文、申请博士以及竞赛支持 [10] - 服务提供针对不同论文级别的差异化定价 [8]
首个文本到3D生成RL范式诞生,攻克几何与物理合理性
量子位· 2025-12-19 15:20
3DGenR1团队 投稿 量子位 | 公众号 QbitAI 在大语言模型和文生图领域,强化学习 (RL) 已成为提升模型思维链与生成质量的关键方法。 但当我们将目光转向更为复杂的文本到3D生成时,这套方法还会还管用吗? 近期,一项由 西北工业大学、北京大学、香港中文大学、上海人工智能实验室、香港科技大学合作 开展 的研究系统性探索了这一重要问 题。 论文链接: https://arxiv.org/pdf/2512.10949 代码链接: https://github.com/Ivan-Tang-3D/3DGen-R1 强化学习是否能够用于Text-to-3D生成,以加强3D自回归模型的逐步推理与生成过程? 在LLM推理和2D文生图中,RL已经证明可以显著提升CoT推理能力和生成质量。但 3D物体更长、更稠密、更具几何约束 。 因此相关方向研究常面临这几个问题: Progressive Investigation:四个层次拆解Text-to-3D+RL 1. Reward设计层 1. 奖励如何同时刻画语义对齐、几何一致性和视觉质量? 2. 现有RL算法是否适合自回归式3D生成? 3. 缺乏专门考察"3D推理能力 ...
亚马逊AGI负责人离职,强化学习大佬Pieter Abbeel接任
机器之心· 2025-12-19 08:21
亚马逊AGI团队高层人事变动 - 亚马逊AGI团队高级副总裁兼首席科学家Rohit Prasad已官宣离职,其于2013年加入公司,曾参与打造Alexa并领导Nova基础模型开发[1][3] - 亚马逊CEO Andy Jassy在公告中认可Rohit Prasad的贡献,指出其推动Alexa成长为一项每天触达数亿用户生活的服务,并领导创建了Amazon Nova及AGI组织,打造了12个业界领先的基础模型,已被数以万计的企业采用[4] - 随着Prasad离职,亚马逊宣布将AI研发职权进一步向云计算部门集中,成立由AWS实用计算高级副总裁Peter DeSantis统一领导的新组织,直接向Jassy汇报[5] 新任领导层与组织架构调整 - Peter DeSantis于1998年加入亚马逊,曾负责革命性的EC2服务及AWS基础设施,其领导的新部门职能涵盖AGI与AI模型研究、自研芯片计划及量子计算[5][6][10] - 顶尖学者Pieter Abbeel将接手前沿AI模型研究团队的领导工作,其是加州大学伯克利分校教授,学术引用量高达23.1万次,也是机器人公司Covariant的联合创始人[7][8][12][15] - Pieter Abbeel领导的伯克利人工智能研究实验室诞生了至少12位知名AI初创公司创始人,其培养的学生已成为AI界的重要力量[16] 亚马逊的AI战略与行业竞争 - 亚马逊一直在努力打破其在AI产品研发方面掉队的印象,为在与OpenAI、谷歌和Anthropic的竞争中加速追赶,推出了自有的基础模型系列Nova[5] - 亚马逊同时研发了自家的Trainium定制AI芯片,直接与英伟达展开竞争[5] - Prasad的离职是AWS近期人事震荡的延续,过去一年中,AI副总裁Matt Wood与生成式AI副总裁Vasi Philomin等资深管理层相继离开[6] 人才流动与公司观点 - 为应对人才缺口,亚马逊积极吸纳新鲜血液,包括前微软高管Julia White出任首席营销官,以及David Richardson、Joe Hellerstein和Chet Kapoor等技术专家入职[6] - AWS首席执行官Matt Garman反对用AI替代初级员工,认为这是最愚蠢的想法之一,并指出2025年调查显示超过55%的初级开发者在日常工作中使用AI,比例远超资深同行[19][20] - Garman强调AI最终创造的职位将多于其取代的职位,拥有扎实核心基础知识的新鲜人才对于填补未来高价值角色至关重要[19]
端到端落地中可以参考的七个Project
自动驾驶之心· 2025-12-19 08:05
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 导航信息、强化学习、扩散模型、自回归、时空联合规划兜底是当下端到端落地中最重要的技术栈。 近期和业内一位招聘朋友聊了聊,他们反馈 头部玩家已经验 证了端到端走的通,其他车企也开始铺 人力和资源跟进。但候选人往往只懂一部分,具体的量产经验如导航信息的引入、强化学习调优、轨迹的建模及优化都有很 多门道,都是实际的落地痛点。 为此我们花了三个月的时间设计了端到端量产进阶课程,七个项目从实战到落地层层展开。 该课程涉及的核心算法包括:一段式端到端、两段式端到端、导航信息的量产应用、开闭环强化学习、扩散模型+强化学习、自回归+强化学习、时空联合规划等 等,最后分享一些实际的量产经验。这门课程是自动驾驶之心联合工业界算法专家开设的《面向量产的端到端实战小班课》!课程只有一个重点:聚焦量产。从一 段式、两段式、强化学习、导航应用、轨迹优化、兜底方案再到具体量产经验分享。面向就业直击落地,所以这门课程目前不打算大规模招生, 仅剩「20名」招生 名额...... 讲师介绍 王路, C9本科+QS50 PhD,已发表CCF-A和 ...
开源首次追平GPT-5!DeepSeek-V3.2:推理与效率兼得
自动驾驶之心· 2025-12-18 17:35
DeepSeek-V3.2 与其同类模型的基准测试结果。 开源模型的三大痛点 要理解DeepSeek-V3.2的突破性,首先需要正视当前开源模型普遍面临的三大核心困境。 从 架构层面 看,传统开源模型大多依赖 标准注意力机制(vanilla attention) ,这种机制在处理长序列文本时,计算复杂度会随序列长度的平方增长 (O(L²)),不仅导致推理速度缓慢,更限制了模型在长上下文场景中的部署与后续训练优化。 点击下方 卡片 ,关注" 大模型之心Tech "公众号 戳我-> 领取大模型巨卷干货 在 大语言模型 (LLM)的发展赛道上,闭源与开源阵营的实力差距曾一度呈现扩大态势。随着OpenAI等巨头持续加码算力与数据投入,其闭源模型在 复杂推 理、工具使用 等核心能力上不断突破;而开源社区虽不乏创新尝试,但受限于架构效率、训练资源等多重因素,在高端任务场景中始终难以望其项背。这种不 平衡的发展格局,让业界对开源模型的上限充满疑虑——开源LLM是否注定只能成为闭源模型的"简化版替代品"? 面对这一趋势,DeepSeek团队并未止步,而是通过系统性技术创新,推出了 DeepSeek-V3.2 。这款兼顾计算效 ...
67页深度 | 智能驾驶行业专题:Robo-X的产业趋势、市场空间和产业链拆解【国信汽车】
车中旭霞· 2025-12-18 09:09
智能驾驶L4系列 车中旭霞 行业深度 《智能驾驶行业专题:Robo-X的产业趋势、市场空间和产业链拆解》——20251215 公司深度 《小马智行(PONY.O)-全球无人驾驶领先企业,Robotaxi商业化落地加速 》——20250628 《文远知行(WRD.O)-全球L4级自动驾驶产品及解决方案先行者 》——20250822 公司点评 《小马智行(PONY.O/2026.HK)-单三季度收入同比增长72%,Robotaxi商业化运营持续推进 》——20251207 《小马智行(PONY.O)-单二季度收入同比增长76%,Robotaxi规模化运营持续推进 》——20250908 《文远知行(WRD.O/0800.HK)-单三季度收入同比增长144%,L4产品商业化落地加速推进 》——20251209 核心观点 E \ = if > ● Robo~X:政策+技术+成本催化下,L4预计在2026年迎元年时刻。监管机构的支持和政策利好将推动无人驾驶汽车的商业化进程,强化学 习+世界模型构建L4技术底层,随着L2/L2+级自动驾驶汽车渗透率持续增长,带动智能驾驶相关的零部件成本下降,而J4和L2/L2+的零部 件 ...
复旦&港大等团队!WholeBodyVLA:面向全身移动操作控制的VLA框架
具身智能之心· 2025-12-18 08:07
点击下方 卡片 ,关注" 具身智能 之心 "公众号 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 现有方法的不足 人形机器人需要精确的移动能力和灵巧的操作技能来完成具有挑战性的移动-操作任务。然而,现有的模块化或端到端方法在"操作感知型移动"方面存在不足。无法 通过规划和执行移动来主动创造操作所需的前提条件(如接近目标、调整姿态、保持稳定),而是将移动和操作视为独立阶段。 ★ 这使得机器人被限制在有限的工作空间内,难以完成大范围移动-操作任务。 ★ 核心挑战在于"操作感知型移动":规划和执行能够主动创造操作前提条件(接近、定向、稳定)的移动,而非将移动和操作视为独立阶段。 一种朴素的解决方案是通过高层规划器序列化移动和操作,在不同技能间切换(如导航与抓取)。然而,有限的闭环反馈和缺乏端到端联合优化可能导致误差累 积,使机器人处于不利于后续操作的次优状态。另一种有前景的方案是端到端框架,直接执行全身控制以缓解模块化pipeline的切换问题,但通 ...
突发,OpenAI大神姚顺雨,任腾讯首席AI科学家
36氪· 2025-12-17 18:21
OpenAI大神姚顺雨,突然入职鹅厂,双重身份曝光,任首席AI科学家,同时兼任AI Infra部、大语言模型负责人。 今天,OpenAI科学家、清华校友姚顺雨入职腾讯,出任首席AI科学家! 个人主页暂未更新 几个月前,全网一则关于姚顺雨去向的爆料,在AI圈掀起涟漪。 如今,这个被反复讨论却始终未被官方正式的消息,终于迎来了大结局。 有媒体报道,腾讯官方宣布,要对内部大模型研发体系,进行一次力度空前的架构升级,其中包括—— 新成立AI Infra部、AI Data部、数据计算平台部,试图从算力、数据到平台能力。 一切行动,就是为了全面夯实大模型「地基」。 与此同时,一直未正式露面的姚顺雨,也首次以官方身份亮相,担任两大职务—— 任CEO/总裁办公室首席AI科学家,向腾讯总裁刘炽平汇报; 兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报 这位AI天才的加入,将为中国大语言模型领域带来怎样的变革? 清华姚班毕业,顶级学霸 姚顺雨本科毕业于清华大学,是姚班出身的典型「学霸」,学业生涯一路闪耀。 初中阶段,他就读于合肥45中,后升入合肥市第一中学。 2014年,他斩获「全国信息学奥林匹克竞赛」( ...