Workflow
世界模型
icon
搜索文档
汽车业AI“狂飙”,“轮式智能生命体”即将到来
华夏时报· 2025-09-25 15:58
行业宏观背景与政策导向 - 国务院发布《关于深入实施"人工智能+"行动的意见》,提出到2027年人工智能与实体经济深度融合取得显著成效的目标,为汽车产业等重点领域指明发展方向 [2] - "全球AI科技大会"的举办被视为观察行业如何响应国家战略、探寻AI落地路径的重要窗口 [2] - 汽车行业面临技术路线快速演进与产业格局深刻重塑的双重变革 [2] 汽车产品形态的进化方向 - 未来汽车将从一个信息孤岛进化成能思考、会学习、懂合作的"轮式智能生命体" [2] - 汽车将成为智慧城市交通网络中的活跃节点,能与道路、云端、其他车辆实时"对话",共同编织安全、高效、绿色的出行网络 [2] - 具体应用场景包括车辆提前接收红绿灯配时信息,自动平滑车速实现"绿波通行",以省时省电并缓解拥堵 [4] 智能驾驶技术发展路径 - 文远知行CEO提出"L3是简化的L4,而不是复杂的L2"的观点,认为L3的"心智"成熟度更接近完全自主的L4 [4] - 商汤科技阐述"世界模型"可推动自动驾驶在数据瓶颈、验证技术边界和通过强化学习超越人类驾驶体验三方面取得突破 [4] - Momenta分享基于强化学习技术的R6飞轮大模型能够实现超越人类老司机的安全水平 [4] 中国智能电动车市场核心趋势 - 汽车之家研究院报告提出影响市场未来发展的五大核心趋势:智驾平权启动、AI大模型上车、智能座舱体验升级、超充等新兴配置成关键、RoboTaxi商业化加速 [6] - 智能化已取代传统认知成为用户选购新能源车的首要因素,认为"智能化是新能源车核心优势"的用户比例从30%大幅提升至73% [7] - 产业竞争格局正从传统的性能、配置比拼转向以智能化体验为核心的生态体系竞争 [6] 行业竞争规则与价值锚点的转变 - 行业已从电动化上半场进入以AI为主导的智能化下半场,价值锚点正在从"马力"转向"算力",从"配置表"转向"体验流" [7] - 消费者与汽车的关系进入"双向选择"新阶段,未来4S店试驾将转变为用户主导的、近乎严苛的"能力测试" [8] - RoboTaxi等"随需所用"的出行模式可能对传统汽车销售逻辑带来冲击,促使车企思考向"智慧出行服务"提供者转型 [7] 技术发展中的挑战与建议 - 报告显示高达85%的被测车型在辅助驾驶过程中出现过需人类紧急接管的危险场景,安全信任是根本前提 [8] - 行业建议跳出参数和价格内卷追求核心技术突破,从"单车智能"向"产业智能"拓展,加强开放合作构建共赢生态,守住安全与伦理底线 [8] - 汽车之家凭借数据资产优势与自研大模型,正通过AI技术系统性解决汽车消费体验与经营效率的结构性痛点 [9]
周鸿祎:语言是最重要的,语言掌握了就一通百通
新浪科技· 2025-09-24 13:09
责任编辑:江钰涵 新浪科技讯 9月24日下午消息,今日,罗永浩与周鸿祎深度对谈,周鸿祎表示,Meta的杨乐坤说要做什 么世界模型,李飞飞为什么要做世界模型?我觉得他们弄错了一个问题,就是语言是最重要的。因为人 类拿语言来干这么几件事,一个是来交流,一个是来做知识的传承,第三是做逻辑的推理,还有来描述 这个世界。其实通过语言,基本上你这个世界模型就能了解了。原来人工智能之所以不能取得进展,就 是因为没有了解语言这个金钥匙。一旦把语言了解了,就意味着对人类的知识了解了,对人类的世界能 有了解了,对人类的这个推理能力有了解了,就一通百通。 最近你看Google新出了一个叫nano banana的产品。他为什么很惊艳,就是说他对图形的理解超越了视 觉,他还是加了很多知识的这种融会贯通。所以为什么语言一旦突破,你看什么音乐模型、视频模型、 这种图形模型、视觉模型都获得很大的进展。(罗宁) ...
打算招聘几位大佬共创平台(4D标注/世界模型/VLA等方向)
自动驾驶之心· 2025-09-24 07:32
QS200以内高校,硕士及以上学历,手握顶会的大佬优先。 待遇说明 自动驾驶资源共享(求职、读博、出国留学推荐等); 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 业务合伙人 自动驾驶之心业务合伙人招募来啦!我们团队今年计划向国内外招募10名优秀的合伙人,负责自动驾驶相 关课程研发、论文辅导业务开发、硬件研发; 主要方向 如果您是大模型/多模态大模型、扩散模型、VLA、端到端、具身交互、联合预测、SLAM、3D目标检测、 世界模型、闭环仿真3DGS、大模型部署与量化感知推理等方向,欢迎加入我们; 岗位要求 丰厚的现金激励; 创业项目合作与推荐; 联系我们 更多欢迎添加微信咨询,备注" 机构/公司 + 自动驾驶合作咨询 "。 ...
3DGS重建!gsplat 库源码解析
自动驾驶之心· 2025-09-24 07:32
作者 | 微卷的大白 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/1952449084788029155 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 前两天看到李飞飞 Worldlabs 新工作Mrable的时候,提到后面想多看一看 3DGS / 重建相关的工作。 不过如果真的有小白要踩坑 ,gsplat 的文档和维护其实比gaussian-splatting 要稍微好一些,个人更推荐这个库。 相比3DGS 论文对应的 gaussian-splatting 库,nerfstudio-projectgsplat 是对官方库做了一些优化,可参考https://docs.gsplat.studio/main/migration/migration_inria.html 的 说明。 但是知乎搜了一下发现,讲 3DGS 论文原理、改进的不少,我自己上半年也回顾过cuda kernel 源码:重温经典之 3DGS CUDA 源码解析 ,但是另一个常用的gsplat ...
AI技术未来发展趋势预测
搜狐财经· 2025-09-21 21:31
技术突破方向 - 原生多模态大模型采用端到端统一架构,实现文本、图像、音频、3D数据深度融合处理,推理效率提升300% [1] - 世界模型加速落地,成为2025年具身智能的核心技术底座 [1] - AI智能体从知识增强转向执行增强,OpenAI的o1/o3模型已实现复杂任务自主决策,预计到2028年AI智能体将自动化15%企业日常决策 [3] - 模型训练范式革新,后训练阶段Scaling Law成为重点,强化学习优化推理效率,降低50%算力消耗 [4] - 训练转向小数据与优质数据驱动,减少对海量低质数据的依赖,提升模型可靠性 [4] 产业重构趋势 - AI代理深度分析用户行为,提供超个性化产品定制,客户满意度提升40% [6] - 实时决策系统渗透物流、营销领域,企业应对市场波动速度加快3倍 [6] - AI与物理世界深度融合,工业场景人形机器人量产化,端到端模型控制精度达毫米级 [6] - 智能工厂覆盖率超80%,推动制造业研发周期缩短28.4% [6] - 生物医学领域,多模态神经影像AI解码大脑三维结构,阿尔茨海默病预警提前至临床前10年 [6] - 联邦学习连接跨区域医疗数据,肺炎诊断特异性达99.2% [6] 社会融合挑战 - 伦理治理刚性化,负责任AI成为强制标准,可解释性模型在医疗、金融领域强制应用 [8] - 就业结构转型,重复性岗位自动化率超30%,创造型与情感交互型职业需求增长200% [8] - 人类创造力与AI执行力成为主流协作模式 [8] - 隐私与版权新机制普及,区块链赋能的AI数据确权技术解决生成内容版权归属争议 [8] - 差分隐私、联邦学习保护个人数据,用户隐私控制权立法强化 [8] 未来十年关键里程碑 - 2027年通用人工智能在封闭场景通过图灵测试 [12] - 2030年神经形态芯片量产,能效比提升1000倍 [12] - 2035年AI贡献全球GDP增长超40% [12]
打算招聘几位大佬共创平台(世界模型/VLA等方向)
自动驾驶之心· 2025-09-21 14:59
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 业务合伙人 创业项目合作与推荐; 联系我们 岗位要求 QS200以内高校,硕士及以上学历,手握顶会的大佬优先。 待遇说明 自动驾驶资源共享(求职、读博、出国留学推荐等); 丰厚的现金激励; 自动驾驶之心业务合伙人招募来啦!我们团队今年计划向国内外招募10名优秀的合伙人,负责自动驾驶相 关课程研发、论文辅导业务开发、硬件研发; 主要方向 如果您是大模型/多模态大模型、扩散模型、VLA、端到端、具身交互、联合预测、SLAM、3D目标检测、 世界模型、闭环仿真3DGS、大模型部署与量化感知推理等方向,欢迎加入我们; 更多欢迎添加微信咨询,备注" 机构/公司 + 自动驾驶合作咨询 "。 ...
无需训练的世界模型?西湖大学WorldForge开启空间智能新路径,让AI读懂3D世界
量子位· 2025-09-21 14:36
文章核心观点 - 西湖大学AGI实验室提出的WorldForge框架通过推理时引导策略实现视频生成的高精度时空控制 绕开传统微调或重训模型的高成本路径 为可控世界模型提供新研究方向 [1][8][14] 技术原理与架构 - 采用步内递归修正(IRR)模块 通过预测-校正微循环在去噪过程中逐步消除轨迹偏离 确保生成内容遵循预设运动轨迹 [4][5] - 流门控潜在融合(FLF)模块通过光流得分分离运动与外观特征 将轨迹信号精准注入高运动相关度通道 避免破坏画面质感 [6] - 双路径自校正引导(DSG)模块利用引导路径与非引导路径的输出差异生成校正项 同时保证轨迹精确性与画面质量稳定 [7] 应用场景与性能 - 支持单视图生成3D静态场景 仅需一张照片即可重建三维场景并生成360°环绕视频 [9] - 实现视频电影级重运镜 允许用户自由设计镜头轨迹智能补全新视角场景 效果领先需大量训练的SOTA模型 [11] - 具备视频内容二次创作能力 包括主体替换、物体擦除/添加及虚拟试穿等编辑功能 [12] 行业意义与创新 - 为视频生成领域提供不修改模型权重、即插即用的引导策略 降低技术与资源门槛 [1][14] - 通过推理时引导结构化模型内部世界知识 为可控世界模型构建开辟低训练成本新路径 [8][14]
开放几个自动驾驶技术交流群(世界模型/端到端/VLA)
自动驾驶之心· 2025-09-21 00:03
欢迎大家加入一起交流相关的内容。感兴趣的同学欢迎添加小助理微信进群:AIDriver005, 备注:昵称 +方向加群。 自动驾驶之心技术交流群成立了,开学季&秋招期我们开放了几个技术交流群(世界模型/端到端/VLA等方 向)。 ...
黄仁勋随特朗普访英:26亿美元下注英国AI,智驾公司Wayve或获5亿美元加码
搜狐财经· 2025-09-20 17:57
投资与合作 - 英伟达宣布在英国投资20亿英镑(约合26亿美元),以催化英国的人工智能初创企业生态系统 [1] - Wayve有望获得英伟达5亿美元的投资,双方已签署投资意向书 [1] - 英伟达曾于2024年5月参与Wayve的10.5亿美元C轮融资,其他投资者包括软银和微软 [2] 公司技术与产品 - Wayve的下一代Gen 3硬件平台将完全基于英伟达的DRIVE AGX Thor车载计算平台打造 [1] - 公司采用具身人工智能和端到端深度学习模型的技术路线,是世界上首家在公共道路上部署端到端深度学习驾驶系统的公司 [3][8] - 其AV2.0架构旨在实现通用化、可全球扩展的自动驾驶,区别于传统模块化的AV1.0系统 [8] - 为解决端到端模型的可解释性问题,公司开发了LINGO-2模型,这是一个闭环视觉-语言-动作驾驶模型,能解释其行为原因并接受自然语言指导 [10][12] - 为解决数据需求挑战,公司开发了视频生成世界模型GAIA-2,用于生成逼真且可控的驾驶场景视频以训练模型 [14][16] - 其人工智能驾驶系统不依赖高精地图,并具有硬件无关特性,能够兼容不同类型的传感器和车辆平台,已在美国、德国和日本等地进行测试验证 [19][20] 公司背景与团队 - Wayve于2017年由亚历克斯·肯德尔和阿玛尔·沙阿在英国剑桥大学附近创立 [3] - 联合创始人兼首席执行官亚历克斯·肯德尔拥有剑桥大学深度学习与计算机视觉方向的博士学位,其研究是公司创立的基础 [21] - 公司高管团队经验丰富,包括来自Mobileye、Waymo以及曾担任高盛、瑞银顶级汽车行业分析师的专业人士 [25]
任少卿加入中科大......
自动驾驶之心· 2025-09-20 13:35
任少卿职业动态 - AI领域专家任少卿开始在母校中国科学技术大学开班招生 [1] - 任少卿曾任Momenta联合创始人、蔚来汽车副总裁 [4] 任少卿学术背景 - 任少卿为07级中科大本硕博(微软亚洲研究院联合培养) [4] - 任少卿是ResNet和Faster R-CNN作者 [4] - 学术高被引超44万,是全球中国籍学者高被引第一 [4] - ResNet是21世纪全球最高被引论文 [4] - 曾获未来科学大奖-数学与计算机科学奖 [4] 招生信息 - 招生方向为AGI、世界模型、具身智能、AI4S等 [6] - 硕士、博士生都在招 [6] - 有推免资格的学生将于下周一(22日)开启紧急面试 [6]