Workflow
世界模型
icon
搜索文档
汽车业AI“狂飙”,“轮式智能生命体”即将到来
华夏时报· 2025-09-25 15:58
行业宏观背景与政策导向 - 国务院发布《关于深入实施"人工智能+"行动的意见》,提出到2027年人工智能与实体经济深度融合取得显著成效的目标,为汽车产业等重点领域指明发展方向 [2] - "全球AI科技大会"的举办被视为观察行业如何响应国家战略、探寻AI落地路径的重要窗口 [2] - 汽车行业面临技术路线快速演进与产业格局深刻重塑的双重变革 [2] 汽车产品形态的进化方向 - 未来汽车将从一个信息孤岛进化成能思考、会学习、懂合作的"轮式智能生命体" [2] - 汽车将成为智慧城市交通网络中的活跃节点,能与道路、云端、其他车辆实时"对话",共同编织安全、高效、绿色的出行网络 [2] - 具体应用场景包括车辆提前接收红绿灯配时信息,自动平滑车速实现"绿波通行",以省时省电并缓解拥堵 [4] 智能驾驶技术发展路径 - 文远知行CEO提出"L3是简化的L4,而不是复杂的L2"的观点,认为L3的"心智"成熟度更接近完全自主的L4 [4] - 商汤科技阐述"世界模型"可推动自动驾驶在数据瓶颈、验证技术边界和通过强化学习超越人类驾驶体验三方面取得突破 [4] - Momenta分享基于强化学习技术的R6飞轮大模型能够实现超越人类老司机的安全水平 [4] 中国智能电动车市场核心趋势 - 汽车之家研究院报告提出影响市场未来发展的五大核心趋势:智驾平权启动、AI大模型上车、智能座舱体验升级、超充等新兴配置成关键、RoboTaxi商业化加速 [6] - 智能化已取代传统认知成为用户选购新能源车的首要因素,认为"智能化是新能源车核心优势"的用户比例从30%大幅提升至73% [7] - 产业竞争格局正从传统的性能、配置比拼转向以智能化体验为核心的生态体系竞争 [6] 行业竞争规则与价值锚点的转变 - 行业已从电动化上半场进入以AI为主导的智能化下半场,价值锚点正在从"马力"转向"算力",从"配置表"转向"体验流" [7] - 消费者与汽车的关系进入"双向选择"新阶段,未来4S店试驾将转变为用户主导的、近乎严苛的"能力测试" [8] - RoboTaxi等"随需所用"的出行模式可能对传统汽车销售逻辑带来冲击,促使车企思考向"智慧出行服务"提供者转型 [7] 技术发展中的挑战与建议 - 报告显示高达85%的被测车型在辅助驾驶过程中出现过需人类紧急接管的危险场景,安全信任是根本前提 [8] - 行业建议跳出参数和价格内卷追求核心技术突破,从"单车智能"向"产业智能"拓展,加强开放合作构建共赢生态,守住安全与伦理底线 [8] - 汽车之家凭借数据资产优势与自研大模型,正通过AI技术系统性解决汽车消费体验与经营效率的结构性痛点 [9]
周鸿祎:语言是最重要的,语言掌握了就一通百通
新浪科技· 2025-09-24 13:09
核心观点 - 行业观点认为语言是人工智能发展的关键 语言突破将推动其他AI模型领域取得重大进展[1] 行业技术路径 - 行业观点指出语言在人类活动中承担交流 知识传承 逻辑推理和世界描述的核心功能 是理解世界模型的关键[1] - 行业观点认为人工智能过去未能取得突破的原因在于未理解语言的重要性 一旦掌握语言即可通晓人类知识 世界和推理能力[1] - 行业观察到Google近期发布的nano banana产品在图形理解方面表现惊艳 其能力超越了视觉层面并融合了知识[1] 技术突破影响 - 行业观点强调语言技术取得突破后 音乐模型 视频模型 图形模型和视觉模型等领域均获得显著进展[1]
打算招聘几位大佬共创平台(4D标注/世界模型/VLA等方向)
自动驾驶之心· 2025-09-24 07:32
QS200以内高校,硕士及以上学历,手握顶会的大佬优先。 待遇说明 自动驾驶资源共享(求职、读博、出国留学推荐等); 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 业务合伙人 自动驾驶之心业务合伙人招募来啦!我们团队今年计划向国内外招募10名优秀的合伙人,负责自动驾驶相 关课程研发、论文辅导业务开发、硬件研发; 主要方向 如果您是大模型/多模态大模型、扩散模型、VLA、端到端、具身交互、联合预测、SLAM、3D目标检测、 世界模型、闭环仿真3DGS、大模型部署与量化感知推理等方向,欢迎加入我们; 岗位要求 丰厚的现金激励; 创业项目合作与推荐; 联系我们 更多欢迎添加微信咨询,备注" 机构/公司 + 自动驾驶合作咨询 "。 ...
3DGS重建!gsplat 库源码解析
自动驾驶之心· 2025-09-24 07:32
3D高斯泼溅技术及gsplat库 - 3D高斯泼溅是一种新兴的3D场景表示与渲染技术,与传统的深度学习模型和框架有显著区别,它更侧重于计算机图形学领域,涉及坐标系转换和激光雷达点云等技术[4] - 在自动驾驶和计算机视觉领域,3D高斯泼溅技术正被探索与感知系统及端到端模型进行结合,但其与大语言模型和自然语言处理领域基本没有关联[4] - 对于希望入门该领域的研究者,开源库gsplat被推荐为比官方Gaussian-splatting库更优的选择,因其文档和维护相对更好[5] gsplat库的技术特性与优化 - gsplat库对原始的3D高斯泼溅官方实现进行了多项优化,提供了更完善的工具链[5] - 该库支持超广角镜头畸变和卷帘快门相机模型,这使其更适用于如自动驾驶等复杂真实场景[12] - 库内提供了高效的高斯球参数压缩功能,能够将1M个高斯球的参数量从236MB压缩至16.5MB,仅造成0.5dB的峰值信噪比损失[13] - 压缩技术结合了量化、排序、K-means聚类以及PNG图像编码等多种方法[14] 3D高斯泼溅的核心算法流程 - 3D高斯泼溅使用位置、协方差矩阵、颜色和不透明度等参数来定义每个高斯球,其中协方差矩阵可通过缩放矩阵和由四元数表示的旋转矩阵分解得到[21] - 训练过程包含自适应密度控制,高斯球的数量会动态变化,通过复制、分裂和修剪等策略进行更新[23] - 复制操作的触发条件是图像平面梯度高且高斯球尺度小,适用于需要保留细节的区域[28] - 分裂操作的触发条件是图像平面梯度高且高斯球尺度大,适用于用多个小高斯拟合复杂几何结构[28] - 修剪操作的触发条件是高斯球的不透明度较低,定期重置策略则用于防止不透明度过早收敛[28] gsplat库的渲染与训练实现 - 渲染管线核心步骤包括:将3D高斯投影至2D图像平面、计算球谐函数着色、进行瓦片相交检测,最终光栅化到像素[42][45][46][53] - 训练循环包含数据准备、前向渲染、损失计算、反向传播、优化器更新以及策略后处理(执行高斯球的分裂与修剪)等标准步骤[33][35][37] - 支持多GPU分布式训练,采用类似模型并行的方式将高斯球参数切分到不同GPU,并在渲染前通过All-to-All通信交换数据,实现计算负载的并行化[65][66][71] 行业影响与未来展望 - 以OpenAI的Sora为代表的视频生成模型若持续发展,可能对未来计算机图形学领域产生深远影响,甚至成为该学科的基础技术之一[6][7] - 从业者期待“世界模型”类技术能在视频生成和场景重建等领域得到更广泛应用,即使其效果仅达到大语言模型影响力的四分之一,也将为算法和基础设施领域的从业者带来新的机会[9]
AI技术未来发展趋势预测
搜狐财经· 2025-09-21 21:31
技术突破方向 - 原生多模态大模型采用端到端统一架构,实现文本、图像、音频、3D数据深度融合处理,推理效率提升300% [1] - 世界模型加速落地,成为2025年具身智能的核心技术底座 [1] - AI智能体从知识增强转向执行增强,OpenAI的o1/o3模型已实现复杂任务自主决策,预计到2028年AI智能体将自动化15%企业日常决策 [3] - 模型训练范式革新,后训练阶段Scaling Law成为重点,强化学习优化推理效率,降低50%算力消耗 [4] - 训练转向小数据与优质数据驱动,减少对海量低质数据的依赖,提升模型可靠性 [4] 产业重构趋势 - AI代理深度分析用户行为,提供超个性化产品定制,客户满意度提升40% [6] - 实时决策系统渗透物流、营销领域,企业应对市场波动速度加快3倍 [6] - AI与物理世界深度融合,工业场景人形机器人量产化,端到端模型控制精度达毫米级 [6] - 智能工厂覆盖率超80%,推动制造业研发周期缩短28.4% [6] - 生物医学领域,多模态神经影像AI解码大脑三维结构,阿尔茨海默病预警提前至临床前10年 [6] - 联邦学习连接跨区域医疗数据,肺炎诊断特异性达99.2% [6] 社会融合挑战 - 伦理治理刚性化,负责任AI成为强制标准,可解释性模型在医疗、金融领域强制应用 [8] - 就业结构转型,重复性岗位自动化率超30%,创造型与情感交互型职业需求增长200% [8] - 人类创造力与AI执行力成为主流协作模式 [8] - 隐私与版权新机制普及,区块链赋能的AI数据确权技术解决生成内容版权归属争议 [8] - 差分隐私、联邦学习保护个人数据,用户隐私控制权立法强化 [8] 未来十年关键里程碑 - 2027年通用人工智能在封闭场景通过图灵测试 [12] - 2030年神经形态芯片量产,能效比提升1000倍 [12] - 2035年AI贡献全球GDP增长超40% [12]
打算招聘几位大佬共创平台(世界模型/VLA等方向)
自动驾驶之心· 2025-09-21 14:59
公司业务与招聘计划 - 公司计划在2024年向国内外招募10名业务合伙人 [2] - 业务合伙人将负责自动驾驶相关课程研发、论文辅导业务开发以及硬件研发 [2] 招聘主要技术方向 - 招聘方向涵盖大模型/多模态大模型、扩散模型、视觉语言模型、端到端自动驾驶、具身交互、联合预测、SLAM、3D目标检测、世界模型、闭环仿真3DGS、大模型部署与量化感知推理等前沿技术领域 [3] 岗位要求与待遇 - 候选人需来自QS200以内高校,拥有硕士及以上学历,拥有顶会论文者优先 [4] - 提供的待遇包括自动驾驶行业资源共享、丰厚的现金激励以及创业项目合作与推荐机会 [5]
无需训练的世界模型?西湖大学WorldForge开启空间智能新路径,让AI读懂3D世界
量子位· 2025-09-21 14:36
文章核心观点 - 西湖大学AGI实验室提出的WorldForge框架通过推理时引导策略实现视频生成的高精度时空控制 绕开传统微调或重训模型的高成本路径 为可控世界模型提供新研究方向 [1][8][14] 技术原理与架构 - 采用步内递归修正(IRR)模块 通过预测-校正微循环在去噪过程中逐步消除轨迹偏离 确保生成内容遵循预设运动轨迹 [4][5] - 流门控潜在融合(FLF)模块通过光流得分分离运动与外观特征 将轨迹信号精准注入高运动相关度通道 避免破坏画面质感 [6] - 双路径自校正引导(DSG)模块利用引导路径与非引导路径的输出差异生成校正项 同时保证轨迹精确性与画面质量稳定 [7] 应用场景与性能 - 支持单视图生成3D静态场景 仅需一张照片即可重建三维场景并生成360°环绕视频 [9] - 实现视频电影级重运镜 允许用户自由设计镜头轨迹智能补全新视角场景 效果领先需大量训练的SOTA模型 [11] - 具备视频内容二次创作能力 包括主体替换、物体擦除/添加及虚拟试穿等编辑功能 [12] 行业意义与创新 - 为视频生成领域提供不修改模型权重、即插即用的引导策略 降低技术与资源门槛 [1][14] - 通过推理时引导结构化模型内部世界知识 为可控世界模型构建开辟低训练成本新路径 [8][14]
开放几个自动驾驶技术交流群(世界模型/端到端/VLA)
自动驾驶之心· 2025-09-21 00:03
技术交流社群建立 - 自动驾驶领域专业社群成立 涵盖世界模型 端到端 VLA等多个前沿技术方向[1] - 社群定位为技术交流平台 面向开学季和秋招期从业人员与学生群体[1] - 通过指定联系方式可申请加入 需备注昵称与研究方向[1]
黄仁勋随特朗普访英:26亿美元下注英国AI,智驾公司Wayve或获5亿美元加码
搜狐财经· 2025-09-20 17:57
投资与合作 - 英伟达宣布在英国投资20亿英镑(约合26亿美元),以催化英国的人工智能初创企业生态系统 [1] - Wayve有望获得英伟达5亿美元的投资,双方已签署投资意向书 [1] - 英伟达曾于2024年5月参与Wayve的10.5亿美元C轮融资,其他投资者包括软银和微软 [2] 公司技术与产品 - Wayve的下一代Gen 3硬件平台将完全基于英伟达的DRIVE AGX Thor车载计算平台打造 [1] - 公司采用具身人工智能和端到端深度学习模型的技术路线,是世界上首家在公共道路上部署端到端深度学习驾驶系统的公司 [3][8] - 其AV2.0架构旨在实现通用化、可全球扩展的自动驾驶,区别于传统模块化的AV1.0系统 [8] - 为解决端到端模型的可解释性问题,公司开发了LINGO-2模型,这是一个闭环视觉-语言-动作驾驶模型,能解释其行为原因并接受自然语言指导 [10][12] - 为解决数据需求挑战,公司开发了视频生成世界模型GAIA-2,用于生成逼真且可控的驾驶场景视频以训练模型 [14][16] - 其人工智能驾驶系统不依赖高精地图,并具有硬件无关特性,能够兼容不同类型的传感器和车辆平台,已在美国、德国和日本等地进行测试验证 [19][20] 公司背景与团队 - Wayve于2017年由亚历克斯·肯德尔和阿玛尔·沙阿在英国剑桥大学附近创立 [3] - 联合创始人兼首席执行官亚历克斯·肯德尔拥有剑桥大学深度学习与计算机视觉方向的博士学位,其研究是公司创立的基础 [21] - 公司高管团队经验丰富,包括来自Mobileye、Waymo以及曾担任高盛、瑞银顶级汽车行业分析师的专业人士 [25]
任少卿加入中科大......
自动驾驶之心· 2025-09-20 13:35
任少卿职业动态 - AI领域专家任少卿开始在母校中国科学技术大学开班招生 [1] - 任少卿曾任Momenta联合创始人、蔚来汽车副总裁 [4] 任少卿学术背景 - 任少卿为07级中科大本硕博(微软亚洲研究院联合培养) [4] - 任少卿是ResNet和Faster R-CNN作者 [4] - 学术高被引超44万,是全球中国籍学者高被引第一 [4] - ResNet是21世纪全球最高被引论文 [4] - 曾获未来科学大奖-数学与计算机科学奖 [4] 招生信息 - 招生方向为AGI、世界模型、具身智能、AI4S等 [6] - 硕士、博士生都在招 [6] - 有推免资格的学生将于下周一(22日)开启紧急面试 [6]