Workflow
自动驾驶
icon
搜索文档
分钟级长视频生成!地平线Epona:自回归扩散式的端到端自动驾驶世界模型(ICCV'25)
自动驾驶之心· 2025-07-07 20:17
自动驾驶世界模型Epona的核心创新 - 提出自回归扩散世界模型框架Epona,融合扩散模型与自回归模型优势,支持分钟级长视频生成、轨迹控制生成和实时运动规划[1][2] - 两项关键架构创新:解耦时空分解(分离时间动态建模与细粒度生成)、模块化轨迹与视频预测(端到端整合运动规划与视觉建模)[2][18] - 引入链式前向训练策略(CoF),解决自回归误差累积问题,FVD指标提升7.4%,支持600帧(2分钟)长视频生成[23][26][29] 技术架构与性能表现 - **解耦设计**:时序建模采用多模态时空Transformer(MST),空间生成采用双-单流DiT结构,支持逐帧自回归生成[20] - **多模态生成**:TrajDiT分支生成3秒连续轨迹(20Hz实时),VisDiT分支生成下一帧图像(4090 GPU上2秒/帧)[21][25] - **基准测试优势**:在NuPlan数据集上FVD降至82.8(优于Vista的89.4),NAVSIM轨迹预测碰撞率0.36%(优于UniAD的0.31%)[29][30] 行业应用价值 - 突破现有世界模型局限:解决传统视频扩散模型固定长度限制(如GAIA-2)与自回归Transformer模型离散token质量损失(如GAIA-1)[15] - 支持实际场景需求:可应用于轨迹控制视频生成(定制化驾驶模拟)和轻量化实时规划(仅启用TrajDiT分支)[21][28] - 参数量2.5B,计算效率优于NVIDIA Cosmos等同类模型,在消费级硬件(4090)上可部署[25][32] 行业技术趋势 - 世界模型成为下一代端到端自动驾驶关键路径,减少对感知模块与标注数据的依赖[6] - 自回归+扩散的混合架构成为前沿方向,Epona首次实现连续表征下的长序列自回归生成[9][33] - 当前行业痛点包括长时序一致性(如Cosmos限于短视频)与实时规划能力(如Vista缺乏轨迹控制),Epona提供统一解决方案[17][26][32]
滴滴自动驾驶感知算法一面面经
自动驾驶之心· 2025-07-07 20:17
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 亲身经历:滴滴自动驾驶感知算法岗三轮技术面复盘! 最近参加了滴滴自动驾驶部门感知算法工程师的面试,总共经历了三轮技术面,每一轮的面试官都问得非常深 入,尤其聚焦在项目细节和技术原理上。这里必须提醒大家: 面试前务必吃透简历上的每一个字! 一旦被问 住,场面真的会很尴尬。 Q4:了解Anchor-Free检测吗?简述FCOS的核心流程。 重点考察对Anchor-Free代表算法FCOS的理解。 Q5:是否接触过端到端(End-to-End)检测算法? 滴滴在自动驾驶领域布局多年,技术积累相当深厚。他们和广汽埃安联合成立的"广州安滴科技"专注于L4级无 人驾驶研发,投入力度很大。今年想冲击自动驾驶方向的同学,滴滴绝对是一个值得重点关注的选项。 第一轮技术面试回顾: Q1:自我介绍 面试官主要围绕我研究生期间的科研产出和研究方向进行了针对性提问。 Q2:论文核心创新点阐述? 在讨论创新点时,面试官自然地延伸出了一些2D目标检测领域的相关问题进行探讨。 Q3:概述2D目标检测算法的主要演进脉络? 需要梳理从传统方法到 ...
【快讯】每日快讯(2025年7月7日)
乘联分会· 2025-07-07 16:36
国内新闻 - 工信部就《汽车、摩托车用车速表》等三项国标公开征求意见,修改内容包括电子数字式车速表分度值与指针式一致,适用于M、N、L类机动车[2][3] - 2026年起实施新乘用车制动系统国标,强制安装ABS,禁止新能源车默认单踏板刹停模式,能量回收减速度大于1.3米/秒²时需点亮制动灯[4][5] - 前5月陕西新能源汽车出口15.5万辆(全国第三),增速173%,产量56.1万辆(占全省汽车71.1%),西安比亚迪产量51.5万辆(同比+39.5%)[6][7] - 宁德时代与吉利汽车签署战略协议,深化动力电池技术协同与供应链体系建设[8] - 长安汽车挪威旗舰店开业,推出深蓝S07(售价28.4万元),配备脉冲加热与金钟罩电池技术,计划2026-2027年推出新SUV车型[9] - 比亚迪储能与国网湖南综能合作,共同探索新型电力储能发展[10][11] - 小马智行与迪拜RTA合作启动自动驾驶测试,计划2026年实现全无人商业化运营[12] - 佛吉亚中国与广汽华望成立合资公司,整合资源研发新技术应对市场竞争[13] 国外新闻 - 6月英国新车注册量同比+6.8%至19.1万辆,纯电动车增长39.1%至4.7万辆[13] - 捷克成为欧洲第二个允许L3自动驾驶上路国家,明年1月生效,适用高速公路低速场景[14] - 现代汽车在蔚山建设氢燃料电池工厂(占地4.3万㎡),计划2028年投产[15] - 特斯拉FSD欧洲测试扩至西班牙,已向欧盟提交正式推出申请[16] 商用车 - 四川出台方案重点研发氢燃料电池、氢能重卡等产品,推动氢能商业化应用[17] - 首批东风多利卡康陆威轻卡交付物流企业[18] - 比亚迪鲨鱼皮卡成澳洲最畅销国产皮卡,6月注册量8156辆(同比+368%)[18] - 广州远程新能源商用车公司揭牌,推动华南公共领域用车新能源化[19][20]
智能眼镜将是下一个iphone!凯文·凯利最新对话:如果让我下注,我可能会押中国公司胜出,而不是苹果……
聪明投资者· 2025-07-07 14:54
未来技术趋势 - 智能眼镜将取代智能手机成为下一代主流终端设备,但技术成熟仍需5-10年甚至25年[47][63][69] - 中国企业最有可能率先推出普及型智能眼镜,受益于供应链优势、材料科学积累和快速迭代文化[70][71][74][77] - 镜像世界将成为AI与人类交互的核心场景,通过智能眼镜实现现实与数字孪生体的融合[47][49][50] 人工智能发展 - AI将深度参与内容生产但人类仍需对结果负责,记者角色将转向可信度背书而非信息输出[33][34][35] - AI将具备情感交互能力,人类与AI的情感连接将成为未来25年最大冲击之一[51][52][53][55] - AI不会取代工作而是改变工作形式,人类需要适应与AI协作的新工作模式[27][28] 媒体行业变革 - YouTube将成为下一代超级平台,整合AI搜索、空间视频和沉浸式内容[43][44][45] - 小型媒体项目更具创新优势,建议保持高频试错并预留专门预算[39][40][41][42] - 新闻呈现形式将向沉浸式体验发展,如通过智能眼镜实现战地现场感知[36][37][38] 机器人技术 - 人形机器人将优先应用于工业场景,25年内难以在家庭普及[79][80][81] - 机器人手部灵活性仍是技术瓶颈,难以复制人类双手的精细操作能力[81] - 机器人发展路径类似VR,功能改进缓慢但成本将持续下降[84][85][86] 自动驾驶 - 自动驾驶普及后人类驾驶将变成特殊技能,需更高资质认证[89][90][91] - 城市核心区域可能禁止人工驾驶,传统驾驶权限将大幅收缩[92][93][94] - 未来汽车可能取消方向盘,自动驾驶服务比私家车更经济便捷[95][96] 太空探索 - 火星不会出现城市,最多建立科研基地作为技术展示[97][98][105] - 近地轨道开发比火星移民更具经济价值,如小行星采矿[100][101] - 太空探索主要价值在于技术衍生效应而非直接商业回报[99][104] 生命科学 - 延长健康寿命比追求永生更现实,癌症疫苗等技术有望实现[110][111][112] - 脑机接口技术将实现非侵入式应用,游戏和艺术领域或成早期场景[119][120][121][122] - 人口老龄化将抑制创新活力,需要社会机制创新来突破结构压制[113][114][115][116] 创业投资 - AI将改变风险投资模式,可能出现众筹式早期参与新形态[131] - 硅谷创新主体将持续更替,但区域优势地位不变[126][127][129] - 创业门槛降低将催生更多小型创业项目,传统大公司转型难度大[39][130]
今年上半年美股的财富密码:“未盈利的858”
财联社· 2025-07-07 10:06
美股市场投机热潮 - 罗素3000指数中858家未盈利公司平均涨幅达36%,远超盈利公司表现 [1] - 自4月8日以来14家涨幅超200%的公司中10家未实现盈利,包括Avis Budget Group(+188%)、Carvana(+98%)和Aeva Technologies(+457%)[1][3][4][5] - 高盛编制的散户最喜爱股票指数创2021年11月以来新高,风险最高板块(高贝塔动能股、比特币敏感指数、未盈利科技股)表现远超标普500 [2][7] 散户交易行为特征 - 盈透证券平台活跃交易名单出现Cyngn等低市值公司(市值<1亿美元),其股价三个月内翻三倍但年内仍跌90% [3] - 杠杆ETF ProShares UltraPro QQQ(3倍纳斯达克100指数)自4月8日涨幅超100%,4月初资金流入创纪录 [8] - YOLO交易理念回归,散户在股价下跌时全盘买入并持仓的策略成为主流 [5][6][8] 市场结构变化 - 低价股(<1美元)交易量占比达47%创纪录,显示高风险偏好升温 [7] - 投机热潮推动市场反弹范围扩大,不再仅依赖大型科技股 [5] - 自动驾驶、激光雷达等前沿技术领域公司成为投机焦点 [3][5] 行业表现差异 - 未盈利科技股与高贝塔动能股成为二季度表现最佳板块 [2] - 汽车租赁(Avis)和二手车(Carvana)等疫情概念股重新获得资金追捧 [3][4] - 比特币敏感指数与科技投机板块联动性增强 [2][7]
汽车早餐 | 小米YU7交付启动;李斌称乐道L90起售价低于30万元;小马智行将在迪拜启动自动驾驶汽车试点测试
中国汽车报网· 2025-07-07 09:14
国内新闻 - 国家发展改革委与巴西有关部门签署合作文件,涉及发展战略对接第二阶段合作谅解备忘录及人工智能合作 [2] - 市场监管总局曝光6起产品质量领域"内卷式"竞争违法典型案例,包括绍兴宏冠新能源有限公司销售不合格柴油机燃料案 [3] - 2025年1-5月全国二手车累计交易量791万辆同比增长0.6%,交易额5164亿元同比下降2.1% [4] 国际新闻 - 特斯拉Cybertruck二季度销量约5000-6000辆,远低于2025年年产25万辆目标,"其他车型"交付量同比下滑52% [5] - 日本首相石破茂表示将推动实现汽车零关税并为所有关税情景做好准备 [6] - 迪拜道路与交通管理局与小马智行合作,计划2025年启动自动驾驶汽车试点测试,2026年推进全无人商业化运营 [7] - 欧盟与美国贸易谈判进展缓慢,德国、意大利倾向尽快达成协议,法国、西班牙等国对让步表示担忧 [8] - 日产与鸿海磋商电动车合作,追滨工厂有望免于关闭并维持日本零部件供应网络 [9][10] 企业新闻 - 蔚来乐道L90起售价低于30万元,展车将于7月10日到店并开启预售 [11] - 理想汽车CEO李想透露曾建议雷军造车需"all in",小米YU7启动交付覆盖58个城市 [12] - 比亚迪与上海乐高乐园度假区达成战略合作,聚焦绿色出行与儿童沉浸式驾驶体验 [13] - 台积电推迟日本第二家工厂建设,优先应对美国潜在关税政策 [14] - 新石器无人车与深汽租协达成千台级合作,助力智慧物流升级 [15]
自动驾驶黄埔军校,一个死磕技术的地方~
自动驾驶之心· 2025-07-06 20:30
自动驾驶技术发展现状 - 自动驾驶技术正处于从辅助驾驶(L2/L3)向高阶无人驾驶(L4/L5)跨越的关键阶段 [2] - 特斯拉的纯视觉方案凭借成本优势和算法革新正在撼动多传感器融合的主流地位 [2] - 激光雷达成本已降至200美元,比亚迪自研体系内价格再降70%,技术红利背后是从业者持续升级的压力 [2] 自动驾驶人才市场变化 - 传统激光雷达感知算法工程师面临技术路线冲击,规划控制领域从PID到强化学习的转型带来技能升级紧迫感 [2] - 学生新手面临选择困难:感知算法赛道内卷加剧,数据闭环工程师需掌握分布式计算与AI模型调优能力,车路协同方向要求跨界知识融合 [2] 自动驾驶技术社区 - 自动驾驶之心知识星球是国内最大的自动驾驶学习社区,聚集近4000名成员和100+行业专家 [7] - 社区覆盖30+技术学习路线,包括端到端自动驾驶、BEV感知、Occupancy、3D目标检测等几乎所有子方向 [7] - 提供学术界与工业界前沿直播、求职内推渠道,每周活跃度位居国内前20 [7] 前沿技术方向 - 视觉大语言模型(VLM)在自动驾驶中的应用包括场景理解、轨迹生成和决策控制 [26][27] - 世界模型技术如GAIA-1、DriveDreamer通过生成式AI模拟驾驶场景演化,提升系统预测能力 [32][33] - 扩散模型在自动驾驶中用于场景合成、数据增强和轨迹预测,相关研究数量快速增长 [35][40] 数据集与评估 - 主流自动驾驶数据集包括nuScenes(12亿帧)、Waymo Open Dataset(12亿帧)和BDD100K(10万视频) [23][24] - VLM预训练数据集规模从1M(SBU Caption)到12B(WebLI),评估指标涵盖mAP(目标检测)、mIoU(语义分割)等 [17][18] 端到端自动驾驶进展 - 端到端方法逐步替代模块化架构,DriveGPT4、DriveMLM等模型实现感知-规划一体化 [29][53] - 技术挑战包括长尾场景处理、系统可解释性以及与传统规控方法的协同 [54][55] - 行业研究报告显示,特斯拉FSD的端到端方案推动量产落地进程加速 [47] 工业界应用案例 - 智能交通领域采用VLM实现语言引导车辆检索和视觉问答,提升交互效率 [25] - 自动驾驶决策控制中,DiLu、LanguageMPC等模型利用大语言模型增强决策可解释性 [28] - 仿真测试依赖扩散模型生成高保真场景,如DriveDreamer-2支持定制化视频生成 [30] 技术社区资源 - 知识星球提供四大板块:技术领域分类、学术直播、求职资料和问题解答 [10][11] - 汇总Awesome资源列表,包括视觉大语言模型、扩散模型和端到端自动驾驶的论文与代码库 [12][35] - 学习路线覆盖BEV感知、Occupancy、CUDA加速等30+方向,配套工程解决方案与优化思路 [66][67]
特斯拉Robotaxi “闯祸”撞车, 自动驾驶安全性遭质疑
环球网资讯· 2025-07-06 12:50
特斯拉Robotaxi事故 - 特斯拉在得克萨斯州奥斯汀的Robotaxi服务发生事故 一辆全自动驾驶Model Y在完成行程后撞上一辆停着的丰田汽车 未造成严重人员受伤和车辆损坏 [1] - 事故视频显示 Model Y在驶出昏暗小巷时出现异常 转弯加速撞向丰田车轮胎 原因不明 [3] - 其他受邀体验者还遇到机器人出租车无端应急灯突然停车 短暂在双黄线错误一侧行驶等意外情况 [3] 特斯拉自动驾驶技术路线 - 特斯拉是纯视觉自动驾驶路线的坚定支持者 依靠摄像头和神经网络 结合算法和算力实现自动驾驶 [3] - 公司CEO埃隆·马斯克多次强调视觉的优越性 认为激光雷达昂贵且没有必要 [3] Waymo自动驾驶事故 - Waymo使用摄像头 激光雷达和雷达组合的自动驾驶方案 与特斯拉技术路线不同 [3] - Waymo去年凤凰城车队撞上电线杆后自愿召回 近期又因车辆易撞路障再次召回 [3] - 2022年至2024年底期间 Waymo共发生16起车辆与铁链 大门等障碍物相撞的事故 未造成人员伤亡 [3] 自动驾驶行业现状 - 自动驾驶技术旨在提升出行安全与效率 但目前特斯拉和Waymo都存在一定安全隐患 [4] - 特斯拉机器人出租车事故为自动驾驶行业敲响警钟 提升技术稳定性和保障乘客安全是行业关键问题 [4]
【RimeData周报06.28-07.04】多重利好因素共振下的AI芯片再现大额融资
Wind万得· 2025-07-06 06:21
投融概况 - 本周融资事件共108起,较上周增加4起,融资金额总计约113.69亿元,较上周增加46.40亿元 [4] - 融资金额在亿元及以上的融资事件有28起,较上周增加6起 [4] - 公开退出案例32个,较上周减少4个 [4] - 97家机构参与一级市场投资,较上周减少48家 [4] - 21起融资事件未公布准确金额,涉及金额至少8.22亿元,占融资总额7.23% [4] 融资事件金额分布 - 500万以下融资事件5起,与上周一致 [5] - 500万-1000万融资事件22起,较上周增加4起 [5] - 1000万-5000万融资事件13起,与上周一致 [5] - 5000万-1亿融资事件18起,较上周增加2起 [5] - 1亿-5亿融资事件9起,较上周增加2起 [5] - 5亿-10亿融资事件2起,与上周一致 [5] - 10亿元以上融资事件1起,与上周一致 [5] 热门投资事件 - 光伏材料:永祥股份完成49.16亿元战略融资,增资前估值270亿元,通威股份持股比例稀释至84.60% [7][8] - AI大模型:智谱完成10亿元战略融资,估值约400亿元,累计融资超30亿元 [8] - AI芯片:阵量智能完成近10亿元战略融资,专注于高性能GPU研发 [8] - 自动驾驶软件:天瞳威视完成5亿元D轮融资,推动Robotaxi全国落地 [9] 重点融资事件 - 麦科奥特(医药健康):D轮超1亿元 [11] - 中导信(信息技术):A轮3.2亿元 [11] - 英麦科微电子(电子):D轮近1.5亿元 [11] - 至信微电子(电子):战略融资近1亿元 [11] - 瑞高新材料(材料):Pre-IPO数亿元 [11] - 航天飞鹏(装备制造):B轮数亿元 [11] 行业分布 - 融资事件数量前五行业:信息技术(26起)、电子(25起)、装备制造(14起)、医药健康、材料,合计占比74.07% [12] - 融资金额前五行业:材料(49.16亿元)、电子、信息技术、装备制造、汽车,合计占比97.49% [14] - AI芯片领域融资活跃,阵量智能获近10亿元投资,国内AI芯片企业通过差异化竞争实现突破 [16] 地域分布 - 融资事件数量前五地区:广东省(17起)、江苏省(17起)、浙江省(16起)、上海市(13起)、北京市(13起),合计占比70.37% [19] - 融资金额前五地区:四川省(50.88亿元)、北京市(15.85亿元)、上海市(11.70亿元)、江苏省(11.30亿元)、广东省(6.61亿元),合计占比84.73% [19][20] 融资轮次 - 早期融资(A轮及以前)占比58.33%,较上周有所下降 [23] - 战略融资金额占比最高,达59.48% [23] - A轮融资金额占比16.91% [23] 投资机构 - 97家机构参与投资,合计出手111次 [26] - 北京国管(5次)、金浦投资(3次)最为活跃 [26] 退出情况 - 公开退出案例32个,股权转让17个,并购9个,新三板挂牌2个,IPO 4个 [30] - 退出案例最多行业:电子、医药健康、信息技术,合计占比53.13% [31] 数据平台功能 - 来觅PEVC推出批量查询统计功能,支持企业、机构、基金等实体数据的关键字段提取和衍生计算 [33]
《北京数字经济发展报告》发布 北京数字经济领跑全球
证券时报网· 2025-07-05 20:35
北京数字经济发展现状 - 北京全球数字经济标杆城市总指数提升,全球排名第二,位列"全球领跑城市",在数据要素配置力、数字产业引领力和数字创新策源力等方面表现优异 [1] - 北京市在数字基础设施、产业培育、市场建设和国际合作等方面取得显著成果,持续释放新动能 [1] - 北京聚力人工智能产业发展,以标准为引领,依托政策创新、产业升级、算力支撑实现协同突破 [1] 自动驾驶与技术创新 - 高级别自动驾驶示范区建设稳步推进,通过规划引领、政策创新、多方合作推动技术研发与产业融合,打造全球自动驾驶产业标杆 [1] - 在基础软件、脑科学、人工智能等重点领域持续攻坚,构建自主可控的生态体系,提升数字经济竞争力 [1] - 数字产业创新指数领跑全国,与粤浙苏沪并居第一梯队,展现领先优势与协同发展活力 [1] 数字经济出海与数智化转型 - 北京市着力打造数字经济出海平台,通过便利化机制、完善口岸功能、创新监管保障模式等举措,优化出海环境,助力企业拓展全球市场 [2] - 北京市推进数智化转型,以数字经济与科技创新融合重塑发展格局,通过算法、算力、数据要素联动赋能产业升级与制造业转型 [2] - 全要素生产率持续提升,引领产业向高端化、智能化升级 [2] 未来发展规划 - 北京市将强化数字基础设施建设与技术创新融合,加快算力体系优化布局,推动数据要素深度市场化改革 [2] - 构建具有国际竞争力的产业生态,夯实人工智能等前沿领域的人才基础,探索更多元的产业融合应用场景 [2] - 提升城市治理精细化、智能化水平 [2]