Workflow
自动驾驶
icon
搜索文档
世界模型与自动驾驶小班课正式推出!特斯拉世界模型、视频OCC生成一网打尽~
自动驾驶之心· 2025-12-09 15:59
课程核心内容与定位 - 课程名称为《世界模型与自动驾驶小班课》,是首个面向端到端自动驾驶的进阶实战教程,旨在推动端到端技术在工业界的落地,并助力学员真正理解端到端自动驾驶 [2][10] - 课程由“自动驾驶之心”公众号联合工业界大佬推出,是继《端到端与VLA自动驾驶小班课》后进一步推出的课程,聚焦于通用世界模型、视频生成、OCC生成等世界模型算法 [2] - 课程讲师Jason拥有C9本科和QS50 PhD背景,发表多篇CCF-A/B论文,现任国内TOP主机厂算法专家,主持并完成多项自动驾驶感知和端到端算法的产品量产交付,具备丰富的研发和实战经验 [2] 课程大纲与章节详解 - **第一章:世界模型介绍** 复盘世界模型与端到端自动驾驶的联系,讲解其发展历史、当下应用案例,并介绍纯仿真、仿真+Planning、生成传感器输入、生成感知结果等不同流派,以及它们在业界的应用、解决的问题、所处环节、相关数据集和评测 [5] - **第二章:世界模型的背景知识** 讲解世界模型的基础知识,包括场景表征、Transformer、BEV感知等,为后续章节奠定基础,其内容是当下世界模型求职面试频率最高的技术关键词 [5][6] - **第三章:通用世界模型探讨** 聚焦通用世界模型和近期热门工作,涵盖李飞飞团队的Marble、DeepMind的Genie 3、Meta的JEPA、导航世界模型,以及业界广泛讨论的VLA+世界模型算法DriveVLA-W0和特斯拉ICCV上分享的世界模型模拟器 [6] - **第四章:基于视频生成的世界模型** 聚焦视频生成类世界模型算法,从Wayve的GAIA-1 & GAIA-2开始,扩展到上交CVR'25的UniScene、商汤的OpenDWM、中科大ICCV'25的InstaDrive,兼顾经典与前沿进展,并以商汤开源的OpenDWM进行实战 [7] - **第五章:基于OCC的世界模型** 聚焦OCC生成类世界模型算法,包含三大论文讲解和一个项目实战,此类方法不局限于OCC生成,可较易扩展为自车轨迹规划,从而进一步实现端到端 [8] - **第六章:世界模型岗位专题** 基于前五章算法基础,分享工业界应用经验,探讨行业痛点、期望解决的问题,以及如何准备相关岗位面试和公司真正关注的内容 [9] 课程技术深度与学后收获 - 课程将详细讲解Transformer、视觉Transformer、CLIP、LLAVA、BEV感知、占用网络(Occupancy Network)、扩散模型、闭环仿真、NeRF、3DGS、VAE、GAN及Next Token Prediction等关键技术概念 [11] - 课程涵盖OCC生成类世界模型的多个前沿工作,包括清华的OccWorld、复旦的OccLLaMA、华科ICCV'25的HERMES以及西交最新的II-World [12] - 学员学完本课程后,预期能够达到1年左右世界模型自动驾驶算法工程师水平,掌握世界模型技术进展(涵盖视频生成、OCC生成等方法),对BEV感知、多模态大模型、3DGS、扩散模型等关键技术有更深刻了解,并可复现II-World、OpenDWM等主流算法框架,能够将所学应用到项目设计中,对实习、校招、社招均有助益 [13] 课程安排与面向人群 - 课程开课时间为1月1号,预计两个半月结课,采用离线视频教学,辅以VIP群内答疑和三次线上答疑 [14] - 章节解锁时间安排如下:第一章于12月10日解锁,第二章于1月1日解锁,第三章于1月20日解锁,第四章于2月4日解锁,第五章于2月24日解锁,第六章于3月1日解锁 [14] - 面向人群需自备GPU(推荐算力在4090及以上),具备一定的自动驾驶领域基础,熟悉自动驾驶基本模块,了解transformer大模型、扩散模型、BEV感知等技术的基本概念,具备一定的概率论、线性代数基础以及Python和PyTorch语言基础 [13]
理想端到端自进化智能体系统CorrectAD
自动驾驶之心· 2025-12-09 08:03
文章核心观点 - 西湖大学、理想汽车与天津大学联合提出名为CorrectAD的自校正智能体系统,旨在通过自动化流程解决端到端自动驾驶模型的长尾故障问题,该系统通过PM-Agent分析故障原因并生成多模态数据需求,再通过DriveSora生成高保真训练数据,最终通过迭代微调持续优化模型,在nuScenes和内部数据集上分别实现了62.5%和49.8%的故障修复率,并将碰撞率降低了39%和27% [3][10][53][77] 当前行业痛点 - 手工收集罕见且危险的长尾故障(如低能见度碰撞)数据成本极高,需数周时间和数千美元,扩展性差 [5] - 现有检索式数据扩充方法(如AIDE)仅能从现有数据集中筛选相似场景,无法覆盖未见过的长尾故障,难以从根源修正模型缺陷 [6] - 现有驾驶场景生成模型(如MagicDrive)可控性差,无法精准匹配故障修正所需的特定场景特征,生成数据与故障关联性弱 [7] - 缺乏有效机制将端到端模型的故障案例转化为生成模型可理解的精准需求,导致生成的数据无法针对性解决问题 [8] CorrectAD系统核心架构与价值 - 系统首创“智能体析因→定向生成→迭代微调”的自校正范式,首个实现端到端自动驾驶故障自校正的智能体系统 [10][74] - 核心模块PM-Agent模拟产品经理角色,基于视觉语言模型进行多轮推理,分析故障原因并生成包含BEV布局和场景描述的多模态数据需求 [9][10] - 核心模块DriveSora是一个可控的多视图视频生成模型,基于STDiT架构,能生成与3D标注对齐的高保真自动驾驶场景视频 [9][10] - 系统采用模型无关设计,可适配UniAD、VAD等主流端到端规划器,无需为特定模型定制 [10][71] - 系统通过迭代自校正循环(故障分析→需求生成→数据生成→模型微调→评估)持续运行,使生成数据分布逐步逼近故障场景分布,实现性能持续优化 [9][73] - 其落地意义在于将故障修正周期从数周缩短至数天,大幅降低数据迭代成本,可直接集成到车企现有模型优化流程中 [10] PM-Agent(故障分析与需求制定)模块详解 - 首先对故障案例进行聚类分析,通过专家标注和GPT-4o提取关键词,最终将故障原因归类为“前景”、“背景”、“天气”三大类别 [18] - 采用多轮问询策略进行故障分类与细化:第一轮,视觉语言模型根据6视图视频和规划轨迹输出故障类别及置信度;第二轮,对高置信度类别进一步细化具体原因 [22] - 基于分析出的故障原因,利用大语言模型生成结构化的场景描述(如“雨天、低能见度、前车突然减速”) [25] - 通过语义检索从训练集中找到与场景描述匹配的真实场景,并提取其BEV布局,包括背景的道路边界线和前景的3D边界框坐标、航向角等信息 [27] - 将场景描述与BEV布局组合,形成驱动数据生成的多模态需求 [31] - 多轮推理策略显著提升了需求准确性,将需求与故障案例的语义距离从单步推理的4.66降至3.49,能更全面地覆盖故障关键因素 [33] DriveSora(高保真数据生成)模块详解 - 基础架构为时空扩散Transformer,并进行了多项关键技术优化 [35] - 通过集成ControlNet-Transformer,将BEV布局中的道路草图和3D边界框作为约束条件注入模型,实现生成视频与3D布局的精准对齐 [35][38] - 采用参数无关的多视图空间注意力机制,通过重塑特征并应用自注意力,使不同视图的特征在同一注意力窗口中交互,提升了多视图间车辆位置、航向角的一致性达15%,并降低了FVD指标2.8% [36][38] - 采用多条件无分类器引导技术,在训练和推理中联合优化文本、前景布局、背景布局等多个条件的对齐,强化了语义与布局的协同约束 [37] - 生成视频后,使用预训练的3D检测器进行自动3D边界框标注,并通过卡尔曼滤波平滑得到连续轨迹,输出格式与nuScenes数据集一致,可直接用于模型微调 [38][41] - 在生成质量上超越现有先进模型,FID为15.08,FVD为94.51,NDS为36.58,均达到SOTA水平 [54][70][77] 实验性能与关键发现 - 在nuScenes数据集上,CorrectAD将基线模型的碰撞率从0.35%降低至0.19%(降低39%),L2轨迹误差从1.25米改善至0.98米,故障修复率达到62.5% [53] - 在内部挑战性数据集上,CorrectAD将碰撞率从0.26%降低至0.19%(降低27%),L2误差从1.06米改善至0.62米,故障修复率达到49.8% [53] - 消融实验表明,完整CorrectAD系统性能最优,仅使用DriveSora(无PM-Agent)或仅使用PM-Agent(无DriveSora)均无法达到最佳效果,证明了双模块协同的价值 [58] - 多轮迭代效果显著:经过三轮迭代,生成数据与故障案例的分布差异(Hellinger距离)从0.15降至0.09,模型碰撞率从0.26%持续降至0.19% [47] - 定性结果显示,系统能有效修复如低能见度夜间碰撞等故障,且DriveSora生成的数据在多视图一致性、可控性(如车辆属性编辑、天气转换)方面表现优异 [60] 系统当前局限与未来方向 - 当前主要将碰撞视为故障,未涵盖车道违规、交通规则违反等更多故障类型 [68] - 生成效率有待提升,DriveSora模型参数量为1.1B,训练需8块A800 GPU耗时72小时,在L40S GPU上推理单样本需4秒 [68] - 对多智能体复杂博弈交互场景的生成能力不足 [68] - 未来方向包括扩展故障评估维度、集成快速扩散模型以提升生成效率、引入博弈论增强复杂场景生成能力,以及与真实车辆部署流程结合实现线上实时闭环迭代 [75]
25年国内L4融资已突破300亿
自动驾驶之心· 2025-12-09 08:03
行业融资与市场动态 - 2025年国内L4自动驾驶融资规模已突破300亿元人民币,创历史新高,较2023年约84亿元增长约257% [2] - 物流配送和Robotaxi成为两大主流赛道,头部企业和已落地场景获资金青睐 [2] - 行业趋势呈现L2渗透狂奔、L3落地在即、L4规模破局的特点,自动驾驶已进入技术深水区 [2] 近期代表性融资与上市案例 - 造父智能于今年6月份融资30亿元人民币,投资方包括哈啰出行、蚂蚁集团、宁德时代 [7] - 新石器无人车于十月获得由阿联酋磊石资本领投的6亿美元融资 [7] - 小马智行于十一月在港交所IPO,募资额达77亿港元 [7] - 文远知行于十一月在港交所IPO,募资额约24亿港元 [7] - 滴滴自动驾驶于十月完成20亿元人民币的D轮融资,资金用于加大AI研发投入、推动L4自动驾驶应用落地 [7] - 卓驭科技于十一月获得中国一汽战略投资36亿元人民币 [7]
没大厂做靠山的Robotaxi公司,陷入集体焦虑
36氪· 2025-12-09 07:45
特斯拉Robotaxi应用发布 - 特斯拉Robotaxi App正式在苹果App Store上架,面向美国、日本、泰国、韩国、澳大利亚8个国家及中国港澳台地区的iOS用户开放[1] - 此举可能意味着特斯拉开始寻求在美国以外市场扩张其自动驾驶出租车业务[3] 行业头部公司上市与冲突 - 国内自动驾驶头部公司小马智行与文远知行于11月6日齐聚港交所上市,但上市前爆发公开数据争议[3] - 争议源于小马智行路演材料被文远知行指控存在不实数据,双方在运营区域、数据、技术及全球布局上存在分歧[3] - 具体分歧包括:文远知行运营区域被指仅有北京,实际为北京、广州;运营数据被指已完成单数为0,实际拥有700+辆Robotaxi车队及超2200天运营记录;技术被指为两段式方案,实际为一段式端到端;全球布局被指限于5个地区,实际在11国30城运营,7国获牌,其中5国可进行纯无人活动[4] - 此次冲突暴露了行业数据披露的模糊性与片面性,根源在于Robotaxi领域关乎生存的集体焦虑[4] 自动驾驶行业投融资趋势变化 - 中国自动驾驶行业投融资金额在2015年后稳步上升,于2021年达到高峰,全年发生58起投融资,金额达242.7亿元人民币[5] - 2021年后,投融资事件数量下降,资金更集中于处于“战略阶段”的头部公司[5] - 2021年前金融市场繁荣,投资人看重团队、技术、前景等“故事”;2021年后资金市场紧缩,投资人更看重能直接验证的数据和商业模式[8] - 当前投资人评判Robotaxi公司的重要标准包括:技术积累、与主机厂紧密程度、大量C端用户资源[8] 小马智行与文远知行财务与市场表现 - 两家公司港股上市首日双双破发,跌幅均超9%,盘中一度跌超13%[8] - 小马智行美股上市首日亦破发,收盘价12美元,较发行价下跌7.69%[9] - 文远知行营收持续下滑:2022年5.3亿元,2023年4.0亿元,2024年3.6亿元;截至2025年上半年累计亏损约66亿元;2025年第三季度单季亏损5330万美元[10] - 小马智行营收小幅增长:2022年6800万美元,2023年7100万美元,2024年7500万美元;但三年半累计亏损达45.8亿元人民币;2025年第三季度经营亏损6970万美元,同比亏损扩大约2900万美元[11] - 持续的亏损和模糊的盈利前景,导致市场对其发行定价和市值持怀疑态度[10][11] 港股上市募资与投资者结构 - 小马智行行使发售量调整权后发行约4825万股,集资额达77亿港元,创2025年全球自动驾驶行业最大IPO及港股AI领域最高募资纪录[12] - 文远知行全球发售8825万股,募资总额(绿鞋前)达23.9亿港元[12] - 此次港股募资中存在大量对冲基金和交易型基金等短线资金,与去年美股上市时长线产业基金为主的情况不同[12] Robotaxi公司的“Robo”与“Taxi”属性分析 - 专业投资人认可小马智行、文远知行的长期价值,但更多在于其“Robo”(自动驾驶)属性,即技术积累和数据积累,这是主机厂所需要的[13] - 两家公司缺乏强大母公司资金支持,依靠与主机厂绑定发展:小马智行与北汽集团、丰田合作;文远知行与日产、广汽集团绑定[13] - 然而,主机厂未来可能进一步回收对智能驾驶软件的控制权[13] - 作为“Taxi”公司,其经营能力和现金流回报能力是资本看重的核心,但这是两家公司的弱项[14] - 两家公司Robotaxi业务营收主要来自B端项目订单,而非C端服务收费,这与百度“萝卜快跑”自建出行服务平台的模式不同[14] - 百度萝卜快跑截至2025年9月已在10城累计服务超800万人次,日均订单破10万单,单城接近盈亏平衡[14] 运营数据对比 - 截至2025年10月31日,文远知行自动驾驶车队规模超1600辆,其中Robotaxi近750台;广州地区单车单日最高完成25单,北京最高23单;以日均单车20单粗略计算,日均总订单约1.5万单[15] - 小马智行Robotaxi数量达961台,日均单车单量约23单;粗略计算日均订单约为2.2万单[15] - 两者在C端运营层面与百度萝卜快跑存在较大差异[16] 行业盈利关键与成本趋势 - 行业观点认为,做好Robotaxi生意的关键在于政策放开,允许在各城市大规模运营,从而摊薄成本,迎来商业拐点[17] - 目前Robotaxi硬件成本持续下降,即将接近或低于人力成本;小马智行预计其第七代自动驾驶套件BOM成本在2026年较2025年基准再降20%[17] - 政策放开面临的挑战包括技术安全问题以及可能导致的失业问题[17]
小马智行(2026.HK):单三季度收入同比增长72% ROBOTAXI商业化运营持续推进
格隆汇· 2025-12-09 01:37
2025年第三季度财务表现 - 公司2025年第三季度实现营收2544万美元,同比增长72.0%,环比增长18.6% [1] - 公司2025年第三季度净亏损为6132万美元,调整后净亏损(加回股权激励费用)为5472万美元 [1] - 公司2025年第三季度毛利率为18.4%,同比提升9.1个百分点,环比提升2.2个百分点 [1] - 公司2025年第三季度净利率为-242.0%,同比改善42.8个百分点,环比改善6.3个百分点 [1] - 公司2025年第三季度费用率为292.2%,同比上升7.7个百分点,但环比下降9.5个百分点 [1] 分业务收入情况 - Robotaxi服务收入为670万美元,同比增长89.5%,其中乘客车费收入同比增长超200% [1] - Robotruck服务收入为1020万美元,同比增长8.7% [1] - 授权和应用收入为860万美元,同比大幅增长354.6%,增长主要得益于自动驾驶域控制器产品需求增加及无人配送领域客户需求攀升 [1] 业务进展与运营数据 - 公司是自动驾驶出行大规模商业化领域的全球领先企业 [1] - Robotaxi规模化运营持续推进,公司拥有961辆Robotaxi运营车辆,其中包括667辆第七代Robotaxi车型 [1] - 公司有望在2025年底前实现Robotaxi车队规模超过1000辆的目标,并朝着2026年底超过3000辆的目标迈进 [1] - 第七代Robotaxi已实现以城市为单位的单车盈利转正 [1] 战略合作与市场拓展 - 自动驾驶“朋友圈”持续扩容,继6月与西湖集团合作后,于11月24日与阳光出行达成战略合作,将围绕自动驾驶出行开展全方位深度合作,共同打造规模化自动驾驶车队 [1] - 公司通过战略合作伙伴将Robotaxi业务拓展至八个国家,近期与卡塔尔最大的交通服务提供商Mowasalat合作进入卡塔尔市场 [1] - 公司通过扩大服务范围和深化当地合作伙伴关系,巩固在新加坡、卢森堡和韩国的现有市场 [1] - 公司与全球打车平台合作探索更多市场,例如其股东Uber和Bolt [1] 技术与成本优化 - 随着第四代Robotruck的推出,其自动驾驶套件BOM成本相比上一代降低了70% [1] 机构观点与预测 - 机构持续看好公司在Robotaxi和Robotruck领域的布局,认为车队规模铺开有望持续超越行业 [2] - 机构维持盈利预测,预计公司2025-2027年营收分别为0.80亿美元、0.93亿美元、1.95亿美元 [2] - 机构预计公司2025-2027年归母净利润分别为-2.27亿美元、-2.20亿美元、-1.95亿美元 [2]
资本围城中的自动驾驶,“讲故事”的终结与“看落地”的开启
36氪· 2025-12-08 16:51
文章核心观点 - 自动驾驶行业明星创业公司毫末智行于2025年11月以近乎静默的方式退场,成为行业从资本狂热转向理性审慎、加速洗牌的标志性事件 [1] - 行业融资环境在2023年发生剧变,资本逻辑从“讲故事”转向“看成果”,资金向头部企业集中,导致缺乏规模效应和成本控制能力的中小玩家面临巨大生存压力 [4][5][9] - 行业未来破局的关键在于技术回归场景落地、商业模式创新以及抓住政策窗口期,中小玩家的生存关键在于融入头部生态或聚焦细分场景打造不可替代性 [10] 资本环境剧变 - 自动驾驶行业融资在2021年达到高峰,全球相关融资总额高达932亿元,但2023年成为分水岭,融资总额断崖式下滑至200亿元,降幅高达78% [1][4] - 资本态度从早期的“狂热追捧”和“广撒网”布局,转向“理性审慎”和“精准聚焦”,投资逻辑从为技术和想象买单变为要求可验证的商业化成果 [4][9] - 2024年自动驾驶行业融资环境急剧降温,资金加速向技术成熟、落地能力强、具备明确盈利潜力的头部企业集中,行业“马太效应”日益凸显 [4][5] 毫末智行案例分析 - 毫末智行曾凭借长城汽车的产业背书和百度系技术团队,累计融资超20亿元,估值突破10亿美元,是资本热潮中的受益者 [1][4] - 随着行业融资退潮,公司2024年仅获得3亿元融资,远不足以支撑其持续研发和业务扩张,至2025年已无力“续血”,资金链承压成为退场重要导火索 [6] - 公司硬件方案成本高达8000元/套,而行业平均成本已压缩至4000元以下,缺乏规模效应与成本控制能力使其在价格战中迅速失去竞争力 [9] 行业格局分化 - 融资环境剧变加剧了行业分化,呈现“头部狂欢、中部挣扎、尾部淘汰”的态势 [7] - 头部企业如华为、Momenta凭借技术壁垒、全栈能力或生态协同,不仅获得融资倾斜,还通过与车企深度绑定形成数据闭环,市场占有率同步攀升 [7] - 中小玩家面临“融资难”与“成本高”的双重压力,生存策略要么是聚焦环卫、矿区等封闭细分场景,要么是通过并购或合作融入头部生态链 [7] 技术落地与商业化挑战 - 自动驾驶技术落地难度远超预期,从实验室到规模化量产需要跨越技术可靠性、场景适配性、成本控制等多重难关 [4] - 行业仍未形成清晰稳定的盈利路径,多数企业依赖与车企的合作研发收入,商业化变现能力不足,长期投入与有限回报的矛盾突出 [5] - 具体商业化路径仍不清晰,例如Robotaxi日均订单量远低于网约车,L3级功能的法律风险尚未完全厘清,传感器与算力成本仍居高不下 [9] 未来破局方向 - 技术必须回归“场景落地”,头部企业通过一体化架构提升复杂路况处理能力,例如Momenta的“一段式端到端大模型”已在城市NOA场景中实现60.1%的市占率 [10] - 商业模式亟需创新,从一次性买断制转向“硬件预埋+软件订阅”或“按使用付费”模式,以降低初始投入门槛 [10] - 政策与产业链协同成为关键变量,2025年中国已启动L3级自动驾驶试点并推动高精地图标准体系建设,为企业提供了新的合规落地窗口期 [10]
渣打银行李海强:连接大湾区与世界,为中国企业出海注入新动力
21世纪经济报道· 2025-12-08 16:33
文章核心观点 - 中国企业出海已成为其增长的新引擎和国际化发展的关键路径 企业出海正从“走出去”向“融进去”阶段深化 面临跨境金融挑战 而金融创新 特别是大湾区构建的跨境金融生态 能够为企业提供关键支持 [1][2][3] 企业出海趋势与现状 - 企业出海呈现千帆竞发势头 “新三样”成为全球产业链重要力量 不少中资企业已成为行业领导者 [1] - 出海地域从传统欧美市场 进一步深入到东盟、中东、拉美等“一带一路”市场 [1] - 中国企业正加速迈向全球价值链高端 在出海过程中展现了强大的供应链整合能力 并越来越重视融入当地及承担企业责任 [1] - 截至2024年底 中国境内投资者已在全球190个国家和地区设立了5万多家境外企业 2024年有70%的境外企业实现了盈利或持平 [3] 出海面临的金融挑战 - 出海企业面临资金管理、融资、供应链协调、货币结算和汇率风险等跨境金融挑战 [2] 金融创新与支持实践 - 渣打银行自2016年布局支持新经济企业 并于2021年正式成立新经济业务团队 提供全方位一站式服务 [2] - 渣打银行作为唯一收款银行支持小马智行在美国纳斯达克上市 并作为主收款银行协助其完成香港上市 后者是2024年全球驾驶行业规模最大的IPO [2] - 渣打银行是海外人民币业务网络覆盖最广的外资银行 也是首家同时在内地和香港直接参与人民币跨境支付系统的外资银行 [2] - 渣打银行利用自贸区政策 成功为一家央企完成一笔十年期美元、人民币货币掉期业务 帮助客户降低项目融资成本并管理长期汇率风险 [2] - 渣打银行致力于用科技驱动金融创新 大量投资人工智能、数字资产等技术 并在广州建立集团级人工智能技术研发中心 [3] - 渣打银行与多家中国头部科技公司达成战略合作 以支持出海企业提升全球司库管理 [3] 大湾区跨境金融优势 - 大湾区凭借优越地理位置、国家开放战略、技术优势与区内协作 构建了中国最有活力的跨境金融生态 [3] - 通过人民币国际化、互联互通等创新机制 大湾区可为出海企业提供更低成本、更高效率的全球化金融支持 是企业打造全球运营能力的理想土壤 [3] - 渣打银行作为深耕大湾区超过160年的国际银行 将继续发挥“超级连接器”作用 连接大湾区与世界、金融与科技 推动跨境金融创新 [4]
达晨、华控领投,极佳视界A2轮再融2亿,押注“世界模型+行动模型”原生架构
钛媒体APP· 2025-12-08 15:17
公司融资与团队背景 - 具身智能公司极佳视界在3个月内连续完成Pre-A、Pre-A+、A1及A2四轮融资,累计融资额达5亿元,其中A2轮融资2亿元 [2] - 本轮融资由达晨财智领投,老股东华控基金联合领投,多家知名机构跟投,老股东合鼎共资本超额追加投资 [2] - 公司创始人兼CEO黄冠博士拥有清华大学自动化系创新领军工程博士背景,曾担任地平线机器人视觉感知技术负责人、鉴智机器人合伙人兼算法副总裁,并曾在三星中国研究院、微软亚洲研究院等顶尖科研机构工作 [2] - 创始人团队在过去十年深度参与并推动了物理AI从技术萌芽到产业落地的关键演进,带领团队在FRVT、COCO、VOT等全球最具影响力的视觉AI竞赛中多次斩获冠军,并实现多项技术的大规模产业化应用 [2] 核心技术优势与历史成就 - 在自动驾驶领域,公司团队提出的BEVDet系列方法已成为全球最具影响力的BEV感知范式之一,长期稳居nuScenes榜单首位,并已实现规模化量产 [3] - 团队主导了地平线AIDI平台(业内最大规模的数据闭环系统)以及百度Apollo仿真框架的研发与商业化落地,奠定了其在智能系统工程化方面的领先优势 [3] 行业趋势与公司战略判断 - 行业正加速向通用行动模型(如VLA与世界行动模型)演进,数据来源日益依赖真机实采与高保真世界模型合成,学习范式逐步统一为“模仿学习 + 强化学习 + 世界模型”的融合架构 [3] - 公司判断物理AI正迈入决定性突破的关键窗口期,未来2至3年将是物理AGI从实验室走向规模化落地的分水岭 [3] - 随着世界模型与行动模型的持续跃迁,属于物理世界的“ChatGPT时刻”正在加速到来 [3] - 公司面向具身智能新时代,率先提出“世界模型 + 行动模型 + 强化学习”的原生AGI范式,强调以世界模型为核心驱动力,贯通数据生成、模型训练与决策执行全链路 [3] 核心产品发布:模型与机器人平台 - 公司已正式发布两大物理AGI核心模型:原生行动模型GigaBrain-0与原生世界模型GigaWorld-0,并同步推出高自由度具身智能机器人平台Maker H01,共同构建端到端的具身智能系统 [4] - GigaBrain-0是一款基于视觉-语言-动作(VLA)架构的端到端决策控制模型,可融合图像、深度、文本及本体状态等多模态输入,输出结构化的任务规划与运动指令 [5] - GigaBrain-0重点强化了3D空间感知与结构化推理能力,以提升在复杂环境中的导航精度与长序列任务执行能力,具备更强的泛化性能 [5] - GigaWorld-0是公司自研的高质量世界模型,依托“GigaWorld”平台,通过几何一致、物理准确的建模机制生成高保真、可控且多样化的具身交互数据,实现高效“数据放大” [6] - GigaWorld-0构建了目前最完整的具身训练数据体系,在三大关键泛化维度(新纹理、新视角、新物体位置)上实现近300%的性能提升 [6] - 在PBench(Robot Set)基准测试中,GigaWorld-0以最小参数量实现最高整体性能,成为当前最具性价比的世界模型方案 [6] - Maker H01是专为家庭、商业服务与轻工业等开放场景设计的高自由度具身机器人,采用双臂 + 全向全驱移动底盘架构,全身拥有20+自由度,单臂支持公斤级负载,配备多指灵巧手爪 [6] - Maker H01标准版高度约1.6米,适配多种空间环境,适用于物品取放、巡检、接待、实验协助、仓储搬运等真实业务场景 [6] 产品性能与应用场景 - GigaBrain-0已成功应用于一系列高难度、长程的具身任务,在真实场景中展现出卓越的综合能力,能稳定高效地完成制作咖啡、叠衣服、整理卷纸、桌面清理、倒饮料、搬运箱子、拾取衣物等复杂任务 [5] - 在多项权威基准测试中,GigaBrain-0的任务成功率显著超越当前最先进的方法(SOTA) [5] - Maker H01不仅是可靠的作业平台,也是高效的算法验证载体,支持多种遥操作方案,并与自研“具身大脑”GigaBrain深度集成,实现抓取、搬运、协作等复杂动作的全身协同控制 [7] - 通过GigaBrain-0、GigaWorld-0与Maker H01的三位一体架构,公司正加速推动具身智能从实验室走向规模化落地,迈向真正“可用、可靠、可泛化”的物理AGI时代 [7]
孙志洋:“十四五”时期广州GDP增量预计达7000亿元
南方都市报· 2025-12-08 13:21
宏观经济与城市发展 - 2024年广州地区生产总值达到3.1万亿元,“十四五”时期GDP增量预计达7000亿元 [1] - 社会消费品零售总额、外贸进出口总值连年保持“双万亿、双增长”势头,成为全国第三个消费、外贸“双万亿”城市 [1] - 全市实有经营主体超425万户,比2020年末增长58%,总量跃居全国第二位 [4] - 新设外资企业数量超3万家,在穗投资世界500强企业增至368家 [4] 现代化产业体系与科技创新 - 积极谋划建设“12218”现代化产业体系,工业投资从2020年的1030亿元增长到2024年的1711亿元,增幅达66% [3] - 6个先进制造业集群产值超千亿,10个服务业增加值超千亿元 [3] - 先进制造业增加值占规上工业比重提升至60%,生产性服务业增加值占服务业比重提升至59% [3] - 新型显示、生物医药、低空产业、自动驾驶等一批战略性新兴产业稳居全国第一方阵 [3] - 全社会研发经费投入近两年每年保持千亿元规模 [3] - 24家企业入选全球独角兽榜,数量是2020年的3倍 [3] - 在手机射频器件、核心工业软件、新型显示等细分领域打破国外技术垄断 [3] 基础设施建设与城市更新 - 白云机场迈入“五条跑道+三座航站楼”运行时代 [4] - 广州港港口货物、集装箱吞吐量位居世界第五、第六位 [4] - 广州南站旅客发送量、广州快递业务量稳居全国第一 [4] - 地铁运营总里程增至768公里 [4] - 52个城中村改造项目纳入国家计划并全部开工 [4][5] 营商环境与对外开放 - 实施营商环境改革一号工程,推出660项进一步全面深化改革举措 [4] - 创新设立投资发展委员会、关键产业办公室,推进要素市场化配置综合改革试点 [4] - 驻穗领馆、国际友城分别增至69家和111个 [4] - 较好完成《南沙方案》第一阶段发展目标,南沙自贸区形成45项、136项制度创新成果分别在全国全省推广 [4] 社会民生与公共服务 - “十四五”期间累计新增就业163.4万人,稳居全省第一 [5] - 新增基础教育公办学位46万个,普通高中招生计划增至9万个 [5] - 三甲医院实现11个区全覆盖 [5] - 农村居民人均可支配收入突破4万元 [5] - 连续三年获评中国最具幸福感城市 [5] 生态环境与安全治理 - PM2.5浓度再创历史新低,20个国考断面水质全面优良 [5] - 建成最小应急单元超3万个,连续13年未发生重大及以上事故 [6] - 案件类警情、刑事立案数实现连年下降 [6] - 获批首批全国社会治安防控体系建设示范城市、全国法治政府建设示范市 [6]
Waymo决定召回无人驾驶汽车,以解决超校车问题
观察者网· 2025-12-08 11:49
核心事件概述 - Waymo宣布自愿召回其无人驾驶汽车(Robotaxi),原因是车辆经过校车时未按规定减速停车 [1] - 公司已向美国国家公路交通安全管理局(NHTSA)提交自愿软件召回,并声称已实施的软件更新显著提升了相关场景下的性能 [1] 违规与调查详情 - 根据美国交通法规,校车亮红灯并伸出停车臂时,所有车辆必须立即停车,这是全国最严格、处罚最重的法规之一 [3] - 自本学年开始以来,Waymo的Robotaxi在得克萨斯州至少19次非法驶过校车而未停车 [3] - NHTSA于10月对学区附近的Waymo车辆展开调查 [3] - 在Waymo宣布软件更新后,整个11月得州奥斯汀独立学区仍报告了5起不停车事件 [3] 监管要求与公司回应 - 得州奥斯汀独立学区要求Waymo在上学和放学期间停止在学校周围运营,直到确保车辆不再违规 [3] - NHTSA于12月3日要求Waymo在2026年1月20日前回答相关质询 [3] - Waymo拒绝停止Robotaxi在学校周围的运营,并认为其软件更新使车辆性能优于人类驾驶员 [3]