自动驾驶
搜索文档
赴港IPO,成了“全村的希望”
36氪· 2025-12-26 08:57
行业现象:智能化供应商扎堆赴港IPO - 多家中国GPU及汽车智能化供应商公司正密集寻求在香港上市,例如壁仞科技已通过港交所聆讯并计划于1月2日上市,另有大批公司处于赴港IPO进程中[3] - 此轮上市热潮的主要驱动力是香港交易所上市制度的优化,特别是新增的第18C章节,该规则允许尚未盈利但拥有核心技术的“特专科技公司”上市,为智能汽车等新兴行业提供了关键的融资路径[3][9] - 港股市场在2025年活跃度显著提升,年内已完成102家企业上市,总募资金额高达2724.76亿港元,同比激增226.62%,创下四年新高;截至12月17日,处于IPO聆讯处理阶段的企业多达298家[3] 上市动机与公司状况 - 部分大型零部件企业赴港上市的核心目的是募集资金,用于技术突破、海外扩产及巩固市场领先地位[5] - 然而,更多的供应商企业上市是出于紧迫的“造血”需求或对赌协议压力,其自身盈利能力不足,上市融资成为维持运营和发展的必要手段[6] - 以驭势科技为例,该公司在2022年至2024年期间除税前亏损分别为2.5亿元、2.13亿元和2.12亿元,2025年上半年净亏损1.10亿元,三年半累计亏损达7.85亿元;截至2025年6月30日,其现金及等价物仅为1.70亿元,面临较大的资金压力[8] 港股18C章规则特点 - 港交所第18C章规则放宽了对企业盈利能力的硬性要求,转而看重企业的“硬科技实力”和“未来增长潜力”[9][10] - 该规则对研发投入有明确要求:对于已商业化公司,若最近一个会计年度收益在1.5亿至2.5亿港元之间,其研发开支需占总营运开支至少30%;对于未商业化公司,若收益少于1.5亿港元,研发开支占比需至少达到50%[9] - 港股市场对科技企业的估值逻辑更注重未来成长性而非短期盈利,且融资流程效率高、规则灵活,与国际资本对接能力较强,对未盈利企业更为包容[9][10] 细分赛道竞争格局 - 寻求上市的汽车智能化供应商大致可分为智驾、智舱和传感器(如激光雷达)三大领域[11] - 在智驾Robotaxi赛道,规模效应至关重要,企业需要达到千辆至万辆级别才能覆盖成本;例如,文远知行自动驾驶车队规模为1600辆,小马智行Robotaxi车辆总数达961辆[12] - 在激光雷达领域,禾赛科技、速腾聚创、图达通及华为引望已形成清晰的四强竞争格局,其他企业难以获得同等竞争地位;在解决方案和智能座舱领域,也分别有数家领先企业正在角逐[12] 行业面临的共同困境与挑战 - 汽车智能化供应商普遍面临持续亏损、资金压力大、“自我造血”能力不足的困境,上市募资成为解决“补血”需求的为数不多的出口之一[10][14] - 行业面临技术路线快速迭代、车企“极致内卷”挤压供应商利润、以及持续高研发投入影响短期盈利等多重压力[14][16] - 即使成功上市也并非终点,企业仍将面临来自技术、产品、市场和客户的持续压力,最终需要依靠核心技术、盈利能力和商业模式的真功夫来证明长期价值[16]
刷新NAVSIM SOTA,复旦提出端到端自动驾驶新框架
具身智能之心· 2025-12-26 08:55
文章核心观点 - 端到端自动驾驶的范式正从模块化向VLA模型主导的“大一统”转变,但主流自回归生成范式存在局限性,其强制性的“从左到右”时序逻辑与人类“以终为始”的驾驶直觉不符,且基于模仿学习的模型易陷入“平均司机”陷阱 [1] - 复旦大学与引望智能联合提出的WAM-Diff框架,通过引入离散掩码扩散模型、结合稀疏混合专家架构与在线强化学习,构建了一套非自回归的生成式规划系统,有效解决了上述痛点 [2] - WAM-Diff在权威评测基准NAVSIM上取得了最先进的成绩,证明了非自回归生成范式在复杂自动驾驶场景下的巨大潜力,是通往高阶自动驾驶的关键技术探索 [2][25] 技术框架与核心创新 - **生成逻辑重构**:WAM-Diff的核心创新在于重新思考生成逻辑,采用Masked Diffusion作为生成骨干,从全掩码序列出发,利用双向上下文信息并行预测所有Token,实现了全局优化,摆脱了自回归模型单向时序的束缚 [4][5] - **动作表示离散化**:框架引入了混合离散动作分词技术,将连续的2D轨迹坐标量化为高精度离散Token,并与驾驶指令的语义Token置于共享词表中,实现了在统一特征空间内的理解与规划 [5] - **“以终为始”的解码策略**:通过探索因果序、反因果序和随机序三种解码策略,发现反因果序策略表现最佳,即先确定远期驾驶意图再反推近期动作,从模型层面验证了人类驾驶员的直觉思维,并取得了91.0的PDMS最高分 [9][20][21] 模型架构与训练优化 - **稀疏混合专家网络**:通过集成LoRA-MoE架构,模型包含64个轻量级专家,能根据场景动态路由与稀疏激活,在控制计算开销的同时显著提升了模型容量与场景适应性 [12] - **多任务联合训练**:模型通过驾驶VQA等任务进行联合训练,使专家网络不仅掌握驾驶技能,更理解决策背后的因果逻辑,增强了规划的可解释性与泛化能力 [12] - **在线强化学习优化**:引入了分组序列策略优化算法,将优化粒度从单步Token提升至完整轨迹序列,依据安全性、合规性及舒适性等多维指标对整条轨迹评分,引导模型生成更安全、更规范的规划结果 [14] 性能表现与实验结果 - **NAVSIM-v1基准测试**:WAM-Diff取得了91.0的PDMS分数,超越了DiffusionDrive、ReCogDrive以及DriveVLA-W0等主流基线模型 [16][17] - **NAVSIM-v2基准测试**:在引入了更严格指标的v2测试中,模型取得了89.7的EPDMS成绩,相较于DiffusionDrive提升了5.2分,证明了其在平衡安全性、合规性与舒适性方面的稳健性 [18][19] - **消融研究验证**:对解码策略的消融研究证实,反因果序策略取得了最佳的闭环性能,支持了“以终为始”规划直觉的有效性 [20][21] - **定性分析**:可视化结果展示了模型在复杂博弈场景下的稳定性,验证了MoE架构与GSPO在提升长尾场景鲁棒性方面的作用 [22]
四大证券报精华摘要:12月26日
中国金融信息网· 2025-12-26 08:24
L3级自动驾驶商业化与风险 - 工信部公布首批L3级车型准入许可 重庆、北京两地发放专用号牌 迈出L3级自动驾驶商业化关键一步 [1] - L3级“有条件自动驾驶”模式下 驾驶责任首次出现“人机转移” 风险核心侧重于系统可靠性、算法决策、传感器性能等变量 [1] - 市场关切事故责任划分 目前市面上的“智驾险”实为车企或智驾方案供应商提供的兜底方案 并非真正保险险种 [1] 创新药与ADC研发进展 - 恒瑞医药及子公司注射用SHR-A1904被纳入突破性治疗品种名单 该药为靶向Claudin18.2的抗体药物偶联物(ADC) [2] - 近期康宁杰瑞、百利天恒、科伦博泰等多家创新药企在ADC研发领域加速突破 中国企业已成为全球ADC创新引擎 [2] - ADC药物作为肿瘤治疗领域的革命性疗法 其市场增长潜力较大 [2] 宏观政策与市场流动性 - 央行12月MLF再度加量续作 实施4000亿元MLF操作 在对冲到期压力后实现净投放1888亿元 延续“稳中偏松”的流动性调控思路 [3] - 2025年全年 MLF净投放超1万亿元 持续呵护市场流动性 [3] - 中国人民银行货币政策委员会2025年第四季度例会提出 用好证券、基金、保险公司互换便利和股票回购增持再贷款 维护资本市场稳定 [9] 资本市场动态与券商业务 - 2025年券商IPO承销总金额达1250.44亿元 相较于2024年的673.53亿元近乎翻倍 同比增长显著 [6] - 年内A股上市公司定增募资额同比大增超375% 为券商带来更多业务机遇 券商年内合计斥资超107亿元认购上市公司增发股份 [8] - 2025年以来共有111家企业成功登陆A股 首发募集资金合计达1253.24亿元 其中102家隶属于战略性新兴产业 [9] 外汇市场与亚洲货币走势 - 2025年年末亚洲货币走势显著分化 人民币汇率展现强劲反弹态势 日元与韩元则深陷“贬值风暴” 对美元跌幅远超同期美元指数涨幅 [4] - 面对货币贬值压力 日韩当局近期密集出手 通过口头警告、政策调整等多种方式打响“货币保卫战” [4] 低空经济发展与挑战 - 低空经济在2024年、2025年均被写入政府工作报告 并亮相“十五五”规划建议 成为最具潜力的未来产业赛道之一 [5] - 2025年低空经济在多元化场景中发展 并作为新质生产力的代表之一深入海外市场 投资机构持续助推头部整机企业商业化并加码布局上游核心技术 [5] - 低空经济快速发展同时 商业模式、基础设施、标准细则等产业瓶颈也逐步浮现 需在技术创新、基础设施完善、安全监管强化等方面协同发力 [5][6] 光伏行业整合与挑战 - 北京光和谦成科技有限责任公司注册成立 被确认为酝酿已久的“多晶硅产能整合收购平台” 由主管部门联合指导、多家龙头骨干企业共同发起 [7] - 收储平台的成立被视为破解光伏“内卷式”恶性竞争的关键行动之一 为行业自律及“反内卷”画上阶段性句号 [7] - 光伏行业仍面临难题 预计明年国内光伏新增需求将出现近年来首度下滑 硅料价格上涨能否带动下游环节价格回升仍存不确定性 [7] 气候信息披露准则出台 - 财政部会同生态环境部等多部门制定了《企业可持续披露准则第1号——气候(试行)》 为国内首个聚焦气候相关信息披露的具体准则 [4] - 气候准则分为治理、战略、风险和机遇管理、指标和目标四个部分 规定了企业在气候相关治理、战略等方面的披露要求 [4] 全球及A股市场表现 - 12月25日 A股三大指数延续升势 沪指录得七连阳 商业航天、大飞机、卫星导航等板块掀起涨停潮 [2] - 2025年新兴市场资产表现亮眼 MSCI新兴市场指数今年以来累计涨幅近30% 在美联储降息、美元走弱的宏观环境下 以中国为代表的新兴市场迎来配置窗口期 [2] - 年内沪深上市公司累计披露重大资产重组超200单 标的集中分布于半导体、信息技术、高端装备制造等关键赛道 [9]
停电事件后,Waymo因暴雨警报再度暂停旧金山自动驾驶叫车服务
新浪财经· 2025-12-26 08:22
公司运营动态 - Waymo于周四暂停了旧金山湾区的自动驾驶出租车服务 原因是该地区预计有暴风雨 根据国家气象局的暴雨洪水警报 [1][3] - 美国国家气象局将整个旧金山湾区的洪水警戒延长至当地时间周五晚上10点 [1][5] - 上周末 旧金山突发停电导致Waymo的数十辆自动驾驶出租车在十字路口集体停摆 造成多个路段交通严重瘫痪 [1][5] - 本周早些时候 Waymo表示将更新其车队 以便在停电期间能更好地运行其自动驾驶出租车服务 [1][5] 业务扩张与布局 - Waymo目前在五个美国市场运营商业无人驾驶服务 而2024年底只有三个 [1][5] - 其自动驾驶出租车服务今年已在奥斯汀 旧金山湾区 凤凰城 亚特兰大和洛杉矶运营 [1][5] - 有报道称 该公司计划在2026年大幅扩大其在美国国内外的服务范围 [1][5] 行业监管与挑战 - 随着Waymo试图扩大其自动驾驶出租车服务 该公司正面临越来越多的公众监督和安全担忧 [1][5] - 旧金山市政交通管理局前首席执行官杰弗里·图姆林指出 监管机构和公司可从上周旧金山停电期间Waymo车辆引发的混乱中吸取教训 [1][6] - 图姆林建议 监管机构应考虑根据一天中的时间 地理位置和天气 设定城市街道上自动驾驶汽车的合理数量 [2][6] - 他提议监管机构建立一个分阶段的系统 允许自动驾驶汽车公司在满足特定测试的情况下迅速扩大运营规模 [2][6] - 其中一项测试是评估自动驾驶汽车在遇到令人困惑的情况(如没有红绿灯的十字路口)时 能多快安全驶离车流 [2][6] - 图姆林还建议 城市和监管机构应从自动驾驶出租车公司获取更多数据 以了解其车辆在停电 洪水或地震等预期紧急情况下的计划或实际表现 [2][6]
每6个人就有一个“老板”,广东做对了什么?
21世纪经济报道· 2025-12-25 21:12
广东经营主体规模与结构 - 截至9月3日,广东省登记在册经营主体突破2000.19万户,较2024年末增长5%,总量稳居全国第一 [2] - 按1.28亿常住人口计算,平均每6个人中就有1个“老板”,深圳、广州包揽全国城市“老板”数量冠亚军 [2] - 经营主体构成多元,民营经济组织占比高达96.45%,同比增长6.47%,其中私营企业超过834万户,个体工商户超过千万户 [3] - 外商投资企业达23万户,较2024年末净增1.5万户,增长6.97% [4] 新兴产业与增长动能 - 今年以来,广东每新设10家企业中,有近4家属于人工智能、平台经济等“四新经济”领域 [4] - 1~10月,广州在低空经济与航空航天、人工智能、时尚消费品等领域的新登记主体增速均超过100%,未来网络与量子科技领域增速高达243.36% [4] - 前三季度,广东先进制造业、高技术制造业增加值分别增长5.4%和6.4%,增速显著高于全省规上工业平均水平 [5] - 依托9个万亿级产业集群,形成紧密的产业协同网络,例如视源股份吸引137家新型显示规模以上企业集聚,2024年该产业产值超1500亿元 [5] 经济效能与商业成就 - 前三季度,广东省GDP突破10.5万亿元,同比增长4.1% [5] - 2025年《财富》中国500强排行榜中,有76家在粤企业入围 [2][5] - 《2025胡润百富榜》中,广东有273位企业家入榜,接近榜单总人数的两成 [5] - 今年前11个月,广东外资企业进出口增速为6.7%,高于同期整体增速2.5个百分点 [4] 企业成长与政策支持 - 2024年,广东自然人首次担任股东的初创企业有87.64万户 [6] - 广东持续推进“个转企”,今年已完成1.13万户,累计培育“名特优新”个体工商户4.2万户 [3] - 截至2024年底,广东累计培育专精特新“小巨人”企业超2000家,专精特新中小企业超3万家、创新型中小企业超5万家 [7] - 《广东省推动专精特新企业高质量发展的指导意见》从财税、金融、人才、用地等方面给予政策支持 [6] 创新生态与长期发展 - 广东为企业提供早期支持,例如越疆科技在2015年获得深圳100万元创业补助资金,并受益于本地强大的供应链 [6] - 广东通过开放应用场景支持前沿创新,如广州南沙为小马智行创造了多个自动驾驶测试的“全国第一” [9] - 政策开放助力企业发展,小马智行已完成“美股+港股”双重上市,其第七代Robotaxi在广州率先实现城市级单车盈利转正,三季度毛利率为18.4%,较去年同期的9.2%显著提高 [10] - 《广东省优化营商环境条例》及全省11个地级市出台的地方性法规,为企业提供了信心和底气 [9]
一家投资OpenAI的硅谷基金的深度研究
36氪· 2025-12-25 19:33
文章核心观点 - 访谈嘉宾Freda Duan作为硅谷一线科技投资人,从一二级市场Crossover基金的视角,系统分析了当前美国科技投资的三大主线、明星公司的商业模式与竞争格局、以及AI浪潮下的投资机会与市场演变 [5][7][12] - 大模型公司的商业模式本质是“负向滚雪球”,其现金流能否转正取决于训练成本增长的停止或收入回报率的极大提升,OpenAI是当前一二级市场最重要的估值标杆 [16][17][45] - 2026年的投资展望将聚焦于能产生实打实AI收入的“应用公司”,市场情绪已从奖励单纯投入AI转向奖励有实际收入的公司,AI基础设施公司可能跑输AI应用公司 [109][110] 美国投资主线与市场演变 - **三条核心投资主线**:当前美股投资清晰围绕三条主线展开:1) **AI**(芯片与云);2) **再工业化**(制造业回流、稀土、数据中心、能源基建);3) **金融产业数字化**(稳定币、支付创新)[12] - **主线间的闭环联系**:再工业化带来的万亿级别基建投资(如日韩承诺投资美国一万亿)将为AI数据中心提供能源支持;金融创新(如稳定币法案、Agentic Commerce)将与AI应用形成另一个闭环 [13][14] - **市场情绪剧烈波动**:2020年后美股波动加剧,纳斯达克历史上仅6次跌幅超20%,但2020年后就经历了3次 [10] - **AI浪潮的预兆**:早在2022年市场低迷时,大模型公司如Inflection AI、Anthropic等A轮融资额达数亿美金,远高于平均1000万美金,且用VC的钱做资本支出,已是明显异常信号 [10][11] - **中国市场观感**:美国投资人近期频繁访华,对中国电动车和机器人感到震撼,但实际投资金额未有明显变化;他们关注中美谈判结果及港股科技IPO的活跃度,后者将影响资金回流 [14] 大模型公司商业模式与竞争分析 - **商业模式本质**:大模型公司成本大头是GPU,遵循Scaling Law,训练成本每年可能上涨10倍,其商业模式是“负向滚雪球”,即每年现金流比上一年烧得更多 [16] - **现金流转正条件**:只有两种可能:1) 收入增长远超前一年(如从2倍变为更大倍数);2) 停止烧钱训练下一代模型 [16] - **与Netflix的类比**:Netflix也曾是资本密集型、现金流负向滚雪球的业务,其现金流在2020年因内容成本(类比训练成本)增长幅度下降而从-30亿大幅翻正至20亿 [17][18] - **OpenAI收入结构**:据媒体报道分为四条线:1) ChatGPT(含企业版)占75%;2) API收入;3) Agent业务;4) 新产品。后两条线增长更快,未来占比更大 [19] - **OpenAI收入预测**:公司预测年底达200亿年化营收,今年收入约130亿;仅ChatGPT若达3亿付费用户(每月30美元),即可贡献约1000亿收入体量 [19][21] - **Anthropic的差异化**:其超过80%是To B业务,毛利率提升迅速,在一年内从收入1元亏2元的水平提升至与OpenAI相近的毛利率 [38] - **增长路径对比**:从1亿到10亿收入,OpenAI更快(不到两个季度),但从10亿往上,Anthropic速度反超,其年化收入从10亿到70亿仅用10个月 [39] - **财务预测假设差异**:OpenAI假设算力总投入在2028年后不再增长,靠训练成本增速放缓提升利润率;Anthropic则假设模型ROI逐年提升,靠更高回报率拉动利润 [42] 头部公司深度研究 - **OpenAI的竞争与定位**: - 内部最大竞争对手是谷歌,而非Anthropic或xAI [25] - 谷歌占位完美,拥有面向消费者的搜索、YouTube,面向企业的Workspace,以及从云到自研芯片的纵向整合 [25] - 谷歌Gemini拥有6.5亿月活,对比GPT约10亿月活,可通过价格战(利用TPU成本优势)和捆绑销售(如与YouTube订阅捆绑)竞争 [26] - 搜索护城河已变:传统搜索靠前几条结果致胜,现在AI搜索能不辞辛苦翻查数十页找到最佳信息,降低了搜索索引的壁垒 [33][34] - 市场可能低估其企业端业务,个人与企业用户占比目前差不多,企业端作为超级入口的想象空间很大 [20][21] - **谷歌的逆转与挑战**: - 逆转原因在于模型能力追上及搜索广告收入尚未下滑 [28][29] - 内部通过将激励与模型榜单排名绑定,激发了研发效率 [29] - 但来自OpenAI的威胁真实存在,当GPT开始做广告或Agentic Commerce时,可能侵蚀谷歌保险、律所等核心广告商预算 [27] - **OpenAI的管理与估值**: - Sam Altman虽非技术背景,但员工信服,其强信念引领了AGI市场 [35] - 近期提出的1.4万亿美元算力投资计划因数字过大、时间线拉得太远而惊吓市场 [36] - 从300亿到5000亿估值,因股权稀释严重,每股价值增长约为6倍,而非接近20倍 [37] - 与微软厘清股权及可能的万亿市值IPO计划被视为合理操作 [37] 其他明星公司分析 (Robinhood) - **商业模式本质**:证券交易业务周期性很强,是一手“烂牌”,但公司通过三方面改善:1) **业务多元化**,已发展出11条收入超1亿的业务线;2) **抢占市场份额**以平滑周期;3) **掌握定价权**,如加密交易佣金从10个基点涨至60个基点 [46][47] - **成本控制卓越**:自2022年起运营成本零增长,严格控制成本端以配合收入波动 [47] - **用户与增长潜力**:用户平均年龄34岁,平均资产约1万美元,远低于嘉信理财的15万美元;美国35-40岁年龄段财富会有3倍跨越,用户自然成长将带来资产增长 [50] - **区别于Beta逻辑**:相对于比特币或纳斯达克,Robinhood表现出明显的Alpha,并非简单的“牛市买券商”逻辑 [49] - **未来展望与创新**:最有机会成为一站式金融应用,可能推出VC基金,让普通人能投资如OpenAI、SpaceX等明星公司股份;已通过代币化策略巧妙进入欧洲市场 [55][56] - **团队与文化**:创始人Vlad具有“坏小孩”特质,敢想敢干,深受散户喜爱;公司2022年重组为Single GM架构,各业务单元高度自主,产品推出速度极快 [57][58] 自动驾驶与机器人投资 - **自动驾驶进展**: - Waymo是今年最大惊喜,执行超预期,开城速度加快(从三番5年缩短至硅谷半年),成本约几千万美金一城 [67][68] - 目前运营2500辆车,年化收入约8亿美元,在三番已盈利;与韩国现代有现成工厂可支持10万量产 [69] - 市场巨大:美国年驾驶里程约3万亿英里,若Robotaxi每英里收费1美元(远低于Uber的3美元),将是3000亿美元年收入市场 [72] - **Waymo vs Tesla**: - Waymo面临硬件成本问题,整车加传感器成本约17-18万美元,难以降至特斯拉级别;Tesla则面临软件问题,纯视觉方案尚未在Robotaxi上完全证实 [71] - 市场可能收敛至这两家主要玩家 [72] - **技术路径思考**:当前自动驾驶多采用模仿学习的小模型,可能需通用大模型真正理解驾驶规则以解决边缘案例 [74] - **机器人领域现状**: - 赛道火热但尚处早期,Locomotion(移动)基本解决,但Manipulation(操作)仍落后 [75] - 在硬件形态(人形/四足)、数据来源(真实/模拟)等技术路径上缺乏共识 [75] - 过于缺乏数据,评估困难,投资人难以定性判断和下重注 [76] - 预期2-3年内出现“GPT时刻”,即能完成叠衣服等通用动作 [77] - **中美对比**: - 自动驾驶:中国因电动车普及,车身摄像头多,数据采集优势明显,预计发展良好且有更多玩家 [79] - 机器人:中国硬件制造能力世界领先 [80] 硅谷投资圈洞察 - **VC与二级市场投资逻辑差异**: - 二级市场追求**非共识**的高风险高回报(如反转投资);VC投资追求**共识**,需要市场持续支持公司多年 [81] - VC基金规模与回报存在矛盾,大规模基金(如200亿美元)难以实现高倍数回报;数据显示,实现5倍DPI的基金大多规模较小(最大5亿美元) [90] - 二级市场容量无限且流动性好,当难以判断一级市场多个竞争者时,可通过重仓二级市场标的(如Nvidia)表达观点 [91] - **投资策略趋势**:顶级基金趋向于**集中仓位下重注**,深入研究少数最好的公司以获取超额收益,而非分散投资 [86][87] - **创始人类别偏好**:不同基金有不同审美,如Altos Ventures偏好专注的“刺猬型”创始人;Ribbit Capital偏好具有反叛者特质的“坏小孩”;Hummingbird VC偏好经历创伤、我命由我的“哪吒型”创始人 [84] 看好的AI应用方向 - **编程**:过去一年创造了50亿美元年化收入,是必须关注的世界级机会;但竞争激烈,谷歌等已开始提供免费编程工具 [92] - **视频**:美国媒体产业是8000亿美元大市场;AI使视频本身成为可被直接优化的对象,将催生百亿美元级公司;强判断是短视频(含短剧)将侵蚀长视频时长 [94][95][96] - **Agentic Commerce**:即AI代理替用户购物,将深刻影响电商、广告、支付格局;可能使亚马逊等平台损失广告收入并增加引流成本,而使Shopify和长尾商家受益 [97][98] - **AI应用公司与软件公司区别**:AI应用公司毛利率可能随用量增加而降低,但合同金额更大(如客服AI单价是传统SaaS的5倍),应关注绝对利润额而非毛利率 [99] 市场泡沫与AI经济账 - **AI收入来源**:美国“互联网电子税”总收入约4000亿(线上广告2600亿、电商佣金1000亿、订阅等500亿),若OpenAI实现2000亿营收,将严重侵蚀存量市场 [100] - **广告市场存量博弈**:美国广告总额过去20年年化增长5-6%,线上渗透率已达80%,总量难有大幅增长;OpenAI等新玩家进入将加剧广告收入竞争 [102] - **更大的想象空间在于劳动力市场**:美国GDP约30万亿,劳动力成本占15万亿;AI若能提升全球生产率,创造新的GDP增量,其巨额投资才算合理 [103] - **当前AI收入规模**:可追踪的AI收入约700亿,其中OpenAI和Anthropic占大头,其他所有创业公司合计仅几十亿 [105][107] - **泡沫判断**: - 当前肯定不是泡沫,AI应用落地速度远超以往,已产生数百亿收入且大公司ROIC在提升 [108] - 未来是否成为泡沫取决于两点:1) 模型能力是否持续进步;2) AI实际收入是否持续增长 [108] 2026年投资展望与Mega 7观点 - **核心思路**:市场将奖励有实打实AI收入的**应用公司**,AI基础设施公司可能跑输 [109] - **重点关注应用领域**:自动驾驶、多模态、端侧AI、企业端/实体经济AI应用、Agentic Commerce、太空(SpaceX)[110] - **Mega 7公司观点**: - **特斯拉**:核心看能否实现无安全员的Robotaxi,以及其对xAI等投资的股权稀释影响;颠覆性科技在“成功”前18个月投资最舒适 [111] - **苹果**:明年有“双击”可能,新Siri(3/4月)与折叠手机(9月)软硬件结合,可能出现类似谷歌的反转行情 [112] - **谷歌**:共识龙头,但面临广告存量市场竞争加剧的风险,OpenAI与TikTok都是强大对手 [113] - **Meta**:市场关注其重金投入后新模型Avacado的表现及能收回多少AI收入;明年现金流可能下跌,股价承压 [113] - **三朵云(微软、亚马逊、谷歌云)**:增速虽好,但竞争格局恶化,新玩家(如Oracle、Coreweave、模型公司自身)以低利润率入场,将挤压存量玩家利润 [115][116]
华科&港大提出UniLION:基于线性组 RNN 的统一自动驾驶模型
自动驾驶之心· 2025-12-25 17:33
文章核心观点 - 由香港大学、华中科技大学和百度联合研发的UniLION,是一种基于线性组RNN(线性注意力)的统一自动驾驶框架,旨在解决传统Transformer模型在处理大规模点云和多视角图像时计算效率低下的问题 [2][3] - 该框架作为单一多功能架构,无需显式的时序或多模态融合模块,即可无缝支持LiDAR-only、Temporal LiDAR、LiDAR-Camera和Temporal LiDAR-Camera等多种设置,并在一系列核心自动驾驶任务上实现了具有竞争力甚至最先进的性能 [3][4] - UniLION通过其线性计算复杂度和统一的特征表示,显著降低了计算资源需求和系统设计复杂性,为自动驾驶3D基础模型的开发提供了新视角,并展现出良好的部署潜力 [3][35][37] 研究背景与挑战 - 当前自动驾驶系统面临四大挑战:传统Transformer模型二次方复杂度的注意力机制导致处理长序列数据时计算开销显著;多模态融合通常需要专门设计的复杂模块;时序信息处理依赖额外的专用模块;在单一框架中实现感知、预测和规划等多任务学习具有难度 [5] 技术创新点 - **统一的3D骨干网络**:基于线性组RNN,能够无缝处理不同模态和时序信息,无需任何显式融合模块 [7][8] - **线性计算复杂度**:利用线性组RNN的线性计算复杂度,将多视角图像、LiDAR点云和时序信息直接转换为token进行拼接,在3D空间中进行统一融合 [8] - **紧凑统一的BEV表示**:能够将异构多模态信息和时间序列压缩成紧凑、统一的鸟瞰图特征表示,作为多种下游任务的共享特征 [8] - **多任务并行学习**:采用多任务共享的BEV特征,能够通过并行多任务学习,无缝处理感知、预测和规划等多种自动驾驶任务 [8] 核心架构:UniLION Block - **UniLION Layer**:利用线性组RNN操作符实现长距离特征交互,每个层包含两个操作符,分别基于X轴和Y轴窗口划分执行特征交互 [11] - **3D空间特征描述器**:由3D子流形卷积、LayerNorm层和GELU激活函数组成,解决将3D体素特征展平为1D序列时可能丢失空间信息的问题 [11] - **体素合并与扩展**:专为高度稀疏的点云数据设计,用于特征下采样和上采样,以获取多尺度特征 [11] - **自回归体素生成**:利用线性组RNN的自回归能力,在前景体素周围生成扩散体素,解决体素合并可能导致的信息丢失问题 [11] 统一特征表示与多任务处理 - **多模态特征学习**:将LiDAR点云量化为体素提取特征,同时将多视角图像特征通过深度预测转换为相机体素特征,两者连接后生成多模态体素特征,直接输入3D骨干网络进行融合 [13][15] - **时序特征学习**:将历史多模态体素与当前帧体素进行空间对齐后连接,构建时序体素,同样直接输入3D骨干网络自适应学习时序信息 [13][15] - **多任务训练策略**:采用动态损失平衡策略,计算每个任务的动态损失权重以对齐不同任务间的损失,公式为 $$w_{t a s k}={\frac{\mathcal{L}_{d e t}}{\mathcal{L}_{t a s k}+1e^{-5}}}$$,最终损失为各任务加权损失之和 [16][17][18] 实验结果与性能分析 - **整体性能表现**:在nuScenes数据集上,基于Swin-Tiny图像骨干的多模态UniLION模型在3D物体检测上达到**74.9% NDS**和**72.2% mAP**,在多目标跟踪上达到**76.2% AMOTA**,在BEV地图分割上达到**72.3% mIoU**,在3D占用预测上达到**50.8% RayIoU** [20] - **最强时序多模态版本**:在所有评估任务中均达到最先进或极具竞争力的性能:检测任务**75.4% NDS**和**73.2% mAP**,跟踪任务**76.5% AMOTA**,地图分割**73.3% mIoU**,占用预测**51.3% RayIoU**,车辆运动预测**0.57 minADE**,行人运动预测**0.37 minADE**,规划任务碰撞率仅**0.18%** [20] - **轻量级版本性能**:采用ResNet-50和较低图像分辨率的轻量版UniLION,仍获得**73.6% NDS**、**70.8% mAP**、**75.0% AMOTA**、**71.8% mIoU**和**50.2% RayIoU**的满意性能,表明其在计算资源受限环境下仍具实用性 [22] - **组件有效性验证**:3D空间特征描述器带来**0.7% NDS**、**0.8% mAP**、**1.9% AMOTA**、**0.5% mIoU**和**1.1% RayIoU**的性能提升;体素生成模块带来**0.6% NDS**、**1.1% mAP**、**2.7% AMOTA**、**0.1% mIoU**和**0.3% RayIoU**的提升;所有组件结合相比基线模型综合提升显著 [31] - **动态损失机制影响**:动态损失机制为检测任务提升**0.3% NDS**,跟踪任务提升**0.9% AMOTA**,地图分割提升**0.6% mIoU**,但3D占用预测性能略有下降 [26][29] - **多任务学习影响**:联合训练3D检测和地图分割时,地图分割性能从**68.3% mIoU**显著提升至**71.7% mIoU**;进一步加入占用预测任务后,占用预测能力获得**2.7% RayIoU**的显著提升 [27] 鲁棒性与效率分析 - **传感器错位鲁棒性**:模拟相机与LiDAR错位实验显示,即使在“高”错位级别(相机旋转5.0°并平移0.50m),多模态UniLION仅出现适度性能下降(**0.8% NDS**、**1.3% mAP**、**1.0% AMOTA**、**0.3% mIoU**和**1.4% RayIoU**),且始终优于仅使用LiDAR的版本,展现出强大鲁棒性 [32][36] - **参数鲁棒性**:对不同窗口大小和组大小的分析表明,UniLION在不同配置下表现出显著的稳定性和一致性能,具有良好的外推能力 [30][34] - **计算效率**:凭借线性组RNN的线性计算复杂度,UniLION显著降低了计算资源需求和推理时间,相比基于Transformer的方法在处理大规模数据时效率更高,更适合实际部署,特别是在计算资源受限的环境中 [35] 主要贡献与未来展望 - **主要贡献**:提出了统一的多模态处理框架,消除了对手工设计融合模块的需求;生成了紧凑统一的BEV特征表示作为多任务通用基础;在多项核心任务上实现了卓越性能;具备显著的计算效率优势 [38][44] - **未来展望**:计划将UniLION扩展到支持更多传感器模态(如毫米波雷达);在实际自动驾驶系统中进行应用验证;探索在更大规模数据上进行预训练以进一步提升泛化能力 [39][45]
香港运输署再批自动驾驶车辆先导牌照 涵盖转机停车场至机场海天中转大楼路段
智通财经· 2025-12-25 17:20
自动驾驶车辆牌照与测试项目 - 香港运输署再次批准了一项自动驾驶车辆先导牌照 [1] - 测试项目涵盖往来港珠澳大桥香港口岸“转机停车场”至香港国际机场海天中转大楼的指定路段 [1] - 获批准的测试路段由“转机停车场”至机场限制区入口 [1] 测试运营与安全规范 - 首阶段测试期间,每辆先导自动驾驶车辆上将配备后备操作员,以便在需要时接管车辆操控 [1] - 所有先导自动驾驶车辆须在车身展示香港运输署的先导自动车标签,以帮助其他道路使用者识别 [1] - 先导牌照的详情已上载至香港运输署的自动车测试网页 [1] 项目愿景与申请流程 - 香港运输署期望在完成测试后,项目能逐渐迈向载客运作 [2] - 该项目旨在便利经“粤车南下”自驾的旅客,旅客可在自动化“转机停车场”泊车后,乘搭自动驾驶车辆前往海天中转大楼转机 [1][2] - 香港运输署欢迎有兴趣的机构或企业提交先导牌照申请 [2] - 署方在接获申请后,将依据《自动驾驶车辆测试及先导使用实务守则》进行审批,考虑因素包括自动驾驶系统的设计运行范围及功能、相关的国家标准或国际标准/指引、以及道路测试情况等 [2]
天眼新知 从技术验证到商业量产,自动驾驶产业链的增长逻辑与机遇
环球网资讯· 2025-12-25 12:46
2025年中国汽车产业转型关键节点 - 2025年成为中国汽车产业转型的关键节点,新能源乘用车渗透率首次突破50%大关,标志着市场从“政策驱动”全面转向“市场驱动” [1] - 工信部正式发放首批L3级有条件自动驾驶车型准入许可,宣告自动驾驶从封闭测试迈入商业化应用新阶段 [1] - 两大趋势叠加重构了汽车产业竞争格局,并向激光雷达、域控制器、高精地图等核心产业链释放出明确的规模化需求信号 [1] 新能源汽车市场发展 - 2025年1-11月,新能源汽车产销量分别达1490.7万辆和1478万辆,同比大幅增长31.4%和31.2%,增速远超行业整体水平 [2] - 消费需求发生结构性变革,增换购需求跃居核心驱动力,2025年换购比例预计超60% [2] - Z世代成为消费主力,70%的年轻消费者将智能驾驶功能列为购车核心考量因素 [2] - 下沉市场成为新增长引擎,三线及以下城市新能源汽车销量增速高达61% [2] - 10-15万元大众价格区间成为市场主流,推动智能驾驶技术从高端车型向平民化普及 [2] - 纯电车型仍是市场主体,插混与增程车型2025年销量预计超800万辆 [5] - 新能源汽车企业正从单纯销售硬件转向“硬件+软件+服务”的盈利模式 [5] 新能源汽车产业生态 - 截至目前,中国现存在业、存续状态的新能源汽车相关企业超164.2万家 [2] - 2025年截至目前新增注册相关企业约30.4万余家,近五年注册数量逐年增长,并在2024年达到顶峰 [2] - 从区域分布看,广东省、山东省、江苏省新能源汽车相关企业数量位居前列,三个省市数量总和超过45.2万家,占企业总数的27.6% [3] L3级自动驾驶商业化 - 2025年12月,工信部首次发放L3级功能的车型准入许可,标志着行业从技术验证迈入受控商业化新阶段 [6] - 准入模式为“场景受限、责任清晰”,明确了事故责任划分:系统接管期间由车企担责,驾驶员未响应接管警告则由个人担责 [6] - 截至目前,中国现存在业、存续状态的自动驾驶相关企业超8900家 [6] - 从区域分布看,广东省、河北省、北京市自动驾驶相关企业数量位居前列,分别为超1400余家、790余家和560余家 [6] - 首批L3级车型的试点场景集中于高速与城市快速路,未来试点范围有望扩展至更多城市与道路类型 [8] 自动驾驶核心产业链 - 激光雷达作为L3级自动驾驶感知层核心进入量产爆发期,2025年国内车载激光雷达市场规模预计达240.7亿元,以2024年约139.6亿元为基数计算,同比增长127% [9] - 域控制器作为自动驾驶“大脑”进入高算力时代,主流产品算力已从L2级的100-200TOPS跃升至500TOPS以上 [9] - 高精地图为L3级自动驾驶提供精准定位与环境预判,2025年国内市场规模预计达65亿元,较2024年的50亿元实现显著增长 [9]
刚做了一份世界模型的学习路线图,面向初学者......
自动驾驶之心· 2025-12-25 11:24
世界模型与端到端自动驾驶的关系 - 世界模型并非端到端自动驾驶本身,而是实现端到端自动驾驶的一种途径[2] - 行业将自动驾驶世界模型的研究收敛于生成和重建两大领域[2] - 目前主流应用是利用世界模型进行闭环仿真,以应对Corner Case成本过高的问题[2] 世界模型课程核心内容架构 - 课程第一章概述世界模型与端到端自动驾驶的联系、发展历史、应用案例及不同技术流派[5] - 课程第二章涵盖世界模型的基础知识,包括场景表征、Transformer、BEV感知等,是求职面试的高频技术点[5][6] - 课程第三章探讨通用世界模型,解析李飞飞团队Marble、DeepMind Genie 3、Meta JEPA、DriveVLA-W0及特斯拉世界模型模拟器等前沿工作[6] - 课程第四章聚焦视频生成类世界模型,讲解Wayve的GAIA-1 & GAIA-2、上交UniScene、商汤OpenDWM、中科大InstaDrive等算法,并以OpenDWM进行实战[7] - 课程第五章聚焦OCC生成类世界模型,讲解三大论文并进行一个项目实战,此类方法可扩展至自车轨迹规划[8] - 课程第六章分享世界模型在工业界的应用现状、行业痛点、期望解决的问题以及相关岗位的面试准备经验[9] 世界模型涉及的关键技术栈 - 基础技术包括Transformer、视觉Transformer、CLIP、LLaVA等多模态大模型基础[11] - 涉及BEV感知基础知识及占用网络[11] - 涵盖扩散模型理论,该模型是输出多模轨迹的热点技术[11] - 包括闭环仿真相关的NeRF和3DGS技术[11] - 也涉及其他生成式模型,如VAE、GAN以及Next Token Prediction[11] 世界模型相关的重要研究 - 国内重要研究包括清华的OccWorld、复旦的OccLLaMA、华科ICCV'25的HERMES以及西交的II-World[12] 课程目标与受众要求 - 课程目标是推动端到端自动驾驶在工业界的落地,助力从业者深入理解端到端技术[10] - 学员需自备GPU,推荐算力在4090及以上[13] - 学员需具备自动驾驶领域基础,熟悉其基本模块[13] - 学员需了解transformer大模型、扩散模型、BEV感知等基本概念[13] - 学员需具备一定的概率论、线性代数及Python、PyTorch基础[13] - 课程期望使学员达到约1年经验的自动驾驶算法工程师水平,掌握世界模型技术进展及BEV感知等关键技术,并能复现主流算法框架[13] 课程进度安排 - 课程于1月1日开课,预计两个半月结课,采用离线视频教学,提供VIP群答疑及三次线上答疑,答疑服务截止2026年12月31日[14] - 各章节解锁时间:第一章12月10日,第二章1月1日,第三章1月20日,第四章2月4日,第五章2月24日,第六章3月1日[15]