YOLO Series(YOLOv12

搜索文档
ACM MM'25 | 自驾2D目标检测新SOTA!超越最新YOLO Series~
自动驾驶之心· 2025-08-02 00:03
自动驾驶目标检测技术 - 当前主流架构如YOLO、DETR在追求轻量化和速度时牺牲了特征一致性与层次表达能力,难以兼顾小目标检测与复杂场景理解[2] - 频率混叠和融合过程僵化是现有Neck结构的主要问题,导致特征表达能力下降和检测器感知能力受限[9][10] - Butter框架通过解耦式设计实现精度与效率的统一,在Neck层引入频率一致性增强模块和渐进式层次特征融合网络[11] Butter框架核心技术 - 频率一致性增强模块(FAFCE)融合高频细节增强与低频噪声抑制,提升边界分辨率[3][20] - 渐进式层次特征融合网络(PHFFNet)逐层融合语义信息并引入空间感知机制,强化多尺度特征表达[3][29] - Backbone采用轻量化改进的HGNetV2,使用GhostConv、RepConv等模块减少参数量,提升推理效率[17] 性能表现 - 在KITTI数据集上mAP@50达到94.4%,比TOD-YOLOv7高出1.2个百分点,计算量仅为后者约1/3[32] - 在BDD100K和Cityscapes数据集上分别取得53.7%和53.2%的mAP@50,显著优于Hyper-YOLO-S方法[32] - 参数量比Hyper-YOLO-S减少约64%,显示更优的部署适应性[32] 技术细节 - FAFCE模块通过高频增强与低频抑制两种机制提升多尺度特征融合准确性[20] - PHFFNet采用从低层向高层的逐级融合策略,缓解非相邻层间语义差异[29] - 引入空间动态权重机制(CASF)动态分配不同空间位置的多层特征权重[31] 应用前景 - 方法具备良好的通用性与部署适配性,适用于主流SOTA检测器[15] - 具备轻量化潜力,可用于高性能自动驾驶视觉系统部署[15] - 在复杂道路场景中实现高精度目标检测与结构感知[14]