Conditional Diffusion Model

搜索文档
成本降低14倍!DiffCP:基于扩散模型的协同感知压缩新范式~
自动驾驶之心· 2025-08-18 09:32
协同感知技术现状 - 协同感知(Collaborative Perception)是解决独立智能系统局限性的新兴方案,但在非理想无线通信场景下面临高可靠性和低延迟传输的挑战 [3] - 当前C-V2X系统在10米距离最大数据速率约10Mbps,100米降至5Mbps,无法满足特征级和原始数据级协同算法的带宽需求 [3] - 多智能体系统中感知特征分布相似,关键差异来自几何位置和前景物体语义信息 [3] DiffCP技术突破 - 首次采用条件扩散模型捕获几何相关性和语义差异性,实现超低通信成本的特征级协同 [4] - 通过整合几何和语义条件,通信成本降低14.5倍,同时保持最先进算法性能 [4] - 可在单个通信步骤内重建协同智能体的BEV特征,成为基于BEV协同感知算法的通用范式 [5] 技术实现细节 - 使用预训练BEV感知算法提取特征,将扩散时间步/空间位置/语义向量作为条件嵌入 [5] - 几何先验信息引导扩散过程,六元素组成传感器几何位置状态 [9] - 语义提取器(SE)生成独特语义向量,通过可调向量长度实现通信量控制 [9] 性能优化方案 - 针对高精度3D检测任务,采用Top-K方法传输特征值最大元素增强重建精度 [11] - 实验显示在向量长度减少32倍时,准确性仅损失30% [18] - 通过DDIM加速去噪,评估指标为协同者与本车BEV特征的均方误差(MSE) [15] 实验数据对比 - 在3D目标检测任务中,DiffCP数据速率从745Mbps降至87.8Kbps,压缩倍数达8,700倍 [20] - AP@IoU=0.7指标显示:无协同58.22,传统特征级协同83.31,DiffCP+Top-25达78.75 [19] - 采样步数从2步增至9步时,计算时间从53ms升至185ms,需平衡迭代步数 [16][18] 行业应用价值 - 实现与SOTA算法相当精度,同时支持可变语义向量长度的自适应速率机制 [20] - 在超低带宽场景(如2.5Kbps)仍保持稳健性能,适合严苛通信条件部署 [16][20] - 推动网联智能系统在现有无线通信基础设施上的商业化落地 [22]