双向智能视频编码
搜索文档
超越 VTM-RA!快手双向智能视频编码器BRHVC亮相NeurIPS2025
机器之心· 2025-11-21 11:56
文章核心观点 - 快手音视频技术团队提出名为BRHVC的全新双向智能视频编码方法,该方法在压缩性能上显著超越业内最先进的端到端智能视频编码方案和最新标准的VTM-RA编码[2] - BRHVC通过双向运动聚合和双向上下文融合两大创新模块,解决了双向智能视频编码中的长跨度帧运动处理难题和参考贡献不平衡问题[13] - 实验结果表明,BRHVC在HEVC数据集上相比传统编码器VTM-RA实现1.1%的码率节省,成功在编码效率上实现超越[25] 视频编码技术背景与价值 - 视频编码的核心价值在于解决海量视频数据与有限传输、存储资源之间的矛盾,未压缩的高清视频码率高达1-3 Gbps,1分钟4K视频占用近20 GB空间[4] - 视频编码通过消除时空冗余将视频码率压缩至1/100~1/1000,使短视频、直播等应用成为可能,每年为行业节省数万亿带宽成本[4] 双向编码模式的技术挑战 - 双向模式(RA)采用双向分层B帧编码,利用时域上的双向信息,在相同画质下可比低延迟模式节省20+%码率,是点播、存储等高画质场景首选[7] - RA模式面临两大核心挑战:长跨度帧的运动处理困难,以及两个参考帧的信息价值存在显著差异的不平衡参考贡献问题[7][9] - 在帧跨度较大(32和16)时,不平衡的参考贡献问题非常严重,极大影响后续帧的编码效率[11] BRHVC技术框架与创新 - BRHVC框架包含双向运动聚合(BMC)和双向上下文融合(BCF)两个核心模块[13] - BMC模块将光流网络生成的多尺度光流收敛至单一隐变量进行联合压缩,突破过往光流压缩局限,显著提升大位移场景下的运动补偿精度[16] - BCF模块通过计算当前帧与双向运动补偿结果的相似度差异,生成空间自适应权重图,实现参考特征按重要性重新加权融合[20] 实验效果与性能数据 - 在HEVC数据集上,BRHVC相比传统编码器VTM-LDB平均实现32.0%的码率节省,在Class D序列上增益高达44.7%[24][25] - 消融实验表明,BMC和BCF模块能获得相对基准模型约12.3%的显著码率节省,具有较高的解码收益性价比[27] - BRHVC在编码效率上成功超越最新传统标准VTM-RA编码器,取得双向智能视频压缩领域的重要突破[29]