智传网(AI Flow)
搜索文档
不得了,这个新技术把视频压缩到了0.02%!
量子位· 2026-01-14 16:10
文章核心观点 - 中国电信人工智能研究院(TeleAI)研发的生成式视频压缩技术实现了革命性的视频数据压缩,将1GB的原生视频压缩至仅需传输200KB数据,压缩率达到0.02%,在极低带宽下仍能保持高清、连贯的视频质量,标志着视频通信从“像素搬运”迈向“语义生成”的新范式 [1][5][51][52] 技术原理与创新 - **核心逻辑转变**:与传统视频编码(如HEVC/H.265)传输像素信息不同,GVC技术传输的是“如何画出画面”的指令,即“用计算换带宽”,将传输压力转移至接收端的推理计算 [14][18][19] - **传输内容**:传输的数据是极小的“压缩Token”,包含**语义信息**(场景、物体结构)和**运动信息**(物体动态),大小可压缩至0.005-0.008 bpp,相比传统高清视频的0.1 bpp以上,数据量降低两个数量级 [22][23][24][25] - **接收端重建**:接收端利用**扩散模型**,结合接收到的Token指令和预训练的世界知识,“脑补”并生成视频 [26] 性能表现与优势 - **画质优势**:在极低码率(约0.005 bpp)下,GVC的LPIPS画质评价指标显著优于传统HEVC,后者画面已严重失真;传统方法需消耗**6倍以上带宽**才能达到与GVC同等的视觉画质 [34][35] - **语义准确性**:在DAVIS2017视频分割任务测试中,在bpp=0.01的极限压缩下,GVC重建视频的J&F指标达**75.22%**,远高于HEVC的**57.68%**,证明其生成视频的关键物体位置和轮廓精准,不影响后续AI分析 [36][37] - **计算可行性**:经过优化,GVC模型在消费级GPU(如RTX 4090)上生成29帧画面仅需**0.95秒到1.35秒**,虽非毫秒级,但在准实时场景下已完全可用 [40][41] 应用场景与意义 - **极端环境通信**:技术旨在解决远洋货轮、应急灾区等带宽极端受限环境的视频传输问题,例如通过窄带卫星网络观看高清直播 [2][3][7] - **广泛行业应用**:潜在应用场景包括**远洋海事通信**(娱乐、远程医疗指导)、**应急救援**(无人机回传现场画面)、**深空探测**与**自动驾驶汽车**路测数据传输,能极大降低存储与传输成本 [53] - **理论体系支撑**:GVC技术基于中国电信提出的“智传网(AI Flow)”理论体系,该体系包含信容律、同源律、集成律三大定律,标志着通信本质从数据传输转向智能分发与协同 [44][48][49]