文章核心观点 - 中国电信人工智能研究院(TeleAI)研发的生成式视频压缩技术实现了革命性的视频数据压缩,将1GB的原生视频压缩至仅需传输200KB数据,压缩率达到0.02%,在极低带宽下仍能保持高清、连贯的视频质量,标志着视频通信从“像素搬运”迈向“语义生成”的新范式 [1][5][51][52] 技术原理与创新 - 核心逻辑转变:与传统视频编码(如HEVC/H.265)传输像素信息不同,GVC技术传输的是“如何画出画面”的指令,即“用计算换带宽”,将传输压力转移至接收端的推理计算 [14][18][19] - 传输内容:传输的数据是极小的“压缩Token”,包含语义信息(场景、物体结构)和运动信息(物体动态),大小可压缩至0.005-0.008 bpp,相比传统高清视频的0.1 bpp以上,数据量降低两个数量级 [22][23][24][25] - 接收端重建:接收端利用扩散模型,结合接收到的Token指令和预训练的世界知识,“脑补”并生成视频 [26] 性能表现与优势 - 画质优势:在极低码率(约0.005 bpp)下,GVC的LPIPS画质评价指标显著优于传统HEVC,后者画面已严重失真;传统方法需消耗6倍以上带宽才能达到与GVC同等的视觉画质 [34][35] - 语义准确性:在DAVIS2017视频分割任务测试中,在bpp=0.01的极限压缩下,GVC重建视频的J&F指标达75.22%,远高于HEVC的57.68%,证明其生成视频的关键物体位置和轮廓精准,不影响后续AI分析 [36][37] - 计算可行性:经过优化,GVC模型在消费级GPU(如RTX 4090)上生成29帧画面仅需0.95秒到1.35秒,虽非毫秒级,但在准实时场景下已完全可用 [40][41] 应用场景与意义 - 极端环境通信:技术旨在解决远洋货轮、应急灾区等带宽极端受限环境的视频传输问题,例如通过窄带卫星网络观看高清直播 [2][3][7] - 广泛行业应用:潜在应用场景包括远洋海事通信(娱乐、远程医疗指导)、应急救援(无人机回传现场画面)、深空探测与自动驾驶汽车路测数据传输,能极大降低存储与传输成本 [53] - 理论体系支撑:GVC技术基于中国电信提出的“智传网(AI Flow)”理论体系,该体系包含信容律、同源律、集成律三大定律,标志着通信本质从数据传输转向智能分发与协同 [44][48][49]
不得了,这个新技术把视频压缩到了0.02%!