Workflow
图像复原技术
icon
搜索文档
用好大模型 “焕新”老照片(唠“科”)
人民日报· 2025-08-16 06:11
人的大脑擅长识别画面里的人脸、物体等大轮廓,却不擅长还原毛发的纤细纹理、皮肤的细腻质感这些 细节,而图像复原技术恰好能填补这个空白。在图像复原领域,人工智能可以比人完成得更为出色。无 论是模糊不清的低分辨率图像还是布满瑕疵的老照片,人工智能都可以通过"神奇魔法"让其变成高清图 像。 第一步,得先给图像"大扫除",去除图像拍摄时的抖动、模糊,图像压缩留下的痕迹等"小毛病",这样 才能保留图像的真实信息,避免其他干扰。科研人员设计了一个专门的深度学习编码器,让它"吃进"有 瑕疵的图像,"吐出"没有缺憾的图像;还通过人为制造各种图像瑕疵的方式,构建了几亿组"瑕疵—完 好"的图像对来训练这个编码器。经过多轮训练,编码器就能熟练掌握去除图像瑕疵的技能。 不过,这时候的图像虽然干净了,但看起来会比较平滑,缺乏自然的细节。所以第二步就是给图像"添 细节"。这里就要用到文生图大模型了,它能根据文字描述生成自然图像。这一步需要输入两个信息: 一个是已经去除瑕疵的图像,一个是对图像的内容描述。此时,多模态大模型就派上用场了,它能"看 懂"图像内容,并输出相应的文字描述,作为文生图大模型的"创作指南"。有了这两个大模型的配合, 就 ...
1.7秒修复高清大片 新型大模型让图像复原更高效
科技日报· 2025-08-11 07:40
技术突破 - 中国科学院深圳先进技术研究院发布HYPIR图像复原大模型,解决传统图像复原技术计算复杂度高、推理速度慢、训练资源消耗大等问题[1] - HYPIR舍弃迭代式扩散模型训练,采用单步对抗生成模型训练方式,算法速度提升数倍[1] - HYPIR实现8K级别细节生成,在生成图像稳定性和可控性方面远超前代SUPIR大模型[1] 性能优势 - HYPIR在单张图像处理器上仅需1.7秒完成1024×1024分辨率图像复原[3] - 传统扩散模型常导致文字模糊或扭曲,HYPIR能保持文字高保真度和清晰度[3] - HYPIR具备自然语言理解能力,可精准捕捉用户指令并反映在复原过程中[3] 应用场景 - 该技术适用于影视修复、文化传承与保护等领域[1] - 已成功部署于明犀科技平台,开源代码和模型上传至GitHub[3] - 团队与深圳市南山区档案馆合作修复馆藏照片,未来将推进模型产业化[3] 效率提升 - HYPIR训练和推理速度较传统方法提升一个数量级以上[2] - 用户可灵活调节生成与复原比例,精细控制图像细节程度[3]
图像复原“黑科技”!深圳科学家团队1.7秒复原高清大片
南方都市报· 2025-07-31 23:45
图像复原技术突破 - 中国科学院深圳先进技术研究院发布HYPIR图像复原大模型 解决了传统方法在速度与质量上的矛盾 实现高清分辨率 文字保真 理解能力和用户控制灵活性等性能突破 [1] - HYPIR采用单步对抗生成模型训练方式 相比迭代式扩散模型速度提升数倍 支持8K级别细节生成 在单张显卡上仅需1.7秒完成1024x1024分辨率图像修复 [4] - 该模型通过预训练扩散模型初始化复原网络 并创新性解释其理论原理 适用于不同尺寸预训练模型 提供场景应用灵活性 [4] 技术性能优势 - 在文字保真方面显著优于传统方法 能精准还原简单标识和复杂文档的原始形态 解决文字模糊扭曲问题 [7] - 具备自然语言理解能力 可精准捕捉用户指令 支持生成与复原的平衡调节 允许用户控制图像细节程度 [7][8] - 已成功应用于国内外经典影视老照片修复 攻克8K分辨率图像生成难题 在文化传承 影视修复领域展现实用价值 [7] 商业化与行业影响 - 开源代码和模型已上传GitHub 并部署于明犀科技平台 与深圳市南山区档案馆合作开展馆藏照片修复 [8] - 技术突破打破传统思维定式 为文化保护 高分辨率图像生成等领域提供可行解决方案 推动行业技术升级 [8] - 团队持续深耕底层视觉技术 研究成果《底层视觉之美》出版 强调科技向善理念 计划进一步推进技术产业化 [8]