丁文华:大模型开始理解物理世界,未来将形成颠覆性生产能力
21世纪经济报道·2025-12-18 13:26

行业技术进展 - 大模型在2025年的最重要新特征是开始理解物理世界 通过多模态感知将分散的图文、声音、动作等信息对齐关联 形成对事件、知识、因果与隐性关系的整体理解[1] - 大模型与AIGC的到来将使周边设施和数字基础发生巨大变化 当前AIGC在内容生成、场景和镜头控制上已达到一定水平 基于生成式的特效已经超越传统方法且应用愈加广泛[1] - 自2024年以来 LMM/AIGC大模型已经完成了巨大的进步[2] 行业应用现状 - 利用AI辅助生产 基于文本或故事片的设计意图和文本描述 通过大模型进行文生图 再根据分镜头剧本进行人工拍摄 实现文本与视频对齐及镜头拼接配合[1] - 利用AI进行创作 根据数据信息制作专业静态、动态图表 结合相关描述生成具有年代性的场景 通过图片和视频进行情景再现[1] - 当前中国AIGC创作尚处于起步阶段 AI创作类应用与AI助手类应用用户数仍有较大差距 用户使用习惯仍待培育[2] - 2025年7月数据显示 AI创作应用Web端总访问量接近3000万 AI助手类应用Web端总访问量超3亿 有5款产品访问量超千万 总MAU约4300万[2] - 在AI助手类应用中 DeepSeek居首位 其国内访问量超1.2亿 MAU约1300万[2] 技术能力局限 - 当前AIGC生成视频的能力仍有局限 在视觉呈现上 受限于训练素材 目前AIGC生成视频最高质量为HD(1920*1080) 尚不普遍具备4K/8K生成能力[2] - 在故事叙述上 当前AIGC在事件、故事层面仍有较大差距 不支持正叙、倒叙、插叙、闪回等叙事手法 无法达到蒙太奇式呈现效果[2] - 在内容真实性上 生成内容无法保证符合物理世界的所有客观规律[2] 未来发展展望 - 未来AIGC可能快速形成颠覆性生产能力 但其迭代发展的最终目标将是帮助人类进行创作 利用科技手段渲染和增强艺术效果 而不是替代人类操作[2] - 当前AI价值观与创作伦理仍需要规范[2]