丁文华：大模型开始理解物理世界，未来将形成颠覆性生产能力

行业技术进展 - 大模型在2025年的最重要新特征是开始理解物理世界通过多模态感知将分散的图文、声音、动作等信息对齐关联形成对事件、知识、因果与隐性关系的整体理解[1] - 大模型与AIGC的到来将使周边设施和数字基础发生巨大变化当前AIGC在内容生成、场景和镜头控制上已达到一定水平基于生成式的特效已经超越传统方法且应用愈加广泛[1] - 自2024年以来 LMM/AIGC大模型已经完成了巨大的进步[2] 行业应用现状 - 利用AI辅助生产基于文本或故事片的设计意图和文本描述通过大模型进行文生图再根据分镜头剧本进行人工拍摄实现文本与视频对齐及镜头拼接配合[1] - 利用AI进行创作根据数据信息制作专业静态、动态图表结合相关描述生成具有年代性的场景通过图片和视频进行情景再现[1] - 当前中国AIGC创作尚处于起步阶段 AI创作类应用与AI助手类应用用户数仍有较大差距用户使用习惯仍待培育[2] - 2025年7月数据显示 AI创作应用Web端总访问量接近3000万 AI助手类应用Web端总访问量超3亿有5款产品访问量超千万总MAU约4300万[2] - 在AI助手类应用中 DeepSeek居首位其国内访问量超1.2亿 MAU约1300万[2] 技术能力局限 - 当前AIGC生成视频的能力仍有局限在视觉呈现上受限于训练素材目前AIGC生成视频最高质量为HD(1920*1080) 尚不普遍具备4K/8K生成能力[2] - 在故事叙述上当前AIGC在事件、故事层面仍有较大差距不支持正叙、倒叙、插叙、闪回等叙事手法无法达到蒙太奇式呈现效果[2] - 在内容真实性上生成内容无法保证符合物理世界的所有客观规律[2] 未来发展展望 - 未来AIGC可能快速形成颠覆性生产能力但其迭代发展的最终目标将是帮助人类进行创作利用科技手段渲染和增强艺术效果而不是替代人类操作[2] - 当前AI价值观与创作伦理仍需要规范[2]