计算机行业点评:腾讯混元开源原生多模态生图模型,3D生成亦再突破
行业投资评级 - 报告未明确给出计算机行业的整体投资评级 [1][2][3][4][5] 核心观点 - 腾讯混元开源原生多模态生图模型,具备强语义理解与知识推理能力,将显著提升AI应用开发和落地密度,并推动腾讯云算力需求快速增长 [1][3] - 腾讯混元3D生成模型实现新突破,支持多种模态输入和灵活可控的部件生成,加速3D生成在游戏、打印和AR/VR等实际生产流程中的落地应用 [2][3] - 腾讯或将维持AI基础设施投入,以支撑千行百业和自身全场景AI产品的高速发展 [3] 腾讯混元图像模型技术要点 - 混元图像3.0(HunyuanImage 3.0)参数规模达80B,是首个开源的工业级原生多模态生图模型 [1] - 模型通过单一模型完成文字、图片、视频与音频等多模态的输入与输出,基于50亿量级的图文对、视频帧、图文交织数据和6T语料数据进行混合训练 [1] - 模型具备超强语义理解能力,能响应复杂长文本并利用世界知识进行推理 [1] 腾讯混元3D模型技术要点 - 混元3D-Omni突破传统图像输入局限性,支持多种模态输入,实现对物体几何结构、拓扑和姿态的精细控制 [2] - 混元3D-Part提出完整的组件化生成新范式,由P3-SAM(高质量原生3D分割模型)及X-Part(工业级组件生成模型)两大模块构成 [2] - 新方案解决了现有组件式3D生成方法可控性不足、部件几何质量不理想及语义连贯性有限的问题 [2] 投资机会 - 报告建议关注IDC领域,如科华数据 [3] - 报告推荐服务器领域,如华勤技术 [3] - 报告推荐算力芯片领域,如海光信息 [3]