行业核心痛点与解决方案 - 3D生成技术虽已实现“一眼惊艳”的可用性,但行业仍受数据质量参差、评估标准缺失、长尾类别覆盖不足三大痛点困扰[3] - 早期基准数据集如ShapeNet存在类别覆盖失衡、几何结构简单、数据量不足等根本缺陷,限制了模型的泛化能力[4] - 尽管Objaverse等大规模数据集(数百万模型)为新一代模型铺平道路,但原始数据预处理(如生成渲染图像、水密网格)需要专业技能和巨大计算资源,成为普惠化研究的“高墙”[4] HY3D-Bench生态系统核心构成 - 公司开源了一套革命性的3D内容生成生态系统HY3D-Bench,旨在通过提供高质量、标准化数据降低3D生成模型的训练门槛[3] - 系统包含三大核心数据部分:25.2万个高质量手工建模3D资产、24万个3D部件分解结果、以及12.5万个AIGC合成样本[3][13][19] - 为补充学术数据集多样性不足,创新性地引入AIGC驱动合成管道,利用LLM生成语义描述、扩散模型生成图像,并通过HY3D-3.0引擎转化为高保真3D资产,均匀覆盖了1252个类别[3] 手工建模数据处理流水线 - 公司设计了一套自动化数据清洗流水线,从Objaverse等原始库中筛选并处理了25.2万个高质量3D资产[3][6] - 流水线通过基于多边形数量、UV映射质量等标准的初步筛选剔除低质资产,后经水密化处理、多视角渲染(提供正交与透视投影图像)及表面点采样,直接输出包含水密网格、渲染图像和点云的标准数据[6] - 该“即用型”数据集彻底解决了传统流程中计算资源消耗大、技术门槛高的痛点,使研究者无需额外操作即可投入模型训练[6] 部件级分解数据处理 - 部件数据处理旨在将整体静态网格智能分解为语义一致的部件集合,为部件感知生成任务奠定基础[8] - 流程基于拓扑连通性分析,通过连通分量分析进行初始分割,再通过面积阈值合并琐碎零件,确保每个资产包含2-50个合理部件[8] - 此方法相当于将3D生成从“整块雕刻”升级为“模块化拼装”,直接支持可控部件生成[8] AIGC合成数据生成 - 为解决长尾数据稀缺并支持具身智能仿真等领域需求,团队打造了三步生成管线进行数据合成[10] - 管线首先收集常见商品类别,用LLM生成详细产品描述;然后借助文生图模型输出干净背景的RGB图像;最后调用HY3D-3.0模型将图像转为带有材质的高精3D资产[12] 实验成果与模型表现 - 基于开源数据集训练的轻量级模型Hunyuan3D-2.1-Small(参数量832M)在生成质量和推理速度上均优于传统方法[3] - 具体数据:Hunyuan3D-2.1-Small在4096 Token长度下,Uni3D-l得分为0.3606,ULIP-I得分为0.2424[13] - 相比优化方法(如SDS),推理速度提升5倍,且避免了“多脸怪”(Janus Problem)问题[13] 数据集分布详情 - 手工建模数据大类分布广泛,其中占比较高的类别包括:家居电器(12.70%)、服装内衣(10.54%)、食品饮料及健康补充剂(7.43%)、计算机与办公(6.71%)、玩具与乐器(5.83%)等[19] - 合成数据同样覆盖了1252个类别,平衡了常见类别和长尾类别的数据分布差异[3][19] 行业影响与未来计划 - HY3D-Bench通过构建统一的数据基础,以开源方式降低技术门槛,让研究者无需重复“造轮子”,可直接聚焦模型创新与应用探索[19] - 该数据集为机器人仿真、虚拟现实等下游应用提供了坚实的数据基石[3] - 未来,公司计划扩展更多样的3D资产与多任务适配能力,进一步探索数据驱动方法在3D生成中的潜力[20]
3D生成「ImageNet」来了!腾讯混元开源HY3D-Bench