核心观点 - 魔芯科技与多所高校联合提出CADCrafter框架,实现从单张图像直接生成可编辑的CAD工程文件,突破传统图生3D技术的局限性 [1][2][16] - 该技术通过参数化CAD指令生成和编译,显著提升模型的可编辑性、表面质量及工业落地实用性 [4][5][29] - 研究已被CVPR 2025接收,团队包括魔芯科技创始人及多国学术机构研究人员 [7][8][9] 技术突破 范式创新 - 首次实现Image-to-CAD范式转变,直接生成参数化CAD指令(包括几何特征指令及参数),而非传统网格模型(Mesh)或3D高斯泼溅(3DGS) [2][13][16] - 支持零件渲染图、3D打印零件照片及日常物体图像输入,输出可编译为STP等工业标准格式的工程文件 [2][3][28] 核心架构 1. 两阶段生成框架 - 结合VAE与Diffusion Transformer:VAE将CAD指令映射至隐空间,DiT模型实现图像引导的隐空间采样 [19][20] 2. 蒸馏策略 - 先训练多视图DiT模型稳定学习映射关系,再通过L_distill损失迁移至单视图模型,提升单图输入效果 [21] 3. 可编译性优化 - 引入DPO损失和代码合理性判别模块,确保生成指令可通过CAD内核编译,成功率显著提高 [22][24][25] 应用优势 工业实用性 - 生成模型表面平面度、棱角细节符合生产要求,支持直接参数化编辑(如调整部件尺寸) [4][15][28] - 实验显示细节还原度优于现有方法,适用于制造维修领域的快速原型设计及零件重建 [26][29][30] 性能对比 - 传统AI生成网格模型存在表面粗糙、边缘不锐利问题,尤其Marching Cubes算法转换时几何质量下降 [14] - CADCrafter参数化模型提供更高可控性,用户可通过指令直接调整几何形状,提升设计效率 [15][16] 研究背景 - 合作机构包括魔芯科技、南洋理工大学、A*STAR、西湖大学等,通讯作者为魔芯科技创始人Tianrun Chen [7][8] - 技术细节详见论文(arXiv:2504.04753),实验采用KOKONI SOTA 3D打印机实物验证 [26][31]
单图直出CAD工程文件!CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点|魔芯科技NTU等出品
量子位·2025-04-14 17:09