单图直出CAD工程文件！CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点｜魔芯科技NTU等出品

核心观点 - 魔芯科技与多所高校联合提出CADCrafter框架，实现从单张图像直接生成可编辑的CAD工程文件，突破传统图生3D技术的局限性 [1][2][16] - 该技术通过参数化CAD指令生成和编译，显著提升模型的可编辑性、表面质量及工业落地实用性 [4][5][29] - 研究已被CVPR 2025接收，团队包括魔芯科技创始人及多国学术机构研究人员 [7][8][9] 技术突破范式创新 - 首次实现Image-to-CAD范式转变，直接生成参数化CAD指令（包括几何特征指令及参数），而非传统网格模型（Mesh）或3D高斯泼溅（3DGS） [2][13][16] - 支持零件渲染图、3D打印零件照片及日常物体图像输入，输出可编译为STP等工业标准格式的工程文件 [2][3][28] 核心架构 1. 两阶段生成框架 - 结合VAE与Diffusion Transformer：VAE将CAD指令映射至隐空间，DiT模型实现图像引导的隐空间采样 [19][20] 2. 蒸馏策略 - 先训练多视图DiT模型稳定学习映射关系，再通过L_distill损失迁移至单视图模型，提升单图输入效果 [21] 3. 可编译性优化 - 引入DPO损失和代码合理性判别模块，确保生成指令可通过CAD内核编译，成功率显著提高 [22][24][25] 应用优势工业实用性 - 生成模型表面平面度、棱角细节符合生产要求，支持直接参数化编辑（如调整部件尺寸） [4][15][28] - 实验显示细节还原度优于现有方法，适用于制造维修领域的快速原型设计及零件重建 [26][29][30] 性能对比 - 传统AI生成网格模型存在表面粗糙、边缘不锐利问题，尤其Marching Cubes算法转换时几何质量下降 [14] - CADCrafter参数化模型提供更高可控性，用户可通过指令直接调整几何形状，提升设计效率 [15][16] 研究背景 - 合作机构包括魔芯科技、南洋理工大学、A*STAR、西湖大学等，通讯作者为魔芯科技创始人Tianrun Chen [7][8] - 技术细节详见论文（arXiv:2504.04753），实验采用KOKONI SOTA 3D打印机实物验证 [26][31]