流匹配生成技术
搜索文档
“iFold”,苹果AI新成果
36氪· 2025-09-25 21:02
公司技术发布 - 苹果公司发布名为SimpleFold的蛋白质折叠AI模型,被戏称为"iFold" [1] - 该模型基于流匹配生成范式,采用通用Transformer模块构建,未使用复杂专属设计 [2][6] - 模型核心创新在于引入流匹配技术,通过学习从随机噪声到蛋白质构象的光滑映射,实现一步生成原子坐标 [7] 模型性能表现 - SimpleFold-3B参数版本在CAMEO22基准测试中性能达到AlphaFold2的95% [9] - 在CASP14高难度测试集上,SimpleFold-3B超越同类流匹配模型ESMFold [9] - 模型在搭载M2 Max芯片的MacBook Pro上处理512残基序列仅需两三分钟,远超传统模型的小时级耗时 [10] 技术架构特点 - 模型架构采用多层Transformer编码器作为核心骨干,仅通过自适应层归一化适配蛋白质序列特征 [6] - 训练阶段使用包含900万条数据的混合数据集,训练出参数规模从100M到3B的多尺度模型 [9] - 该方法避免了传统模型对多序列对比和超算级算力的依赖,实现了化繁为简 [3][4] 研究团队背景 - 研究第一作者Yuyang Wang拥有卡内基梅隆大学机器学习硕士及机械工程博士学位,曾在苹果担任AI/ML Resident [12] - 通讯作者Jiarui Lu本科毕业于清华大学,在卡内基梅隆大学获机器学习硕士,2020年加入苹果公司 [15] - 团队成员具备强化学习、扩散模型等AI研究背景,并主导过苹果开源项目ToolSandbox [12][15]
“iFold”,苹果AI新成果
量子位· 2025-09-25 19:42
文章核心观点 - 苹果公司跨界发布了一款名为SimpleFold的蛋白质折叠AI模型,被戏称为"iFold" [1] - 该模型采用"化繁为简"的设计理念,使用通用Transformer架构和流匹配生成技术 [3][8] - 其3B参数版本在性能上追平了谷歌AlphaFold2,达到后者95%的水平,同时在MacBook Pro上即可高效运行 [2][14][16] 技术架构与创新 - 模型架构采用多层Transformer编码器作为核心骨干,仅通过自适应层归一化适配蛋白质序列特征 [10] - 核心创新在于引入流匹配生成技术,通过学习从随机噪声分布到蛋白质构象分布的光滑映射,实现一步式生成原子坐标 [11][12] - 模型设计没有花里胡哨的专属模块,完全基于通用AI框架解决问题 [2][8] 性能表现 - 在CAMEO22基准测试中,SimpleFold-3B性能达到AlphaFold2的95% [14] - 在CASP14高难度测试集上,超越了同类流匹配模型ESMFold [15] - 具体性能指标:在CAMEO22测试集上TM-score为0.837,GDT-TS为0.802;在CASP14测试集上TM-score为0.720,GDT-TS为0.639 [16] 效率优势 - 在搭载M2 Max芯片的MacBook Pro上,处理512残基序列的推理时间仅需两三分钟 [16] - 远超传统模型的小时级耗时,使得普通实验室也能用得起 [7][16] 训练数据与模型规模 - 训练阶段构建了包含900万条数据的混合数据集 [14] - 训练出了从100M到3B参数的多尺度模型 [14] 研究团队背景 - 第一作者Yuyang Wang拥有卡内基梅隆大学机器学习硕士和机械工程博士学位,曾在苹果担任AI/ML Resident [18] - 通讯作者Jiarui Lu本科毕业于清华大学,在卡内基梅隆大学取得机器学习硕士学位,2020年加入苹果公司 [21][22] - 通讯作者曾主导苹果开源成果ToolSandbox,一套关于大模型工具调用能力的Benchmark [23]