“iFold”,苹果AI新成果
公司技术发布 - 苹果公司发布名为SimpleFold的蛋白质折叠AI模型,被戏称为"iFold" [1] - 该模型基于流匹配生成范式,采用通用Transformer模块构建,未使用复杂专属设计 [2][6] - 模型核心创新在于引入流匹配技术,通过学习从随机噪声到蛋白质构象的光滑映射,实现一步生成原子坐标 [7] 模型性能表现 - SimpleFold-3B参数版本在CAMEO22基准测试中性能达到AlphaFold2的95% [9] - 在CASP14高难度测试集上,SimpleFold-3B超越同类流匹配模型ESMFold [9] - 模型在搭载M2 Max芯片的MacBook Pro上处理512残基序列仅需两三分钟,远超传统模型的小时级耗时 [10] 技术架构特点 - 模型架构采用多层Transformer编码器作为核心骨干,仅通过自适应层归一化适配蛋白质序列特征 [6] - 训练阶段使用包含900万条数据的混合数据集,训练出参数规模从100M到3B的多尺度模型 [9] - 该方法避免了传统模型对多序列对比和超算级算力的依赖,实现了化繁为简 [3][4] 研究团队背景 - 研究第一作者Yuyang Wang拥有卡内基梅隆大学机器学习硕士及机械工程博士学位,曾在苹果担任AI/ML Resident [12] - 通讯作者Jiarui Lu本科毕业于清华大学,在卡内基梅隆大学获机器学习硕士,2020年加入苹果公司 [15] - 团队成员具备强化学习、扩散模型等AI研究背景,并主导过苹果开源项目ToolSandbox [12][15]