这才是 AI 近年来最有价值的成就,却被很多人忽视
36氪·2025-12-01 08:15
有一个英文单词,它由189,819 个字母组成。在常规语速下,要念完它需要花足足三个半小时——它是我们体内的肌联蛋白(titin)的化学全名。 肌联蛋白是人体内最大的蛋白质,由超过 3.4 万个氨基酸组成。相比于只含几百上千个氨基酸的常见蛋白质,肌联蛋白实在是太大了。于是,科学家决定 化用古希腊神话中巨人神族的名字"泰坦"(Titan),将它命名为 titin。 然而,自科学家 1954 年发现肌联蛋白已经过去 70 多年,我们依然不知道这位"巨人"的真实模样。要用传统的实验方法解析出这个庞然大物的完整结构, 几乎是不可能的。 蛋白质的结构由其氨基酸序列决定,我们能否直接通过氨基酸序列,预测出蛋白质的三维结构?这曾是生物学领域最艰难、最核心的挑战之一。 但是,2020 年 11 月 30 日,AlphaFold2 出现了。 DeepMind 将蛋白质数据库(PDB)中实验得到的蛋白质结构"喂"给了神经网络,让 AI 学习序列与结构之间的关系。最终,他们做到了科学家过去无法想 象的事:在那年的"全球蛋白质结构预测比赛"(CASP)中,AlphaFold2 凭借氨基酸序列预测蛋白质结构的准确率超过了 90%,直逼 ...