虚拟细胞

搜索文档
训练自2.67亿个单细胞数据的AI虚拟细胞模型——STATE,无需实验,预测细胞对药物或基因扰动的反应
生物世界· 2025-07-07 11:17
近日, Arc 研究所 发布了其 第一代虚拟细胞模型—— STATE ,该虚拟细胞模型旨在 预测各类干细胞、癌细胞和免疫细胞对药物、细胞因子或基因扰动的反 应。 STATE 模型基于 1.67 亿个细胞的观察数据以及超过 1 亿个细胞的扰动数据进行训练,这些数据涵盖了 70 种细胞系。该论文已于近期发表在了预印本平台 bioRxiv 上。 撰文丨王聪 编辑丨王多鱼 排版丨水成文 人体是由 细胞 (Cell) 构成的马赛克,其中,免疫细胞通过增强炎症来对抗感染;干细胞可以分化成各种组织;癌细胞避开调控信号而无节制地分裂。然而,尽 管这些细胞之间存在显著差异,但这些看上去截然不同的体细胞都携带着 (几乎) 相同的基因组。 细胞的独特性不仅源于 DNA 的不同,更在于每个细胞对 DNA 的使用方式。换句话说,细胞的特性源自基因表达的变化,即基因在不同时刻的"开启"和"关闭"。 细胞的基因表达模式——以 RNA 分子的形式体现,而 RNA 分子本身又是从 DNA 转录而来,基因的表达不仅决定了细胞的类型,还决定了细胞的状态:细胞基 因表达的变化可以揭示细胞如何从健康状态转变为炎症状态,甚至癌变。通过测量有或无化学或基 ...
科学家和资本竞相涌入,AI真的能构建出虚拟细胞吗?
生物世界· 2025-06-30 15:39
人工智能虚拟细胞(AIVC)概述 - 细胞作为生命基本单位,其复杂性对物理和计算模型构成挑战,科学家正构建虚拟细胞模型以模拟、预测和引导细胞行为[2] - AI与组学技术革命使直接从数据学习构建细胞模型成为可能,催生多尺度、多模态的AIVC模型,可表征分子、细胞和组织行为[3] - 全球多个团队竞相开发AI细胞模型,包括CZI、DeepMind、瑞典国家生命科学实验室等机构[4][10] 行业动态与投入 - CZI计划未来十年投入数亿美元创建虚拟细胞,DeepMind推进虚拟细胞项目,瑞典计划2026年启动"Alpha Cell"项目[10] - Xaira Therapeutics发布800万细胞的单细胞扰动测序数据集X-Atlas/Orion,Arc研究所推出虚拟细胞模型STATE[10] - Arc研究所发起虚拟细胞挑战赛,冠军奖励10万美元,旨在预测干细胞对基因干扰的反应[16] 技术进展与数据规模 - 早期虚拟细胞依赖单细胞转录组测序数据,当前CZI计划发布10亿细胞测序数据,Arc发布1亿药物处理癌细胞数据[16] - 单细胞测序数据规模达数百亿数据点,接近大语言模型训练量级,但现有模型预测能力有限且泛化性不足[16] - 研究人员呼吁整合显微镜图像等多元数据,以捕捉细胞组分相互作用和动态变化[17] 行业争议与挑战 - 部分科学家认为虚拟细胞领域存在炒作,缺乏具体成果和明确成功路径,但投资机构仍在加大资金投入[11] - 虚拟细胞定义尚未统一,学术界对模型标准未达成共识,影响研发方向一致性[18] - 早期机械模型如2012年生殖支原体模拟(525个基因)与当前AI驱动模型存在方法论差异[12][15] 应用前景 - 目标将细胞生物学研究模式从"90%实验+10%计算"逆转为"90%计算+10%实验",加速疾病机制研究[7] - 虚拟细胞可作为强大计算工具预测疾病机制,但模型成熟度与生物学家接受度仍需时间磨合[19]
细胞版“图灵测试”来了:Arc研究所推出“虚拟细胞”挑战赛,冠军将获10万美元奖励,或催生下一个诺贝尔奖
生物世界· 2025-06-29 11:30
虚拟细胞挑战赛概述 - 虚拟细胞(Virtual Cell,VC)是人工智能与生物学交叉领域的新兴前沿,有望成为生命科学的基础工具以彻底改变生命科学研究范式 [2] - 虚拟细胞模型的关键目标是预测细胞对干扰的反应 [2] - 2025年6月26日,Arc研究所在Cell期刊发表评论文章,正式推出虚拟细胞挑战赛,旨在提供公平、开放的测试评估 [2] - 挑战赛由Arc研究所发起,英伟达、10x Genomics和Ultima Genomics提供赞助 [4] - 前三名开发者将分别获得10万美元、5万美元和2.5万美元奖励(包括现金奖励和英伟达DGX云服务额度) [4] 虚拟细胞的重要性 - 细胞是生命的基本单位,理解并预测细胞在受到扰动后的反应是生物学和医学研究的核心挑战 [6] - 单细胞测序技术的爆炸式发展和人工智能的突破性进展使得科学家们得以重拾虚拟细胞建模这一宏伟目标 [6] - 强大的虚拟细胞模型能像熟练的生物学家一样"思考",预测不同细胞类型、不同状态下对未知扰动的反应 [6] - 虚拟细胞技术将彻底革新新药研发、疾病机制研究和个性化医疗 [6] 挑战赛的设计与评估 - 参赛模型的核心挑战是"跨环境泛化"能力 [13] - 具体任务:模型将学习多种已知细胞类型中数百个基因被抑制后的反应,然后面对一个全新的细胞类型(人胚胎干细胞系H1) [13] - 终极测试:模型需要准确预测该新细胞类型中其他从未见过的基因扰动会引发的基因表达变化 [13] - 挑战赛采用三重评估体系:差异表达得分、扰动区分得分和平均绝对误差 [15] - Arc研究所专门为竞赛生成了高质量金标准数据,使用CRISPRi技术在H1细胞系中精准抑制了300个关键基因 [15] - 利用10x Genomics Flex单细胞测序平台获取了约30万个单细胞的详细基因表达图谱 [15] - 参赛者可利用Arc研究所开放的"虚拟细胞图谱"(包含超3.5亿细胞的观测数据)和Tahoe-100M扰动数据集进行训练 [15] 挑战赛的意义与展望 - 挑战赛首次为预测基因层面扰动反应建立了严谨的评估框架 [19] - 将推动整个单细胞功能基因组学领域建立更严格的实验和数据生成规范 [19] - 公开且实时更新的排行榜和社区竞争将促使研究者开发更强大、更通用的算法 [19] - 未来的虚拟细胞挑战赛将纳入组合扰动预测、真正的跨细胞类型零样本泛化,并整合多组学数据 [20] - 虚拟细胞挑战赛的启动标志着人工智能赋能生命科学进入一个激动人心的新阶段 [20]
David Baker创立的AI制药公司扔出重磅炸弹:最大规模单细胞扰动测序数据集,支持虚拟细胞研究
生物世界· 2025-06-18 12:09
撰文丨王聪 编辑丨王多鱼 排版丨水成文 2024 年 4 月,一家名为 Xaira Therapeutics 的 人工智能 (AI) 药物研发公司成立,并同时宣布获得了令人瞠目结舌的 10 亿美元种子轮融资 。该公司致力于 通过 新兴 AI 技术的端到端应用,帮助重新设计药物的发现和开发之旅。 该公司拥有一个星光熠熠的创始和领导团队,包括 AI 蛋白质设计先驱、2024 年诺贝尔化学奖得主 David Baker 教授,以及 2022 年诺贝尔化学奖得主 Carolyn Bertozzi 教授 、美国 FDA 前局长 Scott Gottlieb 、强生公司前 CEO Alex Gorsky ,以及 斯坦福大学 前校长 Marc Tessier-Lavigne 等。因此,整个 AI 药物 研发领域都在热切期待着该公司取得令人瞩目的科学成果。 现在,这家 AI 独角兽企业不负众望,在其成立的第一年就为 虚拟细胞 (Virtual Cell) 研究领域送上了一份厚礼——发布了目前最大的公开可用的 P erturb- seq 数据集,名为 X-Atlas/Orion ,为 虚拟细胞 研究提供支持,该数据集可用于 A ...