Workflow
虚拟细胞课程
icon
搜索文档
虚拟细胞研究正在爆发:20篇CNS论文系统解读,现在学还来得及
生物世界· 2026-04-22 12:08
行业技术趋势 - 虚拟细胞与AI大模型的结合正在突破单细胞数据分析的天花板,推动研究从“描述现象”跃升到“预测机制”,如虚拟敲除、RNA预测蛋白、空间推断、调控网络构建、药物响应模拟和机制延伸 [1] - 该方向正处于显著的技术红利期,CNS顶刊及子刊密集发表相关成果,新方法快速涌现,创新空间巨大,是发表高质量文章的窗口期 [1] 课程核心价值主张 - 课程基于二十篇CNS级顶刊,系统拆解虚拟细胞方向的核心模型、创新逻辑与发文路径,旨在帮助学员建立完整知识框架 [2][3] - 课程目标不仅是教授代码,更是结合顶刊AI大模型,教会学员如何根据手头数据选择合适方法、解决具体问题并支撑科研创新 [4] - 课程直接服务于利用技术红利期发表高分文章,帮助学员将已有单细胞数据挖掘更深,提升课题层次 [5] 课程知识体系模块 - **模块一:虚拟细胞基础大模型**:系统理解核心基础模型框架,如GET Foundation(从ATAC预测基因表达)和scGPT(基于3300万个单细胞预训练的Transformer模型),为后续学习打下基础 [5][14][16] - **模块二:网络生物学预测**:学习从序列、表达和表观遗传信息中挖掘更深层次调控关系与网络结构的前沿模型,如AlphaGenome和scPRINT [6][19][21] - **模块三:scRNA-seq虚拟蛋白组**:聚焦利用大模型从单细胞转录组信息预测蛋白质组表达,代表模型为scTranslator(在200万个细胞上预训练) [7][24] - **模块四:基因扰动预测**:系统讲解从单基因到组合扰动、从虚拟敲除到药物响应模拟的主流思路,涵盖STATE、dbDiffusion、GEARS、Prnet、scTenifoldKnk、scGen、GenKI等多种模型 [8][26][27][28][30][31][32] - **模块五:空间微环境与多尺度虚拟细胞**:理解虚拟细胞与空间组学结合,分析细胞通讯、微环境变化与空间扰动效应,涉及Celcomen、Nicheformer、PULSAR等模型及Tahoe-100M大规模数据集 [9][35][36][38] - **模块六:形态学扰动预测**:学习从分子信息预测细胞形态学变化,连接转录组、药物扰动与细胞图像,代表模型为IMPA [10][40] - **模块七:扰动动力学**:认识发育轨迹、扰动响应、细胞命运转变等动态预测思路,使分析从静态走向时间维度模拟,涉及Squidiff和CellOracle等模型 [11][42][43] - **模块八:评估与基准测试**:系统讲解扰动预测与虚拟细胞分析中的评估框架、常用指标和方法选择逻辑,建立规范的研究思维,以scPerturBench(评估27种方法在29个数据集上)为例 [12][45] 课程具体内容与模型实例 - **GET Foundation**:从DNA可及性(ATAC)预测基因表达的模型,应用于GRN推断、ATAC评估、跨细胞类型表达预测等 [14] - **scGPT**:在3300万个单细胞上预训练的生成式基础模型,可通过微调用于细胞注释、批次整合、基因扰动预测和GRN推断 [16] - **AlphaGenome**:能从DNA序列预测多种基因组特征(如表达、可及性、甲基化),并评估SNP影响 [19] - **scPRINT**:在5000万个单细胞上预训练的大规模Transformer模型,支持零样本细胞分类、GRN推断和表达去噪 [21][22] - **scTranslator**:使用Performer架构,从单细胞转录组直接预测蛋白质组表达,参数为117M [24] - **GEARS**:使用图神经网络结合知识图谱预测单基因和组合基因扰动后的转录组变化,能预测未见基因组合的协同效应 [27] - **Prnet**:利用药物分子结构和基因表达数据,预测新化合物处理后的转录组变化,基于LINCS L1000数据集 [28] - **GenKI**:基于变分图自编码器,在仅有野生型单细胞数据的情况下预测基因敲除效应 [32] - **Celcomen**:利用空间转录组数据进行因果解耦建模,预测虚拟扰动的空间效应 [35] - **Nicheformer**:在单细胞和空间转录组数据上联合预训练的Transformer模型,参数为49.3M,支持零样本任务 [36] - **PULSAR**:多尺度虚拟细胞架构,能从单细胞表达推演至群体和个体级别表示,支持零样本年龄回归、疾病分类等任务 [38] - **Tahoe-100M**:目前最大的单细胞化学扰动数据集,包含1亿个单细胞、1100种药物、50种癌症细胞系 [38] - **IMPA**:基于StarGANv2的GAN模型,从细胞荧光显微镜图像预测药物扰动导致的形态变化 [40] - **Squidiff**:使用条件DDIM扩散模型预测单细胞转录组的动态变化,如发育轨迹和药物组合效应 [42] - **CellOracle**:通过线性回归构建GRN并模拟转录因子敲除效应,基于纯统计方法 [43] - **scPerturBench**:对27种扰动预测方法在29个数据集上使用6种评估指标进行系统评估,并提供方法选择决策树 [45] 课程服务与师资 - 课程提供标准版和永久答疑版,包含直播授课、全套录播、教学答疑、配套代码数据及大模型授权码等服务 [48][50] - 课程由东京大学医学科学研究所助理教授杨奕涛与华哥生信创始人张振华联合主讲,两位在深度学习、医疗AI、单细胞多组学及空间转录组领域拥有丰富的科研与实践经验,并指导学员发表了大量高水平论文 [53][55] 学员预期收获 - 系统掌握虚拟细胞的完整框架,理解各方向解决的问题、适用数据及能支撑的创新点 [57] - 能够将虚拟细胞方法迁移到自己的单细胞或空间组学课题中,挖掘数据潜力,延伸分析维度 [58] - 实现从“基础分析”到“机制预测”的升级,通过虚拟敲除、调控网络构建、RNA预测蛋白、药物响应模拟等方法提升文章深度与创新性 [59] - 建立“看懂顶刊—复现顶刊—借鉴顶刊—迁移顶刊”的能力闭环,将前沿技术转化为个人科研竞争力 [60]