Workflow
人类基因组基础模型
icon
搜索文档
百亿级人类基因组基础模型发布
人民日报· 2025-10-27 07:28
模型发布与核心特点 - 华大生命科学研究院与之江实验室联合发布百亿参数人类基因组通用基础模型Genos [1] - 该模型针对人类基因组深度优化,支持高达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别 [1] - Genos标志着基因组研究从“读出”碱基序列迈向“读懂”生命底层逻辑 [1] 训练数据与技术架构 - Genos系统整合了多个公开资源,汇聚了全球范围内636个“端粒到端粒”级别的高质量人类基因组作为训练数据,覆盖不同人群以减少数据偏见 [2] - 模型采用混合专家架构,通过“按需激活”机制,在拥有百亿级参数庞大知识总量的同时,保持较低的推理成本和资源消耗 [2] 模型性能与验证 - 在一系列测试中,Genos在超过一半的经典评测任务里比所有现有模型表现更好 [3] - 在长序列评测任务如突变热点识别和族群分类上,Genos表现远超同类模型 [3] - 在直接面向临床应用的致病性突变解读任务中,Genos实现了较高的准确性,当结合021科学基础模型后准确率更高 [3] 开源策略与平台部署 - Genos模型将全面开源开放,提供12亿和100亿参数两个版本,模型权重、架构细节与完整训练流程已在GitHub、Hugging Face、魔搭等平台公开发布 [4] - 模型被深度整合进DCS Cloud云平台,用户无需复杂安装即可一键调用,平台为每个账户提供高达10万次的免费推理服务 [4] 应用场景与效率提升 - 在科研领域,Genos模型通过与DCS cloud结合,能仅凭DNA序列“秒级”预测RNA表达谱,将过去数周甚至数月才能完成的生物信息分析流程极大提速 [5] - 模型已整合进生命科学数据库CNGBdb,可帮助用户精准预测细胞表达量,高效筛选和验证关键候选基因 [5]
华大集团:全球首个百亿级人类基因组基础模型Genos发布
格隆汇· 2025-10-23 12:54
产品发布 - 华大生命科学研究院与之江实验室联合发布全球首个百亿参数人类基因组通用基础模型Genos [1] - 该模型针对人类基因组深度优化,支持高达百万碱基对的超长上下文分析 [1] - 模型实现单碱基分辨率的精准识别 [1] 行业意义 - Genos的推出标志着基因组研究从“读出”碱基序列迈向“读懂”生命底层逻辑的关键转折 [1] - 该模型有望为临床疾病诊断、个人基因组解读及前沿科学研究带来突破性变革 [1] 学术认可 - Genos的相关成果已发表于国际学术期刊GigaScience [1]