基因组基础AI模型
搜索文档
 百亿参数可部署基因组基础AI模型诞生
 经济观察报· 2025-10-25 11:05
 模型技术突破 - 发布全球首个百亿参数可部署的基因组通用基础模型Genos,支持百万碱基对的超长上下文分析并实现单碱基分辨率精准识别 [1] - 模型提供12亿和100亿参数两个版本,已在HuggingFace、魔搭等平台全面开源开放 [1]   数据资源与训练 - 模型整合人类泛基因组参考联盟、人类基因组结构变异图谱计划等多个权威公开资源 [1] - 首次将全球范围内636个"端粒到端粒"级别的高质量人类基因组作为训练数据,覆盖全球不同人群以体现遗传多样性 [1]   行业应用价值 - 现有模型大多基于1至2个参考基因组训练,难以体现人类遗传资源多样性,而Genos有助更全面理解人类遗传多样性 [1] - 人类基因组由30亿对碱基组成,该模型旨在精准识别和解析序列上碱基的具体功能 [1]