基因组学
搜索文档
为人类健康与可持续发展贡献科研力量
人民网· 2025-10-28 09:12
大会概况 - 第二十届国际基因组学大会在杭州举办 聚焦"组学与人工智能的未来"主题 [1] - 大会吸引来自19个国家和地区的100余位专家学者参与 [1] - 本届大会是ICG时隔20年再次在杭州举办 并逢人类基因组计划草图完成25周年 [1] 行业趋势与意义 - 基因组学技术在过去25年深刻改变医学和农业等领域 [1] - 大会发扬人类基因组计划精神 推动全球组学研究与生物产业跨越式发展 [1] - 大会聚焦基因组学未来方向及AI与组学融合应用等核心问题 [1] 前沿议题与专家观点 - 中外学者围绕多领域前沿议题分享观点 包括人类基因组计划长远价值和组学与AI融合最新成果 [2] - 专家讨论主题涵盖"计算与智能"和"卵巢乳腺癌综合征预防"等疾病防控与技术创新前沿 [2] - 主题论坛展示"健康浙江"百万人群队列建设成果 并探讨细胞组学技术对精准医学的助力 [2] 合作与科普 - 大会呼吁加强无国界合作以促进行业发展 [2] - 设置"科普嘉年华"专场 将前沿科研成果转化为青少年易懂内容以激发科学探索热情 [2]
百亿级人类基因组基础模型发布
人民日报· 2025-10-27 07:28
模型发布与核心特点 - 华大生命科学研究院与之江实验室联合发布百亿参数人类基因组通用基础模型Genos [1] - 该模型针对人类基因组深度优化,支持高达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别 [1] - Genos标志着基因组研究从“读出”碱基序列迈向“读懂”生命底层逻辑 [1] 训练数据与技术架构 - Genos系统整合了多个公开资源,汇聚了全球范围内636个“端粒到端粒”级别的高质量人类基因组作为训练数据,覆盖不同人群以减少数据偏见 [2] - 模型采用混合专家架构,通过“按需激活”机制,在拥有百亿级参数庞大知识总量的同时,保持较低的推理成本和资源消耗 [2] 模型性能与验证 - 在一系列测试中,Genos在超过一半的经典评测任务里比所有现有模型表现更好 [3] - 在长序列评测任务如突变热点识别和族群分类上,Genos表现远超同类模型 [3] - 在直接面向临床应用的致病性突变解读任务中,Genos实现了较高的准确性,当结合021科学基础模型后准确率更高 [3] 开源策略与平台部署 - Genos模型将全面开源开放,提供12亿和100亿参数两个版本,模型权重、架构细节与完整训练流程已在GitHub、Hugging Face、魔搭等平台公开发布 [4] - 模型被深度整合进DCS Cloud云平台,用户无需复杂安装即可一键调用,平台为每个账户提供高达10万次的免费推理服务 [4] 应用场景与效率提升 - 在科研领域,Genos模型通过与DCS cloud结合,能仅凭DNA序列“秒级”预测RNA表达谱,将过去数周甚至数月才能完成的生物信息分析流程极大提速 [5] - 模型已整合进生命科学数据库CNGBdb,可帮助用户精准预测细胞表达量,高效筛选和验证关键候选基因 [5]
全球首个百亿参数人类基因组基础模型Genos发布!开启基因组智能分析的新时代
生物世界· 2025-10-23 16:00
模型发布与核心意义 - 华大生命科学研究院与之江实验室于2025年10月23日联合发布全球首个百亿参数人类基因组通用基础模型Genos [2] - 该模型标志着基因组研究从“读出”碱基序列迈向“读懂”生命底层逻辑的关键转折 [4] - 相关成果已于10月22日发表于国际学术期刊《GigaScience》 [5] 模型技术特点与架构 - Genos是针对人类基因组深度优化的基础模型,支持高达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别 [3] - 模型系统整合了人类泛基因组参考联盟等多个权威资源,首次汇聚全球636个“端粒到端粒”级别的高质量人类基因组作为训练数据,覆盖不同人群以全面代表人类遗传多样性 [8] - 采用混合专家架构,在拥有百亿级参数庞大知识总量的同时,推理成本和资源消耗远低于同等规模模型 [9] 模型性能表现 - 在基因组元件识别、远程调控预测等经典评测任务中,Genos在超过一半的任务中表现优于所有现有模型 [11] - 在长序列评测任务中表现远超同类模型,展现了强大的上下文分析能力 [11] - 在直接面向临床应用的致病性突变解读任务中,实现了92%的准确性,当结合之江实验室的021科学基础模型后,准确率高达98.3% [13] - 综合多项评测结果,Genos在各项核心任务中的表现均全面超越了现有最佳水平 [13] 模型开源与应用生态 - 模型将全面彻底地开源开放,提供12亿参数和100亿参数两个版本,模型权重、架构细节与完整训练流程已在GitHub、Hugging Face等平台依据MIT协议公开发布 [21] - 模型被深度整合进DCS Cloud云平台,用户无需复杂配置即可一键调用,每个账户提供高达10万次的免费推理服务,极大降低使用门槛 [21] - 在科研领域,模型能仅凭DNA序列“秒级”预测RNA表达谱,将过去数周甚至数月的分析流程极大提速 [21] - 在临床应用领域,模型与GeneT深度思考模型结合,能为遗传疾病诊断提供专家级多模态解读 [22] - 在个人健康领域,模型已整合进BGE平台,赋能个人基因组报告解读 [22] 未来发展规划 - 公司联合发起“十万长读长大人群联盟”和“百亿细胞计划”两项大科学计划 [23] - “十万长读长大人群联盟”将完成10万人的“端粒到端粒”级别完整基因组测序,为模型提供高质量训练数据 [23] - “百亿细胞计划”将完成百亿单细胞测序,助力基因和细胞的融合大模型开发 [23]