Genos
搜索文档
百亿级人类基因组基础模型发布
人民日报· 2025-10-27 07:28
模型发布与核心特点 - 华大生命科学研究院与之江实验室联合发布百亿参数人类基因组通用基础模型Genos [1] - 该模型针对人类基因组深度优化,支持高达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别 [1] - Genos标志着基因组研究从“读出”碱基序列迈向“读懂”生命底层逻辑 [1] 训练数据与技术架构 - Genos系统整合了多个公开资源,汇聚了全球范围内636个“端粒到端粒”级别的高质量人类基因组作为训练数据,覆盖不同人群以减少数据偏见 [2] - 模型采用混合专家架构,通过“按需激活”机制,在拥有百亿级参数庞大知识总量的同时,保持较低的推理成本和资源消耗 [2] 模型性能与验证 - 在一系列测试中,Genos在超过一半的经典评测任务里比所有现有模型表现更好 [3] - 在长序列评测任务如突变热点识别和族群分类上,Genos表现远超同类模型 [3] - 在直接面向临床应用的致病性突变解读任务中,Genos实现了较高的准确性,当结合021科学基础模型后准确率更高 [3] 开源策略与平台部署 - Genos模型将全面开源开放,提供12亿和100亿参数两个版本,模型权重、架构细节与完整训练流程已在GitHub、Hugging Face、魔搭等平台公开发布 [4] - 模型被深度整合进DCS Cloud云平台,用户无需复杂安装即可一键调用,平台为每个账户提供高达10万次的免费推理服务 [4] 应用场景与效率提升 - 在科研领域,Genos模型通过与DCS cloud结合,能仅凭DNA序列“秒级”预测RNA表达谱,将过去数周甚至数月才能完成的生物信息分析流程极大提速 [5] - 模型已整合进生命科学数据库CNGBdb,可帮助用户精准预测细胞表达量,高效筛选和验证关键候选基因 [5]
让AI大模型读懂生命之书
经济日报· 2025-10-26 06:09
模型发布与核心优势 - 华大生命科学研究院与之江实验室联合发布全球首个百亿参数可部署基因组通用基础模型Genos [1] - 模型训练数据整合多个权威资源,使用全球范围内636个高质量人类基因组,覆盖不同人群以提升遗传多样性理解 [2] - 采用"混合专家"架构降低推理成本和资源消耗,提供12亿和100亿参数两个开源版本 [2] - 在致病性突变解读任务中准确率达92%,结合科学基础模型后准确率高达98.3%,超越现有最佳水平模型 [2] 行业应用前景 - AI大模型可重塑基因组研究节奏,助力科研、临床与产业三重跃迁 [3] - 科研侧AI能压缩寻找致病位点周期,为罕见病和复杂病机制研究导航 [3] - 临床侧AI可将基因报告转化为患者易懂文本,辅助医生进行快速合规的临床级解读 [3] - 产业侧AI推动研发从"试错式"转向"设计式",大幅降低新药研发的实验迭代次数和成本 [4] 未来发展方向与挑战 - 需持续扩充训练数据库,纳入更多疾病样本与遗传数据以提升复杂疾病解读能力 [4] - 需建立完善伦理与安全规范,明确模型临床边界,避免过度解读和隐私泄露风险 [4] - 应加强跨学科协同,推动AI与临床数据系统、生物实验平台深度融合,通过"预测+验证"反馈迭代优化模型 [4] - 实现基因组"读、思、写、用"闭环将打开生命经济下一扇大门,需要学界、产业界等多方共同努力 [4]
百亿参数可部署基因组基础AI模型诞生
经济观察报· 2025-10-25 11:05
模型技术突破 - 发布全球首个百亿参数可部署的基因组通用基础模型Genos,支持百万碱基对的超长上下文分析并实现单碱基分辨率精准识别 [1] - 模型提供12亿和100亿参数两个版本,已在HuggingFace、魔搭等平台全面开源开放 [1] 数据资源与训练 - 模型整合人类泛基因组参考联盟、人类基因组结构变异图谱计划等多个权威公开资源 [1] - 首次将全球范围内636个"端粒到端粒"级别的高质量人类基因组作为训练数据,覆盖全球不同人群以体现遗传多样性 [1] 行业应用价值 - 现有模型大多基于1至2个参考基因组训练,难以体现人类遗传资源多样性,而Genos有助更全面理解人类遗传多样性 [1] - 人类基因组由30亿对碱基组成,该模型旨在精准识别和解析序列上碱基的具体功能 [1]
AI进化速递 | 阿里夸克AI眼镜将开启预售
第一财经· 2025-10-23 20:49
政策法规动态 - 全国人大常委会法工委计划在网络安全法中增加促进人工智能安全与发展的内容 [1] 中国公司AI模型与平台发布 - 字节跳动Seed团队推出3D生成大模型Seed3D 1.0 [1] - 中科曙光发布国内首个科学大模型一站式开发平台OneScience [1] - 百亿参数人类基因组通用基础模型Genos正式发布 [1] 中国公司AI产品与工具发布 - 快手StreamLake正式推出集工具、模型、平台于一体的AI编程产品矩阵 [1][2] - 阿里夸克AI眼镜于24日开启预售,起售价为3699元 [1][2] 国际AI行业动态 - 马斯克称Optimus机器人第三代可能将于明年第一季度发布 [1][2] - 英国政府与OpenAI达成协议,以扩大数据托管范围 [1]
华大集团:全球首个百亿级人类基因组基础模型Genos发布
格隆汇· 2025-10-23 12:54
产品发布 - 华大生命科学研究院与之江实验室联合发布全球首个百亿参数人类基因组通用基础模型Genos [1] - 该模型针对人类基因组深度优化,支持高达百万碱基对的超长上下文分析 [1] - 模型实现单碱基分辨率的精准识别 [1] 行业意义 - Genos的推出标志着基因组研究从“读出”碱基序列迈向“读懂”生命底层逻辑的关键转折 [1] - 该模型有望为临床疾病诊断、个人基因组解读及前沿科学研究带来突破性变革 [1] 学术认可 - Genos的相关成果已发表于国际学术期刊GigaScience [1]
全球首个百亿级可部署基因组基础模型诞生
科技日报· 2025-10-23 07:36
模型发布与核心突破 - 华大生命科学研究院与之江实验室联合发布全球首个百亿参数可部署的基因组通用基础模型Genos [1] - 该模型支持多达百万碱基对的超长上下文分析并实现单碱基分辨率的精准识别 [1] - 模型采用"混合专家"架构精准调度算法在汇总百亿级参数时成功降低推理成本和资源消耗 [1] 技术优势与数据基础 - Genos整合多个权威公开资源首次将全球范围内636个"端粒到端粒"级别的高质量人类基因组作为训练数据 [1] - 训练数据覆盖全球不同人群有助更全面理解人类遗传多样性克服现有模型基于1-2个参考基因组难以体现多样性的局限 [1] - 在致病性突变解读任务中准确率达92%结合科学基础模型后准确率高达98.3%多项评测超越现有最佳水平模型 [1] 商业化与可及性 - 模型已在HuggingFace魔搭等平台全面开源开放提供12亿和100亿参数两个版本满足不同需求 [2]