Workflow
女娲CE
icon
搜索文档
昆仑万维发布并开源Skywork-R1V 3.0版本;浙江大学发布高精准基因组设计AI模型丨AIGC日报
创业邦· 2025-07-10 08:00
昆仑万维Skywork-R1V 3.0版本发布 - 昆仑万维发布并开源Skywork-R1V 3.0版本 在MMMU评测中取得76.0的开源模型最高成绩 超越Claude-3.7-Sonnet(75.0)和GPT-4.5(74.4)等闭源模型 逼近人类初级专家水平(76.2) [1] Hugging Face开源模型与机器人产品 - Hugging Face开源小参数模型SmolLM3 拥有128k上下文窗口 支持6种语言 支持深度思考和非思考双推理模式 [1] - Hugging Face推出桌面机器人Reachy Mini 分无线版(449美元)和Lite版(299美元) 内置Raspberry 5微型计算机或需外接计算设备 [1] - Reachy Mini为开源DIY套件 体积与毛绒玩具相当 内置两块"眼睛"屏幕与天线结构 可通过Python编程操作 接入Hugging Face Hub平台 可使用超过170万个AI模型和40多万个数据集 [2] 浙江大学基因组AI模型 - 浙江大学开发"女娲CE"AI模型 能以超过90%准确率预测基因组调控区域突变带来的表型变化 并设计相应治疗位点 成果发表于《细胞》期刊 [1] 行业资讯服务 - 提供AIGC产业日报订阅服务 涵盖人形机器人、商业航天、AGI等热门赛道行业图谱和报告 [4]
浙江大学最新Cell论文:AI基因组模型——女娲CE,破译脊椎动物基因组调控语言
生物世界· 2025-07-09 08:09
基因组学与深度学习 - 多细胞生物中不同细胞类型拥有相同基因组但通过基因表达差异调控实现功能特化 调控序列通过细胞类型特异性方式招募转录因子决定基因表达模式 [2] - 染色质可及性是调控DNA的通用标志 可通过DNase-seq和ATAC-seq测量 但大多数物种仍缺乏全面的细胞类型解析调控序列图谱 [2] - 深度学习模型可直接从DNA序列预测调控和表达信号 郭国骥团队开发的Nvwa模型实现单细胞分辨率基因表达预测 Huatuo模型可解码疾病相关调控序列 [3] - 当前细胞图谱数据在灵敏度或通量方面存在局限 阻碍高精度预测模型生成 [3] 技术突破与研究成果 - 郭国骥团队开发超高通量超灵敏单核ATAC测序技术UUATAC-seq 一天内可完成物种染色质可及性图谱构建 [5][8] - 在五大脊椎动物(小鼠/鸡/守宫/蝾螈/斑马鱼)中绘制候选顺式调控元件(cCRE)图谱 发现基因组大小差异影响cCRE数量但不影响其大小 [9][10] - 开发多任务深度学习模型NvwaCE 实现从基因组序列到单细胞水平调控元件图谱的直接预测 在多项指标上超越现有基因组AI模型 [5][11] 模型性能与应用验证 - NvwaCE证明调控"语法"保守性强于核苷酸序列 并将cCRE组织成不同功能模块 揭示细胞类型特异性基因表达的序列基础 [6][11] - 模型精准预测合成突变对谱系特异性cCRE功能的影响 与QTL和基因编辑结果一致 [13] - 首次预测出镰状细胞病治愈性突变位点(HBG1-68:A>G) 基因编辑验证显示胎儿血红蛋白表达量显著提升 证明AI模型预测功能性位点的性能 [13][14] 研究意义与行业影响 - UUATAC-seq技术高效构建染色质可及性图谱 NvwaCE模型为破译脊椎动物基因组调控语言提供资源 [15] - 研究成果为全面解读基因组语言和建立数字生命模型奠定基础 [6]
浙大发布高精准基因组设计AI模型
快讯· 2025-07-09 00:00
基因组预测AI模型"女娲CE" - 江大学郭国骥教授团队开发出深度学习AI模型"女娲CE",能够以超过90%的准确率预测基因组调控区域突变后的表型变化,并设计相应治疗位点 [1] - 该模型结合疾病表型设计治疗位点,相关成果发表于国际学术期刊《细胞》 [1] - 人类基因组计划绘制的人类基因图谱中,科学家对其遗传信息的破译不足10% [1] 技术基础与数据 - 团队自主开发超高通量、超灵敏度的单核染色质可及性测序技术 [1] - 构建覆盖小鼠、鸡、守宫、蝾螈和斑马鱼五种脊椎动物的全组织调控元件图谱,形成优质数据库 [1] - 在此基础上开发多任务深度学习AI模型"女娲CE",实现从基因组到细胞图谱的直接预测 [1] 模型性能与应用 - "女娲CE"在多项指标上超越现有基因组AI模型 [2] - 能够预测基因组调控元件突变对各种细胞类型带来的表型变化,准确率超过90% [2] - 成功应用于镰刀型贫血症治疗,通过修改预测位点使胎儿血红蛋白表达量提升 [2] 研究意义 - 帮助研究人员更好理解遗传病发生的复杂原因 [2] - 为生命科学、医学和农学研究提供强大支撑 [2] - 有助于破译隐藏在海量基因序列背后的复杂调控语言 [1]