人工智能模型
搜索文档
Evo-2登上Nature:AI模型实现对所有生命基因组的建模和设计,甚至能从头设计生命
生物世界· 2026-03-09 14:48
文章核心观点 - 由Arc研究所、斯坦福大学、加州大学伯克利分校、加州大学旧金山分校及英伟达科学家团队开发的Evo-2模型正式发表,这是有史以来最大的生物学人工智能模型,能够对所有生命域进行理解、建模和设计遗传密码,标志着生命科学进入AI驱动的新时代 [2][3][31] 模型概述与发布信息 - Evo-2模型于2026年3月4日在《自然》杂志正式发表,其前身Evo模型于2024年11月15日在《科学》杂志作为封面论文发表 [2][6] - Evo-2是首个经过同行评议的、能够对所有生命域进行基因组建模和设计的AI模型,其训练数据涵盖了从病毒到人类的12.8万个基因组的9.3万亿个核苷酸 [3] - 该模型完全开源,在GitHub上共享了模型参数、训练代码、推理代码及OpenGenome 2数据集,并可通过英伟达BioNeMo平台免费访问和部署 [3] 模型的技术规格与架构 - Evo-2的训练数据扩展至所有生命域,包括细菌、古菌、噬菌体、植物、动物和人类等,总计9.3万亿个核苷酸,训练参数高达400亿(另有70亿参数版本) [12] - 训练过程使用了超过2000张英伟达H100 GPU,持续数月,规模接近顶尖通用大模型 [3][12] - 模型采用全新的StripedHyena 2架构,融合了输入依赖卷积和注意力机制,在处理长序列时比标准Transformer架构快3倍,且显存占用更低 [14] - 其最引人注目的技术突破之一是拥有100万个token的上下文窗口,能够一次性处理长达100万碱基对的DNA序列,从而捕捉基因组中的长距离相互作用 [14] 模型的核心能力:预测 - Evo-2具备强大的零样本预测能力,无需针对特定任务微调即可评估基因突变的功能影响 [16] - 在ClinVar数据库测试中,对于编码区单核苷酸突变,其预测性能AUROC达到0.841;对于非编码区突变,AUROC高达0.987,表现尤为突出 [20] - 对于插入、缺失、重复等复杂非单核苷酸突变类型,Evo-2的预测能力全面领先于其他模型 [20] - 在剪接突变预测方面,于内含子突变预测中与SpliceAI、CADD等专业监督模型竞争激烈,在外显子突变预测中超越了所有零样本模型 [17] - 该模型能够有效预测BRCA1和BRCA2等关键疾病基因的编码区和非编码区单核苷酸突变,展示了其作为零样本预测器在精准医疗中的应用潜力 [23] 模型的核心能力:生成与设计 - Evo-2能够生成全新的、完整的DNA序列,研究团队已成功生成了线粒体基因组、最小细菌基因组(生殖支原体)以及长达33万碱基对的酵母染色体 [18][21] - 其生成能力为合成生物学开辟新可能,通过推理时搜索技术,可引导模型设计具有特定功能的DNA序列,例如定制化设计启动子、增强子等调控元件 [24] - 团队展示了可控生成能力,例如设计了具有预设染色质可及性模式的序列,甚至在表观基因组上“写”出了“EVO2”、“ARC”这样的摩斯电码 [24] 模型在基础研究与行业生态中的意义 - Evo-2的内部表示捕捉了多种生物学特征,如外显子-内含子边界、转录因子结合位点、蛋白质结构元素等,为发现新的功能元件提供了工具 [26] - 模型的完全开源被视为生物计算领域的结构性事件,有望解决该领域工具生态割裂、数据许可复杂等问题,并可能成为一个标准生态平台 [28] - 这标志着生物学开始拥有自己的“通用底座”,研究人员可在此基础上开发各种应用,加速整个生命科学领域的创新 [29] 生物安全与未来展望 - 研究团队在生物安全方面采取了谨慎措施,在训练数据中排除了能够感染真核生物的病毒序列,以降低模型被滥用于设计致病性病毒的风险 [31] - 团队验证了数据排除导致模型对真核病毒基因组建模性能较差,表明该策略达到了预期效果 [31] - Evo系列模型为生物学建模与设计奠定了基础,未来通过整合基因组序列与其他模态数据,有望开发出能够模拟健康与疾病状态下复杂表型的模型 [31]
cpo的决心
小熊跑的快· 2026-03-03 06:40
英伟达战略投资与行业影响 - 英伟达宣布向两家光通信领域的关键公司进行重大投资 向Lumentum和Coherent各投资20亿美元[1] - 这两家公司被描述为光通信产业链中的核心资产 其股价在消息公布后出现暴涨[1] A股光通信板块市场情绪 - A股市场的CPO板块近期出现非理性波动 可能受到市场传言影响[4] - 分析认为光通信仍然是未来市场投资的主线[4] AI模型生态与国产化趋势 - OpenRouter是一个AI开发者社区 是全球各类新模型展示和竞争的平台[5] - 在当前AI大模型技术迭代速度放缓的背景下 国产AI模型正在快速崛起[5]
马斯克:Grok 4.20下周发布,较4.1版改进重大
搜狐财经· 2026-02-15 17:41
Grok 模型迭代与性能表现 - xAI公司CEO宣布Grok 4.20版本将于下周发布,相比4.1版本将有重大改进 [1] - Grok 4.1版本于去年11月发布,在创造性、情感理解和协作互动方面实现了重大改进 [1] - Grok 4.1版本在LMArena文本能力排行榜上以1483的Elo分数高居榜首,领先第二名达31分 [1] Grok 模型技术优势与特性 - Grok 4.1的“即时响应”版本以1465的Elo分数位列第二,性能超越了其他所有模型的“全推理”模式 [3] - Grok 4.1版本相较于前代Grok 4(排名第33位)实现了巨大飞跃,印证了其在底层能力上的绝对优势 [3] - Grok 4.1版本改进了“幻觉”出现率,为用户提供更可靠、更准确的信息 [3]
字节越来越像 Google:字节跳动距离 Google 这样的头部公司,大概只差六个月
新浪财经· 2026-02-14 19:08
行业格局与公司定位 - DeepMind CEO Demis Hassabis 曾判断字节跳动在AI模型领域距离Google这样的头部公司只差六个月 [2][60] - 随着Seedance 2.0等产品的发布,市场认为字节跳动与Google的模型差距可能已缩小至一两个月,公司正站在世界第一梯队 [4][62][66] - 字节跳动的模型战略与Google相似,其优势在于模型与应用(如抖音、即梦、豆包)深度协同,形成从场景反馈到模型迭代的闭环系统 [47][48][49][101][102][103] Seedance 2.0(视频生成模型) - 模型在指令遵循能力上表现突出,能够理解并完美执行复杂、冗长的提示词,基本解决了幻觉问题 [12][13][72] - 生成视频的质量(包括运镜、画面、声音、物理逻辑细节)远超预期,让AI视频生成能力“越过了临界点”,达到完全可用的水平 [11][13][16][70][73] - 其表现引发了行业领袖(如导演贾樟柯、游戏制作人冯骥)的强烈关注和积极评价,认为“AI的童年时代结束了” [7][15][65][73] Seedream 5.0 Lite(图像生成模型) - 模型能力主要提升在主体一致性和指令遵循两方面,解决了旧版本生成多张图片时人物神态、细节不一致的“出戏感” [21][78] - 指令遵循能力强大,能够精准完成复杂的图片编辑指令(如修改物体颜色、修复破损部分),满足了用户“改图”这一核心场景需求 [23][25][80][82] 豆包大模型 2.0 - 模型在复杂的深度推理和Agent任务上相比1.8版本有“一个数量级”的明显进步 [26][83] - 具备原生多模态能力,模型本身能一体化理解文本、图片、视频,其视觉理解能力在通用模型中表现优异,优于包括Opus 4.6在内的竞品 [30][31][33][34][86][87][88] - 具备原生Agent能力,能自主规划并执行长链路复杂任务(如研究、写作、编程),在相关评测中取得高分 [35][36][40][41][89][93][94] - 推理成本大幅下降,模型效果与业界顶尖模型基本打平,但Token定价降低了大约一个数量级,使Agent等耗Token大户场景的商业化落地成为可能 [45][46][98][99] 商业模式与战略协同 - 公司构建了“模型能力、应用反馈、云服务变现、反哺算力”的自循环系统 [56][57][110][111] - 火山引擎作为云服务出口,其逻辑与拥有自研模型的Google Cloud相似,公司模型能力越强,火山引擎的云服务就越有竞争力 [54][55][108][109] - 内部海量应用(抖音、即梦、豆包)是模型的“压力测试场”,为模型迭代提供直接的场景反馈和方向指引 [48][49][102][103]
港股异动丨MiniMax大涨13%,M2.5模型即将正式上线
格隆汇· 2026-02-12 11:14
公司股价与市值表现 - 公司股票代码为0100.HK,盘中股价大幅上涨13%,报收580港元 [1] - 公司市值因此次股价上涨超过1800亿港元 [1] 核心产品进展 - 公司即将正式上线其M2.5模型 [1] - 目前M2.5模型已在海外市场的MiniMax Agent产品中进行内测 [1]
智谱高开近9% 正式推出旗舰模型GLM-5 GLM Coding Plan套餐涨价
智通财经· 2026-02-12 09:37
公司股价与市场反应 - 智谱股价高开近9%,截至发稿涨8.77%,报339.8港元,成交额1739.78万港元 [1] 新一代旗舰模型发布 - 公司正式推出新一代旗舰模型GLM-5,主攻编程与智能体能力,官方称已实现开源领域最优表现 [1] - GLM-5参数规模由上一代的355B扩展至744B,激活参数从32B提升至40B [1] - 公司证实此前在全球模型服务平台OpenRouter登顶热度榜首的神秘模型"Pony Alpha"即为GLM-5 [1] - 内部评估显示,GLM-5在前端、后端、长程任务等编程开发场景中,平均性能较上一代提升超20% [1] - 真实编程体验逼近Claude Opus 4.5水平,该模型已上线chat.z.ai平台 [1] 产品定价策略调整 - 公司发布GLM Coding Plan价格调整函,因市场需求持续强劲增长,用户规模与调用量快速提升 [2] - 为保障高负载下的稳定性与服务质量,公司同步加大算力与模型优化投入 [2] - 决定对GLM Coding Plan套餐价格体系进行结构性调整,整体涨幅自30%起 [2] - 调整内容包括取消首购优惠,保留按季按年订阅优惠,已订阅用户价格保持不变 [2] - 价格调整生效时间为2026年2月12日 [2]
港股异动 | 智谱(02513)高开近9% 正式推出旗舰模型GLM-5 GLM Coding Plan套餐涨价
智通财经网· 2026-02-12 09:33
公司股价与市场反应 - 智谱(02513)股价高开近9%,截至发稿上涨8.77%至339.8港元,成交额1739.78万港元 [1] 新一代旗舰模型发布 - 公司于2月11日正式推出新一代旗舰模型GLM-5,主攻编程与智能体能力,官方称已实现开源领域最优表现 [1] - GLM-5参数规模由上一代的355B扩展至744B,激活参数从32B提升至40B [1] - 公司证实此前在全球模型服务平台OpenRouter登顶热度榜首的神秘模型"Pony Alpha"即为GLM-5 [1] - 内部评估显示,GLM-5在前端、后端、长程任务等编程开发场景中,平均性能较上一代提升超20%,真实编程体验逼近Claude Opus 4.5水平 [1] - 该模型已上线chat.z.ai平台 [1] 产品定价策略调整 - 公司发布GLM Coding Plan价格调整函,称因市场需求持续强劲增长,用户规模与调用量快速提升 [2] - 为保障高负载下的稳定性与服务质量,公司同步加大算力与模型优化投入 [2] - 公司决定对GLM Coding Plan套餐价格体系进行结构性调整,整体涨幅自30%起 [2] - 调整内容包括:取消首购优惠,保留按季按年订阅优惠;已订阅用户价格保持不变 [2] - 价格调整生效时间为2026年2月12日 [2]
神秘模型“Pony Alpha”确认为智谱新模型GLM-5,目前已上线
第一财经资讯· 2026-02-12 04:35
公司动态与产品发布 - 智谱公司于2月11日向第一财经确认,此前在全球模型服务平台OpenRouter登顶热度榜首的神秘模型“Pony Alpha”即为公司的新模型GLM-5 [1] - 该新模型GLM-5目前已在公司的官方平台chat.z.ai上线 [1] 市场表现与行业地位 - 智谱公司的新模型GLM-5(以“Pony Alpha”为名)在全球模型服务平台OpenRouter上登顶热度榜首 [1]
神秘模型“Pony Alpha”确认为智谱新模型GLM-5,目前已上线
第一财经· 2026-02-11 21:32
公司动态与产品发布 - 智谱公司(股票代码2513.HK)向第一财经确认,此前在全球模型服务平台OpenRouter登顶热度榜首的神秘模型“Pony Alpha”即为公司的新模型GLM-5 [1] - 该新模型GLM-5目前已在公司的chat.z.ai平台上线 [2] 市场反应与媒体报道 - 该神秘模型的爆火,带动了智谱公司股价的暴涨 [3] - 有知情人士透露,该神秘模型是智谱即将发布的GLM-5 [3]
智谱确认神秘模型“Pony Alpha”为GLM-5
第一财经· 2026-02-11 21:20
公司动态 - 智谱官方确认,此前在OpenRouter平台登顶热度榜首的神秘模型“Pony Alpha”即为公司的新模型GLM-5 [2] - 新模型GLM-5目前已在公司旗下的chat.z.ai平台上线 [2] 行业与市场表现 - 智谱公司的新模型GLM-5(以“Pony Alpha”为名)在全球模型服务平台OpenRouter上曾登顶热度榜首 [2]