AI scientist

搜索文档
对谈斯坦福 Biomni 作者黄柯鑫:AI Scientist 领域将出现 Cursor 级别的机会|Best Minds
海外独角兽· 2025-06-20 19:18
AI+生物领域发展现状 - 语言模型和agent技术正在从通用领域快速渗透到生物医药等高价值垂直领域 [3] - AI scientist agent能够自主提出假设、设计实验并循环修正,正在改写科研和药物开发范式 [3][19] - 前谷歌CEO投资的FutureHouse推出四款AI scientist agent,并宣称其AI系统Robin成功发现新药 [3][25] - OpenAI近期强调AI在生物学领域能力不断增强 [3] AI scientist的本质与特点 - AI scientist本质是agentic system,能够模拟人类科学家的"假设-实验-观察"循环 [19][21] - 与通用agent相比,AI scientist需要专业环境和专家know-how支持 [28] - 当前阶段AI scientist主要实现任务自动化,未来目标是实现完全自主的科学发现 [21][29] - AI scientist可以使用AlphaFold等工具完成任务,两者是互补关系 [53] 通用agent的局限性 - 通用agent缺乏生物学专业环境和工具整合 [28] - 生物学领域存在大量未记录的专家隐性知识 [28] - 科研探索需要严谨性、创造力和长期规划能力,这些都是当前agent的短板 [28] - 生物研究任务高度分散,需要跨学科交叉研究能力 [37] Biomni系统的创新 - Biomni构建了集成数百种专业工具、数据库与软件的开放环境 [34][38] - 通过文献挖掘和Action Discovery agent发现新工具资源 [38] - 采用code as action设计,使agent能够灵活处理复杂任务 [38] - 在湿实验protocol设计和数据分析等任务上显著提升效率 [39] - 未来计划引入强化学习让agent自主学习和优化解决方案 [48] AI for Science的商业机会 - 生物医药研发存在数千亿美元市场,AI可大幅提升效率 [77] - AI scientist可能带来类似Cursor或Devin的创业机会 [77] - 未来可能出现"一人+多个agent"运营的虚拟药企模式 [79] - 药企对AI接受度提高,开始使用ChatGPT等工具辅助工作 [81] 行业挑战与未来方向 - 生物学数据获取成本高,是主要瓶颈 [62] - 需要设计适合生物学特点的benchmark评估体系 [70] - 强化学习在生物学应用需要明确定义的reward系统 [50] - 终极目标是AI scientist实现诺贝尔奖级别的科学发现 [90]
AI4Science 图谱,如何颠覆10年 x 20亿美金成本的药物研发模式
海外独角兽· 2025-06-18 20:27
核心观点 - AI for Science 正在将生命科学与数字互联网两大科技树交汇并加速,大模型对生物系统等复杂系统具有前所未有的理解和生成能力,有望成为加速科学发现的关键引擎 [3] - Foundation Model + AI Agent 正在颠覆传统高成本、慢速的试错式科研流程,将药物研发从平均10年、20亿美元的成本重新压缩与重构 [3][7] - 行业采用「Tech/Bio × Generalist/Specialist」四象限框架梳理玩家,包括Biology Foundation Model、AI Scientist、AI-Native Therapeutics和AI-empowered solution四大类 [4] 研究框架 - 横轴:Generalist vs Specialist,评估公司在生物医药研发流程中的广度和深度,左侧偏单点聚焦,右侧偏全流程技术平台 [8] - 纵轴:Tech vs Bio,评估企业产品侧重平台技术能力还是直接解决生物/临床问题,上方接近技术方案交付,下方需完整开发药物/疗法 [9] Tech × Specialist:Biology foundation model - AlphaFold 3 解决了蛋白质三维结构预测难题,将数月甚至数年的实验缩短为计算机快速预测,并扩展到预测蛋白质与DNA、RNA、小分子等的复合物结构与相互作用 [14] - Isomorphic Labs 由DeepMind分拆成立,已与礼来和诺华签署总里程碑达26.5亿欧元的合作协议,定位为技术平台提供方 [15] - ESM3 旨在打造通用生物基础模型,整合序列、结构、功能三个模态,存在1.4B、7B、98B三种尺寸,展现明显Scaling Law [17][18] - Evo2 是基因组语言模型,在超9万亿碱基序列上训练,拥有100万碱基的超长上下文窗口,能预测变异功能和设计生物序列 [22][23] Tech × Biologist:自动化科研平台 - AI Scientist 通过LLM的推理、规划、工具使用能力,整合文献检索、实验设计、数据分析、机器人控制等环节,将科研从劳动密集型转变为知识和算力密集型 [24][25] - Future House 发布Crow、Falcon、Owl、Phoenix四款Agent,组成多智能体系统Robin,在2.5个月内完成端到端科研循环,发现治疗干性年龄相关性黄斑变性的全新药物方案 [26][34][35][36][37] - Lila Sciences 构建"科学超级智能平台",已在基因药物设计、新型治疗分子发现、绿色能源技术创新、碳捕获材料设计等方面取得进展 [39] Bio × Generalist:AI-native Therapeutics - AI-native制药公司构建以AI为核心的整合平台,自主研发创新疗法管线,AI不仅仅是工具而是研发范式的基础和引擎 [40] - Xaira Therapeutics 募集约10亿美元启动资金,重点方向包括蛋白质生成式模型、多模态数据工厂和端到端推进管线 [49][50] - Generate Biomedicines 采用"生成生物学"方法,已与安进、诺华签订潜在里程碑超过10亿美元的合作协议,累计融资超过7亿美元 [51][52][53] - Somite AI 聚焦"可编程细胞疗法",完成4700万美元A轮融资,开发DeltaStem基座模型预测细胞命运转变路径 [54][55][56] - Moonwalk Bio 专注"精准表观遗传编辑",种子+A轮总融资约5700万美元,开发EpiRead和EpiWrite技术 [57][58][59] Bio × Specialist:AI赋能解决方案 - 实验数据平台批量生成并开源稀缺实验数据,降低AI4sci模型训练门槛,如Tahoe Therapeutics发布的单细胞扰动数据集涵盖1亿细胞/6万次化学-生物扰动 [63][64] - 多组学靶点发现整合DNA、蛋白、显微图像和临床表型等多模态数据,训练跨尺度Foundation Model直接输出新靶点与作用机制假设 [65][66] - 药物重定位将已上市或临床搁浅的药物与新疾病通路快速匹配,可跳过毒理与I期,如Healx的候选药HLX-1502已进入NF-1 II期 [68][69][70][73] - 临床试验加速用AI优化患者匹配,如Unlearn AI的数字孪生技术可将招募期缩短30-50% [75][76] 行业趋势 - 价值正在从传统CRO与药企的"手工试错"转移到掌握数据、模型飞轮与自动化实验室的AI原生公司手中 [78] - 行业进入"算力-数据-算法"驱动的指数级进步时代,四类玩家分别在单点突破、科研流程产品化、新疗法开发和关键环节优化方面推动变革 [78]