Owl

搜索文档
FutureHouse 联合创始人:AI Scientist 不是“全自动化科研”
海外独角兽· 2025-06-26 20:25
核心观点 - FutureHouse是由Google前CEO Eric Schmidt资助创立的AI Lab,专注于AI for Science方向,目标是打造可自主提出问题、规划实验、迭代假设的AI科学家体系 [3] - 公司推出了四个AI科研agent:Crow(通用智能体)、Falcon(自动化文献综述智能体)、Owl(调研智能体)以及Phoenix(实验智能体),这些agent可访问完整科学文献全文并具备信息质量评估能力 [3] - AI系统Robin成功发现新药,展示了AI在科研自动化领域的潜力 [3] - AI推动生物科学分为两层视角:以AlphaFold 3等模型为代表的分子设计空间打开,以及FutureHouse探索的科研自动化agent系统构成的AI Scientist [4] 生物比化学更具"平台化"潜力 - 生物学比化学更具平台化特征,更适合作为科学自动化的起点 [14] - 蛋白质设计流程相对标准化,可以选择克隆、细胞表达或直接机器合成,而化学每个分子几乎都是"定制品" [15] - 生物学平台化程度高,测序几乎免费,合成成本低,适合做验证假设 [15] - 生物学研究任务具备高度开放性,总有新的生物基因组需要探索和功能注释 [15] - 生物学已经具备进化论基础理论,更侧重研究复杂系统在既定规则下的演化与调控 [15] FutureHouse是在构建科研API - FutureHouse延续了FRO的基本规模和运行周期,聚焦"Moonshot"级别挑战,可能需要5年以上持续投入 [22] - 公司开发了论文问答系统PaperQA,基于RAG思路构建但做了改进,系统表现已超过人类 [24] - WikiCrow系统将人类基因组相关维基百科内容从2500个基因介绍扩展到近1.8万篇文章 [25] - 开发了矛盾检测系统,能在超过两亿篇论文里查找和任意陈述相冲突的信息 [26] - 实质上正在构建一个科研API,通过整合多种功能如查找矛盾、文献研究、分子设计等 [28] FutureHouse科研Agent开发思路 - 将所有需要训练的部分称为agent,未训练的部分叫environment,agent通过语言、观测和动作与环境交互 [29] - 把memory从environment移到agent,尝试过多种记忆形式如简单追加消息、压缩、保留最近几条等 [29] - 框架主要目标是突破零样本的限制,关注可训练性,支持在线RL [30] - 使用语言模型过滤和识别相关性,而不是只靠embedding,虽然带来更高成本和更长响应时间但更注重性能 [31] - 搭建了全文检索系统,把相关代码开源在PaperQA2里,技术上可以用Postgres或Elastic Search [32] "科研自动化"不是100%替代人类 - 对实验室机器人前景持谨慎态度,认为10年后不会出现完全自主的科研系统 [46] - 更可行的情景是系统辅助判断和生成方案,人类提供明确的问题和研究框架并和系统反复协作 [47] - 生物学本质上受限于观测和经验数据,无法简单指令系统完成实验任务,需要人类深度参与 [47] - 实现真正意义上的100%自动化非常困难,越接近完全自动化所需投入越高而边际收益减小 [49] - 探索将人类资源嵌入科研流程的可能性,用可编程工具推进科研但背后执行的是人 [51] AI是如何影响科学研究的 - 用云计算计算分子和蛋白结合的自由能成本约十几美元,有机合成和实验验证成本也差不多 [53] - 分子动力学不能模拟化学反应,而生物过程大量依赖酸碱反应,单纯原子运动模拟无法描述细胞功能 [54] - 有虚拟分子库如Zinc收录数百亿种理论上可合成的分子,研究者可直接从中筛选 [55] - 药物开发从发现机制到推进到二期临床通常要7年,反馈周期太长是主要瓶颈 [59] - 建议政府公开所有已获批药物的IND资料包,这些数据能提供丰富的训练资源 [60]
腾讯研究院AI速递 20250506
腾讯研究院· 2025-05-05 18:05
生成式AI - DeepSeek-Prover-V2推出671B和7B模型,采用递归+强化学习提升数学推理能力,创造多项新纪录 [1] - 采用DeepSeek-V3分解定理+GRPO算法优化,结合冷启动训练实现非形式化与形式化推理统一 [1] - 7B模型在本科级测试表现优异,展现独特基数处理能力 [1] - Anthropic发布Claude整合功能(Integrations),基于MCP协议实现与Jira等10个热门服务的无缝连接 [1] - Claude新增研究能力,可在5-45分钟内完成复杂调研,支持多数据源查询并标明出处 [1] - 新功能目前在Max、Team和Enterprise计划测试,全球付费用户已可使用Web搜索 [1] AI语音与播客 - Google NotebookLM支持50种语言生成播客,语音地道,擅长模拟京腔等本地口音 [2] - 产品将文本转化为轻松对谈,摆脱AI语音生硬感,由Google产品经理Martin和编辑Johnson主导 [2] - 具备资料溯源功能,可处理2500万字内容,标注引用来源并加入音频水印 [2] 社交与AI整合 - Meta推出独立AI应用对标ChatGPT,可通过用户社交数据实现个性化服务,包含发现信息流功能 [3] - 应用与Meta社交产品矩阵打通,支持语音交互和图像生成,在美加等地区首批开放 [3] - 软件与Meta AI眼镜深度整合,扎克伯格预测未来眼镜将全面智能化,全息影像将取代实体屏幕 [3] AI编程与开发 - 苹果与Anthropic合作开发"氛围编程"软件平台,基于Claude Sonnet模型,用于代码编写和测试 [4] - 该平台为Xcode新版本,目前仅计划内部使用,此前苹果自研AI编程工具因精度不足未发布 [4] - 苹果正构建AI合作网络,此前已与OpenAI合作整合ChatGPT,并考虑引入谷歌Gemini作为备选 [4] 图像生成与一致性 - Midjourney推出Omni-Reference全向参考功能,通过--oref和--ow参数实现人物、物体、场景的超高一致性 [5] - 相比4o和Lora模型,Omni-Reference只需一张参考图即可保持细节迁移和风格统一 [5] - 新功能支持真人写实、动漫风格,还能实现机械体、装置物等复杂物体的多角度一致性呈现 [5] - Runway参考功能支持多角色参考、风格迁移等广泛应用,无需反复调参即可实现角色一致性生成 [5] - Gen-4模型支持类ChatGPT的自然语言提示,能理解复杂语义,可用于黑白照片着色、室内设计等12种创意应用 [5] AI科研与智能体 - FutureHouse推出四个AI科研智能体(Crow、Falcon、Owl、Phoenix),在文献搜索精度和准确性方面超越GPT-4.5及人类博士 [6] - 这些AI智能体可访问完整科学文献全文,具备信息质量评估能力,能透明展示推理过程,提供API集成 [6] - AI科学家团队已应用于疾病机制研究、文献矛盾梳理、实验方法分析等领域,可显著提升科研效率 [6] AGI与失控风险 - MIT研究显示:即使采用最理想的监督机制,人类成功控制超级智能的概率仅为52%,AI失控风险可能超过90% [6] - 研究提出"康普顿常数"概念,通过四种博弈场景验证了嵌套可扩展监督机制的有效性与局限性 [6] - 随着AI智能水平提升,监督难度增大,Guard获胜概率持续下降,人类最终可能难以控制超级智能AI系统 [6] 具身智能与机器人 - Physical Intelligence创始人强调收集多样化机器人数据的重要性,认为机器人需具备适应不同环境的能力 [7] - 专家低估了运动控制中蕴含的智能,机器人需要从自身物理体验中学习,而不仅仅依靠观察数据 [7] - 未来机器人形态可能呈现"寒武纪大爆发"式的多样化,针对不同场景可能出现专门的机器人设计 [7]