AI科学家Kosmos的核心能力突破 - 引入结构化世界模型,能高效整合数百条智能体轨迹信息,在千万级token文本中保持研究目标一致性与连贯性 [11] - 单次运行可阅读1500篇论文并执行42,000行分析代码,能力远超已知的任何智能体 [13] - 相比上一代Robin,分析能力显著增强,Beta测试用户反馈其一天可完成原本需六个月的工作,结论准确率达79.4% [13][24] Kosmos的科研产出与验证 - 独立复现神经科学、材料科学、生物学等领域3项人类发现,其中两项复现时原研究尚未发表,一项发布时间晚于其训练数据截止日期 [1][25][30][37] - 取得4项原创发现,涵盖遗传流行病学、多组学整合分析、阿尔茨海默症和转录组学 [1][42][47][48][50][51][54] - 所有结论均配有明确出处,确保推理链条完全可溯源,经独立科学家验证79.4%的陈述准确 [24] 效率提升与量化评估 - 20步深度的运行平均等效为6.14个月的人类研究工时,开发团队通过用户反馈和盲测得出与科研任务复杂度相关的推理时间scaling law [16][17] - 采用"已有成果对照法"验证,Kosmos复现的人类发现通常需耗时数月,支持其工作成果达到"数月级"时间价值 [19] - 通过计算工时模型估算,单次运行阅读论文数量与分析路径总和,换算为人类科研时间约4.1个月(按每周40小时工作制) [20] Future House与Edison的商业化路径 - Future House成立于2023年,目标为打造加速创新的AI科学家,其商业分支Edison正将AI科学家技术推向全球 [6][8] - Edison由来自物理、生物、化学和AI等领域的顶尖机构科学家与工程师打造,为科研社区提供免费服务,并为深度用户提供付费选项 [9] - Kosmos定位为深度科研工具而非聊天机器人,定价较高但学术用户可享免费额度,需一定学习调试时间 [11] 行业影响与战略意义 - OpenAI首席执行官Sam Altman认为此类事件将越来越多,并成为AI最重要影响之一,标志着科学从稀缺走向丰饶的时代 [1][6] - Kosmos的进展可能提前实现OpenAI设定的"2026年打造实习级别研究助理AI"目标,引发对AI加速科学进程的重新评估 [22] - 平台已在2.5个月内找到治盲新药,展示其在生物、化学、材料科学等学科中发现新结果的能力 [8][24]
AI半天顶博士6个月,奥特曼太激动,生化圈巨震
36氪·2025-11-22 16:03