AI Scientist
搜索文档
MOSS孙天祥新公司要让AI自己写100篇论文,还要全网直播一个月
36氪· 2026-02-12 17:52
FARS系统概述与直播事件 - 公司Analemma将于明天上午11点启动一场为期约一个月的公开直播,展示其全自动研究系统FARS从零开始自主完成科研全流程,目标是连续产出100篇完整论文,全程无人类介入,这被认为是全球首次以公开直播方式部署全自动科研系统[1] - FARS是一个多智能体系统,由四个模块构成:负责文献调研和假设生成的Ideation、负责实验方案设计的Planning、负责代码编写和执行的Experiment以及负责论文撰写的Writing,它们在一个共享文件系统中协作[4] - 在模型层面,FARS调用了Claude、GPT、Gemini等多家闭源模型的API,并在部分链路使用了后训练的自研模型,其核心能力在于Agent系统工程层面,硬件上团队将一个包含160张NVIDIA GPU的集群封装成工具供实验智能体调度[5] - FARS的设计基于研究系统的第一性原理,旨在高效、可靠地拓展知识边界,其产出为“短论文”形式,聚焦边界清晰的研究贡献并鼓励报告失败结果,不遵循传统学术论文的篇幅和结构限制[7] - 本次直播中,FARS将从9个预设研究方向出发,涵盖强化学习从可验证奖励中学习、小语言模型后训练、前沿LLM自动化评估等多个AI热点领域,同时系统也被允许自由探索预设方向之外的课题[7] 公司背景与团队实力 - 公司Analemma成立不到一年,已获得红杉中国、高榕创投、光源资本、嘉程资本、美团龙珠等机构数千万美元的天使轮融资[1] - 创始人孙天祥是2023年引爆国内大模型热潮的MOSS的核心开发者,于2025年3月创办Analemma,同期加入上海创智学院担任助理教授,走学术与创业并行的道路[1][12] - 公司目前团队约15人,其中一半是研究团队,核心成员来自复旦MOSS团队和InternLM(书生大模型)项目[15] - 公司核心团队成员在Google Scholar上拥有高引用次数,例如孙天祥被引用5675次,其他成员如Yunfan Shao被引用5477次,Xiangyang Liu被引用4775次[16] 技术定位与产品策略 - FARS目前聚焦于“AI4AI”领域,即用AI来研究AI,选择该领域是因为其实验可完全在计算机上完成,无需物理实验室,天然适合自动化,但暂时无法进行极度消耗算力或需要人类直接参与的实验[8] - 在产出质量控制上,FARS生产的每篇论文在上传arXiv前将经过至少3位具有五年以上研究经验的团队成员审核,并明确标注为AI生成,团队不打算将这些论文投稿到传统学术会议,而是邀请同行评审,更关注实际引用和结果价值[8] - 公司已上线名为Lemma的产品,提供快速文献调研、深度调研报告和代码实验三项功能,定位为生产力工具,而FARS的定位是自动驾驶式的基础设施[10] - 团队将直播目标定为100篇论文,是因为规模是评估自动化研究系统的关键,连续大规模产出能让系统的真实能力充分暴露,团队此前从未大规模部署过FARS,对其工作过程和产出结果同样未知和好奇[9][10] 行业竞争格局与发展趋势 - 全自动科研是一条正在升温的赛道,过去一年半出现密集进展,例如2024年8月日本Sakana AI发布了首个端到端全自动科研系统AI Scientist,2025年4月其升级版v2生成的一篇论文成功通过了ICLR 2025 Workshop的同行评审[17][18] - 同期,香港大学Chao Huang团队发布了AI-Researcher,获得NeurIPS 2025 Spotlight论文,并已推出产品化版本Novix[18] - 大公司如OpenAI在2025年10月公布路线图,计划在2026年9月前开发出“AI研究实习生”,到2028年3月目标是完全自主的AI研究员,首席科学家Jakub Pachocki表示为了重大科学突破,值得把整个数据中心的算力投入到单一问题上[18] - 技术路线上,FARS与AI Scientist、AI-Researcher同属端到端全自动科研系统,但关键差异在于其展示方式为实时、大规模、全透明的公开部署,并且跳出了学术出版惯例,以可验证的假设为单位组织产出[19] - 智源研究院在其2026年趋势预测中指出,AI for Science正在从Copilot角色向AI Scientist角色迁移,OpenAI将“全自主AI研究员”写进2028年路线图,DeepMind去年底宣布将在英国建设首个AI自动化研究实验室[20] - 在这场全球竞赛中,FARS可能是来自中国的第一个公开实验[21]
AI写的论文首次被顶会ACL录用,评分位列投稿前8.2%
第一财经· 2025-05-30 00:17
AI科研突破 - Intology公司开发的AI科学家Zochi的论文被自然语言处理顶会ACL主会议录用,成为首个独立通过A*级别科学会议同行评审的AI [1][4] - ACL主会议平均录用率低于20%,Zochi论文评审最终评分4分,在所有投稿论文中排名前8.2% [4] - Zochi此前研究成果已被ICLR 2025研讨会接收,但主会要求更高,标志着AI达到博士级科研水平 [4] 技术细节 - Zochi论文主题为《Tempest: Automatic Multi-Turn Jailbreaking of Large Language Models with Tree Search》,利用树搜索技术突破大模型安全防线 [5] - Tempest框架通过多轮对话逐步瓦解模型安全防线,在GPT-3.5-turbo上成功率100%,GPT-4上成功率97% [8] - 除论文格式调整与绘图外,内容全程无人工参与,AI独立完成从提出假设到实验的全流程 [8] 公司背景 - Intology成立于2025年初,定位为研究智能科学的实验室,联创为连续创业者Ron Arel和前Meta研究员Andy Zhou [4] - 另一家由Transformer作者Llion Jones创立的Sakana AI也推出AI科研系统,论文被ICLR 2025研讨会接收 [9] 行业影响 - AI for Science(AI4Science)是AI行业最前沿的落地领域之一,可提高科学家效率、准确性和创造力 [9] - AI驱动研究引发学术伦理争议,Intology主张AI系统应在致谢中列出而非作为作者,人类研究者负责验证和伦理规范 [10]
AI视频进入「真4K时代」?近期AI新鲜事还有这些……
红杉汇· 2025-04-16 22:19
谷歌DeepMind推出Veo 2 - 谷歌DeepMind推出Veo 2 AI视频生成工具,正式登陆Gemini Advanced [4] - Veo 2可生成8秒720P电影级视频,支持4K分辨率(计划年内开放),在运镜、文本语义还原、物理模拟、动作一致性等方面表现优秀 [6] - 新增电影级创作工具:自动移除干扰元素、Outpainting功能扩展画面、内置"无人机视角""延时摄影"等拍摄参数 [8] - 支持多模态协同:调用Imagen 3文本生图模型或导入本地素材,实现"文字描述-图像生成-视频剪辑"全流程闭环 [8] - 嵌入不可见数字水印,支持第三方验证内容来源 [8] - 测试数据显示Veo 2在用户偏好和提示还原方面超过Sora、可灵1.5、MetaMovieGen和Minimax [10] 川崎公司推出氢动力AI坐骑CORLEO - 川崎重工展示Corleo四足机器人概念车,融合摩托车工程与机器人技术 [13] - 配备150cc氢燃料发动机,四个独立机械腿带柔性橡胶蹄,实时分析机器人及骑手位置确保安全 [13] Astrocade推出Wish-to-Game平台 - Astrocade团队推出AI游戏创作平台,用户仅需文字描述即可生成可玩游戏 [16] - 平台自动处理代码、视效、动画、音乐及机制,支持实时修改内容 [16] - 集成社交功能,用户可发现新游戏并参与比赛、合作项目 [17] DeepSeek推出SPCT技术 - DeepSeek联合清华大学推出SPCT技术,通过推理阶段动态优化AI输出质量 [19] - 突破传统奖励模型局限,支持自我指导机制优化决策过程,提升智能水平和可扩展性 [19] Midjourney V7发布 - Midjourney V7在图像质量、指令解析能力方面显著提升,可生成超逼真人物及商业大片级图像 [21] - 新增个性化模型功能,根据用户审美偏好提供精准生成,草稿模式提升渲染速度和成本效率 [21] TokenHSI技术革新仿真人形机器人 - 香港大学和上海人工智能实验室开发TokenHSI技术,基于Transformer架构统一策略网络 [23] - 解决传统物理角色控制方法无法整合多种复杂人体场景交互技能的局限 [25] - 支持可变长度输入快速适应新场景,通过跨任务知识共享提升交互多样性与灵活性 [25] Sakana AI推出AI Scientist - Sakana AI的AI Scientist-v2生成首篇通过ICLR研讨会同行评审的科研论文 [28] - 系统在自主研究中存在不足:文献综述错误归类学术概念、42个实验因编码错误失败、论文存在结构错误等 [30]