Workflow
科研智能体
icon
搜索文档
智能体开发大赛、AI 项目月度路演,近期优质 AI 活动都在这里
Founder Park· 2025-10-11 19:57
AI行业近期活动与赛事 - 由深势科技、北京科学智能研究院(AISI)及上海交通大学人工智能学院联合主办的玻尔科研智能体开发大赛正在进行,第一阶段为2025年9月11日至10月10日,第二阶段为2025年10月至12月,活动形式为线上与线下结合[4] - 该大赛为第一阶段入选队伍提供研发经费支持,包括算力机时与模型API等资源,并提供全套Agent开发工具箱与孵化机会[4][5][6] - 大赛设置总奖金100万元人民币(税前),分两次发放:第一次评比奖金20万元计划于10月底发放,第二次评比奖金80万元计划于比赛结束后发放[9] - 中国技术创业协会主办的元创营高校AI Agent创新赛将于9月22日至11月7日在上海举行,聚焦“AI+互娱”方向,设置五大赛题[10] - 该创新赛提供重磅现金奖池,单个作品最高可赢取十万元大奖,优秀作品有机会上线Soul App,全球高校优胜者将汇聚上海Soul App总部[10] - S创月度路演第四十九期“未来智能Future Intelligence 1024”将于10月24日在上海漕河泾会议中心举行,活动形式为夜间场,设有酒水畅饮与DJ驻场[11] - 该路演活动将有10个未来智能项目亮相,其中8家进行路演竞技,2家进行展示,前2名将直通S创上海2026科创大会路演大赛复赛,路演项目申请截止日期为10月14日24:00[11] - 赤道象限(EquatorQ)主办的“AI全球未来峰会”将于10月17日至18日在上海举行,活动汇聚近百位行业大咖,内容涵盖创新项目路演、前沿展位、五大年度AI荣誉榜单、两大年度AI奖项及两大AI行业研究报告[11][12] - 该峰会设有AI社交名片、特邀AI主持、AI玄学解签、AI调奶茶等互动环节[12] - NVIDIA初创加速计划正在招募中,该计划为会员创业公司提供免费的NVIDIA深度学习培训中心(DLI)课程、SDK访问权限、精选软硬件优惠价格、GPU云折扣以及投融资与商务对接和联合营销机会[14][15]
科研智能体「漫游指南」—助你构建领域专属科研智能体
机器之心· 2025-09-01 10:49
科研智能体综述核心观点 - 基于大语言模型的智能体构建推动AI4S迅猛发展 催生一系列科研智能体构建与应用[2] - 人工智能与自然科学研究之间存在认知论与方法论偏差 对系统设计、训练及验证产生较大阻碍[2] - 综述提供科研智能体"漫游指南" 涵盖分级策略、构建方案、基线评估及未来方向[2] 科研智能体分级策略 - 三级分级系统根据构建策略与能力边界划分:Agent as Assistant、Agent as Partner、Agent as Avatar[4][8] - Agent as Assistant使用小模型经后训练或微调完成 局限于特定领域单一任务[8] - Agent as Partner集成各类工具实现能力跃迁 采用闭源大型模型结合上下文信息优化[8] - Agent as Avatar具备强大推理能力、深度记忆和强协作能力 能跨学科解决科研难题[8] 构建方案与能力增强 - 从头构建工作流包含知识组织、知识注入和工具集成三部分[12] - 知识组织涵盖非结构化序列、结构化数据、指令及知识图谱四种形式[14] - 知识注入通过显式或隐式方法实现 显式注入直接整合知识到提示中 隐式注入涉及微调模型或强化学习[14] - 工具集成通过外部工具扩展功能 包括专业知识获取、执行模拟、分析及可视化[14] - 能力增强包含记忆增强、推理增强和协作增强三个维度[19] 基准评估体系 - 基准分为知识密集型任务和实验驱动型任务两类[17][18] - 知识密集型任务侧重文献挖掘、假设生成、实验设计等需要深厚专业知识的领域[17] - 实验驱动型任务评估智能体在科学探究中使用工具的能力 强调自主实验设计和验证[18] - 基准覆盖生物学、化学、医学、计算机科学等多个领域 包含True/False、Open-ended、Choices等多种题型[20] 应用案例与模型配置 - 汇总超过80个科研智能体案例 涵盖天文学、生物学、化学、医学等15个学科领域[10] - 基础模型包括LLaMA系列(7B/13B)、GPT系列(GPT-3/4/4o)、Qwen系列(2.5-72B)等[10] - 应用阶段覆盖知识问答、假设生成、实验设计、分子设计、临床分析等科研全生命周期[10] 未来研究方向 - 需确保科学实验设计的实证准确性和理性 整合验证工具和反馈机制[23] - 需要灵活连贯的框架适应特定研究领域 克服复杂领域系统局限性[23] - 需融入自我反思和持续迭代机制 平衡情景记忆和参数记忆[23] - 需优化智能体与人类研究人员交互 整合通用和专用模型促进跨学科合作[23] - 需通过跨学科知识转移增强专业知识 提高相关领域执行能力[23] - 需创新评估方法确保遵循可证伪性和可重复性等核心科学原则[23]