Workflow
书生·浦语InternLM
icon
搜索文档
WAIC 2025大黑马,一个「谢耳朵AI」如何用分子式超越Grok-4
机器之心· 2025-07-29 18:31
核心观点 - 上海AI实验室发布并开源科学多模态大模型Intern-S1 其综合性能为当前开源模型中最优 在科学推理任务上超越xAI的Grok 4 同时训练算力消耗仅为Grok 4的1% [5][7] - Intern-S1首创"跨模态科学解析引擎" 可精准解读化学分子式 蛋白质结构 地震波信号等多种复杂科学模态数据 助力AI从"对话助手"进化为"科研搭档" [16] - 基于Intern-S1构建的多智能体虚拟疾病学家系统"元生"已在肝癌和结直肠癌治疗领域提出新靶点GPR160和ARG2 并经真实临床样本和动物实验验证 [17] 模型性能 - Intern-S1采用235B MoE语言模型和6B Vision编码器 预训练数据包含5T tokens 其中50%以上为科学数据 [21][25] - 在综合多模态通用能力评估上 Intern-S1得分比肩国内外一流模型 展现跨文本 图像的全面理解力 [10] - 在科学能力评测中 Intern-S1领先Grok-4等最新闭源模型 评测覆盖物理 化学 材料 生物等领域的复杂专业任务 [12] - 在化学 材料 地球等多学科专业任务基准上 Intern-S1超越顶尖闭源模型Grok-4 展现出卓越的科学推理与理解能力 [17] 技术创新 - Intern-S1新增动态Tokenizer和时序信号编码器 对化学分子式的压缩率相比DeepSeek-R1提升70%以上 [26] - 采用通专融合的科学数据合成方法 使模型同时具备强大的通用推理能力与多项顶尖的专业能力 [28] - 通过系统与算法联合优化 实现大型多模态MoE模型在FP8精度下的高效稳定强化学习训练 成本相比近期公开的MoE模型降低10倍 [30] 开源生态 - 上海AI实验室开源了面向大模型研发与应用的全链路开源工具体系 覆盖数据处理 预训练 微调 部署 评测与应用等关键环节 [32] - 近期开源多智能体框架Intern·Agent 可广泛应用于化学 物理 生物等领域的12种科研任务 [32] - 基于Intern-S1的『书生』科学发现平台Intern-Discovery上线 驱动科学研究从团队单点探索迈向科学发现Scaling Law阶段 [6][32]