通专融合

搜索文档
WAIC 2025大黑马,一个「谢耳朵AI」如何用分子式超越Grok-4
机器之心· 2025-07-29 18:31
核心观点 - 上海AI实验室发布并开源科学多模态大模型Intern-S1 其综合性能为当前开源模型中最优 在科学推理任务上超越xAI的Grok 4 同时训练算力消耗仅为Grok 4的1% [5][7] - Intern-S1首创"跨模态科学解析引擎" 可精准解读化学分子式 蛋白质结构 地震波信号等多种复杂科学模态数据 助力AI从"对话助手"进化为"科研搭档" [16] - 基于Intern-S1构建的多智能体虚拟疾病学家系统"元生"已在肝癌和结直肠癌治疗领域提出新靶点GPR160和ARG2 并经真实临床样本和动物实验验证 [17] 模型性能 - Intern-S1采用235B MoE语言模型和6B Vision编码器 预训练数据包含5T tokens 其中50%以上为科学数据 [21][25] - 在综合多模态通用能力评估上 Intern-S1得分比肩国内外一流模型 展现跨文本 图像的全面理解力 [10] - 在科学能力评测中 Intern-S1领先Grok-4等最新闭源模型 评测覆盖物理 化学 材料 生物等领域的复杂专业任务 [12] - 在化学 材料 地球等多学科专业任务基准上 Intern-S1超越顶尖闭源模型Grok-4 展现出卓越的科学推理与理解能力 [17] 技术创新 - Intern-S1新增动态Tokenizer和时序信号编码器 对化学分子式的压缩率相比DeepSeek-R1提升70%以上 [26] - 采用通专融合的科学数据合成方法 使模型同时具备强大的通用推理能力与多项顶尖的专业能力 [28] - 通过系统与算法联合优化 实现大型多模态MoE模型在FP8精度下的高效稳定强化学习训练 成本相比近期公开的MoE模型降低10倍 [30] 开源生态 - 上海AI实验室开源了面向大模型研发与应用的全链路开源工具体系 覆盖数据处理 预训练 微调 部署 评测与应用等关键环节 [32] - 近期开源多智能体框架Intern·Agent 可广泛应用于化学 物理 生物等领域的12种科研任务 [32] - 基于Intern-S1的『书生』科学发现平台Intern-Discovery上线 驱动科学研究从团队单点探索迈向科学发现Scaling Law阶段 [6][32]
通专融合,思维链还透明,上海AI Lab为新一代大模型打了个样
机器之心· 2025-05-24 12:07
AI发展新阶段 - AI下半场将聚焦问题定义与评估体系重构,行业需设计更有效的模型评测体系弥补AI能力与真实需求的差距[2] - 上海AI Lab构建"加速训练营"(InternBootcamp),通过评价建模与大模型交互提供反馈,使大模型持续进化获得解决复杂推理任务的能力[2] - 书生・思客(InternThinker)实现奥赛级数学、科学对象理解与推理、算法编程、棋类游戏、智力谜题等多专业任务同步学习演进,并在多任务混合强化学习中出现智能"涌现时刻"[2] 围棋领域突破 - InternThinker成为我国首个既具备围棋专业水平又能展示透明思维链的大模型,在实验室科研人员的布局中围棋成为科学探索的"试应手"[2] - InternThinker在围棋任务上打破思维"黑盒",运用自然语言就对弈过程进行讲解,用户可与之对弈并获取每一步棋背后的推理过程和决策依据[4] - InternThinker评价李世石"神之一手"为"相当刁钻",并给出应对策略,同时具备多样化语言风格如鼓励"以攻代守的好手"或毒舌锐评"不是棋的选择"[5][6] - 新生代世界围棋冠军王星昊九段评价InternThinker棋力在职业3-5段之间,分析能力优秀[8] 技术架构创新 - InternBootcamp包含超1000个验证环境覆盖复杂逻辑推理任务,能批量化规范化生成难度可控的推理任务并与大模型交互提供反馈[11] - InternThinker在包括数十个任务的测试集上平均能力超过o3-mini、DeepSeek-R1及Claude-3.7-Sonnet等国内外主流推理模型[14][15] - 研究人员观察到在多任务混合训练过程中出现强化学习的"涌现时刻",模型通过多个任务混合强化学习成功获得单一任务无法得到的奖励[18] - 上海AI Lab提出通专融合技术路线,通过基础模型层、融合协同层和探索进化层"三层"技术路径打造通用人工智能[22][23] 算法与框架突破 - 设计强化学习算法PRIME结合高密度监督信号,获取比现有方法高出7%的性能提升,在AIME、MATH等竞赛难度数学题上7B模型能力显著超越GPT-4o[24] - 推出多任务强化学习技术框架MoR实现多任务强化学习混合训练,构建基于结果奖励的强化学习新范式OREAL解决大模型三大困局[24] - 开发测试时强化学习(TTRL)框架探索AI自主进化路径,能在没有准确标签情况下进行奖励估计,减少人工标注依赖[24] - 构建分子逆合成新方法Retro-R1,仅使用1万条强化学习数据通过200步训练实现大模型在逆合成推理能力的升级[24]
神州数码董事长郭为: “通专融合”是AI应用落地的重要方向
21世纪经济报道· 2025-04-03 19:37
公司业绩表现 - 2024年公司实现营业收入1281.66亿元,同比增长7.14%,创五年新高 [2] - 数云服务及软件业务收入29.65亿元,同比增长18.75%,毛利率20.32%,同比提升4.7个百分点 [2] - 自有品牌业务收入45.81亿元,同比增长20.25%,毛利率11.49%,同比提升2.65个百分点 [4] - 净利润下降35.57%至7.77亿元,主要因持有的神州数码国际创新中心资产减值影响,扣除后净利润为13.05亿元 [3] AI战略布局 - AI成为公司数云融合战略的核心,推出神州问学AI原生赋能平台 [5] - 推出神州鲲泰问学一体机解决企业快速落地AI能力问题 [4] - 战略并购智邦科技大陆地区业务,切入国产高端网络交换机市场 [4] - 神州金服云数据产品作为数据资产获得建设银行深圳分行3000万元授信融资,成为全国首笔大中型数据资产质押融资案例 [4] AI应用与行业观点 - 公司认为AI应用处于"开始"阶段,尚未跨越鸿沟,当前"离人很近、离企业很远" [6] - 强调"通专融合"是AI发展方向,需结合企业流程改造实现创新 [6] - 未来企业AI应用场景将以异构算力为基础,共存多种模型,整合内部数据与知识,搭载海量Agent [7] - AI for Process是数字化转型关键路径,将重构企业核心竞争力 [6] - 目前优先在传统优势行业推广AI应用,因客户关系及数据资产熟悉度较高 [8] 技术及产能建设 - 神州鲲泰合肥生产基地正式投产,为安徽省单体产能最大服务器产线 [4] - 并购标的智邦科技拥有16条全球领先SMT产线,具备高端制造服务能力 [5]