Workflow
通专融合
icon
搜索文档
顶尖模型离“科学家”还差得远?AI4S亟待迈向2.0时代
机器之心· 2026-01-30 18:43
行业趋势与战略判断 - 当前科学智能(AI for Science, AI4S)在蛋白质折叠等特定领域取得里程碑成就,但《自然》杂志研究指出过度依赖现有深度学习模型可能局限新知识探索并阻碍创新[1] - 一项系统性评估联合10个不同科学领域的100位科学家构建评测题目,结果显示前沿模型在通用科学推理任务中得分可达50分(满分100),但在各类专业推理任务中得分骤降至15-30分,表明存在明显的“木桶效应”[1][71] - 行业正处在通用人工智能(AGI)前夕,但面临“通专融合”智能环节的缺失,亟需推动科学智能从AI4S 1.0向2.0迭代,即迈向AGI4S[2] - 通往AGI的战略路径是“通专融合”,即构建能够动态融合直觉式“系统1”与逻辑式“系统2”的智能架构,在保持通用认知基座的同时,能在特定任务上实现专家级专精[10][11] - 2024年末OpenAI o1与2025年初DeepSeek-R1的出现,通过在大模型上应用强化学习提升逻辑推理能力,验证了“通专融合”路径预判的正确性[14] - 科学发现被视为推理智能的终极前沿和AI探索的绝对前沿,因其对AI提出了处理组合爆炸(如10^60量级搜索空间)、分布外知识泛化以及稀疏延迟奖励的三重极限挑战[15][19] 核心技术架构:SAGE - 为将“通专融合”战略落地,上海人工智能实验室提出了“智者”SAGE技术架构,这是一个旨在弥合广泛泛化与深度专精鸿沟的递归循环统一认知生态系统[17][18] - SAGE架构由三个逻辑耦合的层次构成:底部的基础模型层致力于知识与推理能力的解耦;中间的融合协同层动态协调快慢思考;顶层的探索进化层赋予AI主动能动性[18][20] - 该架构通过双向循环实现全栈进化:底层表征自下而上支撑推理,顶层探索获得的高水平反馈自上而下回流,将“未知”转化为新的训练信号,推动认知策略持续进化[18] 基础模型层创新 - 记忆解码器(Memory Decoder)作为预训练、即插即用的独立组件,旨在解决现有大模型将事实记忆与逻辑推理混淆的问题[22] - 该组件采用与基础模型并行运行并融合输出分布的机制,用紧凑的参数化模型替代传统非参数检索器,在无需修改基础模型参数、无在线检索开销下实现高效知识注入[22] - 实验数据显示,其推理开销仅为基础模型的1.28倍,显著低于现有主流方案,成功填补了高密度知识供给与推理引擎解耦之间的技术鸿沟[22] 融合协同层算法突破 - 针对复杂推理需要密集过程监督但人工标注成本高昂的矛盾,提出了隐式奖励强化学习算法PRIME,利用策略模型与参考模型间的统计差异,隐式习得Q函数,从而推导出密集的逐步奖励信号[28][31] - 在AIME 2024数据集上,PRIME使模型准确率提升23.4%;在AMC数据集上提升27.7%;在MATH-500等测试中也取得显著增长[38] - 研究发现强化学习训练中策略熵会急剧下降导致“熵坍缩”,使模型过早自信并停止探索,而验证性能与熵呈现显著的对数线性相关[39][40] - 提出了精准化、局部化的熵控制方案,应用该策略后,模型在保持高探索能力的同时显著提升了下游任务准确率,该方法已被Intern-S1等多个头部机构采纳[40] - 为克服传统强化学习以奖励最大化为目标导致的“模式崩溃”,引入了FlowRL,将学习目标从“奖励最大化”重构为“分布匹配”,使模型学习所有有效推理路径的概率分布[47][48] - 实验显示,FlowRL生成的分布与目标分布的KL散度大幅降低至0.11(传统方法为8.68);在32B模型上,其数学推理准确率达48.39%,较GRPO提升10个百分点;生成的解决方案多样性评分约为PPO的2倍[50] 探索进化层机制 - 提出了测试时强化学习框架,其核心假设是“共识即正确性”,在推理时对多个候选解采样,将多数投票结果作为代理奖励,对模型参数进行在线更新,实现了无监督环境下的自我增强[56][58] - 实测数据显示,搭载TTRL的Qwen-2.5-Math-7B模型在AIME 2024数据集上准确率实现了159%的相对提升,性能甚至逼近使用真实标签训练的理论上限[60][62] - 研发了大规模交互验证环境InternBootcamp,覆盖8大任务类别、超1000种多样化环境,支持将专业领域任务转化为可验证环境[61] - 基于InternBootcamp的实验发现,当任务类型数量从8种扩展至512种时,模型性能持续上升,证实了与任务数量增长相关的规模化定律存在[66] - 在具身智能领域,提出了极端数据稀缺下的在线强化学习框架SimpleVLA-RL,仅用极少数据与计算资源便取得了与先进模型比肩的性能,实现了智能体在物理世界中的“具身化”演进[64][69] 公司实践与基础设施 - 研发了“书生”科学多模态大模型Intern-S1,作为SAGE架构在科学领域的体现,旨在构建“可深度专业化通才”[77] - Intern-S1在基础层采用动态分词器与专用编码器,原生支持DNA序列、蛋白质结构等10余种模态,在科学数据上的压缩率较GPT-OSS等通用模型提升1.7倍,并基于2.5万亿高质量科学Token进行预训练[77] - 测评结果显示,Intern-S1在通用能力上对齐顶尖开源模型,而在涵盖化学、生物、材料等9大领域的科学性能上,全面超越了包括GPT-5和Grok-4在内的顶尖闭源模型[79] - 构建了“书生”科学发现平台Intern-Discovery,这是一个将Intern-S1与海量数据、2000+专业工具及湿实验室验证环境深度融合的智能体系统,实现了从假设生成到实验验证的闭环[80] - 平台引入了科学智能上下文协议,以标准化调度科学资源和工作流;并通过分层记忆模块沉淀研究模式、记录实验细节并整合长期知识[86] - 在气候科学领域,Intern-Discovery自主调用30余种工具,分析20年多模态数据,编写4000多行专业代码,成功发现被人类专家忽略的关联并推导出新方程,有效修正了系统性偏差[81] - 在生物医学领域,虚拟疾病生物学家“元生”成功在数据稀疏条件下发现并验证了具有高临床潜力的隐藏靶点,展示了全流程智能化能力[84]
福州大学校长:对于高等教育,人工智能是“东风”
新浪财经· 2025-12-11 18:21
核心观点 - 福州大学校长吴明红认为,人工智能对于高等教育不是需要抵御的风暴,而是可以借力的“东风”,公司将AI视为战略发展机遇而非威胁 [1][19] - 公司认为AI对就业市场的本质影响是“重塑”而非简单“替代”,AI是职业生态的“重启键”,将催生新型岗位并对所有岗位提出“人机协同”新要求 [2][10][14][20][27][33] - 公司对AI人才市场的回应是战略性、系统性的,旨在培养既有扎实功底又能直面产业、既精通技术又明德笃行的新一代AI人才 [6][24] 战略定位与学科建设 - 公司是国内高校中布局人工智能学科的“先行者”之一,于2018年10月成立了福建省内首个高校人工智能学院和人工智能研究院 [1][20] - 公司将AI能力全面融入每一个传统学院视为迈向“世界一流东南强校”必须完成的“战略必答题”,而非一道“选择题” [2][20] - 公司的应对策略已系统性地规划在《福州大学学科专业调整优化与综合改革行动方案》和《福州大学“十五五”本科教育专项规划》之中 [3][21] 专业布局与优化 - 公司计划将本科专业总数优化至80个左右,核心策略是“削枝强干” [4][22] - 在存量优化方面,公司对传统专业进行“智能+”改造,例如为机械工程注入“数字孪生”、为土木工程赋予“智能运维”“智慧管养”新内涵、为法学开拓“智慧司法”新方向 [4][22] - 公司对被认为有“被替代”风险的专业采取“赋能”而非“淘汰”策略,例如将会计学专业的培养重心从“核算”转向“管理与战略决策支持”,并强化大数据财务分析和智能审计 [11][17][29][34] - 在增量布局方面,公司围绕福建省“四大经济”,动态增设了如“可持续能源”、“量子信息科学”等新兴交叉专业,并正整合资源构建“储能科学与工程”专业 [4][22] - 公司前瞻布局“AI+”新兴交叉专业,主动申报如“机器人工程”、“大数据管理与应用”等专业,以培养面向未来的紧缺人才 [11][17][29][34] 人才培养模式 - 公司坚持“价值引领”与“市场需求”相统一的育人理念,培养的AI人才不仅是追逐高薪的“尖兵”,更应是心怀“国之大者”的“帅才” [3][21] - 公司大力推进“跨界融合”,打破学院壁垒,构建“AI+X”的课程体系和项目平台 [5][23] - 公司面向全校开设人工智能通识课程,并开设了《人工智能导论》《人工智能与医工融合概论》《机器学习与智能金融》等47门与人工智能相关的研究生课程 [5][23] - 公司探索本硕博贯通培养模式,支持学生自主选择“AI+X”研究方向,以对接行业未来标准 [5][23] - 公司依托与华为公司等共建的现代产业学院,推行“校企双导师制”,让学生在校期间直面并解决产业真问题 [5][23] - 公司坚定走“通专融合、分层分类”的人才培养道路,构建“通专并举、双向赋能”的培养架构 [7][12][25][30] - 在“通”的层面,公司通过建设面向全体学生的信息技术通识课程体系,例如所有专业必修C语言或Python/Access数据库程序设计,夯实人才培养的“基本盘” [8][13][26][31] - 在“专”的层面,公司实行分层分类的“双路径”机制:一路依托未来技术学院等培养“学术专才”;另一路通过现代产业学院和卓越工程师学院培养“产业专才” [8][13][26][31] 数字化转型与教学改革 - 公司正按照《教育教学数字化实施方案》,全力打造智慧教育新生态,通过构建教育大数据平台实现“数智驱动”的个性化教学与精准评价 [6][23] - 本学期,公司共有570门研究生课程利用智慧教室开展授课,为互动式、混合式、翻转课堂等教学模式提供多样化教学场景 [6][24] - 公司正在深化激励机制改革,改革教师评价体系,认可并激励教师在跨学院教学、校企合作方面的贡献 [9][14][27][32] - 公司大力推进数字化赋能,建设智慧教育平台,打造优质数智化资源供给体系,鼓励专业构建“课程图谱”和“能力画像” [9][14][27][32] 培养目标与能力聚焦 - 公司的本科专业设置正从“静态供给”转向“动态适应” [11][15][28][34] - 公司的培养目标正从“知识传授”转向“核心素养培育”,聚焦于AI难以替代的能力,如通过大幅增加研究性、项目式学习比重来提升批判性思维与复杂问题解决能力 [11][18][29][34] - 公司着力培养具备人机协同、情感道德、沟通合作、发现和提出问题、跨学科融合创新能力的人才 [10][14][27][33] - 在研究生培养方面,公司主动提前布局人工智能相关学位点建设 [11][18][29][34] - 公司积极拓展非学历教育,将学校打造为服务区域从业人员终身学习的“加油站” [11][18][29][34]
人工智能如何赋能科学研究(创新谈)
人民日报· 2025-09-07 05:54
人工智能在科学研究中的应用价值 - 人工智能具有基础性、平台性和通用性特点,对经济社会产生深远影响,科学研究是重要方面 [1] - 国务院印发《关于深入实施"人工智能+"行动的意见》,将"人工智能+"科学技术列为六大重点行动之一 [1] - 人工智能在生命科学、数学、生物、材料科学等领域发挥越来越重要的作用 [1] 人工智能驱动科研范式变革 - 人工智能帮助科学家突破认知局限,提出更好问题并找到更有价值的研究方向 [1] - 人工智能不仅优化既有工具效率,更能自主构建新工具或实现创新性组合 [1] - 人工智能让研究者更全面审视研究对象,发现被忽视的潜在关联 [1] - 通过"通专融合"推动整个科研范式的系统性变革 [1][3] 科学研究的现状与挑战 - 科学学科高度分化,取得重大科学发现和解决重大科技问题的难度越来越大 [2] - 重大科学发现存在偶然性,受限于科学家认知水平和知识传播滞后性 [2] - 爱因斯坦相对论案例显示工具限制对科学发现的影响 [2] 人工智能技术发展路径 - 大模型出现前人工智能主要沿专业深度方向推进(深蓝、阿尔法围棋) [2] - 大模型出现后人工智能在泛化能力上取得重大突破但专业深度不足 [2] - 实现"通专融合"是通用人工智能发展的重要路径 [2] 人工智能科研应用具体场景 - 帮助研究者理解文献、增强计算能力、丰富研究对象表征维度 [3] - 帮助产生跨领域想法,判断科研假设价值 [3] - 自主构建新工具或实现已有工具创新性组合 [3] - 支撑研究者更全面、更交叉地审视研究对象,提升认知水平 [3] 实践案例与成果 - 上海人工智能实验室发布并开源"书生"科学多模态大模型 [3] - 模型融合蛋白质序列、基因组、化学分子式、脑电信号等科学数据 [3] - 具备严谨的逻辑推理能力和科学多模态能力 [3] - 基于"书生"大模型推出科学发现平台,与国内多家科研单位合作 [3] - 成功研发基于人工智能的量子计算中性原子排布算法 [3] - 开发专注于靶标发现与临床转化评估的多智能体系统 [3] - 在量子计算、药物研发、高分子化学等方面取得进展 [3] 未来发展方向 - 人工智能将成为跨学科、跨领域突破的重要引擎 [4] - 加快探索人工智能驱动的新型科研范式 [4] - 加快建设应用科学大模型 [4] - 进一步强化人工智能的牵引带动作用,推动科学技术取得更多"高点"突破 [4]
WAIC 2025大黑马,一个「谢耳朵AI」如何用分子式超越Grok-4
机器之心· 2025-07-29 18:31
核心观点 - 上海AI实验室发布并开源科学多模态大模型Intern-S1 其综合性能为当前开源模型中最优 在科学推理任务上超越xAI的Grok 4 同时训练算力消耗仅为Grok 4的1% [5][7] - Intern-S1首创"跨模态科学解析引擎" 可精准解读化学分子式 蛋白质结构 地震波信号等多种复杂科学模态数据 助力AI从"对话助手"进化为"科研搭档" [16] - 基于Intern-S1构建的多智能体虚拟疾病学家系统"元生"已在肝癌和结直肠癌治疗领域提出新靶点GPR160和ARG2 并经真实临床样本和动物实验验证 [17] 模型性能 - Intern-S1采用235B MoE语言模型和6B Vision编码器 预训练数据包含5T tokens 其中50%以上为科学数据 [21][25] - 在综合多模态通用能力评估上 Intern-S1得分比肩国内外一流模型 展现跨文本 图像的全面理解力 [10] - 在科学能力评测中 Intern-S1领先Grok-4等最新闭源模型 评测覆盖物理 化学 材料 生物等领域的复杂专业任务 [12] - 在化学 材料 地球等多学科专业任务基准上 Intern-S1超越顶尖闭源模型Grok-4 展现出卓越的科学推理与理解能力 [17] 技术创新 - Intern-S1新增动态Tokenizer和时序信号编码器 对化学分子式的压缩率相比DeepSeek-R1提升70%以上 [26] - 采用通专融合的科学数据合成方法 使模型同时具备强大的通用推理能力与多项顶尖的专业能力 [28] - 通过系统与算法联合优化 实现大型多模态MoE模型在FP8精度下的高效稳定强化学习训练 成本相比近期公开的MoE模型降低10倍 [30] 开源生态 - 上海AI实验室开源了面向大模型研发与应用的全链路开源工具体系 覆盖数据处理 预训练 微调 部署 评测与应用等关键环节 [32] - 近期开源多智能体框架Intern·Agent 可广泛应用于化学 物理 生物等领域的12种科研任务 [32] - 基于Intern-S1的『书生』科学发现平台Intern-Discovery上线 驱动科学研究从团队单点探索迈向科学发现Scaling Law阶段 [6][32]
通专融合,思维链还透明,上海AI Lab为新一代大模型打了个样
机器之心· 2025-05-24 12:07
AI发展新阶段 - AI下半场将聚焦问题定义与评估体系重构,行业需设计更有效的模型评测体系弥补AI能力与真实需求的差距[2] - 上海AI Lab构建"加速训练营"(InternBootcamp),通过评价建模与大模型交互提供反馈,使大模型持续进化获得解决复杂推理任务的能力[2] - 书生・思客(InternThinker)实现奥赛级数学、科学对象理解与推理、算法编程、棋类游戏、智力谜题等多专业任务同步学习演进,并在多任务混合强化学习中出现智能"涌现时刻"[2] 围棋领域突破 - InternThinker成为我国首个既具备围棋专业水平又能展示透明思维链的大模型,在实验室科研人员的布局中围棋成为科学探索的"试应手"[2] - InternThinker在围棋任务上打破思维"黑盒",运用自然语言就对弈过程进行讲解,用户可与之对弈并获取每一步棋背后的推理过程和决策依据[4] - InternThinker评价李世石"神之一手"为"相当刁钻",并给出应对策略,同时具备多样化语言风格如鼓励"以攻代守的好手"或毒舌锐评"不是棋的选择"[5][6] - 新生代世界围棋冠军王星昊九段评价InternThinker棋力在职业3-5段之间,分析能力优秀[8] 技术架构创新 - InternBootcamp包含超1000个验证环境覆盖复杂逻辑推理任务,能批量化规范化生成难度可控的推理任务并与大模型交互提供反馈[11] - InternThinker在包括数十个任务的测试集上平均能力超过o3-mini、DeepSeek-R1及Claude-3.7-Sonnet等国内外主流推理模型[14][15] - 研究人员观察到在多任务混合训练过程中出现强化学习的"涌现时刻",模型通过多个任务混合强化学习成功获得单一任务无法得到的奖励[18] - 上海AI Lab提出通专融合技术路线,通过基础模型层、融合协同层和探索进化层"三层"技术路径打造通用人工智能[22][23] 算法与框架突破 - 设计强化学习算法PRIME结合高密度监督信号,获取比现有方法高出7%的性能提升,在AIME、MATH等竞赛难度数学题上7B模型能力显著超越GPT-4o[24] - 推出多任务强化学习技术框架MoR实现多任务强化学习混合训练,构建基于结果奖励的强化学习新范式OREAL解决大模型三大困局[24] - 开发测试时强化学习(TTRL)框架探索AI自主进化路径,能在没有准确标签情况下进行奖励估计,减少人工标注依赖[24] - 构建分子逆合成新方法Retro-R1,仅使用1万条强化学习数据通过200步训练实现大模型在逆合成推理能力的升级[24]
神州数码董事长郭为: “通专融合”是AI应用落地的重要方向
21世纪经济报道· 2025-04-03 19:37
公司业绩表现 - 2024年公司实现营业收入1281.66亿元,同比增长7.14%,创五年新高 [2] - 数云服务及软件业务收入29.65亿元,同比增长18.75%,毛利率20.32%,同比提升4.7个百分点 [2] - 自有品牌业务收入45.81亿元,同比增长20.25%,毛利率11.49%,同比提升2.65个百分点 [4] - 净利润下降35.57%至7.77亿元,主要因持有的神州数码国际创新中心资产减值影响,扣除后净利润为13.05亿元 [3] AI战略布局 - AI成为公司数云融合战略的核心,推出神州问学AI原生赋能平台 [5] - 推出神州鲲泰问学一体机解决企业快速落地AI能力问题 [4] - 战略并购智邦科技大陆地区业务,切入国产高端网络交换机市场 [4] - 神州金服云数据产品作为数据资产获得建设银行深圳分行3000万元授信融资,成为全国首笔大中型数据资产质押融资案例 [4] AI应用与行业观点 - 公司认为AI应用处于"开始"阶段,尚未跨越鸿沟,当前"离人很近、离企业很远" [6] - 强调"通专融合"是AI发展方向,需结合企业流程改造实现创新 [6] - 未来企业AI应用场景将以异构算力为基础,共存多种模型,整合内部数据与知识,搭载海量Agent [7] - AI for Process是数字化转型关键路径,将重构企业核心竞争力 [6] - 目前优先在传统优势行业推广AI应用,因客户关系及数据资产熟悉度较高 [8] 技术及产能建设 - 神州鲲泰合肥生产基地正式投产,为安徽省单体产能最大服务器产线 [4] - 并购标的智邦科技拥有16条全球领先SMT产线,具备高端制造服务能力 [5]