Workflow
科学基础模型
icon
搜索文档
之江实验室薛贵荣:当AI开始做科研,我看到了大语言模型的天花板丨GAIR 2025
雷峰网· 2025-12-24 08:22
文章核心观点 - 大语言模型在解决复杂科学问题上存在根本性局限,其受限于“语言的边界”,难以理解高维度、跨模态的科学数据,在覆盖100多个学科的高难度HLE测试中,最优模型准确率仅为25.4% [3][4][19] - 为突破此局限,需要发展新一代的科学基础模型,其核心在于将光谱、化学结构、基因序列、地震波等多元科学数据统一Token化并映射到高维空间,从而实现对科学世界的客观认知与推理 [4][24][26] - 之江实验室研发的“021”科学基础模型是这一方向的实践,该模型旨在统一处理跨学科科学数据,具备科学知识问答、分子结构生成与编辑、基因到疾病精准诊断等能力,以推动科学研究范式的变革 [4][5][30][34][36] 大语言模型在科学领域的应用与局限 - 大语言模型已在多个学科研究中展现潜力,例如被用于解决微分几何难题和黑洞扰动理论计算,显著提升了研究效率 [15][16] - 然而,其本质是低维的离散符号系统,受限于“语言的边界”,无法真正理解包含时间、空间和能量等高维特性的科学数据,如分子、基因、地震波、光谱等 [4][19][23] - 在覆盖100多个学科的高难度HLE测试中,表现最优的大语言模型准确率仅为25.4%,表明其在科学知识与推理方面尚未达到人类认知水平 [4][19] 科学基础模型的核心原理与构建 - 科学基础模型与大语言模型的核心差异在于数据维度:前者以跨学科、多类型的科学数据作为Token化基础,而后者仅以文本数据为基础 [4][25][26] - 构建科学基础模型的首要挑战是实现“OneTokenizer”,即将光谱、化学结构、蛋白质、DNA、地震波等异构科学数据结构化,统一映射到一个高维空间中 [4][26][28] - 数据Token化并对齐后,能够建立不同类型科学数据之间的关联,从而实现跨学科的全链路科学解析与发现 [5][28][30] 之江实验室“021”科学基础模型 - “021”模型是之江实验室研发的科学基础模型,旨在对科学世界形成客观认知,并具备迅速、精准、高泛化性的科学知识问答能力 [5][30] - 该模型覆盖数学、物理、化学、计算机等19个重要学科,涉及174个领域的科学知识,但其训练所用的科学数据Token规模仅约为互联网语料的1% [34] - 模型具备多项应用能力,包括:通过对话进行分子结构的生成与编辑,替代耗时数月的高通量实验;实现从基因组学到临床医学的全链路基因突变分析与疾病精准诊断 [34][36] - 该模型支持全球204种语言,旨在让更多人享受其服务 [36] 行业趋势与生态建设 - “AI+科学”已成为全球重要战略,例如美国启动了被称为“AI曼哈顿计划”的“创世纪计划”,动员了17个国家实验室和4万名科学家 [9] - OpenAI等领先机构也积极布局,启动了“OpenAI for Science”倡议,旨在打造由人工智能驱动、加速科学发现的平台 [16] - 构建科学基础模型需要深度跨学科合作,之江实验室通过设立“种子班”、“科学家工作坊”以及与国内外专家的协同创新,汇聚AI科学家与领域科学家共同攻坚 [36][37] - 实验室通过开放研究平台“zero2x”开放其数据与模型,并设立奖金池和科研支持方案,以全球征集科学问题的方式,推动AI在科学领域的极限探索 [37][38]
之江实验室021科学基础模型首次亮相 突破语言局限
中国新闻网· 2025-12-19 07:44
021科学基础模型发布 - 之江实验室于12月18日在杭州举行创新合作大会,首次全面展示其021科学基础模型及系列领域科学模型研发进展 [1] - 该模型构筑了跨学科知识、跨领域推理、跨语言理解三大基石,其语言理解能力覆盖204种语言 [1] - 模型旨在突破语言表达的局限,通过构建“科学空间+语言空间”的统一高维空间来连接跨学科数据,从而变革科学研究范式 [1] 模型技术架构与能力 - 研发团队探索将科学数据和文本语料编码到统一高维空间,使模型能够识别、处理科学数据并解决复杂科学问题 [1] - 经过近万次实验,团队形成了包含预训练、后训练、强化学习的模型训练框架 [1] - 已完成2360亿参数规模的021科学基础模型训练 [1] 应用领域与定位 - 目前,021模型已服务于地球科学、天文学、生命科学、材料科学等多个领域 [2] - 该模型被定位为打破学科边界、激发创新思维的“科研伙伴” [2]
GAIR 2025 大会首日:AI重构教育、科学与产业的十三重碰撞
雷峰网· 2025-12-13 12:02
文章核心观点 文章报道了第八届GAIR全球人工智能与机器人大会首日主论坛的盛况与核心讨论,大会主题聚焦于AI对教育的重新定义(AI之道)与AI在各领域的范式重构(AI之术)[1][3],与会顶级学者分享了AI前沿技术进展、产业应用挑战与未来发展趋势,认为AI正从技术讨论迈向重塑教育、产业乃至文明的内在力量[1] AI之道:教育的重新定义 高等教育培养模式的重构 - 深圳理工大学提出“加减替换”培养模式以应对AI冲击:减法包括压缩课堂时长20%、每周减少一天上课时间并删减低效课程内容;加法包括要求大一学生必修两学期人工智能导论、每周腾出一天进实验室;替换包括用跨文化交流课替代传统英语教学、计划以智能APP取代传统教科书[6] - 高等教育管理需从传统“电子版电话黄页”式信息系统迭代为智能信息系统,弱智能层面可在现有平台接入大语言模型,强智能层面则让系统直接对接各子系统以实现实时响应与智能决策[7] - 大学应回归培养“有智慧的人”的本质,帮助学生找到自身定位,并推出科研成果与素质教育双成绩体系进行全面评价[6] 教育理念与目标的根本转变 - 生成式AI使知识从“黄金”变成“无处不在的空气”,教育应从“知识传输”转向培养学生的能力、好奇心、学习主动性和共创意识[9] - 未来教育的重点需从“真”(知识与事实)转移到“善”(价值观、自省力、判断力)与“美”(独特的自我展现),以培养更聪明的人并防范缺乏价值判断的AI系统风险[9][10] - 大学的核心竞争力最终产品是“人”,重要能力包括运用知识的能力、沟通能力(人与机器)、创造力以及人文素养,好大学和好学科的共同特征都与数学及母语语言文学有关[15] 教育体系与评估的变革讨论 - 当前AI教育转型不存在“弯道超车”,社会对教育抱有过高期望,进步应是全社会责任而非仅由师生承担[13] - 应创造自有教学理念而非跟随他人“领先”话语体系,AI极大地推动了教育民主化并为师生带来更强自主性[14] - 考核方式需因应AI时代改变,若学生能用AI作弊则说明考试方式本身出了问题,港科大是全球首个宣布GPT是好东西并在教学中广泛使用的学校[9][11] - 在应试教育现实下,校内应减教学、减刷题、减考试量,增加“体验”以让孩子找到AI不能代替的科研与人生快乐[17] AI之术:领域的范式重构 机器人技术与产业自动化 - 全球服装市场规模巨大,预计到2030年价值达2.3万亿美元,但智能化不足,2019年数据显示纺织产业机器人密度很低,总生产时间和成本的80%用于物料搬运,67%劳动力集中于缝纫过程[23] - 研究团队开发了可像人一样思考、配合旋转布料方向的缝纫机器人,以及被动式无致动器抓手、布料边缘高速检测、双臂机械手2D和3D裁剪等技术,以革新服装生产流程[22][24] - 选择汽车座椅作为3D剪裁自动化方案的优先商业化场景,因为该品类产量高且预计到2028年相关工业生产设备投入达3.63亿美元,目前尚无自动化解决方案[24] - 欧洲因人工昂贵将成为继中国、北美、东南亚和日本之外最大的自动化服装市场[25] 大模型技术演进与挑战 - 大模型需从当前“一次性学习”模式革新为人类“连续学习”式的终身学习,并从“虚拟大脑”走向与机器人等实体载体结合的“感知机器”,这是未来5-10年的核心方向[28][29][30] - 需改善神经元连接方式让模型在同等数量神经元上变得更聪明,发展进程可能缓慢但方向明确[28] - 面临幻觉与长上下文处理瓶颈,可通过“有损计算”理念破解,即利用参数精度无需过高、无需启用全部参数两个关键点,开发简易算法优化相对位置信息与KV缓存显存占用[38][39] - 大语言模型依赖公开数据的发展模式即将触顶,如何利用私有数据持续赋能是巨大挑战,且将基于公开语言数据的成功经验迁移到其他非语言数据领域是错误的[49] 科学基础模型与AI+科学 - 科学基础模型面临语言边界限制与科学数据复杂性两大瓶颈,例如一张光谱信息量相当于1000张图片,人类30亿个基因可存储全球数据,语言作为低维离散符号系统难以覆盖[42] - 构建路径包括将分子、基因、光谱等非文本科学数据转化为Token表示并统一编码,以及通过数据对齐(如基因数据与病理数据对齐)推动科学发现[43] - 团队已完成覆盖十余门学科的超大规模模型训练,并推动“大模型种子班”和“科学家工作坊”以加速AI+科学研究[44][45] 时空AI与城市计算 - AI真正产业价值需进入物理世界(如具身智能、无人驾驶、城市管理),面临数据稀缺、需结合行业知识、现有模型非为时空而设三大挑战[33][34] - 城市计算可作为具身智能的方法论,具身智能将成为城市计算的核心组件,未来城市有望成为“巨大的具身智能体”[35] - 城市知识体系是实现时空数据与其他数据融合的路径和方法论[34] 算力基础设施与超智融合 - 超算核心逻辑是集聚算力攻克复杂科学问题(如地球系统模式、气候变化研究),与AI大模型的并行思维本质相通[52][55] - 超算领域面临国产算力硬件投入大、软件生态投入相对少以及复合型人才流失的困境[55] - 需借鉴通用人工智能的可扩展模型经验,加强算力软件与科学发现协同,完善国产生态以留住人才,深圳超算将搭建超智融合平台形成开源生态[55][56] 医疗人工智能的应用 - 医学人工智能应由医生主导,因为所有工具最终都要落到医生面对患者的场景中,AI是医生调用或辅助诊疗的工具,从人文关怀角度医生使用AI比患者独自面对机器体验更好[60] - 实现路径包括基于现有语言大模型接入更多数据模态并构建应用体系,以及大模型与小模型协同,由垂域小模型纵向攻克预警、诊断、治疗等核心环节[60] - 落地需放在整个医院医疗体系中思考,构建培训、AI赋能、后续医疗支撑的体系以实现“强基层”和真正落地价值,而非仅技术解决[60] 智能硬件与端侧AI - 云端模型存在显著浪费,一些语音指令经云端解析再回传至少50%传输成本被无效消耗,全球云端模型每日消耗成本高达万亿至百万亿量级但有效利用率存疑[63] - 行业正从云端向端侧战略转移,未来智能硬件最重要的是原生记忆和自主学习,大模型需从固定工具转向持续学习和实时成长[63][64] - 当前“更多数据、更大算力、更高人才密度、更大参数=更好模型”的共识可能扼杀创新,Transformer架构偏向压缩智能和静态函数,并未真正产生知识[63] 新型模态感知与空间智能 - 未来5-10年,面向新型模态(如声波、毫米波)的新型感知模型会非常繁荣,传统AI与新型传感将“殊途同归”以实现对物理世界的准确感知和空间智能[65][67][68] - 当前多模态感知仍集中在语音、文字、图像、视频,对新型模态探索不多,需用最新模型技术理解新型传感器数据以进行空间感知、智能交互、健康监测等技术探索[67][68]
专家:Token消耗量或成AI时代经济衡量指标
中国新闻网· 2025-11-21 19:36
论坛核心观点 - 在人工智能时代,Token(词元)消耗量有望成为衡量经济运行情况的关键指标,类比于电力时代的耗电量[1] - 论坛主题为“计算依靠智能、计算为了智能”,吸引中外专家探讨AI技术前沿及其赋能其他学科领域[1] AI模型效率与成本 - 模型的推理效率越高,产生Token的成本越低[1] - 应通过产业上下游联合优化、协同设计模型芯片,并推动系统与架构联合创新,以实现模型推理效率的提升[1] 科学基础模型发展 - 科学基础模型基于科学数据解决问题,关键是将不同种类的科学数据编码为同一种数字标识符(Token),以便模型训练与推理,从而应对跨学科问题[1] - 科学基础模型的构建需要与科学家携手,在开放科学生态下共同推动科研范式的变革[2] 智能系统应用前景 - 随着智能系统在动态、不可预测环境中运行增多,能够有效响应变化的机器人变得愈发重要[2] - 中国被视为新技术应用的绝佳试验场,能迅速观察到不同智能体之间以及人与智能体之间协作取得的实际成效[2] - 各国科学家应建立合作网络,通过携手合作创造更多可能[2]
中外专家共探AI技术前沿与产业赋能
新浪财经· 2025-11-21 15:23
论坛概况 - 第五届智能计算创新论坛在浙江杭州举行,由浙江之江实验室与《科学》/美国科学促进会共同举办 [1] - 论坛主题为“计算依靠智能、计算为了智能”,旨在搭建智能计算领域国际学术交流平台 [1] - 论坛吸引中外专家探讨人工智能技术前沿发展及其在天文、地学、生命科学、材料等领域的赋能作用 [1] 科学基础模型发展 - 科学基础模型构建的关键是将不同类型科学数据token化并置于同一空间进行训练与推理,以应对跨学科复杂问题 [2] - 基础模型的学习范式经历模仿学习、强化学习和自主学习三个阶段,目前已从模仿学习过渡到强化学习 [2] - 基础模型的应用正从对话转向任务处理,模型推理效率成为大规模部署AI应用程序的关键因素 [2] 模型效率与产业协同 - 基础模型能力提升所消耗的token数量呈指数增长,token消耗量可能成为AI时代衡量经济运行的新指标 [3] - 提升模型推理效率需通过产业上下游联合优化、协同设计模型芯片,并推动系统与架构联合创新 [3] - 模型推理效率越高,产生token的成本越低 [3] 智能系统应用与协作 - 在动态、不可预测环境中,能够有效响应变化的机器人变得愈发重要 [4] - 中国在智能制造等领域展现出领先实力,为观察智能体协作及新技术应用提供了绝佳试验场 [4] - 各国科学家应建立合作网络,携手合作以创造更多可能 [4]