大语言模型
搜索文档
训练加速1.8倍,推理开销降78%,精准筛选题目高效加速RL训练
36氪· 2026-02-09 18:39
行业技术背景与挑战 - 以DeepSeek R1为代表,基于强化学习(RLVR)微调显著提升大语言模型推理能力,但强化微调成本高昂 [1] - 高昂成本主要源于训练过程中的“低效”,大量算力浪费在无法提供有效学习信号的题目上 [1] - 现有主流“挑题”策略存在明显缺陷:“题海战术”(Uniform Sampling)导致大量算力浪费;“先测后学”(Dynamic Sampling, DS)依赖大模型“自测”,推理成本依然高昂 [2] MoPPS框架核心创新 - 清华大学THU-IDM团队与慕尼黑大学CompVis团队合作,提出全新框架:基于模型预测的提示选择(Model Predictive Prompt Selection, MoPPS) [2] - 核心解决思路是无需昂贵的大模型评估,动态预测题目难度并精准挑选训练数据,以更高效提升模型推理能力 [5] - 将每道题目建模为“老虎机”,每个题目有一个未知的“获胜概率”(即模型在当前参数下答对的成功率) [7] - 采用轻量化的贝叶斯难度预测,为每个题目配备Beta分布来估计其成功率,并通过二值反馈递归更新,计算量极低 [8] - 引入时间衰减因子以适应模型能力动态变化的环境 [9] - 使用Thompson Sampling进行主动问题筛选,从候选集中挑选最接近目标难度(成功率约0.5)的“黄金题”,平衡探索与利用 [10] 性能与效率优势 - 与需要大量额外推理的“先测后学”方法相比,MoPPS达到相同性能所需的Rollouts减少了高达78.46% [15] - 相较于传统的“题海战术”,MoPPS实现了高达1.6倍至1.8倍的训练加速,且训练效果更好 [16] - 在R1-Distill-Owen-1.5B模型上,MoPPS在多项基准测试中的平均性能达到51.83,与DS(Oracle)的52.00相当,但仅使用737k Rollouts,远低于DS的2933k [17] - 在R1-Distill-Qwen-7B模型上,MoPPS平均性能达62.20,与DS的62.42相当,但仅使用287k Rollouts,远低于DS的1147k [17] - MoPPS预测的题目难度与真实难度之间具有极高的相关性(Spearman Rank Correlation),证明了其预测的有效性和可靠性 [19] 方法适用性与行业影响 - MoPPS作为“数据筛选器”即插即用,可兼容PPO、GRPO、Reinforce++等多种强化学习算法 [20] - 在PPO (k=1)算法下,MoPPS在CD-34和CD-4基准上的性能分别为69.12和40.11,显著优于Uniform采样的62.33和32.65 [23] - 支持不同采样策略并可引入先验信息,默认采用Top-B采样,也可扩展为阈值采样,并能结合先验知识加速前期训练 [24] - 该工作已被KDD 2026接收,受到包括阿里千问、腾讯混元、蚂蚁等业界的关注,以及UIUC张潼老师、UCL汪军老师、UvA Max Welling教授等知名学界团队的引用 [4] - 该研究为大模型强化微调领域提供了一个“降本增效”的利器,其核心贡献在于提出了一种全新的“先预测,再优化”范式 [26]
训练加速1.8倍,推理开销降78%!精准筛选题目高效加速RL训练丨清华KDD
量子位· 2026-02-09 17:50
文章核心观点 - 清华大学与慕尼黑大学团队提出的MoPPS框架,通过一种轻量化的“先预测,再优化”范式,能够在不依赖昂贵大模型自评估的情况下,动态预测并筛选出难度最合适的训练题目,从而显著降低大语言模型强化学习微调的成本并大幅提升训练效率 [3][6][15][31] 大模型强化微调面临的效率挑战 - 以DeepSeek R1为代表,基于强化学习微调能提升模型推理能力,但训练过程成本高昂,主要源于“低效”学习,即大量算力被浪费在过于简单或过于困难、无法提供有效学习信号的题目上 [1] - 传统“题海战术”从题库中随机抽题训练,会导致梯度坍缩,资源被白白浪费 [2] - 传统“先测后学”策略依赖大模型对候选题目集进行“自测”来筛选,虽然能提升效率,但“自测”本身需要大量LLM推理,成本依然高昂 [2][8] MoPPS框架的核心机制 - MoPPS将每一道训练题目建模为一个“老虎机”臂,其核心目标是估计并优先选择成功率接近0.5的中等难度题目 [9][11] - 采用极低开销的轻量化贝叶斯模型进行难度预测:为每个题目维护一个Beta分布,通过模型训练产生的“成功/失败”二值反馈直接递归更新分布参数,计算量极低 [10][11][12] - 引入时间衰减因子,使难度估计能适应模型能力变化的动态环境 [11] - 使用Thompson Sampling策略进行主动题目筛选,平衡对已知最优题目的利用和对潜在有价值新题的探索 [11][14][20] MoPPS框架的性能优势 - **大幅降低算力成本**:与需要大量额外推理的“先测后学”方法相比,MoPPS达到相同性能所需的Rollouts减少了高达78.46% [18] - **显著提升训练效率**:相较于传统的“题海战术”,MoPPS实现了高达1.6倍至1.8倍的训练加速,且最终训练效果更好 [21] - **难度预测精准可靠**:MoPPS预测的题目难度与真实难度之间具有极高的相关性,证明了其预测的有效性 [25][29] 实验数据与效果验证 - 在AIME24、AMC23、MATH500等多个数学推理基准测试中,基于Qwen-1.5B模型,MoPPS方法取得了32.92、66.72、84.82的分数,性能优于Uniform采样和HIR方法,与需要大量额外计算的DS方法相当甚至更优,且仅使用了737k Rollouts [22] - 基于Qwen-7B模型,MoPPS方法在多个基准上取得48.54至91.04的分数,性能接近DS方法,但Rollouts仅为287k,远低于DS方法的1147k [22] - MoPPS框架具有良好的兼容性,可作为即插即用的“数据筛选器”,适配PPO、GRPO、Reinforce++等多种强化学习算法,并均能带来性能提升 [26][27] 方法适用性与行业影响 - MoPPS框架支持不同的题目筛选策略,并能结合先验知识以加速前期训练 [28][31] - 该工作已被KDD 2026接收,并受到阿里千问、腾讯混元、蚂蚁等业界公司,以及多位知名学者的关注和引用 [5] - 该研究为大模型强化微调领域提供了一个“降本增效”的利器,未来有希望应用于更大规模的大模型强化学习后训练 [31]
英伟达被起诉,用盗版训练大模型成行业潜规则?
新浪财经· 2026-02-08 17:51
英伟达涉AI训练数据版权诉讼案 - 英伟达因使用“影子图书馆”的盗版图书数据训练其大语言模型,被五位作家提起集体诉讼,指控其侵犯版权 [3][4] - 英伟达于2026年1月31日提交正式动议,主张其行为属于“合理使用”,并要求法院驳回起诉,法院定于2026年4月2日举行听证会审理此动议 [4][18] - 起诉书内部记录显示,英伟达为应对OpenAI的竞争压力,在2023年开发者大会前通过“影子图书馆”获取了数百万本盗版图书用于训练模型 [4][19] 英伟达获取盗版数据的详细过程 - 英伟达发布的NeMo Megatron系列模型部分训练数据来自非营利机构EleutherAI发布的The Pile数据集,该数据集包含源自“影子图书馆”Bibliotik的Books3子集,约有19万本图书 [5][21] - 除使用The Pile外,英伟达被指控直接与全球最大的“影子图书馆”Anna‘s Archive合作,在管理层迅速批准后,获得了总量约500TB、涵盖数百万本盗版图书的访问权限 [7][22][24] - 英伟达转向盗版数据的直接原因是竞争压力:公司在2023年8月与多家图书出版商洽谈数据授权被拒,为赶在2023年秋季开发者大会发布领先模型,转而联系Anna’s Archive [7][23] “影子图书馆”的商业模式与风险 - “影子图书馆”如Anna‘s Archive提供付费的“优先级下载通道”或“高速企业级访问权限”,以换取数万美元级别的捐赠,这为大模型公司提供了便利但非法的数据源 [10][27] - Anna’s Archive声称,随着人工智能崛起,已为约30家公司提供高速数据访问权限,这为濒临消亡的“影子图书馆”带来了生机 [10][27] - 使用盗版资源带来巨大侵权风险,美国版权局2025年报告指出,商业用途下收集受版权保护的数据可能构成对复制权、编辑权、改编权的多重侵害 [10][27] 行业其他公司的类似诉讼与判例 - 多家AI巨头陷入类似纠纷:OpenAI、xAI、Anthropic、Meta等均遭遇训练数据版权诉讼 [4][20] - 2025年,Anthropic在一起侵权案中同意支付至少15亿美元达成和解,可能创下版权赔偿金额纪录 [4][20][28] - 2025年法院对Anthropic和Meta的两起案件作出判决:虽认定AI训练可能构成“合理使用”,但明知故犯地从盗版网站获取数据的行为可能被判定侵权 [11][28][29] 行业诉讼趋势与潜在影响 - 训练数据版权问题引发更多诉讼:2025年12月,六名作家起诉谷歌、OpenAI、xAI、Anthropic、Meta和Perplexity六家公司 [13][30] - 出版商群体也在2025年启动维权,例如多家大型出版商起诉AI初创公司Cohere,指控其未经授权使用超过4000部受版权保护的作品 [15][32] - 诉讼呈现全球化趋势:中国爱奇艺诉MiniMax案是国内视频平台首例AI训练数据诉讼;MiniMax同时在美国遭遇好莱坞巨头集体诉讼,索赔金额最高达7500万美元(约合52.8亿元人民币) [15][33]
苏炜杰获2026「统计学诺奖」考普斯奖,14年来首位华人得主
机器之心· 2026-02-07 12:09
考普斯奖项与苏炜杰获奖 - 2026年考普斯奖(COPSS Presidents' Award)颁给了宾夕法尼亚大学副教授苏炜杰,这是时隔14年后再次有华人获得此奖项 [1][6] - 该奖项被誉为“统计学诺贝尔奖”或统计学界的菲尔兹奖,由五大顶级统计学会共同评选,每年仅授予一位40岁以下的统计学家 [4] - 奖项委员会评价苏炜杰的贡献包括:为大语言模型的多项应用建立严格的统计基础;在隐私保护数据分析方面取得突破性进展并应用于2020年美国人口普查;设计了AI顶级会议的同行评审机制;以及在凸优化、深度学习数学理论与高维统计推断方面作出广泛而深远的贡献 [2] 苏炜杰的学术背景与职业履历 - 苏炜杰现任宾夕法尼亚大学沃顿商学院统计与数据科学系副教授,同时在数学系、计算机系兼职,并担任宾大机器学习研究中心联合主任 [7] - 其教育经历:2007-2011年就读于北京大学数学科学学院基础数学专业,以年级第一毕业;2011-2016年在斯坦福大学攻读博士学位,师从美国国家科学院院士Emmanuel Candes [12][13] - 2016年博士毕业后,未经博士后阶段直接受聘于宾夕法尼亚大学沃顿商学院执教 [9][14] - 高中时期曾获中国数学奥林匹克竞赛银牌(高一)和金牌(高三),并因此保送北京大学 [11][12] 主要学术成就与研究领域 - **大模型的统计与优化理论基础**:其研究将大模型可信部署的关键问题形式化为严谨统计框架,发展了最优的水印检测假设检验方法,并提出了首个能完全保证人类偏好对齐的无偏正则化方案 [18] - **隐私保护机器学习的理论突破**:与其学生提出的高斯差分隐私(GDP)框架,实现了隐私保护与模型准确率的最优平衡,并成功应用于2020年美国人口普查——全球规模最大的差分隐私实践,研究表明在相同隐私保护水平下噪声方差可降低约15% [21] - **AI学术评审的机制设计**:提出的保序机制开创了“作者参与评审”的新范式,该机制要求作者对自己的多篇投稿进行质量排序,并严格证明了其激励相容性,已于2026年在国际顶级AI会议ICML正式投入使用 [23] - **凸优化加速算法的理论奠基**:其工作将离散凸优化加速算法纳入连续微分方程分析框架,系统性地在数值分析与最优化两大领域间建立深刻数学联系,该成果已成为教科书级经典,并被OpenAI研究员近期的突破性成果所引用 [25] - **深度学习理论的数学解释**:其团队提出的层间剥离模型为“神经坍缩”现象提供了严格数学证明,并从理论分析中预测出全新的“非均衡坍缩”现象 [27]
蔡崇信复盘阿里AI:“早”做,不等于领先
36氪· 2026-02-07 10:22
阿里巴巴的AI战略反思与核心框架 - 公司早在2019年已将Transformer模型用于推荐系统,但未能在大语言模型研发上投入足够资源,错过了三年的窗口期[1] - 公司董事会主席在2023年复出后将AI战略聚焦于三个关键词:采用、规模、开源[5] 采用:AI价值的实现关键 - AI战略的核心在于找到能被真实使用的场景,产生价值,而不仅仅是做出模型[7] - 公司的AI战略包含消费者应用、大语言模型和基础设施三个同等重要的层次,均需资本投入[8] - 通义App是验证AI能力在真实场景落地的关键环节,需考察C端使用频率、B端接入稳定性及在具体行业的应用效果[8] - 中国市场企业级软件付费习惯薄弱,用户为API调用付费的接受度低,推广难度远高于美国[9] - 因此,中国模型厂商需通过云基础设施或应用层寻找盈利路径,而非依赖纯API收入模式[11] - 通义千问在“春节30亿免单”活动中,上线9小时AI订单突破1000万单,验证了真实用户流量对基础设施的考验[11] 规模:推理成为成本与能力的焦点 - 行业投资正从模型训练转向推理,推理是AI成本的真正大头[12] - 美国大型科技公司年资本支出已从此前的600到800亿美元,上涨至1200到1500亿美元[12] - 训练只发生在少数公司内部,而用户每日使用的功能(如提问、客服处理、内容生成)均为推理,持续消耗算力资源[13][14] - 模型规模化的关键在于高并发下的稳定性、推理速度及成本控制,即吞吐量,而非单纯追求最强性能[15] - 公司将模型部署在自家云上,以全面控制推理性能、吞吐量和并发处理能力[15] - 随着AI多模态化,对算力的需求将持续增长且无天花板,规模化比拼的是基础设施调度GPU的能力、高负载稳定性及成本控制[16] 开源:基于市场现实的商业策略 - 中国模型公司选择开源,主要源于纯API订阅模式在中国难以规模化的商业现实[17] - 开源的首要价值在于赋予用户“主权”,即企业、政府、开发者可将模型部署在自有服务器或私有云,实现完全的数据控制与自主可控[18][19][20] - 开源后的盈利关键在于掌握模型运行所依赖的基础设施,公司通过开源通义千问模型,引导用户在阿里云上进行训练和推理,以基础设施收费实现商业闭环[22] - 这一路径依赖公司自身的云业务,对于没有云基础设施的公司而言难以复制[23]
代表建议重塑上海高考选拔模式,不让理工人才被“刷”在门外
第一财经· 2026-02-07 09:52
文章核心观点 - 上海市人大代表段纯刚建议改革上海高中学业水平等级考制度 核心是重塑自然科学学科的战略地位 以应对新一轮科技革命对理工科人才的迫切需求 具体建议包括将物理纳入必考科目 改革赋分体系以提升区分度 以及优化考试内容设计以考查深度思维与科学探究能力 [1][2][3][4][5] 现行高考制度分析 - 上海现行“3+3”高考模式中 语文、数学、外语“大三门”每门满分150分 从6门中自选的“小三门”每门满分70分 实施等级赋分制 起评分40分 实际有效区分区间为30分 这30分仅占高考总分660分的4.5% [1] - 这种赋分制设计导致自然科学学科区分度被压缩 在顶尖学生录取排序时影响力远不及“一分一档”的语数外 对物理学科构成了根本性冲击 [2] - 根据华东师范大学课题组2018年调研 实施“6选3”新高考后 上海市选考物理的学生比例从改革前的约28%降至2017年的16%左右 近年来在高校“物化双选”招生要求下 物理选考人数已回升至约3.6万人 [2] 改革背景与必要性 - 全球正处于以人工智能、量子科技等为代表的第四次工业革命纵深推进的关键阶段 对理工科人才需求加大 [1] - 物理学是探究物质、能量与时空最底层规律的基础学科 是现代工程技术与信息科技的源头与核心 也是化学、生物等其他自然科学的基石性支撑 [2] - 随着AI技术特别是大语言模型的发展 细枝末节知识的重要性下降 未来教育更应注重逻辑思维训练 解决问题能力以及对AI工具的运用 这些都离不开理科教育 [3] - 未来发展趋势属于交叉领域 近年诺贝尔奖的颁布也显示出学科界限正在被打破 [3] - 上海作为国家重要的科技创新策源地与高端人才集聚区 对高考等级考制度的改革是维系城市核心竞争力的关键一环 [3] 具体改革建议 - 重塑学科战略地位 设立“自然科学基础”核心科目 将物理纳入必考基础科目范畴 赋予其与语数外同等或接近的分值权重 [4] - 改革评价与赋分体系 实施“增强型”等级赋分 例如在高校“强基计划”、理工科特种专业招生时 提供关键科目的原始分或高难度试题得分情况作为重要参考 以解决“区分度坍塌”问题 让有学科天赋的学生脱颖而出 [4][5] - 优化考试设计与内容 将物理、化学、生物等核心理科等级考时长延长 增加综合应用题、实验设计题、开放论证题等考查深度思维与科学探究能力的题型比重 扭转“短平快”考查模式 [5]
机构研究系列:03 江苏银行——从区域银行到系统重要性银行的跨越之路
新浪财经· 2026-02-07 07:47
公司概况与市场地位 - 江苏银行是全国20家系统重要性银行之一,也是江苏省内最大的法人银行,其发展对城商行群体具有重要示范意义 [2] - 截至2025年6月末,公司资产总额已突破4.4万亿元,在英国《银行家》杂志全球银行1000强中位列第56位,较2020年提升36位 [2] - 截至2025年一季度末,总资产达到44596.21亿元,突破4万亿元 [7] 战略演变历程 - **重组筑基与规模突围期(2007-2015年)**:公司于2007年由江苏省内10家城商行合并重组成立,核心战略为“整合资源、深耕本土”,并通过跨省设立分行实现全国性布局,2014年末总资产突破1万亿元 [3] - **结构优化与创新破局期(2016-2020年)**:2016年上市后,公司确立“智慧化、特色化、国际化、综合化”的“四化”愿景,并聚焦“智慧金融、财富管理、消费金融”三大特色定位,2017年成为国内城商行首家赤道银行,2019年集团资产首次突破2万亿元 [4][5] - **高质量发展与战略深化期(2021年至今)**:公司提出“最具价值的银行、服务领先的银行、智能创新的银行、员工满意的银行、政治过硬的银行”五大战略目标,新管理层强调“稳中求进、稳中求变” [6][7] 当前战略框架 - **顶层定位**:企业使命为“融创美好生活”,愿景是建设“四化”服务领先银行,核心价值观为“融合创新、务实担当、精益成长”,市场定位坚守“服务中小企业、服务地方经济、服务城乡居民” [8] - **五大战略目标体系**:包括最具价值的银行、服务领先的银行、智能创新的银行、员工满意的银行、政治过硬的银行,构成高质量发展的战略框架 [9][10] - **六大业务发展战略**:1)做强公司业务;2)做大零售业务,聚焦财富管理;3)做优金融市场业务;4)加速数字金融发展;5)深化区域布局,推进综合经营;6)实施ESG战略 [11][12][13][14][15][16][17] - **五篇大文章战略重点**:将科技金融、绿色金融、普惠金融、养老金融、数字金融作为服务新质生产力的战略重点 [7][17][18] 各业务领域战略布局与成效 - **对公业务**:坚持“做强公司业务,打造行业专长”,形成以制造业为主体、科创和绿色为特色、数字经济为新增长极的“一主一特一新”结构 [20] - 截至2025年6月末,对公存款余额14197亿元,较上年末增长22.20%;对公贷款余额16250亿元,较上年末增长23.30% [11] - 制造业贷款余额3606亿元,较上年末增长18.90%;基础设施贷款余额6912亿元,较上年末增长31% [11] - 科技金融:截至2025年9月末,科技企业贷款余额近3000亿元,保持江苏省第一,实现省内高新技术企业三分之一有合作、六分之一有贷款 [7][17] - 绿色金融:截至2025年9月末,绿色融资规模超7500亿元,较五年前增长6倍 [7][18] - 交易投行业务:2024年债务融资工具承销规模超1500亿元,城商行排名第一;并购贷款余额新增143.09亿元,增长150.16% [22] - **零售业务**:围绕“做大零售业务,聚焦财富管理”,形成“大财富+大零售”格局 [23] - 截至2025年6月末,零售AUM规模超1.59万亿元,半年新增突破1600亿元;零售存款余额9484亿元,较上年末增长15.25% [12] - 江苏银行App客户数超2100万,月活客户数突破750万户,持续位列城商行第一 [12][23] - 普惠金融:截至2025年9月末,小微贷款余额超7800亿元 [7][18] - 养老金融:个人养老金账户开立突破120万户,发行长辈客群专属卡片超百万张,专属理财产品累计销量超3300亿元 [18][24] - **金融市场业务**:目标为“做优金融市场业务,建立领先优势”,打造“最强金融市场品牌” [13][25] - 截至2025年6月末,金融投资资产余额18833亿元,较上年末增长23.38% [13] - 金融债及信贷ABS承销规模在城商行排名保持第1,票据经纪业务规模全市场排名第2 [13][25] - 托管业务:截至2025年6月末,托管资产余额5.06万亿元,成为首家托管规模突破5万亿元的城商行 [13][26] - **金融科技**:深入推进“加速数字金融发展,提升科技价值贡献”战略 [14][27] - 2024年科技投入占比约3.5%,高于城商行平均水平,信息科技监管评级连续多年在全国城商行中排名首位 [27] - 自主研发的“智慧小苏”大语言模型平台已落地近60个智能化场景,合同文本提取准确率超95%,地址风险识别准确率达99% [7][14][28] - “苏银金管家”云财资平台截至2025年9月末覆盖客户超11万家,通过供应链金融带动中小企业融资近4000亿元 [18][28] 同业对标分析 - **与省级城商行对比(2024年末数据)**: - 资产规模:江苏银行3.95万亿元,北京银行4.22万亿元,上海银行3.23万亿元,宁波银行3.0万亿元 [29] - 资产质量:江苏银行不良贷款率0.89%,拨备覆盖率350.10%,优于北京银行(1.31%,208.75%)和上海银行(约1.18%,约250%),宁波银行不良率约0.7%,拨备覆盖率约500% [29][32] - 盈利能力:2024年江苏银行营业收入808.15亿元,归母净利润318.43亿元;北京银行分别为699.17亿元和258.31亿元;上海银行分别为529.86亿元和235.60亿元 [33] - **与全国性股份制银行对比**: - 资产规模:江苏银行3.95万亿元,显著低于招商银行(超过10万亿元)和兴业银行(超过8万亿元) [36] - 零售AUM:江苏银行1.42万亿元,远低于招商银行(超过12万亿元)和兴业银行(约2万亿元) [36] - 科技投入占比:江苏银行3.5%,低于招商银行的4.85% [36] - **相对优势与不足**: - 优势:规模居城商行第一梯队;资产质量优良;科技金融、绿色金融等特色业务均衡发展;科技赋能成效显著;深耕江苏的区域优势明显 [37][38][39][40][41] - 不足:零售业务占总资产比重偏低;国际化程度不高;全国品牌影响力有限;创新能力有待提升;规模扩张带来资本约束 [41][42][43][44] 未来战略方向展望 - **“十五五”规划前瞻**:战略定位将更加清晰和聚焦,发展目标预计更务实,研究机构预测2025-2027年营收增速分别为6.9%、7.3%、7.6%,利润增速分别为8.2%、9.2%、9.5% [44] - **重点领域展望**: - 科技金融:预计到2027年科技企业贷款余额突破5000亿元,重点支持战略性新兴产业 [45] - 绿色金融:预计到2027年绿色融资规模突破1.5万亿元,绿色贷款占比超过30% [45] - 财富管理:预计到2027年零售AUM突破2.5万亿元 [46] - 数字化转型:科技投入占比预计提升至4%以上,“智慧小苏”将在更多场景落地 [46] - 综合化经营:苏银理财管理规模有望突破1.2万亿元,苏银金租资产规模突破2000亿元 [46]
互联网大厂抢人,年薪最高128万
21世纪经济报道· 2026-02-06 22:52
行业AI人才竞争态势 - 互联网大厂正以高薪争夺AI领域各类型人才,例如元宝用户运营、活动运营岗位年薪超过75万元,豆包AI产品经理岗位年薪达60万元,豆包AI应用工程师岗位年薪接近100万元,千问App用户增长算法工程师岗位年薪最高可达128万元,千问App用户增长岗位年薪最高可达112万元 [1] - 行业顶级人才争夺战从高校延伸至海外,公司通过设立高额奖学金“预定”校园苗子及延揽成名科学家等组合拳构筑人才高地 [1] - 整个行业最大的痛点在于人才稀缺,尤其是指能在大模型底层架构或多模态前沿领域实现突破的顶尖人才,在全球范围内都属极少数 [4] 公司人才战略与投入 - 公司推出“青云计划”及“青云奖学金”,面向全球顶尖技术学子,对标行业竞争对手的人才计划 [1] - “青云奖学金”首期为15位在校硕博生提供每人总价值50万元的高额激励,包括20万元现金及价值30万元的云异构算力资源,获奖者来自计算机科学、人工智能及其交叉领域 [2] - 除物质支持外,公司还为获奖者搭建产学研交流平台,包括参与校企合作、技术开放日等活动,并提供企业导师指导,旨在连接学术理想与工程落地 [2] - 该奖学金旨在支持开放式创新而非绑定式资助,获奖学生不被强制要求入职公司,以扩大行业人才池为目标 [4] - 公司在AI领域的研发投入持续加大,2025年第三季度研发支出达228.2亿元,创下单季度历史新高,2025年前三季度累计研发开支达619.83亿元 [4] 公司高端人才引进 - 公司在加速招募成熟期顶尖人才,例如前新加坡Sea AI Lab高级研究科学家庞天宇已加盟,担任公司混元首席研究科学家和多模态强化学习技术负责人 [5] - 公司最受关注的人才引进是知名AI科学家、前OpenAI研究员姚顺雨,其于2025年12月加盟,出任首席AI科学家并兼任AI Infra部、大语言模型部负责人 [5] - 姚顺雨带领团队发布了加入公司后的首份研究成果,公司通过分享前沿研究增强其在AI领域的学术影响力与技术透明度 [6] 公司技术展示与影响 - 公司混元官网技术博客上线并发布深度技术文章,系统介绍其团队与复旦大学的最新联合研究成果 [6] - 此举不仅是技术博客的首次公开亮相,也体现了公司在AI前沿领域的技术能力 [6]
金智维拟港股上市 中国证监会要求补充说明股权变动等事项
智通财经· 2026-02-06 20:42
中国证监会问询要点 - 关于股权变动:要求补充说明历次增资及股权转让的价格与定价依据、实缴出资情况、是否存在出资瑕疵或股份代持情形,以及2025年12月激励授予备案变更的办理进展 [1] - 关于股东情况:要求说明实际控制人是否拥有永久境外居留权、股东金石众成的合伙人变更与迁址工商手续进展、以及股东银河源汇和珠海正菱的国有股东标识办理进展 [1] - 关于合规与发行:要求说明合成类算法备案申请进展、本次发行股份拆细的具体计划及其对发行数量的影响,以及拟参与“全流通”股东所持股份是否存在质押或冻结等权利瑕疵 [2] 公司业务与市场地位 - 公司定位与产品:金智维是一家专注于提供AI数字员工及企业级智能体解决方案的AI企业,通过融合AI算法、大语言模型和RPA技术,助力企业数智化转型 [2] - 市场领先地位:按市场份额计,公司于2022年至2024年连续三年在中国AI数字员工解决方案市场排名第一,其中在金融服务领域市场份额连续三年稳居第一 [3] - 客户与部署规模:截至2025年6月30日,公司已部署超过180万名AI数字员工,累计服务超过1,300家优质客户,覆盖金融服务、政务、制造业等十余个行业 [3]
新股消息 | 金智维拟港股上市 中国证监会要求补充说明股权变动等事项
智通财经网· 2026-02-06 20:34
公司上市进程与监管问询 - 公司向港交所主板递交上市申请 联席保荐人为国泰君安融资有限公司及中银国际亚洲有限公司[1] - 中国证监会国际司对公司出具上市备案补充材料要求 要求其就股权变动、股东情况等事项进行说明[1] - 监管要求补充说明的具体事项包括:历次增资及股权转让的定价与出资情况、历史沿革中是否存在股份代持、2025年12月激励授予备案变更进展[1] - 监管要求补充说明的具体事项包括:实际控制人境外居留权情况、金石众成合伙人变更等工商手续进展、银河源汇等国有股东标识办理进展[1] - 监管要求补充说明的具体事项包括:合成类算法备案申请进展、本次发行股份拆细计划及其对发行数量的影响、拟参与“全流通”股东所持股份的权利限制情况[2] - 监管要求公司结合报告期主要客户和供应商、产品功能、定价依据及具体应用场景、收入规模与行业地位的匹配性等 进一步说明业务经营模式和核心竞争力[2] 公司业务与市场地位 - 公司是一家专注于提供人工智能数字员工解决方案及企业级智能体解决方案的AI企业[2] - 公司通过自主研发的AI解决方案助力企业数智化转型 核心技术为AI算法、大语言模型和机器人流程自动化与行业场景的深度融合[2] - 按市场份额计 公司于2022年至2024年连续三年在中国AI数字员工解决方案市场蝉联榜首[3] - 于整个往绩记录期间 公司在此市场服务的大中型企业数量位居市场首位[3] - 公司在金融服务领域的市场领先地位显著 自2022年至2024年连续三年市场份额稳居第一[3] - 截至2025年6月30日 根据授予客户的授权数量计 公司已部署超过180万名AI数字员工[3] - 公司的AI数字员工涉足金融服务、政务、制造业等十余个行业 累计服务超过1,300家优质客户[3]