开源模型
搜索文档
金融大家评 | 中国农业银行董事长、党委书记 谷澍:提升AI应用普惠性的若干思考
清华金融评论· 2025-12-18 17:46
文章核心观点 - 金融业应主动融入国家“人工智能+”行动,通过平衡开源与闭源模型、协同决策式与生成式AI、优化算力供给与保障安全性等多维路径,提升人工智能应用的普惠性,推动技术与业务深度融合,最终提升金融服务质效和内部管理效能 [3][4][5][8][9] 开源模型与闭源模型 - 开源模型意味着技术平权和自主可控,通过分布式协同创新降低企业应用成本,提升AI普惠性,但存在模型迭代速度较慢、幻觉率较高的特点 [4] - 闭源模型在稳定性和可靠性上相对更高,同等参数规模下性能可能更优,服务支持更成熟,但自主定制化程度受限且模型透明度较低 [4] - 金融业应重点考虑“AI+”应用而非自建大模型,融合开源与闭源优势,围绕场景建设提升服务质效和管理效能 [4] - 以农业银行为例,采取“两条腿走路”策略:在普惠服务、办公等领域加快探索应用开源模型以提高普及率;同时通过本地化部署闭源模型,在客户服务、知识优化推荐等场景确保数据隐私和极致体验 [4] 决策式AI与生成式AI - 决策式AI擅长“确定性优化”,在强可解释性和准确性要求高的场景中仍是最优选择,目前金融业应用占比超过八成,主导风险评估、算法交易和欺诈检测等核心业务领域 [5] - 生成式AI擅长“可能性涌现”,在开放式和创意性场景中泛化能力更好,主要应用于智能客服、知识助手、报告撰写等非核心业务领域 [5] - 随着大模型能力增强、生态完善和算力突破,生成式AI应用可能实现指数级增长,并与决策式AI协同,形成以智能体为主的通用范式,二者边界趋于模糊 [5] - 多智能体配合的“双AI”编排协作模式能更好实现AI能力普惠化,例如在客户营销中,用决策式AI构建客户画像,用生成式AI形成个性化服务方案,提升服务精准性和获得感 [5] AI普惠与算力供给 - AI普惠性提升导致数据处理规模和复杂度指数级增长,数据中心计算量膨胀速度将远大于CPU处理效率进化速度,AI大规模应用意味着进入加速计算时代 [7] - GPU凭借强大并行计算能力能高效应对计算密集型任务,未来通用计算将退化为“控制平面”,高时效高计算负载场景由专用加速计算实现 [7] - AI加速普及过程中,GPU算力需求与供给将始终处于“紧平衡”状态,从绿色发展角度看这种平衡是必要的 [8] - 需从存量挖潜和增量扩容两端发力平衡矛盾:一方面通过算力灵活调度、参数合理匹配、模型压缩加速等工程化手段降低运行成本;另一方面加快建设支持AI高性能计算的智算中心 [8] - 以农业银行为例,依托“农银智+”平台构建参数多样、能力丰富的模型矩阵,通过模型蒸馏、微调等手段精细化匹配业务并充分利用GPU资源,同时建设支持多类型GPU组合的算力云平台,保障AI算力弹性、韧性和可持续供给 [8] 普惠性与安全性 - 提升AI应用普惠性同时必须高度重视安全性,需强化AI稳定性以保障大众利益,未来AI将成为数字世界“基础设施”,需建立模型安全护栏、主动防御等技术手段应对提示词注入、资源消耗攻击等风险,保障AI稳定运行和业务连续性 [9] - 需提升数据质量以增强模型可信度,在AI广泛应用背景下,数据来源更丰富、结构更复杂,数据倾斜、数据投毒等问题会加剧模型决策偏差,引发公众信任危机,需建立全生命周期模型评测和监控体系,加强算法公平性约束,提升模型稳定性和可解释性 [9] - 需避免模型共振以防范系统性风险,随着竞争加剧,市场主流大模型集中度会越来越高,商业银行依赖的模型算法逐步趋同,局部缺陷可能形成机构间模型共振并引发系统性风险,需加快构建更可靠知识体系,开展差异化模型训练,提升金融系统整体韧性 [9]
在这个开源「从夯到拉」榜单,我终于明白中国 AI 为什么能逆袭
新浪财经· 2025-12-17 22:25
文章核心观点 中国开源大模型在2024年至2025年间实现了全球范围内的领导地位,以DeepSeek、Qwen、Kimi、智谱和MiniMax为代表的国产模型,在性能、价格、生态和可用性等维度上快速逼近甚至超越闭源巨头,正在改变全球AI行业的格局和运行规则 [3][5][116] 全球开源模型排名与格局演变 - 根据AI研究员Nathan Lambert等人的排名,全球开源模型前五名均为中国公司:DeepSeek、Qwen、Kimi、智谱和MiniMax,而OpenAI仅位列第四梯队,Meta的Llama仅获荣誉提名 [3][114] - 2024年曾是Llama主导的天下,但到2025年,国产开源模型已成为全球开发者的默认选择,持续刷新行业选项 [5][116] - 在Hugging Face的热门模型趋势榜上,前四名均为国产开源模型 [86][89] 主要中国开源模型厂商及其技术亮点 - **DeepSeek**:通过混合注意力等机制显著降低成本,打开了高效推理的突破口 [29][98] - **Qwen(阿里巴巴)**:凭借庞大的生态规模,覆盖从4800亿参数到6亿参数的各种尺寸模型,以及视觉语言、代码编写等多领域,几乎渗透整个开源市场 [23][131] - **Kimi(Moonshot AI)**:2025年11月发布万亿参数的混合专家模型Kimi K2 Thinking,采用交错思考技术,一次性能执行300次工具调用,在多个榜单上超越GPT-5和Claude 4.5 [11][122][135] - **MiniMax**:2025年10月底发布MiniMax M2混合专家模型,在综合榜单排名第五,超越Gemini 2.5 Pro和Claude Opus 4.1,其API定价为每百万输入/输出token 0.3美元/1.2美元 [14][124][127][185] - **智谱(Zhipu AI)**:发布GLM系列模型,如GLM-4.5和GLM-4.6,丰富了国产开源生态 [9][10][120] 国产开源模型的竞争优势与市场反馈 - **性能与成本**:国产模型在保持高性能的同时,具备极具竞争力的价格,例如MiniMax M2的价格仅为Anthropic Sonnet模型的1/12 [127][185] - **开发者认可**:海外社交媒体上广泛认可国产模型“好用、便宜”,成为小公司和副业项目的开发首选 [14][124] - **企业应用**:爱彼迎CEO公开表示,中国的开源模型Qwen比OpenAI更适合其实际工作,且更便宜 [25][134] - **具体能力展示**:实测显示,MiniMax M2能一次性生成功能齐全的棋类应用或网站,在处理包含20714个岗位、大小10MB的Excel数据时也表现出色 [16][18][30][35][138][141] 技术路径选择:全注意力与高效注意力之争 - MiniMax M2选择了传统的“全注意力机制”,而非当前流行的稀疏或高效注意力机制,主要原因是全注意力在工业级系统中的性能和可靠性仍然更高 [38][75][144][181] - 高效注意力机制(如线性、稀疏注意力)的核心目标是节省有限的计算资源,但其在复杂推理任务中可能存在隐藏缺陷,且相关基础设施尚不成熟 [41][44][57][147][150][163] - 随着上下文长度需求增长和GPU算力增速放缓,高效注意力的优势未来可能显现,但当前阶段,在质量、速度、价格三角中寻求平衡是关键 [62][75][168][181] 国产开源崛起的驱动因素与行业影响 - **内部竞争与算力限制**:国内模型厂商众多、竞争激烈,且面临算力紧张、芯片受限的困境,开源成为共享算力、避免重复建设、吸引开发者的有效策略 [93] - **构建完整生态**:各厂商通过不同的技术路线(如DeepSeek的成本控制、Qwen的生态规模、MiniMax的智能体能力)共同构建了一个庞大而完整的开源系统,形成了合力 [29][84][97][98] - **改变全球格局**:国产开源模型已成为全球AI生态的底座,全球小团队使用Qwen微调、用DeepSeek做推理基座、用MiniMax做智能体验证已成为常态,导致全球开源生态中心向中国倾斜 [98][109] - **数据佐证**:a16z数据显示,国产开源模型的累计下载量已超过美国模型,且领先优势持续扩大;斯坦福大学2025年AI指数报告也预示国产开源性能将超过闭源和美国模型 [95][97]
小米天才少女罗福莉首秀,称小米开源模型全球前二
金融界· 2025-12-17 10:57
责任编辑:栎树 财经频道更多独家策划、专家专栏,免费查阅>> 2025 小米人车家全生态合作伙伴大会于今日举行,罗福莉首次登场,并称"(小米开源模型的)代码能 力和agent能力,在世界级非常公开公正的评估榜单上,在我来看它已经进入了全球top1 2"。 ...
英伟达成开源新王?Nemotron 3全新混合专家架构,推理效率升4倍
机器之心· 2025-12-16 16:55
英伟达发布Nemotron 3系列开放模型 - 公司发布了Nemotron 3系列开放模型,包含Nano、Super和Ultra三种规模,旨在应对企业从单一模型转向多智能体AI系统时面临的挑战 [2][7][8] - 该系列模型的核心目标是提供构建专业级智能体AI所需的性能与开放性,创始人黄仁勋强调开放式创新是AI进步的基石 [8] - Nemotron 3 Nano(30B-3A)模型已于发布日上线,而Super和Ultra型号预计将于2026年上半年正式推出 [8] 各型号模型规格与定位 - **Nemotron 3 Nano**:总参数316亿,激活参数32亿(含嵌入层为36亿),针对软件调试、内容摘要等任务优化,是计算成本效率最高的模型 [3][5] - **Nemotron 3 Super**:参数规模约1000亿,每个token最多激活100亿参数,擅长需要大量协作智能体且对低延迟要求极高的复杂任务 [4][5] - **Nemotron 3 Ultra**:参数规模约5000亿,每个token最多激活500亿参数,作为高级推理引擎,适用于深度研究与战略规划等高复杂度AI工作流 [4][5] Nano型号的性能提升与优势 - 与上代Nemotron 2 Nano相比,Nemotron 3 Nano实现了最高4倍的Token吞吐量提升,并将推理阶段生成的Token数量减少最高60% [3] - 其激活的参数数量不到上代的一半,却实现了更高的准确率,并具备100万Token的上下文窗口以增强长期记忆能力 [3] - 在单张H200、8K输入/16K输出配置下,其推理吞吐量是Qwen3-30B-A3B的3.3倍,是GPT-OSS-20B的2.2倍 [28] 核心技术:混合MoE与架构创新 - 系列模型采用Mamba-Transformer混合MoE架构,大量采用MoE层与成本更低的Mamba-2层交替堆叠,避免了传统自注意力层KV Cache线性增长的成本 [12] - 引入了LatentMoE架构,先将token投影到更小的潜在维度进行专家路由和计算,以减少专家权重加载和通信成本,并增加专家数量 [16] - 采用了多Token预测技术,一次预测多个未来token以提升准确率和推理效率,该技术仅引入极少量额外FLOPs并能带来可观的推测解码加速收益 [18][19] 训练与精度格式创新 - 公司在NVFP4数值格式下,成功实现了在Mamba-MoE混合架构上对最高25万亿tokens的稳定高精度预训练 [21] - 在GB300芯片上,FP4的峰值吞吐量是FP8的3倍,这使得在现有基础设施上训练更大规模模型成为可能 [21][37] - 模型权重、激活值和梯度均被量化为NVFP4,使得前向传播、反向传播中的梯度计算和权重更新都可以使用NVFP4 GEMM运算 [21] 超长上下文与实用能力增强 - 系列模型支持最长100万token的上下文长度,以满足大规模、多轮、具备Agentic推理的应用需求 [22] - 通过使用Mamba层天然的隐式位置信息,在注意力层中完全不使用旋转位置编码,从而避免了RoPE带来的上下文扩展限制 [22] - 引入了多环境强化学习后训练,以及推理阶段精细化推理预算控制,增强了模型在真实世界应用中的可靠性、灵活性与泛化表现 [23] 模型性能表现 - 在覆盖多个类别的主流基准测试中,Nemotron 3 Nano-30B-A3B的准确率优于GPT-OSS-20B和Qwen3-30B-A3B-Thinking-2507 [27] - 在不同上下文长度下的RULER基准测试中,其性能均优于GPT-OSS-20B和Qwen3-30B-A3B-Instruct-2507 [29] - 独立AI基准评测机构Artificial Analysis将其评为同规模模型中最开放、最高效的模型之一,并具备领先的准确率 [30] 开放生态与配套工具 - 公司不仅开源了模型,还发布了训练数据、强化学习环境和训练代码,斯坦福大学教授认为这能让用户创建自己的模型,意义重大 [6][31] - 同步发布了囊括3万亿Token的全新预训练、后训练及强化学习数据集,以及Nemotron智能体安全数据集,用于打造专业化领域智能体 [39] - 开源了NeMo Gym与NeMo RL库,并推出NeMo Evaluator,所有工具和数据集已在GitHub和Hugging Face上开放 [41] - 该系列模型已获得LM Studio、llama.cpp、SGLang和vLLM等项目的支持 [41]
英伟达发布Nemotron 3开源模型系列
美股IPO· 2025-12-16 08:26
英伟达周一发布最新版开源人工智能模型系列Nemotron 3,并同步推出配套数据与工具,旨在为各行业提供透 明、高效、可定制的智能体AI开发能力。Nemotron3包含Nano、Super和Ultra三个版本,引入突破性的混合 潜在专家混合(latent MoE)架构,显著提升推理效率并降低运行成本。周一,英伟达股价开盘上涨近1.7%。 英伟达周一发布最新版系列开源人工智能模型"Nemotron",以及配套的数据和库,旨在为各行各业提供透明、 高效、可定制的智能体AI(agentic AI)开发能力。该公司表示,这一新模型家族在速度、成本和智能水平方面 都将优于此前的产品。 Nemotron 3模型系列包括Nano、Super和Ultra三个版本,引入了一项突破性的混合潜在专家混合(latent Mixture-of-Experts,MoE)架构,帮助开发者以规模化方式构建和部署可靠的多智能体系统。 该公司表示,周一已经上线的Nemotron 3 Nano相比上一代产品效率更高,即运行成本更低,同时在处理包含多 个步骤的长任务时表现更好。另外两款体量更大的版本预计将在2026年上半年推出。 在Artifici ...
美股三大指数集体高开
第一财经· 2025-12-15 22:49
12月15日,美股三大指数集体高开,道指涨0.33%,纳指涨0.60%,标普500指数涨0.45%。 | 名称 | 肌价 | 涨跌 | 涨跌幅 | | --- | --- | --- | --- | | 道琼斯工业平均 | 48618.09 c | 160.04 | 0.33% | | 纳斯达克指数 | 23333.72c | 138.55 | 0.60% | | 标普500 | 6858.23 c | 30.82 | 0.45% | 热门中概股多数下跌,纳斯达克中国金龙指数跌0.5%,百度跌超2%,阿里巴巴、理想汽车跌超1%。 特斯拉涨超2%,公司副总裁陶琳在微博发文确认称,在美国得州奥斯汀,取消了安全员的特斯拉无人驾驶网约车正进行测试。 英伟达涨超1%,公司发 布Nemotron 3系列开源模型。 扫地机器人制造商iRobot跌近70%,盘初触发熔断。公司申请破产并将被其代工制造商Picea Robotics收购。 | < ロ | IROBOT | | | --- | --- | --- | | | IRBT.O | | | | 1 320 量4365万 股本 3183万 市盈™ -0.20 万得 | | ...
英伟达发布Nemotron 3开源模型系列
华尔街见闻· 2025-12-15 22:03
风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何 意见、观点或结论是否符合其特定状况。据此投资,责任自负。 英伟达发布Nemotron 3开源模型系列。 ...
打破霸主神话,中国AI横扫美国硅谷
新浪财经· 2025-12-15 01:21
事件概述 - Meta公司被曝在研发其闭源大模型“牛油果”时,使用了阿里巴巴集团的开源大模型“通义千问”进行训练,且未事先与阿里沟通或获取授权[1][4] - 该事件因Meta公司此前在开源与知识产权问题上的公开立场,以及其高管强调美国AI领先的言论,而显得极具戏剧性和讽刺意味[1][4] Meta公司的行为与困境 - Meta公司被指行为存在“双标”:公开倡导开源、自由分享并批评闭源阻碍创新,但自身却使用中国开源模型来训练其闭源收费产品“牛油果”[4] - 这一行为暴露了Meta在AI战略上的实际困境:尽管投入巨额资金(如Llama 4砸了几百亿)和算力,但在技术落地和生态支撑上面临挑战[4][13] - 公司内部发生权力交替,AI奠基人、图灵奖得主杨立坤离开,28岁的亚历山大王空降成为首席AI官并掌握实权,这一变动为事件增添了象征意义[5] 阿里巴巴通义千问的实力与表现 - 通义千问是全球领先的开源大模型,累计下载量已突破7亿次,其衍生模型数量在2024年8月超越Llama,下载量于2025年10月完成反超[4][8] - 模型性能强劲:Qwen3-30B版本在MMLU-Redux知识测试中得分91.4,在MMLU-Pro中得分80.9,在编程、多模态理解等场景错误率低于Llama 4[6] - 具备“芯片-云-模型”全栈能力:底层有自研含光800芯片,中层有阿里云提供算力,上层有全系列模型,带来显著的降维打击成本优势[6] - 应用落地能力强大:已被新加坡政府选用,亚马逊用于操控人形机器人,Airbnb用于推荐算法,其APP公测23天月活即破3000万[8][14] - 阿里云AI相关收入已连续九个季度实现三位数增长,市场份额超过第二到四名总和[7] 行业格局与趋势变化 - 全球AI竞争格局生变:开源世界的中心发生位移,中国AI从“跟跑者”转变为“规则制定者”[9][15] - 中国AI选择了“开源+应用”的路径,通过全球开发者社区优化和真实场景驱动快速迭代,这与美国公司主要依赖“闭源”和堆算力烧钱的模式形成对比[9][13][15] - 英伟达CEO黄仁勋指出,中国在开源领域遥遥领先,阿里通义千问已占据开源模型大部分市场份额并“断层领先”[10] - 通义千问正被新加坡、巴西、阿联酋等国视为“AI基础设施”,硅谷创业公司也多有使用其进行原型开发[15] - 市场反应积极:阿里巴巴股价一年内上涨93%,在Meta“偷师”消息传出后,阿里盘前股价直接上涨4%[15]
AI赛道竞争多维深化,生态应用格局加速演进
华金证券· 2025-12-12 16:18
报告行业投资评级 - 行业投资评级为“领先大市”,且评级为“维持” [4] 报告核心观点 - 核心观点认为AI赛道竞争正向多维度深化,生态应用格局正在加速演进 [2] - AI创作与推理应用已进入高速增长期,编程与角色扮演成为核心使用场景,中国开源模型崛起正带动多模态、端侧AI及智能体(Agent)等技术向产业化落地演进 [7] AI创作赛道市场表现 - 2025年11月,AI创作Web端产品总访问量超过2700万,总独立访客数超过770万 [7] - 头部产品优势明显,即梦AI和稿定AI的web端活跃用户超过百万 [7] - 部分产品增长迅猛,可灵AI的月活跃用户相比10月增长超50%,即梦AI新增下载量环比翻倍并重新突破千万,Canva可画、可灵AI等下载增速超100% [7] - 用户使用深度显著,多款产品平均使用时长达8分钟以上,其中Kuaizi平均访问时长近26分钟,度加创作工具达22.3分钟 [7] - 在AI视频生成细分赛道,共5款应用11月访问量超30万,包括即梦AI、可灵AI、Vidu AI等 [7] - APP端表现突出,美图秀秀平均日活跃用户近1800万,醒图、即梦AI分别超460万和超310万 [7] AI技术竞争与发展格局 - AI发展进入“大分流”阶段,竞争向多维度深化 [7] - 开源模型流量占比已达30%,成为特定场景的首要选择,其中中国开源模型占据全球开源模型流量近30% [7] - 推理优化模型主导,流量占比超50%,AI正从“生成文本”转向“思考问题” [7] - 主要使用场景为编程和角色扮演:编程类请求占比从2025年年初的11%飙升至50%以上;在开源领域,角色扮演占据开源模型流量的52% [7] - DeepSeek的流量中,超2/3为角色扮演和闲聊 [7] - 多模型生态格局逐渐清晰:闭源模型更多承担高价值、与收入强关联的工作负载;开源模型则更侧重于低成本、高并发的任务需求 [7] - 竞争已由单纯的技术竞赛转向关于场景适配、成本控制与生态构建的综合竞争 [7] AI应用扩展与技术趋势 - Agent(智能体)正在成为下一代AI范式,具备感知-规划-执行闭环能力,开发门槛因代码生成与框架支持而降低 [7] - 多模态融合逐步成熟,支持文本、图像、视频一体化生成,提升3D、视频等内容生产效率 [7] - 端侧AI生态快速发展,设备本地化部署兼顾低延迟与隐私保护 [7] - 整体趋势指向服务主动化、交互自然化与软硬件协同,推动AI从效率工具向智能伙伴演进 [7] - 中国正从AI领域的参与者向引领者转变:全球平台Hugging Face上,智源研究院和阿里巴巴的开源模型下载量分别达7.90亿次和7.49亿次 [7] - 应用层面,DeepSeek用户数已突破1亿,通义千问成为重要的开源基座模型 [7] 投资建议 - 建议关注蓝色光标、昆仑万维、天娱数科、因赛集团、视觉中国、汇量科技等公司 [7]
阿里千问成全球开源模型“新标杆”,Meta新项目被曝蒸馏千问
新浪财经· 2025-12-11 20:59
Meta新模型“牛油果”动态 - Meta计划于明年春季推出代号为“牛油果”的新模型项目 该模型很可能以闭源形式发布[1] - “牛油果”模型的训练蒸馏了多方开源模型 包括谷歌的Gemma、OpenAI的gpt-oss以及阿里巴巴的通义千问[1] - Meta CEO马克·扎克伯格密切关注新组建的TBD实验室团队 其态度发生转变 从呼吁支持美国模型转向采用阿里千问[2] 阿里巴巴通义千问的全球影响力与市场表现 - 通义千问Qwen模型在2024年8月衍生模型数首次超越Meta的Llama 并在2025年10月全球下载量实现超越 取代Llama成为全球第一的开源模型[2] - Qwen3-Max旗舰模型性能超过GPT5、Claude Opus 4等国际竞争者 跻身全球前三[3] - 消息传出后 阿里巴巴美股于12月10日上涨1.83% 收于每股158.82美元 总市值达3790亿美元 今年以来股价已涨超90%[2] 通义千问的广泛生态应用 - 亚马逊、Airbnb等公司使用Qwen发展新业务 英伟达、微软、Meta等科技企业基于Qwen开发衍生模型[3] - 斯坦福李飞飞团队、硅谷独角兽Thinking Machines Lab、艾伦AI研究所等机构基于Qwen进行前沿技术创新[3] - 来自韩国、泰国、越南、日本、阿联酋、巴西等全球的公司和开发者使用Qwen开发新模型、新技术和应用[6] - 新加坡国家人工智能计划放弃了Meta模型 转向通义千问Qwen开源架构[6] 阿里巴巴的AI战略与业务进展 - 公司走出了一条完整的AI发展之路 涵盖基模迭代引领、全栈布局加速、生态协同放大[6] - 最新一季财报显示 云计算季度营收同比增长34%至398.24亿元 AI相关产品收入已连续九个季度实现三位数同比增幅[6] - 公司于今年2月宣布投入3800亿元用于AI基础设施建设 并设定了到2032年将云数据中心能耗规模扩大十倍的长期目标[6] - 千问APP自11月17日公测仅23天 月活跃用户数已突破3000万 成为全球增长最快的AI应用 上线一周下载量便突破1000万[6]