大语言模型 - 财报，业绩电话会，研报，新闻 - Reportify

大语言模型

搜索文档

腾讯大模型团队架构调整前OpenAI研究员姚顺雨任要职

第一财经· 2025-12-17 17:01

腾讯并未披露Vinces Yao的中文名或过往履历。不过，记者了解到，Vinces Yao即为数月前入职腾讯的姚顺雨，他毕业于清华和普林斯顿大学，曾任OpenAI研究员，是OpenAI首批智能体产品Operator与 Deep Research的核心贡献者。据36氪，腾讯近期完成了一次组织调整，正式新成立AI Infra部、AI Data部、数据计算平台部。12月17 日下午发布的内部公告中，腾讯表示，Vinces Yao将出任"CEO/总裁办公室"首席AI科学家，向腾讯总裁刘炽平汇报；他同时兼任AI Infra部、大语言模型部负责人，向技术工程事业群总裁卢山汇报。（文章来源：第一财经） ...

腾讯控股(HK:00700)

大语言模型

大语言模型

L3自动驾驶量产元年，离L4的梦想又近了一步

36氪· 2025-12-17 16:43

L3迎来规模化曙光今年4月的上海车展，华为联合赛力斯、阿维塔、奇瑞汽车、北汽新能源、岚图汽车、江汽集团、上汽集团、广汽集团等11家车企，在央视直播镜头前谈起了L3，这些车企基本囊括了中国汽车行业的四大央企和新势力代表，堪称中国新能源汽车行业的"半壁江山"。行业普遍认为，L3级是从"辅助驾驶"到"完全自动驾驶"的重要过渡，后续的L4级自动驾驶将实现更大突破——在固定区域内，车辆可完全脱离人类干预，真正实现无人驾驶。这一小步，背后是全球十年的技术博弈。德国早在2021年就通过《自动驾驶法》，明确L3系统激活期间事故责任由车企承担，并要求车辆配备"黑匣子"记录运行数据。奔驰Drive Pilot系统随后在德国高速公路上线，成为全球首个商业化的L3产品。相比之下，中国此次准入虽起步稍晚，却一步切入责任核心，未走"测试"老路，而是直接启动附条件商业化运营。但现实挑战在于人机共驾的信任建立——系统何时退出？驾驶员能否及时接管？未来交通治理将重新定义机器守规与责任切割的边界。近日，工信部首次批准L3级自动驾驶商业化运营，通过L3级自动驾驶准入申请的两款车型为长安深蓝SL03与极狐阿尔法S6，标志着我国首次 ...

端到端技术

大语言模型

L3级自动驾驶

端到端技术

大语言模型

L3级自动驾驶

罗福莉首秀前，小米突然发布，代码全球最强，总体媲美DeepSeek-V3.2【附实测】

36氪· 2025-12-17 10:51

智东西12月17日报道，今天，小米发布并开源了最新MoE大模型MiMo-V2-Flash，总参数309B，激活参数15B。今日上午，小米2025小米人车家全生态合作伙伴大会上，Xiaomi MiMO大模型负责人罗福莉将首秀并发布主题演讲。该模型专为推理、编码和Agent场景构建，支持混合思维模式，允许用户切换模型是"思考"还是即时回答。它能一键生成功能齐全的HTML网页，并与 Claude Code、Cursor和Cline等氛围编码框架协同。该模型提供256k上下文窗口，能够完成数百轮Agent交互和工具调用的任务。基准测试结果显示，MiMo-V2-Flash的性能基本与DeepSeek-V3.2相当，仅在不使用任何工具辅助的"人类最后一场考试"和创意文本生成评估ARENA- HARD中略逊色于DeepSeek-V3.2，但时延更小。在多个Agent测评基准上，MiMo-V2-Flash位列全球开源模型Top 2；代码能力测评超过所有开源模型，比肩标杆闭源模型Claude 4.5 Sonnet，但推理价格仅为其2.5%且生成速度提升至2倍。 MiMo-V2-Flash能以每秒150个token的速 ...

大语言模型

多词元预测（MTP）

多教师在线策略蒸馏（MOPD）

大语言模型

多词元预测（MTP）

多教师在线策略蒸馏（MOPD）

英伟达成开源新王？Nemotron 3全新混合专家架构，推理效率升4倍

机器之心· 2025-12-16 16:55

英伟达发布Nemotron 3系列开放模型 - 公司发布了Nemotron 3系列开放模型，包含Nano、Super和Ultra三种规模，旨在应对企业从单一模型转向多智能体AI系统时面临的挑战 [2][7][8] - 该系列模型的核心目标是提供构建专业级智能体AI所需的性能与开放性，创始人黄仁勋强调开放式创新是AI进步的基石 [8] - Nemotron 3 Nano（30B-3A）模型已于发布日上线，而Super和Ultra型号预计将于2026年上半年正式推出 [8] 各型号模型规格与定位 - **Nemotron 3 Nano**：总参数316亿，激活参数32亿（含嵌入层为36亿），针对软件调试、内容摘要等任务优化，是计算成本效率最高的模型 [3][5] - **Nemotron 3 Super**：参数规模约1000亿，每个token最多激活100亿参数，擅长需要大量协作智能体且对低延迟要求极高的复杂任务 [4][5] - **Nemotron 3 Ultra**：参数规模约5000亿，每个token最多激活500亿参数，作为高级推理引擎，适用于深度研究与战略规划等高复杂度AI工作流 [4][5] Nano型号的性能提升与优势 - 与上代Nemotron 2 Nano相比，Nemotron 3 Nano实现了最高4倍的Token吞吐量提升，并将推理阶段生成的Token数量减少最高60% [3] - 其激活的参数数量不到上代的一半，却实现了更高的准确率，并具备100万Token的上下文窗口以增强长期记忆能力 [3] - 在单张H200、8K输入/16K输出配置下，其推理吞吐量是Qwen3-30B-A3B的3.3倍，是GPT-OSS-20B的2.2倍 [28] 核心技术：混合MoE与架构创新 - 系列模型采用Mamba-Transformer混合MoE架构，大量采用MoE层与成本更低的Mamba-2层交替堆叠，避免了传统自注意力层KV Cache线性增长的成本 [12] - 引入了LatentMoE架构，先将token投影到更小的潜在维度进行专家路由和计算，以减少专家权重加载和通信成本，并增加专家数量 [16] - 采用了多Token预测技术，一次预测多个未来token以提升准确率和推理效率，该技术仅引入极少量额外FLOPs并能带来可观的推测解码加速收益 [18][19] 训练与精度格式创新 - 公司在NVFP4数值格式下，成功实现了在Mamba-MoE混合架构上对最高25万亿tokens的稳定高精度预训练 [21] - 在GB300芯片上，FP4的峰值吞吐量是FP8的3倍，这使得在现有基础设施上训练更大规模模型成为可能 [21][37] - 模型权重、激活值和梯度均被量化为NVFP4，使得前向传播、反向传播中的梯度计算和权重更新都可以使用NVFP4 GEMM运算 [21] 超长上下文与实用能力增强 - 系列模型支持最长100万token的上下文长度，以满足大规模、多轮、具备Agentic推理的应用需求 [22] - 通过使用Mamba层天然的隐式位置信息，在注意力层中完全不使用旋转位置编码，从而避免了RoPE带来的上下文扩展限制 [22] - 引入了多环境强化学习后训练，以及推理阶段精细化推理预算控制，增强了模型在真实世界应用中的可靠性、灵活性与泛化表现 [23] 模型性能表现 - 在覆盖多个类别的主流基准测试中，Nemotron 3 Nano-30B-A3B的准确率优于GPT-OSS-20B和Qwen3-30B-A3B-Thinking-2507 [27] - 在不同上下文长度下的RULER基准测试中，其性能均优于GPT-OSS-20B和Qwen3-30B-A3B-Instruct-2507 [29] - 独立AI基准评测机构Artificial Analysis将其评为同规模模型中最开放、最高效的模型之一，并具备领先的准确率 [30] 开放生态与配套工具 - 公司不仅开源了模型，还发布了训练数据、强化学习环境和训练代码，斯坦福大学教授认为这能让用户创建自己的模型，意义重大 [6][31] - 同步发布了囊括3万亿Token的全新预训练、后训练及强化学习数据集，以及Nemotron智能体安全数据集，用于打造专业化领域智能体 [39] - 开源了NeMo Gym与NeMo RL库，并推出NeMo Evaluator，所有工具和数据集已在GitHub和Hugging Face上开放 [41] - 该系列模型已获得LM Studio、llama.cpp、SGLang和vLLM等项目的支持 [41]

英伟达(US:NVDA)

大语言模型

Nemotron 3系列开放模型

大语言模型

Nemotron 3系列开放模型

计算机行业周报：MistraiAI发布Devstral2系列，GPT-5.2定义专家级智能-20251216

华鑫证券· 2025-12-16 15:36

报告行业投资评级 - 行业评级为“推荐(维持)” [1] 报告核心观点 - 报告持续看好AI算力板块，认为其业绩增长具备坚实支撑，行业呈现高景气度 [7][61] - 核心逻辑基于AI算力基础设施需求的刚性增长、持续的技术迭代以及谷歌与博通在TPU芯片领域的商业化推进 [7][61] 根据相关目录分别总结 1. 算力动态 - **Tokens消耗与市场份额**：报告期内（2025年12月8日至14日），周度token调用量为5.78T，环比下降6.6% [15]；市场份额前五名为：Google（20.5%）、OpenAI（19.9%）、xAI（15.5%）、Anthropic（12.9%）和Deepseek（8.1%）[16] - **算力租赁价格平稳**：上周主要云服务商的A100/A800显卡租赁价格保持稳定，例如腾讯云A100-40G配置价格为28.64元/时，阿里云同配置为31.58元/时，价格环比变化分别为+3.99%和0.00% [21][22] - **MistralAI发布Devstral2系列**：2025年12月10日，MistralAI发布专为编程设计的开源模型家族Devstral2，包含123B参数的旗舰版和24B参数的轻量版 [3][22]；该系列具备256K超长上下文窗口，在SWE-benchVerified基准测试中取得72.2的高分 [23]；同步推出的命令行工具MistralVibeCLI实现了自然语言与代码操作的直接映射 [3][25]；模型采用修改版MIT许可证，对全球合并月收入超过2000万美元的公司使用进行了限制 [27] 2. AI应用动态 - **AI应用流量跟踪**：在2025年12月5日至11日期间，AI相关网站中，Perplexity的平均停留时长环比增速最快，达+10.58% [32]；周访问量前三名为ChatGPT（1327.0M）、Bing（780.4M）和Gemini（391.7M）[34] - **OpenAI发布GPT-5.2系列**：2025年12月12日，OpenAI发布GPT-5.2系列模型，包括Instant、Thinking和Pro三个版本 [4][33]；该系列在多项基准测试中表现卓越：在SWE-BenchPro测试中得分为55.6%，在ARC-AGI-2评估中GPT-5.2Pro以52.9%位居榜首，在GDPval测试中其产出在70.9%的情况下优于或等同于人类专家 [35]；模型支持40万Token的上下文窗口，知识库更新至2025年8月31日 [39]；尽管输入输出Token价格较前代提高约40%，但因Token效率更高，整体性价比被认为更具优势 [41]；模型在编程（SWE-bench验证得分80%）、减少“幻觉”（错误回答比例降低约30%）及科学研究（GPQADiamond基准得分93.2%）方面均有显著提升 [41][42][47] 3. AI融资动向 - **Fal.ai完成大额融资**：2025年12月10日，多模态AI平台Fal.ai完成1.4亿美元D轮融资，公司估值达45亿美元 [4][48]；该平台提供超过600个AI模型，拥有超过200万开发者用户，截至2025年10月其年度经常性收入（ARR）已超过2亿美元 [49] 4. 行情复盘 - **指数表现**：上周（12月8日至12日），AI算力指数单日最大涨幅为2.28%，最大跌幅为-2.08%；AI应用指数单日最大涨幅为1.22%，最大跌幅为-1.93% [54] - **个股涨跌**：在AI算力指数内部，开普云以+21.30%录得最大涨幅，天源迪科以-14.01%录得最大跌幅 [54]；在AI应用指数内部，淳中科技以+13.90%录得最大涨幅，恒银科技以-13.62%录得最大跌幅 [54] 5. 投资建议 - **看好AI算力板块**：报告引述博通财报数据，其AI芯片销售额同比激增74%，累计未完成订单规模达730亿美元，并与谷歌合作的TPU产品能效比较前代提升六倍，认为这为AI算力板块注入强劲增长动能 [7][61] - **建议关注公司**：报告中长期建议关注四家公司：加快扩张算力业务的迈信林（688685.SH）、新能源业务高增的唯科科技（301196.SZ）、AI智能文字识别与商业大数据领域的合合信息（688615.SH）、深耕工业AI与软件的能科科技（603859.SH）[8][62]；报告给出了这四家公司的盈利预测与“买入”评级 [10][63]

大语言模型

Devstral2系列

谷歌TPUIronwood机架

大语言模型

Devstral2系列

谷歌TPUIronwood机架

2026年汽车智能化投资策略

2025-12-16 11:26

2026 年汽车智能化投资策略 20251215 摘要 2014-2017 年行业发散，2020-2022 年聚焦单车智能和 L2+技术，预控制器崭露头角。近三年硬件市场达峰值，硬件预埋逻辑估值下降，自动化行情未结束，特斯拉和小鹏引发市场争议。未来五年（2026-2030）产业将经历三个阶段：2025-2026 年为黎明前的黑暗期，电动化红利消退；2026-2028 年是投资最佳期，L4 技术在 B 端商业模式跑通；2028-2030 年则是 C 端市场重新爆发期。 L2 到 L4 发展过程中，行业从炒作硬件转向关注软件应用。硬件市场趋于饱和，自动化行情仍有结构性机会。未来五年投资策略应从电动化框架跳脱，注重 AI 应用，从上游硬件转向下游软件应用。无人驾驶汽车商业模式发展路径：2025-2026 年是投入期；2026- 2028 年 B 端商业模式跑通；2028-2030 年 C 端市场爆发。技术进步是核心驱动力，政策是辅助因素。电动化早期政策是主要驱动力，现在技术是首要驱动力。软件算法的重要性超过硬件。大语言模型对汽车行业产生深远影响，并应用于智能化车辆。 Q&A 智能汽车行业在过 ...

L4 自动驾驶

大语言模型

L4 自动驾驶

大语言模型

格林大华期货早盘提示-20251216

格林期货· 2025-12-16 08:01

报告行业投资评级未提及报告核心观点受外围市场利空影响，周一两市主要指数震荡调整，科创 50 指数跌幅较大；2026 年股市预计有增量资金，中国科技板块成全球资金布局 AI 新选择；摩根大通看好 2026 年中国股市；后市资金面承压，市场预期弱势运行，建议股指观望等待新机会，暂不参与股指看涨期权 [1][2][3] 各部分内容总结行情复盘 - 周一两市主要指数震荡调整，科创 50 指数跌幅较大，两市成交额 1.77 万亿元，下跌缩量；沪深 300 指数收 4552 点，跌 28 点，跌幅 -0.63%；上证 50 指数收 2987 点，跌 7 点，跌幅 -0.25%；中证 500 指数收 7113 点，跌 55 点，跌幅 -0.78%；中证 1000 指数收 7309 点，跌 61 点，跌幅 -0.84% [1] - 行业与主题 ETF 中涨幅居前的是卫星 ETF、航空航天 ETF 等，跌幅居前的是科创芯片设计 ETF、创新药 ETF 等；两市板块指数中涨幅居前的是林业、航天装备等，跌幅居前的是消费电子、医疗美容等 [1] - 中证 1000、中证 500、沪深 300、上证 50 指数股指期货沉淀资金分别净流出 52、40、34、1 亿元 [1] 重要资讯 - 11 月份，规模以上工业增加值同比实际增长 4.8%，环比增长 0.44%，1 - 11 月份同比增长 6.0%，41 个大类行业中有 30 个行业增加值同比增长 [1] - 证监会表示推动落实中长期资金长周期考核机制，发展权益类公募基金，推动指数化投资发展，启动创业板改革，加快科创板改革举措落地，研究推出新期货品种 [1] - 中泰证券称 2025 年股市实现 2.26 万亿净流入，2026 年保险、理财、养老金为增量资金，机构增量资金达 3.1 万亿，公募固收 + 规模至少翻倍 [1][2] - 高盛估计全球央行 10 月净买入 49 吨黄金，维持 2026 年月均 70 吨假设，预计 2026 年底金价升至 4900 美元 [1] - 美银认为美联储储备管理购买计划和财政部债券发行策略调整形成“类 QE 组合拳”，2026 年美联储预计购买 5600 亿美元短债，财政部增发 5000 亿短债、减发 6000 亿中长期债券，降低市场久期风险，预计对 10 年期美债收益率产生 20 - 30 个基点下行压力 [1][2] - AI 专家对大语言模型发展有不同观点，一方认为逼近人类，另一方认为是“智能幻觉” [2] - 可再生能源板块今年跑赢大盘和石油股，标普全球清洁能源转型指数年内飙升 44%，投资创新高，源于人工智能革命带来的能源需求 [2] - 对冲基金进军实物大宗商品市场，金融巨头涉足天然气、电力和原油实物交易 [2] - 国金证券研报称 SpaceX 护城河是成本、制造和客户三大壁垒融合，猎鹰 9 号降低发射成本，与美国政府客户关系构建商业闭环 [2] - OpenAI 取消新员工“期权授予期”，今年股权薪酬支出预计达 60 亿美元，接近预计收入一半 [2] - 日本大型制造业企业商业信心 12 月攀升至四年高位，为日本央行本周加息扫除障碍，市场预计基准利率上调至 0.75% [2] - 经济学家建议特朗普用“关税退税”政策拉升支持率，推动新“超级法案” [2] - 多家全球大型资产管理机构看好印度市场，认为其股市与全球 AI 交易低相关，可对冲风险 [2] 市场逻辑 - 受外围影响周一两市指数调整，2026 年股市有增量资金，中国科技板块因估值、产业生态和制造能力优势成全球资金布局 AI 新选择 [2] - 瑞银证券分析师认为 2026 年多因素共振助力 A 股估值上行，摩根大通上调中国股票评级为“超配”，英伟达 CEO 认为中国将赢得人工智能竞赛 [2][3] 后市展望 - 受外围影响周一两市指数调整，全球资金加码中国股市，外资期待主动资金回归，中国科技板块成布局 AI 新战场 [3] - 摩根大通认为 2026 年中国股市上涨风险高于下跌风险，看好多重积极因素，阿里和谷歌相关人士表示 AI 需求旺盛 [3] - 美国回归门罗主义使全球资金加速流向中国资本市场，美联储降息并购买短债，资产负债表扩张 [3] - 周一两市调整技术走弱，后市资金面承压，市场预期弱势运行，股指观望等待机会 [3] 交易策略 - 股指期货方向交易建议观望等待新机会 [3] - 股指期权交易暂不参与股指看涨期权 [3]

大语言模型

大语言模型

新股消息金智维递表港交所主板连续三年蝉联国内AI数字员工解决方案市场榜首

金融界· 2025-12-16 08:01

智通财经获悉，据港交所12月15日披露，珠海金智维人工智能股份有限公司(下称"金智维")递表港交所主板，国泰君安融资有限公司及中银国际亚洲有限公司为其联席保荐人。招股书显示，金智维是一家专注于提供人工智能("AI")数字员工解决方案及企业级智能体解决方案的AI 企业，通过自主研发的AI解决方案，助力企业加速其数智化转型。通过将AI算法、大语言模型("大语言模型")和机器人流程自动化("RPA")技术与行业场景的深度融合，该公司实现了将各种不同的工作交由 AI数字员工及智能体处理。根据弗若斯特沙利文的资料，该公司已服务众多行业多家头部企业，并取得市场领先地位。按市场份额计，金智维于2022年至2024年连续三年在中国AI数字员工解决方案市场蝉联榜首。于整个往绩记录期间，该司在此市场服务的大中型企业数量亦位居市场首位。公司的市场领先地位尤其体现在金融服务领域，自2022年至2024年连续三年市场份额稳居第一。截至2025年6月30日，根据公司AI解决方案授予客户的授权数量计，金智维已部署逾180万名AI数字员工。该等AI数字员工涉足金融服务、政务、制造业等十余个行业，累计服务超过1,300家优质 ...

Artificial Intelligence

大语言模型

机器人流程自动化

Artificial Intelligence

AI数字员工解决方案

企业级智能体解决方案

Artificial Intelligence

大语言模型

机器人流程自动化

Artificial Intelligence

AI数字员工解决方案

企业级智能体解决方案

新股消息 | 金智维递表港交所主板连续三年蝉联国内AI数字员工解决方案市场榜首

智通财经网· 2025-12-16 07:22

招股书显示，金智维是一家专注于提供人工智能("AI")数字员工解决方案及企业级智能体解决方案的AI企业，通过自主研发的AI解决方案，助力企业加速其数智化转型。通过将AI算法、大语言模型("大语言模型")和机器人流程自动化("RPA")技术与行业场景的深度融合，该公司实现了将各种不同的工作交由AI 数字员工及智能体处理。智通财经APP获悉，据港交所12月15日披露，珠海金智维人工智能股份有限公司(下称"金智维")递表港交所主板，国泰君安融资有限公司及中银国际亚洲有限公司为其联席保荐人。根据弗若斯特沙利文的资料，该公司已服务众多行业多家头部企业，并取得市场领先地位。按市场份额计，金智维于2022年至2024年连续三年在中国AI数字员工解决方案市场蝉联榜首。于整个往绩记录期间，该司在此市场服务的大中型企业数量亦位居市场首位。公司的市场领先地位尤其体现在金融服务领域，自2022年至2024年连续三年市场份额稳居第一。截至2025年6月30日，根据公司AI解决方案授予客户的授权数量计，金智维已部署逾180万名AI数字员工。该等AI数字员工涉足金融服务、政务、制造业等十余个行业，累计服务超过1,300家优 ...

大语言模型

机器人流程自动化

AI数字员工解决方案

企业级智能体解决方案

大语言模型

机器人流程自动化

AI数字员工解决方案

企业级智能体解决方案

美股异动英伟达(NVDA.US)盘前涨逾1% 公布第三代“Nemotron”大语言模型

金融界· 2025-12-15 23:15

本文源自：智通财经网智通财经获悉，周一，英伟达(NVDA.US)盘前涨逾1%，报177.64美元。消息面上，英伟达公布了第三代"Nemotron"大语言模型，主要面向写作、编程等任务。其中最小的模型Nemotron 3 Nano已于当天发布，另外两个更大版本将在2026年上半年推出。与此同时，有报道称，Meta Platforms正在考虑转向闭源模型，这使得英伟达成为美国最主要的开源模型提供者之一。 ...

英伟达(US:NVDA)

大语言模型

第三代“Nemotron”大语言模型

大语言模型

第三代“Nemotron”大语言模型