大语言模型
搜索文档
腾讯大模型团队架构调整 前OpenAI研究员姚顺雨任要职
第一财经· 2025-12-17 17:01
腾讯并未披露Vinces Yao的中文名或过往履历。不过,记者了解到,Vinces Yao即为数月前入职腾讯的 姚顺雨,他毕业于清华和普林斯顿大学,曾任OpenAI研究员,是OpenAI首批智能体产品Operator与 Deep Research的核心贡献者。 据36氪,腾讯近期完成了一次组织调整,正式新成立AI Infra部、AI Data部、数据计算平台部。12月17 日下午发布的内部公告中,腾讯表示,Vinces Yao将出任"CEO/总裁办公室"首席AI科学家,向腾讯总裁 刘炽平汇报;他同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报。 (文章来源:第一财经) ...
L3自动驾驶量产元年,离L4的梦想又近了一步
36氪· 2025-12-17 16:43
L3迎来规模化曙光 今年4月的上海车展,华为联合赛力斯、阿维塔、奇瑞汽车、北汽新能源、岚图汽车、江汽集团、上汽集团、广汽集团等11家车企,在央视直播镜头前谈 起了L3,这些车企基本囊括了中国汽车行业的四大央企和新势力代表,堪称中国新能源汽车行业的"半壁江山"。 行业普遍认为,L3级是从"辅助驾驶"到"完全自动驾驶"的重要过渡,后续的L4级自动驾驶将实现更大突破——在固定区域内,车辆可完全脱离人类干预, 真正实现无人驾驶。 这一小步,背后是全球十年的技术博弈。德国早在2021年就通过《自动驾驶法》,明确L3系统激活期间事故责任由车企承担,并要求车辆配备"黑匣子"记 录运行数据。奔驰Drive Pilot系统随后在德国高速公路上线,成为全球首个商业化的L3产品。相比之下,中国此次准入虽起步稍晚,却一步切入责任核 心,未走"测试"老路,而是直接启动附条件商业化运营。 但现实挑战在于人机共驾的信任建立——系统何时退出?驾驶员能否及时接管?未来交通治理将重新定义机器守规与责任切割的边界。 近日,工信部首次批准L3级自动驾驶商业化运营,通过L3级自动驾驶准入申请的两款车型为长安深蓝SL03与极狐阿尔法S6,标志着我国首次 ...
罗福莉首秀前,小米突然发布,代码全球最强,总体媲美DeepSeek-V3.2【附实测】
36氪· 2025-12-17 10:51
智东西12月17日报道,今天,小米发布并开源了最新MoE大模型MiMo-V2-Flash,总参数309B,激活参数15B。今日上午,小米2025小米人车家全生态合 作伙伴大会上,Xiaomi MiMO大模型负责人罗福莉将首秀并发布主题演讲。 该模型专为推理、编码和Agent场景构建,支持混合思维模式,允许用户切换模型是"思考"还是即时回答。它能一键生成功能齐全的HTML网页,并与 Claude Code、Cursor和Cline等氛围编码框架协同。该模型提供256k上下文窗口,能够完成数百轮Agent交互和工具调用的任务。 基准测试结果显示,MiMo-V2-Flash的性能基本与DeepSeek-V3.2相当,仅在不使用任何工具辅助的"人类最后一场考试"和创意文本生成评估ARENA- HARD中略逊色于DeepSeek-V3.2,但时延更小。 在多个Agent测评基准上,MiMo-V2-Flash位列全球开源模型Top 2;代码能力测评超过所有开源模型,比肩标杆闭源模型Claude 4.5 Sonnet,但推理价格 仅为其2.5%且生成速度提升至2倍。 MiMo-V2-Flash能以每秒150个token的速 ...
英伟达成开源新王?Nemotron 3全新混合专家架构,推理效率升4倍
机器之心· 2025-12-16 16:55
英伟达发布Nemotron 3系列开放模型 - 公司发布了Nemotron 3系列开放模型,包含Nano、Super和Ultra三种规模,旨在应对企业从单一模型转向多智能体AI系统时面临的挑战 [2][7][8] - 该系列模型的核心目标是提供构建专业级智能体AI所需的性能与开放性,创始人黄仁勋强调开放式创新是AI进步的基石 [8] - Nemotron 3 Nano(30B-3A)模型已于发布日上线,而Super和Ultra型号预计将于2026年上半年正式推出 [8] 各型号模型规格与定位 - **Nemotron 3 Nano**:总参数316亿,激活参数32亿(含嵌入层为36亿),针对软件调试、内容摘要等任务优化,是计算成本效率最高的模型 [3][5] - **Nemotron 3 Super**:参数规模约1000亿,每个token最多激活100亿参数,擅长需要大量协作智能体且对低延迟要求极高的复杂任务 [4][5] - **Nemotron 3 Ultra**:参数规模约5000亿,每个token最多激活500亿参数,作为高级推理引擎,适用于深度研究与战略规划等高复杂度AI工作流 [4][5] Nano型号的性能提升与优势 - 与上代Nemotron 2 Nano相比,Nemotron 3 Nano实现了最高4倍的Token吞吐量提升,并将推理阶段生成的Token数量减少最高60% [3] - 其激活的参数数量不到上代的一半,却实现了更高的准确率,并具备100万Token的上下文窗口以增强长期记忆能力 [3] - 在单张H200、8K输入/16K输出配置下,其推理吞吐量是Qwen3-30B-A3B的3.3倍,是GPT-OSS-20B的2.2倍 [28] 核心技术:混合MoE与架构创新 - 系列模型采用Mamba-Transformer混合MoE架构,大量采用MoE层与成本更低的Mamba-2层交替堆叠,避免了传统自注意力层KV Cache线性增长的成本 [12] - 引入了LatentMoE架构,先将token投影到更小的潜在维度进行专家路由和计算,以减少专家权重加载和通信成本,并增加专家数量 [16] - 采用了多Token预测技术,一次预测多个未来token以提升准确率和推理效率,该技术仅引入极少量额外FLOPs并能带来可观的推测解码加速收益 [18][19] 训练与精度格式创新 - 公司在NVFP4数值格式下,成功实现了在Mamba-MoE混合架构上对最高25万亿tokens的稳定高精度预训练 [21] - 在GB300芯片上,FP4的峰值吞吐量是FP8的3倍,这使得在现有基础设施上训练更大规模模型成为可能 [21][37] - 模型权重、激活值和梯度均被量化为NVFP4,使得前向传播、反向传播中的梯度计算和权重更新都可以使用NVFP4 GEMM运算 [21] 超长上下文与实用能力增强 - 系列模型支持最长100万token的上下文长度,以满足大规模、多轮、具备Agentic推理的应用需求 [22] - 通过使用Mamba层天然的隐式位置信息,在注意力层中完全不使用旋转位置编码,从而避免了RoPE带来的上下文扩展限制 [22] - 引入了多环境强化学习后训练,以及推理阶段精细化推理预算控制,增强了模型在真实世界应用中的可靠性、灵活性与泛化表现 [23] 模型性能表现 - 在覆盖多个类别的主流基准测试中,Nemotron 3 Nano-30B-A3B的准确率优于GPT-OSS-20B和Qwen3-30B-A3B-Thinking-2507 [27] - 在不同上下文长度下的RULER基准测试中,其性能均优于GPT-OSS-20B和Qwen3-30B-A3B-Instruct-2507 [29] - 独立AI基准评测机构Artificial Analysis将其评为同规模模型中最开放、最高效的模型之一,并具备领先的准确率 [30] 开放生态与配套工具 - 公司不仅开源了模型,还发布了训练数据、强化学习环境和训练代码,斯坦福大学教授认为这能让用户创建自己的模型,意义重大 [6][31] - 同步发布了囊括3万亿Token的全新预训练、后训练及强化学习数据集,以及Nemotron智能体安全数据集,用于打造专业化领域智能体 [39] - 开源了NeMo Gym与NeMo RL库,并推出NeMo Evaluator,所有工具和数据集已在GitHub和Hugging Face上开放 [41] - 该系列模型已获得LM Studio、llama.cpp、SGLang和vLLM等项目的支持 [41]
计算机行业周报:MistraiAI发布Devstral2系列,GPT-5.2定义专家级智能-20251216
华鑫证券· 2025-12-16 15:36
报告行业投资评级 - 行业评级为“推荐(维持)” [1] 报告核心观点 - 报告持续看好AI算力板块,认为其业绩增长具备坚实支撑,行业呈现高景气度 [7][61] - 核心逻辑基于AI算力基础设施需求的刚性增长、持续的技术迭代以及谷歌与博通在TPU芯片领域的商业化推进 [7][61] 根据相关目录分别总结 1. 算力动态 - **Tokens消耗与市场份额**:报告期内(2025年12月8日至14日),周度token调用量为5.78T,环比下降6.6% [15];市场份额前五名为:Google(20.5%)、OpenAI(19.9%)、xAI(15.5%)、Anthropic(12.9%)和Deepseek(8.1%)[16] - **算力租赁价格平稳**:上周主要云服务商的A100/A800显卡租赁价格保持稳定,例如腾讯云A100-40G配置价格为28.64元/时,阿里云同配置为31.58元/时,价格环比变化分别为+3.99%和0.00% [21][22] - **MistralAI发布Devstral2系列**:2025年12月10日,MistralAI发布专为编程设计的开源模型家族Devstral2,包含123B参数的旗舰版和24B参数的轻量版 [3][22];该系列具备256K超长上下文窗口,在SWE-benchVerified基准测试中取得72.2的高分 [23];同步推出的命令行工具MistralVibeCLI实现了自然语言与代码操作的直接映射 [3][25];模型采用修改版MIT许可证,对全球合并月收入超过2000万美元的公司使用进行了限制 [27] 2. AI应用动态 - **AI应用流量跟踪**:在2025年12月5日至11日期间,AI相关网站中,Perplexity的平均停留时长环比增速最快,达+10.58% [32];周访问量前三名为ChatGPT(1327.0M)、Bing(780.4M)和Gemini(391.7M)[34] - **OpenAI发布GPT-5.2系列**:2025年12月12日,OpenAI发布GPT-5.2系列模型,包括Instant、Thinking和Pro三个版本 [4][33];该系列在多项基准测试中表现卓越:在SWE-BenchPro测试中得分为55.6%,在ARC-AGI-2评估中GPT-5.2Pro以52.9%位居榜首,在GDPval测试中其产出在70.9%的情况下优于或等同于人类专家 [35];模型支持40万Token的上下文窗口,知识库更新至2025年8月31日 [39];尽管输入输出Token价格较前代提高约40%,但因Token效率更高,整体性价比被认为更具优势 [41];模型在编程(SWE-bench验证得分80%)、减少“幻觉”(错误回答比例降低约30%)及科学研究(GPQADiamond基准得分93.2%)方面均有显著提升 [41][42][47] 3. AI融资动向 - **Fal.ai完成大额融资**:2025年12月10日,多模态AI平台Fal.ai完成1.4亿美元D轮融资,公司估值达45亿美元 [4][48];该平台提供超过600个AI模型,拥有超过200万开发者用户,截至2025年10月其年度经常性收入(ARR)已超过2亿美元 [49] 4. 行情复盘 - **指数表现**:上周(12月8日至12日),AI算力指数单日最大涨幅为2.28%,最大跌幅为-2.08%;AI应用指数单日最大涨幅为1.22%,最大跌幅为-1.93% [54] - **个股涨跌**:在AI算力指数内部,开普云以+21.30%录得最大涨幅,天源迪科以-14.01%录得最大跌幅 [54];在AI应用指数内部,淳中科技以+13.90%录得最大涨幅,恒银科技以-13.62%录得最大跌幅 [54] 5. 投资建议 - **看好AI算力板块**:报告引述博通财报数据,其AI芯片销售额同比激增74%,累计未完成订单规模达730亿美元,并与谷歌合作的TPU产品能效比较前代提升六倍,认为这为AI算力板块注入强劲增长动能 [7][61] - **建议关注公司**:报告中长期建议关注四家公司:加快扩张算力业务的迈信林(688685.SH)、新能源业务高增的唯科科技(301196.SZ)、AI智能文字识别与商业大数据领域的合合信息(688615.SH)、深耕工业AI与软件的能科科技(603859.SH)[8][62];报告给出了这四家公司的盈利预测与“买入”评级 [10][63]
2026年汽车智能化投资策略
2025-12-16 11:26
2026 年汽车智能化投资策略 20251215 摘要 2014-2017 年行业发散,2020-2022 年聚焦单车智能和 L2+技术,预 控制器崭露头角。近三年硬件市场达峰值,硬件预埋逻辑估值下降,自 动化行情未结束,特斯拉和小鹏引发市场争议。 未来五年(2026-2030)产业将经历三个阶段:2025-2026 年为黎明 前的黑暗期,电动化红利消退;2026-2028 年是投资最佳期,L4 技术 在 B 端商业模式跑通;2028-2030 年则是 C 端市场重新爆发期。 L2 到 L4 发展过程中,行业从炒作硬件转向关注软件应用。硬件市场趋 于饱和,自动化行情仍有结构性机会。未来五年投资策略应从电动化框 架跳脱,注重 AI 应用,从上游硬件转向下游软件应用。 无人驾驶汽车商业模式发展路径:2025-2026 年是投入期;2026- 2028 年 B 端商业模式跑通;2028-2030 年 C 端市场爆发。技术进步是 核心驱动力,政策是辅助因素。 电动化早期政策是主要驱动力,现在技术是首要驱动力。软件算法的重 要性超过硬件。大语言模型对汽车行业产生深远影响,并应用于智能化 车辆。 Q&A 智能汽车行业在过 ...
格林大华期货早盘提示-20251216
格林期货· 2025-12-16 08:01
报告行业投资评级 未提及 报告核心观点 受外围市场利空影响,周一两市主要指数震荡调整,科创 50 指数跌幅较大;2026 年股市预计有增量资金,中国科技板块成全球资金布局 AI 新选择;摩根大通看好 2026 年中国股市;后市资金面承压,市场预期弱势运行,建议股指观望等待新机会,暂不参与股指看涨期权 [1][2][3] 各部分内容总结 行情复盘 - 周一两市主要指数震荡调整,科创 50 指数跌幅较大,两市成交额 1.77 万亿元,下跌缩量;沪深 300 指数收 4552 点,跌 28 点,跌幅 -0.63%;上证 50 指数收 2987 点,跌 7 点,跌幅 -0.25%;中证 500 指数收 7113 点,跌 55 点,跌幅 -0.78%;中证 1000 指数收 7309 点,跌 61 点,跌幅 -0.84% [1] - 行业与主题 ETF 中涨幅居前的是卫星 ETF、航空航天 ETF 等,跌幅居前的是科创芯片设计 ETF、创新药 ETF 等;两市板块指数中涨幅居前的是林业、航天装备等,跌幅居前的是消费电子、医疗美容等 [1] - 中证 1000、中证 500、沪深 300、上证 50 指数股指期货沉淀资金分别净流出 52、40、34、1 亿元 [1] 重要资讯 - 11 月份,规模以上工业增加值同比实际增长 4.8%,环比增长 0.44%,1 - 11 月份同比增长 6.0%,41 个大类行业中有 30 个行业增加值同比增长 [1] - 证监会表示推动落实中长期资金长周期考核机制,发展权益类公募基金,推动指数化投资发展,启动创业板改革,加快科创板改革举措落地,研究推出新期货品种 [1] - 中泰证券称 2025 年股市实现 2.26 万亿净流入,2026 年保险、理财、养老金为增量资金,机构增量资金达 3.1 万亿,公募固收 + 规模至少翻倍 [1][2] - 高盛估计全球央行 10 月净买入 49 吨黄金,维持 2026 年月均 70 吨假设,预计 2026 年底金价升至 4900 美元 [1] - 美银认为美联储储备管理购买计划和财政部债券发行策略调整形成“类 QE 组合拳”,2026 年美联储预计购买 5600 亿美元短债,财政部增发 5000 亿短债、减发 6000 亿中长期债券,降低市场久期风险,预计对 10 年期美债收益率产生 20 - 30 个基点下行压力 [1][2] - AI 专家对大语言模型发展有不同观点,一方认为逼近人类,另一方认为是“智能幻觉” [2] - 可再生能源板块今年跑赢大盘和石油股,标普全球清洁能源转型指数年内飙升 44%,投资创新高,源于人工智能革命带来的能源需求 [2] - 对冲基金进军实物大宗商品市场,金融巨头涉足天然气、电力和原油实物交易 [2] - 国金证券研报称 SpaceX 护城河是成本、制造和客户三大壁垒融合,猎鹰 9 号降低发射成本,与美国政府客户关系构建商业闭环 [2] - OpenAI 取消新员工“期权授予期”,今年股权薪酬支出预计达 60 亿美元,接近预计收入一半 [2] - 日本大型制造业企业商业信心 12 月攀升至四年高位,为日本央行本周加息扫除障碍,市场预计基准利率上调至 0.75% [2] - 经济学家建议特朗普用“关税退税”政策拉升支持率,推动新“超级法案” [2] - 多家全球大型资产管理机构看好印度市场,认为其股市与全球 AI 交易低相关,可对冲风险 [2] 市场逻辑 - 受外围影响周一两市指数调整,2026 年股市有增量资金,中国科技板块因估值、产业生态和制造能力优势成全球资金布局 AI 新选择 [2] - 瑞银证券分析师认为 2026 年多因素共振助力 A 股估值上行,摩根大通上调中国股票评级为“超配”,英伟达 CEO 认为中国将赢得人工智能竞赛 [2][3] 后市展望 - 受外围影响周一两市指数调整,全球资金加码中国股市,外资期待主动资金回归,中国科技板块成布局 AI 新战场 [3] - 摩根大通认为 2026 年中国股市上涨风险高于下跌风险,看好多重积极因素,阿里和谷歌相关人士表示 AI 需求旺盛 [3] - 美国回归门罗主义使全球资金加速流向中国资本市场,美联储降息并购买短债,资产负债表扩张 [3] - 周一两市调整技术走弱,后市资金面承压,市场预期弱势运行,股指观望等待机会 [3] 交易策略 - 股指期货方向交易建议观望等待新机会 [3] - 股指期权交易暂不参与股指看涨期权 [3]
新股消息 金智维递表港交所主板 连续三年蝉联国内AI数字员工解决方案市场榜首
金融界· 2025-12-16 08:01
智通财经获悉,据港交所12月15日披露,珠海金智维人工智能股份有限公司(下称"金智维")递表港交所 主板,国泰君安融资有限公司及中银国际亚洲有限公司为其联席保荐人。 招股书显示,金智维是一家专注于提供人工智能("AI")数字员工解决方案及企业级智能体解决方案的AI 企业,通过自主研发的AI解决方案,助力企业加速其数智化转型。通过将AI算法、大语言模型("大语言 模型")和机器人流程自动化("RPA")技术与行业场景的深度融合,该公司实现了将各种不同的工作交由 AI数字员工及智能体处理。 根据弗若斯特沙利文的资料,该公司已服务众多行业多家头部企业,并取得市场领先地位。按市场份额 计,金智维于2022年至2024年连续三年在中国AI数字员工解决方案市场蝉联榜首。于整个往绩记录期 间,该司在此市场服务的大中型企业数量亦位居市场首位。公司的市场领先地位尤其体现在金融服务领 域,自2022年至2024年连续三年市场份额稳居第一。 截至2025年6月30日,根据公司AI解决方案授予客户的授权数量计,金智维已部署逾180万名AI数字员 工。该等AI数字员工涉足金融服务、政务、制造业等十余个行业,累计服务超过1,300家优质 ...
新股消息 | 金智维递表港交所主板 连续三年蝉联国内AI数字员工解决方案市场榜首
智通财经网· 2025-12-16 07:22
招股书显示,金智维是一家专注于提供人工智能("AI")数字员工解决方案及企业级智能体解决方案的AI企业,通过自主研发的AI解决方案,助力企业加速其 数智化转型。通过将AI算法、大语言模型("大语言模型")和机器人流程自动化("RPA")技术与行业场景的深度融合,该公司实现了将各种不同的工作交由AI 数字员工及智能体处理。 智通财经APP获悉,据港交所12月15日披露,珠海金智维人工智能股份有限公司(下称"金智维")递表港交所主板,国泰君安融资有限公司及中银国际亚洲有 限公司为其联席保荐人。 根据弗若斯特沙利文的资料,该公司已服务众多行业多家头部企业,并取得市场领先地位。按市场份额计,金智维于2022年至2024年连续三年在中国AI数 字员工解决方案市场蝉联榜首。于整个往绩记录期间,该司在此市场服务的大中型企业数量亦位居市场首位。公司的市场领先地位尤其体现在金融服务领 域,自2022年至2024年连续三年市场份额稳居第一。 截至2025年6月30日,根据公司AI解决方案授予客户的授权数量计,金智维已部署逾180万名AI数字员工。该等AI数字员工涉足金融服务、政务、制造业等 十余个行业,累计服务超过1,300家优 ...
美股异动 英伟达(NVDA.US)盘前涨逾1% 公布第三代“Nemotron”大语言模型
金融界· 2025-12-15 23:15
本文源自:智通财经网 智通财经获悉,周一,英伟达(NVDA.US)盘前涨逾1%,报177.64美元。消息面上,英伟达公布了第三 代"Nemotron"大语言模型,主要面向写作、编程等任务。其中最小的模型Nemotron 3 Nano已于当天发 布,另外两个更大版本将在2026年上半年推出。与此同时,有报道称,Meta Platforms正在考虑转向闭 源模型,这使得英伟达成为美国最主要的开源模型提供者之一。 ...