AGI
搜索文档
“雷军的AI秘密武器”罗福莉首秀:详解小米AGI之路
创业邦· 2025-12-17 18:19
公司AI战略与模型发布 - 小米于2025年12月17日举办“人车家全生态合作伙伴大会”,前DeepSeek核心成员罗福莉首次公开演讲,标志着公司AI研发走向“正规军化”和“极客化”[6] - 公司发布了面向智能体的新一代基座模型MiMo-V2-Flash,并已开源所有模型权重、技术报告,并提供API和体验Web[40] - 罗福莉阐述了公司的AGI愿景,认为真正的智能需从交互中产生,最终目标是打造一个能推演世界运作逻辑、具备物理一致性的虚拟宇宙,而不仅仅是语言程序[6][42] 模型MiMo-V2-Flash核心特点 - 模型采用MoE架构,总参数达3090亿,但激活参数仅为150亿,通过MTP技术实现高效推理,生成速度达150 tokens/秒,带来约2.5倍加速[7][32] - 模型采用创新的Hybrid SWA注意力机制,锁定128 tokens的“神奇窗口”,支持256K长上下文,并固定KV缓存以降低硬件压力,在代码生成上刷新了SOTA[10] - 在落地层面追求高性价比,后训练阶段采用MOPD技术,用极低计算量(不到标准流程1/50)复刻教师模型性能,旨在降低大规模部署成本[10] 模型性能与成本优势 - 在代码能力和智能体能力上,该模型在全球开源模型评估榜单中进入Top 1-2行列,大部分评估基准超过或与总参数量为其2-3倍的DeepSeek-V3、Kimi、Qwen等模型相当[24] - 在价格与速度的权衡中,该模型定位为低成本、高速度,其推理速度比DeepSeek-V3.2快约3倍,而推理成本比综合性能相当的Gemini 2.5 Pro便宜20倍[27] 技术创新细节 - 模型架构围绕“极致推理效率”设计,采用Hybrid Attention结构,其中Sliding Window Attention与Full Attention的比例约为5:1,以兼顾性能并适配主流推理框架[29] - 深度挖掘MTP技术潜力,在训练和微调中加入MTP层以提升基座潜能,最终推理时使用三层MTP进行加速并行Token验证,实现2.2到2.6倍的推理加速[31][32] - 提出MOPD训练范式,利用稠密的令牌级奖励进行监督学习,可高效将各领域专家能力蒸馏到学生模型上,并尝试通过学生模型自我迭代实现持续提升[34][36] 对AI发展路径的思考 - 从生物进化视角看,智能发展遵循从控制身体与环境互动、到强化学习、再到大脑模拟未来、最后掌握语言的路径,而当前大模型的发展是“倒叙”,先掌握了语言[16][19] - 大模型通过海量文本的下一词预测学习,本质上是压缩了人类数十亿年对世界的认知同构,解码了人类思维在文本空间的投影,这是一种自顶向下的捷径[19] - 公司认为AI进化的下一个起点是构建物理模型,让智能体具备从“回答问题”到“完成任务”的能力,这需要统一的全模态感知能力和对物理规律的理解[40][42] 现状与挑战 - 尽管模型追求高效推理,但其150亿的激活参数对当前旗舰手机等移动设备而言依然过高,端侧AI的舒适区仍停留在30亿到70亿参数之间[11] - 模型当前的“高效推理”更多指在云端数据中心实现高吞吐量,对用户终端而言仍是一个重度依赖网络的“云端模型”,并未打破端侧AI的算力天花板[11] - 公司旨在通过高效推理与智能体技术,推动AI从“语言交互”跨越到“物理世界”以赋能“人车家全生态”,但这一理想仍在路上,现有硬件尚难完全支撑[9]
何小鹏:当前没有AI泡沫!
证券时报· 2025-12-17 18:00
文章核心观点 - 小鹏汽车董事长何小鹏基于其在美国与AI领域人士的交流,分享了对中美AI竞争、产业生态及“物理AI”发展趋势的最新研判,并阐述了小鹏汽车向“物理AI世界的出行探索者”和“全球具身智能公司”转型的战略定位 [1][4] 对中美AI及机器人产业的观察 - 美国在AI、生物、金融领域的创业活动众多,尤其在硅谷,SaaS和物理AI机器人领域的创业公司非常集中且估值特别高 [1] - 中美机器人公司的发展路径存在差异:中国公司多从关节和控制入手,而美国公司多从模型入手 [1] - 人形机器人领域未来将是巨头的竞争,而不同的专用机器人领域则会有大量不同领域的选手,并存在非常多的成功机会 [1] - 当前AI领域的估值,中国比较合理,而美国估值实在有一点高;中国更关注市场应用,美国更关注前沿研究 [2][3] 对“物理AI”的理解与展望 - “物理AI”被认为是未来可能产生大变局的领域,其发展速度可能比数字AI慢,但改变生活的力度会更大 [2] - 未来3年,重大突破可能发生在物理AI领域,例如自动驾驶直接到达准L4或完整L4,人形机器人实现从L1到L4初阶的快速跨越 [2] - 当前AI主要是模仿学习和强化学习,尚不具备真正的创造力,真正的AGI(通用人工智能)还需要多模态到世界模型、持续学习、长时序洞见和规划等能力的进一步发展,可能还需数年时间 [3] 小鹏汽车的“物理AI”战略与产品规划 - 小鹏汽车在2025科技日上强调了“物理AI”概念,并围绕此发布了四项重要应用:小鹏第二代VLA、小鹏Robotaxi、全新一代IRON以及汇天两套飞行体系 [1] - 这些AI应用已有明确的量产计划,表明“物理AI”并非遥不可及,而是人人触手可及的现实 [1] - 小鹏汽车已正式升级企业定位,从“未来出行探索者”转向“物理AI世界的出行探索者,面向全球的具身智能公司” [4] - 市场正跳出造车的眼光,以物理AI的视角重新打量小鹏,其价值可能被重构为一家面向全球的、以AI驱动物理世界智能化的科技企业 [4] 对AI泡沫与行业发展阶段的看法 - 任何科技时代(如互联网、新能源汽车)都可能有阶段或局部的泡沫,这是市场从混沌到有序的必然竞争过程 [2] - 整体认为当前没有AI泡沫,未来AI市场存在巨大机遇,目前AI发展仍处于0到0.1的最开始阶段 [2][3]
罗福莉首秀小米:MiMo大模型开源破局,AI战略锚定 “物理
搜狐财经· 2025-12-17 17:21
小米AI战略与认知框架 - 公司AI战略由原DeepSeek核心成员、MiMo大模型负责人罗福莉首次公开阐述,其核心观点认为AI正以非线性方式重演人类大脑6亿年的进化史[3] - 公司认为语言是“人类思维和物理世界在符号空间的投影”,因此选择从语言切入构建Agent语言基座模型MiMo-V2-Flash[3] - 公司对AI“护城河”的定义是科学的研究文化与方法,以及将未知问题结合模型优化转化为可用产品的能力,而非算力和数据[4] - 公司明确其AI发展路径与OpenAI联合创始人Ilya“语言可实现终极AGI”的观点存在差异,强调需让大模型跳出文本局限,通过多模态感知理解物理世界[4] MiMo-V2-Flash模型技术细节 - 发布的MiMo-V2-Flash模型在全球开源模型代码与Agent测评基准中跻身TOP2[3] - 模型关键突破在于“极致推理效率”:采用Hybrid SWA架构固定KV Cache以强化长文推理能力,并通过3层MTP推理加速并行Token验证,将推理速度提升2-2.6倍[3] - 模型在同类性能模型中实现了“低成本+高速度”的双重优势,现场演示展现了通过HTML编写简易操作系统、模拟太阳系运行轨迹的能力[3] - 公司宣布MiMo-V2-Flash发布即开源,模型权重、技术报告全面开放,API限时免费[6] 公司业务与研发投入支撑 - 2025年前三季度,公司实现收入超3400亿元,同比增长32.5%,经调整利润增长73.5%[4] - 2025年1-10月,公司在中国手机市场销量稳居第二[4] - 未来五年,公司研发投入预计超2000亿元,其中2026年单年投入将达400亿元左右[5] - 研发投入将聚焦“芯片、OS、AI”三大核心技术,作为“人车家全生态”的底层支柱[5] “人车家全生态”战略构成 - 生态产品端覆盖个人设备(手机、PC等)、出行设备(汽车)、家庭设备(IoT)[5] - 生态技术端以芯片、OS、AI为核心驱动力[5] - 生态制造端依托手机、汽车、大家电工厂实现落地[5] - 该全链路覆盖的生态为MiMo大模型提供了从手机端侧推理、汽车智能交互到家庭IoT设备联动的真实场景土壤[5] 开源战略与行业影响 - 公司认为开源的价值是“一种分布式的技术加速主义”,并指出早年开源模型与顶尖模型存在三年代差,如今差距已缩短至“数月”[6] - 公司视开源为实现AGI普惠化、确保所有人类智慧共同进化的唯一路径,是其对AGI发展的“伦理立场”,旨在避免技术被少数主体垄断[6] - MiMo-V2-Flash作为性能TOP2的开源模型,可能推动行业格局变化,使中小开发者无需巨额基础模型研发成本,可聚焦场景化创新[6] 团队与执行能力 - 公司大模型Core团队是“研究、产品与工程深度耦合的年轻团队”,具备“小而美”的创业精神与技术转化能力[4] - 从罗福莉11月12日官宣加入,到12月16日模型发布,再到17日公开演讲,短短一个月团队快速落地,印证了其执行优势[8]
罗福莉执掌小米大模型首秀!定调下一代模型,全新MiMo-V2开源还横扫Agent第一梯队
AI前线· 2025-12-17 16:00
小米大模型战略与MiMo-V2-Flash发布 - 小米在2025年合作伙伴大会上,由新任命的大模型负责人罗福莉首次公开亮相,并发布了新一代开源大模型MiMo-V2-Flash [2][3][4] - 该模型采用MoE(混合专家)架构,总参数规模达3090亿,但每次推理仅激活约150亿参数,旨在实现高速、高频、低成本的推理 [8] - 模型设计目标明确为“要跑得快、跑得久、被高频调用也跑得起”,核心是为Agent(智能体)和真实世界应用场景服务 [8][16] 技术负责人背景 - 大模型负责人罗福莉是行业知名AI技术专家,硕士毕业于北大,曾任职于阿里巴巴达摩院和DeepSeek母公司幻方量化,参与研发DeepSeek-V2等模型 [11][12] - 她于2024年11月加入小米,此次演讲是其入职后的首次公开亮相 [13] 模型设计理念与工程逻辑 - 公司认为当前大语言模型本质上是解码了人类思维在文本空间中的投影,而非真正理解物理世界,因此语言是工具而非终点 [19][20][35] - MiMo-V2-Flash的设计目标不是追求“更聪明”,而是“更好用、更可部署”,其技术选择是被Agent场景需求“倒逼”出来的工程取舍 [21][22] - 模型研发主要围绕三大现实挑战展开:智能体需要高效的代码与工具调用沟通语言、智能体间交互带宽低要求极高推理效率、大模型范式正从预训练转向后训练和强化学习 [25][41] 核心技术特点与性能 - 模型采用Hybrid Attention混合注意力结构(Sliding Window Attention与Full Attention比例约5:1),以兼顾长短文本推理并适配现有推理基础设施 [45] - 深入挖掘多词元预测技术潜力,在预训练和微调阶段引入MTP层以提升模型潜能,在推理阶段使用三层MTP并行,实现约2到2.6倍的推理加速 [24][46][47] - 在单机环境下,模型输出吞吐可达5000到15000 token/s,单请求输出速度达150 token/s,相比不使用MTP速度提升约2-3倍 [24][47] - 在后训练阶段,公司提出了Multi-Teacher On-Policy Distillation范式,以高效、稳定地将多个专家模型能力蒸馏到学生模型中 [47][50] 模型性能对比与评测结果 - 在7项主流评测中,MiMo-V2-Flash在Agent、代码、工具调用和复杂任务执行方面已进入全球开源模型第一梯队,整体表现与DeepSeek-V3.2、Kimi-K2-Thinking基本相当 [27][40] - 在SWE-Bench基准测试中,MiMo-V2-Flash在多语言模式下以71.7%的准确率获得一项第一 [28] - 在推理效率对比上,MiMo-V2-Flash的推理成本略低于DeepSeek-V3.2,但推理速度约为后者的三倍;与综合能力相近的Gemini 2.5 Pro相比,推理速度接近,但成本低约20倍 [40][48] 对AGI发展的观点与未来方向 - 公司认为当前大模型虽能完成复杂任务,但缺乏对物理一致性、时空连续性及因果关系的理解,这是“具身幻觉”的根源 [30][52] - 真正的下一代智能体需从“回答问题”转向“完成任务”,并具备与世界交互的能力,其核心是构建一个统一、动态的世界模型,而非仅增加多模态输入 [31][32][52][53] - 智能不是从文本中“读出来”,而是要在与真实环境的持续交互中“活出来”,AI进化的下一个关键点是发展能够持续交互的物理模型 [33][52] - 公司对开源持积极态度,视其为一种分布式的技术加速机制,是缩短开源与闭源差距、推动AGI普惠化的现实路径 [33] 模型发布与生态 - MiMo-V2-Flash已正式发布并开源,同步开放了模型权重、技术报告和API,方便开发者接入Web Coding、IDE等场景,体验网页也已上线 [50]
95后“AI天才”罗福莉首秀:中国模型距顶尖差距从三年缩至数月!她出身农村普通家庭,曾被雷军千万元年薪挖角
每日经济新闻· 2025-12-17 15:16
今日上午,2025小米"人车家全生态"合作伙伴大会在北京举办,《每日经济新闻》记者现场参会。会上,小米官宣开源并上线Xiaomi MiMo-V2- Flash大模型。与此同时,记者还注意到,在这次会上,MiMo大模型负责人罗福莉首次公开亮相。这位被业界称为"AI才女"的95后技术专家,介 绍了小米大模型的具体情况,并谈及自己对AI的相关看法。 在活动现场,罗福莉的表现稍显紧张,所介绍内容以技术解读为主。罗福莉提到,研发之初主要围绕三个问题展开:智能体必须有一个高效的沟 通语言,即代码能力和工具调用能力;目前智能体之间的沟通带宽非常低,该如何加速带宽;如何激发后训练的潜能。 图片来源:小米"人车家全生态"合作伙伴大会 据罗福莉介绍,Xiaomi MiMo-V2-Flash是一个非常小的模型,总参数只有309B,激活参数只有15B。"我都不愿意称它是一个非常大的模型。但是 它的代码能力,在我来看它已经进入了全球top 2"。 图片来源:每经记者 杨卉 摄 罗福莉称,Xiaomi MiMo-V2-Flash在大部分评测基准上超过了DeepSeek V3.2 和K2-Thinking,同时对比参数量减少了二分之一至三 ...
何小鹏:当前没有AI泡沫!
证券时报网· 2025-12-17 14:53
何小鹏也最新谈及了对"物理AI"的理解。 (原标题:何小鹏:当前没有AI泡沫!) 小鹏汽车董事长何小鹏近日在美国和近三十位AI领域的外部和内部朋友聊天,他对中美AI竞逐和产业 生态等有了最新判断。 关于美国的新创业和机器人,何小鹏认为,美国在AI,生物,金融方面的创业多。"对于AI方面的创 业,从硅谷看,在SaaS和物理AI机器人领域特别多,估值也特别高,我这次聊了其中一半都是做机器 人创业的朋友,非常集中。" 对比来看,中国的机器人公司很多是从关节和控制入手,而美国的机器人公司很多是从模型入手。何小 鹏认为,人形机器人将来会是巨头的竞争,而不同的专用机器人则会有大量不同领域的选手,且会有非 常多的成功机会。 今年11月中旬,2025小鹏科技日举办。活动现场,何小鹏强调了"物理AI"概念,并围绕"物理AI"发布了 四项重要应用,包括小鹏第二代VLA、小鹏Robotaxi、全新一代IRON,以及汇天两套飞行体系,勾勒 出物理AI未来出行的清晰图景。 让市场更为关注的是,这些AI应用已有明确的量产计划。小鹏汽车表示,"物理AI"并非遥不可及,而是 人人触手可及的现实。 他表示,维特根斯坦曾经说过,"语言即世界"。 ...
何小鹏:未来3年,物理AI领域产生的变局或大于数字世界
新浪财经· 2025-12-17 13:54
12月17日,小鹏汽车CEO何小鹏在微博发文称,近日在美国,和差不多近三十位AI领域的外部和内部 朋友聊天,并分享了一些感受。 关于美国的新创业和机器人 何小鹏表示,美国在AI,生物,金融方面的创业多。而AI方面的创业,从硅谷看,在SaaS和物理AI机 器人领域特别多,估值也特别高,非常集中。中国的机器人公司很多是从关节和控制入手,而美国的机 器人公司很多是从模型入手。 他认为,人形机器人将来会是巨头的竞争,而不同的专用机器人则会有大量不同领域的选手,且会有非 常多的成功机会。 关于物理AI 维特根斯坦曾经说过,"语言即世界"。语言是知识的总结,信息的传递,但某种程度也束缚了对世界的 想象。很多事情靠语言很难想象和学习,例如小朋友如何学习行走,如何学习游泳,主要都必须依靠对 世界的观察,模仿和强化。所以,大家都在期望从语言大模型,走向多模态甚至世界模型。 在何小鹏看来,未来3年,最有可能有大突破的不一定是在数字世界,反而有可能在物理AI领域会产生 大变局,例如自动驾驶会直接到达准L4或完整L4;人形机器人会实现从类自动驾驶的L1到L4初阶的快 速跨越,这些反而会产生巨大的突破。"物理AI的发展速度会比数字AI ...
何小鹏:人形机器人将是巨头的竞争,机会非常多
新浪财经· 2025-12-17 13:54
文章核心观点 - 小鹏汽车CEO何小鹏基于近期与美国近三十位AI领域人士的交流 分享了关于AI创业趋势、物理AI发展前景、AI估值泡沫以及通用人工智能AGI发展阶段的看法 其核心观点认为AI仍处于发展初期 物理AI领域在未来三年可能产生重大突破 并将深刻改变生活 同时指出当前市场整体不存在AI泡沫 未来机遇巨大 [1][3][4][7][8][9] 关于美国的新创业和机器人 - 美国在AI、生物和金融领域的创业活动较为活跃 其中AI创业在硅谷尤其集中于SaaS和物理AI机器人领域 且这些领域的公司估值特别高 [3][8] - 中美机器人公司的技术路径存在差异 中国公司多从关节和控制技术入手 而美国公司则更多从模型入手 [3][8] - 人形机器人市场未来将是巨头之间的竞争 而各类专用机器人领域则将涌现大量来自不同领域的参与者 并拥有非常多的成功机会 [3][8] 关于物理AI - 行业正期待从语言大模型向多模态乃至世界模型演进 因为许多物理技能(如行走、游泳)难以仅通过语言学习 需依靠观察、模仿和强化 [4][9] - 未来3年 最有可能产生重大突破的领域可能不在数字世界 而在物理AI领域 例如自动驾驶技术可能直接达到准L4或完整L4级别 人形机器人可能实现从类似自动驾驶L1到L4初阶的快速跨越 [4][9] - 物理AI的发展速度可能慢于数字AI 但其对生活改变的力度将会更大 [4][9] 关于AI泡沫 - 任何科技时代(如互联网、新能源汽车)的发展过程中都存在阶段性或局部性泡沫 这是市场从混沌走向有序的必然竞争过程 [4][9] - 整体而言 AI必将推动社会巨大变革 目前仍处于“0到0.1”的最初阶段 [4][9] - 若论估值 中国市场相对合理 而美国市场估值则显得较高 中国市场更关注应用落地 美国市场更关注前沿研究 [4][9] - 当前整体上并不存在AI泡沫 AI市场未来蕴含着巨大机遇 [4][9] 关于AGI的到来 - 当前AI的能力主要基于模仿学习(学习既有知识和操作)和强化学习(通过反复练习优化效果与效率) 例如自动驾驶可通过学习数百万人的驾驶习惯 快速达到比大多数人更安全驾驶的水平并展现出涌现能力 但这并非真正的创造力 [5][11] - 真正的通用人工智能AGI尚需多项关键能力 包括从多模态发展到世界模型、持续学习能力以及长时序的洞见和规划能力 这些能力尚未完全实现 可能还需要数年时间以及底层能力的进一步提升 [6][11]
何小鹏:当前没有AI泡沫,未来AI的市场有着巨大机遇
华尔街见闻· 2025-12-17 13:37
文章核心观点 - 2025年下半年,关于AI泡沫的讨论已成为市场焦点,市场集中度和资本流动呈现极端化特征,但行业普遍认为全面泡沫化言之过早,未来2-3年是关键验证期 [1][3] - 小鹏汽车CEO何小鹏认为当前没有AI泡沫,AI仍处于0到0.1的初始阶段,未来市场存在巨大机遇,并指出中美在AI估值、关注重点及机器人技术路径上存在差异 [1] - 未来AI发展的关键是与实体经济深度融合,物理AI领域(如自动驾驶、人形机器人)可能在3年内产生巨大突破,其发展速度虽慢于数字AI,但对生活的改变力度更大 [1][4] 市场现状与资本动态 - 美股前10大市值的公司中,已有8家是AI相关科技公司,其集中度远高于互联网泡沫时期 [1] - 资本流动呈现极端化特征,一方面科技巨头开启“军备竞赛”,另一方面机构投资者纷纷获利了结 [1] - 瑞银证券报告显示,中国互联网龙头资本支出占收入比例为10%,显著低于美国同业的27% [2] 对AI泡沫的行业观点 - 富国基金认为,与互联网泡沫相比,本轮AI行情虽显现泡沫特征,但尚处早期阶段,行情仍有演绎空间,触发互联网泡沫破灭的流动性收紧、盈利兑现失败等情况尚未出现 [3] - 多数分析师认为,产业全面泡沫化言之过早,未来2-3年将是关键验证期 [3] 中美AI发展差异 - 在估值方面,中国估值比较合理,美国估值则被认为偏高 [1] - 在发展重点上,中国更关注市场应用,美国更关注前沿研究 [1] - 在AI创业领域,美国在SaaS和物理AI机器人领域创业特别多,估值也特别高 [1] - 在机器人技术路径上,中国的机器人公司多从关节和控制入手,而美国的机器人公司多从模型入手 [1] AI技术发展阶段与未来机遇 - 当前AI仍处于0到0.1的最开始阶段,主要是类似人类的模仿学习加上强化学习,并非真正的创造力 [1][2] - 真正的AGI(通用人工智能)还需要多模态到世界模型、持续学习、长时序洞见和规划等能力,可能还需要数年时间 [2] - 未来3年,最有可能产生大突破的领域可能在物理AI,例如自动驾驶直接到达准L4或完整L4,人形机器人实现从L1到L4初阶的快速跨越 [1] - 物理AI的发展速度会比数字AI慢,但改变生活的力度会更大 [1] - 人形机器人将来会是巨头的竞争,而不同的专用机器人则会有大量不同领域的选手和成功机会 [1] 行业竞争与商业落地 - 在应用端,垂直领域存在较高的服务能力壁垒,头部公司正主动将AI功能整合至自有应用中 [2] - 行业观察到,OpenAI虽然核心在说AGI,但是全力在做业务落地 [1] - 只有那些能穿透市场噪音、聚焦技术本质与商业价值的企业,更有可能在技术革命中赢得未来 [4]
加入小米一个多月后,95后“AI天才”罗福莉首秀:中国模型距顶尖差距从三年缩至数月!她出身农村普通家庭,曾被雷军千万元年薪挖角
每日经济新闻· 2025-12-17 13:36
每经记者|杨卉 每经编辑|程鹏 廖丹 今日上午,2025小米"人车家全生态"合作伙伴大会在北京举办,《每日经济新闻》记者现场参会。会上,小米官宣开源并上线Xiaomi MiMo-V2-Flash大模 型。与此同时,记者还注意到,在这次会上,MiMo大模型负责人罗福莉首次公开亮相。这位被业界称为"AI才女"的95后技术专家,介绍了小米大模型的 具体情况,并谈及自己对AI的相关看法。 图片来源:每经记者 杨卉 摄 在活动现场,罗福莉的表现稍显紧张,所介绍内容以技术解读为主。罗福莉提到,研发之初主要围绕三个问题展开:智能体必须有一个高效的沟通语言, 即代码能力和工具调用能力;目前智能体之间的沟通带宽非常低,该如何加速带宽;如何激发后训练的潜能。 据罗福莉介绍,Xiaomi MiMo-V2-Flash是一个非常小的模型,总参数只有309B,激活参数只有15B。"我都不愿意称它是一个非常大的模型。但是它的代 码能力,在我来看它已经进入了全球top 2"。 图片来源:小米"人车家全生态"合作伙伴大会 罗福莉称,Xiaomi MiMo-V2-Flash在大部分评测基准上超过了DeepSeek V3.2 和K2-Thinki ...