Qwen2 - 财报，业绩电话会，研报，新闻

Qwen2

搜索文档

DeepSeek、月之暗面、MiniMax被点“非法提取”，它们做错了吗? | 电厂

新浪财经· 2026-02-25 18:47

事件核心观点 - Anthropic指控三家中国AI公司（DeepSeek、Moonshot、MiniMax）通过约2.4万个欺诈账户与Claude进行超1600万次互动，以“非法提取”其模型输出用于训练自身模型，并将此行为定义为“蒸馏攻击” [1] - 被指控的三家中国公司截至目前均未对Anthropic的声明作出公开回应 [1] - 此次事件是2026年开年不到三个月内，国产模型第二次陷入使用美国领先AI模型进行训练的争议 [1] 指控的具体内容与数据 - **技术手段**：Anthropic称三家中国公司采用了名为“蒸馏”的模型训练手段，将Claude作为“教师模型”，通过交互获取其输出概率分布等信息来训练“学生模型” [4] - **交互规模**：据Anthropic披露，三家中国企业以约2.4万个欺诈账户与Claude进行了超1600万次互动 [1] - **细分数据**：DeepSeek与Claude进行了15万次交换、Moonshot进行了340万次交换、MiniMax进行了1300万次交换 [7] - **提取焦点**：Anthropic认为上述行为针对Claude最独特的三大能力——代理推理、工具使用、编码进行了有意提取 [7] “蒸馏”技术的行业背景与争议 - **技术起源**：蒸馏技术可追溯至2015年，由Geoffrey Hinton及其团队提出 [4] - **行业普遍实践**：蒸馏是常见的让模型快速进化的手段，顶尖的大模型厂商和AI实验室常在自研大版本模型基础上蒸馏出更小版本模型，例如阿里巴巴在Qwen2发布5个月后蒸馏出了DistilQwen2 [6] - **条款禁止**：许多大模型（包括Claude）在其服务条款中明确禁止用户或竞品将模型输出用于训练或开发AI模型 [6] - **行为定性困难**：如何确证模型蒸馏行为的存在、如何定性该行为、是否涉及法律问题等，目前尚无明确路径可循 [10] 涉事各方的历史与回应 - **Anthropic的对华立场**：Claude及其公司Anthropic是对中国用户及客户最不“友好”的大模型公司之一，曾表态支持美国出口管制政策，并于2025年9月更新销售地区限制，不向位于中国或中资持股超50%的海外子公司提供商业访问渠道 [7] - **DeepSeek的历史争议**：2025年1月，OpenAI研究人员曾称DeepSeek可能使用了OpenAI模型的输出来训练R1大模型；DeepSeek在2025年9月发表于Nature的论文中回应称，其部分训练数据源于网页随机抓取，“没有故意加入OpenAI生成的合成数据” [9] - **Moonshot的历史争议**：2026年1月底Moonshot新模型Kimi K2.5发布后，坊间曾质疑其蒸馏自Claude；公司创始人杨植麟公开否认，解释称模型在预训练中采样了最新的互联网数据，而这些数据与“Claude”这个token关联较多 [9] 开源与闭源的生态博弈 - **中国模型的开源政策**：中国多款领先大模型遵循开源协议允许蒸馏行为，例如DeepSeek主要模型系列遵循MIT许可证，MiniMax-M1、Kimi K2、阿里巴巴Qwen3等遵循Apache 2.0许可证 [10] - **闭源模型的受益**：许多闭源模型同样受益于开源模型进行蒸馏，例如有市场消息称，Meta在训练其闭源模型“Avocado”时，会使用包括阿里巴巴Qwen在内的多家第三方模型进行蒸馏 [11] - **竞争逻辑的演变**：在AI新市场，技术先进程度不再是唯一追求，生态、人才、法律、地缘等因素叠加，使得竞争维度不断丰富 [13]

Seek .(US:SKLTY)

模型蒸馏

Artificial Intelligence

Artificial Intelligence

创业邦· 2026-01-06 08:07

行业阶段判断 - 2025年是AI行业的筛选赛，资本热浪退潮，融资喧嚣平息，行业迎来残酷的“成年礼”，并非所有AI公司都能留在牌桌上[4] - 2026年AI行业进入耐力比拼的新周期，核心命题是谁能继续坐在牌桌上[5] 通用大模型赛道 - 2025年后，通用大模型赛道已正式关闭创业入口，训练有竞争力的基座模型需要数十亿美元、数千张H100集群和数年工程积累[7] - OpenAI在2025年单季亏损超120亿美元，这被视为一道“劝退公告”，表明该赛道只有国家资本或万亿美元市值公司才走得通[7] - 2026年不再有“通用大模型创业”，创业机会不在“造轮子”，而在“用好轮子”[6][10] 开源模型的影响 - DeepSeek在2025年持续推进“极致开源”战略，年底推出的DeepSeek-V3.2系列显著降低了高能力AI的使用门槛[8] - 阿里通义实验室在2025年1月开源Qwen2全系列模型，并开放免费商用授权，构建了国内最完整的开源AI生态体系[8] - 开源模型完成了关键的“基础设施下放”，将巨头服务器里的能力变为开发者可下载、可微调、可私有部署的工具[8] - 对创业者而言，这意味着不再需要从零训练模型，不必依赖昂贵且不稳定的API，可以基于成熟底座快速构建垂直场景应用[9][10] 头部玩家的竞争 - 中美头部玩家仍在进行“万亿美元级的豪赌”，OpenAI、Anthropic加速冲刺Giga-IPO[10] - 国内智谱AI与MiniMax争夺“大模型第一股”，月之暗面手握百亿现金继续扩军[10] - 这些公司的目标是成为下一代操作系统，创业者的机会是在操作系统上建应用、做集成、打穿场景[12] 创业者的安全路径 - 最危险的创业方向是重复造一个没人用的基座[12] - 最安全的路径是：选择一个开源底座；找一个高价值、低容错的垂直场景；构建能闭环交付ROI的Agent系统；用私有化部署或SaaS订阅实现商业变现[13][14][15] Agent（智能体）的机会 - 2025年真正的创业活跃区已上移至Agent与系统层，业内共识是“模型决定能力上限，Agent决定变现速度”[17] - 企业不再为华丽的“内容生成”买单，真正关心AI能否在多步骤任务中稳定执行、调用工具完成复杂流程、交付可衡量的商业价值[17] - 创业者的机会窗口是不要做“会说话的模型”，要做“能干活的员工”[17] - 以阿里通义灵码为例，截至2025年12月，其插件下载量突破1500万，服务企业超1万家，开发者达千万级，个人开发者平均缩短30%–50%开发周期，在吉利等头部车企，AI生成代码占比已超30%[18] 具身智能的机会 - 具身智能正成为中国AI在物理世界最具确定性的出口，其高度依赖制造能力、供应链整合与成本控制，这是中国AI体系中最难被复制、也最容易被资本理解的长期优势[20] - 2025年12月8日，智元机器人量产工厂第5000台通用具身机器人“灵犀X2”正式下线，其三大产品线累计产量已突破5000台[20][23] - 宇树科技、云深处等公司也在工业巡检、科研教育等场景实现稳定出货，并全面进入上市筹备阶段[23] - 这标志着具身智能创业正式跨越实验室阶段，迈入规模化量产、真实应用与资本预期叠加的新周期[24] 退出方式的变化 - 2025年AI创业的“成功样本”开始分化，一部分公司选择冲刺IPO，另一部分公司则通过并购完成阶段性退出，进入大厂体系[26] - 这意味着2026年之后，AI创业不再只有“独立做大”这一种答案[29] - 对投资人而言，是否能被并购、是否能融入产业体系，正在成为与上市同等重要的成功指标[30] 幸存者的特征 - 真正还能坐在牌桌上的公司，必须至少占据一方阵地：掌握不可替代的基础能力、深度嵌入真实产业流程、或占据通往物理世界的入口[33] - 对绝大多数创业者来说，最现实的路径是站在开源巨人的肩膀上，解决一个具体、高频、付费意愿强的问题[34] - 中美AI的路径差异将进一步拉大：美国定义技术边界与平台规则，中国则主导应用形态与落地速度[34] - 2026年之后，AI创业不再是看“谁先下注”，而是看“谁还能一直坐着”，而坐得住的人早已不再赌模型，只赌价值[35]

Artificial Intelligence

具身智能

AGI

Artificial Intelligence

通义灵码

DeepSeek - R1

Artificial Intelligence

具身智能

AGI

Artificial Intelligence

通义灵码

DeepSeek - R1

吴伟：中国科技崛起吹响AI平权的号角

环球网资讯· 2025-09-02 06:53

中国AI行业全球影响力提升 - 多位中国企业家与学者入选2025年度全球AI影响力榜单包括华为创始人任正非、DeepSeek CEO梁文锋、宇树科技CEO王兴兴等[1] - 中国上榜者数量显著增加且背景多元涵盖领导者、创新者、塑造者和思想者等类别[1] - 中国AI产业快速发展并不断靠近国际舞台中心反映全球技术格局"去地理化"扩散趋势[1] 开源技术推动行业变革 - DeepSeek开源技术路径增强AI行业开放性与参与性为建立包容性全球技术格局贡献中国经验[1] - 开源生态帮助企业以极低成本开发衍生模型阿里通义实验室开源超过200款模型且衍生模型数量突破10万个[1][4] - 中国开源模型Qwen2、Qwen2.5入选斯坦福报告2024年最具代表性AI模型[4] 东南亚AI市场快速发展 - 东南亚数字经济规模预计2030年达2万亿美元其中AI市场规模有望突破5800亿美元[2] - 新加坡推出国家AI战略2.0并与OpenAI合作设立亚太中心马来西亚发布AI治理指南并吸引字节跳动等投资[2] - 印度尼西亚制定人工智能国家战略蓝图预计2030年AI为印尼经济贡献3660亿美元[2] 人才格局变化 - 美国顶级AI研究机构中中国人才占比38% 高于美国本土的37%[3] - 美国STEM领域对中国学者签证收紧加速海外人才回流中国本土直培与人才回流战略显现成效[3] - 中国现存AI相关企业超442万家 2025年新增50.5万余家[3] 技术竞争力提升 - 中美大模型综合性能差距从2023年17.5%骤降至2025年0.3%[4] - 中国在开源生态建设和垂直领域应用形成独特优势实现跨越式发展[4] - 政策支持从要素驱动向系统赋能转变推动基础研究与应用转化双轮驱动[3] 创新生态建设 - 中国AI产业以顶层政策为锚点坚持自主创新和长期主义发展范式[3] - 发展模式以共建共享为核心兼顾效率与包容为全球科技领域提供中国案例[4] - 通过系统性技术突破打破外部垄断从根本上瓦解技术霸权架构[2]

ARPO：智能体强化策略优化，让Agent在关键时刻多探索一步

机器之心· 2025-08-09 14:02

研究背景与动机 - 大语言模型在单轮推理任务中表现亮眼，但在开放式多轮交互场景中仍存在长程规划与工具交互能力不足的问题 [8] - 现有强化学习方法在平衡模型推理与多轮工具交互方面存在局限性，常因奖励稀疏和工具过用导致价值低估 [8] - 研究发现模型在工具调用后的初始生成阶段熵值显著升高，这一高熵现象未被现有方法充分利用 [14][16] ARPO方法创新 - 提出熵驱动的自适应rollout机制，在高熵工具调用步骤加大探索力度，增强推理路径多样性 [20][24] - 引入优势归因估计，优化策略更新方式，更好理解工具交互中各步骤的价值差异 [28][29] - 算法在保持计算复杂度可控的同时，实现不确定性感知的高效探索 [27] 实验设计与结果 - 在13个高难基准测试中，ARPO仅使用一半工具调用预算即显著优于主流RL方法 [3][21] - 在Qwen2.5-7B模型上，ARPO相比GRPO方法工具调用效率提升明显，同时准确率更高 [37][39] - 多任务测试显示ARPO在计算推理（AIME24 71.4%）、知识推理（HotpotQA 67.4%）和深度搜索（GAIA 61.2%）任务中均保持稳定优势 [35][41] 技术实现细节 - 采用分层奖励设计，综合考虑答案正确性、工具调用格式及多工具协作，最高可获得0.1额外奖励 [32] - 软优势估计方法在训练中表现更稳定，被设为默认优势估计方式 [31] - 工具生态覆盖搜索引擎、网页浏览智能体和代码解释器三类代表性工具 [22] 应用前景与展望 - 未来可扩展至多模态Agentic RL，探索图像、视频等多模态场景下的工具调用优化 [42] - 通过引入代码调试器、数据分析工具等扩展工具生态，提升复杂任务表现 [42] - 算法展示出良好的大规模部署潜力，可进一步优化实时动态环境中的适配性 [42]

大语言模型

多轮推理智能体

Agentic Reinforced Policy Optimization

Agentic Reinforced Policy Optimization

ARPO

Qwen2

Qwen2.5