开源大模型 - 财报，业绩电话会，研报，新闻 - Reportify

开源大模型

搜索文档

OpenClaw调用量Kimi K2.5冲上榜首；阿里开源智能体编程模型Qwen3-Coder-Next｜未来商业早参

每日经济新闻· 2026-02-05 07:04

高鑫零售管理层突发状况 - 公司公告暂时无法与执行董事兼首席执行官李卫平取得联系 [1] - 董事会认为该事项与集团业务及营运无关，且无重大不利影响，业务及营运维持正常 [1] - 事件短期可能带来情绪冲击，长期影响取决于管理层稳定与转型策略的持续推进 [1] AI大模型与智能体竞争格局 - 中国AI模型Kimi K2.5在AI智能体平台OpenClaw的模型调用量中排名第一，超过Gemini 3 Flash、Claude Sonnet 4.5等模型 [2] - 此事件被视为中国开源大模型在全球AI智能体领域竞争力提升的重要信号，行业竞争从“技术追赶”转向“生态竞争” [2] AI编程模型技术进展与成本优化 - 阿里巴巴开源新一代智能体编程模型Qwen3-Coder-Next，其智能体编程性能可媲美DeepSeek-V3.2、GLM-4.7等开源模型 [3] - 该模型仅激活3B参数，实现了智能体训练的创新性扩展，并能处理长上下文和复杂智能体任务 [3] - 模型推理成本显著降低，仅为同等性能模型成本开销的5%～10%，体现了AI模型轻量化、低成本化的技术突破 [3]

阿里巴巴(US:BABA)

开源大模型

Qwen3-Coder-Next

开源大模型

Qwen3-Coder-Next

中国AI的“Max时刻”！千问最强模型开启第二增长曲线

新浪财经· 2026-01-27 20:07

文章核心观点 - 阿里巴巴通过发布旗舰推理模型Qwen3-Max-Thinking，在关键性能上超越国际顶尖模型，标志着中国AI技术实现代际领先，并可能推动资本市场对阿里巴巴及其AI业务进行价值重估 [8][10][13] - 行业正从依赖算力堆砌的“拼算力”阶段，转向追求高效智能的“拼智能”阶段，阿里巴巴通过技术创新找到了第二增长曲线 [14][17][20] - 阿里巴巴的Qwen系列在开源生态取得统治性地位，其全球采用率已超越美国，并反向影响了硅谷巨头的技术发展，重写了全球AI地缘政治格局 [22][23][25] - 阿里巴巴是中国唯一、全球唯三具备“算力、模型、应用”全栈闭环能力的科技公司，其从底层芯片到上层应用的全栈优势正在转化为坚实的护城河，为估值重构奠定基础 [31][34] 资本市场定价逻辑的演变 - 2024至2025年，市场曾因中国大模型表现而短暂对中国AI资产进行“重估”，但性质更多是情绪修复，华尔街仍将阿里的AI价值视为有潜力的看涨期权，而非核心增长引擎 [6][7] - Qwen3-Max-Thinking在多项全球权威评测中超越GPT-5.2和Gemini 3 Pro，成为首个性能最接近国际顶尖的国产模型，这改变了技术代差，使资本市场对阿里的AI重定价成为必然 [8][10][13] Qwen3-Max-Thinking的技术突破 - 模型性能实现质的飞跃，在启用工具的HLE评测中得分58.3，远超GPT-5.2-Thinking的45.5和Gemini 3 Pro的45.8，超过10分的差距意味着代际领先 [10] - 核心突破在于“测试时扩展”机制，引入“经验提取”式提炼过程，让模型进行多轮自我迭代和慢思考，在同等算力下产出更高密度的智能 [9][18][19] - 模型总参数超万亿，预训练数据高达36T Tokens，其HLE测试高分证明能处理现实世界中模糊、多变的任务 [19] - 模型实现了原生Agent能力的内化，可自主判断并调用工具，边用边思考，大幅降低幻觉，为企业级应用提供可靠性，展现了面向Agent时代规模化落地的可能性 [12][20] 行业发展趋势：从拼算力到拼智能 - 过去五年AI发展遵循Scaling Laws，依赖堆算力和数据，但2025年后遭遇高质量数据枯竭和训练成本指数级爆炸的物理墙 [15][16] - 行业增长曲线正从训练转向推理，迫切需要第二增长曲线 [17] - 阿里巴巴通过Qwen3-Max-Thinking的“系统2”式思维和高效推理机制，探索从“成本叙事”转向“价值叙事”的智能化解决方案 [18][20] 开源生态的格局重塑 - 截至2026年1月，基于Qwen的衍生模型数量突破20万个，成为全球首个达成此目标的开源家族，累计下载量突破10亿次，日均下载110万次，完全超越Llama稳居全球第一 [23] - MIT研究指出，中国开源AI模型的全球采用份额跃升至17.1%，首次超越美国的15.8% [25] - Qwen的胜利源于“全尺寸、全模态”策略，覆盖0.5B到480B全参数段并支持119种语言，使其在东南亚、中东等新兴市场成为首选 [25] - 硅谷内部出现戏剧性信号：Meta内部秘密项目采用“蒸馏”技术向Qwen学习，间接承认了Qwen在特定能力上的领先 [26][27] - 英伟达CEO黄仁勋在2025 GTC大会上直言“中国在开源领域遥遥领先” [27] 阿里巴巴的全栈能力与护城河 - 阿里巴巴是中国唯一、全球唯三具备“算力、模型、应用”全栈闭环能力的科技公司 [31] - 在算力层面，面对芯片限制，阿里平头哥研发的PPU在特定推理任务上性能已与英伟达H20相当，配合倚天710芯片构建了“一云多芯”异构算力体系，市场消息称平头哥可能独立上市 [32] - 在云基础设施层面，阿里云已构建中国最完整的AI基础设施，摩根士丹利预测其收入将在三年内翻倍，从2025财年的1180亿元增长至2028财年的2400亿元，目标是在2026年拿下中国AI云市场增量的80% [33] - 在应用层，千问APP上线首周下载量突破1000万，两个月月活即突破1亿，正从聊天机器人进化为全球首个“能办事”的AI，全面接入淘宝、支付宝等生态，将AI价值从信息层推向交易层 [34] - 公司宣布未来三年将投入超过3800亿元用于建设云和AI硬件基础设施，高达3000亿级别的投入是对未来竞争资格的买断 [34]

开源大模型

Qwen3-Max-Thinking

开源大模型

Qwen3-Max-Thinking

DeepSeek概念股短线拉升，OCR 2重磅发布，让AI学会“人类视觉逻辑”

金融界· 2026-01-27 14:18

市场反应 - DeepSeek发布新模型引发相关概念股短线拉升，云赛智联直线触及涨停，宏景科技20cm涨停，开普云、世纪恒通、并行科技短线拉升 [1] 技术突破与性能 - DeepSeek发布DeepSeek-OCR2模型，采用创新的DeepEncoder V2方法，使AI能根据图像含义动态重排图像部分，更接近人类视觉编码逻辑 [1] - 该技术打破传统OCR按固定顺序识别的局限，能更好理解图像语义关联，在复杂排版、扭曲变形、遮挡模糊等场景下识别准确率大幅提升 [6] - 在OmniDocBench v1.5基准测试中，该模型取得91.09%的成绩，较前代DeepSeek-OCR提升3.73% [6] - 模型在保持高精度的同时严格控制计算成本，其视觉Token数量限制在256至1120之间，上限与Google的Gemini-3 Pro保持一致 [6] - 在实际生产环境中，模型处理在线用户日志和PDF预训练数据时的重复率分别下降2.08%和0.81%，显示出极高的实用成熟度 [6] 架构意义与未来方向 - DeepSeek-OCR 2的发布具有深远的架构探索意义，DeepEncoder V2初步验证了使用语言模型架构作为视觉编码器的潜力 [7] - 这种架构天然继承了LLM社区在基础设施优化方面的成果，如混合专家架构和高效注意力机制 [7] - 这为迈向统一的全模态编码器提供了有希望的路径，未来单一编码器可能通过配置特定模态的可学习查询，在同一参数空间内实现对图像、音频和文本的特征提取与压缩 [7] - 模型展示的"两个级联的1D因果推理器"模式，通过将2D理解分解为"阅读逻辑推理"和"视觉任务推理"两个互补子任务，或许代表了实现真正2D推理的一种突破性架构方法 [7] 应用领域与行业机遇 - 模型可广泛应用于金融票据处理、医疗病历录入、政务文件数字化、古籍修复识别等多个领域，帮助相关企业降低人工识别成本，提升信息处理效率 [6] - OCR技术应用行业：为OCR行业带来技术升级方向，相关从事图文信息处理、数字化转型服务的企业可借助该模型优化自身产品，在金融、医疗、政务等领域拓展更多业务场景，迎来业绩增长机遇 [8] - 开源大模型服务行业：DeepSeek坚持开源开放的技术路线，持续推出高性能模型产品，为开发者和企业提供优质的模型底座，专注于大模型二次开发、模型部署与运维服务的企业将受益于行业热度提升，获得更多合作订单与市场关注 [8] - 端侧AI适配：众多企业完成DeepSeek模型在端侧设备上的适配部署，推动AI能力向边缘侧延伸，从事端侧硬件研发、边缘计算方案设计的企业将迎来发展机会，助力智能家居、智能车载、工业物联网等场景下的AI应用快速落地 [8]

Seek .(US:SKLTY)

开源大模型

OCR技术应用

开源大模型服务

开源大模型

OCR技术应用

开源大模型服务

北水动向|北水成交净买入139.3亿北水再度加仓港股ETF 抢筹盈富基金(02800)超41亿港元

智通财经· 2026-01-21 18:08

港股市场南向资金整体流向 - 1月21日，南向资金（北水）成交净买入139.3亿港元，其中港股通(沪)净买入77.89亿港元，港股通(深)净买入61.41亿港元 [1] - 南向资金净买入最多的个股是盈富基金、恒生中国企业、阿里巴巴-W [1] - 南向资金净卖出最多的个股是中国移动、腾讯、华虹半导体 [1] 主要个股资金流向详情 - 盈富基金获净买入26.99亿港元，买卖总额为28.60亿港元 [2] - 恒生中国企业获净买入18.17亿港元 [4] - 阿里巴巴-W获净买入9.45亿港元，买卖总额为42.24亿港元 [2]，另据消息，其获净买入10.77亿港元 [5] - 小米集团-W获净买入3.08亿港元，买卖总额为41.87亿港元 [2]，另据消息，其获净买入5.89亿港元 [7] - 腾讯控股获净买入2956.91万港元，买卖总额为27.43亿港元 [2]，但综合消息遭净卖出2.71亿港元 [7] - 中芯国际遭净卖出1.25亿港元，买卖总额为25.83亿港元 [2]，但另据消息其获净买入3.87亿港元 [6] - 中国移动遭净卖出9.21亿港元，买卖总额为20.70亿港元 [2][7] - 华虹半导体遭净卖出1.20亿港元，买卖总额为14.26亿港元 [2][6] - 美团-W获净买入2.05亿港元，买卖总额为8.68亿港元 [4]，另据消息其获净买入2.04亿港元 [7] - 快手-W获净买入2.62亿港元，买卖总额为6.07亿港元 [4]，另据消息其获净买入7.33亿港元 [5] - 山东黄金获净买入3.03亿港元，买卖总额为6.66亿港元 [4] - 中国人寿获净买入10.07亿港元 [5] - 中海油获净买入3.64亿港元 [7] 行业与公司动态 - 阿里巴巴旗下千问衍生模型数突破20万个，成为全球首个达成此目标的开源大模型，系列模型下载量突破10亿次，平均每天被下载110万次，稳居开源大模型全球第一 [5] - 快手旗下视频生成大模型可灵AI的月活跃用户在1月突破1200万，1月App端付费用户规模较去年12月增长约350%，日均收入水平较12月日均提升约30% [5] - 芯片行业出现分化，台积电将2026年资本开支大幅上调至520-560亿美元，DRAM价格持续上涨，DDR4部分型号周涨幅超12%，美光指出AI需求占比已快速提升至DRAM市场的50-60%，供给紧张或延续至2028年 [6] - 现货黄金价格历史首次升破4876美元/盎司关口，波兰央行批准一项购买多达150吨黄金的计划，将使该国黄金储备总量增加到700吨 [7] - 美国暂未就军事打击伊朗作出决定，转而选择通过经济手段施压，但美伊冲突仍存升级的潜在风险 [7] - 中国人寿方面，开源证券认为其个险和银保开门红均超预期，花旗预期寿险行业将迎来财富重新配置带来的历史性机遇 [5]

开源大模型

开源大模型

千问系列模型下载量超10亿次

北京商报· 2026-01-21 14:21

公司里程碑 - 阿里千问衍生模型数量超过20万个，成为全球首个达成此目标的开源大模型 [1] - 千问系列模型总下载量突破10亿次，平均每日下载量达110万次 [1] - 千问系列模型下载量超越美国Llama，成为开源大模型领域的全球第一 [1] 行业地位 - 根据AI开源社区Hugging Face的最新数据，阿里千问在开源大模型领域取得了领先地位 [1]

阿里巴巴(US:BABA)

开源大模型

开源大模型

2025年第53周：数码家电行业周度市场观察

艾瑞咨询· 2026-01-16 08:05

文章核心观点文章通过汇总多篇行业观察报告与新闻，系统性地阐述了2025年人工智能技术驱动下，多个关键行业（包括家电、医疗、物流、消费电子、机器人、自动驾驶、零售等）的深刻变革、发展趋势与竞争格局，核心观点聚焦于AI技术从探索走向规模化应用，正成为各行业转型升级和未来竞争的核心驱动力 [2][5][6][7][9][11][12][13][14][16][17][18][20][21][22][24][25][26][28][29][31][33] 行业环境 - **数据质量是AI应用成败关键**：企业数字化转型和大模型落地效果不佳，根源常在于数据质量差，存在大量“电子垃圾”和逻辑噪音，而非算法问题 [3] - **提升AI价值需遵循三原则**：企业需进行逻辑脱水（去除冗余）、定义统一（明确术语）和语境对齐（提供背景），管理者应成为“首席数据家政员” [3][4] - **高端家电市场持续增长**：消费升级推动高端家电市场，2025年报告显示家电市场零售额同比增长10.2%，白电和小家电表现突出 [5] - **高端家电呈现四大趋势**：趋势包括从单品到空间融合、AI赋能情感契合、下沉市场“性价比”竞争、中国品牌深本土化出海 [5] - **医疗AI市场高速增长**：2024年中国医疗AI市场规模达164亿元，预计2030年将增至353亿元 [6] - **医疗AI应用提升效率显著**：AI在胸外科等科室的应用可将诊断时间缩短56%-84%，并提升手术精准度 [6] - **智慧物流市场规模庞大**：预计2025年中国智慧物流市场规模将达9655亿元 [7] - **智慧物流向“全局智能”演进**：行业在人工智能驱动下，正从“单点智能”向“全局智能”甚至“自主决策”演进 [7] - **大模型开源成为主流**：2025年，开源凭借低成本、高效率优势成为大模型领域主流趋势，推动AI普惠和生态建设 [9] - **大模型企业亏损严重**：代表性企业如智谱亏损62亿元，MiniMax亏损93亿元，尽管收入增速快，但普遍面临严重亏损 [10] - **AI手机逆势增长**：在整体手机换机周期延长至51个月的背景下，AI手机逆势增长，预计2024年全球出货量占比达15%，2027年中国份额将超50% [11] - **零售业面临核心困境**：传统规模扩张失效，行业陷入存量竞争，数据割裂、供应链滞后、营销精准度不足成为核心困境 [12] - **人形机器人进入“量产元年”**：2025年被视为人形机器人“量产元年”，国内企业如智元机器人已量产超5000台 [13] - **L3自动驾驶正式开启**：随着工信部批准长安、极狐L3车型落地，L3自动驾驶时代正式开启，核心在于责任向车企转移 [14] - **AI眼镜市场快速增长但存挑战**：AI眼镜市场迎来大厂跨界热潮，增长迅速，但存在退货率高（达30%-50%）、技术不成熟等问题 [15][16][21] - **铜价飙升冲击家电业**：2025年下半年以来铜价创新高，对高度依赖铜的空调行业造成成本压力，推动“铝代铜”技术替代讨论 [18] - **机器人行业融资活跃**：2025年前三季度，机器人行业融资达500亿元，十余家公司申请港股IPO [19][20] - **全球机器人市场前景广阔**：IDC预计2029年全球机器人市场规模将超4000亿美元，中国占近半份额 [20] 头部品牌动态 - **荣耀押注AI与海外市场**：荣耀通过AI手机和拓展海外市场寻求突破，2025年重返国内市场份额前五，并在欧洲折叠屏市场份额有所提升 [24] - **蚂蚁集团布局C端AI应用**：蚂蚁集团将AI健康应用升级为“蚂蚁阿福”（月活用户1500万），并推出通用AI助手“灵光”（上线6天下载量破200万），寻求支付宝外的新入口 [25] - **小米发布自研大模型强化生态**：小米发布年度旗舰并搭载自研MiMo大模型，该模型参数3090亿，激活仅150亿，旨在通过大模型强化其庞大的硬件生态协同 [26] - **钉钉发布AI硬件向“Agent OS”转型**：钉钉发布企业级AI硬件DingTalk Real，集成通义大模型，支持内网部署和独立运行，标志其AI战略从软件向硬件延伸 [27][28] - **字节跳动大幅涨薪争夺AI人才**：字节跳动宣布大幅涨薪，奖金投入增加35%，调薪投入提升1.5倍，以吸引和保留全球AI人才，其AI应用“豆包”月活近2亿 [29] - **简智机器人快速完成融资**：简智机器人在4个月内完成超2亿元的三轮融资，通过全链路闭环方案构建具身智能数据基建，已覆盖1000多个家庭，积累百万小时数据资产 [30] - **小米宣布巨额研发投入计划**：小米集团总裁卢伟冰宣布未来五年将投入2000亿元研发资金，2026年研发投入预计约400亿元，重点布局芯片、OS和AI三大核心技术 [31][32] - **消费级机器狗取得市场突破**：Vbot超能机器狗（售价9988元）成为全球首款无需遥控的智能机器狗，开售5小时登热搜，首日销售额破千万元 [33]

小米集团(HK:01810)

开源大模型

开源大模型

春节AI王炸突袭！DeepSeekV4硬刚海外巨头，暗藏关键破局点

搜狐财经· 2026-01-15 16:03

公司发展历程与市场地位 - 公司于2024年12月26日推出基础模型V3，随后在2025年1月20日上线开源推理模型R1，凭借“先思考、再作答”的显式推理能力获得市场关注 [4] - 公司推出的R1+V3聊天产品在国内收获极高关注度，已成长为中国AI工程能力领域的标杆企业之一 [4] - 公司创始人梁文锋与北京大学研究人员于1月12日晚间共同发布了新训练架构论文，题为《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》 [9] 新一代模型V4的技术突破 - 新一代大模型V4预计于2026年2月中旬农历新年前后上线 [1] - 新模型编程能力大幅提升，在Design2Code等权威编程基准测试中以92.0分刷新纪录，可将手绘草图直接转化为可运行的React代码，多项关键指标超越GPT-4.5、Claude3.7等海外头部产品 [6] - 模型解决了超长上下文处理难题，搭载NSA机制实现64K上下文窗口下6-9倍提速，可一次性处理百万级Token，适配复杂软件工程的完整上下文需求 [6] - 模型在高端GPU受限的情况下研发而成，依托自研的mHC架构，训练稳定性大幅提升 [7] - 在270亿参数模型测试中，仅增加6.7%训练时间，就使复杂推理任务准确率从43.8%跃升至51.0%，有效规避了行业常见的训练崩溃与性能衰减问题 [7] 核心架构创新与竞争策略 - 论文提出的Engram条件记忆模块，核心是实现计算与存储“解耦”，让CPU负责静态知识存储，GPU专注推理计算，无需依赖芯片数量堆砌即可实现模型规模扩展 [10] - 公司采取“不拼资源拼方法”的路线，在海外大厂侧重算力与参数竞赛时，深耕效率与架构创新，形成差异化竞争 [10] - V4的推出旨在证明自身技术领先性，并向行业验证其架构创新方法论的成熟度 [13] - 从内部反馈看，V4回答结构严谨、推理路径清晰，拆解复杂任务能力可靠，是一次贴合实际应用需求的实用型升级 [13] 行业趋势与竞争格局 - 2025年开源成为大模型行业的核心趋势之一，大厂和初创公司密集发布模型，争夺全球开源生态话语权 [11] - DeepSeek、MiniMax、智谱、月之暗面等中国企业，频繁与全球同行同台竞技，旗下模型在HuggingFace等国际社区的存在感持续提升 [11] - 全球大模型竞争焦点已从单纯的参数竞赛，转向技术方法的精妙与运行效率高下的角逐 [16] - V4的市场表现，不仅关乎公司在全球开源生态中的地位，更能折射出中国大模型技术路线的成熟度 [16]

Seek .(US:SKLTY)

Artificial Intelligence

开源大模型

Artificial Intelligence

Artificial Intelligence

开源大模型

Artificial Intelligence

存储大周期的投资机会梳理

2026-01-08 10:07

纪要涉及的行业或公司 * 半导体设备行业[1][3][13][19] * 存储行业[1][2][6][8][13] * 算力租赁/AI基础设施行业[1][4][7][10][11] * 大模型/AI应用行业[1][4][5][8][9] * 机器人行业[2][12] * 商业航空行业[9] * 公司：长鑫存储[1][3][13]、长江存储[3]、阿里云[1][4][5][9][11]、协创数据[1][6][7]、协创科技[1][11][12]、科玛科技[1][14][15][16][17][18][19]、中微公司[1][19]、长川科技[19]、英伟达[2][11][12]、Lambda[2]、Cover[10]、斯达令[9]、SpaceX[9] 核心观点和论据 **1 半导体设备与存储行业进入强周期，国内龙头被低估且盈利强劲** * 国内半导体设备板块过去两年被低估，当前行情超预期[2][3] * 存储产业正迎来一轮超级牛市和超级周期[2][8] * 长鑫存储2025年四季度收入250亿元、利润87亿元，预计2026年Q1利润约240亿元，Q2增长至约300亿元，盈利能力强劲[13] * 预计2030年资本开支高点可能远超400亿美元，达到500-600亿美元，将打开行业龙头估值和股价空间[1][3] * 此轮先进逻辑和存储扩产周期比2021年更强[13] **2 算力租赁与AI基础设施：国内具备显著优势，协创数据/科技为核心标的** * 协创数据是国内最大的第三方算力租赁平台[1][7] * 国内算力租赁行业相比海外更易成功，核心优势：IDC建设周期短（从拿卡到产生收入仅需3个月）、融资成本低（中国约3% vs 美国超10%）[7][10] * 协创科技与阿里云建立战略合作，是国内少数获英伟达官方背书认证的服务商[1][11] * 协创科技过去一年累计采购221亿元用于算力租赁和购买芯片，每投入100亿元资本开支，约产生30多亿元年收入和10亿元新增利润[11] * 2026年计划在221亿元基础上进行翻倍以上投资，目标实现千亿投资、百亿利润[11] * 协创科技推出基于英伟达生态的F Cloud OmniBot机器人推理平台，是公司重要护城河[12] **3 AI大模型：阿里云千问展现全球竞争力，带动产业链机会** * 阿里云千问大模型是全球最优秀的开源大模型之一，在全球范围内具有竞争力[1][4][5][9] * 对阿里云2026年收入持乐观态度[1][4] * 阿里云背后的算力支持及供应链存在投资机会[1][4] **4 半导体设备耗材：科玛科技高增长，市场空间巨大** * 科玛科技陶瓷加热器业务取得重大突破，市场需求极大[1][14] * 产能从2025年底150颗/月提升至2026年底300颗/月，2027年计划再翻倍[15] * 预计2026年陶瓷加热器收入比2025年增长4倍，总收入约3亿元，产品毛利率高达70-80%，净利率50%[1][15] * 预计公司2026年总利润接近10亿元，2027年可能达20亿元[15] * 2025年国内陶瓷加热器市场规模预计50亿元，远期市场空间（含逻辑客户）预计达200亿元[16] * 静电卡盘业务市场空间不小于陶瓷加热器，已通过龙头设备厂商验证，是潜在第二增长曲线[17] **5 具体公司推荐与目标展望** * **中微公司**：2025年70%订单来自存储客户，随着国产化率提升，在十五五规划期间总收入可达90-100亿美元，目标市值4000亿元[1][19] * **长川科技**：2025年利润约13-14亿元，是当前最便宜的半导体设备资产（约30倍PE）[19] * **科玛科技**：综合陶瓷结构件、加热器、静电卡盘业务，到十五五规划结束后目标市值达2000亿元是大概率事件[18][19] * 在存储设备产业链中，耗材首推科玛科技，设备推荐中微公司和长川科技[19] 其他重要内容 * 存储涨价将大幅增加厂商盈利，加速中国存储在全球市场占有率提升[1][8] * 协创数据在存储模组领域敏锐度高，与全球闪存巨头签有晶圆保供协议，其DRAM业务通过二手服务器回收翻新，自2024年四季度以来堪称暴利[6] * 2027年产业趋势还包括商业航空主线（如斯达令、SpaceX）[9] * 当前市场行情被判断为一轮长期行情的开端，而非短期事件驱动[9] * 根据十五五规划，到2025年底，长鑫、长存两厂产能将至少翻三倍，设备厂收入也会有至少三倍以上增长[16]

存储超级周期

开源大模型

半导体设备

阿里云千问大模型

陶瓷加热器

存储超级周期

开源大模型

半导体设备

阿里云千问大模型

陶瓷加热器

陈天桥代季峰打响2026大模型第一枪：30B参数跑出1T性能

量子位· 2026-01-06 13:48

产品发布与核心定位 - 陈天桥与代季峰团队于新年伊始发布自研旗舰版搜索智能体模型MiroThinker 1.5，定位为智能体模型领域的“最强小钢炮” [1] - 该模型由MiroMind团队开发，该团队此前曾凭借成功预测Polymarket筛选题目而连续登顶Future X全球榜首 [9] - MiroThinker 1.5的推出标志着团队在已有技术积累上更进一步，整体预测能力达到新水平 [10] 性能基准测试表现 - 在HLE-Text测试中得分为39.2%，在BrowseComp测试中得分为69.8%，在BrowseComp-ZH测试中得分为71.5%，在GAIA-Val-165测试中得分为80.8% [3] - 与国内外顶尖模型对比，其235B参数版本在BrowseComp测试中以69.8%的得分超越了ChatGPT Agent的68.9%，刷新了该榜单纪录 [4][5] - 在GAIA-Val-165测试中，235B版本以80.8%的得分超越了GPT-5-High的76.7%和Gemini-3-Pro的74.8% [4] - 其30B参数版本在BrowseComp-ZH测试中以66.8%的得分，超越了1T参数的Kimi-K2-Thinking的62.3%，实现了4.5%的性能超越 [4][8] 核心优势：高智效比与低成本 - 模型参数规模显著小于主流模型，仅30B和235B，约为其他顶尖模型参数规模的1/30 [7] - 在实现相近甚至更好性能的同时，拥有极低的推理成本，例如MiroThinker 1.5的单条调用成本低至0.07美元，仅为Kimi模型的1/20 [8] - 模型的推理速度也显著优于Kimi-K2-Thinking等大参数模型 [8] - 公司对开发者友好，模型上线即开源 [8] 技术范式创新：交互式智能 - 行业普遍存在过度依赖堆叠参数和资源的问题，本质是让模型记忆更多知识并进行长链推理，一旦中间步骤出错会导致错误累积放大 [46][47] - 当模型参数规模达到一定程度后，继续堆资源的边际收益会迅速下降，行业需寻找新的智能增长路径 [48] - MiroThinker 1.5的解法在于将推理过程与外部环境深度绑定，为每一轮推理引入反馈校验环节，构建“推理-验证-修正”的循环路径 [48] - 核心是将Interactive Scaling从推理阶段前移并内化为训练阶段的核心机制，把模型训练成注重求证、校验和自我修正的探索型Agent [48] - 模型对于不确定性问题先交互再判断，对于高风险结论先查证再收敛，能够按需向外部世界精准取证，从而以更小的参数规模实现更高的智能密度 [49] - 这是其推理成本显著降低但性能保持一线水准的根本原因 [50] 关键技术：时序敏感训练与主动求证 - 通过“时序敏感训练沙盒”严格约束模型只能使用当前可见的信息做出真实预测，杜绝复述结果或使用未来数据“剧透” [52] - 该沙盒包含可控数据合成引擎和时序敏感训练机制，从机制上彻底杜绝未来信息泄露，迫使模型学会在信息不完备、有噪声和信号延迟的真实条件下完成推演并不断修正 [53][54] - 模型具备Evidence-Seeking能力，会将关键判断拆解为可验证子假设并主动发起对外查询、检索与比对，缺乏信源支撑的输出会受到惩罚 [56] - 模型具备Iterative Verification能力，推理过程允许反复回溯修正，当发现证据矛盾时会立即调整，而非将错误延续 [56] - 模型具备Anti-Hallucination能力，会对看似合理但缺乏证据的推理结果给予否定并标记为低质量，更关注“怎样得出答案”而非简单对错 [56] 行业逻辑转变：从“做题家”到“科学家” - 传统的Scaling Law是“做题家模式”，依赖记忆和统计，而非真正的理解和验证 [60] - MiroMind团队提出了除模型规模、上下文长度之外的第三大核心可扩展维度Interactive Scaling，将智能增长空间瞄准外部世界 [58] - 内化Interactive Scaling的模型像“科学家”一样建立研究闭环：提出假设→向外部世界查数据/取证→发现对不上→修正假设→再查证，直到证据收敛 [60] - 这有效降低了Scaling Law导致的幻觉，提升了可靠性 [61] - 此举是底层逻辑的转变，将有限的算力效益最大化，导向对外的信息获取与交互，把智能扩展维度从“更大脑袋”变成“更勤快的手” [62] - 这与MiroMind强调的“发现式智能”相契合，即在未知条件下重建对世界的理解，抽丝剥茧发现真相 [63] - 公司认为智能“奇点”的关键在于交互，并已率先转换赛道 [64]

开源大模型

发现式智能

Interactive Scaling

时序敏感训练沙盒

Artificial Intelligence

MiroThinker 1.5

开源大模型

发现式智能

Interactive Scaling

时序敏感训练沙盒

Artificial Intelligence

MiroThinker 1.5

斯坦福报告揭秘中国开源AI全景：本土模型能否领跑全球？

搜狐财经· 2026-01-03 21:19

报告核心观点 - 斯坦福大学HAI与DigiChina项目联合发布的政策简报指出，中国开放权重AI模型已从全球追赶者变为领跑者，并形成了一个庞大且多元的生态系统，DeepSeek仅是其中一员 [1][3][42] 行业地位与市场数据 - 在开源大模型领域，中国已从追赶者变为领跑者 [4][30][43] - 阿里巴巴旗下的Qwen模型系列于2025年9月超越Meta的Llama，成为Hugging Face平台下载量最高的大语言模型家族 [4][17][44] - 截至2025年12月中旬，Qwen累计下载量达约3.85亿次，Llama约为3.46亿次 [4][17][44] - 2024年8月至2025年8月间，中国开发者的模型下载量占Hugging Face总下载量的17.1%，首次超过美国的15.8% [4][17][44] - 2025年9月，基于中国模型的衍生版本占Hugging Face当月新增衍生模型的63% [6][19][46] 主要参与者与模型特点 - 报告重点剖析了四个具有代表性的中国模型家族 [7][20][33] - **Qwen（阿里巴巴）**：定位于多语言和多模态能力最强的通用模型，支持119种语言，采用Apache 2.0许可证开源 [7][20][33] - **DeepSeek-R1（DeepSeek）**：以推理能力见长，在数学和复杂问题求解方面表现突出，提供多个蒸馏版本 [7][20][33] - **Kimi K2（月之暗面）**：聚焦于代码生成和智能体任务，强调快速推理 [7][20][33] - **GLM-4.5（智谱AI/Z.ai）**：走均衡路线，通过多专家训练整合推理、编程和视觉能力 [7][20][33] - 性能榜单显示，中国模型（如GLM-4.6、Kimi-K2-Thinking、Qwen3-VL-235B等）在Elo、Coding等多项评分中位居前列 [8][21][34] 技术架构与驱动因素 - 中国模型普遍采用混合专家（MoE）架构，核心优势在于效率，能在有限计算资源下获得更好性能 [9][22][35] - 采用MoE架构是应对美国自2022年起对先进AI芯片实施出口管制的策略 [9][22][35] - 以DeepSeek-V3为例，总参数量高达6,710亿，但单次推理仅激活370亿参数，在保证性能的同时大幅降低运行成本 [9][22][35] - 2025年，主要模型的开源许可证策略趋向宽松，如Qwen3采用Apache 2.0，DeepSeek R1采用MIT License，以吸引全球开发者并建立学术信誉 [10][23][36] - 开放潮流影响了此前坚持闭源的玩家，百度于2025年6月将其旗舰产品文心一言（ERNIE）4.5以开放权重形式发布 [10][23][36] 政策环境与商业模式 - 中国官方在顶层设计上支持开源AI发展，2017年的《新一代人工智能发展规划》已将“开源”和“开放”列为关键词汇 [10][23][36] - 2023年10月的《全球人工智能治理倡议》和2025年7月的《全球人工智能治理行动计划》将开源AI提升至国际话语权争夺的高度 [11][24][37] - 中国开放权重AI的繁荣更多是市场竞争、人才积累和工程文化共同作用的结果，而非纯粹自上而下的规划产物 [11][24][37] - 地方政府为参与开源社区的AI组织和项目提供定向财政支持，学术机构被鼓励将开源贡献纳入科研考核 [12][25][38] - 已有不少地方公共服务部门将DeepSeek模型的本地化版本集成到相关系统中 [12][25][38] - **阿里巴巴**的商业模式是将Qwen定位为“AI操作系统”，通过企业和政府客户采用模型来带动云计算业务增长，客户包括HP、阿斯利康，新加坡国家AI计划也基于Qwen3构建旗舰模型 [12][25][38] - **DeepSeek和智谱**走轻资产路线，采取协作部署策略，为不同云和算力提供商的客户提供本地化服务 [12][25][38] - 行业目前仍依赖间接变现：通过广泛采用的开放模型培育用户基础，再将其引导至付费产品和服务 [12][25][38] 全球影响与竞争态势 - 高性能中国模型的广泛可用，为资源有限的低收入和中等收入国家提供了获取先进AI能力的新路径 [13][26][39] - 中国模型因“够好用”、许可证宽松、使用成本低而受到青睐，例如Airbnb CEO透露公司使用Qwen而非ChatGPT为客服机器人供电，原因是“又快又便宜” [13][26][39] - DeepSeek R1的发布直接改变了美国对开放权重AI的政策态度，被特朗普总统称为“警醒时刻” [14][27][40] - 2025年7月，白宫发布《美国AI行动计划》，将开放权重模型提升为战略资产，同时强调加强对中国等对手的出口管制 [14][27][40] - 2025年8月，OpenAI时隔近六年首次发布开放权重模型，Sam Altman承认中国开源模型的竞争是促使该决定的重要因素 [14][27][40] - 真正的行业竞争已演变为生态竞争、工程竞争、成本竞争与合规竞争叠加的系统战 [15][28][41]

开源大模型

混合专家（Mixture of Experts

Qwen（通义千问）

开源大模型

混合专家（Mixture of Experts

Qwen（通义千问）