开源大模型
搜索文档
中国AI的“Max时刻”!千问最强模型开启第二增长曲线
新浪财经· 2026-01-27 20:07
文章核心观点 - 阿里巴巴通过发布旗舰推理模型Qwen3-Max-Thinking,在关键性能上超越国际顶尖模型,标志着中国AI技术实现代际领先,并可能推动资本市场对阿里巴巴及其AI业务进行价值重估 [8][10][13] - 行业正从依赖算力堆砌的“拼算力”阶段,转向追求高效智能的“拼智能”阶段,阿里巴巴通过技术创新找到了第二增长曲线 [14][17][20] - 阿里巴巴的Qwen系列在开源生态取得统治性地位,其全球采用率已超越美国,并反向影响了硅谷巨头的技术发展,重写了全球AI地缘政治格局 [22][23][25] - 阿里巴巴是中国唯一、全球唯三具备“算力、模型、应用”全栈闭环能力的科技公司,其从底层芯片到上层应用的全栈优势正在转化为坚实的护城河,为估值重构奠定基础 [31][34] 资本市场定价逻辑的演变 - 2024至2025年,市场曾因中国大模型表现而短暂对中国AI资产进行“重估”,但性质更多是情绪修复,华尔街仍将阿里的AI价值视为有潜力的看涨期权,而非核心增长引擎 [6][7] - Qwen3-Max-Thinking在多项全球权威评测中超越GPT-5.2和Gemini 3 Pro,成为首个性能最接近国际顶尖的国产模型,这改变了技术代差,使资本市场对阿里的AI重定价成为必然 [8][10][13] Qwen3-Max-Thinking的技术突破 - 模型性能实现质的飞跃,在启用工具的HLE评测中得分58.3,远超GPT-5.2-Thinking的45.5和Gemini 3 Pro的45.8,超过10分的差距意味着代际领先 [10] - 核心突破在于“测试时扩展”机制,引入“经验提取”式提炼过程,让模型进行多轮自我迭代和慢思考,在同等算力下产出更高密度的智能 [9][18][19] - 模型总参数超万亿,预训练数据高达36T Tokens,其HLE测试高分证明能处理现实世界中模糊、多变的任务 [19] - 模型实现了原生Agent能力的内化,可自主判断并调用工具,边用边思考,大幅降低幻觉,为企业级应用提供可靠性,展现了面向Agent时代规模化落地的可能性 [12][20] 行业发展趋势:从拼算力到拼智能 - 过去五年AI发展遵循Scaling Laws,依赖堆算力和数据,但2025年后遭遇高质量数据枯竭和训练成本指数级爆炸的物理墙 [15][16] - 行业增长曲线正从训练转向推理,迫切需要第二增长曲线 [17] - 阿里巴巴通过Qwen3-Max-Thinking的“系统2”式思维和高效推理机制,探索从“成本叙事”转向“价值叙事”的智能化解决方案 [18][20] 开源生态的格局重塑 - 截至2026年1月,基于Qwen的衍生模型数量突破20万个,成为全球首个达成此目标的开源家族,累计下载量突破10亿次,日均下载110万次,完全超越Llama稳居全球第一 [23] - MIT研究指出,中国开源AI模型的全球采用份额跃升至17.1%,首次超越美国的15.8% [25] - Qwen的胜利源于“全尺寸、全模态”策略,覆盖0.5B到480B全参数段并支持119种语言,使其在东南亚、中东等新兴市场成为首选 [25] - 硅谷内部出现戏剧性信号:Meta内部秘密项目采用“蒸馏”技术向Qwen学习,间接承认了Qwen在特定能力上的领先 [26][27] - 英伟达CEO黄仁勋在2025 GTC大会上直言“中国在开源领域遥遥领先” [27] 阿里巴巴的全栈能力与护城河 - 阿里巴巴是中国唯一、全球唯三具备“算力、模型、应用”全栈闭环能力的科技公司 [31] - 在算力层面,面对芯片限制,阿里平头哥研发的PPU在特定推理任务上性能已与英伟达H20相当,配合倚天710芯片构建了“一云多芯”异构算力体系,市场消息称平头哥可能独立上市 [32] - 在云基础设施层面,阿里云已构建中国最完整的AI基础设施,摩根士丹利预测其收入将在三年内翻倍,从2025财年的1180亿元增长至2028财年的2400亿元,目标是在2026年拿下中国AI云市场增量的80% [33] - 在应用层,千问APP上线首周下载量突破1000万,两个月月活即突破1亿,正从聊天机器人进化为全球首个“能办事”的AI,全面接入淘宝、支付宝等生态,将AI价值从信息层推向交易层 [34] - 公司宣布未来三年将投入超过3800亿元用于建设云和AI硬件基础设施,高达3000亿级别的投入是对未来竞争资格的买断 [34]
DeepSeek概念股短线拉升,OCR 2重磅发布,让AI学会“人类视觉逻辑”
金融界· 2026-01-27 14:18
DeepSeek概念股短线拉升,云赛智联直线触及涨停,宏景科技20cm涨停,开普云、世纪恒通、并行科 技短线拉升。消息面上,DeepSeek发布DeepSeek-OCR2模型。据了解,DeepSeek-OCR2模型采用创新的 DeepEncoder V2方法,让AI能够根据图像的含义动态重排图像的各个部分,更接近人类的视觉编码逻 辑。 DeepSeek-OCR 2的发布不仅是一次OCR性能的升级,更具有深远的架构探索意义。DeepEncoder V2初步 验证了使用语言模型架构作为视觉编码器的潜力。这种架构天然继承了LLM社区在基础设施优化方面的 成果,如混合专家(MoE)架构和高效注意力机制。 该技术打破了传统OCR仅按照固定顺序识别图像内容的局限,能够更好地理解图像语义关联,在复杂排 版、扭曲变形、遮挡模糊等场景下的识别准确率大幅提升,可广泛应用于金融票据处理、医疗病历录 入、政务文件数字化、古籍修复识别等多个领域,帮助相关企业降低人工识别成本,提升信息处理效 率。 根据DeepSeek公布的技术报告,DeepSeek-OCR 2在多项关键指标上展现出显著优势。在OmniDocBench v1.5基准测试 ...
北水动向|北水成交净买入139.3亿 北水再度加仓港股ETF 抢筹盈富基金(02800)超41亿港元
智通财经· 2026-01-21 18:08
港股市场南向资金整体流向 - 1月21日,南向资金(北水)成交净买入139.3亿港元,其中港股通(沪)净买入77.89亿港元,港股通(深)净买入61.41亿港元 [1] - 南向资金净买入最多的个股是盈富基金、恒生中国企业、阿里巴巴-W [1] - 南向资金净卖出最多的个股是中国移动、腾讯、华虹半导体 [1] 主要个股资金流向详情 - 盈富基金获净买入26.99亿港元,买卖总额为28.60亿港元 [2] - 恒生中国企业获净买入18.17亿港元 [4] - 阿里巴巴-W获净买入9.45亿港元,买卖总额为42.24亿港元 [2],另据消息,其获净买入10.77亿港元 [5] - 小米集团-W获净买入3.08亿港元,买卖总额为41.87亿港元 [2],另据消息,其获净买入5.89亿港元 [7] - 腾讯控股获净买入2956.91万港元,买卖总额为27.43亿港元 [2],但综合消息遭净卖出2.71亿港元 [7] - 中芯国际遭净卖出1.25亿港元,买卖总额为25.83亿港元 [2],但另据消息其获净买入3.87亿港元 [6] - 中国移动遭净卖出9.21亿港元,买卖总额为20.70亿港元 [2][7] - 华虹半导体遭净卖出1.20亿港元,买卖总额为14.26亿港元 [2][6] - 美团-W获净买入2.05亿港元,买卖总额为8.68亿港元 [4],另据消息其获净买入2.04亿港元 [7] - 快手-W获净买入2.62亿港元,买卖总额为6.07亿港元 [4],另据消息其获净买入7.33亿港元 [5] - 山东黄金获净买入3.03亿港元,买卖总额为6.66亿港元 [4] - 中国人寿获净买入10.07亿港元 [5] - 中海油获净买入3.64亿港元 [7] 行业与公司动态 - 阿里巴巴旗下千问衍生模型数突破20万个,成为全球首个达成此目标的开源大模型,系列模型下载量突破10亿次,平均每天被下载110万次,稳居开源大模型全球第一 [5] - 快手旗下视频生成大模型可灵AI的月活跃用户在1月突破1200万,1月App端付费用户规模较去年12月增长约350%,日均收入水平较12月日均提升约30% [5] - 芯片行业出现分化,台积电将2026年资本开支大幅上调至520-560亿美元,DRAM价格持续上涨,DDR4部分型号周涨幅超12%,美光指出AI需求占比已快速提升至DRAM市场的50-60%,供给紧张或延续至2028年 [6] - 现货黄金价格历史首次升破4876美元/盎司关口,波兰央行批准一项购买多达150吨黄金的计划,将使该国黄金储备总量增加到700吨 [7] - 美国暂未就军事打击伊朗作出决定,转而选择通过经济手段施压,但美伊冲突仍存升级的潜在风险 [7] - 中国人寿方面,开源证券认为其个险和银保开门红均超预期,花旗预期寿险行业将迎来财富重新配置带来的历史性机遇 [5]
千问系列模型下载量超10亿次
北京商报· 2026-01-21 14:21
公司里程碑 - 阿里千问衍生模型数量超过20万个,成为全球首个达成此目标的开源大模型 [1] - 千问系列模型总下载量突破10亿次,平均每日下载量达110万次 [1] - 千问系列模型下载量超越美国Llama,成为开源大模型领域的全球第一 [1] 行业地位 - 根据AI开源社区Hugging Face的最新数据,阿里千问在开源大模型领域取得了领先地位 [1]
2025年第53周:数码家电行业周度市场观察
艾瑞咨询· 2026-01-16 08:05
文章核心观点 文章通过汇总多篇行业观察报告与新闻,系统性地阐述了2025年人工智能技术驱动下,多个关键行业(包括家电、医疗、物流、消费电子、机器人、自动驾驶、零售等)的深刻变革、发展趋势与竞争格局,核心观点聚焦于AI技术从探索走向规模化应用,正成为各行业转型升级和未来竞争的核心驱动力 [2][5][6][7][9][11][12][13][14][16][17][18][20][21][22][24][25][26][28][29][31][33] 行业环境 - **数据质量是AI应用成败关键**:企业数字化转型和大模型落地效果不佳,根源常在于数据质量差,存在大量“电子垃圾”和逻辑噪音,而非算法问题 [3] - **提升AI价值需遵循三原则**:企业需进行逻辑脱水(去除冗余)、定义统一(明确术语)和语境对齐(提供背景),管理者应成为“首席数据家政员” [3][4] - **高端家电市场持续增长**:消费升级推动高端家电市场,2025年报告显示家电市场零售额同比增长10.2%,白电和小家电表现突出 [5] - **高端家电呈现四大趋势**:趋势包括从单品到空间融合、AI赋能情感契合、下沉市场“性价比”竞争、中国品牌深本土化出海 [5] - **医疗AI市场高速增长**:2024年中国医疗AI市场规模达164亿元,预计2030年将增至353亿元 [6] - **医疗AI应用提升效率显著**:AI在胸外科等科室的应用可将诊断时间缩短56%-84%,并提升手术精准度 [6] - **智慧物流市场规模庞大**:预计2025年中国智慧物流市场规模将达9655亿元 [7] - **智慧物流向“全局智能”演进**:行业在人工智能驱动下,正从“单点智能”向“全局智能”甚至“自主决策”演进 [7] - **大模型开源成为主流**:2025年,开源凭借低成本、高效率优势成为大模型领域主流趋势,推动AI普惠和生态建设 [9] - **大模型企业亏损严重**:代表性企业如智谱亏损62亿元,MiniMax亏损93亿元,尽管收入增速快,但普遍面临严重亏损 [10] - **AI手机逆势增长**:在整体手机换机周期延长至51个月的背景下,AI手机逆势增长,预计2024年全球出货量占比达15%,2027年中国份额将超50% [11] - **零售业面临核心困境**:传统规模扩张失效,行业陷入存量竞争,数据割裂、供应链滞后、营销精准度不足成为核心困境 [12] - **人形机器人进入“量产元年”**:2025年被视为人形机器人“量产元年”,国内企业如智元机器人已量产超5000台 [13] - **L3自动驾驶正式开启**:随着工信部批准长安、极狐L3车型落地,L3自动驾驶时代正式开启,核心在于责任向车企转移 [14] - **AI眼镜市场快速增长但存挑战**:AI眼镜市场迎来大厂跨界热潮,增长迅速,但存在退货率高(达30%-50%)、技术不成熟等问题 [15][16][21] - **铜价飙升冲击家电业**:2025年下半年以来铜价创新高,对高度依赖铜的空调行业造成成本压力,推动“铝代铜”技术替代讨论 [18] - **机器人行业融资活跃**:2025年前三季度,机器人行业融资达500亿元,十余家公司申请港股IPO [19][20] - **全球机器人市场前景广阔**:IDC预计2029年全球机器人市场规模将超4000亿美元,中国占近半份额 [20] 头部品牌动态 - **荣耀押注AI与海外市场**:荣耀通过AI手机和拓展海外市场寻求突破,2025年重返国内市场份额前五,并在欧洲折叠屏市场份额有所提升 [24] - **蚂蚁集团布局C端AI应用**:蚂蚁集团将AI健康应用升级为“蚂蚁阿福”(月活用户1500万),并推出通用AI助手“灵光”(上线6天下载量破200万),寻求支付宝外的新入口 [25] - **小米发布自研大模型强化生态**:小米发布年度旗舰并搭载自研MiMo大模型,该模型参数3090亿,激活仅150亿,旨在通过大模型强化其庞大的硬件生态协同 [26] - **钉钉发布AI硬件向“Agent OS”转型**:钉钉发布企业级AI硬件DingTalk Real,集成通义大模型,支持内网部署和独立运行,标志其AI战略从软件向硬件延伸 [27][28] - **字节跳动大幅涨薪争夺AI人才**:字节跳动宣布大幅涨薪,奖金投入增加35%,调薪投入提升1.5倍,以吸引和保留全球AI人才,其AI应用“豆包”月活近2亿 [29] - **简智机器人快速完成融资**:简智机器人在4个月内完成超2亿元的三轮融资,通过全链路闭环方案构建具身智能数据基建,已覆盖1000多个家庭,积累百万小时数据资产 [30] - **小米宣布巨额研发投入计划**:小米集团总裁卢伟冰宣布未来五年将投入2000亿元研发资金,2026年研发投入预计约400亿元,重点布局芯片、OS和AI三大核心技术 [31][32] - **消费级机器狗取得市场突破**:Vbot超能机器狗(售价9988元)成为全球首款无需遥控的智能机器狗,开售5小时登热搜,首日销售额破千万元 [33]
春节AI王炸突袭!DeepSeekV4硬刚海外巨头,暗藏关键破局点
搜狐财经· 2026-01-15 16:03
公司发展历程与市场地位 - 公司于2024年12月26日推出基础模型V3,随后在2025年1月20日上线开源推理模型R1,凭借“先思考、再作答”的显式推理能力获得市场关注 [4] - 公司推出的R1+V3聊天产品在国内收获极高关注度,已成长为中国AI工程能力领域的标杆企业之一 [4] - 公司创始人梁文锋与北京大学研究人员于1月12日晚间共同发布了新训练架构论文,题为《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》 [9] 新一代模型V4的技术突破 - 新一代大模型V4预计于2026年2月中旬农历新年前后上线 [1] - 新模型编程能力大幅提升,在Design2Code等权威编程基准测试中以92.0分刷新纪录,可将手绘草图直接转化为可运行的React代码,多项关键指标超越GPT-4.5、Claude3.7等海外头部产品 [6] - 模型解决了超长上下文处理难题,搭载NSA机制实现64K上下文窗口下6-9倍提速,可一次性处理百万级Token,适配复杂软件工程的完整上下文需求 [6] - 模型在高端GPU受限的情况下研发而成,依托自研的mHC架构,训练稳定性大幅提升 [7] - 在270亿参数模型测试中,仅增加6.7%训练时间,就使复杂推理任务准确率从43.8%跃升至51.0%,有效规避了行业常见的训练崩溃与性能衰减问题 [7] 核心架构创新与竞争策略 - 论文提出的Engram条件记忆模块,核心是实现计算与存储“解耦”,让CPU负责静态知识存储,GPU专注推理计算,无需依赖芯片数量堆砌即可实现模型规模扩展 [10] - 公司采取“不拼资源拼方法”的路线,在海外大厂侧重算力与参数竞赛时,深耕效率与架构创新,形成差异化竞争 [10] - V4的推出旨在证明自身技术领先性,并向行业验证其架构创新方法论的成熟度 [13] - 从内部反馈看,V4回答结构严谨、推理路径清晰,拆解复杂任务能力可靠,是一次贴合实际应用需求的实用型升级 [13] 行业趋势与竞争格局 - 2025年开源成为大模型行业的核心趋势之一,大厂和初创公司密集发布模型,争夺全球开源生态话语权 [11] - DeepSeek、MiniMax、智谱、月之暗面等中国企业,频繁与全球同行同台竞技,旗下模型在HuggingFace等国际社区的存在感持续提升 [11] - 全球大模型竞争焦点已从单纯的参数竞赛,转向技术方法的精妙与运行效率高下的角逐 [16] - V4的市场表现,不仅关乎公司在全球开源生态中的地位,更能折射出中国大模型技术路线的成熟度 [16]
存储大周期的投资机会梳理
2026-01-08 10:07
纪要涉及的行业或公司 * 半导体设备行业[1][3][13][19] * 存储行业[1][2][6][8][13] * 算力租赁/AI基础设施行业[1][4][7][10][11] * 大模型/AI应用行业[1][4][5][8][9] * 机器人行业[2][12] * 商业航空行业[9] * 公司:长鑫存储[1][3][13]、长江存储[3]、阿里云[1][4][5][9][11]、协创数据[1][6][7]、协创科技[1][11][12]、科玛科技[1][14][15][16][17][18][19]、中微公司[1][19]、长川科技[19]、英伟达[2][11][12]、Lambda[2]、Cover[10]、斯达令[9]、SpaceX[9] 核心观点和论据 **1 半导体设备与存储行业进入强周期,国内龙头被低估且盈利强劲** * 国内半导体设备板块过去两年被低估,当前行情超预期[2][3] * 存储产业正迎来一轮超级牛市和超级周期[2][8] * 长鑫存储2025年四季度收入250亿元、利润87亿元,预计2026年Q1利润约240亿元,Q2增长至约300亿元,盈利能力强劲[13] * 预计2030年资本开支高点可能远超400亿美元,达到500-600亿美元,将打开行业龙头估值和股价空间[1][3] * 此轮先进逻辑和存储扩产周期比2021年更强[13] **2 算力租赁与AI基础设施:国内具备显著优势,协创数据/科技为核心标的** * 协创数据是国内最大的第三方算力租赁平台[1][7] * 国内算力租赁行业相比海外更易成功,核心优势:IDC建设周期短(从拿卡到产生收入仅需3个月)、融资成本低(中国约3% vs 美国超10%)[7][10] * 协创科技与阿里云建立战略合作,是国内少数获英伟达官方背书认证的服务商[1][11] * 协创科技过去一年累计采购221亿元用于算力租赁和购买芯片,每投入100亿元资本开支,约产生30多亿元年收入和10亿元新增利润[11] * 2026年计划在221亿元基础上进行翻倍以上投资,目标实现千亿投资、百亿利润[11] * 协创科技推出基于英伟达生态的F Cloud OmniBot机器人推理平台,是公司重要护城河[12] **3 AI大模型:阿里云千问展现全球竞争力,带动产业链机会** * 阿里云千问大模型是全球最优秀的开源大模型之一,在全球范围内具有竞争力[1][4][5][9] * 对阿里云2026年收入持乐观态度[1][4] * 阿里云背后的算力支持及供应链存在投资机会[1][4] **4 半导体设备耗材:科玛科技高增长,市场空间巨大** * 科玛科技陶瓷加热器业务取得重大突破,市场需求极大[1][14] * 产能从2025年底150颗/月提升至2026年底300颗/月,2027年计划再翻倍[15] * 预计2026年陶瓷加热器收入比2025年增长4倍,总收入约3亿元,产品毛利率高达70-80%,净利率50%[1][15] * 预计公司2026年总利润接近10亿元,2027年可能达20亿元[15] * 2025年国内陶瓷加热器市场规模预计50亿元,远期市场空间(含逻辑客户)预计达200亿元[16] * 静电卡盘业务市场空间不小于陶瓷加热器,已通过龙头设备厂商验证,是潜在第二增长曲线[17] **5 具体公司推荐与目标展望** * **中微公司**:2025年70%订单来自存储客户,随着国产化率提升,在十五五规划期间总收入可达90-100亿美元,目标市值4000亿元[1][19] * **长川科技**:2025年利润约13-14亿元,是当前最便宜的半导体设备资产(约30倍PE)[19] * **科玛科技**:综合陶瓷结构件、加热器、静电卡盘业务,到十五五规划结束后目标市值达2000亿元是大概率事件[18][19] * 在存储设备产业链中,耗材首推科玛科技,设备推荐中微公司和长川科技[19] 其他重要内容 * 存储涨价将大幅增加厂商盈利,加速中国存储在全球市场占有率提升[1][8] * 协创数据在存储模组领域敏锐度高,与全球闪存巨头签有晶圆保供协议,其DRAM业务通过二手服务器回收翻新,自2024年四季度以来堪称暴利[6] * 2027年产业趋势还包括商业航空主线(如斯达令、SpaceX)[9] * 当前市场行情被判断为一轮长期行情的开端,而非短期事件驱动[9] * 根据十五五规划,到2025年底,长鑫、长存两厂产能将至少翻三倍,设备厂收入也会有至少三倍以上增长[16]
陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能
量子位· 2026-01-06 13:48
产品发布与核心定位 - 陈天桥与代季峰团队于新年伊始发布自研旗舰版搜索智能体模型MiroThinker 1.5,定位为智能体模型领域的“最强小钢炮” [1] - 该模型由MiroMind团队开发,该团队此前曾凭借成功预测Polymarket筛选题目而连续登顶Future X全球榜首 [9] - MiroThinker 1.5的推出标志着团队在已有技术积累上更进一步,整体预测能力达到新水平 [10] 性能基准测试表现 - 在HLE-Text测试中得分为39.2%,在BrowseComp测试中得分为69.8%,在BrowseComp-ZH测试中得分为71.5%,在GAIA-Val-165测试中得分为80.8% [3] - 与国内外顶尖模型对比,其235B参数版本在BrowseComp测试中以69.8%的得分超越了ChatGPT Agent的68.9%,刷新了该榜单纪录 [4][5] - 在GAIA-Val-165测试中,235B版本以80.8%的得分超越了GPT-5-High的76.7%和Gemini-3-Pro的74.8% [4] - 其30B参数版本在BrowseComp-ZH测试中以66.8%的得分,超越了1T参数的Kimi-K2-Thinking的62.3%,实现了4.5%的性能超越 [4][8] 核心优势:高智效比与低成本 - 模型参数规模显著小于主流模型,仅30B和235B,约为其他顶尖模型参数规模的1/30 [7] - 在实现相近甚至更好性能的同时,拥有极低的推理成本,例如MiroThinker 1.5的单条调用成本低至0.07美元,仅为Kimi模型的1/20 [8] - 模型的推理速度也显著优于Kimi-K2-Thinking等大参数模型 [8] - 公司对开发者友好,模型上线即开源 [8] 技术范式创新:交互式智能 - 行业普遍存在过度依赖堆叠参数和资源的问题,本质是让模型记忆更多知识并进行长链推理,一旦中间步骤出错会导致错误累积放大 [46][47] - 当模型参数规模达到一定程度后,继续堆资源的边际收益会迅速下降,行业需寻找新的智能增长路径 [48] - MiroThinker 1.5的解法在于将推理过程与外部环境深度绑定,为每一轮推理引入反馈校验环节,构建“推理-验证-修正”的循环路径 [48] - 核心是将Interactive Scaling从推理阶段前移并内化为训练阶段的核心机制,把模型训练成注重求证、校验和自我修正的探索型Agent [48] - 模型对于不确定性问题先交互再判断,对于高风险结论先查证再收敛,能够按需向外部世界精准取证,从而以更小的参数规模实现更高的智能密度 [49] - 这是其推理成本显著降低但性能保持一线水准的根本原因 [50] 关键技术:时序敏感训练与主动求证 - 通过“时序敏感训练沙盒”严格约束模型只能使用当前可见的信息做出真实预测,杜绝复述结果或使用未来数据“剧透” [52] - 该沙盒包含可控数据合成引擎和时序敏感训练机制,从机制上彻底杜绝未来信息泄露,迫使模型学会在信息不完备、有噪声和信号延迟的真实条件下完成推演并不断修正 [53][54] - 模型具备Evidence-Seeking能力,会将关键判断拆解为可验证子假设并主动发起对外查询、检索与比对,缺乏信源支撑的输出会受到惩罚 [56] - 模型具备Iterative Verification能力,推理过程允许反复回溯修正,当发现证据矛盾时会立即调整,而非将错误延续 [56] - 模型具备Anti-Hallucination能力,会对看似合理但缺乏证据的推理结果给予否定并标记为低质量,更关注“怎样得出答案”而非简单对错 [56] 行业逻辑转变:从“做题家”到“科学家” - 传统的Scaling Law是“做题家模式”,依赖记忆和统计,而非真正的理解和验证 [60] - MiroMind团队提出了除模型规模、上下文长度之外的第三大核心可扩展维度Interactive Scaling,将智能增长空间瞄准外部世界 [58] - 内化Interactive Scaling的模型像“科学家”一样建立研究闭环:提出假设→向外部世界查数据/取证→发现对不上→修正假设→再查证,直到证据收敛 [60] - 这有效降低了Scaling Law导致的幻觉,提升了可靠性 [61] - 此举是底层逻辑的转变,将有限的算力效益最大化,导向对外的信息获取与交互,把智能扩展维度从“更大脑袋”变成“更勤快的手” [62] - 这与MiroMind强调的“发现式智能”相契合,即在未知条件下重建对世界的理解,抽丝剥茧发现真相 [63] - 公司认为智能“奇点”的关键在于交互,并已率先转换赛道 [64]
斯坦福报告揭秘中国开源AI全景:本土模型能否领跑全球?
搜狐财经· 2026-01-03 21:19
报告核心观点 - 斯坦福大学HAI与DigiChina项目联合发布的政策简报指出,中国开放权重AI模型已从全球追赶者变为领跑者,并形成了一个庞大且多元的生态系统,DeepSeek仅是其中一员 [1][3][42] 行业地位与市场数据 - 在开源大模型领域,中国已从追赶者变为领跑者 [4][30][43] - 阿里巴巴旗下的Qwen模型系列于2025年9月超越Meta的Llama,成为Hugging Face平台下载量最高的大语言模型家族 [4][17][44] - 截至2025年12月中旬,Qwen累计下载量达约3.85亿次,Llama约为3.46亿次 [4][17][44] - 2024年8月至2025年8月间,中国开发者的模型下载量占Hugging Face总下载量的17.1%,首次超过美国的15.8% [4][17][44] - 2025年9月,基于中国模型的衍生版本占Hugging Face当月新增衍生模型的63% [6][19][46] 主要参与者与模型特点 - 报告重点剖析了四个具有代表性的中国模型家族 [7][20][33] - **Qwen(阿里巴巴)**:定位于多语言和多模态能力最强的通用模型,支持119种语言,采用Apache 2.0许可证开源 [7][20][33] - **DeepSeek-R1(DeepSeek)**:以推理能力见长,在数学和复杂问题求解方面表现突出,提供多个蒸馏版本 [7][20][33] - **Kimi K2(月之暗面)**:聚焦于代码生成和智能体任务,强调快速推理 [7][20][33] - **GLM-4.5(智谱AI/Z.ai)**:走均衡路线,通过多专家训练整合推理、编程和视觉能力 [7][20][33] - 性能榜单显示,中国模型(如GLM-4.6、Kimi-K2-Thinking、Qwen3-VL-235B等)在Elo、Coding等多项评分中位居前列 [8][21][34] 技术架构与驱动因素 - 中国模型普遍采用混合专家(MoE)架构,核心优势在于效率,能在有限计算资源下获得更好性能 [9][22][35] - 采用MoE架构是应对美国自2022年起对先进AI芯片实施出口管制的策略 [9][22][35] - 以DeepSeek-V3为例,总参数量高达6,710亿,但单次推理仅激活370亿参数,在保证性能的同时大幅降低运行成本 [9][22][35] - 2025年,主要模型的开源许可证策略趋向宽松,如Qwen3采用Apache 2.0,DeepSeek R1采用MIT License,以吸引全球开发者并建立学术信誉 [10][23][36] - 开放潮流影响了此前坚持闭源的玩家,百度于2025年6月将其旗舰产品文心一言(ERNIE)4.5以开放权重形式发布 [10][23][36] 政策环境与商业模式 - 中国官方在顶层设计上支持开源AI发展,2017年的《新一代人工智能发展规划》已将“开源”和“开放”列为关键词汇 [10][23][36] - 2023年10月的《全球人工智能治理倡议》和2025年7月的《全球人工智能治理行动计划》将开源AI提升至国际话语权争夺的高度 [11][24][37] - 中国开放权重AI的繁荣更多是市场竞争、人才积累和工程文化共同作用的结果,而非纯粹自上而下的规划产物 [11][24][37] - 地方政府为参与开源社区的AI组织和项目提供定向财政支持,学术机构被鼓励将开源贡献纳入科研考核 [12][25][38] - 已有不少地方公共服务部门将DeepSeek模型的本地化版本集成到相关系统中 [12][25][38] - **阿里巴巴**的商业模式是将Qwen定位为“AI操作系统”,通过企业和政府客户采用模型来带动云计算业务增长,客户包括HP、阿斯利康,新加坡国家AI计划也基于Qwen3构建旗舰模型 [12][25][38] - **DeepSeek和智谱**走轻资产路线,采取协作部署策略,为不同云和算力提供商的客户提供本地化服务 [12][25][38] - 行业目前仍依赖间接变现:通过广泛采用的开放模型培育用户基础,再将其引导至付费产品和服务 [12][25][38] 全球影响与竞争态势 - 高性能中国模型的广泛可用,为资源有限的低收入和中等收入国家提供了获取先进AI能力的新路径 [13][26][39] - 中国模型因“够好用”、许可证宽松、使用成本低而受到青睐,例如Airbnb CEO透露公司使用Qwen而非ChatGPT为客服机器人供电,原因是“又快又便宜” [13][26][39] - DeepSeek R1的发布直接改变了美国对开放权重AI的政策态度,被特朗普总统称为“警醒时刻” [14][27][40] - 2025年7月,白宫发布《美国AI行动计划》,将开放权重模型提升为战略资产,同时强调加强对中国等对手的出口管制 [14][27][40] - 2025年8月,OpenAI时隔近六年首次发布开放权重模型,Sam Altman承认中国开源模型的竞争是促使该决定的重要因素 [14][27][40] - 真正的行业竞争已演变为生态竞争、工程竞争、成本竞争与合规竞争叠加的系统战 [15][28][41]
2025盘点:DeepSeek引领AI进化 国补激发消费活力 行业重塑带来更多可能
新浪财经· 2026-01-01 00:07
文章核心观点 2025年是中国数码3C行业经历深刻变革与加速发展的一年,以DeepSeek为代表的国产AI大模型引领了全球AI效率至上的新周期,国家补贴政策强力激活了消费市场,充电宝行业因安全事件迎来最严监管与洗牌,AI眼镜市场实现爆发式增长,同时系统级AI助手的出现引发了关于未来手机形态与生态权限的行业大讨论,这些变化共同重塑了产业的底层逻辑,标志着中国企业正从“并跑”向“领跑”跨越的关键节点 [1][14][27] DeepSeek引领AI效率革命 - 2025年1月20日,DeepSeek-R1发布,以仅约600万美元的极低训练成本冲击硅谷算力霸权,其数学和代码推理能力可对标顶级闭源模型 [1][15] - 9月推出的V3.2-Exp引入稀疏注意力机制,将API价格再次“腰斩”,12月发布的V3.2正式版将逻辑思考与Agent工具调用深度融合,在国际赛事中获金牌级表现 [2][16] - DeepSeek的“开源平权”策略,让千元级手机、入门级AI眼镜等设备能通过低成本云端API实现智能体验,引领了全球AI公司加码开源大模型的风潮 [2][16] “国补元年”激活3C消费市场 - 2025年1月8日,国家发改委、财政部发布政策,首次将手机、平板、智能手表纳入以旧换新补贴范畴,单机最高补贴500元,政策上线20天内即扭转消费疲软 [3][16] - 下半年政策扩容,广东、江苏、四川等14省地方加码,使单台设备综合补贴上限冲至700元,直接拉动全年3C零售额突破1200亿元 [3][16] - 补贴政策不仅带动销量,也促使消费者转向中高端产品,并将昂贵的AI体验门槛拉低至平民水准,加速了全行业智能化普及 [5][18] - 官方已宣布2026年国补政策将延续,且补贴范围有望进一步覆盖至智能眼镜等新兴品类 [5][18] “罗马仕事件”引发充电宝行业强监管 - 2025年6月,移动电源巨头罗马仕因产品自燃隐患被多所高校“封杀”,并遭民航局通报,该公司随后宣布召回近50万台问题产品,行业另一巨头安克也召回71万件 [5][19] - 事件导火索指向上游电芯供应商安普瑞斯未经报备擅自变更隔膜材料 [5][19] - 监管迅速反应:6月28日民航局发布紧急禁令;8月15日国家认监委强制要求所有在售充电宝加贴3C标志;11月工信部公示新增针刺试验等要求的“史上最严”新国标,计划于2026年Q1正式发布 [7][21] - 受事件影响,罗马仕自7月起停工整改6个月,近万张不达标的3C证书被撤销,行业告别低价公模的“狂野时代” [7][21] AI眼镜行业迎来爆发元年 - 2025年AI眼镜享受最高500元补贴,大幅降低消费门槛 [8][22] - 市场规模跨越式增长,全年全球出货量预计达1205万台,中国市场突破275万台,同比激增107%,稳居全球第一 [8][22] - 行业进入“百镜大战”,不仅Rokid、影目等专业品牌发力,华为、小米、阿里、理想汽车等巨头跨界入局,全球近70家企业布局,国际市场上Meta、谷歌与三星等纷纷加码 [10][24] 字节“豆包手机”引发系统级AI助手权限之争 - 12月1日,字节跳动联手中兴推出努比亚M153工程机,搭载“豆包手机助手技术预览版”,赋予AI模拟人类操作的全局权限,可实现跨应用连贯操作 [10][24] - 该技术随后引发“权限攻防战”,微信、支付宝等多家平台以“环境风险”为由对其进行了风控封禁 [12][26] - 此事件揭示了AI时代厂商App底层权限、用户信息安全与交互自由的多维矛盾,并引发行业对手机未来形态的思考:是封闭的应用容器,还是完全开放的数字化分身 [14][27]