Workflow
Qwen3系列
icon
搜索文档
3B打32B?海外病毒式传播的小模型,竟然来自BOSS直聘
机器之心· 2026-03-09 11:58
行业趋势:大模型军备竞赛与“小模型”的兴起 - 大模型行业正经历激烈的“军备竞赛”,开源与闭源阵营都在疯狂追求更大的参数量和算力,模型规模已膨胀至“近乎离谱”的程度 [1] - 过去GPT-2仅有约1.5B参数,如今GPT-4的参数规模估计已达万亿水平,GPT-5预计更大,而2026年发布的开源模型如Kimi K2.5和Ling 2.5也已达到万亿参数规模 [1][2] - 然而,“模型大就一定强”的定律正在动摇,一个仅3B参数的小模型在“50米洗车”等复杂推理问题上,表现超越了万亿级参数的大模型,凸显了模型能力与参数规模并非绝对正相关 [5][7] 核心案例:Nanbeige4.1-3B模型的突破性表现 - BOSS直聘南北阁实验室发布的Nanbeige4.1-3B模型,以仅3B的参数量,实现了通用问答、复杂推理、代码编写和深度搜索等综合能力,挑战了“小模型难通用”的刻板印象 [10][19][21] - 该模型在多项评测中显著超越同规模开源模型(如Qwen3-4B、Qwen3-8B),并在综合指标上超越了参数量大10倍的Qwen3-32B与Qwen3-30B-A3B模型 [11] - 即使与发布时间更晚、参数接近的Qwen3.5-4B模型对比,Nanbeige4.1-3B在六大核心指标上依然整体领先,展现了稳健的技术优势 [14] - 模型发布后迅速获得社区关注,登上HuggingFace文本模型趋势榜第一,并一度冲进全球模型总榜前三 [14] 技术解析:实现“小而全”的关键方法 - 研究团队采用了分阶段、分领域的优化策略,在有限的3B参数规模内系统性地整合了多项能力,并保持了各领域间的能力平衡 [21][22] - **通用能力优化**:调整了指令数据的结构比例,提高代码类样本、数学难题和复杂推理任务的占比,以强化小模型对深层逻辑的建模能力 [23] - **上下文长度扩展**:采用三阶段课程学习(32K → 64K → 256K),渐进式地让模型适应更长的依赖关系,稳定学习长距离注意力结构 [24] - **回复质量提升**:通过引入Solution Refinement(解答迭代优化)与CoT Reconstruction(思维链重构)框架,减少推理中的逻辑跳步和不连贯问题,提升思维链的忠实度和一致性 [26][27][30] 训练机制:创新的强化学习(RL)策略 - 团队创新性地将RL拆分为两个阶段:Point-wise RL和Pair-wise RL [33] - **Point-wise RL**:引入通用奖励模型对单条回答质量评分,显著降低了冗长、重复与格式错误,将LiveCodeBench-v6的格式错误率从5.27%降至0.38% [34][35] - **Pair-wise RL**:让模型与其他模型进行PK,由Pair-wise奖励模型判断回答优劣,使模型在竞争环境中迭代提升,不仅提升了Arena-Hard V2等对抗评测成绩,也对Multi-Challenge等单点评分任务带来明显收益 [35][36] 专项能力:编码与深度搜索的深度优化 - **编码能力**:采用两阶段RL策略,并设计了“门控时间复杂度奖励”机制,即时间奖励仅在解答通过所有测试用例(正确率100%)时才会被激活,确保模型先追求正确性,再优化效率 [38][39] - **深度搜索能力**:通过构建大规模、结构复杂的搜索数据集,并引入“轮次级质量控制”机制,对每一轮搜索交互的推理逻辑、工具调用和信息增益进行独立评估,训练模型形成稳定的“检索-判断-再检索”循环结构 [45][46][48] - 在深度搜索基准测试中,Nanbeige4.1-3B在xBench-DeepSearch-2505上达到75分,在GAIA (text-only)上达到69.90分,成绩接近专为搜索打造的AgentCPM-Explore-4B模型 [54][55] 性能验证:全面的基准测试与实战检验 - 在综合基准测试中,Nanbeige4.1-3B在多数测试上超越了参数规模10倍以上的模型,并在与Qwen3-Next-80B-A3B等超大模型的对比中保持竞争力,各项指标互有胜负 [50][53] - 在代码领域,其LCB-V6得分达76.9,远超Qwen3-32B的57.4;在数学领域,AIME 2025得分达90.83,优于Qwen3-30B-A3B的87.8 [51] - 在模型发布后举办的真实任务竞赛中(如LeetCode周赛和HMMT数学竞赛),Nanbeige4.1-3B的表现不仅显著优于Qwen3.5-4B,甚至超过了参数量更大的Qwen3.5-9B,有力证明了其极强的泛化与推理能力 [56][57][58] 行业影响与未来展望 - Nanbeige4.1-3B的成功表明,通过精细化的训练方法创新,小模型可以形成独立、通用的能力体系,而不再仅仅是大模型的“轻量替代品” [60][61] - 参数规模的差距正被训练范式的创新所弥补,原本依赖大模型规模优势的Agent与复杂推理能力,开始下沉到更具部署友好性的小尺度模型 [61] - 当3B模型即可稳定处理推理、编程与搜索任务时,企业侧的部署范式将被重写,为移动端、本地化及私有化部署场景打开了巨大的想象空间 [62] - 行业认为,大模型的边界在扩张的同时,小模型的效率革命也在发生,未来决定AI应用广度的关键,可能是“小参数模型所能释放的智能密度” [63][64]
兴业证券:2026年值得关注的十大产业趋势
智通财经网· 2026-02-18 11:45
文章核心观点 文章提出了2026年值得关注的十大产业趋势,认为这些方向将构成核心投资主线,并基于产业趋势迭代与政策导向对每个领域进行了详细分析 [1] AI应用 - **全球AI竞赛持续深化,模型迭代推动应用场景落地**:市场关注焦点从资本开支转向应用商业化落地,国内外大模型密集迭代并在各场景实现突破,证明前期算力投入正转化为模型能力与场景渗透,2026年爆款应用落地值得期待 [2] - **海外竞争格局多极化,开源力量与AIAgent崛起**:竞争格局从OpenAI独大转向多极化,ChatGPT仍领跑,但谷歌Gemini、XAI(Grok)、Meta、Anthropic等通过构建闭环生态形成制衡,开源模型如OpenClaw快速崛起,其token调用量在OpenRouter平台已位居首位,同时AIAgent迈向自主智能,推动垂直高价值场景加速商业化 [3] - **国内AI应用迎来爆发拐点,模型与场景共振**:2025年是国内模型迭代与落地的关键一年,DeepSeek、阿里通义千问、MiniMax等头部模型加速开源,竞争重心从参数比拼转向应用落地,字节豆包、阿里通义千问、腾讯元宝等通过核心业务卡位,构建生态闭环,2026年国内AI应用有望完成从模型落地到场景变现的转化 [5] - **多模态与垂直AIAgent是配置重点**:建议重点关注持续迭代的多模态模型对影视、游戏、广告等内容创意领域的赋能,以及规则明确、人力成本高的垂直高价值场景AIAgent的商业化,包括医疗、金融、法律、教育、税务、政务等赛道 [6] AI算力 - **海外科技巨头资本开支维持高增长**:2025年北美四大云服务厂商资本开支合计达3592亿美元,2026年亚马逊、谷歌、Meta、微软四家资本开支指引合计约5987亿美元,同比预计增长67%,反映AI算力需求具备确定性 [7] - **产业链新技术与新需求加速推进**:数据中心向超大规模集群发展,推动1.6T乃至3.2T高速光模块加速商用,硅光技术、CPO等前沿技术持续突破,同时海量算力需求带动光纤、液冷等关键基础设施供需缺口扩大 [7] - **国产替代加速推进,生态逐步完善**:美国出口管制加速国产替代,华为昇腾、寒武纪、海光信息等头部厂商持续加大投入,自研芯片与本土大模型(如华为昇腾与DeepSeek)深度适配,应用落地倒逼算力架构优化 [9] - **光模块与国产芯片是配置重点**:建议重点关注占据全球主要份额的国内头部光模块供应商,以及高速率光模块、光纤、CPO、液冷等配套技术,同时关注国产AI芯片龙头企业在推理市场份额的提升 [10] 存储 - **AI驱动存储进入新一轮超级周期**:AI服务器对DRAM和NAND的需求是传统服务器的8–10倍,2025年AI服务器消耗全球内存月产能的53%,导致高端存储颗粒供应紧张,2025年第四季度全球存储价格整体上涨超40%,2026年供需矛盾或持续推高价格 [11] - **供给端产能受限,供不应求格局延续**:三星、SK海力士、美光等将先进产能转向DDR5与HBM,造成消费级存储产能缺口扩大,国产存储厂商扩产周期长,新增产能预计2026年下半年逐步释放,但难以迅速收敛供需缺口,长鑫存储、长江存储最大扩产计划预计2027年投产 [16] - **存储芯片龙头与上游设备封测受益**:建议重点关注在供需持续紧张背景下景气具备确定性的存储芯片龙头,以及受国内超级扩产周期驱动的上游半导体设备和封测环节 [18] 商业航天 - **战略地位跃升,政策资金持续加码**:商业航天是中美大国博弈必争之地,我国连续两年将其写入《政府工作报告》,2025年11月专项政策提出22项重点举措,并设立首期规模200亿元的国家商业航天发展基金 [19] - **资本市场政策配套,企业IPO提速**:国内开启上市快速审批通道,截至2026年2月15日已有超10家商业航天企业启动上市辅导,蓝箭航天、星河动力等进入实质申报阶段,电科蓝天已于2026年2月10日登陆科创板 [21] - **核心技术取得突破,产业进入商业化放量关键期**:国内在卫星批产和可复用火箭两大核心技术上取得实质性突破,2026年2月11日梦舟载人飞船成功实施海上回收,标志返回舱具备多次重复使用能力,行业正由主题行情转向计价景气 [22] - **卫星制造、火箭产业链及上游材料是配置重点**:建议重点关注作为降本核心突破口的卫星批产技术与可重复使用火箭相关产业链,以及有望受益于国家基金支持的上游材料和地面设备 [26] 人形机器人 - **海外巨头量产节奏清晰,国产零部件供应商受益**:特斯拉计划2026年产能目标提升10倍至5万-10万台,并发布第三代Optimus,Figure AI计划未来4年累计交付10万台,其量产计划带动国产减速器、滚珠丝杠、电机、传感器等零部件加速供应 [27] - **国内主机厂商量产落地,出货量占据优势**:2025年全球人形机器人出货量前六品牌均来自中国,智元机器人以5168台出货量位居榜首,占全球39%市场份额,优必选Walker系列全年订单总额超13亿元,国产零部件厂商深度参与国内外供应链 [30] - **本体公司与核心零部件是配置重点**:建议重点关注依托国产供应链加速规模化生产的国内人形机器人本体公司,以及随海外巨头采购需求增加,有望率先兑现业绩的丝杠、减速器、轻量化材料、灵巧手等核心零部件环节 [31] 智能驾驶 - **国内政策落地推动L3商业化元年**:2025年下半年政策密集催化,工信部有条件批准L3级车型生产准入并许可长安和北汽蓝谷两款L3车型,北京、武汉、广州等地出台支持政策,理想、小鹏、奇瑞、广汽等厂商计划2026年实现L3级量产或推进 [32] - **海外特斯拉FSD引领技术,英伟达提供全栈支持**:特斯拉FSD V14进一步AI化,计划实现推理功能,引领无人监督FSD技术方向,英伟达发布开源AI模型并提供成熟的芯片与平台,加速L2++与Robotaxi量产落地 [35] - **L3级车企与智驾硬件供应商是配置重点**:建议重点关注已发布L3级车型的国产车企,以及智驾芯片、激光雷达、域控制器、传感器等核心硬件供应商 [36] 电网储能 - **北美缺电推动国内电力设备出海加速**:海外AI算力扩张催生电力需求,而北美电网老化严重,美国能源部评估到2030年将有104吉瓦发电能力退役,停电风险增加,2026年国产燃气轮机、燃气内燃机、柴发等有望加速出海 [37] - **国内“十五五”电网投资大幅提升,储能政策完善**:国家电网“十五五”固定资产投资规划达4万亿元,较“十四五”增长40%,其中2026年预算达7200亿,目标冲刺7800亿,特高压投资将优先落地,同时容量电价新机制将电网侧独立新型储能纳入,使其从成本项转为收益项 [40] - **电网设备、出海动力设备及储能产业链是配置重点**:建议重点关注受益于国内特高压投资的主网设备(换流阀、变压器等),受益于北美缺电的国产燃气轮机等出海设备,以及受益于全球需求共振的储能锂电池产业链 [43] 化工 - **反内卷政策引导供给侧出清**:2025年政策严控新产能、推进老旧装置改造,以涤纶长丝为代表的行业推行减产保价,截至25Q3多数化工细分板块产能利用率与库存已降至较低水平,行业经历去库和去产能,供给结构优化 [44] - **新兴产业趋势推动新材料需求向好**:AI、新能源、机器人等产业趋势为化工新材料带来增量,如AI数据中心需要高频高速树脂、液冷材料,新能源拉动磷产业链、硫磺需求,人形机器人需要PEEK与MXD6等高性能材料 [47] - **格局优化品类与新材料是配置重点**:建议关注供给已到底部、供需格局优化的细分品类(如有机硅、钛白粉、化学纤维等),以及受益于下游产业趋势的新材料品种(如AI智驾材料、新能源材料、机器人材料等) [48] 创新药 - **中国药企竞争力提升,BD出海持续加速**:2025年中国创新药license out数量超100项,总金额超1100亿美元,仅次于美国,在ADC、双抗、小核酸等前沿技术赛道具备开发优势,BD逻辑具备可持续性 [49] - **国内商业化进入兑现期,产业链需求复苏**:2025年中国创新药BD出海交易总金额达1357亿美元,首付款70亿美元,交易数量157起,均创历史新高,2026年全球CDMO需求持续高景气,国内CRO企业新签订单量增价稳,收入和利润有望改善 [52] - **出海龙头企业与前沿技术赛道是配置重点**:建议关注具有大单背书的BD出海龙头企业,以及中国具备全球竞争力的前沿技术赛道,如ADC、双抗、小核酸、CAR-T等 [53] 脑机接口 - **海外Neuralink启动规模化量产,重塑行业预期**:Neuralink宣布2026年启动脑机接口设备大规模生产并推进手术自动化,标志着全球首个侵入式系统从临床进入量产准备期,新一代产品性能将提升至三倍 [54] - **国内“十五五”政策引领布局,支付体系创新加速落地**:脑机接口被列为“十五五”规划重点布局的未来产业和新的经济增长点,2025年多项政策支持其发展,支付体系创新加速其收费目录覆盖和商业化落地 [57] - **全产业链是配置重点**:建议关注上游芯片、传感器、电极等核心零部件,中游系统集成、算法与设备制造,下游优先关注应用最成熟的医疗康复场景 [59]
Token售卖已无溢价、大模型公司转型“系统商”?记忆张量 CTO 李志宇:智能体能力会拉开差距,长期记忆与状态管理成竞争核心
AI前线· 2026-01-12 19:04
文章核心观点 - 大模型行业正从单纯追求模型规模扩展(Scaling up)转向追求系统效率、长期记忆与状态管理等可持续能力,竞争焦点从模型性能转向系统架构和工程化落地能力[2][8][17] - 智能体(Agent)是下一阶段核心主赛道,但现有模型的推理稳定性与可持续性不足,真正自主的智能体需要模型在推理过程可控、状态保持及系统协同三方面优化,竞争关键在于围绕模型构建的记忆、推理和系统架构能力[2][14][15] - 大模型公司正在演变为系统公司,核心竞争力在于构建具备长期记忆与状态管理能力的智能基础设施,而非单一的模型产品[2][17] - 若2026年各家模型能力无法形成代际差异,价格战将愈演愈烈,模型厂商需通过提供记忆增值服务、MCP增值服务等超越纯Token售卖的增值服务来获取溢价[2][16] 2025年行业现状与公司表现 - 2025年涌现出如MiniMax和智谱等冲击港股上市的“赛点公司”,以及Mannus等现象级Agentic产品,展示了商业化价值和场景可行性,但上市招股书也揭示了大模型公司普遍面临的投产比低、亏损严重等问题[4] - 科技公司面临技术节奏加快与商业回报不确定性放大的多层叠加压力,需同时应对持续投入算力与成本现金流约束,包括POC项目需评估收益[5] - 行业应对压力更趋理性,更强调系统效率、真实使用场景和可持续技术积累,而非单纯追逐参数规模或热点概念[5] - 员工整体状态“压力不小,但方向更清楚”,行业正从早期红利阶段走向拼工程、拼长期价值的阶段[5] 国内外AI发展水平对比 - 国内前沿AI在基础模型能力、多模态理解、推理效率和工程化落地方面取得实质性进展,涌现出DeepSeek-R2、Qwen3系列等优秀模型,在成本控制、系统优化和应用适配上形成自身优势[6] - 在部分通用能力和工程执行层面,与硅谷的差距正在快速缩小,甚至在某些场景下具备竞争力[6] - 但在长期基础研究积累、原创范式探索及面向下一代智能的系统性布局上,整体仍存在差距[6] - 竞争正进入更健康阶段,从单点能力对标转向技术路线和系统能力的分化[6] 技术发展趋势与路线变化 - Scaling up(扩大模型规模)仍能提升模型能力,但经济效益下降,已不再是单独成立的答案[8] - 行业瓶颈在于模型“用不好已有的信息”,如长上下文稳定性、跨时间一致性、复杂任务持续推理能力,多模态发展放大了此问题[8] - 技术路线关键变化是从训练时把模型做大,转向运行时让模型用得更好,强化学习、测试时计算、显式推理结构被大规模引入以补足纯预训练的不足[11] - 记忆、工具调用和系统编排成为核心能力,而不再只是外挂能力,模型能力提升正从一次性参数写入转向可持续的系统演化[11] - MoE架构在2025年成为主流,是在参数规模与推理开销间找到平衡的工程选择,解决了“算力怎么省”的问题,但并未改变智能范式或自动带来更好的推理稳定性[12] - 非MoE路线企业的差异化竞争力在于系统层面构建独特能力,如更有效的记忆机制、更稳定的推理流程或更贴近真实应用的数据闭环[12] 情境感知与智能体发展 - 2025年行业对情境感知的理解进步快于能力本身,意识到其不等于上下文长度,而是对环境、历史、目标和约束的综合理解能力[13] - 模型在短期情境理解、多轮对话连贯性、多模态即时状态感知上有提升,但在长期、跨任务、跨时间的情境一致性上能力仍有限[13] - 技术路线变化体现为将情境感知从模型内部的隐式能力转向系统层面的显式建模,如引入长期记忆、状态表示、环境建模和任务轨迹管理[13] - 情境感知正从一个模型特性演变为一个系统能力,这是智能体和长期智能成立的关键[14] - 大模型需在三个方面优化以支持智能体:推理从一次性回答转向过程可控;对状态的理解和保持能力;与工具、环境和记忆系统的协同能力[14] - 现有模型的推理能力不足以支撑真正意义上的自主智能体,瓶颈在于稳定性和可持续性,模型会漂移、遗忘、在长链路决策中逐步失真[15] 合成数据与推理数据集构建 - 大规模合成数据替代人工数据是正在发生但易被误读的趋势,合成数据已成为高质量训练数据的重要来源,尤其在推理能力、复杂任务分解场景[9] - 高价值合成数据需被严格约束、可验证、能放大信息增益,而非模型随意生成[9] - 构建高质量推理数据集需关注两点:是否有明确的推理结构(如中间状态、决策分支和失败路径);是否引入对抗性和反事实设计以暴露模型盲区[9] 模型价格战与商业模式演进 - 2025年模型价格战最关键的影响是模型性能提升上限受阻导致模型Tokens售卖溢价降低,不同厂商模型性能差异减小及模型开源使得纯售卖模型Token难以获得企业溢价认可[15] - 若2026年开源与闭源模型、不同公司模型间无法形成代际差,价格战将继续甚至愈演愈烈[16] - 部分国产卡下场且效率提升后,由于算力补贴存在,价格将逼近冰点,甚至越用越亏[16] - 模型厂商需在纯模型Token售卖模式上提供增值服务,如MCP增值服务、记忆增值服务等,通过额外能力提升来提供溢价空间[16] 未来竞争核心与代际飞跃方向 - 2026年大模型竞赛的核心是“记忆能力如何完成一次系统性升级”[18] - 技术演进趋势是从底层算力和KV Cache等激活记忆管理,到基模型层引入记忆原生机制,再到上层通过显式记忆支撑Agent和应用的长期运行能力,形成完整的记忆技术栈升级[18] - 下一次“大模型代际飞跃”可能来自系统层面管理参数记忆、激活记忆和显式记忆,跨推理过程进行调度、复用和隔离的能力,这将带来智能形态本身的跃迁[18] - 大模型公司的核心竞争力是构建具备长期记忆与状态管理能力的系统,这能让AI长期运行、持续进化,公司本质是在构建新的智能基础设施[17]
2025年AI的温柔转身:从颠覆行业到生活“缝补匠”
36氪· 2025-12-26 18:06
行业年度回顾与趋势 - 2025年AI行业完成了从单点技术突破到全生态构建的关键一跃,大模型竞争从单纯比拼参数转向追求极致效率,智能体告别概念演示迈入规模化落地新阶段 [1] - 2025年初,DeepSeek凭借高效推理迅速出圈,Meta持续深耕开源生态,中国模型厂商在算力受限环境下通过算法优化交出瞩目答卷 [1] - 2025年9月,阿里云在云栖大会发布Qwen3系列,万亿参数级别的Qwen3 Max正式亮相,定位为“AI时代的Android”,拉开生态竞争序幕 [1] - 2025年末,AI技术已渗透日常生活,Nano Banana的AI生图让创意生成成为全民日常,灵光的“全民开发”生态让普通人零门槛搭建应用,豆包手机让智能体验融入掌心 [1] 辅助技术与无障碍应用 - 灵光AI应用帮助用户创建沟通工具,例如为偏瘫失语老人创建带有大按钮的语音应用,上线仅1个月用户已成功创建1200万个闪应用 [2] - Be My Eyes应用覆盖全球上百个国家,汇聚超过820万名明眼志愿者与74万名视障用户,2025年全面接入GPT-4o,通过实时视觉描述帮助视障用户独立决策 [2][3] - 2025年12月13日,集成视觉语言大模型与3D体素神经网络的智能导盲犬“小蒜”在深圳黄木岗交通枢纽试点,视障乘客可通过口头指令激活路径规划 [3] - 深圳地铁在黄木岗枢纽设置智能导盲服务点,通过视觉语言大模型驱动的服务填补人工引导无法覆盖的24小时空白 [4] 教育普惠与AI应用 - 豆包推出的AI英语外教Owen已陪伴超过700万人次在线练习口语,服务覆盖偏远山区留守儿童及城市儿童 [5] - 在贵州石阡困牛山红军学校,希沃提供的算力“盒子”将普通教室变为实时响应的AI空间,自动生成深度反馈报告以精准指出学生薄弱环节 [5] - 在甘肃会宁,快手公益捐建的数字教室利用可灵AI的生成能力,帮助乡村孩子将画作变成动画并编写代码,截至2025年底已有超过1.4万名乡村学生通过此类教室接触前沿科技 [5] 医疗健康与AI赋能 - 浙江的医院使用AI医生分身在线上解答老人高血压用药疑问并提醒定期复查 [5] - 蚂蚁的阿福能回答健康医学疑问、解读报告、生成运动打卡计划,实现一对一对话与量身定制 [6] - 中国电信贵港分公司与贵港市人民医院打造的AI医学影像远程诊断云平台,使乡镇卫生院的CT影像能瞬间呈现在三甲医院专家眼前,至今已完成3000例辅助诊断 [6]
大厂 AI 各走“开源”路
36氪· 2025-10-16 19:53
开源大模型的产业趋势 - 2025年9月,阿里、腾讯、百度等公司几乎同步将核心模型开源,中国开源大模型已占据公开榜单前五名 [1] - 开源模式通过分布式创新,将全球开发者群体转化为研发外延团队,以破解人工智能发展的“复杂性陷阱” [4] 开源模式的驱动因素 - 多模态交互、3D建模、代码生成等技术需求呈指数级增长,单一企业的研发投入难以覆盖所有技术分支 [4][5] - 例如,谷歌Veo、OpenAI的Sora Pro等先进模型需支持4K分辨率、120秒以上时长视频生成,技术难度极大 [5] - 普林斯顿大学研究揭示机器学习模型的“复杂性悖论”:当参数数量超过训练数据量的特定比例时,性能反而下降 [7] 开源模式的技术与效能优势 - 根据MLCommons 2025年能效评估报告,采用动态路由MoE架构的AI模型推理能耗可降低42% [8] - DeepSeek-R1通过FP8混合精度训练技术,将视频生成的能耗降低30%以上 [8] - 中国已成为全球开源参与者数量排名第二、增长速度最快的国家,软件开发者数量突破940万 [8] 代表性公司的开源策略与成果 - 阿里云Qwen3系列构建起覆盖文本、图像、音频、视频的300余个开源模型矩阵,截至2025年9月累计下载量突破6亿次,衍生出17万个细分场景模型 [8] - 腾讯面向游戏开发的混元3D-Omni模型,使独立游戏工作室能快速生成次世代资产 [10] - 百度将自研昆仑芯算力与优化后的视觉模型搭档销售,在政务、金融等场景建立壁垒 [11] 开源背景下的商业模式变革 - 企业用户愿意为完整解决方案支付的费用,是单纯技术授权费的7倍以上 [10] - 商业模式从“技术授权”转向“免费核心+增值服务”,利润来源主要包括API调用收入、专属算力租赁和定制化解决方案 [10][11] - 中国某头部云厂商测算显示,其Token调用收入未来几年可能增长到40亿-70亿元人民币 [11] 开源模式的市场影响与财务表现 - 阿里云2025财年营收1180亿元人民币,增速重回两位数达到11%,AI相关业务已连续七个季度实现100%以上增长 [13] - 公司通过“前端引流+后端变现”模式,免费提供基础版本的同时,构建包含数据标注、模型训练、部署优化的全链条服务体系 [13] 开源对中小企业的价值与产业影响 - 全球94.57%的企业正在使用开源软件,其中中小企业占比达45.12%,开源软件为企业节省90%的软件采购成本 [14] - 江西景德镇一家煤化工企业通过将工艺知识图谱与AI大模型融合,将产品合格率从82%提升至95%以上 [14] - 百度推出的轻量级文字识别模型PP-OCRv5仅0.07B参数,却在多项测试中媲美7B参数模型 [14] - 开源降低了技术应用的启动成本,使竞争从“单点技术战”变为“生态持久战” [17][19]
中国在AI领域超越美国已是板上钉钉?吴恩达:美国无法保持领先
机器之心· 2025-08-01 12:23
中国人工智能发展态势 - 中国在人工智能领域已成为全球竞争的重要力量,与美国在MMLU、HumanEval等基准测试中的差距从双位数下降到几乎持平 [1] - WAIC大会展示了中国在AI应用、智能体和新模型方面的迅猛迭代 [2] - 中国凭借活跃的开源模型生态和半导体领域的进取,展现出超越美国的潜在路径 [8] 美国人工智能政策与竞争 - 特朗普宣布「人工智能行动计划」,主张在最少监管下刺激美国AI产业发展 [4][5] - 美国白宫发布的《AI行动计划》支持开源,但不足以确保长期领先优势 [9] - 美国顶尖闭源大模型如Gemini 2.5 Pro、Claude 4 Opus等仍占主导 [11] 中美技术生态对比 - 中国开源模型生态竞争激烈,涌现DeepSeek R1-0528、Kimi K2、Qwen3系列等领先产品 [12] - 美国企业采取高度保密策略,知识流动高成本且缓慢 [14] - 中国通过开源和快速知识扩散加速技术迭代,美国侧重闭源商业竞争 [19] 半导体与硬件进展 - 华为推出CloudMatrix 384系统,通过堆叠芯片与英伟达GB200竞争 [15] - 中国在GPU性能上仍落后于英伟达B200,但通过架构创新寻求突破 [15] - 出口限制推动中国企业加大自主技术研发投入 [16] 行业专家观点 - 吴恩达认为中国高度竞争的商业环境和知识扩散机制赋予其巨大动能 [9] - 黄仁勋称赞中国企业在受限条件下实现世界级创新,如深度求索、阿里巴巴等 [19] - AI技术将渐进式演进,不存在单一「终点线」,领先优势将带来经济增长与国家实力差距 [10][11] 未来竞争格局 - 中国可能通过开源生态和半导体进展实现「弯道超车」,类似电动汽车领域 [16] - 行业已为中国主导开源大模型的未来格局做好准备,当前处于这一阶段初期 [17] - 良好的竞争态势是行业发展的驱动力,中国有望在AI领域转为领先 [20]
Qwen全面升级非思考模型,3B激活、256K长文、性能直逼GPT-4o
量子位· 2025-07-30 17:44
Qwen3-30B-A3B-Instruct-2507模型发布 - 全新非思考模型Qwen3-30B-A3B-Instruct-2507闪电上线,是Qwen3-30B-A3B的高质量指令微调版本[2][7] - 仅激活3B参数即媲美Gemini 2.5-Flash和GPT-4o等顶尖闭源模型性能[3] - 相较前代非思考模型,推理能力(AIME25)提升183.8%,对齐能力(Arena-Hard v2)提升178.2%,长文本处理能力从128K提升至256K[4][5] 模型性能优势 - 在多语言长尾知识覆盖、主观与开放任务文本质量、代码生成、数学计算、工具使用等通用能力上全面进步[5] - 在长文本处理任务中展现出惊人稳定性,极端情况下仅偶尔遗漏少量文档,而其他模型会出现大面积内容丢失[10] - 支持256K上下文窗口,具备稳健的长程依赖建模能力,能保持语义连贯和细节清晰[11] Qwen3系列产品矩阵 - Qwen3系列包含不同参数量和激活参数的模型,如旗舰模型Qwen3-235B-A22B(235B总参数/22B激活参数)和较小模型Qwen3-30B-A3B(30B总参数/3B激活参数)[14][15] - 针对不同场景推出密集(Dense)模型,参数量从0.6B到32B不等[14][16] - 提供多种量化策略版本,包括FP8、Int4、AWQ、GGUF、GPTQ等[16] - 模型命名系统清晰标注参数规模、精度格式和训练类型等信息[13][15] 行业影响 - 模型更新速度极快,一周内发布多款新模型,包括Qwen3-235B-A22B-Thinking-2507和Qwen3-Coder-480B-A35B-Instruct等[12][15] - 产品矩阵覆盖从研究到应用、从大厂集群到边缘部署的各种需求[18] - 网友评价其更新速度"疯狂",认为其他竞争者难以匹敌[5]
开源Qwen一周连刷三冠,暴击闭源模型!基础模型推理编程均SOTA
量子位· 2025-07-26 13:06
模型性能突破 - 通义千问开源Qwen3-235B-A22B-Thinking-2507推理模型,在MMLU-Pro(84.4)、GPQA(81.1)、AIME25(92.3)等基准测试中超越DeepSeek-R1和OpenAI o4-mini,登顶开源SOTA [3][10][12][15] - 新模型在"人类最后考试"HLE测试得分从11.8提升至18.2,超越DeepSeek-R1(17.7)和o4-mini高性能模式(18.1) [13][14] - 支持256K原生上下文,在逻辑推理、数学、编码等复杂任务中性能显著提升,编程能力超越Gemini-2.5 Pro等闭源标杆 [16][17] 开源战略布局 - 一周内连续开源Qwen3基础模型(235B参数)、Qwen3-Coder编程模型和Qwen3-235B推理模型,形成技术矩阵 [6][22][26] - Qwen3-Coder在SWE-bench测试中达到69.6分,超越Claude Sonnet 4(70.4)和DeepSeek-V3(38.8),刷新AI编程SOTA [26][27] - 基础模型Qwen3-235B-A22B-Instruct-2507在GPQA、LiveCodeBench等12项测评中超越Claude4非思考版,登顶开源第一 [32] 市场影响与行业地位 - 通义千问API调用量突破1000亿Tokens,在OpenRouter平台包揽全球前三热门模型 [31] - 阿里已开源300余款大模型,通义千问衍生模型突破14万个,超越Llama成为全球最大开源模型家族 [37] - 公司计划未来三年投入3800亿元建设AI基础设施,持续升级全栈能力 [38] 中国开源生态崛起 - DeepSeek、Qwen、Kimi等中国开源模型引领全球风潮,在Llama4表现不佳后成为行业新标杆 [34][35] - 中国开源模型发展速度被黄仁勋公开认可,技术差距与闭源模型快速缩小 [36][39] - 开源三连击战略使中国AI技术首次实现在基础模型、编程模型、推理模型三个维度同时达到世界前沿水平 [7][33][37]
阿里巴巴-W(09988.HK)FY2025Q4季报点评:核心主业超预期,AI持续投入
东吴证券· 2025-05-27 21:25
报告公司投资评级 - 维持“买入”评级 [1][35] 报告的核心观点 - 阿里巴巴 FY2025Q4 营收稳健利润略超预期,各业务有不同表现,淘天客户管理收入增但 EBITA Margin 降,阿里云收入超预期增长,部分核心商业不及预期,考虑业务盈利能力回升等因素,维持“买入”评级 [1][7][35] 根据相关目录分别总结 营收表现稳健,利润略超预期 - FY2025Q4 公司收入 2364.5 亿元,同比增 6.6%,低于彭博预期;非公认会计准则净利润 298.5 亿,同比增 22.2%,高于彭博预期 [12] - 淘宝天猫商业、国际数字商业、本地生活、菜鸟、阿里云智能、大文娱六大集团和其他业务收入同比变动 8.7%、22.3%、10.3%、 - 12.2%、17.7%、12.3%、4.9%,天猫商业、阿里云智能、大文娱收入超预期,国际数字商业、本地生活、菜鸟收入不及预期 [14] 淘天客户管理收入继续增加,EBITA Margin 有所下滑 - FY2025Q4 淘天集团收入同比增 8.7%至 1013.69 亿元,客户管理收入同比增 11.8%达 710.8 亿元,得益于改善用户体验投入和 AI 技术应用,订单量增长良好,88VIP 核心用户群体持续增加 [19] - 经调整 EBITA Margin 为 40.1%,同比降 1.2%,未来预计持续波动 [19] 阿里云收入显著增长,部分核心商业不及预期 跨境业务带动国际数字商业收入增长 - FY2025Q4 国际数字商业收入同比增 22%至 335.79 亿元,由跨境业务带动,运营和投资效率提升使分部亏损同比收窄,速卖通 Choice 业务单位经济效益环比改善 [22] 规模效应和运营效率提升助力本地生活业务亏损持续收窄 - FY2025Q4 本地生活集团收入同比增 10%至 161.34 亿元,由高德和饿了么订单增长及市场营销服务收入增长带动 [25] - 整体亏损同比持续收窄,得益于规模扩大和运营效率提升,菜鸟物流服务整合完成后规模效应有望进一步显现 [25] AI 需求强劲驱动阿里云业务发展,大文娱扭亏为盈 - 阿里云智能集团收入 301.27 亿元,同比增 18%,整体收入同比增长加速至 17%,由公共云业务收入增长带动,AI 相关产品收入连续七个季度三位数同比增长 [29] - 公司推进多模态 AI 技术发展,4 月发布 Qwen3 系列模型并全部开源,有望推动创新与应用 [30] - FY2025Q4 大文娱集团收入 55.54 亿元,同比增 12%,由电影及娱乐业务和优酷广告收入增长带动,经调整 EBITA 转正,由优酷盈利带动 [30] 盈利预测与评级 - 将 FY2026/FY2027 的 Non - GAAP 净利润预测由 167721/181542 百万元调整为 171156/188575 百万元,预计 FY2028 的 Non - GAAP 净利润为 210307 百万元,FY2026/FY2027/FY2028 对应 PE(Non - GAAP)为 12/11/10 倍 [35] - 考虑公司 GMV 增长、货币化进程加快及持续回购分红,维持“买入”评级 [35]
阿里巴巴-W(09988):FY2025Q4季报点评:核心主业超预期,AI持续投入
东吴证券· 2025-05-27 21:04
报告公司投资评级 - 维持“买入”评级 [1][35] 报告的核心观点 - 阿里巴巴 FY2025Q4 营收稳健利润略超预期,淘天客户管理收入增加但 EBITA Margin 下滑,阿里云业务收入超预期增长部分核心商业不及预期,考虑业务盈利能力回升及相关因素维持“买入”评级 [1][7][35] 根据相关目录分别进行总结 营收表现稳健,利润略超预期 - FY2025Q4 公司收入 2364.5 亿元同比增长 6.6%,低于彭博一致预期;非公认会计准则净利润 298.5 亿同比增长 22.2%,高于彭博一致预期 [12] - 淘宝天猫商业、国际数字商业、本地生活、菜鸟、阿里云智能、大文娱六大集团和其他业务收入同比变动 8.7%、22.3%、10.3%、-12.2%、17.7%、12.3%、4.9%,天猫商业、阿里云智能、大文娱收入超预期,国际数字商业、本地生活、菜鸟收入不及预期 [14] 淘天客户管理收入继续增加,EBITA Margin 有所下滑 - FY2025Q4 淘天集团收入同比增长 8.7%至 1013.69 亿元,客户管理收入同比增长 11.8%达 710.8 亿元,得益于投入加大和 AI 技术升级,订单量增长良好,88VIP 核心用户群体持续增加 [19] - 经调整 EBITA Margin 为 40.1%同比下降 1.2%,未来预计持续波动 [19] 阿里云收入显著增长,部分核心商业不及预期 跨境业务带动国际数字商业收入增长 - FY2025Q4 国际数字商业收入同比增长 22%至 335.79 亿元,由跨境业务带动,运营和投资效率提升使分部亏损同比收窄,速卖通 Choice 业务单位经济效益环比改善 [22] - 多元化市场布局,聚焦重点地区,不同地区差异化布局和产品供给有望强化竞争优势 [22] 规模效应和运营效率提升助力本地生活业务亏损持续收窄 - FY2025Q4 本地生活集团收入同比增长 10%至 161.34 亿元,由高德和饿了么订单增长及市场营销服务收入增长带动 [25] - 整体亏损同比持续收窄,得益于规模扩大和运营效率提升带来的单位经济效益改善,菜鸟物流服务整合完成后规模效应有望进一步显现 [25] AI 需求强劲驱动阿里云业务发展,大文娱扭亏为盈 - 阿里云智能集团收入 301.27 亿元同比增长 18%,整体收入同比增长加速至 17%,由公共云业务收入增长带动,AI 相关产品采用量提升,AI 相关产品收入连续七个季度三位数同比增长 [29] - 公司推进多模态 AI 技术发展并拓展开源生态建设,4 月发布 Qwen3 系列模型并全部开源 [30] - FY2025Q4 大文娱集团收入 55.54 亿元同比增长 12%,由电影及娱乐业务和优酷广告收入增长带动,经调整 EBITA 转正由优酷实现盈利带动 [30] 盈利预测与评级 - 将 FY2026/FY2027 的 Non - GAAP 净利润预测由 167,721/181,542 百万元调整为 171,156/188,575 百万元,预计 FY2028 的 Non - GAAP 净利润为 210,307 百万元,FY2026/FY2027/FY2028 对应 PE(Non - GAAP)为 12/11/10 倍 [35] - 考虑公司 GMV 增长情况及货币化进程加快,以及公司持续回购分红,维持“买入”评级 [35]