Qwen3系列
搜索文档
Token售卖已无溢价、大模型公司转型“系统商”?记忆张量 CTO 李志宇:智能体能力会拉开差距,长期记忆与状态管理成竞争核心
AI前线· 2026-01-12 19:04
文章核心观点 - 大模型行业正从单纯追求模型规模扩展(Scaling up)转向追求系统效率、长期记忆与状态管理等可持续能力,竞争焦点从模型性能转向系统架构和工程化落地能力[2][8][17] - 智能体(Agent)是下一阶段核心主赛道,但现有模型的推理稳定性与可持续性不足,真正自主的智能体需要模型在推理过程可控、状态保持及系统协同三方面优化,竞争关键在于围绕模型构建的记忆、推理和系统架构能力[2][14][15] - 大模型公司正在演变为系统公司,核心竞争力在于构建具备长期记忆与状态管理能力的智能基础设施,而非单一的模型产品[2][17] - 若2026年各家模型能力无法形成代际差异,价格战将愈演愈烈,模型厂商需通过提供记忆增值服务、MCP增值服务等超越纯Token售卖的增值服务来获取溢价[2][16] 2025年行业现状与公司表现 - 2025年涌现出如MiniMax和智谱等冲击港股上市的“赛点公司”,以及Mannus等现象级Agentic产品,展示了商业化价值和场景可行性,但上市招股书也揭示了大模型公司普遍面临的投产比低、亏损严重等问题[4] - 科技公司面临技术节奏加快与商业回报不确定性放大的多层叠加压力,需同时应对持续投入算力与成本现金流约束,包括POC项目需评估收益[5] - 行业应对压力更趋理性,更强调系统效率、真实使用场景和可持续技术积累,而非单纯追逐参数规模或热点概念[5] - 员工整体状态“压力不小,但方向更清楚”,行业正从早期红利阶段走向拼工程、拼长期价值的阶段[5] 国内外AI发展水平对比 - 国内前沿AI在基础模型能力、多模态理解、推理效率和工程化落地方面取得实质性进展,涌现出DeepSeek-R2、Qwen3系列等优秀模型,在成本控制、系统优化和应用适配上形成自身优势[6] - 在部分通用能力和工程执行层面,与硅谷的差距正在快速缩小,甚至在某些场景下具备竞争力[6] - 但在长期基础研究积累、原创范式探索及面向下一代智能的系统性布局上,整体仍存在差距[6] - 竞争正进入更健康阶段,从单点能力对标转向技术路线和系统能力的分化[6] 技术发展趋势与路线变化 - Scaling up(扩大模型规模)仍能提升模型能力,但经济效益下降,已不再是单独成立的答案[8] - 行业瓶颈在于模型“用不好已有的信息”,如长上下文稳定性、跨时间一致性、复杂任务持续推理能力,多模态发展放大了此问题[8] - 技术路线关键变化是从训练时把模型做大,转向运行时让模型用得更好,强化学习、测试时计算、显式推理结构被大规模引入以补足纯预训练的不足[11] - 记忆、工具调用和系统编排成为核心能力,而不再只是外挂能力,模型能力提升正从一次性参数写入转向可持续的系统演化[11] - MoE架构在2025年成为主流,是在参数规模与推理开销间找到平衡的工程选择,解决了“算力怎么省”的问题,但并未改变智能范式或自动带来更好的推理稳定性[12] - 非MoE路线企业的差异化竞争力在于系统层面构建独特能力,如更有效的记忆机制、更稳定的推理流程或更贴近真实应用的数据闭环[12] 情境感知与智能体发展 - 2025年行业对情境感知的理解进步快于能力本身,意识到其不等于上下文长度,而是对环境、历史、目标和约束的综合理解能力[13] - 模型在短期情境理解、多轮对话连贯性、多模态即时状态感知上有提升,但在长期、跨任务、跨时间的情境一致性上能力仍有限[13] - 技术路线变化体现为将情境感知从模型内部的隐式能力转向系统层面的显式建模,如引入长期记忆、状态表示、环境建模和任务轨迹管理[13] - 情境感知正从一个模型特性演变为一个系统能力,这是智能体和长期智能成立的关键[14] - 大模型需在三个方面优化以支持智能体:推理从一次性回答转向过程可控;对状态的理解和保持能力;与工具、环境和记忆系统的协同能力[14] - 现有模型的推理能力不足以支撑真正意义上的自主智能体,瓶颈在于稳定性和可持续性,模型会漂移、遗忘、在长链路决策中逐步失真[15] 合成数据与推理数据集构建 - 大规模合成数据替代人工数据是正在发生但易被误读的趋势,合成数据已成为高质量训练数据的重要来源,尤其在推理能力、复杂任务分解场景[9] - 高价值合成数据需被严格约束、可验证、能放大信息增益,而非模型随意生成[9] - 构建高质量推理数据集需关注两点:是否有明确的推理结构(如中间状态、决策分支和失败路径);是否引入对抗性和反事实设计以暴露模型盲区[9] 模型价格战与商业模式演进 - 2025年模型价格战最关键的影响是模型性能提升上限受阻导致模型Tokens售卖溢价降低,不同厂商模型性能差异减小及模型开源使得纯售卖模型Token难以获得企业溢价认可[15] - 若2026年开源与闭源模型、不同公司模型间无法形成代际差,价格战将继续甚至愈演愈烈[16] - 部分国产卡下场且效率提升后,由于算力补贴存在,价格将逼近冰点,甚至越用越亏[16] - 模型厂商需在纯模型Token售卖模式上提供增值服务,如MCP增值服务、记忆增值服务等,通过额外能力提升来提供溢价空间[16] 未来竞争核心与代际飞跃方向 - 2026年大模型竞赛的核心是“记忆能力如何完成一次系统性升级”[18] - 技术演进趋势是从底层算力和KV Cache等激活记忆管理,到基模型层引入记忆原生机制,再到上层通过显式记忆支撑Agent和应用的长期运行能力,形成完整的记忆技术栈升级[18] - 下一次“大模型代际飞跃”可能来自系统层面管理参数记忆、激活记忆和显式记忆,跨推理过程进行调度、复用和隔离的能力,这将带来智能形态本身的跃迁[18] - 大模型公司的核心竞争力是构建具备长期记忆与状态管理能力的系统,这能让AI长期运行、持续进化,公司本质是在构建新的智能基础设施[17]
2025年AI的温柔转身:从颠覆行业到生活“缝补匠”
36氪· 2025-12-26 18:06
行业年度回顾与趋势 - 2025年AI行业完成了从单点技术突破到全生态构建的关键一跃,大模型竞争从单纯比拼参数转向追求极致效率,智能体告别概念演示迈入规模化落地新阶段 [1] - 2025年初,DeepSeek凭借高效推理迅速出圈,Meta持续深耕开源生态,中国模型厂商在算力受限环境下通过算法优化交出瞩目答卷 [1] - 2025年9月,阿里云在云栖大会发布Qwen3系列,万亿参数级别的Qwen3 Max正式亮相,定位为“AI时代的Android”,拉开生态竞争序幕 [1] - 2025年末,AI技术已渗透日常生活,Nano Banana的AI生图让创意生成成为全民日常,灵光的“全民开发”生态让普通人零门槛搭建应用,豆包手机让智能体验融入掌心 [1] 辅助技术与无障碍应用 - 灵光AI应用帮助用户创建沟通工具,例如为偏瘫失语老人创建带有大按钮的语音应用,上线仅1个月用户已成功创建1200万个闪应用 [2] - Be My Eyes应用覆盖全球上百个国家,汇聚超过820万名明眼志愿者与74万名视障用户,2025年全面接入GPT-4o,通过实时视觉描述帮助视障用户独立决策 [2][3] - 2025年12月13日,集成视觉语言大模型与3D体素神经网络的智能导盲犬“小蒜”在深圳黄木岗交通枢纽试点,视障乘客可通过口头指令激活路径规划 [3] - 深圳地铁在黄木岗枢纽设置智能导盲服务点,通过视觉语言大模型驱动的服务填补人工引导无法覆盖的24小时空白 [4] 教育普惠与AI应用 - 豆包推出的AI英语外教Owen已陪伴超过700万人次在线练习口语,服务覆盖偏远山区留守儿童及城市儿童 [5] - 在贵州石阡困牛山红军学校,希沃提供的算力“盒子”将普通教室变为实时响应的AI空间,自动生成深度反馈报告以精准指出学生薄弱环节 [5] - 在甘肃会宁,快手公益捐建的数字教室利用可灵AI的生成能力,帮助乡村孩子将画作变成动画并编写代码,截至2025年底已有超过1.4万名乡村学生通过此类教室接触前沿科技 [5] 医疗健康与AI赋能 - 浙江的医院使用AI医生分身在线上解答老人高血压用药疑问并提醒定期复查 [5] - 蚂蚁的阿福能回答健康医学疑问、解读报告、生成运动打卡计划,实现一对一对话与量身定制 [6] - 中国电信贵港分公司与贵港市人民医院打造的AI医学影像远程诊断云平台,使乡镇卫生院的CT影像能瞬间呈现在三甲医院专家眼前,至今已完成3000例辅助诊断 [6]
大厂 AI 各走“开源”路
36氪· 2025-10-16 19:53
开源大模型的产业趋势 - 2025年9月,阿里、腾讯、百度等公司几乎同步将核心模型开源,中国开源大模型已占据公开榜单前五名 [1] - 开源模式通过分布式创新,将全球开发者群体转化为研发外延团队,以破解人工智能发展的“复杂性陷阱” [4] 开源模式的驱动因素 - 多模态交互、3D建模、代码生成等技术需求呈指数级增长,单一企业的研发投入难以覆盖所有技术分支 [4][5] - 例如,谷歌Veo、OpenAI的Sora Pro等先进模型需支持4K分辨率、120秒以上时长视频生成,技术难度极大 [5] - 普林斯顿大学研究揭示机器学习模型的“复杂性悖论”:当参数数量超过训练数据量的特定比例时,性能反而下降 [7] 开源模式的技术与效能优势 - 根据MLCommons 2025年能效评估报告,采用动态路由MoE架构的AI模型推理能耗可降低42% [8] - DeepSeek-R1通过FP8混合精度训练技术,将视频生成的能耗降低30%以上 [8] - 中国已成为全球开源参与者数量排名第二、增长速度最快的国家,软件开发者数量突破940万 [8] 代表性公司的开源策略与成果 - 阿里云Qwen3系列构建起覆盖文本、图像、音频、视频的300余个开源模型矩阵,截至2025年9月累计下载量突破6亿次,衍生出17万个细分场景模型 [8] - 腾讯面向游戏开发的混元3D-Omni模型,使独立游戏工作室能快速生成次世代资产 [10] - 百度将自研昆仑芯算力与优化后的视觉模型搭档销售,在政务、金融等场景建立壁垒 [11] 开源背景下的商业模式变革 - 企业用户愿意为完整解决方案支付的费用,是单纯技术授权费的7倍以上 [10] - 商业模式从“技术授权”转向“免费核心+增值服务”,利润来源主要包括API调用收入、专属算力租赁和定制化解决方案 [10][11] - 中国某头部云厂商测算显示,其Token调用收入未来几年可能增长到40亿-70亿元人民币 [11] 开源模式的市场影响与财务表现 - 阿里云2025财年营收1180亿元人民币,增速重回两位数达到11%,AI相关业务已连续七个季度实现100%以上增长 [13] - 公司通过“前端引流+后端变现”模式,免费提供基础版本的同时,构建包含数据标注、模型训练、部署优化的全链条服务体系 [13] 开源对中小企业的价值与产业影响 - 全球94.57%的企业正在使用开源软件,其中中小企业占比达45.12%,开源软件为企业节省90%的软件采购成本 [14] - 江西景德镇一家煤化工企业通过将工艺知识图谱与AI大模型融合,将产品合格率从82%提升至95%以上 [14] - 百度推出的轻量级文字识别模型PP-OCRv5仅0.07B参数,却在多项测试中媲美7B参数模型 [14] - 开源降低了技术应用的启动成本,使竞争从“单点技术战”变为“生态持久战” [17][19]
中国在AI领域超越美国已是板上钉钉?吴恩达:美国无法保持领先
机器之心· 2025-08-01 12:23
中国人工智能发展态势 - 中国在人工智能领域已成为全球竞争的重要力量,与美国在MMLU、HumanEval等基准测试中的差距从双位数下降到几乎持平 [1] - WAIC大会展示了中国在AI应用、智能体和新模型方面的迅猛迭代 [2] - 中国凭借活跃的开源模型生态和半导体领域的进取,展现出超越美国的潜在路径 [8] 美国人工智能政策与竞争 - 特朗普宣布「人工智能行动计划」,主张在最少监管下刺激美国AI产业发展 [4][5] - 美国白宫发布的《AI行动计划》支持开源,但不足以确保长期领先优势 [9] - 美国顶尖闭源大模型如Gemini 2.5 Pro、Claude 4 Opus等仍占主导 [11] 中美技术生态对比 - 中国开源模型生态竞争激烈,涌现DeepSeek R1-0528、Kimi K2、Qwen3系列等领先产品 [12] - 美国企业采取高度保密策略,知识流动高成本且缓慢 [14] - 中国通过开源和快速知识扩散加速技术迭代,美国侧重闭源商业竞争 [19] 半导体与硬件进展 - 华为推出CloudMatrix 384系统,通过堆叠芯片与英伟达GB200竞争 [15] - 中国在GPU性能上仍落后于英伟达B200,但通过架构创新寻求突破 [15] - 出口限制推动中国企业加大自主技术研发投入 [16] 行业专家观点 - 吴恩达认为中国高度竞争的商业环境和知识扩散机制赋予其巨大动能 [9] - 黄仁勋称赞中国企业在受限条件下实现世界级创新,如深度求索、阿里巴巴等 [19] - AI技术将渐进式演进,不存在单一「终点线」,领先优势将带来经济增长与国家实力差距 [10][11] 未来竞争格局 - 中国可能通过开源生态和半导体进展实现「弯道超车」,类似电动汽车领域 [16] - 行业已为中国主导开源大模型的未来格局做好准备,当前处于这一阶段初期 [17] - 良好的竞争态势是行业发展的驱动力,中国有望在AI领域转为领先 [20]
Qwen全面升级非思考模型,3B激活、256K长文、性能直逼GPT-4o
量子位· 2025-07-30 17:44
Qwen3-30B-A3B-Instruct-2507模型发布 - 全新非思考模型Qwen3-30B-A3B-Instruct-2507闪电上线,是Qwen3-30B-A3B的高质量指令微调版本[2][7] - 仅激活3B参数即媲美Gemini 2.5-Flash和GPT-4o等顶尖闭源模型性能[3] - 相较前代非思考模型,推理能力(AIME25)提升183.8%,对齐能力(Arena-Hard v2)提升178.2%,长文本处理能力从128K提升至256K[4][5] 模型性能优势 - 在多语言长尾知识覆盖、主观与开放任务文本质量、代码生成、数学计算、工具使用等通用能力上全面进步[5] - 在长文本处理任务中展现出惊人稳定性,极端情况下仅偶尔遗漏少量文档,而其他模型会出现大面积内容丢失[10] - 支持256K上下文窗口,具备稳健的长程依赖建模能力,能保持语义连贯和细节清晰[11] Qwen3系列产品矩阵 - Qwen3系列包含不同参数量和激活参数的模型,如旗舰模型Qwen3-235B-A22B(235B总参数/22B激活参数)和较小模型Qwen3-30B-A3B(30B总参数/3B激活参数)[14][15] - 针对不同场景推出密集(Dense)模型,参数量从0.6B到32B不等[14][16] - 提供多种量化策略版本,包括FP8、Int4、AWQ、GGUF、GPTQ等[16] - 模型命名系统清晰标注参数规模、精度格式和训练类型等信息[13][15] 行业影响 - 模型更新速度极快,一周内发布多款新模型,包括Qwen3-235B-A22B-Thinking-2507和Qwen3-Coder-480B-A35B-Instruct等[12][15] - 产品矩阵覆盖从研究到应用、从大厂集群到边缘部署的各种需求[18] - 网友评价其更新速度"疯狂",认为其他竞争者难以匹敌[5]
开源Qwen一周连刷三冠,暴击闭源模型!基础模型推理编程均SOTA
量子位· 2025-07-26 13:06
模型性能突破 - 通义千问开源Qwen3-235B-A22B-Thinking-2507推理模型,在MMLU-Pro(84.4)、GPQA(81.1)、AIME25(92.3)等基准测试中超越DeepSeek-R1和OpenAI o4-mini,登顶开源SOTA [3][10][12][15] - 新模型在"人类最后考试"HLE测试得分从11.8提升至18.2,超越DeepSeek-R1(17.7)和o4-mini高性能模式(18.1) [13][14] - 支持256K原生上下文,在逻辑推理、数学、编码等复杂任务中性能显著提升,编程能力超越Gemini-2.5 Pro等闭源标杆 [16][17] 开源战略布局 - 一周内连续开源Qwen3基础模型(235B参数)、Qwen3-Coder编程模型和Qwen3-235B推理模型,形成技术矩阵 [6][22][26] - Qwen3-Coder在SWE-bench测试中达到69.6分,超越Claude Sonnet 4(70.4)和DeepSeek-V3(38.8),刷新AI编程SOTA [26][27] - 基础模型Qwen3-235B-A22B-Instruct-2507在GPQA、LiveCodeBench等12项测评中超越Claude4非思考版,登顶开源第一 [32] 市场影响与行业地位 - 通义千问API调用量突破1000亿Tokens,在OpenRouter平台包揽全球前三热门模型 [31] - 阿里已开源300余款大模型,通义千问衍生模型突破14万个,超越Llama成为全球最大开源模型家族 [37] - 公司计划未来三年投入3800亿元建设AI基础设施,持续升级全栈能力 [38] 中国开源生态崛起 - DeepSeek、Qwen、Kimi等中国开源模型引领全球风潮,在Llama4表现不佳后成为行业新标杆 [34][35] - 中国开源模型发展速度被黄仁勋公开认可,技术差距与闭源模型快速缩小 [36][39] - 开源三连击战略使中国AI技术首次实现在基础模型、编程模型、推理模型三个维度同时达到世界前沿水平 [7][33][37]
阿里巴巴-W(09988.HK)FY2025Q4季报点评:核心主业超预期,AI持续投入
东吴证券· 2025-05-27 21:25
报告公司投资评级 - 维持“买入”评级 [1][35] 报告的核心观点 - 阿里巴巴 FY2025Q4 营收稳健利润略超预期,各业务有不同表现,淘天客户管理收入增但 EBITA Margin 降,阿里云收入超预期增长,部分核心商业不及预期,考虑业务盈利能力回升等因素,维持“买入”评级 [1][7][35] 根据相关目录分别总结 营收表现稳健,利润略超预期 - FY2025Q4 公司收入 2364.5 亿元,同比增 6.6%,低于彭博预期;非公认会计准则净利润 298.5 亿,同比增 22.2%,高于彭博预期 [12] - 淘宝天猫商业、国际数字商业、本地生活、菜鸟、阿里云智能、大文娱六大集团和其他业务收入同比变动 8.7%、22.3%、10.3%、 - 12.2%、17.7%、12.3%、4.9%,天猫商业、阿里云智能、大文娱收入超预期,国际数字商业、本地生活、菜鸟收入不及预期 [14] 淘天客户管理收入继续增加,EBITA Margin 有所下滑 - FY2025Q4 淘天集团收入同比增 8.7%至 1013.69 亿元,客户管理收入同比增 11.8%达 710.8 亿元,得益于改善用户体验投入和 AI 技术应用,订单量增长良好,88VIP 核心用户群体持续增加 [19] - 经调整 EBITA Margin 为 40.1%,同比降 1.2%,未来预计持续波动 [19] 阿里云收入显著增长,部分核心商业不及预期 跨境业务带动国际数字商业收入增长 - FY2025Q4 国际数字商业收入同比增 22%至 335.79 亿元,由跨境业务带动,运营和投资效率提升使分部亏损同比收窄,速卖通 Choice 业务单位经济效益环比改善 [22] 规模效应和运营效率提升助力本地生活业务亏损持续收窄 - FY2025Q4 本地生活集团收入同比增 10%至 161.34 亿元,由高德和饿了么订单增长及市场营销服务收入增长带动 [25] - 整体亏损同比持续收窄,得益于规模扩大和运营效率提升,菜鸟物流服务整合完成后规模效应有望进一步显现 [25] AI 需求强劲驱动阿里云业务发展,大文娱扭亏为盈 - 阿里云智能集团收入 301.27 亿元,同比增 18%,整体收入同比增长加速至 17%,由公共云业务收入增长带动,AI 相关产品收入连续七个季度三位数同比增长 [29] - 公司推进多模态 AI 技术发展,4 月发布 Qwen3 系列模型并全部开源,有望推动创新与应用 [30] - FY2025Q4 大文娱集团收入 55.54 亿元,同比增 12%,由电影及娱乐业务和优酷广告收入增长带动,经调整 EBITA 转正,由优酷盈利带动 [30] 盈利预测与评级 - 将 FY2026/FY2027 的 Non - GAAP 净利润预测由 167721/181542 百万元调整为 171156/188575 百万元,预计 FY2028 的 Non - GAAP 净利润为 210307 百万元,FY2026/FY2027/FY2028 对应 PE(Non - GAAP)为 12/11/10 倍 [35] - 考虑公司 GMV 增长、货币化进程加快及持续回购分红,维持“买入”评级 [35]
阿里巴巴-W(09988):FY2025Q4季报点评:核心主业超预期,AI持续投入
东吴证券· 2025-05-27 21:04
报告公司投资评级 - 维持“买入”评级 [1][35] 报告的核心观点 - 阿里巴巴 FY2025Q4 营收稳健利润略超预期,淘天客户管理收入增加但 EBITA Margin 下滑,阿里云业务收入超预期增长部分核心商业不及预期,考虑业务盈利能力回升及相关因素维持“买入”评级 [1][7][35] 根据相关目录分别进行总结 营收表现稳健,利润略超预期 - FY2025Q4 公司收入 2364.5 亿元同比增长 6.6%,低于彭博一致预期;非公认会计准则净利润 298.5 亿同比增长 22.2%,高于彭博一致预期 [12] - 淘宝天猫商业、国际数字商业、本地生活、菜鸟、阿里云智能、大文娱六大集团和其他业务收入同比变动 8.7%、22.3%、10.3%、-12.2%、17.7%、12.3%、4.9%,天猫商业、阿里云智能、大文娱收入超预期,国际数字商业、本地生活、菜鸟收入不及预期 [14] 淘天客户管理收入继续增加,EBITA Margin 有所下滑 - FY2025Q4 淘天集团收入同比增长 8.7%至 1013.69 亿元,客户管理收入同比增长 11.8%达 710.8 亿元,得益于投入加大和 AI 技术升级,订单量增长良好,88VIP 核心用户群体持续增加 [19] - 经调整 EBITA Margin 为 40.1%同比下降 1.2%,未来预计持续波动 [19] 阿里云收入显著增长,部分核心商业不及预期 跨境业务带动国际数字商业收入增长 - FY2025Q4 国际数字商业收入同比增长 22%至 335.79 亿元,由跨境业务带动,运营和投资效率提升使分部亏损同比收窄,速卖通 Choice 业务单位经济效益环比改善 [22] - 多元化市场布局,聚焦重点地区,不同地区差异化布局和产品供给有望强化竞争优势 [22] 规模效应和运营效率提升助力本地生活业务亏损持续收窄 - FY2025Q4 本地生活集团收入同比增长 10%至 161.34 亿元,由高德和饿了么订单增长及市场营销服务收入增长带动 [25] - 整体亏损同比持续收窄,得益于规模扩大和运营效率提升带来的单位经济效益改善,菜鸟物流服务整合完成后规模效应有望进一步显现 [25] AI 需求强劲驱动阿里云业务发展,大文娱扭亏为盈 - 阿里云智能集团收入 301.27 亿元同比增长 18%,整体收入同比增长加速至 17%,由公共云业务收入增长带动,AI 相关产品采用量提升,AI 相关产品收入连续七个季度三位数同比增长 [29] - 公司推进多模态 AI 技术发展并拓展开源生态建设,4 月发布 Qwen3 系列模型并全部开源 [30] - FY2025Q4 大文娱集团收入 55.54 亿元同比增长 12%,由电影及娱乐业务和优酷广告收入增长带动,经调整 EBITA 转正由优酷实现盈利带动 [30] 盈利预测与评级 - 将 FY2026/FY2027 的 Non - GAAP 净利润预测由 167,721/181,542 百万元调整为 171,156/188,575 百万元,预计 FY2028 的 Non - GAAP 净利润为 210,307 百万元,FY2026/FY2027/FY2028 对应 PE(Non - GAAP)为 12/11/10 倍 [35] - 考虑公司 GMV 增长情况及货币化进程加快,以及公司持续回购分红,维持“买入”评级 [35]