阿里巴巴(BABA)
搜索文档
千问3.5除夕开源!可通过千问APP免费体验
新浪财经· 2026-02-16 21:00
阿里巴巴发布千问Qwen3.5-Plus大模型 - 公司于2月16日除夕当天开源全新一代大模型千问Qwen3.5-Plus,其性能据称可媲美Gemini 3 Pro [1] 模型性能与效率 - 千问3.5-Plus总参数为3970亿,激活参数仅170亿,性能超过万亿参数的Qwen3-Max模型 [1] - 模型部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍 [1] - 在常用的32K上下文场景中,推理吞吐量可提升8.6倍;在256K超长上下文情况下,推理吞吐量最大提升至19倍 [3] - 通过FP8、FP32精度应用策略,在训练扩展到数十万亿个token时,激活内存减少约50%,训练还能提速10% [5] 成本与定价 - Qwen3.5-Plus的API价格每百万Token低至0.8元,仅为Gemini 3 Pro价格的1/18 [1] 技术架构与创新 - 模型实现了从纯文本模型到原生多模态模型的代际跃迁,基于视觉和文本混合token进行预训练 [1] - 公司自研的门控技术成果已融入模型创新的混合架构,结合线性注意力机制与稀疏混合专家MoE模型架构 [3] - 原生多模态训练在阿里云AI基础设施上完成,混合数据训练吞吐量几近100%持平纯文本基座模型训练 [5] 多模态能力 - 在多模态推理、通用视觉问答、文本识别、文件理解、空间智能、视频理解等众多权威评测中均斩获最佳性能 [2] - 支持长达2小时(对应1M token上下文)的视频直接输入,适用于长视频内容分析与摘要生成 [2] - 实现了视觉理解与代码能力的原生融合,可将手绘界面草图直接转为可用的前端代码 [2] Agent智能体与应用 - 模型在推理、编程、Agent智能体等全方位基准评估中表现优异 [1] - 千问3.5可自主操作手机与电脑高效完成日常任务,在移动端支持更多主流APP,在PC端可处理复杂的多步骤操作 [5] - 公司构建的可扩展Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体Agent支持扩展至百万级规模 [6] - 千问App发布的全球首个消费级AI购物Agent,在春节期间6天时间帮用户完成了1.2亿笔订单 [6] 开源生态与市场影响 - 自2023年开源以来,阿里已开源400多个千问模型,覆盖全尺寸、全模态 [6] - 千问模型全球下载量突破10亿次,单月下载量是DeepSeek、Meta、OpenAI、智谱、Kimi、MiniMax等2到8名总和 [6] - 开发者基于千问开发的衍生模型超20万 [6] - 千问3.5扩展支持201种语言,将词表大小从15万扩展到25万,可最高提升小语种60%的编码效率 [6] 模型获取与未来计划 - 千问APP、PC端已第一时间接入Qwen3.5-Plus模型,开发者可在魔搭社区和HuggingFace下载新模型,或通过阿里云百炼获取API服务 [7] - 公司很快将继续开源不同尺寸、不同功能的千问3.5系列模型,性能更强的旗舰模型Qwen3.5-Max不久也将发布 [7]
Morgan Stanley and Jefferies Stay Positive on Alibaba (BABA)
Yahoo Finance· 2026-02-16 20:42
核心观点 - 阿里巴巴集团被列为15只飙升的AI股之一 摩根士丹利和杰富瑞均维持对其的积极评级 核心驱动力在于其AI助手Qwen的发展潜力以及云业务的增长前景 [1][7] 机构评级与目标价 - 摩根士丹利于1月15日重申对阿里巴巴的“增持”评级 目标价为180美元 主要基于其Qwen AI助手的强劲增长 [1] - 杰富瑞于1月14日重申对阿里巴巴的“买入”评级 目标价为225美元 认为其云业务将捕获行业AI云收入的大部分增量 [3] AI业务发展 - 摩根士丹利认为Qwen AI助手有潜力发展成为“一体化AI超级应用和生活助手” 这可能推动公司股价上涨 [2] - 杰富瑞指出 AI应用的普及和AI智能体机会将支持市场对阿里巴巴云服务需求的增长 [3] 云业务前景 - 摩根士丹利指出 Qwen的发展可能同时推动公司云业务的收入增长 [2] - 杰富瑞预计 阿里巴巴的云业务将占据行业AI云增量收入的大部分 并预计其市场份额将在2026年实现增长 [3] 财务与运营影响 - 为支持用户采纳Qwen而增加的营销支出 可能导致其他业务部门出现更大亏损 摩根士丹利估计 在第三财季这些亏损可能达到约70亿元人民币 [2]
Alibaba Upgrades AI Model. What It Means for the Software Stocks Selloff and China Fears.
Barrons· 2026-02-16 20:11
公司动态 - 阿里巴巴于周一发布了其领先AI模型的最新升级版Qwen 3.5 [1] 产品与技术 - 公司发布了其AI模型系列的最新版本Qwen 3.5 [1] - 该模型是公司领先AI模型的重大更新 [1]
30亿元砸向春晚,AI巨头在抢什么?
每日经济新闻· 2026-02-16 20:07
文章核心观点 - 2026年春节档成为多家AI大模型公司的核心营销与用户争夺战场,其投入规模与参与深度前所未有,标志着AI技术正从传统品牌手中抢占春晚这一顶级流量入口[1][3] - AI公司通过巨额资金投入、技术合作与场景嵌入等方式,旨在利用春节家庭场景进行用户教育、习惯培养和生态绑定,但高投入后的用户留存与商业转化是长期挑战[7][9][10] 行业竞争格局与参与者策略 - **阿里巴巴**:投入30亿元用于春节营销,旗下“千问”大模型独家冠名河南、东方、浙江、江苏四大卫视春晚,通过品牌露出、节目共创及与阿里系服务场景(外卖、闪购、机票)捆绑进行推广[1][3][9] - **字节跳动**:旗下火山引擎成为央视春晚独家AI云技术合作伙伴,提供节目创作、互动及直播技术支持;除夕夜通过“豆包”安排三轮抽奖,送出超10万份科技礼品[1][3][9] - **腾讯与百度**:分别推出10亿元和5亿元春节红包计划,在微信和百度App内强化大模型入口[1] - **其他参与者**:B站作为央视春晚独家弹幕视频平台增加技术投入以提升弹幕体验;山东卫视采用AIGC技术打造虚拟舞台并引入具身智能机器人;北京卫视推出聚焦服务机器人的纪实短片[4] 营销投入与市场活动 - 阿里巴巴为“千问”投入30亿元春节营销费用,并包揽四家一线卫视春晚冠名[1][3] - 腾讯和百度分别准备了10亿元和5亿元春节红包预算[1] - 字节跳动“豆包”在除夕夜送出超10万份科技礼品[9] - 效果显现案例:2月16日,通过“千问”帮买电影票的订单量日环比增长500%[9] 技术应用与内容创新 - **央视春晚**:由字节跳动火山引擎提供AI云技术支持,覆盖节目创作、线上互动及直播核心环节[3] - **地方卫视创新**: - 河南卫视全链路融入AI技术,解决节目制作难点并提升生产效率[8] - 山东卫视使用AIGC技术与XR虚拟舞台,强化视觉并减少实景搭建投入[4][8] - 北京卫视制作以“人机共生”为主题的纪实短片,展示服务机器人在家庭中的应用[4] - **产品发布**:字节跳动在春节期间发布视频生成模型Seedance 2.0,并通过互动活动开放用户体验[9] 战略目标与行业洞察 - **核心目标**:利用春节密集流量与完整家庭场景,对用户(尤其是长辈群体)进行AI服务教育、推广及使用习惯培养[6][8] - **选择逻辑**:AI公司选择合作卫视时考虑影响力与目标人群匹配度,例如“千问”选择覆盖人群广的四大卫视,而未选择更擅长跨年晚会的湖南卫视[6] - **春晚自身诉求**:面对观众触达场景迁移及新媒体竞争压力,春晚主动拥抱AI以寻求降本增效、吸引年轻观众(2025年央视春晚在B站直播的观众中30岁以下占比83%)及实现技术展示与商业转化功能[7][8] 效果与长期挑战 - **短期效果显著**:春节窗口期内,大模型厂商通过活动迅速获得曝光、下载与体验,例如“千问帮我买电影票”成为年轻人消费新宠[9] - **长期挑战**:春节流量具有强时效性,用户可能因红包或活动而来,节后存在流失风险;行业竞争是马拉松,最终胜负取决于巨额投入能否转化为稳定的用户使用频次、商业转化及生态绑定[9][10]
除夕开源,阿里发布新一代基础模型千问3.5
北京商报· 2026-02-16 19:45
阿里巴巴发布新一代开源大模型 - 公司于2月16日除夕当天开源了全新一代大模型千问Qwen3.5-Plus [1] - 该模型性能媲美Gemini 3 Pro,并登顶全球最强开源模型 [1] 模型技术性能与参数 - 千问3.5实现了底层模型架构的全面革新 [1] - Qwen3.5-Plus版本总参数为3970亿,激活参数为170亿 [1] - 其性能超过了万亿参数的Qwen3-Max模型 [1] - 模型部署显存占用降低了60%,推理效率大幅提升 [1] - 最大推理吞吐量可提升至19倍 [1] 模型商业化与成本 - Qwen3.5-Plus的API价格低至每百万Token 0.8元 [1] - 此价格仅为Gemini 3 Pro API价格的1/18 [1]
2026年春晚AI公司成主角,阿里30亿元投入,腾讯推红包计划,千问冠名四大卫视……当红包散尽、晚会落幕,你的手机里会剩下哪个AI?
每日经济新闻· 2026-02-16 19:44
2026年春节AI营销与竞争格局 - 2026年春节档成为多家AI大模型的竞技场,AI公司取代了传统的白酒、乳制品和家电品牌,成为春晚营销的新主角[1][3] - 阿里巴巴旗下千问投入30亿元用于春节营销,并包揽了河南、东方、浙江、江苏四大卫视春晚的独家冠名[1][3][4] - 字节跳动旗下火山引擎成为央视春晚独家AI云合作伙伴,提供节目创作、互动及直播技术支持[1][4] - 腾讯和百度分别推出10亿元和5亿元的春节红包计划,在各自App内强化大模型入口[1] AI参与春晚的形式与目标 - AI企业参与春晚的形式主要分为四类:冠名展示、现金红包补贴、技术服务支撑、消费场景嵌入[8] - 阿里巴巴将千问的补贴权益与阿里系服务场景(如外卖、闪购、机票)捆绑,旨在通过春节场景(如订年夜饭、电影票)改变用户习惯[8] - 字节跳动在除夕当晚通过豆包安排三轮抽奖,送出超10万份科技好礼[8] - 行业观点认为,春节是推广和普及大模型服务的有效手段,尤其有助于对长辈群体进行教育,并借助家庭场景加深对AI技术的认知[6] AI技术对春晚内容制作的影响 - AI技术为各大卫视春晚提供了更高效、低成本的创作方式[7] - 河南卫视2026年春晚全链路融入AI技术,解决了如《万马奔腾》节目中“人马交互”的实拍难点,并整体提升了生产效率[7] - 山东卫视采用AIGC技术打造虚拟舞台背景,并使用XR虚拟舞台,在强化视觉呈现的同时减少了实景搭建投入[4][7] - 北京卫视推出聚焦“人机共生”主题的纪实短片,呈现服务机器人在家庭场景中的应用[4] 市场表现与用户反馈 - 在春节窗口期内,多家大模型厂商集中发布或升级产品,例如字节跳动发布了视频生成模型Seedance 2.0[8] - 据官方披露,2月16日,使用千问帮买电影票的订单量日环比增长500%,“千问帮我买电影票”成为年轻人消费新宠[8] - 2025年央视总台春晚在B站的直播中,30岁以下观众占比达83%;微博相关话题讨论中,“90后”和“00后”用户占比66%[6] - B站作为2026年央视春晚独家弹幕视频平台,宣布增加技术投入以确保弹幕体验同比有较大提升[4] 行业背景与战略考量 - 传统的春晚是全民守岁的重要仪式,也是品牌营销的主场,看重的是除夕夜的高收视率与家庭场景下的消费决策影响力[3] - 对于地方卫视而言,春晚的角色正在变化,它不仅是文化仪式,也开始承担技术展示和商业转化的功能,这被视为“弯道超车”的机会[7] - 行业分析指出,春节流量具有强时效性,用户可能仅为红包而来,节后存在迅速流失的风险[7] - 竞争的核心在于,投入数十亿元换来的曝光和体验,最终能否沉淀为稳定的用户使用频次、商业转化和生态绑定[9]
今日财经要闻TOP10|2026年2月16日
新浪财经· 2026-02-16 19:41
地缘政治与安全动态 - 以色列总理内塔尼亚胡为美伊新一轮谈判设定明确底线,要求任何协议必须包含彻底拆除伊朗的核基础设施并运出伊朗,而不仅仅是暂停铀浓缩 [1][9] - 内塔尼亚胡强调哈马斯必须彻底解除武装,据估算哈马斯手中仍掌握约6万支步枪,这些武器连同火箭弹等必须全部被收缴或运出加沙 [1][9] - 以军目前已摧毁约150公里的哈马斯隧道网络 [1][9] - 以色列计划在2028年现有援助协议到期后,结束美国每年提供的38亿美元军事援助 [1][9] - 伊朗革命卫队海军在霍尔木兹海峡举行名为“智能管控霍尔木兹海峡”的军事演习,旨在检验战备状态和应对潜在安全威胁的方案 [5][13] - 伊朗外长阿拉格齐已启程前往瑞士日内瓦,参加将于17日举行的第二轮伊美谈判 [7][14] 全球金融市场交易安排 - 周一(2月17日)美股因美国总统日休市一日,芝商所旗下美债期货交易休市,贵金属、美国原油期货合约交易提前于北京时间03:30结束,股指期货合约提前于02:00结束 [2][10] - 加拿大多伦多证券交易所因家庭日休市一日 [2][10] - 韩国、越南胡志明市、中国台湾证券交易所均因农历新年休市 [2][10] - 香港交易所除夕交易半日,并于12时08分与12时10分之间随机收市,南、北向交易关闭 [2][10] 人工智能与科技行业 - 阿里巴巴低调上线两款新大语言模型:Qwen3.5-Plus和Qwen3.5-397B-A17B,均支持文本和多模态任务 [3][11] - Qwen3.5-Plus总参数为3970亿,激活仅170亿,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,最大推理吞吐量可提升至19倍 [3][11] - Qwen3.5-Plus的API定价具有显著成本优势,每百万Token价格低至0.8元,仅为谷歌Gemini 3 pro价格的1/18 [3][11] 香港股市表现与指数调整 - 蛇年最后一个交易日,香港恒生指数收盘上涨0.52%,恒生科技指数上涨0.13% [4][12] - 个股方面,MINIMAX-WP股价大幅收涨24.56%,智谱上涨4.74%,老铺黄金上涨6.64%,洛阳钼业上涨6.35%,宁德时代上涨2.71% [4][12] - 受将被纳入恒生指数消息带动,宁德时代在香港的股价上涨2.2%,洛阳钼业上涨3.7%,老铺黄金涨4.5% [7][16] - 汽车零售商中升控股将被剔除出恒生指数,股价下跌2.5% [7][16] - 恒生指数成份股数量将由88只增至90只,调整于3月9日生效 [7][16] - 贝壳与地平线获纳入恒生中国企业指数,华润啤酒与蒙牛乳业将被剔除 [7][16] - 高盛策略师报告指出,此次指数再平衡可能带来接近80亿美元的双向被动资金流动 [7][16] - 互联网/媒体与娱乐、资本货物以及金属与采矿板块预计将获得最多被动买盘,而银行、能源及科技硬件与半导体板块可能出现最大资金流出 [7][16] 安全事故与政府应对 - 2月15日下午,江苏连云港东海县一烟花爆竹零售店发生爆炸,造成8人死亡、2人受伤 [5][13] - 应急管理部紧急召开调度会,派出工作组赶赴现场,并要求全面排查烟花爆竹各环节安全风险隐患,坚决防范超量储存、违规燃放等行为 [5][13] 新兴市场政治与监管动荡 - 1月下旬印尼股市暴跌,引发总统普拉博沃·苏比安托震怒,其在与内阁部长会议中下令开除金融监管高层 [8][14][15] - 会议中,部长们将股市暴跌归咎于金融监管机构和证券交易所官员未能解决MSCI公司提出的关于投资性和市场透明度的担忧 [8][14][15] - 随后,印尼金融服务管理局与印尼证券交易所的负责人相继辞职 [8][15] 媒体娱乐行业并购动态 - 华纳兄弟探索公司在收到派拉蒙天空之舞公司修订后的收购要约后,正考虑重启出售谈判 [10][17] - 此举可能引发与网飞公司的第二轮竞购战,华纳兄弟董事会尚未决定如何回应 [10][17] - 派拉蒙修订的条款包括:若华纳兄弟终止与网飞的协议,派拉蒙将承担应付给网飞的28亿美元费用,并为华纳兄弟的债务再融资提供兜底支持 [10][17] - 派拉蒙承诺,若交易未能在12月31日前完成,将向华纳兄弟股东作出赔偿,以显示其对快速获得监管批准的信心 [10][17]
千问3.5,除夕开源!
上海证券报· 2026-02-16 19:08
核心观点 - 公司于2月16日开源全新一代大模型Qwen3.5-Plus,其性能媲美Gemini 3 Pro,且API价格仅为后者的1/18,展现出极强的性能与成本优势 [2][3][6] - 千问3.5系列实现了从纯文本到原生多模态的代际跃迁,在多项核心评测中超越包括GPT-5.2、Claude 4.5在内的顶级模型,并在底层架构、训练效率和Agent能力上取得重大突破 [4][6][7][8][10] - 公司持续推动模型开源与生态建设,千问模型全球下载量已突破10亿次,基于其开发的衍生模型超20万个,巩固了其全球第一开源模型的地位,并已通过AI购物Agent实现大规模商业化验证 [12] 模型发布与性能表现 - 公司于2月16日除夕当天开源了Qwen3.5-Plus模型,性能媲美Gemini 3 Pro [2] - Qwen3.5-Plus的API价格为每百万token 0.8元,仅为Gemini 3 Pro价格的1/18 [3][6] - 公司即将发布性能更强的旗舰模型Qwen3.5-Max,并计划继续开源不同尺寸、不同功能的千问3.5系列模型 [2] 技术突破与架构创新 - 千问3.5实现了从纯文本模型到原生多模态模型的代际跃迁,基于视觉和文本混合token进行预训练 [4] - 模型以不到40%的参数量获得了超万亿参数的Qwen3-Max基座模型的顶尖性能 [4] - 模型底层架构全面革新,采用自研门控技术、线性注意力机制与稀疏混合专家(MoE)架构,实现了3970亿总参数中仅激活170亿参数的极致效率 [6][7][8] - 通过训练稳定优化及多token预测等技术,在保持与Qwen3-Max同等性能的同时大幅提升推理效率 [8] 评测成绩与能力优势 - 在知识推理评测MMLU-Pro中得分87.8分,超越GPT-5.2 [4] - 在博士级难题测评GPQA中得分88.4分,高于Claude 4.5 [4] - 在指令遵循评测IFBench中以76.5分刷新所有模型纪录 [4] - 在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,表现均超越Gemini 3 Pro、GPT-5.2 [4] - 在多模态推理、通用视觉问答、文本识别、空间智能、视频理解等众多权威评测中均斩获最佳性能 [6] - 视觉能力支持长达2小时(对应1M token上下文)的视频直接输入与分析 [6] - 实现了视觉理解与代码能力的原生融合,可将手绘草图转为前端代码,或通过截图定位修复UI问题 [6] 效率与成本优化 - 相比前代模型,Qwen3.5-Plus部署显存占用降低60% [6] - 在32K上下文场景中,推理吞吐量可提升8.6倍;在256K超长上下文情况下,最大推理吞吐量可提升至19倍 [8] - 原生多模态训练的吞吐量几近100%持平纯文本基座模型训练,大幅降低了训练门槛 [10] - 通过FP8、FP32精度应用策略,在训练扩展到数十万亿token时,激活内存减少约50%,训练还能提速10% [10] Agent能力与商业化进展 - 千问3.5可自主操作手机与电脑完成日常任务,在移动端和PC端处理复杂操作,显著提升效率 [10] - 公司构建了可扩展的Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体支持扩展至百万级规模 [10] - 公司于1月15日发布全球首个消费级AI购物Agent,并在春节前夕用6天时间帮助用户完成了1.2亿笔订单,实现了大规模真实世界任务执行和商业化验证 [12] 开源生态与市场影响 - 自2023年开源以来,公司已开源400多个千问模型,覆盖全尺寸、全模态 [12] - 千问模型全球下载量突破10亿次,单月下载量是第二到第八名模型的总和 [12] - 开发者基于千问开发的衍生模型超过20万个,公司被公认为全球第一开源模型 [12] - 千问3.5扩展支持201种语言,词表大小从15万扩展到25万,最高可提升小语种60%的编码效率 [12] - 千问App、PC端已第一时间接入Qwen3.5-Plus模型,开发者可通过魔搭社区、HuggingFace或阿里云百炼获取模型及API服务 [12]
最新!阿里开源新一代大模型
券商中国· 2026-02-16 19:08
模型性能与技术创新 - 公司于2月16日开源全新一代大模型千问Qwen3.5-Plus,实现了底层模型架构的革新[1] - Qwen3.5-Plus总参数达3970亿,激活参数为170亿,性能超过万亿参数的Qwen3-Max模型[2] - 新模型部署显存占用降低60%,最大推理吞吐量可提升至19倍[2] - 模型基于视觉和文本混合token进行预训练,并新增了中英文、多语言、STEM和推理等数据[2] - 千问3.5扩展支持201种语言,将词表大小从15万扩展到25万,可最高提升小语种60%的编码效率[2] 成本优势与市场应用 - Qwen3.5-Plus的API定价极具竞争力,每百万Token低至0.8元,仅为Gemini 3 Pro价格的1/18[2] - 千问App在春节期间通过其AI购物Agent,于6天内完成了1.2亿笔订单[2] - 模型能力的大幅增强,有望进一步拓展千问APP在工作和生活中协助用户处理事务的应用场景[2] - 千问APP及PC端已第一时间接入Qwen3.5-Plus模型[3] 开源生态与未来规划 - 自2023年开源以来,公司已累计开源超过400个千问模型[2] - 开发者可通过魔搭社区和HuggingFace平台下载新模型,或通过阿里云百炼获取API服务[3] - 公司计划继续开源不同尺寸和功能的千问3.5系列模型[3] - 性能更强的旗舰模型Qwen3.5-Max也将在不久后发布[3]
最强开源大模型除夕登场!397B参数千问3.5超越Gemini 3,百万Tokens低至8毛
量子位· 2026-02-16 19:00
模型发布与定位 - 阿里于除夕发布全新一代开源大模型Qwen3.5-Plus,登顶最强开源模型宝座[1] - 该模型是阿里春节档发布的第一弹,后续几天将继续开源多款适用于不同场景的Qwen3.5模型,旗舰版Qwen3.5-Max将在年后压轴登场[11][12][13] 核心性能表现 - 模型总参数为3970亿,单次推理仅激活170亿参数,激活比例不到5%,性能却超越万亿参数的Qwen3-Max[4][55] - 在MMLU-Pro测试中得分87.8分,超过GPT-5.2[17] - 在GPQA博士级科学推理评测基准中斩获88.4分,超越Claude 4.5[18] - 在IFBench榜单中以76.5分刷新指令遵循最高纪录[20] - 在Agent能力评测(BFCL-V4、Browsecomp)中评分全面超越Gemini-3-Pro[20] 多模态能力 - 模型从预训练第一天起就基于视觉和文本的混合Token数据,拥有原生多模态理解能力[22][23] - 在多模态主流评测(MathVison、RealWorldQA、CC_OCR、RefCOCO-avg、MLVU)中几乎横扫所有指标,刷新开源模型天花板[23] - 在学科解题、任务规划与物理空间推理等高难度场景上,表现出超越专项模型Qwen3-VL的综合素养[24] - 支持长达2小时的超长视频直接输入,配合1M Tokens原生上下文,能进行精准分析与摘要[26] - 实现视觉理解与代码逻辑的原生融合,可将手绘界面草图重构为高质量前端代码,并通过单张截图定位修复UI缺陷[28] 技术架构创新 - 对Transformer架构进行深度重构,引入四项关键技术以平衡性能与效率[48] - 引入混合注意力机制,根据信息重要程度动态分配计算资源,提升长上下文处理效率[53] - 采用极致稀疏的MoE架构,总参数3970亿,单次推理激活仅170亿,激活比例不到5%[55] - 采用原生多Token预测机制,使推理速度接近翻倍[56] - 引入NeurIPS 2025最佳论文的注意力门控机制等优化,解决稀疏架构训练稳定性问题[57][59] 效率与成本优势 - 新架构使训练成本降幅高达90%[60] - 与Qwen3-Max相比,Qwen3.5-Plus部署显存占用降低60%,最大推理吞吐量可提升至19倍[5][60] - 阿里云百炼为Qwen3.5 API提供极具竞争力的定价:百万Tokens输入低至0.8元,相当于同级别模型Gemini-3-pro价格的1/18[9] - 原生多模态训练方案使整体训练吞吐量与纯文本基座模型几乎无差别,激活内存减少约一半,训练速度额外提升10%[65] - 大规模强化学习框架将智能体训练效率提升了3到5倍[66] 语言支持与可及性 - Qwen3.5首次实现201种语言全覆盖,词表规模从15万大幅扩充至25万,小语种编码效率最高提升60%[9] - 普通用户可登录千问APP或PC端免费体验Qwen3.5模型,开发者可前往魔搭社区或HuggingFace下载部署[9] 行业影响与开源生态 - 自2023年开源以来,阿里已累计开源400多个模型,覆盖全尺寸和全模态领域[71] - 千问模型全球下载量突破10亿次,单月下载量超过第2名到第8名的总和,开发者基于千问开发的衍生模型已超过20万个[72] - 千问已成为全球最大AI大模型族群,其开源开放、低成本和广泛语言支持的策略旨在让更多人用上顶尖模型[73]