阿里巴巴(BABA)
搜索文档
阿里除夕发布千问3.5,性能媲美Gemini 3,价更低
南方都市报· 2026-02-16 18:16
阿里千问Qwen3.5模型发布 - 阿里巴巴于2月16日除夕开源全新一代大模型千问Qwen3.5-Plus,性能媲美Gemini 3 Pro,登顶全球最强开源模型[1] - Qwen3.5-Plus版本总参数为3970亿,激活参数仅170亿,性能超过万亿参数的Qwen3-Max模型,实现了“以小胜大”[1] - 该模型实现了从纯文本模型到原生多模态模型的代际跃迁,基于视觉和文本混合token进行预训练[1] 模型性能与效率突破 - 部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍[1][3] - 在常用的32K上下文场景中,推理吞吐量可提升8.6倍;在256K超长上下文情况下,最大提升至19倍[3] - API价格极具竞争力,每百万token低至0.8元,仅为Gemini 3 Pro的1/18[1] 技术架构与训练创新 - 模型性能跃升源于对Transformer经典架构的重大创新突破,融入了获2025 NeurIPS最佳论文的自研门控技术[3] - 结合线性注意力机制与稀疏混合专家模型架构,实现了3970亿总参数仅激活170亿的极致效率[3] - 原生多模态训练在阿里云AI基础设施上完成,混合数据训练吞吐量几近100%持平纯文本基座模型训练,大幅降低训练门槛[4] - 通过FP8、FP32精度应用策略,在训练扩展到数十万亿token时,激活内存减少约50%,训练还能提速10%[4] 多模态与视觉能力 - 千问3.5在多模态推理、通用视觉问答、文本识别、文件理解、空间智能、视频理解等众多权威评测中均斩获最佳性能[3] - 以不到40%的参数量获得了超万亿参数Qwen3-Max基座模型的顶尖性能[1] Agent智能体应用突破 - 基于顶级视觉能力,千问3.5实现了从Agent框架到Agent应用的新突破,可自主操作手机与电脑高效完成日常任务[4] - 在移动端支持更多主流APP与指令,在PC端可处理复杂的多步骤操作,如跨应用数据整理、自动化流程执行[4] - 团队构建了可扩展的Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体支持扩展至百万级规模[4] 行业动态:AI大模型“春节档” - 国产大模型集体上新抢占“AI春节档”,行业竞争加剧[5] - 字节跳动于2月14日推出豆包大模型2.0系列,针对大规模生产环境进行优化[5] - MiniMax于2月13日上线并开源新一代文本模型MiniMax M2.5[5] - 字节跳动发布Seedance2.0,阿里发布Qwen-Image-2.0,DeepSeek更新至1.7.4版本,面壁智能开源MiniCPM-o 4.5模型[5]
阿里正式发布新一代基模千问3.5
新华网财经· 2026-02-16 18:06
阿里巴巴发布新一代大模型 - 公司于2月16日开源全新一代大模型千问Qwen3.5-Plus [2] - 千问3.5实现了底层模型架构的创新 [2] - 此次发布的Qwen3.5-Plus版本总参数为3970亿,激活参数仅170亿 [2] - 该模型性能超过万亿参数的Qwen3-Max模型 [2] - 模型部署显存占用降低60%,最大推理吞吐量可提升至19倍 [2] - Qwen3.5-Plus的API价格每百万Token低至0.8元 [2] 模型应用与获取渠道 - 千问APP、PC端已第一时间接入Qwen3.5-Plus模型 [2] - 开发者可在魔搭社区和HuggingFace下载新模型 [2] - 开发者可通过阿里云百炼直接获取API服务 [2] - 公司在chat.qwen.ai页面上线了Qwen3.5-Plus和Qwen3.5-397B-A17B两款新模型 [2] 新模型定位与能力 - Qwen3.5-Plus定位为Qwen3.5系列最新大语言模型 [2][5] - Qwen3.5-397B-A17B定位为Qwen3.5开源系列旗舰大语言模型 [2][6] - 两款模型均支持文本和多模态任务 [2][5][6]
阿里发布新一代基模千问3.5
新浪财经· 2026-02-16 17:53
公司发布新一代大模型 - 阿里巴巴于2月16日开源全新一代大模型千问Qwen3.5-Plus [1] - Qwen3.5-Plus版本总参数量为3970亿,激活参数量为170亿,性能超过其万亿参数的Qwen3-Max模型 [1] - 该模型部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍 [1] 模型定价与市场竞争力 - Qwen3.5-Plus的API价格低至每百万Token 0.8元 [1] - 其API价格仅为谷歌Gemini 3 pro模型的1/18 [1] 产品接入与开发者生态 - 千问APP和PC端已第一时间接入Qwen3.5-Plus模型 [1] - 开发者可通过魔搭社区和HuggingFace平台下载新模型 [1] - 开发者也可通过阿里云百炼平台直接获取该模型的API服务 [1]
Qwen3.5-Plus登顶全球最强开源模型
新浪财经· 2026-02-16 17:53
公司技术发布 - 阿里巴巴旗下阿里云开源全新一代大模型千问Qwen3.5-Plus,该模型登顶全球最强开源模型 [1] - 千问3.5实现了从纯文本模型到原生多模态模型的代际跃迁 [1] - 千问3.5基于视觉和文本混合token进行预训练,而千问3预训练仅在纯文本Tokens上进行 [1] 模型性能与优势 - 千问3.5以不到40%的参数量,获得了超万亿参数的Qwen3-Max基座模型的顶尖性能 [1] - 模型在推理、编程、Agent智能体等全方位基准评估中均表现优异 [1] - 模型通过大幅新增中英文、多语言、STEM和推理等数据,增强了世界知识和推理逻辑 [1]
Qwen3.5-Plus的API价格每百万Token为0.8元
金融界· 2026-02-16 17:48
公司动态:产品发布与技术升级 - 阿里巴巴于除夕当天开源发布大语言模型新版本千问Qwen3.5-Plus [1] - 新版本总参数规模达3970亿,激活参数为170亿 [1] - 模型性能超越前代旗舰产品Qwen3-Max [1] - 模型在显存占用方面实现显著优化,下降幅度达60% [1] - 模型推理吞吐量获得大幅提升,提升倍数高达19倍 [1] 商业模式与市场策略 - 公司为Qwen3.5-Plus模型设定了API调用价格,为每百万Token 0.8元 [1] - 公司已将新模型率先接入其自有应用生态,包括千问APP和PC端 [1]
阿里正式发布新一代大模型Qwen3.5
每日经济新闻· 2026-02-16 17:36
公司动态 - 公司于2月16日发布了名为Qwen3.5的新模型系列,并推出了该系列的首个模型Qwen3.5-397B-A17B的开放权重版本[1] - 该模型采用创新的混合架构,将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)技术相结合[1] - 模型总参数量达到3970亿,但每次前向传播仅激活170亿参数[1] 产品与技术 - 新模型通过创新的混合架构设计,旨在实现出色的推理效率[1] - 模型在保持强大能力的同时,优化了运行速度与成本[1] - 技术核心是结合了线性注意力与稀疏混合专家系统,以实现参数的高效利用[1]
揭秘春节红包的算法门道:最后出手的人,更容易拿“手气最佳”?
新浪财经· 2026-02-16 17:34
春节红包现象与营销策略 - 春节抢红包已成为由各大社交平台和明星联手打造的声势浩大的“数字新年俗”[2] - 除夕夜和大年初一,由明星、网红组成的200位福气加马官将狂撒百万红包雨[2] - 该活动不仅是“发钱”,更是一场集宠粉、剧宣、平台引流于一体的营销盛宴[2] - 截至当天下午4点,微博热搜前10名中,“红包”占据六席[3] 红包分配算法与公平性 - 早期红包采用完全随机分配,存在漏洞,先抢者更容易拿到大额红包[9] - 例如:100元红包分给10人,第一人可抢金额范围0.01~100元,数学期望为50元[9] - 若第一人只抢10元,剩余90元,第二人可抢金额范围变为0.01~90元,期望降至45元,导致“先抢占便宜,后抢吃大亏”[9] - 目前红包界多采用“二倍均值法”以兼顾随机性与公平性[10] - 该方法为每个红包设限,最少0.01元,最多不超过剩余金额平均值的两倍[11] - 例如:100元分10人,第一人最多可抢(100/10)*2=20元,金额范围0.01~20元,期望为10元[12] - 若第一人抢走20元,剩余80元分9人,第二人上限为(80/9)*2≈17.78元,期望约8.89元,避免了期望值断崖式下跌[12] - 该算法将平均运气拉平,且因后期人数减少,系统允许上限相对放开,后抢者更容易“逆袭称王”[14] - 实际平台算法更复杂,需兼顾最小金额限制、高并发系统稳定性等细节[14] 互联网大厂红包大战与AI引流 - 马年春节期间,腾讯、百度、阿里巴巴、京东等互联网大厂计划派发的红包总额已超过75亿元[16] - 除京东的30亿红包主要投放电商场景外,其余大部分红包多是为各大AI应用引流[16] - 百度旗下AI应用文心助手于1月26日上线春节红包活动,用户可分5亿元现金红包,最高可获得1万元奖励[18] - 腾讯元宝于2月1日启动春节红包活动,用户可分10亿元现金红包,单个红包金额可达万元[18] - 2月16-17日期间,用户可在元宝App制作拜年朋友圈并发布到微信,在朋友圈下点击“拜年”有机会领彩蛋红包,元宝还加送100张万元现金“小马卡”[18][19] - 腾讯公关总监张军发布制作金色朋友圈攻略,在元宝里制作“拜年朋友圈”并发表可触发金色效果,给别人的金色朋友圈点赞还有机会掉落红包[16] - 阿里旗下千问App于2月2日宣布投入30亿启动“春节请客计划”,于2月6日正式上线,联合淘宝闪购、飞猪等阿里生态业务以免单形式邀请用户吃喝玩乐[19] - 今年春晚,抖音旗下豆包和火山引擎将送出包含宇树、奔驰、大疆等智能产品以及最高8888元现金红包[19]
“源神”启动!阿里杀手锏——全新架构千问3.5来了,最强性能x最低成本
硬AI· 2026-02-16 17:32
千问3.5的核心突破与性能优势 - 阿里巴巴正式开源Qwen3.5-Plus,其性能指标直接对标Gemini 3 pro与GPT 5.2等顶级闭源模型,成为全球最强开源模型[3] - 模型采用全新架构,总参数397B,推理时仅激活17B参数,相比上代万亿参数的Qwen3 Max,部署显存占用降低60%,最大推理吞吐量可提升至19倍[4] - 模型实现了“以小胜大”,API价格降至0.8元/百万Token,同等性能下仅为Gemini 3 Pro的十八分之一,打破了高算力、高成本的闭环[7] - 模型具备真正的原生多模态理解能力,从预训练起就在文本与视觉混合数据中联合学习,实现了人类级别的跨模态理解,能力边界宽广[11][12][14] - 具体能力包括:像素级细粒度视觉定位、理解长达2小时视频的时序与因果关联、将手绘草图转化为可运行的前端代码,以及作为视觉智能体操控手机与电脑完成复杂指令[15][17] 驱动性能跃迁的全新架构技术 - 竞争重点从参数规模转向模型效率,通过四项核心技术创新实现代际跃迁[20][21] - **混合注意力机制**:模型动态分配注意力资源,略读无关信息,精读关键节点,提升长文本处理效率与精度[21] - **极致稀疏的混合专家架构**:从397B总参数库中精准激活与任务最相关的专家子网络,每次推理仅用17B参数,以不到5%的算力调动全局知识[4][21] - **原生多Token预测**:在预训练阶段学会对后续多个Token进行前瞻性联合预测,使长文生成、代码补全等场景的推理速度接近翻倍[21] - **系统级训练稳定性优化**:采用获NeurIPS 2025最佳论文的注意力门控机制,配合归一化与专家路由初始化,确保大规模训练稳健[21][22] - 技术叠加效应显著:训练成本降低90%,相比Qwen3 Max显存占用降60%,推理吞吐量最高提升19倍,原生多模态融合使训练提速10%、激活内存减少50%[22] 开源生态与市场领导地位 - 公司坚持开源战略,千问产品矩阵全线遵循Apache 2.0协议开放,迅速成为最受欢迎的开源大模型[24] - 开源生态数据优势明显:官方开源模型超400个,全球开发者衍生的微调与定制模型突破20万个,总下载量超10亿次,在热度、活跃度与生态广度上全面超越Meta的Llama生态[24] - 李飞飞团队、爱彼迎等顶尖力量已将千问深度嵌入其AI引擎,免费且最强的特性成为开发者无法拒绝的选项[24] - 在企业市场,通过平头哥真武芯片与千问模型的软硬件深度耦合,实现了对MoE架构的底层指令级优化,释放了芯片算力潜能,这是实现极低API定价的底气[25] - 阿里云在中国AI云市场占据领导地位:2025年上半年市场规模达223亿元,阿里云以35.8%的市场占比排名第一,超过第二至第四名总和[26] - 市场预测2025-2030年中国AI云市场复合年增长率为26.8%,其中MaaS层增速最快,复合增长率超72%,2030年将达177亿元规模,阿里云市场份额从33%升至36%[26] - 财务数据印证增长趋势:阿里云公共云收入同比增长34%,AI相关产品收入连续9个季度保持三位数增长[28] 战略影响与行业范式切换 - 此次发布标志着AI产业的范式切换,公司通过技术创新重构行业规则,使AI从少数人的工具走向所有人的生产力工具[31][32] - 竞争主轴已从单点性能跑分转向生态系统的整体替代,目标是让“powered by 阿里云”成为AI时代的默认技术印记[24][30] - 开源、免费、无处不在的特质,使千问有望像Linux和Android定义各自时代一样,成为AI产业的底层基石[30] - 公司采取双管齐下战略:研发端高频推出SOTA模型,生态端坚持开源,将核心技术直接推向全球数千万开发者[24]
阿里开源新一代基模千问3.5,可通过千问APP免费体验
财经网· 2026-02-16 17:31
公司动态与产品发布 - 阿里巴巴于2月16日除夕当天开源全新一代大模型千问Qwen3.5-Plus [1] - 该模型性能媲美Gemini3Pro,并登顶全球最强开源模型 [1] - 千问3.5实现了底层模型架构的全面革新 [1] 产品性能与技术参数 - Qwen3.5-Plus模型总参数为3970亿,激活参数仅170亿 [1] - 模型性能超过万亿参数的Qwen3-Max模型,实现了“以小胜大” [1] - 模型部署显存占用降低60%,推理效率大幅提升 [1] - 模型最大推理吞吐量可提升至19倍 [1] 市场定价与竞争优势 - Qwen3.5-Plus的API价格低至每百万Token 0.8元 [1] - 其API价格仅为竞争对手Gemini3Pro的1/18,展现出显著的成本优势 [1]
阿里正式发布新一代基模千问3.5
第一财经· 2026-02-16 17:24
阿里巴巴发布新一代大模型Qwen3.5-Plus - 公司于2月16日开源全新一代大模型千问Qwen3.5-Plus,该版本实现了底层模型架构的创新 [1] - Qwen3.5-Plus模型总参数为3970亿,激活参数仅170亿,性能超过万亿参数的Qwen3-Max模型 [1] - 与之前模型相比,新模型部署显存占用降低60%,最大推理吞吐量可提升至19倍 [1] - 该模型的API定价极具竞争力,每百万Token价格低至0.8元 [1] 模型定位与获取渠道 - 公司同时上线了两款新模型:Qwen3.5-Plus定位为Qwen3.5系列最新大语言模型,Qwen3.5-397B-A17B定位为Qwen3.5开源系列旗舰大语言模型 [1] - 两款模型均支持文本和多模态任务 [1] - 开发者可通过魔搭社区和HuggingFace平台下载新模型,或通过阿里云百炼直接获取API服务 [1] 产品集成与上线 - 千问APP、PC端已第一时间接入Qwen3.5-Plus模型 [1] - 公司于发布当日下午,在chat.qwen.ai页面低调上线了Qwen3.5-Plus和Qwen3.5-397B-A17B两款新模型 [1]