阿里巴巴(BABA)
搜索文档
阿里正式发布新一代大模型Qwen3.5
每日经济新闻· 2026-02-16 17:36
公司动态 - 公司于2月16日发布了名为Qwen3.5的新模型系列,并推出了该系列的首个模型Qwen3.5-397B-A17B的开放权重版本[1] - 该模型采用创新的混合架构,将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)技术相结合[1] - 模型总参数量达到3970亿,但每次前向传播仅激活170亿参数[1] 产品与技术 - 新模型通过创新的混合架构设计,旨在实现出色的推理效率[1] - 模型在保持强大能力的同时,优化了运行速度与成本[1] - 技术核心是结合了线性注意力与稀疏混合专家系统,以实现参数的高效利用[1]
揭秘春节红包的算法门道:最后出手的人,更容易拿“手气最佳”?
新浪财经· 2026-02-16 17:34
春节红包现象与营销策略 - 春节抢红包已成为由各大社交平台和明星联手打造的声势浩大的“数字新年俗”[2] - 除夕夜和大年初一,由明星、网红组成的200位福气加马官将狂撒百万红包雨[2] - 该活动不仅是“发钱”,更是一场集宠粉、剧宣、平台引流于一体的营销盛宴[2] - 截至当天下午4点,微博热搜前10名中,“红包”占据六席[3] 红包分配算法与公平性 - 早期红包采用完全随机分配,存在漏洞,先抢者更容易拿到大额红包[9] - 例如:100元红包分给10人,第一人可抢金额范围0.01~100元,数学期望为50元[9] - 若第一人只抢10元,剩余90元,第二人可抢金额范围变为0.01~90元,期望降至45元,导致“先抢占便宜,后抢吃大亏”[9] - 目前红包界多采用“二倍均值法”以兼顾随机性与公平性[10] - 该方法为每个红包设限,最少0.01元,最多不超过剩余金额平均值的两倍[11] - 例如:100元分10人,第一人最多可抢(100/10)*2=20元,金额范围0.01~20元,期望为10元[12] - 若第一人抢走20元,剩余80元分9人,第二人上限为(80/9)*2≈17.78元,期望约8.89元,避免了期望值断崖式下跌[12] - 该算法将平均运气拉平,且因后期人数减少,系统允许上限相对放开,后抢者更容易“逆袭称王”[14] - 实际平台算法更复杂,需兼顾最小金额限制、高并发系统稳定性等细节[14] 互联网大厂红包大战与AI引流 - 马年春节期间,腾讯、百度、阿里巴巴、京东等互联网大厂计划派发的红包总额已超过75亿元[16] - 除京东的30亿红包主要投放电商场景外,其余大部分红包多是为各大AI应用引流[16] - 百度旗下AI应用文心助手于1月26日上线春节红包活动,用户可分5亿元现金红包,最高可获得1万元奖励[18] - 腾讯元宝于2月1日启动春节红包活动,用户可分10亿元现金红包,单个红包金额可达万元[18] - 2月16-17日期间,用户可在元宝App制作拜年朋友圈并发布到微信,在朋友圈下点击“拜年”有机会领彩蛋红包,元宝还加送100张万元现金“小马卡”[18][19] - 腾讯公关总监张军发布制作金色朋友圈攻略,在元宝里制作“拜年朋友圈”并发表可触发金色效果,给别人的金色朋友圈点赞还有机会掉落红包[16] - 阿里旗下千问App于2月2日宣布投入30亿启动“春节请客计划”,于2月6日正式上线,联合淘宝闪购、飞猪等阿里生态业务以免单形式邀请用户吃喝玩乐[19] - 今年春晚,抖音旗下豆包和火山引擎将送出包含宇树、奔驰、大疆等智能产品以及最高8888元现金红包[19]
“源神”启动!阿里杀手锏——全新架构千问3.5来了,最强性能x最低成本
硬AI· 2026-02-16 17:32
千问3.5的核心突破与性能优势 - 阿里巴巴正式开源Qwen3.5-Plus,其性能指标直接对标Gemini 3 pro与GPT 5.2等顶级闭源模型,成为全球最强开源模型[3] - 模型采用全新架构,总参数397B,推理时仅激活17B参数,相比上代万亿参数的Qwen3 Max,部署显存占用降低60%,最大推理吞吐量可提升至19倍[4] - 模型实现了“以小胜大”,API价格降至0.8元/百万Token,同等性能下仅为Gemini 3 Pro的十八分之一,打破了高算力、高成本的闭环[7] - 模型具备真正的原生多模态理解能力,从预训练起就在文本与视觉混合数据中联合学习,实现了人类级别的跨模态理解,能力边界宽广[11][12][14] - 具体能力包括:像素级细粒度视觉定位、理解长达2小时视频的时序与因果关联、将手绘草图转化为可运行的前端代码,以及作为视觉智能体操控手机与电脑完成复杂指令[15][17] 驱动性能跃迁的全新架构技术 - 竞争重点从参数规模转向模型效率,通过四项核心技术创新实现代际跃迁[20][21] - **混合注意力机制**:模型动态分配注意力资源,略读无关信息,精读关键节点,提升长文本处理效率与精度[21] - **极致稀疏的混合专家架构**:从397B总参数库中精准激活与任务最相关的专家子网络,每次推理仅用17B参数,以不到5%的算力调动全局知识[4][21] - **原生多Token预测**:在预训练阶段学会对后续多个Token进行前瞻性联合预测,使长文生成、代码补全等场景的推理速度接近翻倍[21] - **系统级训练稳定性优化**:采用获NeurIPS 2025最佳论文的注意力门控机制,配合归一化与专家路由初始化,确保大规模训练稳健[21][22] - 技术叠加效应显著:训练成本降低90%,相比Qwen3 Max显存占用降60%,推理吞吐量最高提升19倍,原生多模态融合使训练提速10%、激活内存减少50%[22] 开源生态与市场领导地位 - 公司坚持开源战略,千问产品矩阵全线遵循Apache 2.0协议开放,迅速成为最受欢迎的开源大模型[24] - 开源生态数据优势明显:官方开源模型超400个,全球开发者衍生的微调与定制模型突破20万个,总下载量超10亿次,在热度、活跃度与生态广度上全面超越Meta的Llama生态[24] - 李飞飞团队、爱彼迎等顶尖力量已将千问深度嵌入其AI引擎,免费且最强的特性成为开发者无法拒绝的选项[24] - 在企业市场,通过平头哥真武芯片与千问模型的软硬件深度耦合,实现了对MoE架构的底层指令级优化,释放了芯片算力潜能,这是实现极低API定价的底气[25] - 阿里云在中国AI云市场占据领导地位:2025年上半年市场规模达223亿元,阿里云以35.8%的市场占比排名第一,超过第二至第四名总和[26] - 市场预测2025-2030年中国AI云市场复合年增长率为26.8%,其中MaaS层增速最快,复合增长率超72%,2030年将达177亿元规模,阿里云市场份额从33%升至36%[26] - 财务数据印证增长趋势:阿里云公共云收入同比增长34%,AI相关产品收入连续9个季度保持三位数增长[28] 战略影响与行业范式切换 - 此次发布标志着AI产业的范式切换,公司通过技术创新重构行业规则,使AI从少数人的工具走向所有人的生产力工具[31][32] - 竞争主轴已从单点性能跑分转向生态系统的整体替代,目标是让“powered by 阿里云”成为AI时代的默认技术印记[24][30] - 开源、免费、无处不在的特质,使千问有望像Linux和Android定义各自时代一样,成为AI产业的底层基石[30] - 公司采取双管齐下战略:研发端高频推出SOTA模型,生态端坚持开源,将核心技术直接推向全球数千万开发者[24]
阿里开源新一代基模千问3.5,可通过千问APP免费体验
财经网· 2026-02-16 17:31
公司动态与产品发布 - 阿里巴巴于2月16日除夕当天开源全新一代大模型千问Qwen3.5-Plus [1] - 该模型性能媲美Gemini3Pro,并登顶全球最强开源模型 [1] - 千问3.5实现了底层模型架构的全面革新 [1] 产品性能与技术参数 - Qwen3.5-Plus模型总参数为3970亿,激活参数仅170亿 [1] - 模型性能超过万亿参数的Qwen3-Max模型,实现了“以小胜大” [1] - 模型部署显存占用降低60%,推理效率大幅提升 [1] - 模型最大推理吞吐量可提升至19倍 [1] 市场定价与竞争优势 - Qwen3.5-Plus的API价格低至每百万Token 0.8元 [1] - 其API价格仅为竞争对手Gemini3Pro的1/18,展现出显著的成本优势 [1]
阿里正式发布新一代基模千问3.5
第一财经· 2026-02-16 17:24
阿里巴巴发布新一代大模型Qwen3.5-Plus - 公司于2月16日开源全新一代大模型千问Qwen3.5-Plus,该版本实现了底层模型架构的创新 [1] - Qwen3.5-Plus模型总参数为3970亿,激活参数仅170亿,性能超过万亿参数的Qwen3-Max模型 [1] - 与之前模型相比,新模型部署显存占用降低60%,最大推理吞吐量可提升至19倍 [1] - 该模型的API定价极具竞争力,每百万Token价格低至0.8元 [1] 模型定位与获取渠道 - 公司同时上线了两款新模型:Qwen3.5-Plus定位为Qwen3.5系列最新大语言模型,Qwen3.5-397B-A17B定位为Qwen3.5开源系列旗舰大语言模型 [1] - 两款模型均支持文本和多模态任务 [1] - 开发者可通过魔搭社区和HuggingFace平台下载新模型,或通过阿里云百炼直接获取API服务 [1] 产品集成与上线 - 千问APP、PC端已第一时间接入Qwen3.5-Plus模型 [1] - 公司于发布当日下午,在chat.qwen.ai页面低调上线了Qwen3.5-Plus和Qwen3.5-397B-A17B两款新模型 [1]
阿里正式发布新一代基模千问3.5
第一财经· 2026-02-16 17:20
公司动态 - 阿里巴巴于2月16日开源了全新一代大模型千问Qwen3.5-Plus [1] - Qwen3.5-Plus版本总参数为3970亿,但激活参数仅170亿 [1] - 该模型性能超过其万亿参数的Qwen3-Max模型 [1] - 千问APP及PC端已第一时间接入Qwen3.5-Plus模型 [1] - 开发者可通过魔搭社区、HuggingFace下载新模型,或通过阿里云百炼获取API服务 [1] 技术突破 - Qwen3.5实现了底层模型架构的创新 [1] - 与Qwen3-Max相比,Qwen3.5-Plus的部署显存占用降低了60% [1] - Qwen3.5-Plus的最大推理吞吐量可提升至19倍 [1] 商业化与定价 - Qwen3.5-Plus的API服务定价为每百万Token低至0.8元 [1]
阿里发布千问3.5:性能媲美Gemini 3,Token价格仅为其1/18
新浪财经· 2026-02-16 17:13
阿里巴巴发布千问Qwen3.5-Plus大模型 - 阿里巴巴于2月16日(除夕)开源全新一代大模型千问Qwen3.5-Plus,宣布其性能媲美Gemini 3 Pro,并登顶全球最强开源模型 [1][4] - 该模型实现了底层模型架构的全面革新,从纯文本模型跃迁为原生多模态模型,基于视觉和文本混合token进行预训练 [1][4] 模型性能与效率 - Qwen3.5-Plus总参数为3970亿,激活参数仅170亿,性能超过万亿参数的Qwen3-Max模型 [1][4] - 部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍 [1][4] - 以不到40%的参数量获得了超万亿参数Qwen3-Max基座模型的顶尖性能 [1][4] 成本优势 - Qwen3.5-Plus的API价格低至每百万Token 0.8元,仅为Gemini 3 Pro价格的1/18 [1][4] 技术升级与数据增强 - 相比千问3的纯文本预训练,千问3.5大幅新增了中英文、多语言、STEM和推理等数据 [1][4] - 技术升级使模型学会了更密集的世界知识和推理逻辑 [1][4] 基准评测表现 - 在MMLU-Pro知识推理评测中得分87.8分,超越GPT-5.2 [2][5] - 在博士级难题GPQA测评中斩获88.4分,高于Claude 4.5 [2][5] - 在指令遵循IFBench以76.5分刷新所有模型纪录 [2][5] - 在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,表现均超越Gemini 3 Pro和GPT-5.2 [2][5] - 在推理、编程、Agent智能体等全方位基准评估中均表现优异 [1][4]
阿里Qwen3.5-Plus/Qwen3.5-397B-A17B新模型上线
第一财经· 2026-02-16 17:12
公司产品发布 - 公司于今天下午在chat.qwen.ai页面低调上线了两款新模型,分别为Qwen3.5-Plus和Qwen3.5-397B-A17B [1] - Qwen3.5-Plus定位为Qwen3.5系列最新的大语言模型 [1] - Qwen3.5-397B-A17B定位为Qwen3.5开源系列的旗舰大语言模型 [1] - 两款新模型均支持文本和多模态任务 [1] 行业技术动态 - 公司发布了参数规模达397B(即3970亿)和A17B(即170亿)级别的大语言模型,表明行业在模型规模上持续探索 [1]
阿里发布千问3.5,性能媲美Gemini 3, Token价格仅为其1/18
华尔街见闻· 2026-02-16 17:07
公司动态与产品发布 - 阿里巴巴于2月16日除夕当天开源了全新一代大模型千问Qwen3.5-Plus [1] - Qwen3.5-Plus版本总参数为3970亿,激活参数仅170亿,性能超过万亿参数的Qwen3-Max模型 [1] - 该模型部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍 [1] - Qwen3.5-Plus的API价格定为每百万Token低至0.8元 [1] - 千问APP、PC端已第一时间接入Qwen3.5-Plus模型 [1] 产品性能与竞争优势 - 千问Qwen3.5-Plus性能媲美Gemini 3 Pro,登顶全球最强开源模型 [1] - 模型在底层模型架构上实现全面革新,以较小参数量实现高性能,即“以小胜大” [1] - Qwen3.5-Plus的API价格仅为Gemini 3 pro的1/18 [1] - 模型在文本和视觉的混合数据上预训练,实现了原生多模态的新突破 [1] - 在推理、编程、Agent智能体等全方位基准评估中均表现优异,并在视觉理解能力的权威评测中斩获数项性能最佳 [1] 生态与开发者支持 - 开发者可在魔搭社区和HuggingFace平台下载新模型 [1] - 开发者可通过阿里云百炼平台直接获取API服务 [1]
Alibaba unveils new Qwen3.5 model for 'agentic AI era'
Reuters· 2026-02-16 17:01
阿里巴巴发布新模型 - 公司于周一发布了新一代人工智能模型Qwen 3.5,旨在独立执行复杂任务,进入“智能体AI时代” [1] - 新模型在性能和成本上有重大改进,公司声称其在多项基准测试中超越了主要美国竞争对手模型 [1] - 新模型的使用成本比其前代产品降低了60%,处理大型工作负载的能力提升了八倍 [2] - 模型具备“视觉智能体能力”,能够独立在移动和桌面应用程序中执行操作 [2] - 公司表示,Qwen3.5旨在帮助开发者和企业用相同的计算资源更快地完成更多工作,为每单位推理成本的能力设定了新基准 [3] 市场竞争格局 - 发布新模型旨在吸引更多用户使用其Qwen聊天机器人应用,当前中国市场主要由字节跳动的豆包和DeepSeek主导 [1] - 字节跳动于周六发布了其聊天机器人应用豆包的2.0版本,该应用目前拥有中国最大的用户群,接近2亿 [3] - 去年,公司是首批对DeepSeek迅速崛起做出反应的竞争对手之一,发布了声称优于DeepSeek热门模型的Qwen 2.5-Max [5] - 此次发布未提及DeepSeek,其公布的基准测试仅显示新模型优于其前代迭代以及美国竞争对手模型GPT-5.2、Claude Opus 4.5和Gemini 3 Pro [5] - DeepSeek预计将在未来几天发布其新一代模型,鉴于该公司一年前曾引发全球科技股抛售,这引发了投资者和业内人士的期待 [6] 业务进展与市场策略 - Qwen3.5的推出可能有助于巩固公司近期在中国激烈的AI模型竞争中所取得的成果 [4] - 本月早些时候,公司通过优惠券赠送活动鼓励消费者在Qwen聊天机器人中直接购买食品饮料,尽管存在一些技术故障,但活跃用户数增长了七倍 [4]