Workflow
Qwen3
icon
搜索文档
蚂蚁阿福爆火背后:大厂AI,正霸榜2025
36氪· 2025-12-17 10:24
中国的AI叙事逻辑,在悄然变化。 2025年以来,曾经以"AI六小虎"为代表,凭借创新概念搅动赛道的初创公司,当下面临着更深度的竞争压力。而反观传统互联网大厂,其在AI赛道的动作 越发密集和大力度。 最明显的体现,便是大厂布局的不断深入。除了竞相推出全新的基础模型和应用以外,大厂还公开表态要加大对AI的资金和技术投入,诸如阿里、字节 等已经有了突出进展的选手,不但已经具备了全栈的AI能力,也已经过渡到用"杀手级"应用在核心场景做卡位。 比如,12月15日,蚂蚁集团宣布全面升级旗下AI健康应用"蚂蚁阿福",新版App凭借健康陪伴等亮点,发布后迅速攀升至苹果应用商店免费榜第三位,引 发了行业广泛关注。这也是近期阿里系继开售夸克AI眼镜、上线"千问"及"灵光"应用、成立千问C端事业群等动作之后的又一大动作。 产品层面,年初DeepSeek等产品的爆火,以前所未有的力度完成了一轮AI市场教育,大众对AI产品的认知真正从一种新奇技术转变为得心应手的日常工 具。而阿里、字节、腾讯等大厂又凭借巨额营销投入和天然的生态入口等优势,牢牢把控住大量用户的"屏幕"。 以a16z今年发布的全球top 100消费级Gen AI应用榜单 ...
斯坦福报告:AI透明度集体倒退!IBM夺冠,马斯克xAI垫底
搜狐财经· 2025-12-16 18:28
(来源:The 2025 Foundation Model Transparency Index) 从报告的整体结果来看,尽管 2024 年报告显示模型透明度有短暂的改善,但 2025 年的报告指出,透明度指数正呈现倒退:各基础模型的平 均得分从 2024 年的 58 分下降到 2025 年的 40 分,几乎与 2023 年报告首次发布时的水平相当(备注:100 分为满分)。 最近,美国斯坦福大学等团队发布了一份名为《2025 年基础模型透明度指数》(FMTI,The 2025 Foundation Model Transparency Index)的报 告。其中,IBM 以透明度得分最高夺冠,xAI 和 Midjourney 则垫底。 该报告揭示了一种令人担忧的趋势:随着技术的发展,尽管基础模型在性能等各方面持续进步,但其在数据使用、模型训练和下游影响等方 面的透明度却出现了集体倒退。 这是该报告自 2023 年以来发布的第三个年度版本,就像通过量化透明度为各大基础模型开发者做一次"体检"。 本次评估共包括 13 家基础模型公司,其中既有阿里巴巴、DeepSeek 和马斯克的 xAI 等首次纳入报告的企业, ...
DeepSeek V3到V3.2的进化之路,一文看全
机器之心· 2025-12-08 12:27
DeepSeek模型系列技术演进 - 公司于2024年12月发布DeepSeek V3基础模型,随后推出基于相同架构的专用推理模型DeepSeek R1,使其成为最受欢迎的开放权重模型之一,成为OpenAI、Google、xAI和Anthropic等公司专有模型的有力替代方案[11] - 从DeepSeek V3到V3.2的演进过程中,公司模型策略从专用推理模型转向混合模型,V3.1和V3.2均为兼具通用聊天和推理能力的混合模型,而R1可能更多是作为研究项目或测试平台[25] - 公司于2025年9月发布实验性模型DeepSeek V3.2-Exp,旨在为更大规模的发布准备生态系统和推理基础设施,该模型引入了非标准的稀疏注意力变体,需要定制代码[17][18] - 2025年12月1日,公司发布新旗舰模型DeepSeek V3.2和DeepSeek V3.2-Speciale,与当前专有旗舰模型相比表现非常出色[5][103] 核心架构创新:注意力机制与效率提升 - DeepSeek V3基础模型采用了混合专家模型和多头潜在注意力架构,MLA通过在将键和值张量存储到KV缓存前将其压缩到低维空间来节省内存,虽然增加了一次额外的矩阵乘法,但显著减少了内存使用[29][31][32] - DeepSeek V3.2-Exp及V3.2的主要架构创新是DeepSeek稀疏注意力,该机制由Lightning Indexer和Token选择器组成,基于学习到的相关性分数选择性地关注部分过去的Token,而非所有Token或固定局部窗口[49][50][54][58][59] - DSA将注意力机制的计算复杂度从二次的O(L²)降低到了线性的O(Lk),其中L是序列长度,k是选定Token的数量,在减少性能衰减的同时实现了效率提升[66][67][68] - DeepSeek V3.2使用了与DeepSeek V3.2-Exp完全相同的架构,集成了MLA和DSA机制,主要动机是提高整体模型性能的同时,将计算效率视为巨大驱动因素[107][110] 训练方法演进:从RLVR到自我验证 - DeepSeek R1专注于“带可验证奖励的强化学习”方法以提高推理能力,其核心思想是让模型从可以进行符号化或编程验证的响应中学习,例如数学和代码[37][38] - RLVR流程使用了GRPO算法,这是“近端策略优化”算法的一个简化变体,GRPO取消了评论家模型,而带GRPO的RLVR进一步移除了奖励模型,转而依赖来自符号工具的可验证奖励[40][42] - 为改善常规RLVR的缺点,公司在DeepSeekMath V2中引入了自我验证与自我修正技术,开发了基于LLM的验证器和元验证器来对证明生成器的输出进行评分和检查,使验证器证明分析的平均质量得分从0.85提高到了0.96[76][77][83][86][89][90] - 在推理期间,公司使用单一模型同时执行证明生成和验证,这比运行第二个LLM进行证明验证增加了更少的复杂性和计算需求,通过多达8次的自我修正迭代,模型的准确性得到提高且尚未饱和[98][99][102] DeepSeek V3.2的具体训练改进 - DeepSeek V3.2采用了类似于DeepSeek R1的RLVR程序,但更新了奖励机制,对于推理和智能体任务采用基于规则的结果奖励、长度惩罚和语言一致性奖励,对于通用任务则采用生成式奖励模型[115][116] - 对于数学领域,公司整合了来自DeepSeekMath-V2的数据集和奖励方法[117] - 在GRPO算法本身,公司进行了一系列稳定性更新,包括:零梯度信号过滤、主动采样、Token级损失、无KL损失、更高裁剪阈值、截断重要性采样、无标准差归一化、特定领域的KL强度、无偏KL估计、异策略序列掩码、保留MoE模型的路由、保留top-p/top-k的采样掩码以及保留原始GRPO优势归一化[119][120][122] - DeepSeek V3.2-Speciale是V3.2的扩展思维变体,其在RL阶段仅在推理数据上进行训练,并减少了长度惩罚以允许模型输出更长的响应,这种推理扩展形式以生成长度增加为代价获得更好的结果[123][124] 模型性能表现 - DeepSeek V3.2在多项基准测试中与专有旗舰模型相比表现非常出色,在数学基准测试中获得了金牌级的表现,同时在训练时也考虑到了工具的使用,在其他任务上也表现良好[103][107] - 扩展思维变体DeepSeek V3.2-Speciale在多个基准测试中实现了更高的准确性,例如在AIME 2025基准上达到96.0,在HMMT Feb 2025基准上达到99.2,但同时也生成了更多的Token[127]
图解Qwen3-VL多模态模型
自动驾驶之心· 2025-11-29 10:06
Qwen3-VL多模态模型架构分析 - 文章核心观点是通过源码解析Qwen3-VL多模态大模型的内部实现细节,重点阐述其如何整合处理视觉和文本信息[2][3] - Qwen3-VL模型将文本和图像作为输入进行处理的自回归AI模型,源码实现包含配置、多模态模型、图片处理和视频处理四大核心模块[4][5] 模型核心组件与处理流程 - 模型入口类Qwen3VLForConditionalGeneration负责整合输入数据,处理流程包括:接收pixel_value和input_ids输入、通过Qwen3VLModel处理多模态数据、经线性层lm_head输出logits、最终以统一格式输出结果[12][13][15][16] - Qwen3VLModel类实现多模态数据融合:通过get_image_features将图像转换为image_embeds,文本通过get_input_embeddings转为inputs_embeds,使用masked_scatter技术将视觉嵌入整合到文本序列中,最终输入大语言模型进行统一处理[18][20][21] 视觉编码器技术实现 - Qwen3-VL采用自研视觉编码器而非现有CLIP或SigLIP方案,通过Qwen3VLVisionPatchEmbed的3维卷积将图像转为hidden_states,结合位置编码后输入27层Attention模块的Qwen3VLVisionBlock进行处理[34][35][37][40] - 视觉处理使用Qwen2VLImageProcessorFast实现图像到pixel_value的转换,预处理过程包含图像分组、尺寸调整、归一化和特征网格重组等步骤,最终输出模型可处理的pixel_values张量[7][8][9][10] 多模态融合与位置编码机制 - 模型采用特殊标记<|im_start|>和<|im_end|>实现视觉与文本特征的精确对齐,通过get_rope_index方法计算旋转位置编码索引,支持图像和视频序列的时空位置信息编码[21][22][23][24] - 视觉特征嵌入过程严格校验占位符标记与特征数量匹配,确保多模态数据融合的准确性,最终生成包含视觉位置掩码和深度堆叠特征的统一表示[30][31][32][33]
重金砸下满屏“千问”,暴露了阿里的生态野心
搜狐财经· 2025-11-27 05:14
公司战略与产品发布 - 阿里于2025年11月14日将“通义App”正式更名为“千问App”,版本号从3.60.0升级至5.0.0,此次更名上线由阿里巴巴集团CEO吴泳铭亲自拍板决策 [2] - 全新的千问项目归属于阿里智能信息事业群,但统筹工作已上升到阿里巴巴集团层面主导 [2] - 千问APP于11月17日公测版上线,接入Qwen3模型,宣称打造面向C端用户的AI超级原生应用,是阿里在AI to C领域的“一剂猛药” [4][6] - 公司最新AI战略为:在AI to B领域,做世界领先的全栈AI服务商;在AI to C领域,打造面向C端用户的AI超级原生应用 [9] 产品性能与技术基础 - 千问APP搭载的Qwen3模型是一款全系列开源模型,采用Apache 2.0协议,允许自由修改与商用 [4] - Qwen3实现了混合推理模式落地,支持用户自主切换思考模式与非思考模式,其4B参数模型性能宣称可媲美上代72B模型 [4] - 据称Qwen3已成为硅谷AI基础设施的重要组成部分,但在硬核编程、复杂多任务适配等场景仍存在明显短板 [4][5] 市场推广与用户反响 - 千问App上线后进行了声势浩大的宣传造势,营销覆盖面广,大量科技、财经、娱乐、教育博主参与推广,ASA竞价关键词数量从千级跃升至万级 [6] - 用户对密集宣传反响强烈,并有对产品与夸克是否存在重复建设的疑惑 [8] - 公测一周后,千问App下载量突破1000万次,对比ChatGPT实现此目标用了40天,DeepSeek用时20天 [8] 市场竞争与行业地位 - 更名前,通义App在中国AI应用中的月活跃用户排名第十,月活跃用户仅为306万,而行业前三的豆包、DeepSeek、腾讯元宝的MAU分别为1.72亿、1.45亿、3286万 [1] - 国内目前尚未出现一款能稳定突破亿级DAU的国民级AI应用,产品大都还处于初级阶段 [12] - 公司在AI to C应用上动作相对迟缓,已错过最好增长机会,但其模型能力公认很强 [11][12] 生态整合与业务表现 - 千问将与夸克整合,新版的夸克AI浏览器基于千问底层基础,无需打开即可唤起千问AI助手,意味着千问从APP走向PC端 [8] - 此举被视作公司在C端布局的双保险,核心目标是争夺AI时代的超级流量入口 [8] - 阿里云智能集团三季度收入为398.24亿元,同比增长34%,是公司增速最高的业务板块 [9] - 过去4个季度,公司在AI+云基础设施的资本开支约1200亿元,并计划持续投入3800亿元用于AI基础设施建设 [9]
阿里财报:四个季度资本开支1200亿,全栈AI能力全面提升
环球网· 2025-11-25 19:19
公司财务业绩 - 2026财年第二季度阿里云整体收入同比增长34% [1] - AI相关产品收入连续9个季度实现三位数(超过100%)同比增长 [1] - 本季度资本开支为315亿元,过去四个季度在AI+云基础设施的资本开支总额约1200亿元 [1] AI技术能力与基础设施 - 公司全栈AI能力显著升级,覆盖AI基建、AI模型及AI原生应用 [1] - 旗舰模型Qwen3-Max性能超过GPT5、Claude Opus 4等国际竞争者,跻身全球前三 [1] - AI基础设施包括服务器、高性能网络、分布式存储、智算集群及人工智能平台(PAI) [1] AI模型生态与市场地位 - 在Hugging Face平台上基于Qwen家族开发的衍生模型数量已超过18万个,超过第二名的两倍 [2] - 2025年上半年,阿里云在中国AI云市场份额位列第一,占比35.8%,超过第二到第四名的总和 [2] AI To C业务进展 - 基于Qwen3模型的千问App公测一周新下载量突破1000万,成为增长最快的AI应用 [1][3] - 千问App旨在打造个人AI助手,并将陆续接入电商、地图、本地生活等业务生态 [3] AI在核心业务中的应用 - 天猫双11首次大规模应用AI,覆盖搜索、推荐、广告、商家运营工具及C端导购等核心场景 [4] - 双11期间500万商家使用AI工具“生意管家”,实现平均1.5倍的效率提升 [4] - AI客服“店小蜜”累计服务3亿人次消费者,帮助商家转化效率提升30% [4] - 为消费者提供6款AI导购应用,包括“AI万能搜”、“AI帮我挑”、“AI试穿”等 [4] - 阿里国际站B2B采购搜索引擎Accio推出AI Agent版本,提高用户寻源与采购效率 [4] 公司战略方向 - 公司将继续投入构建AI技术和基础设施平台,以及生活服务与电商结合的大消费平台 [5]
阿里千问启用全新域名qianwen.com
凤凰网· 2025-11-24 20:36
公司战略与产品发布 - 阿里旗下AI助手“千问”正式启用全新域名qianwen.com,旨在提升用户访问便捷性 [1] - 千问网页端与App端实现无缝一致的使用体验,用户可通过网页直接体验 [1] - 千问网页端面向专业用户开放了更多Qwen3系列模型体验选择,包括Qwen3-Max-Thinking-Preview、Qwen3-Coder等十余款 [1] - 千问网页端增加了“对话分组”功能,方便用户管理对话记录 [1] 市场竞争与定位 - “千问”代表阿里巴巴全力进军AI to C市场的项目 [1] - 该产品基于全球性能第一的开源模型Qwen3,凭借免费以及与各类生活场景生态的结合,与ChatGPT展开全面竞争 [1] 市场表现与用户增长 - 自11月17日开启公测以来,千问App全网累计下载量已突破1000万次 [1] - 开启公测仅一周即实现上述下载量突破 [1]
阿里一度涨超5%,千问下载量破千万成增长最快AI应用
新浪财经· 2025-11-24 13:37
公司股价表现 - 港股阿里巴巴股价于11月24日走势强劲,日内涨幅一度涨超5%,午间休市报153.70港元,涨4.13%,市值为2.93万亿港元 [1] AI应用市场表现 - 阿里旗下AI助手千问APP公测第一周下载量突破1000万,成为史上增长最快的AI应用,超越ChatGPT、Sora、DeepSeek等竞品 [1] - 千问APP于11月17日开启公测后,迅速攀升至苹果App Store免费应用总榜第四位,两天后进入前三甲,目前排名第四 [3] - 公测首日因用户涌入过载导致部分服务出现拥堵和中断 [6] 公司AI战略与产品定位 - 千问APP基于阿里开源模型Qwen3开发,免费向用户开放,直接与ChatGPT竞争,标志着公司AI战略从侧重企业端市场向消费端市场的重大转向 [3][8] - 该应用旨在与用户对话及帮用户办事,后续将覆盖办公、地图、健康、购物等多个生活场景 [6] - 自2023年全面开源以来,阿里Qwen系列模型全球累计下载量突破6亿次,近期发布的旗舰模型Qwen3-Max性能跻身全球前列,超越GPT5和Claude Opus 4等国际竞品 [8] 行业竞争格局 - 根据10月数据,国内月活跃用户数量排名前三的AI聊天机器人应用分别为豆包(2.72亿)、DeepSeek(1.63亿)、腾讯元宝(5304.99万) [8] - 千问APP在短时间内异军突起,可能改变现有的市场竞争格局 [8]
AI圈大变天!阿里千问硬刚ChatGPT,开源免费掀翻行业规则
搜狐财经· 2025-11-21 16:48
产品发布与市场策略 - 阿里巴巴于11月17日突然官宣其AI产品“千问”APP公测,直接对标ChatGPT [4] - 千问基于全球性能第一的开源模型Qwen3,并采取免费策略,整合了淘宝、钉钉、高德、饿了么等阿里生态应用 [4] - 该产品旨在将AI从聊天工具转变为实用助手,功能包括比价下单、旅行规划、自动生成会议纪要,搅乱了AI to C市场格局 [4] 技术积累与模型性能 - 公司在AI基础设施领域投入了3800亿元,并持续迭代Qwen开源模型,强调底层功底的长期主义路线 [7] - Qwen3-Max性能超过GPT-4和ClaudeOpus,进入全球前三;开源的Qwen系列在2023年至今迭代三代,Qwen3性能比肩GPT5 [9] - Qwen系列全球下载量反超Llama,成为最火的开源模型;斯坦福大学报告指出中美顶级AI模型性能差距仅为0.3% [9][11] 行业路线与生态影响 - 千问代表的开源免费路线与ChatGPT的闭源付费路线形成正面较量,核心是AI应服务少数精英还是普惠所有人 [13] - 开源策略使千问被硅谷广泛采用,亚马逊用于训练人形机器人,苹果适配IOS系统,英伟达以Qwen为基座开发模型 [15] - 美国AI专家惊叹硅谷建立在Qwen之上,此举被认为可能削弱美国的技术领导力,并改写了全球AI行业的游戏规则 [17] 战略愿景与行业展望 - 公司的野心是打造AI时代的超级入口,让AI融入生活生产的方方面面,挑战过去十年由美国闭源模式主导的AI话语权 [17] - 千问的出现预示着AI未来应向普惠、开放的方向发展,随着更多企业加入开源阵营,行业将回归让每个人受益的本质 [19]
彭博社:美国无法通过针对阿里巴巴获胜
凤凰网· 2025-11-20 12:30
公司AI产品发布与市场影响 - 阿里巴巴正式宣布“千问”项目并上线基于Qwen3模型的“千问APP”公测版,标志着公司在消费市场的最大胆尝试[1] - 千问APP不仅限于对话式AI,具备强大的多模态处理能力,可在几秒钟内生成完整研究报告或制作PowerPoint演示文稿[1] - 阿里巴巴目前免费提供千问服务,此举可能对OpenAI构成潜在威胁,据称后者70%的年收入来自消费者使用ChatGPT[1] 公司AI技术实力与全球接受度 - 自2023年全面开源以来,Qwen系列模型的全球下载量已突破6亿次,超越了Meta的Llama等竞争对手[2] - Qwen系列模型已受到全球开发者广泛欢迎,越来越多的全球跨国公司选择基于Qwen构建系统[2] - 阿里的技术实力在硅谷引发了所谓的“Qwen恐慌”[2] 公司面临的国际审视与回应 - 阿里巴巴在展示AI雄心的同时,被一份据称来自华盛顿的备忘录指控为中国特定敏感领域提供技术支持,公司对此予以强烈否认,驳斥该指控“完全错误”[2] - 公司直言该指控是一场旨在破坏中美贸易缓和局势的“恶意行动”[2] - 负面报道一度导致公司股价波动,但市场情绪迅速回稳,花旗集团分析师建议投资者“逢低买入”[3] 国际环境分析与前景展望 - 彭博社评论指出,华盛顿试图通过限制手段遏制阿里的新一轮攻势可能会遭遇失败,美方相关部门目前对此保持缄默[2][3] - 历史表明,尽管存在所谓“安全担忧”,美国消费者和开发者实际上仍在广泛使用源自中国的技术产品[3] - 阿里巴巴的AI雄心虽然面临复杂的国际环境,但其技术崛起已是既定事实[3]