Workflow
阿里开源首个“混合推理模型”:集成“快思考”、“慢思考”能力

文章核心观点 阿里开源具备“快思考”与“慢思考”能力的混合推理大模型Qwen3,该模型部署成本低且采用“混合专家(MoE)架构”节省算力,国内科技公司纷纷推出低成本AI模型服务,阿里围绕Qwen系列构建AI战略版图,国际科技巨头也在加速模型优化布局 [1][3][4] 公司动态 - 4月29日凌晨阿里巴巴宣布开源新一代通义千问模型Qwen3,集成“快思考”与“慢思考”,部署成本较Deepseek等大模型显著降低 [1] - 百度发布新一代文心一言模型4.5和X1,多模态理解、文本和逻辑推理能力显著提升 [3] - 火山引擎正式发布豆包1.5深度思考模型,实现更低延迟 [3] - 科大讯飞全新升级深度推理大模型讯飞星火X1 [3] - 29日OpenAI发布ChatGPT多项功能更新,支持和优化购物功能,朝着超级消费级应用方向发展 [4] 模型特点 - Qwen3系列采用“混合专家(MoE)架构”,能模仿人类思考,节省算力,满足多样需求,其他开发者也采用该架构 [3] 行业趋势 - 近两个多月国内科技公司迅速推出低成本AI模型服务,加注国产模型升级浪潮 [3] 公司战略 - 今年2月阿里巴巴集团CEO吴泳铭称公司“首要目标”转向实现通用人工智能,未来三年投入超3800亿元建设云和AI硬件基础设施 [4] 开源成果 - 阿里云称阿里通义已开源200余个模型,全球下载量超3亿次,Qwen衍生模型数超10万个,超越美国Llama成全球第一开源模型 [4] 模型测试 - 展示了千问3旗舰版和32B版本在部分基准测试中的得分 [2]