Workflow
通义千问 Qwen3 发布,对话阿里周靖人

文章核心观点 - 阿里云CTO周靖人认为大模型发展已进入早期阶段中期,需在多模态、工具使用、Agent支持和持续学习等多方向布局[5][14] - 通义千问Qwen3作为全球首个开源混合推理模型,通过融合推理和非推理模式实现性能与成本平衡,代表技术新趋势[6][15] - 阿里开源战略成效显著:Qwen系列下载量达3亿次,衍生模型超10万个,超越Meta Llama成为全球最活跃开源模型[7][8][18] - 公司坚持技术规律导向的研发节奏,强调长期创新而非短期竞争,认为AGI发展需要云计算体系与大模型的深度协同[12][13][21] 技术突破 - Qwen3-235B-A22B以2350亿总参数在多项基准测试超越6710亿参数的DeepSeek-R1,小尺寸MoE模型Qwen3-30B-A3B激活参数仅30亿但性能更优[7] - 混合推理模型创新性实现"思考预算"设置,开发者可自定义深度思考的token消耗量以平衡成本效益[15] - 模型支持vLLM/SGLang推理框架和MCP协议,配合Qwen-Agent框架可快速开发智能体[18] - 多模态技术积累始于2019年,2021年已发布万亿参数MoE多模态模型M6,当前视频生成模型万相2.1与Sora互有胜负[17][26] 开源生态 - 开源决策基于两大判断:模型作为核心生产元素需通过开源普及,开源已成为大模型重要创新驱动力[18] - 魔搭社区累计开源超200个模型,Qwen系列占Hugging Face下载量30%以上,衍生模型数量持续领先Llama系列[7][8][18] - 版本策略覆盖全场景需求:0.6B-32B稠密模型满足端侧到企业部署,MoE模型提供高性价比选择[18] - 开发者服务导向体现在消费级显卡适配、及时支持主流框架等举措,形成技术生态正循环[18] 研发体系 - 采用pipeline式研发管理,预研方向通过小规模实验验证后阶梯式投入,保持多技术方向并行探索[24] - 实验平台支持快速迭代,避免直接超大规模投入,强调科学评估和数据驱动的决策机制[25] - 人才策略结合职级普调与使命驱动,通过系统性工程积累形成代际技术优势[25][26] - 研发投入聚焦三大方向:类人思考能力进化、多模态融合、云模型协同优化带来的效率突破[13][20] 行业竞争 - 认为当前模型竞争本质是系统工程较量,需云计算、数据平台和工程能力的全面配合[13][21] - 指出纯Infra优化无法替代完整云服务,强调阿里云在SLA保障、多模型兼容等方面的企业级优势[22] - 预判行业将面临供电瓶颈,提前布局智算中心选址的energy-aware优化[22][23] - 3800亿新基建投入应对AI应用指数增长,目前MaaS服务已现供不应求态势[22]