阿里,重磅发布!股价大涨
证券时报·2025-03-06 10:08
开源浪潮与AI模型进展 - 阿里通义千问大模型团队推出320亿参数的QwQ-32B推理模型,性能可与6710亿参数的DeepSeek-R1媲美,后者采用MoE架构和MLA方法,每次推理仅激活370亿参数(占总量的5.5%)[1] - QwQ-32B在数学推理、编程能力和通用能力测试中表现与DeepSeek-R1相当,远胜于OpenAI的o1-mini及相同尺寸的R1蒸馏模型[1] - 阿里通过大规模强化学习方法实现小参数规模下的卓越性能,针对数学和编程任务进行两轮强化学习训练,通过校验答案正确性和代码执行评估提供反馈[2] 模型开源与社区反响 - QwQ-32B大幅降低部署成本,可在消费级硬件上本地部署,采用Apache2.0协议全球开源,支持免费下载及商用,也可通过阿里云百炼平台调用API服务[3] - 阿里近期开源动作频繁,2月底开源视频生成模型万相2.1,包含14B和1.3B两个参数规格,支持文生视频和图生视频任务,开源一周内登顶Hugging Face模型热榜和空间榜[3] - 阿里通义团队2023年至今已开源200多款模型,覆盖从0.5B到110B参数规模,包含千问Qwen和万相Wan两大基模系列,实现全模态、全尺寸大模型开源[4] 资本市场表现 - 阿里巴巴美股隔夜大涨超8%,港股大幅高开一度涨超7%,截至发稿涨6.47%,今年以来累计涨幅近70%[5] - 阿里在AI领域持续发力,践行AI驱动战略,后续投入有望加速成果迭代,带动相关产业链发展并推动算力需求爆发[4]