昨夜3件事，加强中国AI科技叙事？

阿里通义开源RL新模型 - 阿里通义开源了QwQ-32B RL新模型性能比肩满血DeepSeek R1 在AIME24数学测试和LiveCodeBench代码评估中表现优异 [1] - 该模型采用创新训练方法通过校验生成答案正确性提供反馈相比传统奖励模型训练时间大幅缩短 [2] - 公司预告将在Qwen Chat平台发布QwQ-Max-Preview模型并承诺持续开源更多RL模型 [3][4][5] 大模型本地化部署进展 - 高性能大模型本地部署门槛显著降低仅需NVIDIA 4090显卡或24G内存以上Mac mini即可实现成本控制在4位数人民币 [6] - 苹果Mac Studio搭载M3 Ultra芯片(32核CPU/80核GPU)可实现满血DeepSeek-R1本地化运行速度达20token/s 价格从70万降至7万人民币 [8][9] - 512GB内存配置的Mac Studio可支持更强大本地AI运算能力 [11][12] AI行业发展趋势 - RL技术突破将显著提升智能硬件性能推动应用需求爆发利好Agent技术发展 [7] - Manus AI等Agent产品引发市场关注提升应用端对AI能力的期待将带动算力需求增长 [13][14] - 中国科技公司在RL大规模强化学习领域取得突破行业估值逻辑面临重塑 [14]