Workflow
全球最强开源AI大模型诞生:中国研发,成本只有Deepseek的30%
新浪财经·2025-04-30 19:28

大模型技术路线分化 - 全球AI大模型发展呈现两种技术路线:OpenAI代表的"大力出奇迹"路线依赖高强度GPU堆砌算力 [1][3] - Deepseek代表的"四两拨千斤"路线通过算法优化实现低算力高性能 仅需少量显卡即可超越同行性能 [3] - 开源模式成为行业趋势 因开源模型更易获得开发者采用 [1] 阿里千问3技术突破 - 千问3(Qwen3)成为全球首个混合推理模型 集成"快思考"与"慢思考"双模式 可根据任务复杂度动态调整 [5] - 在ArenaHard(95 6)、AIME'24(85 7)等8项基准测试中超越OpenAI-o1、Deepseek-R1等主流模型 [6] - 参数规模仅为Deepseek-R1的三分之一 显存占用减少三分之二 部署成本降低65%-75% [6][7] 硬件部署革新 - 仅需4张H20显卡即可部署全功能千问3 显存需求为同类产品的三分之一 [7] - 部署成本降至满血版Deepseek-R1的25%-35% 大幅降低商业化门槛 [7] - 混合推理架构使单张H20显卡可支持2000token/s的生成速度 [7] 国产GPU产业机遇 - Deepseek已验证国产GPU可替代英伟达高端芯片部署高性能模型 [9] - 千问3的低算力需求将进一步加速国产GPU替代进程 [9] - 行业算力泡沫被打破 中低端国产GPU迎来市场扩容机会 [9]