Workflow
规模叙事
icon
搜索文档
“万亿参数”VS“半价长文”:国产大模型的“规模幻象”与“算力革命”之战
格隆汇· 2025-10-24 20:06
行业核心趋势 - 2025年人工智能赛道从“百模大战”的单一竞争格局,分化为“极限性能”与“极致普惠”两条截然相反又彼此纠缠的核心叙事 [2][3] - 行业竞争从单纯比拼参数规模的1.0时代,进入比拼算法与工程优化的“神经效率”的2.0时代 [16] 极限性能路线(规模派) - 阿里通义Qwen3-Max在多个权威基准测试中跻身全球前三,一度超越GPT-5-Chat特定版本,实现国产大模型与全球顶级玩家的“同框竞技” [3] - Qwen3-Max是参数量达万亿级别的模型,在SWE-Bench Verified上获得69.6分的世界级成绩,在AIME等高难度推理任务中取得满分或接近满分表现 [9] - 该路线是只有巨头才能参与的“3A游戏”,通过极致资源投入构建性能壁垒,但面临高昂成本:其API输出价格高达43.2元/百万Tokens,主要服务于高价值核心场景 [9][10] 极致普惠路线(效率派) - DeepSeek发布DeepSeek-V3.2-Exp模型,在性能与前代旗舰相当的前提下,API价格“腰斩”超过50%,输出端价格从12元/百万Tokens骤降至3元/百万Tokens [3][15] - 降价底气源于底层技术突破DSA(DeepSeek Sparse Attention),通过智能筛选机制将注意力计算复杂度从O(n²)优化,极大减少处理Token数量并削减推理成本 [15] - 此路线通过算法和架构的极致创新,在不牺牲模型质量的前提下压缩成本,是对资源薄弱创业公司的“另辟蹊径” [12][16] 市场竞争格局演变 - 效率派的“技术破价”推动AI应用从头部企业垄断转向长尾场景渗透,激发海量新需求,符合“杰文斯悖论” [17] - 国内AI巨头(如阿里、百度、腾讯、字节)已陷入“API价格战”,字节豆包“白菜价”迫使阿里云Qwen-Long降价97%,百度将文心两大主力模型免费,核心目的是抢占AI云市场入口 [18] - 巨头陷入两难困境:一方面必须跟进降价以保住市场份额和云业务增长,另一方面旗舰模型高昂的推理成本使得降价如同“割肉” [18][19] 未来发展趋势 - “规模派”和“效率派”必然走向融合,巨头需将稀疏算法等效率技术作为旗舰模型“标配”,而效率派需利用市场和数据反哺更高性能模型的研发 [22] - 市场竞争焦点从“模型跑分”转向“应用价值”,市场被清晰划分为追求极限性能的高价值场景和拥抱极致效率的海量长尾应用 [22] - 行业竞争的核心终极问题转变为:所提供的智能究竟为客户创造了多少可衡量的价值 [22]