从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
硬AI·2025-09-01 01:14
行业发展趋势 - AI行业从单纯追求模型能力转向追求计算效率 混合推理成为行业共识 [2][3][5] - 随着推理模式复杂化 完成任务所需token数量暴涨 导致实际成本不降反升 [2][8] - 顶尖模型厂商包括OpenAI DeepSeek Anthropic Google及国内阿里 快手 字节 智谱等均在探索混合推理方案 [13][14] 成本压力分析 - 虽然单个token价格下降 但复杂任务消耗token数量呈指数级增长 代码编写或法律分析需消耗数十万至百万token [8][9] - 最强模型价格保持稳定 99%需求转向SOTA模型 导致应用层公司利润率下降 Notion利润率下降约10个百分点 [7][10] - AI模型竞赛演变为成本竞赛 Theo Browne表示争夺最智能模型已成为争夺最昂贵模型的竞赛 [10] 技术解决方案 - 美团开源龙猫模型采用零计算专家机制 智能识别非关键内容直接返回 实现显著算力节省 [4] - OpenAI GPT-5采用路由器机制 根据问题复杂度自动选择模型 思考模式比前代少50-80%输出token [13] - DeepSeek V3.1推出单模型双模式架构 思考模式消耗减少25-50% token 保持相同答案质量 [13][14] 创新架构特点 - 混合推理模式让AI系统根据问题复杂度自动配置计算资源 避免简单任务浪费算力 [5][12] - 系统通过用户行为偏好反馈和正确率等真实信号持续训练路由机制 实现自我改进 [13] - 下一代混合推理将实现自我调节 让AI自主评估任务难度并以最低计算代价启动深度思考 [14]