Workflow
大模型场景应用
icon
搜索文档
大模型竞争的下半场,为何场景为王?
钛媒体APP· 2025-07-11 12:05
图片系AI生成 场景的深度与广度正成为大模型价值的真正标尺。 2025年4月发布的斯坦福AI指数报告,揭示了一些有趣的事实。2024年,TOP1和TOP10的模型的差距为 12%,但如今,它们的差距已经锐减至5%。 这说明头部模型的效果没有本质差别,大模型的进化已经到达瓶颈期,与此同时,顶级模型能力也不再 被小部分人垄断。随之变化的还有成本和参数等层面。与两年前相比,38亿参数的小模型就能实现之前 5400亿参数模型的效果。 在大规模多任务语言理解(MMLU)基准测试中达到GPT-3.5水平(MMLU准确率64.8%)的AI模型调 用成本,已从2022年11月的20美元/每百万token,骤降至2024年10月的0.07美元/每百万token(谷歌 DeepMind的Gemini-1.5-Flash-8B模型),18个月内成本下降280倍。 当模型能力不再是壁垒,场景穿透力成为新的竞争维度。单纯刷榜失去意义,不论大厂还是初创,都在 寻找垂直场景深度、逻辑可靠性与终端适配性,本质上是在某一个具体的场景中,验证"效率-性能-安 全"的三角平衡。 而就钛媒体接触和收集到的场景来看,过去三年,也呈现出明显从「技术试水 ...