行业竞争格局与模型生命周期 - 顶级AI模型的领先地位极不稳固,排名第一的模型平均仅能保持约35天的领先地位,通常在5个月内跌出前五,7个月内跌出前十[4] - 行业洗牌剧烈,曾位列榜首的模型如OpenAI o1已跌至第56位,Claude 3 Opus更是跌至第139位[4] - 35天已成为顶级AI模型的“斩杀线”,反映了模型过气速度之快[6] 用户行为与留存挑战 - 用户选择AI模型的核心因素是性能至上,缺乏品牌忠诚度,哪款模型好用便投向哪款[9] - AI应用用户留存率极低,例如Sora 2发布5天内下载量破百万,但30天留存率仅1%,60天直接归零[9] - 大量用户是受“FOMO”心理驱动的“AI游客”,仅为尝鲜,体验后便离开[10] - 多数AI产品未能构建有效的用户留存闭环,这与传统SaaS产品“因X而来,因Y而留”的增长逻辑形成鲜明对比[10] 产品生态与竞争策略 - 用户使用逻辑转向多模型协作,利用不同模型的优势,例如用Claude写长文本、Gemini写代码,而非依赖单一入口[14] - 科技巨头凭借成熟生态闭环获得优势,例如Google将Gemini无缝嵌入YouTube、Workspace、Chrome等核心流量入口,轻松获取海量用户与企业客户[15] - 以OpenAI为代表的初创厂商采取防御策略,包括绑定生态合作、推出AI Office等新产品,并押注“个性化记忆”与情商功能,试图抬高用户迁移门槛[17][19] 行业评测与信任危机 - 行业权威评测榜单LMArena存在机制问题,52%的对决判定存在错误,大众投票更偏爱回答冗长、排版华丽的“显眼包”模型[22] - 刷榜作弊成为行业潜规则,例如Meta曾通过发布特供测试版使Llama 4霸榜,正式版发布后排名从第2暴跌至第32名[20] - 榜单公信力受损及模型“降智”更新,加速了用户对“榜一大哥”的祛魅[22] 开源与低价模型的冲击 - 开源与低价模型极大推动了AI普及,例如DeepSeek R1在白俄罗斯占据56%的市场份额,在古巴占49%,在俄罗斯占43%[24] - 免费或低价模型已覆盖大多数日常需求,促使用户形成“可以随时换,也应该随时换”的心态[26] - 开发者基于Qwen、DeepSeek等开源模型进行轻量化微调,产生了一批在特定场景表现远超闭源巨头的垂直模型,进一步瓦解了头部模型的话语权[26] - 对于既不够强也不够便宜的中间地带AI玩家,在“35天生死线”面前几乎没有回旋空间[27]
35 天,成了 AI 模型的斩杀线
36氪·2026-01-15 07:02