文章核心观点 - 2024年AI行业经历了从年初对技术突破的乐观预期,到年底技术进展放缓、竞争格局剧变的剧烈调整 [4][6] - 技术扩散速度超乎想象,OpenAI等领先者不再能甩开对手,模型“保鲜期”变短,头部模型差距缩小 [110][111][114] - 行业竞争从纯粹的技术模型竞赛,转向依赖价格战、应用矩阵和算力资源的综合实力比拼,大公司开始掌握主动权 [4][27][125] - 当OpenAI不再技惊全场,正是技术扩散的开始;当AI不再被广泛讨论,才是其真正融入和改造生活的标志 [131] 2024年AI行业关键发展脉络 年初的乐观与技术风向 - 2024年初,OpenAI发布视频生成模型Sora,重演了ChatGPT上线时的震撼,确立了多模态竞争的新风向 [3][7][9] - 中国市场上,阿里巴巴在年初连续投资月之暗面、MiniMax等大模型公司,总额近15亿美元,创造了“阿里轮”,显著改变了创业公司的身位 [3][13][19] - 信仰充沛的年初,行业普遍预测视频生成模型将在当年变得实用,并拓展了AGI是普通人每日使用产品的愿景 [9][12] 技术进展放缓与“撞墙”讨论 - 到了年底,大部分乐观期望落空,Sora延期10个月发布,实际效果不如年初演示,GPT-5至今仍未发布 [4] - OpenAI投入可能超过10亿美元训练GPT-5,但性能提升有限,引发大模型性能提升“撞墙”的讨论,互联网公开优质数据耗尽成为瓶颈 [38] - 模型暴露出基础逻辑推理的缺陷,例如难以判断“9.11和9.9谁大”这类简单问题 [40] 价格战与成本下降 - OpenAI发布GPT-4o开启了模型“性价比”优化方向,其API价格比GPT-4-Turbo便宜了一半 [21][22] - 中国公司DeepSeek打响国内价格战,DeepSeek-V2价格仅为GPT-4o的1/36,随后字节、阿里、百度、腾讯全部跟进降价 [25][26] - 大模型推理成本在过去三年降低了1000倍,训练成本也在下降,例如DeepSeek-V3参数达6710亿,仅用了2024张H800 [27] - 模型降价是应用繁荣的前提,类似历史上网费下降推动互联网普及 [27] 算力军备竞赛与芯片竞争 - 英伟达在AI芯片市场占据主导地位,其数据中心业务在2024年Q1的收入和净利润同比涨了4倍和6倍,市值一度超过微软达到3.34万亿美元 [27][28] - 苦于英伟达的高占有率(达97.7%),Google、亚马逊、Meta、苹果等大公司加速自研AI芯片,博通作为设计支持方市值也突破万亿美元 [29][30][31] - 中美算力竞争是另一主题,寒武纪市值从562亿元增长至2747亿元,涨幅超400%,反映了在中国芯片限制下的国产替代预期 [32][37] - 全球科技巨头持续加大算力投入,2024年前三季度,微软、Meta、Google、亚马逊总计在AI算力中心上投入1250亿美元 [54] - 中国公司采购积极,字节跳动和腾讯2024年分别订购了约23万枚H系列GPU,超过Meta、特斯拉等国际公司 [55] 资本聚焦与创业公司收缩 - 2024年全球大模型公司在一级市场筹集560亿美元,其中OpenAI、Anthropic、xAI三家融资额就占近一半 [46] - 美国公司拿走了近9成投资,中国公司中仅月之暗面在单轮融资中获得10亿美元及以上 [47] - 创业公司进入收缩状态,海外如Inflection、Character.ai,中国如零一万物,纷纷将团队出售或并入大公司 [124] - 行业共识转向:创业公司与大厂比拼烧钱训练超大模型难以成功,竞争更依赖资源,进入大厂更擅长的战场 [125] 应用探索与挑战 - 编程成为AI落地最成熟的场景之一,大模型提供了近乎完美的试验场,OpenAI的o3模型写代码能力已排进人类程序员Top 200 [67][68][69] - 普通人对AI的使用仍处于探索期,Slack调查显示超1/3员工已在工作中用AI,但近一半人不愿告诉领导,且产品同质化严重(如出现626个“AI科比”分身) [74][76][77] - AI技术被灰黑产业滥用,2024年用Deepfakes技术欺骗身份验证系统的尝试增长了3000%,韩国一起案件涉及近23万人群组,前10个月抓获474名相关犯罪嫌疑人 [5][81] 硬件尝试与机器人概念 - 2024年卖得好的AI硬件热销并非主要因为AI功能,如Ray-Ban Meta眼镜15个月卖出200万副,主要靠经典造型和渠道 [90][91] - 更“AI原生”的硬件处境艰难,如AI Pin总销量约1万台,且退货量超过新增销量,其母公司寻求出售 [94] - 人形机器人仍处概念和炒作阶段,特斯拉Optimus量产时间数次延后,但A股供应链个股被热炒,部分公司4个月涨幅超过英伟达全年 [96][100] 开源进展与中国模型崛起 - 中国开源大模型在2024年取得显著进展,在Chatbot Arena排名中,全球前6的开源模型里中国模型从1个增长到3.5个 [105] - DeepSeek-V3在多项评测中超越了Qwen 2.5-72B和Llama-3.1-405B等开源模型,其训练成本仅为557.6万美元,是效果相似美国模型的十分之一 [110] - 开源与闭源模型的差距在缩小,两者在Chatbot Arena上的评分分差从1月的99分缩小至12月的58分 [110] 技术扩散与竞争格局固化 - 模型技术扩散速度超乎想象,试图通过模型本身建立通用场景壁垒已几乎不可能 [123] - 年初最强的GPT-4模型,年底在Chatbot Arena的排名已滑落到第42位,新模型“保鲜期”变短 [110] - 头部模型差距显著缩小,第1名与第15名的分差从年初的143分缩窄至年底的75分 [114] - OpenAI高层在2024年几乎换血一遍,核心员工流向直接推动了其大模型技术扩散 [119]
AI 一年过山车:从狂想到放下幻想丨晚点回望 2024 ⑤