AI 一年过山车：从狂想到放下幻想丨晚点回望 2024 ⑤

文章核心观点 - 2024年AI行业经历了从年初对技术突破的乐观预期，到年底技术进展放缓、竞争格局剧变的剧烈调整 [4][6] - 技术扩散速度超乎想象，OpenAI等领先者不再能甩开对手，模型“保鲜期”变短，头部模型差距缩小 [110][111][114] - 行业竞争从纯粹的技术模型竞赛，转向依赖价格战、应用矩阵和算力资源的综合实力比拼，大公司开始掌握主动权 [4][27][125] - 当OpenAI不再技惊全场，正是技术扩散的开始；当AI不再被广泛讨论，才是其真正融入和改造生活的标志 [131] 2024年AI行业关键发展脉络年初的乐观与技术风向 - 2024年初，OpenAI发布视频生成模型Sora，重演了ChatGPT上线时的震撼，确立了多模态竞争的新风向 [3][7][9] - 中国市场上，阿里巴巴在年初连续投资月之暗面、MiniMax等大模型公司，总额近15亿美元，创造了“阿里轮”，显著改变了创业公司的身位 [3][13][19] - 信仰充沛的年初，行业普遍预测视频生成模型将在当年变得实用，并拓展了AGI是普通人每日使用产品的愿景 [9][12] 技术进展放缓与“撞墙”讨论 - 到了年底，大部分乐观期望落空，Sora延期10个月发布，实际效果不如年初演示，GPT-5至今仍未发布 [4] - OpenAI投入可能超过10亿美元训练GPT-5，但性能提升有限，引发大模型性能提升“撞墙”的讨论，互联网公开优质数据耗尽成为瓶颈 [38] - 模型暴露出基础逻辑推理的缺陷，例如难以判断“9.11和9.9谁大”这类简单问题 [40] 价格战与成本下降 - OpenAI发布GPT-4o开启了模型“性价比”优化方向，其API价格比GPT-4-Turbo便宜了一半 [21][22] - 中国公司DeepSeek打响国内价格战，DeepSeek-V2价格仅为GPT-4o的1/36，随后字节、阿里、百度、腾讯全部跟进降价 [25][26] - 大模型推理成本在过去三年降低了1000倍，训练成本也在下降，例如DeepSeek-V3参数达6710亿，仅用了2024张H800 [27] - 模型降价是应用繁荣的前提，类似历史上网费下降推动互联网普及 [27] 算力军备竞赛与芯片竞争 - 英伟达在AI芯片市场占据主导地位，其数据中心业务在2024年Q1的收入和净利润同比涨了4倍和6倍，市值一度超过微软达到3.34万亿美元 [27][28] - 苦于英伟达的高占有率（达97.7%），Google、亚马逊、Meta、苹果等大公司加速自研AI芯片，博通作为设计支持方市值也突破万亿美元 [29][30][31] - 中美算力竞争是另一主题，寒武纪市值从562亿元增长至2747亿元，涨幅超400%，反映了在中国芯片限制下的国产替代预期 [32][37] - 全球科技巨头持续加大算力投入，2024年前三季度，微软、Meta、Google、亚马逊总计在AI算力中心上投入1250亿美元 [54] - 中国公司采购积极，字节跳动和腾讯2024年分别订购了约23万枚H系列GPU，超过Meta、特斯拉等国际公司 [55] 资本聚焦与创业公司收缩 - 2024年全球大模型公司在一级市场筹集560亿美元，其中OpenAI、Anthropic、xAI三家融资额就占近一半 [46] - 美国公司拿走了近9成投资，中国公司中仅月之暗面在单轮融资中获得10亿美元及以上 [47] - 创业公司进入收缩状态，海外如Inflection、Character.ai，中国如零一万物，纷纷将团队出售或并入大公司 [124] - 行业共识转向：创业公司与大厂比拼烧钱训练超大模型难以成功，竞争更依赖资源，进入大厂更擅长的战场 [125] 应用探索与挑战 - 编程成为AI落地最成熟的场景之一，大模型提供了近乎完美的试验场，OpenAI的o3模型写代码能力已排进人类程序员Top 200 [67][68][69] - 普通人对AI的使用仍处于探索期，Slack调查显示超1/3员工已在工作中用AI，但近一半人不愿告诉领导，且产品同质化严重（如出现626个“AI科比”分身） [74][76][77] - AI技术被灰黑产业滥用，2024年用Deepfakes技术欺骗身份验证系统的尝试增长了3000%，韩国一起案件涉及近23万人群组，前10个月抓获474名相关犯罪嫌疑人 [5][81] 硬件尝试与机器人概念 - 2024年卖得好的AI硬件热销并非主要因为AI功能，如Ray-Ban Meta眼镜15个月卖出200万副，主要靠经典造型和渠道 [90][91] - 更“AI原生”的硬件处境艰难，如AI Pin总销量约1万台，且退货量超过新增销量，其母公司寻求出售 [94] - 人形机器人仍处概念和炒作阶段，特斯拉Optimus量产时间数次延后，但A股供应链个股被热炒，部分公司4个月涨幅超过英伟达全年 [96][100] 开源进展与中国模型崛起 - 中国开源大模型在2024年取得显著进展，在Chatbot Arena排名中，全球前6的开源模型里中国模型从1个增长到3.5个 [105] - DeepSeek-V3在多项评测中超越了Qwen 2.5-72B和Llama-3.1-405B等开源模型，其训练成本仅为557.6万美元，是效果相似美国模型的十分之一 [110] - 开源与闭源模型的差距在缩小，两者在Chatbot Arena上的评分分差从1月的99分缩小至12月的58分 [110] 技术扩散与竞争格局固化 - 模型技术扩散速度超乎想象，试图通过模型本身建立通用场景壁垒已几乎不可能 [123] - 年初最强的GPT-4模型，年底在Chatbot Arena的排名已滑落到第42位，新模型“保鲜期”变短 [110] - 头部模型差距显著缩小，第1名与第15名的分差从年初的143分缩窄至年底的75分 [114] - OpenAI高层在2024年几乎换血一遍，核心员工流向直接推动了其大模型技术扩散 [119]