Workflow
杰文斯悖论
icon
搜索文档
当硅谷用AI“洗白”裁员决策,“岗位消失论”是一场幻觉吗?
第一财经· 2025-12-29 23:56
AI与就业市场现状 - 2025年美国约有5.5万次裁员被归因于人工智能(AI),科技巨头如亚马逊和赛富时(Salesforce)裁减了上万个岗位,并将AI列为裁员的主要因素之一 [3] - 麻省理工学院(MIT)研究显示,AI已经能够胜任美国劳动力市场约11.7%的工作,并有望在金融、医疗及其他专业服务领域节省高达1.2万亿美元的工资支出 [3] - 特斯拉公司创始人马斯克预测未来人类的工作并不是必须的,工作会像“运动或游戏一样” [3] AI驱动裁员的复杂性 - 有观点认为,当前许多裁员“实质上是将传统重组包装成AI驱动的创新”,企业需要区分真正的AI转型与以自动化为名、掩盖运营低效的行为 [6] - IBM首席执行官克里希纳公开承认,近期的裁员更像是一场“自然修正”,主要是为了解决过度招聘的问题,而非完全由AI导致 [6] - 克里希纳称,AI确实会带来一定程度的职位取代,可能影响美国就业的10%左右,但他也强调,AI不会全面取代人类 [7] AI对岗位结构的影响 - 根据求职网站Indeed招聘实验室的分析,截至2025年初,高级和管理级科技职位的招聘数量较疫情前水平下降19%,普通及初级科技职位的降幅则高达34% [10] - 2022年第二季度至2025年第二季度间,要求至少5年工作经验的科技职位占比从37%上升至42%,而需要2-4年经验的岗位比例则相应减少 [10] - 亚马逊云服务(AWS)首席执行官加尔曼表示,用新技术取代初级工程师和员工是糟糕的商业决策,如果不建设人才梯队,企业将错失许多最优秀的创新思路 [10] AI应用的现实与调整 - 瑞典金融科技公司Klarna的案例显示,其AI客服助手曾处理公司三分之二的客服对话,相当于完成了700名全职客服的工作量,但到2025年,公司开始重新招聘人类客服,因过度依赖AI导致服务质量下降、客户不满增加 [7] - 乔杜里博士指出,当首席执行官们宣称要用AI淘汰工作时,他们往往很快不得不收回这些言论,因为AI实际上无法完全取代人类,即使在呼叫中心这样的领域也是如此 [7] - 乔杜里博士认为,AI并不会取代最资深和最有经验的人,被自动化淘汰的主要是涉及知识合成和低级信息搜集的入门级岗位 [9] 技术进步与工作量的“杰文斯悖论” - 根据“杰文斯悖论”理论,当技术进步提高了某种资源的利用效率,导致其成本降低,反而可能引发对该资源需求的显著增加,最终使其消耗总量不减反增 [10] - 乔杜里博士指出,硅谷正在拥抱一种更长工作时间的文化,技术进步并未减少工作量,反而带来了更多工作,工作是一个不断膨胀、无限扩张的生态系统 [11] - 乔杜里博士解释,最底层的工作被自动化淘汰,但随着信息流动加快,新工作也在不断涌现,AI帮助我们更快地实现目标,同时也催生了新的任务与岗位 [4]
当硅谷用AI“洗白”裁员决策,“岗位消失论”是一场幻觉吗?
第一财经· 2025-12-28 17:53
文章核心观点 - 当前科技行业裁员与AI的关系复杂,部分裁员被指是“AI洗白”,即企业将传统重组包装为AI驱动的创新以节省开支或掩盖运营低效 [1][2] - AI对就业市场的影响是双面的:一方面自动化替代了部分初级和入门级岗位,另一方面也催生了新的任务与岗位,长期来看可能增加总工作量 [1][2][6] - AI目前无法完全取代人类工作,过度依赖AI可能导致服务质量下降,企业仍需人类员工,尤其是在资深和管理岗位 [3][4] AI与当前裁员的关系 - 2025年美国约有5.5万次裁员被归因于人工智能(AI),科技巨头如亚马逊和赛富时(Salesforce)裁减了上万个岗位并将AI列为主要因素之一 [1] - 分析指出,部分裁员实质上是将传统重组包装成AI驱动的创新,企业需要区分真正的AI转型与以自动化为名、掩盖运营低效的行为 [2] - IBM首席执行官认为近期裁员更像是一场“自然修正”,旨在解决过度招聘问题,而非完全由AI导致 [3] AI对工作岗位的替代效应与局限性 - 麻省理工学院(MIT)研究显示,AI已经能够胜任美国劳动力市场约11.7%的工作,并有望在金融、医疗及其他专业服务领域节省高达1.2万亿美元的工资支出 [1] - AI显示出对初级开发者的替代效应,且这类案例正在增多,但不会取代最资深和最有经验的人 [2][4] - 瑞典金融科技公司Klarna的案例显示,过度依赖AI客服导致服务质量下降和客户不满增加,公司随后重新招聘人类客服 [3] AI对招聘市场与岗位结构的影响 - 截至2025年初,高级和管理级科技职位的招聘数量较疫情前水平下降19%,普通及初级科技职位的降幅则高达34% [5] - 2022年第二季度至2025年第二季度间,要求至少5年工作经验的科技职位占比从37%上升至42%,而需要2-4年经验的岗位比例相应减少 [5] - 亚马逊云服务(AWS)首席执行官批评用新技术取代初级员工是糟糕的商业决策,将错失创新思路并终将自食其果 [5] 长期视角:AI与工作量的“杰文斯悖论” - 技术进步(如AI)提高了效率,但根据“杰文斯悖论”,可能引发对资源(此处指工作)需求的显著增加,最终使工作量不减反增 [6] - 硅谷的工作文化显示工作量在增加而非减少,表明工作是一个不断膨胀、无限扩张的生态系统,而非有限的泡沫 [6] - 历史经验表明,新技术的开发从未真正减少工作量,反而往往带来更多工作 [6]
推理成本打到1元/每百万token,浪潮信息撬动Agent规模化的“最后一公里”
量子位· 2025-12-26 12:24
行业核心趋势 - 全球AI产业已从模型性能竞赛进入智能体规模化落地的“生死竞速”阶段,“降本”成为决定AI企业能否盈利、行业能否突破的核心命脉 [1] - 当前AI时代处于临界点,token成本下降是推动应用生态爆发的关键,类似互联网“提速降费”的历史进程 [7] - 技术进步促使token单价下滑,但单任务对token的需求呈指数级增长,若成本下降速度跟不上消耗增长,将面临更高费用投入,经济学中的“杰文斯悖论”正在token经济中重演 [8] - 要让AI真正成为“水电煤”般的基础资源并进入规模化普惠阶段,token成本必须在现有基础上实现数量级的跨越,成本能力将从“核心竞争力”升级为“生存入场券” [4][5][11] 成本挑战与瓶颈 - 现阶段token成本80%以上来自算力支出,阻碍成本下降的核心矛盾在于推理负载与训练负载不同,沿用旧架构导致“高配低效” [12] - 核心瓶颈之一是算力利用率(MFU)严重倒挂:训练阶段MFU可达50%以上,而推理阶段由于自回归解码特性,实际MFU往往仅为5%-10%,造成巨大算力闲置 [14] - 核心瓶颈之二是“存储墙”问题:随着上下文长度增加,KV Cache呈指数级增长,占用大量显存并导致高功耗,存算分离成为阻碍成本下降的重要瓶颈 [15][16] - 核心瓶颈之三是网络通信代价高昂:当模型规模突破单机承载能力时,跨节点通信可能占据总推理时间的30%以上,推高了总拥有成本(TCO) [17] 市场需求与规模 - 字节跳动旗下豆包大模型截至今年12月日均token使用量突破50万亿,较去年同期增长超过10倍,相比2024年5月刚推出时增长达417倍 [13] - 谷歌在10月披露其各平台每月处理的token用量已达1300万亿(相当于日均43.3万亿),而一年前月均仅为9.7万亿 [13] - 当使用量达到“百万亿token/月”量级时,每百万token成本仅下降1美元,就可能带来每月1亿美元的成本差异 [10] - 当前主流大模型的token成本依然高昂,以输出百万token为例,Claude、Grok等模型价格普遍在10-15美元,国内大模型也多在10元以上,高昂成本让大规模商业化应用面临严峻ROI挑战 [19][20] 解决方案与技术创新 - 降低token成本的核心不是“把一台机器做得更全”,而是围绕目标重构系统,将推理流程拆细,支持P/D分离、A/F分离、KV并行、细粒度专家拆分等计算策略,让不同计算模块在不同卡上按需配置并发,提升每张卡的负载和产出 [18] - 浪潮信息推出元脑HC1000超扩展AI服务器,基于全新设计的全对称DirectCom极速架构,采用无损超扩展设计,可高效聚合海量本土AI芯片,支持极大推理吞吐量,将推理成本首次击穿至1元/每百万token [2][23] - 元脑HC1000的DirectCom极速架构每计算模组配置16颗AIPU,采用直达通信设计,解决传统架构的协议转换和带宽争抢问题,实现超低延迟,计算通信1:1均衡配比,实现全局无阻塞通信 [25] - 该架构支持超大规模无损扩展,通过算网深度协同、全域无损技术实现推理性能1.75倍提升,通过对大模型计算流程细分和模型结构解耦,实现计算负载灵活按需配比,单卡MFU最高可提升5.7倍 [27] - 通过自适应路由和智能拥塞控制算法,提供数据包级动态负载均衡,将KV Cache传输对Prefill、Decode计算实例影响降低5-10倍 [29] 未来发展方向 - 当前1元/每百万token的成本突破仅是阶段性胜利,面对未来token消耗量指数级增长、复杂任务token需求激增数十倍的趋势,现有成本水平仍难支撑AI的普惠落地 [4] - 若要实现单token成本的持续、数量级下降,需要推动计算架构的根本性革新,要求整个AI产业的产品技术创新从当前的规模导向转为效率导向 [29] - 未来需从根本上重新思考和设计AI计算系统,发展AI专用计算架构,探索开发大模型芯片,推动算法硬件化的专用计算架构创新,实现软硬件深度优化 [29]
浪潮信息刘军:AI产业不降本难盈利,1元钱/每百万Token的成本还远远不够!
环球网资讯· 2025-12-25 14:30
行业背景与核心挑战 - 全球AI产业已从模型性能竞赛进入智能体规模化落地的关键阶段,“降本”成为决定企业盈利与行业突破的核心命脉[1] - 当前AI推理成本依然高昂,主流大模型如Claude、Grok输出百万token价格在10-15美元,国内模型也多在10元以上,高昂成本使大规模商业化面临严峻ROI挑战[10] - 未来token消耗量将呈指数级增长,复杂任务需求可能激增数十倍,若成本下降速度跟不上消耗增长,企业将面临更高费用投入,经济学中的“杰文斯悖论”正在token经济中重演[1][3] - 来自行业的数据佐证了token消耗的激增趋势:字节跳动豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍,较2024年5月推出时增长达417倍;谷歌各平台每月处理token用量达1300万亿(日均43.3万亿),而一年前月均仅为9.7万亿[4] - 当使用量达到“百万亿token/月”量级时,每百万token成本仅下降1美元,就可能带来每月1亿美元的成本差异,token成本直接决定了智能体的盈利能力[7] 成本高企的结构性瓶颈 - 现阶段token成本80%以上来自算力支出,阻碍成本下降的核心矛盾在于推理负载与训练负载不同,沿用旧架构导致“高配低效”[7] - 瓶颈一:算力利用率严重倒挂,训练阶段MFU可达50%以上,而推理阶段因自回归解码特性,GPU大部分时间在等待数据搬运,实际MFU仅为5%-10%,造成巨大算力闲置[8] - 瓶颈二:“存储墙”瓶颈在推理场景下被放大,随着上下文长度增加,KV Cache呈指数级增长,占用大量显存并导致高功耗,存算分离及对昂贵HBM的依赖成为成本下降障碍[8] - 瓶颈三:网络通信与横向扩展代价高昂,当模型规模突破单机承载能力时,跨节点通信可能占据总推理时间的30%以上,企业被迫堆砌更多资源以维持响应速度,推高总拥有成本[8] 解决方案与架构革新方向 - 降低token成本的核心不是“把一台机器做得更全”,而是围绕目标重构系统,将推理流程拆细,支持P/D分离、A/F分离、KV并行、细粒度专家拆分等策略,让不同计算模块在不同卡上按需配置并发,打满每张卡负载,降低“卡时成本”,提高“卡时产出”[9] - 需要推动计算架构的根本性革新,将AI产业的产品技术创新从规模导向转为效率导向,从根本上重新思考和设计AI计算系统,发展AI专用计算架构,探索开发大模型芯片,推动算法硬件化的专用计算架构创新,实现软硬件深度优化[16] 浪潮信息元脑HC1000产品突破 - 浪潮信息推出元脑HC1000超扩展AI服务器,基于全新设计的全对称DirectCom极速架构,采用无损超扩展设计,可高效聚合海量本土AI芯片,支持极大推理吞吐量,将推理成本首次击穿至1元/每百万token[1][12] - 该产品创新设计DirectCom极速架构,每计算模组配置16颗AIPU,采用直达通信设计,解决传统架构的协议转换和带宽争抢问题,实现超低延迟;计算通信1:1均衡配比,实现全局无阻塞通信;全对称系统拓扑支持灵活的PD分离、AF分离方案,按需配置计算实例,最大化资源利用率[14] - 产品支持超大规模无损扩展,通过算网深度协同、全域无损技术实现推理性能1.75倍提升,并通过计算流程细分和模型结构解耦实现计算负载灵活按需配比,单卡MFU最高可提升5.7倍[16] - 产品通过自适应路由和智能拥塞控制算法,提供数据包级动态负载均衡,实现KV Cache传输和All to All通信流量的智能调度,将KV Cache传输对Prefill、Decode计算实例影响降低5-10倍[16] 未来展望与行业意义 - 当前1元/每百万token的成本突破仅是阶段性胜利,面对未来token消耗的指数级增长,现有成本水平仍难支撑AI的普惠落地[1] - 要让AI真正成为如同“水电煤”般的基础资源并进入规模化普惠阶段,token成本必须在现有基础上实现数量级的跨越[1][7] - 成本能力将从“核心竞争力”进一步升级为“生存入场券”,直接决定AI企业在智能体时代的生死存亡[1] - 此次成本突破有望打通智能体产业化落地“最后一公里”的成本障碍,并将重塑AI产业竞争的底层逻辑[1]
施罗德基金资产配置观点
21世纪经济报道· 2025-12-16 17:08
全球宏观经济与资产配置展望 - 预计2025-2027年全球GDP增速将高于市场一致预期,经济深度衰退概率低 [1] - 美国零售与就业数据稳健,消费动能仍在 [1] - 对久期债券相对谨慎,对信用债保持中性,继续看好全球股票 [1] - 美元长期看空,黄金仍看好 [1] - 中国资产处于外资低配状态,估值吸引力上升,若情绪趋稳存在回补空间 [1] - 投资者可考虑减配美国资产、增配欧洲和亚洲资产,中国台湾和韩国也有结构性机会 [1] 债券市场分析 - 预计今年十年期国债收益率在1.65%-1.90%区间波动,市场以看多和中性观点为主 [2] - 央行下场买债,地产与基建实物量持续低于预期,社融信贷同步走弱,货币宽松未转向,为债市提供下行保护 [2] - 银行理财规模突破32万亿元,固收类理财偏好信用票息 [2] - 二级债基热销,ETF持续吸金,但主动债基赎回明显 [2] - 城投债继续净偿还,10月净偿还524亿元,信用利差低于历史中位 [3] - 理财规模突破32万亿元,年底摊余成本法产品到期再配置,对信用债需求形成支撑 [3] - 利率债波动大,信用债收益更稳 [3] 财政、地产与税收状况 - 地产基建数据持续下行,基建实物量远落后往年,地产投资加速下行 [3] - 一线城市二手房挂牌量激增,30城成交仍处低位,居民房贷负增长 [3] - 前10月地产相关税收仍呈双位数下滑,10月财政支出明显放缓,土地基金收入同比减少 [3] - 全年广义财政缺口约8.3万亿元,明年需扩大赤字弥补 [3] - 个人所得税因高收入行业累进效应超预期增长,消费税仅增长2%,企业税由-3%回升至+2%,显示消费弱、企业利润边际修复 [3] 周期品行业(股票) - 贵金属韧性足,黄金中长期逻辑未变 [4] - 继续看好工业金属铜、铝,预计铜矿2026年或零增长,储能与数据中心带来增量缺口,铝海外新增产能低于预期,短期缺口仍在 [4] - 碳酸锂因储能需求爆发而价格飙升,供需增速均较快 [4] - 化工“反内卷”品种(纯碱、己内酰胺、PTA、有机硅)行业会议落实减产10%-30%,亏损面收窄,价格底部反弹 [4] - 电芯链六氟磷酸锂、磷酸铁、VC涨价,上游磷矿石资源约束,磷肥、铁锂需求双升,具备持续弹性 [4] - 投资者整体配置或可倾向于供给有瓶颈的矿端,自律减产或需求有催化的化工品 [4] 制造业(股票) - 工业板块核心变化集中在锂电材料涨价 [5] - 光伏11月排产与价格均持平,产能收储政策落地慢,股价上涨主要靠主题与情绪 [5] - 锂电需求端储能爆发拉动辅材价格普涨,但主材电芯涨幅有限 [5] - 上游碳酸锂现货价格约9万元/吨,期货价格突破10万元/吨,涨价由需求驱动,预计通胀中枢将继续上移 [5] - 制造业中游(挖机、自动化)10月订单不佳,仅出口链保持韧性 [5] - 汽车批发数据增长6-7%,出口贡献为主,内销略增,零售下滑 [5] - 明年汽车补贴退坡与购置税回升将压制增速,但仍有望正增长 [5] - 估值层面,光伏、锂电已修复至中枢偏上,短期交易拥挤;车链主机厂估值低,机器人概念回调后回到中枢区间 [5] - 机构11月明显减配汽车,增配新能源,储能、锂电、风电、光伏成为除科技外加仓最迅速的板块 [5] 消费行业(股票) - 高端消费强于大众品,出行与宠物维持高景气 [6] - 出行链价格修复:航空、酒店同比转正,贡献来自休闲需求而非商务 [6] - 耐克加单反馈欧美库存回归正常,代工订单回暖 [6] - 白酒批价在双11扰动后企稳,某头部品牌价格小幅回升 [6] - 城镇居民可支配收入/茅台瓶数比值已回到2014年底部区间,机构超配比例接近历史最低,板块最悲观阶段或已过去 [6] - 化妆品国货品牌弱于进口,部分品牌高端线恢复明显,体现K型分化 [6] - 生猪价格跌破所有企业完全成本,能繁母猪存栏见顶回落,仔猪价格低迷预示去产能开始 [6] - 预计2026上半年猪价仍弱,下半年有望回升 [6] - 东鹏、农夫增速维持高位,速冻板块受益餐饮修复,部分头部品牌10月增速改善 [6][7] - 家电受制于高基数、消费券难抢,量价均承压;扫地机行业降价促销侵蚀利润 [7] - 宠物食品双11线上增速超过50%,头部公司增速仍快于行业 [7] 科技行业(股票) - 仍然看好科技,AI主线仍处“杰文斯悖论”驱动的算力迭代周期 [8] - 芯片算力每年提升会创造新需求和商业模式,若芯片算力每年以5-10倍迭代,短期静态现金流质疑并不构成趋势拐点 [8] - 海外云厂商资本开支高增与在手订单匹配,收入确认滞后,短期高投入属正常节奏 [8] - 海外谷歌、OpenAI等模型调用量仍在扩张,国内AI企业紧跟,AI搜索替代传统链接已见增量 [8] - 半导体设备2025年市场规模有望翻倍,叠加存储涨价,设备厂商扩张加速确定 [8] - AI应用端仍在成本投入期,下游公司现金流被购买算力卡挤压,爆发需等待芯片成本曲线下降 [8] - 手机等非AI终端需求平淡,明年承压 [8] - 电子、通信基金持仓处于历史高位,短期交易拥挤带来波动 [8]
德银深度报告:真假AI泡沫,究竟谁在裸泳?
美股IPO· 2025-12-13 19:14
文章核心观点 - 当前AI热潮并非单一泡沫,而是由估值、投资、技术三重泡沫交织构成[1] - 公开市场巨头估值有盈利支撑,而私营公司估值已极度高企[1] - 天量投资由现金流驱动,非债务扩张,但复杂循环融资与潜在技术瓶颈埋下风险[1] - AI需求强劲且成本骤降,但能源与芯片供应或成最终制约[1] 估值泡沫 - 希勒周期调整市盈率已超过40,接近2000年互联网泡沫顶峰的44倍水平,显示市场过热[4] - 整体估值主要由盈利增长驱动,标普500指数自2022年10月以来在22.7%的年化增长趋势通道内运行,目前处于通道低端[6] - 大型科技股的估值溢价约60%,但得到了20%以上的盈利增长差异支撑[8] - 科技股估值未达互联网泡沫极端水平,且盈利增长正向更广泛行业扩散[9] - 私营公司估值极高:OpenAI基于2025年130亿美元预测收入的市销率达38倍,Anthropic达44倍[11] - 公开市场科技巨头估值相对合理:英伟达市销率22倍,微软12倍,谷歌9.9倍,亚马逊3.5倍[13] 投资泡沫 - 当前AI投资主要由自由现金流支撑,与互联网泡沫时期的债务驱动不同[15] - 谷歌第三季度运营现金流达480亿美元,超大规模云服务商的资本支出与运营现金流比率普遍低于1,财务状况健康[15] - 自2013年以来,全球科技资本支出年增长率为12.3%,当前增长仍在这一趋势通道内[16] - 大型科技公司的投资回报率自AI周期开始以来持续上升,通过云客户需求、AI工具和编程成本节约产生实际回报[17] 技术泡沫 - 生成式AI仍容易出错和产生幻觉,难以大规模应用[19] - AI的快速扩展可能遭遇物理瓶颈,例如芯片间数据传输速度的限制[19] - 2025年11月谷歌推出的Gemini 3证明AI尚未触及天花板,在多模态能力方面取得重大进展[21] - Gemini 3在“人类最后的考试”中超越所有先前模型,在视觉推理方面的得分是GPT-5 Pro在ARC-AGI-2测试中的三倍[21] - 需求端数据强劲:谷歌10月透露其每月处理1300万亿个令牌,较2024年4月的9.7万亿大幅增长[23] - 目前仍不到10%的美国企业在使用AI,显示巨大的增长空间[23] - 成本骤降是需求激增的重要驱动力:在MMLU基准测试中得分至少42分的最便宜大语言模型成本已下降1000倍[25] 泡沫破裂的潜在触发点 - 复杂循环融资协议可能带来系统性风险:例如OpenAI在八年内承诺1.4万亿美元的计算购买,涉及多方交叉投资和购买协议,可能导致估值不透明[28] - 超大规模云服务商开始发行更多债务:2025年美元投资级债券发行量已超过350亿美元,微软、谷歌、Meta、亚马逊和甲骨文的净债务与EBITDA比率正在上升[30] - 技术规模效应递减:从Llama 2到Grok 4,训练计算成本从1000万美元飙升至10亿美元以上[32] - 基于数据中心支出在5年内开发AGI的概率从2022年的接近100%降至2025年的约20%[32] - 社会政治反弹:在英国和欧盟,20%以上的受访者非常担心AI会在未来几年抢走他们的工作,可能导致客户抵制、员工抵抗和限制性监管[34] - 能源供应制约:2030年电力需求预计将是2020年的四倍,美国家庭今年支付的电价达创纪录的每千瓦时约17美分,能源供应可能成为AI采用和变现的最大障碍[36]
AI会引发能源危机吗?
财经网· 2025-12-11 20:34
文章核心观点 - AI具有双重角色:既是能源消耗者,也是能源系统的效率倍增器 [1] - AI带来的能耗增加是即时的,但其应用带来的节能效益需要3-5年时间逐步显现,存在时间差 [1] - 从长远看,AI带来的节能量最终将数倍于其自身的能耗,成为推动全球碳中和的重要工具 [1][20] AI的能源消耗现状与挑战 - 2024年全球数据中心电力消耗约占全球总电力消耗的1.5%,达415太瓦时 [4] - 2024年数据中心电力消耗地域分布:美国占45%,中国占25%,欧洲占15% [4] - 自2017年以来,全球数据中心电力消耗年均增长约12%,是总电力消耗增长率的四倍多 [4] - 国际能源署预测,到2030年全球数据中心电力消耗将增长一倍以上,达到约945太瓦时,略高于日本当前全国电力消费总量 [4] - 预计到2030年,美国数据中心电力消耗将超过其铝、钢、水泥、化工等所有能源密集型工业产品的生产用电总和 [4] - AI需求激增带动美国天然气及燃气发电行业,因其能快速响应数据中心高稳定性供电需求 [5] - 以美国弗吉尼亚州为例,2024年数据中心用电量已占全州电力需求26%,预计2030年这一比例可达40% [5] 降低AI自身能耗的路径 - 软件算法优化:采用混合专家模型、模型压缩、知识蒸馏、量化、稀疏化等技术降低计算需求与能耗 [6][7] - 硬件效率提升:新一代GPU能效显著提高,例如B200 GPU相比H100和A100系列,每瓦特浮点运算能效分别提升60%和80% [7] - 软硬件协同设计与边缘计算:通过共同优化软件硬件以及边缘计算降低能耗 [7] - 全栈优化案例:谷歌Gemini AI模型单个文本提示中位能耗仅为0.24瓦时,碳排放0.03克,耗水量0.26毫升,较早期估计低1-2个数量级 [8] - 谷歌通过模型架构改进、算法优化、推理优化及定制TPU硬件,实现12个月内能耗下降33倍,碳排放减少44倍 [8] - 数据中心能效提升:中国八大国家枢纽节点数据中心集群平均PUE达到1.3左右,最先进数据中心PUE最低降至1.04 [10] 绿色能源供应与政策引导 - 科技公司积极采购绿电:腾讯提出2030年实现100%绿色电力目标 [9] - 美国科技公司通过长期可再生能源采购协议锁定绿电供应,并探索小时级匹配的可再生能源供应 [9] - 中国推行“东数西算”工程,引导东部算力需求向可再生能源丰富的西部转移 [9] - 在西部建设运营数据中心综合成本约为东部的50%-70% [10] - 八大国家枢纽节点已建成智算规模62万PFLOPS,约占全国智算总量的80% [10] AI在能源供应端的创新应用 - 可再生能源预测:阿里巴巴达摩院eForecaster平台覆盖中国某省262座风电场和331座光伏电站,将新能源发电功率和电力负荷预测准确率分别提升至96%和98%以上 [11] - 电网运营优化:法国RTE、比利时Elia采用AI进行实时预测以评估系统供需失衡 [12] - 预测工具应用:日立能源“诺查丹玛斯”工具提供负荷、市场电价及可再生能源出力预测服务 [12] - 火电厂优化:AI优化调度可让灵活调节的火电厂维持更高利用率,减少效率损失 [13] - 故障预警:通过智能传感器和AI实时监测电网设备,进行预防性维护 [13] AI在能源消费端的创新应用 - 工业领域:安赛乐米塔尔公司利用AI实现卢森堡工厂能效提升3% [14] - 工业领域:德国海德堡材料公司通过AI优化水泥煅烧工艺,将熟料比降低5个百分点,单厂年减排4万吨二氧化碳 [14] - 工业领域:西门子埃尔朗根工厂通过全厂级AI优化实现25%-42%的能耗强度下降 [14] - 交通领域:DHL旗下Greenplan的AI工具为车队规划最优路径,减少20%燃油成本 [15] - 交通领域:沃尔玛通过AI预测卡车维护需求,提升燃油效率5%-7% [15] - 交通领域:TuSimple自动驾驶卡车通过AI控制车速降低10%-20%能耗 [15] - 交通领域:阿拉斯加航空应用AI规划飞行路径,单次航班节油5%-12% [15] - 交通领域:预计到2035年,AI可使全球道路货运能耗减少1.5艾焦,相当于行业需求的4% [15] - 建筑领域:瑞典某市政公司为600所学校部署AI驱动的能源管理系统,结合1万个传感器数据,每15分钟调整设定,节电率达10% [16] - 建筑领域:印度Infosys园区通过AI在LEED铂金认证基础上再提升7%能效 [16] - 建筑领域:新加坡某科技公司总部仅用历史数据训练AI模型,实现23%制冷能耗下降 [16] - 建筑领域:上海某高层建筑通过AI模拟风场优化设计,预计比传统建筑节能35% [16] - 建筑领域:据IEA预测,若全面推广现有AI技术,2035年全球建筑领域可节电3000亿度,相当于澳新两国年发电量,其中10%峰值需求可参与电网调峰 [16] AI在能源领域的应用局限 - 人才短缺:兼具数字技能与能源专业知识的复合型人才严重短缺 [17] - 数据与基础设施限制:能源系统缺乏高质量数据,新兴市场数字化基础设施不足,传感器覆盖率低 [18] - 复杂环境决策能力有限:AI在需要多步骤因果推理或应对突发情况的场景中适应性不如人类 [18] - 安全与伦理限制:在关键基础设施等敏感领域,AI的“黑箱”特性难以满足透明性和可审计性要求 [18] AI的净收益前景与终极能源 - 短期与中期权衡:短期内AI直接能耗将持续上升,而节能效益需要3-5年时间逐步释放,存在阶段性失衡 [19] - 净正收益路径:随着技术进步、可再生能源比例提升及AI节能应用规模化,中期内AI的净节能效应将超过其自身能耗 [20] - 长远展望:核聚变技术有望为AI提供终极零碳能源,AI也正在加速可控核聚变的研发进程 [20] - 资本布局:微软、谷歌、亚马逊等科技巨头正积极投资布局核聚变能源商业化 [21] - 中国进展:2025年7月,中国聚变能源有限公司成立,推进聚变工程化与商业化 [21]
100万亿Token揭示今年AI趋势!硅谷的这份报告火了
新浪财经· 2025-12-08 20:28
报告核心观点 - 基于对OpenRouter平台自2024年11月至2025年11月超过100万亿Token使用量的分析,报告揭示了AI行业的发展趋势,核心观点包括开源模型与闭源模型形成互补、中国开源模型影响力显著提升、模型使用范式向推理与工具调用转变、编程与角色扮演成为主要应用场景以及用户留存呈现“水晶鞋效应”等 [3][5][6][70] 开源与闭源模型格局演变 - 开源模型使用量持续增长,预计到2025年底将达到总使用量的约三分之一,与闭源模型形成互补关系,而非简单的替代关系 [5][6][71] - 开源模型已找到独特定位,成为特定场景的首选,开发者倾向于同时使用开源和闭源两类模型 [6][71] - 中国开源模型成为增长主要引擎,其每周Token使用量占比从2024年底的1.2%最高激增至30%,平均占比为13%,而其他地区开源模型的平均份额为13.7% [2][7][10][74] - 开源模型市场格局从高度集中转向多元化,2025年上半年DeepSeek V3和R1占据一半以上份额,但下半年随着MiniMax M2、Kimi K2、GPT-OSS等模型发布,市场趋于分散,预计年底没有单一模型能持续占据超过25%的Token用量,市场将由5到7个模型均分 [13][77] 模型形态与架构趋势 - 开源模型形态发生变化,中型模型(参数在150亿到700亿之间)更受市场青睐,小模型(参数少于150亿)正在失宠,市场分化为强大的中型模型类别或整合到最强大的单个大型模型(参数为700亿或更多)上 [16][20][80][85] - 语言模型正从“语言生成系统”转变为“推理执行系统”,使用推理功能的Token用量从年初可忽略不计增长至超过50% [7][18][83] - 在所有推理模型中,马斯克xAI旗下的Grok Code Fast 1使用的推理流量份额最大,领先于Gemini 2.5 Pro和Gemini 2.5 Flash,而几周前Gemini 2.5 Pro还是主力 [21][86] - 模型调用工具的功能使用占比上升,年初该功能集中于GPT-4o-mini和Claude 3.5/3.7系列,年中后更多模型开始支持,生态系统更具竞争性,9月底后Claude 4.5 Sonnet、Grok Code Fast和GLM 4.5等新玩家取得进展 [24][89] 主要应用场景与使用方式 - 编程和角色扮演是AI模型的两大主要使用方式 [7][32][70] - 编程类查询的用量从年初的11%上涨至最近的超过50%,增长最为稳定 [32][97] - 在编程模型领域,Claude系列长期占据主导地位,大部分时间占比超过60%,但到2025年11月其市场份额首次跌破60% [35][100] - 同期,OpenAI在编程领域的市场份额从2025年7月的约2%增长至近几周的约8%,谷歌市场份额稳定在约15%,开源模型如Qwen、Mistral份额稳步提升,其中MiniMax被特别提及为快速崛起的新秀 [35][100] - 在开源模型中,角色扮演的使用量占比达到52%,几乎与编程持平,中国开源模型与西方开源模型在该领域平分秋色 [38][103] - DeepSeek的流量中有超过三分之二是角色扮演和闲聊,显示了其在消费者端的高粘性 [38][103] 主流模型的使用偏好 - Anthropic(Claude)超过80%的流量用于编程和技术任务,是主要的程序员工具 [41][106] - 谷歌模型用途相对宽泛,涵盖法律、科学、技术和常识性查询 [44][109] - 马斯克旗下的xAI同样专注于编程,其技术应用、角色扮演及学术用途在2025年11月下旬显著增长 [47][112] - OpenAI的使用重点随时间从娱乐休闲活动逐渐转向编程和技术类任务 [50][115] - Qwen模型同样发力编程端,角色扮演和科学类任务的使用量随时间有所波动 [52][117] 用户行为与市场动态 - 用户留存呈现“水晶鞋效应”,即新模型发布时若能完美解决特定痛点,就能锁定一批高粘性用户,例如Claude 4 Sonnet和Gemini 2.5 Pro发布5个月后用户留存率仍保持40% [7][55][120] - “水晶鞋效应”的窗口期很短,仅在模型刚发布被视为最前沿时有效,一旦竞品发布、能力差距被抹平,则难以再吸引新用户 [58][59][122][123] - 模型任务复杂度提升,从“写短文”变为“解难题”,用户平均每次提示词长度增加了约4倍,且由于推理消耗更多Token,完成任务所需的总Token用量增加了近3倍 [27][29][92][94] - 模型正演变为“自动Agent”,用户给出复杂目标后,模型能自行规划步骤、调用工具并维持对话状态以完成任务,从“聊天机器人”转变为“智能Agent” [32][97] - 模型价格下降对使用量的影响有限,价格下降10%仅带来使用量0.5%至0.7%的增长 [65][129] - 存在“杰文斯悖论”,即模型降价后,因使用更频繁、上下文更长,总Token消耗可能飙升,总支出未必降低 [60][124][125] 区域与语言市场变化 - AI使用不再是硅谷独角戏,亚洲地区的付费使用量占比从13%翻倍至31% [65][129] - 北美仍是最大市场,但份额已不足50%,地位相对下降 [65][129] - 英语以82%的份额占据绝对主导,简体中文以近5%的份额位居第二 [65][129]
100万亿Token揭示今年AI趋势!硅谷的这份报告火了
量子位· 2025-12-08 19:36
文章核心观点 - 基于对OpenRouter平台超过100万亿Token使用数据的实证分析,揭示了2025年AI行业的发展趋势,核心结论包括开源与闭源模型关系转变为互补、中国开源模型力量崛起、模型功能向推理与执行系统演进、编程与角色扮演成为主要应用场景以及用户留存呈现“水晶鞋效应”等[1][8][12] 开源与闭源模型格局演变 - 开源模型不再是闭源模型的廉价替代品,两者关系已演变为互补,开发者常同时使用两类模型[9][10] - 开源模型使用量稳步增长,预计到2025年底将占据约三分之一的Token用量[10][12] - 开源模型市场从高度集中走向多元化,早期DeepSeek V3和R1曾占一半以上用量,但预计到2025年底,没有单一模型能持续占比超25%,市场将由5~7个模型均分[16][17][18] - 中型模型(参数在150亿到700亿之间)更受市场青睐,小模型正在失宠,市场分化为强大的中型模型类别或整合到最强大的单个大型模型上[20][21] 中国开源模型崛起 - 中国开源模型成为增长主要引擎,其每周Token使用量占比从2024年底的1.2%最高激增至30%,平均占比为13%,与其他地区开源模型平均13.7%的份额相当[12][13] - 中国模型如DeepSeek、MiniMax、Kimi K2等在开源领域受到青睐,其中DeepSeek在角色扮演和闲聊领域有极高粘性,超过三分之二的流量用于此[1][16][50] - 在编程领域,中国模型如MiniMax已成为快速崛起的新秀,近几周取得显著增长[48] 模型功能与使用范式转变 - 语言模型正从对话系统升级为推理与执行系统,使用推理功能的Token用量从年初可忽略不计增长至超过50%[22] - 模型调用工具的功能使用占比上升,从年初集中于少数模型发展到更多模型支持,缺乏可靠工具的模型有落后风险[29][30][31][33] - 用户任务复杂度提升,从生成短文转向解决难题,如分析完整文档或代码库[35] - 用户平均每次提示词长度增加约4倍,模型完成任务所需Token用量增加近3倍,反映出工作负载更依赖上下文且推理消耗更多[36][39] - AI正从聊天机器人转变为能独立规划步骤、调用工具并完成复杂目标的自动智能体(Agent)[42][43] 主要应用场景与模型偏好 - 编程和角色扮演是AI模型最主要的使用方式[12][44] - 编程查询的Token用量从年初的11%上涨至最近的超过50%,增长最为稳定[45] - 在编程领域,Claude系列长期占据主导地位,大部分时间占比超过60%,但其份额在2025年11月首次跌破60%[47] - OpenAI在编程领域的市场份额从2025年7月的约2%增长至近几周的约8%,谷歌份额稳定在约15%[47][48] - 在角色扮演领域,开源模型中其使用量占比高达52%,中国与西方开源模型在该领域平分秋色[50] 用户行为与留存特征 - 用户留存呈现“水晶鞋效应”,即新模型发布时若能完美解决特定用户痛点,便能锁定一批高粘性用户,即使后续有更好模型也难以被替换[12][67] - 例如,Claude 4 Sonnet和Gemini 2.5 Pro发布5个月后用户留存率仍保持40%高位[67] - 该效应窗口期很短,仅在模型被视为“最前沿”时有效,一旦竞品能力赶超则难以吸引新用户[69][70] - 用户留存模式可分为:成功锁定(如Claude、GPT-4o Mini)、从未合脚(如Gemini 2.0 Flash)、回旋镖效应(用户离开后因性价比或特定能力又回归,如DeepSeek)[74] 市场与区域动态 - AI不再是硅谷独角戏,亚洲地区付费使用量占比从13%翻倍至31%[71] - 北美仍是最大市场,但份额已不足50%[80] - 英语以82%的份额占据绝对主导,简体中文以近5%的份额位居第二[80] 其他关键发现 - 模型价格下降对使用量的影响有限,价格下降10%仅带来0.5%-0.7%的使用量增长[80] - 存在“杰文斯悖论”现象,即模型降价且好用后,用户会在更多场景更频繁地调用,导致总Token用量飙升,总支出可能并未降低[75][76] - 报告数据主要反映开发者与服务端API调用行为,未涵盖通过App或Web直接访问的流量,且平台定价策略可能影响数据代表性[76]
关于AI投资泡沫争议的几点思考
搜狐财经· 2025-11-27 20:36
AI龙头公司股价表现与市场背景 - 自2022年底ChatGPT发布以来,美股AI龙头公司(“7姐妹”)股价大幅跑赢整体市场 [2] - 自2025年初DeepSeek出现以来,中国AI龙头公司(主要在港股)也大幅跑赢大市 [2] - 尽管相关企业盈利有较快增长,但美国股市风险溢价处于极低水平,反映了投资者的乐观预期 [2] 高利率与高股价并存现象的解释 - 传统思维认为利率与风险资产价格是跷跷板关系,但过去几年美元利率上升环境下股价仍大幅上涨,需要新的解释 [3] - 第一种解释:股市是因,利率是果 AI领衔的股市上涨是美国经济总需求的重要支撑,由此带来的通胀压力促使美联储维持高利率 [3] - 今年以来AI相关资本开支贡献了美国GDP增长的三分之一 [3] - 最富有的10%人口拥有85%的美国股票,这部分人占总消费支出的一半,为有记录以来最高份额,股市财富效应促进消费、降低储蓄 [3] - AI相关资本开支增加投资,与财富效应共同作用,导致维持供求平衡的自然利率上升 [3] - 第二种解释:利率和股价都是果,由第三方力量驱动 美国AI主导的股市吸引了全球资金,截至2025年9月,外国投资者持有美股21.2万亿美元,占总市值31.3%,为二战后最高市场份额 [4] - 全球投资者押注美国科技巨头股票,助长美国股市,相关财富效应刺激总需求,进而支撑了利率水平 [4] AI技术发展的成本与收益分析 - AI技术发展特征为应用层面技术成熟度低与预期利润大并存,需要资本市场尤其股权投资支持 [6] - 大模型成本包括研发成本(算力、人员、电费、数据获取、模型维护等)和应用成本(推理能耗) [6] - AI相关投资模式从资本轻型的软件分发模式转变为资本密集的硬件生产(先进芯片和数据基础设施)模式 [6] - 科技巨头公司投入巨额资金,并成为OpenAI、Anthropic等大型AI初创企业的主要支持者,接管了风投公司的角色 [6] - 业界资本相比风投更容易被AI赋能,可以降低不确定性或提高预期收益 [6] - 大模型收益端分析面临很大不确定性,不同应用场景差异大,直接经济收益(降本增效)和间接经济收益(提升竞争优势)难以估量和加总 [7] - 大语言模型可能给出不准确答案,限制其在很多商业应用的价值 [7] - 大模型应用价值在于用企业内部场景数据训练,但很多企业尚未准备好或不知如何应用自身数据 [7] AI对宏观经济影响的估算 - 估算AI对经济增长影响主要有两种方法:外推法和基于任务的方法 [8] - 外推法将AI类比电力与IT革命,推测未来十年AI革命或能带来0.8-1.3个百分点的年度额外GDP增长 [8] - 基于任务的方法(Acemoglu, 2024)估算未来十年AI对TFP增速的影响仅为每年增加0.07个百分点 [8] - Aghion教授认为基于任务的方法因未充分考虑AI成本下降及能力提升而存在低估,综合文献看,AI带来的年生产率增长应在0.08-1.24个百分点之间 [8] - 中金研究院2024年《AI经济学》采用“元任务”分析方法,测算到2035年AI引入将为我国带来GDP额外提升约9.8%,对应额外年化增长率约0.8% [9] 规模经济、技术进步与行业格局 - DeepSeek的突破在于以算法架构改善弥补算力限制(美国对华先进芯片出口限制),用7纳米芯片做4纳米芯片的事 [10] - 对于算法改善对先进芯片的替代作用,存在悲观与乐观两派观点,乐观派引用杰文斯悖论,即技术进步提升要素使用效率时,收入效应大于替代效应,导致整体需求增加 [11] - 从英伟达股价后续走势看,杰文斯悖论似乎得到印证 [11] - 芯片作为制造品具有规模经济特征,单位成本随生产规模增加而下降,在充分竞争市场下价格随边际成本下降 [12] - 煤炭作为自然禀赋具有规模不经济特征,采矿业供给弹性低,需求增加导致价格上升 [12] - 规模定律隐含算力、数据、电力等要素投入呈现规模报酬递减,对模型性能的追求只能通过增加要素投入来实现 [13] - 规模报酬递减和盈利增长同时发生,反映了相关企业的定价能力,规模定律带来的投入门槛使巨型科技企业处在有利地位 [13] - 中国大模型开源模式对全球AI竞争格局带来重大影响,推动市场朝更公平方向发展,大幅提升中国在全球AI领域话语权 [14] - DeepSeek动态稀疏架构被IEEE纳入国际标准,欧美不少初创企业采用中国开源模型 [14] - 中国开源模式倒逼OpenAI重启开源、Meta调整开源策略,DeepSeek以宽松许可证推动技术自由传播,且推理成本远低于GPT-4等闭源模型 [14] - AI的能耗成为关注点,电力来源中,化石能源具有规模不经济特征,绿色能源(制造业)具有规模经济特征 [14] 高估值可持续性与潜在风险 - 当前美国AI相关股票高估值可能有两个载体:一是投资者对未来长期盈利增长过度乐观;二是当前盈利本身(与当下AI相关资本开支相关)不可持续 [15] - 泡沫破裂可能体现为芯片产业规模经济作用,叠加竞争格局变化(如中国先进半导体产业发展)或算法架构/系统改善提升芯片产出效率,导致技术壁垒被打破、先进芯片价格下降 [15] - 另一个可能是AI大模型应用及其创造的经济效益不及当前乐观预期 [16] - 关键是大模型研发的规模报酬递减能否通过技术进步(如算法改善)来弥补,或大模型应用能否在更广经济层面带来规模报酬递增 [16] - 科技泡沫与房地产泡沫不同,前者的破裂短期带来较大冲击,但长远看是创造性破坏,规模经济和正外部性意味局部领域过度投资虽不可持续,但可能有利于长远的技术进步和创新发展 [16]