Workflow
杰文斯悖论
icon
搜索文档
英伟达现在的情况不会持续太久
美股研究社· 2026-01-16 20:34
文章核心观点 - 英伟达2026财年第三季度业绩稳健超预期,尽管市场对AI支出存在担忧,但公司凭借数据中心业务的强劲增长、健康的财务状况、领先的技术平台和生态系统护城河,在AI革命中占据主导地位,分析师认为其长期前景稳固,2026年存在多个增长动力,但同时也面临行业估值调整的潜在风险 [1][2][14][22] 2026财年第三季度财报表现 - **营收与盈利超预期**:第三季度营收达570.1亿美元,超出市场预期3.48%,同比增长26% [1][4];调整后每股收益为1.30美元,超出分析师预期3.46% [1] - **数据中心业务驱动增长**:数据中心部门收入达512亿美元,同比增长66%,表明需求依然强劲 [4] - **毛利率变化与原因**:毛利润同比增长60%至418亿美元,但毛利率同比下降1.2个百分点至73.4%,主要原因是销售模式从单个芯片转向包含GPU、冷却系统、网络解决方案等的完整系统,这些附加部件的利润率较低 [5] - **出色的运营与盈利能力**:营业收入同比增长65%至360亿美元;净利润同比增长65%至319亿美元,基本每股收益为1.31美元 [6] - **强劲的资产负债表与现金流**:现金及现金等价物同比增长40%至606亿美元,总资产1611亿美元,总负债423亿美元,资产负债表健康 [6];经营现金流同比增长40%至665亿美元,自由现金流同比增长36%至617亿美元 [6] - **下季度展望积极**:管理层预计下季度营收约为650亿美元(上下浮动几个百分点),毛利率预计约为74.8%,显示持续增长势头和利润率可能企稳甚至提升 [6] 英伟达的估值分析 - **当前股价与历史表现**:发布时股价约188美元/股,过去六个月上涨约10%,一年期回报率约42%,五年期涨幅近1300% [9] - **估值倍数高于行业**:公司当前GAAP预期市盈率约40倍,意味着投资者为其每1美元年化收益支付约40美元,比行业平均水平高出约26% [12];预期市净率高达29倍,比行业中位数高出约500% [13] - **高估值的合理性**:公司在AI市场占据主导地位(有报告称占据90%的市场),处于互联网以来最大技术革命的中心,其CUDA软件平台已成为行业标准,创造了巨大的转换成本和竞争护城河,这些竞争优势支撑了溢价估值 [13] - **技术迭代推动增长**:芯片性能呈指数级增长(从Hopper到Blackwell,再到预计2026年下半年推出的Rubin),性能飞跃降低了旧型号和替代品的吸引力,形成了升级周期的飞轮效应,使竞争对手持续追赶 [14] - **长期投资视角**:对于五年以上投资视野的长期投资者而言,当前价格水平被认为是合理的,尽管预计近期会因AI支出消息而产生波动 [14] 2026年的潜在增长动力 - **中国市场重新开放**:限制解除后,来自中国科技公司的H200芯片订单超过200万片,单价约2.7万美元,首批约8万片预计于2026年2月中旬出货,有望显著贡献利润 [16] - **Rubin平台发布**:预计2026年下半年推出的Rubin平台是一项重大技术升级,据称与Blackwell相比,能将运行AI模型的成本降低10倍,训练AI模型所需的GPU数量减少4倍 [18] - **客户广泛采用**:微软、Alphabet、亚马逊、甲骨文等超大规模数据中心承诺在2026年下半年部署Rubin;Anthropic、Meta、OpenAI等AI公司也计划利用Rubin训练下一代模型 [18] - **市场扩张潜力**:Rubin带来的效率提升可能遵循杰文斯悖论,即效率提高导致使用量增加,从而显著扩大AI市场,而非减少芯片销量 [19] - **巨大的盈利潜力**:若到2028年Rubin占据高性能芯片市场60%到70%的份额,该平台可能产生1500亿至2000亿美元的毛利润,扣除运营成本后,可能转化为1200亿至1600亿美元的净利润 [19] 2026年的潜在风险 - **行业投资回报缺口**:高盛预测,2026年主要云公司在AI基础设施上的支出将达5270亿美元(较2025年的约4000亿美元显著增加),但这些投资需要产生超1万亿美元的年利润才能证明合理性,而2026年估计利润仅约4500亿美元,存在巨大缺口 [20] - **AI泡沫与估值重估风险**:德意志银行预计OpenAI在2024年至2029年间可能消耗1430亿美元才能盈利,若其2026年下半年上市后财务状况不佳,可能引发整个AI行业估值的广泛重新评估,导致AI股票抛售 [20] - **历史模式警示**:当前巨额投资期望AI应用回报但实际收入滞后的模式,类似于历史上的铁路繁荣、互联网泡沫等,行业可能过度扩张并在价值实现前经历痛苦调整 [21] - **股价下行风险**:若AI泡沫破裂,英伟达估值可能从当前40倍预期市盈率降至低于20倍,叠加盈利增长放缓,股价可能大幅下跌,即使公司运营执行良好 [21]
2025人工智能发展现状报告:超级智能与中美大模型PK,限制与超越 | 企服国际观察
钛媒体APP· 2026-01-12 13:39
报告概览与核心预测 - 报告为《人工智能现状报告 2025》,长达300多页,由业界顶尖从业者评审,涵盖技术、产业、政策、安全、市场等多个维度[2] - 报告对下一年度做出多项预测:中国研究机构在前沿AI模型研究上将超越美国;开放式AI智能体(Agent)更值得获得进一步科研发现;基于AI生成欺诈视频的网络攻击将引发国际讨论;美国某头部AI研究架构将转向开源生态以获得政府支持[2] 技术发展与模型竞争 - 2024年末至2025年,随着GPT-o1发布,基于深度推理的大模型发展热潮兴起,多家厂商快速面世多个推理模型[3] - 以Meta为代表的科技巨头定义了“超级人工智能”(Superintelligence)一词,“通用人工智能”(AGI)成为过去时[3] - 顶尖模型仍保持闭源,如GPT-5、GPT-o3、Gemini 2.5 Pro、Claude 4.1 Opus、Grok4等,其中OpenAI的GPT-5在多个基准测试中保持领先[5] - 中国基础模型虽未取得突破性进展,但在开源模型领域颇具竞争力,DeepSeek、Qwen和Kimi等模型崛起,在推理和编程任务方面正逐步缩小与领先者的差距[6] - 开源为中国厂商提供了快速追赶的契机,越来越多的开发者选择基于Qwen进行开发[6] - 曾作为开源模型标杆的Meta Llama,其市场份额已从2024年末的约50%大幅下滑至目前的15%[6] - 近期推理模型的方法改进完全处于基准模型的误差范围内,可能意味着其进步并不真实,且强化学习带来的实际收益微乎其微,容易过拟合[9] - 前沿AI实验室正探索将强化学习、可验证奖励机制、可验证推理与新环境结合,赋予模型规划、反馈、自我修正及长期执行任务的能力[11] - AI研究正考虑利用小语言模型构建智能体,因其成本显著降低且能满足实际操作需求,策略是采用小语言模型构建有限的异构智能体架构,仅在必要时调用大模型[11] AI智能体与产业应用 - AI智能体框架发展迅速,LangChain仍是众多选择之一,各细分领域涌现数十种框架,如研发领域的AutoGen、camel,软件工程领域的MetaGPT等[13] - AI智能体的研究正赋予其记忆能力,实现从拓展上下文窗口到结构化、持久性终身记忆的转变,并延伸至动态整合、遗忘和反思[13] - AI在跨学科领域应用价值凸显,例如DeepMind基于Gemini 2.0构建的AI系统“Co-scientist”能生成、辩论并进化其假设生成与实验规划过程[13] - AI在物理世界涌现,如艾伦人工智能研究所的MolmoAct和谷歌的Gemini Robotics 1.5,能提升物理机器人的可解释性和可靠性[13] - AI产业应用迅速普及,AI优先企业营收远超其SaaS同行,在各个行业展现出发展势头[13] - 2025年,随着AI采用率上升,用户留存率上升,企业支出增加,特别是在音视频、虚拟形象、图像生成领域,AI公司收入有望实现爆发式增长[13] - 企业内部AI应用场景以内容生成、代码生成、研究及分析密集型任务最为常见[18] - 使用频率最高的工具包括ChatGPT、Claude、Gemini/Google和Perplexity,DeepSeek覆盖率略低但使用频率相对较高[18] - 在开发者工具中,Cursor、Claude Code和GitHub Copilot备受青睐;非编程工具中,Deep Research、ChatGPT、ElevenLabs、Perplexity和Claude使用频率非常高[18] - 对1183名AI从业者的调研显示,95%的专业人士现在在工作或生活中使用AI,76%的人自掏腰包购买AI工具,且大多数人表示生产力持续提高[25] 市场竞争、风险与基础设施 - AI编程工具可能主动覆盖企业生产代码,导致开发成果受损[21] - 从事AI编程开发的初创公司面临严峻的单位经济效益挑战,盈利受制于上游模型价格和竞争对手,可能采取突然提价或限制用户功能等措施[21] - 浏览器正成为AI应用的最新焦点和企业竞争的新战场,OpenAI、Google、Anthropic和Perplexity均推出了能在浏览器中导航和操作的助手功能,将浏览器重新定义为智能操作系统[21] - 谷歌在其产品中嵌入Gemini能力,其每月Token消耗数量在2025年同比增长了50倍,达到千万亿个Token[22] - 电力供应正成为制约AI发展的新因素,若电力供应不足,国家AI计划将面临崩溃风险,未来1-3年内美国几个主要地区可能会出现电力短缺[22] - 美国能源部警告,由于电力供应不稳定和AI需求增长,到2030年,停电频率可能会增加100倍[22] - 2024年末DeepSeek搅动市场,市场重新认识“杰文斯悖论”,即更便宜的智能带来更高的需求,进而提高对芯片的消耗[22] - GPU至关重要,英伟达市值突破4万亿美元,占据90%的AI研究论文市场份额,定制芯片与新云服务同步崛起[25] - 除英伟达外,上市公司Coreweave、Nebius以及私企Lambda、Crusoe因客户对优惠价格、灵活合同条款及AI专用软件套件的需求增加而实现快速增长[25] - TPU和AMD的GPU普及程度并不高[25] 劳动力市场影响 - AI主要挤压入门级岗位市场,在软件和客服领域,这类岗位极易受AI技术影响,其招聘岗位持续下降,经验丰富的劳动力暂时保持工作稳定性[25] - 研究发现当前劳动力市场变化早于2022年ChatGPT的问世,AI自动化目前并未削弱经济领域对认知型劳动力的需求[28] 政策、安全与监管 - 美国推行“美国AI优先”战略并调整出口政策,中国加速推进自主研发与本土芯片制造,中美AI竞赛愈演愈烈[28] - 2025年,特朗普政府将人工智能安全研究所更名为人工智能标准与创新中心,并启动了5000亿美元的“星门计划”,同时美国政府发布《人工智能行动计划》力求保持其全球主导地位[28] - AI芯片出口限制政策用“反复”形容,美国政府需在国家安全目标与供应链依赖、供应商游说间寻求平衡,英伟达和AMD成为政治焦点,英伟达在中国市场并未达到稳定状态[28] - 美国监管措施在巨额投资浪潮中被边缘化,国际外交陷入僵局,《人工智能法案》实施遭遇重重阻碍[31] - AI数据中心建设陷入邻避主义瓶颈,美国公众对新建大规模数据中心的反对声日益高涨[33] - 政府《人工智能行动计划》提及需自主AI领域“基础科学”,但其核心研发资金远低于专家建议的2026年320亿美元投资目标[33] - 硅谷科技巨头采取“逆向”并购政策:通过快速引进人才(创始人及团队高薪)以规避并购限制,同时保留原业务精简的公司转型拓展小众市场,例如微软收购Inflection,谷歌收购Character AI,亚马逊收购Adept,Meta收购Scale AI[33] - 美国联邦贸易委员会对这类“逆向”并购行为的担忧日益加剧[35] - 美国就AI安全相关的政策议题发生转变,加之实验室间商业竞争激烈,某些安全规程已被列为非优先事项[36] - 外部安全机构年度预算甚至不及顶尖实验室单日总支出,曾以安全为核心的机构开始将重点转向产品化[36] - 报告估算,外部AI安全研究投入仅约1.3亿美元,而同期全球AI研发支出接近千亿美元,比例极低[36] - AI实验室为防范生物安全风险和网络攻击部署了空前防护,部分实验室却因错过自我设定的截止日期或悄然放弃测试方案[36] - 网络攻击能力每五个月翻一番,远超防御措施的更新速度,犯罪分子利用AI智能体的勒索软件已渗透至世界500强企业[39] - 涉及生成式AI的安全事件正呈急剧增长态势,大量报告事件涉及AI换脸技术,与大模型的滥用密切相关,AI代理正日益成为网络安全防御的重大挑战[39]
从业 43 年的程序员直言:AI 不会取代程序员,软件开发的核心从未改变
程序员的那些事· 2026-01-12 08:48
文章核心观点 - 基于43年编程经验的行业观察,认为AI(特别是LLM)不会取代程序员,软件开发的未来仍掌握在开发者手中 [1][3][19] - 编程的本质是将模糊的人类思维转化为精准的计算思维,这一核心能力是AI难以替代的 [12][17] - 历史上多次“程序员将被取代”的预言均未成真,反而导致了程序与程序员数量的增加,体现了“杰文斯悖论” [6][9] 历史循环:“程序员将被取代”的预言从未成真 - 在过去43年中,多次技术革新(如Visual Basic、Delphi、无代码平台、4GL/5GL)都被预言为程序员的终结,但均未实现 [4][5][6] - 最终结果并非程序员减少,而是程序与程序员越来越多,形成了每年规模达1.5万亿美元的“杰文斯悖论”典型例证 [9] LLM与过往技术的本质差异 - 当前LLM浪潮的规模和关注度远超以往(如Visual Basic、可执行UML),并受到整个经济体的押注 [11] - 与过去能稳定可靠提升效率的技术不同,LLM对大多数团队而言拖慢了开发速度,并降低了软件的可靠性与可维护性,形成双输局面 [11] 编程的本质:从模糊思维到精准计算的转化 - 编程的真正难点在于将人类模糊、矛盾、充满歧义的想法,转化为逻辑严谨、精准明确的计算思维 [12] - 这一核心挑战从打孔卡片时代至今从未改变,未来很多年可能依然如此 [13][14][15][16][17] - 自然语言因语义模糊和不确定性,无法用于精准编程,市场上对既热爱又擅长计算思维的人才需求将长期供不应求 [17] AI在编程中的局限性 - 目前没有可靠证据表明AI正在大规模取代软件开发者,就业市场变化主因是疫情过度招聘、借贷成本上升及数据中心建设分流资金 [17] - AI短期内无法进化到胜任人类程序员的核心工作(理解、推理和学习),通用人工智能(AGI)仍遥不可及 [18] - AI生成的代码几乎必然存在问题,需要真正的程序员去识别和修复,且企业宣扬AI生成代码比例后常伴随重大系统故障 [18] - 构建大型模型的成本极高且承受亏损,其长期前景存疑,可能被证明得不偿失 [19] 软件开发的未来展望 - 软件开发可预见的未来是AI以更朴素的形式辅助工作,例如生成原型代码或自动补全 [19] - 在关键核心环节,方向盘前永远会坐着一名软件开发者 [19] - 建议雇主应提前招聘程序员,以应对未来可能出现的抢人大战 [20] 网友讨论精选 - 有观点指出,当前对大模型的使用依赖外部投资补贴,其真实的高昂隐性成本被忽视或淡化 [23] - 有经验认为,智能体大模型在解决底层库复杂问题、寻找非明显bug或理解嵌套抽象逻辑方面完全无用,但能高效处理简单、重复的样板代码任务 [24][26] - 有从业者感到担忧,认为AI工具在设计、代码评审、找bug、项目规划及决策方面可能已超越人类,程序员角色可能转变为流程协调者 [27][28]
AI开始替游戏厂商赚钱:腾讯的算盘、网易的执念、中腰部的生死局
36氪· 2026-01-08 20:21
文章核心观点 - 当其他行业仍将AI作为营销噱头或内部工具时,中国游戏行业已率先实现AI的商业闭环,将其转变为实打实的利润增长引擎 [1] - 文章从财务视角剖析了AI在中国游戏产业的应用,揭示了腾讯、网易及中腰部厂商如何通过不同路径利用AI提升商业效率与盈利能力 [1] 腾讯的"大象起舞":AI学会了赚钱 - AI对腾讯游戏业务的最大贡献并非直接作用于游戏开发,而是体现在"卖游戏"的营销环节 [2] - 2025年第三季度,腾讯营销服务收入达362亿元,同比增长21%,在广告行业整体承压背景下增速显著 [3] - 腾讯通过"混元+广告"全链路智能投放系统重构广告业务,AI能理解广告素材并精准预测用户从点击到付费的全链路行为 [4] - 该系统使广告主每万元投放费用所需操作次数下降80%,同时有效千次展示费用和点击率大幅提升,在不增加广告位的前提下将流量卖出了更高价格 [5] - 2025年Q3,在高端算力供应受限背景下,腾讯资本开支增速显著低于收入增速,通过模型蒸馏、量化剪枝等技术优化存量算力,提升了现有GPU的推理效率 [6][7] - 收入端由AI驱动增长,成本端通过软硬协同降低单位算力成本,共同推动2025年Q3毛利同比增长22%,经营利润率提升至38% [8] - 腾讯的AI哲学在于不盲目参与算力竞赛,而是追求极致的工程化落地与商业变现 [9] 网易的"人机之恋":把AI卖给玩家 - 网易将AI深度融入游戏产品,其典型案例如《逆水寒》手游,通过赋予AI NPC记忆、性格和情绪,将AI技术转化为"情感商品" [10] - 《逆水寒》手游国际服未正式上线预约人数已超800万,智能NPC显著提升了用户留存率和在位时长,这对于免费游戏的用户生命周期总价值至关重要 [10] - 2025年Q3,在行业增速放缓背景下,网易游戏及相关增值服务净收入仍实现11.8%的增长 [11] - 在UGC领域,网易通过《蛋仔派对》的AI辅助创作工具,将内容生产成本转嫁给用户,用户可通过自然语言描述生成复杂地图组件,源源不断为游戏创造免费高质量内容 [11][12] 中腰部"绝地求生":要么AI,要么死 - 对于完美世界、巨人网络等中腰部厂商,AI是扭亏为盈和生存的关键 [13] - 完美世界在2025年上半年预计净利润达4.8亿至5.2亿元,成功扭亏,《诛仙世界》的成功上线得益于AI工具链在美术外包和NPC行为逻辑设计上的应用,实现了成本控制 [13][14][15] - 巨人网络自研垂直领域的"GiantGPT",专门针对游戏、数值和玩家心理,在《太空行动》等产品中实现低成本AI玩法部署,降低了推理成本并提升了响应速度 [16] - 三七互娱通过AI辅助使2D美术绘图效率提升60%-80%,每月产出超28万张AI原画,得以快速测试广告素材和游戏画风 [17][18] - 世纪华通旗下点点互动利用AI驱动数据分析,使其游戏《Whiteout Survival》在2025年月流水超2亿美元,AI帮助精准预测全球不同地区用户的用户生命周期总价值,实现"高买高卖"的套利模型 [18] 繁荣背后的阴影:杰文斯悖论与合规大考 - 游戏行业出现"杰文斯悖论"现象:AI虽将单张原画成本降至极低,但公司为争夺用户注意力,要求产出10倍、100倍的内容量,导致游戏安装包变大、皮肤推出加速、活动更频繁,行业从"拼人头"转向"拼算力"和"拼产能",总竞争门槛被无限拔高 [20] - 人才结构发生剧烈震荡,初级原画师、翻译、文案策划等岗位减少,取而代之的是身价不菲的AI工程师、技术美术和数据科学家,游戏公司的核心资产从"创意人才"转向"算力+数据+模型" [21] - 合规成为重大挑战,2025年9月1日《人工智能生成内容标识管理办法》正式实施,要求所有AI生成内容必须添加标识,这对依赖第三方模型的小厂构成巨大技术门槛,合规成本上升加速了行业资源向头部集中 [22][23] 从"工具"到"物种"的行业展望 - AI对中国游戏产业的影响已完成从"量变"到"质变"的跨越:对腾讯是提升经营效率的杠杆,对网易是提升用户体验的增值服务,对中腰部公司则是生存门票 [24] - 展望2026年,竞争维度将再次升级,可能出现真正的"AI原生游戏",即游戏本身由AI实时生成,智能体取代脚本成为游戏世界的新驱动引擎 [24]
AI军备竞赛的终点,或是一场关于铀的“全球狩猎”
36氪· 2025-12-30 20:11
文章核心观点 - 人工智能产业的快速发展,特别是其巨大的、持续增长的电力需求,正在成为推动核能产业发展的结构性新驱动力,这导致能源需求侧(AI)与供给侧(核能)在速度和特性上产生激烈碰撞 [1][2] - 铀市场面临严重的长期供应短缺,价格可能因矿商重启产能的激励需求而大幅上涨至每磅135美元,但供应端的扩张受制于其固有的工业周期和地缘政治现实,无法匹配AI驱动的需求增长 [3][4][7] - 核能产业的性质正在从公共事业向“私有平台”转变,科技巨头通过长期购电协议锁定优质基荷电力,可能将电网升级成本社会化,从而重塑能源领域的权力和利益分配格局 [5][6] AI电力需求与能源结构转变 - 一项针对600余名全球投资者的调查显示,63%的受访者将AI的电力需求视为核能规划中的“结构性”转变,而非暂时性需求 [1] - 生成式AI不仅使用数据,还在创造数据的过程中大量消耗能源,传统的“效率提升抵消用量”的叙事可能已经失效 [1] - 超大规模AI数据中心的能耗密度极高,耗电量堪比中等规模城市,且要求99.999%的无缝运行,传统的电力需求模型未预料到该行业能在五年内实现电力足迹的翻倍式增长 [2] - 标普全球能源最近的报告预计,数据中心的耗电量可能达到2200太瓦时(TWh) [2] - 间歇性可再生能源无法满足数据中心7*24小时的“基荷”电力需求,迫使超大规模云厂商转向寻求核能等稳定电源 [2] 铀市场供需矛盾与价格展望 - 铀市场呈现“双速”格局:短期现货价格剧烈波动,而长期供应缺口持续扩大,当前开采的铀矿仅能满足未来反应堆需求的不到75% [3] - 过去二十年铀投资严重不足,2011年后全球基本停止了铀矿勘探,长期依赖冷战遗留的核弹头和电力储备等“次级供应”,如今这些储备已基本耗尽 [3] - 行业调查中,超过85%的受访投资者预计到2026年铀价将达到每磅100-120美元区间,部分人士预期将突破135美元/磅 [4] - 135美元/磅的价格被视为迫使矿商重启封存矿坑的“绝望的激励价格”,而非市场健康信号 [4] 核能产业性质与利益格局演变 - 核能正从由国家出资、监管的公用事业,转向“私有平台”时代,科技巨头通过签订长达二十年的购电协议,将最优质、最清洁的基础负荷电力锁定为私有资源 [5][6] - 一个关键问题是:为输送AI企业所需的绿色电力而进行的电网升级,其成本常被转嫁给公众或政府,导致能源安全私有化而风险社会化 [6] - 若AI成为核电规划的新驱动力,电网的“公共服务”属性可能让位于科技巨头的“算力就绪”需求 [6] 铀供应链的地缘政治因素 - 西方正试图重建铀供应链并将其纳入“可持续金融框架”,但面临浓缩和转换能力的巨大瓶颈,这些能力仍与俄罗斯的国家利益深度捆绑 [7] - 中国、韩国和阿联酋等新兴市场将核能视为国家生存大事,中国目前在建的反应堆数量比世界其他国家的总和还要多 [7] - 如果铀供应持续受限,可能引发全球争夺“承购协议”的政治抢夺战,锁定铀资源意味着锁定AI的领先地位,世界可能进入按价格实行能源配给的时代 [7]
当硅谷用AI“洗白”裁员决策,“岗位消失论”是一场幻觉吗?
第一财经· 2025-12-29 23:56
AI与就业市场现状 - 2025年美国约有5.5万次裁员被归因于人工智能(AI),科技巨头如亚马逊和赛富时(Salesforce)裁减了上万个岗位,并将AI列为裁员的主要因素之一 [3] - 麻省理工学院(MIT)研究显示,AI已经能够胜任美国劳动力市场约11.7%的工作,并有望在金融、医疗及其他专业服务领域节省高达1.2万亿美元的工资支出 [3] - 特斯拉公司创始人马斯克预测未来人类的工作并不是必须的,工作会像“运动或游戏一样” [3] AI驱动裁员的复杂性 - 有观点认为,当前许多裁员“实质上是将传统重组包装成AI驱动的创新”,企业需要区分真正的AI转型与以自动化为名、掩盖运营低效的行为 [6] - IBM首席执行官克里希纳公开承认,近期的裁员更像是一场“自然修正”,主要是为了解决过度招聘的问题,而非完全由AI导致 [6] - 克里希纳称,AI确实会带来一定程度的职位取代,可能影响美国就业的10%左右,但他也强调,AI不会全面取代人类 [7] AI对岗位结构的影响 - 根据求职网站Indeed招聘实验室的分析,截至2025年初,高级和管理级科技职位的招聘数量较疫情前水平下降19%,普通及初级科技职位的降幅则高达34% [10] - 2022年第二季度至2025年第二季度间,要求至少5年工作经验的科技职位占比从37%上升至42%,而需要2-4年经验的岗位比例则相应减少 [10] - 亚马逊云服务(AWS)首席执行官加尔曼表示,用新技术取代初级工程师和员工是糟糕的商业决策,如果不建设人才梯队,企业将错失许多最优秀的创新思路 [10] AI应用的现实与调整 - 瑞典金融科技公司Klarna的案例显示,其AI客服助手曾处理公司三分之二的客服对话,相当于完成了700名全职客服的工作量,但到2025年,公司开始重新招聘人类客服,因过度依赖AI导致服务质量下降、客户不满增加 [7] - 乔杜里博士指出,当首席执行官们宣称要用AI淘汰工作时,他们往往很快不得不收回这些言论,因为AI实际上无法完全取代人类,即使在呼叫中心这样的领域也是如此 [7] - 乔杜里博士认为,AI并不会取代最资深和最有经验的人,被自动化淘汰的主要是涉及知识合成和低级信息搜集的入门级岗位 [9] 技术进步与工作量的“杰文斯悖论” - 根据“杰文斯悖论”理论,当技术进步提高了某种资源的利用效率,导致其成本降低,反而可能引发对该资源需求的显著增加,最终使其消耗总量不减反增 [10] - 乔杜里博士指出,硅谷正在拥抱一种更长工作时间的文化,技术进步并未减少工作量,反而带来了更多工作,工作是一个不断膨胀、无限扩张的生态系统 [11] - 乔杜里博士解释,最底层的工作被自动化淘汰,但随着信息流动加快,新工作也在不断涌现,AI帮助我们更快地实现目标,同时也催生了新的任务与岗位 [4]
当硅谷用AI“洗白”裁员决策,“岗位消失论”是一场幻觉吗?
第一财经· 2025-12-28 17:53
文章核心观点 - 当前科技行业裁员与AI的关系复杂,部分裁员被指是“AI洗白”,即企业将传统重组包装为AI驱动的创新以节省开支或掩盖运营低效 [1][2] - AI对就业市场的影响是双面的:一方面自动化替代了部分初级和入门级岗位,另一方面也催生了新的任务与岗位,长期来看可能增加总工作量 [1][2][6] - AI目前无法完全取代人类工作,过度依赖AI可能导致服务质量下降,企业仍需人类员工,尤其是在资深和管理岗位 [3][4] AI与当前裁员的关系 - 2025年美国约有5.5万次裁员被归因于人工智能(AI),科技巨头如亚马逊和赛富时(Salesforce)裁减了上万个岗位并将AI列为主要因素之一 [1] - 分析指出,部分裁员实质上是将传统重组包装成AI驱动的创新,企业需要区分真正的AI转型与以自动化为名、掩盖运营低效的行为 [2] - IBM首席执行官认为近期裁员更像是一场“自然修正”,旨在解决过度招聘问题,而非完全由AI导致 [3] AI对工作岗位的替代效应与局限性 - 麻省理工学院(MIT)研究显示,AI已经能够胜任美国劳动力市场约11.7%的工作,并有望在金融、医疗及其他专业服务领域节省高达1.2万亿美元的工资支出 [1] - AI显示出对初级开发者的替代效应,且这类案例正在增多,但不会取代最资深和最有经验的人 [2][4] - 瑞典金融科技公司Klarna的案例显示,过度依赖AI客服导致服务质量下降和客户不满增加,公司随后重新招聘人类客服 [3] AI对招聘市场与岗位结构的影响 - 截至2025年初,高级和管理级科技职位的招聘数量较疫情前水平下降19%,普通及初级科技职位的降幅则高达34% [5] - 2022年第二季度至2025年第二季度间,要求至少5年工作经验的科技职位占比从37%上升至42%,而需要2-4年经验的岗位比例相应减少 [5] - 亚马逊云服务(AWS)首席执行官批评用新技术取代初级员工是糟糕的商业决策,将错失创新思路并终将自食其果 [5] 长期视角:AI与工作量的“杰文斯悖论” - 技术进步(如AI)提高了效率,但根据“杰文斯悖论”,可能引发对资源(此处指工作)需求的显著增加,最终使工作量不减反增 [6] - 硅谷的工作文化显示工作量在增加而非减少,表明工作是一个不断膨胀、无限扩张的生态系统,而非有限的泡沫 [6] - 历史经验表明,新技术的开发从未真正减少工作量,反而往往带来更多工作 [6]
推理成本打到1元/每百万token,浪潮信息撬动Agent规模化的“最后一公里”
量子位· 2025-12-26 12:24
行业核心趋势 - 全球AI产业已从模型性能竞赛进入智能体规模化落地的“生死竞速”阶段,“降本”成为决定AI企业能否盈利、行业能否突破的核心命脉 [1] - 当前AI时代处于临界点,token成本下降是推动应用生态爆发的关键,类似互联网“提速降费”的历史进程 [7] - 技术进步促使token单价下滑,但单任务对token的需求呈指数级增长,若成本下降速度跟不上消耗增长,将面临更高费用投入,经济学中的“杰文斯悖论”正在token经济中重演 [8] - 要让AI真正成为“水电煤”般的基础资源并进入规模化普惠阶段,token成本必须在现有基础上实现数量级的跨越,成本能力将从“核心竞争力”升级为“生存入场券” [4][5][11] 成本挑战与瓶颈 - 现阶段token成本80%以上来自算力支出,阻碍成本下降的核心矛盾在于推理负载与训练负载不同,沿用旧架构导致“高配低效” [12] - 核心瓶颈之一是算力利用率(MFU)严重倒挂:训练阶段MFU可达50%以上,而推理阶段由于自回归解码特性,实际MFU往往仅为5%-10%,造成巨大算力闲置 [14] - 核心瓶颈之二是“存储墙”问题:随着上下文长度增加,KV Cache呈指数级增长,占用大量显存并导致高功耗,存算分离成为阻碍成本下降的重要瓶颈 [15][16] - 核心瓶颈之三是网络通信代价高昂:当模型规模突破单机承载能力时,跨节点通信可能占据总推理时间的30%以上,推高了总拥有成本(TCO) [17] 市场需求与规模 - 字节跳动旗下豆包大模型截至今年12月日均token使用量突破50万亿,较去年同期增长超过10倍,相比2024年5月刚推出时增长达417倍 [13] - 谷歌在10月披露其各平台每月处理的token用量已达1300万亿(相当于日均43.3万亿),而一年前月均仅为9.7万亿 [13] - 当使用量达到“百万亿token/月”量级时,每百万token成本仅下降1美元,就可能带来每月1亿美元的成本差异 [10] - 当前主流大模型的token成本依然高昂,以输出百万token为例,Claude、Grok等模型价格普遍在10-15美元,国内大模型也多在10元以上,高昂成本让大规模商业化应用面临严峻ROI挑战 [19][20] 解决方案与技术创新 - 降低token成本的核心不是“把一台机器做得更全”,而是围绕目标重构系统,将推理流程拆细,支持P/D分离、A/F分离、KV并行、细粒度专家拆分等计算策略,让不同计算模块在不同卡上按需配置并发,提升每张卡的负载和产出 [18] - 浪潮信息推出元脑HC1000超扩展AI服务器,基于全新设计的全对称DirectCom极速架构,采用无损超扩展设计,可高效聚合海量本土AI芯片,支持极大推理吞吐量,将推理成本首次击穿至1元/每百万token [2][23] - 元脑HC1000的DirectCom极速架构每计算模组配置16颗AIPU,采用直达通信设计,解决传统架构的协议转换和带宽争抢问题,实现超低延迟,计算通信1:1均衡配比,实现全局无阻塞通信 [25] - 该架构支持超大规模无损扩展,通过算网深度协同、全域无损技术实现推理性能1.75倍提升,通过对大模型计算流程细分和模型结构解耦,实现计算负载灵活按需配比,单卡MFU最高可提升5.7倍 [27] - 通过自适应路由和智能拥塞控制算法,提供数据包级动态负载均衡,将KV Cache传输对Prefill、Decode计算实例影响降低5-10倍 [29] 未来发展方向 - 当前1元/每百万token的成本突破仅是阶段性胜利,面对未来token消耗量指数级增长、复杂任务token需求激增数十倍的趋势,现有成本水平仍难支撑AI的普惠落地 [4] - 若要实现单token成本的持续、数量级下降,需要推动计算架构的根本性革新,要求整个AI产业的产品技术创新从当前的规模导向转为效率导向 [29] - 未来需从根本上重新思考和设计AI计算系统,发展AI专用计算架构,探索开发大模型芯片,推动算法硬件化的专用计算架构创新,实现软硬件深度优化 [29]
浪潮信息刘军:AI产业不降本难盈利,1元钱/每百万Token的成本还远远不够!
环球网资讯· 2025-12-25 14:30
行业背景与核心挑战 - 全球AI产业已从模型性能竞赛进入智能体规模化落地的关键阶段,“降本”成为决定企业盈利与行业突破的核心命脉[1] - 当前AI推理成本依然高昂,主流大模型如Claude、Grok输出百万token价格在10-15美元,国内模型也多在10元以上,高昂成本使大规模商业化面临严峻ROI挑战[10] - 未来token消耗量将呈指数级增长,复杂任务需求可能激增数十倍,若成本下降速度跟不上消耗增长,企业将面临更高费用投入,经济学中的“杰文斯悖论”正在token经济中重演[1][3] - 来自行业的数据佐证了token消耗的激增趋势:字节跳动豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍,较2024年5月推出时增长达417倍;谷歌各平台每月处理token用量达1300万亿(日均43.3万亿),而一年前月均仅为9.7万亿[4] - 当使用量达到“百万亿token/月”量级时,每百万token成本仅下降1美元,就可能带来每月1亿美元的成本差异,token成本直接决定了智能体的盈利能力[7] 成本高企的结构性瓶颈 - 现阶段token成本80%以上来自算力支出,阻碍成本下降的核心矛盾在于推理负载与训练负载不同,沿用旧架构导致“高配低效”[7] - 瓶颈一:算力利用率严重倒挂,训练阶段MFU可达50%以上,而推理阶段因自回归解码特性,GPU大部分时间在等待数据搬运,实际MFU仅为5%-10%,造成巨大算力闲置[8] - 瓶颈二:“存储墙”瓶颈在推理场景下被放大,随着上下文长度增加,KV Cache呈指数级增长,占用大量显存并导致高功耗,存算分离及对昂贵HBM的依赖成为成本下降障碍[8] - 瓶颈三:网络通信与横向扩展代价高昂,当模型规模突破单机承载能力时,跨节点通信可能占据总推理时间的30%以上,企业被迫堆砌更多资源以维持响应速度,推高总拥有成本[8] 解决方案与架构革新方向 - 降低token成本的核心不是“把一台机器做得更全”,而是围绕目标重构系统,将推理流程拆细,支持P/D分离、A/F分离、KV并行、细粒度专家拆分等策略,让不同计算模块在不同卡上按需配置并发,打满每张卡负载,降低“卡时成本”,提高“卡时产出”[9] - 需要推动计算架构的根本性革新,将AI产业的产品技术创新从规模导向转为效率导向,从根本上重新思考和设计AI计算系统,发展AI专用计算架构,探索开发大模型芯片,推动算法硬件化的专用计算架构创新,实现软硬件深度优化[16] 浪潮信息元脑HC1000产品突破 - 浪潮信息推出元脑HC1000超扩展AI服务器,基于全新设计的全对称DirectCom极速架构,采用无损超扩展设计,可高效聚合海量本土AI芯片,支持极大推理吞吐量,将推理成本首次击穿至1元/每百万token[1][12] - 该产品创新设计DirectCom极速架构,每计算模组配置16颗AIPU,采用直达通信设计,解决传统架构的协议转换和带宽争抢问题,实现超低延迟;计算通信1:1均衡配比,实现全局无阻塞通信;全对称系统拓扑支持灵活的PD分离、AF分离方案,按需配置计算实例,最大化资源利用率[14] - 产品支持超大规模无损扩展,通过算网深度协同、全域无损技术实现推理性能1.75倍提升,并通过计算流程细分和模型结构解耦实现计算负载灵活按需配比,单卡MFU最高可提升5.7倍[16] - 产品通过自适应路由和智能拥塞控制算法,提供数据包级动态负载均衡,实现KV Cache传输和All to All通信流量的智能调度,将KV Cache传输对Prefill、Decode计算实例影响降低5-10倍[16] 未来展望与行业意义 - 当前1元/每百万token的成本突破仅是阶段性胜利,面对未来token消耗的指数级增长,现有成本水平仍难支撑AI的普惠落地[1] - 要让AI真正成为如同“水电煤”般的基础资源并进入规模化普惠阶段,token成本必须在现有基础上实现数量级的跨越[1][7] - 成本能力将从“核心竞争力”进一步升级为“生存入场券”,直接决定AI企业在智能体时代的生死存亡[1] - 此次成本突破有望打通智能体产业化落地“最后一公里”的成本障碍,并将重塑AI产业竞争的底层逻辑[1]
施罗德基金资产配置观点
21世纪经济报道· 2025-12-16 17:08
全球宏观经济与资产配置展望 - 预计2025-2027年全球GDP增速将高于市场一致预期,经济深度衰退概率低 [1] - 美国零售与就业数据稳健,消费动能仍在 [1] - 对久期债券相对谨慎,对信用债保持中性,继续看好全球股票 [1] - 美元长期看空,黄金仍看好 [1] - 中国资产处于外资低配状态,估值吸引力上升,若情绪趋稳存在回补空间 [1] - 投资者可考虑减配美国资产、增配欧洲和亚洲资产,中国台湾和韩国也有结构性机会 [1] 债券市场分析 - 预计今年十年期国债收益率在1.65%-1.90%区间波动,市场以看多和中性观点为主 [2] - 央行下场买债,地产与基建实物量持续低于预期,社融信贷同步走弱,货币宽松未转向,为债市提供下行保护 [2] - 银行理财规模突破32万亿元,固收类理财偏好信用票息 [2] - 二级债基热销,ETF持续吸金,但主动债基赎回明显 [2] - 城投债继续净偿还,10月净偿还524亿元,信用利差低于历史中位 [3] - 理财规模突破32万亿元,年底摊余成本法产品到期再配置,对信用债需求形成支撑 [3] - 利率债波动大,信用债收益更稳 [3] 财政、地产与税收状况 - 地产基建数据持续下行,基建实物量远落后往年,地产投资加速下行 [3] - 一线城市二手房挂牌量激增,30城成交仍处低位,居民房贷负增长 [3] - 前10月地产相关税收仍呈双位数下滑,10月财政支出明显放缓,土地基金收入同比减少 [3] - 全年广义财政缺口约8.3万亿元,明年需扩大赤字弥补 [3] - 个人所得税因高收入行业累进效应超预期增长,消费税仅增长2%,企业税由-3%回升至+2%,显示消费弱、企业利润边际修复 [3] 周期品行业(股票) - 贵金属韧性足,黄金中长期逻辑未变 [4] - 继续看好工业金属铜、铝,预计铜矿2026年或零增长,储能与数据中心带来增量缺口,铝海外新增产能低于预期,短期缺口仍在 [4] - 碳酸锂因储能需求爆发而价格飙升,供需增速均较快 [4] - 化工“反内卷”品种(纯碱、己内酰胺、PTA、有机硅)行业会议落实减产10%-30%,亏损面收窄,价格底部反弹 [4] - 电芯链六氟磷酸锂、磷酸铁、VC涨价,上游磷矿石资源约束,磷肥、铁锂需求双升,具备持续弹性 [4] - 投资者整体配置或可倾向于供给有瓶颈的矿端,自律减产或需求有催化的化工品 [4] 制造业(股票) - 工业板块核心变化集中在锂电材料涨价 [5] - 光伏11月排产与价格均持平,产能收储政策落地慢,股价上涨主要靠主题与情绪 [5] - 锂电需求端储能爆发拉动辅材价格普涨,但主材电芯涨幅有限 [5] - 上游碳酸锂现货价格约9万元/吨,期货价格突破10万元/吨,涨价由需求驱动,预计通胀中枢将继续上移 [5] - 制造业中游(挖机、自动化)10月订单不佳,仅出口链保持韧性 [5] - 汽车批发数据增长6-7%,出口贡献为主,内销略增,零售下滑 [5] - 明年汽车补贴退坡与购置税回升将压制增速,但仍有望正增长 [5] - 估值层面,光伏、锂电已修复至中枢偏上,短期交易拥挤;车链主机厂估值低,机器人概念回调后回到中枢区间 [5] - 机构11月明显减配汽车,增配新能源,储能、锂电、风电、光伏成为除科技外加仓最迅速的板块 [5] 消费行业(股票) - 高端消费强于大众品,出行与宠物维持高景气 [6] - 出行链价格修复:航空、酒店同比转正,贡献来自休闲需求而非商务 [6] - 耐克加单反馈欧美库存回归正常,代工订单回暖 [6] - 白酒批价在双11扰动后企稳,某头部品牌价格小幅回升 [6] - 城镇居民可支配收入/茅台瓶数比值已回到2014年底部区间,机构超配比例接近历史最低,板块最悲观阶段或已过去 [6] - 化妆品国货品牌弱于进口,部分品牌高端线恢复明显,体现K型分化 [6] - 生猪价格跌破所有企业完全成本,能繁母猪存栏见顶回落,仔猪价格低迷预示去产能开始 [6] - 预计2026上半年猪价仍弱,下半年有望回升 [6] - 东鹏、农夫增速维持高位,速冻板块受益餐饮修复,部分头部品牌10月增速改善 [6][7] - 家电受制于高基数、消费券难抢,量价均承压;扫地机行业降价促销侵蚀利润 [7] - 宠物食品双11线上增速超过50%,头部公司增速仍快于行业 [7] 科技行业(股票) - 仍然看好科技,AI主线仍处“杰文斯悖论”驱动的算力迭代周期 [8] - 芯片算力每年提升会创造新需求和商业模式,若芯片算力每年以5-10倍迭代,短期静态现金流质疑并不构成趋势拐点 [8] - 海外云厂商资本开支高增与在手订单匹配,收入确认滞后,短期高投入属正常节奏 [8] - 海外谷歌、OpenAI等模型调用量仍在扩张,国内AI企业紧跟,AI搜索替代传统链接已见增量 [8] - 半导体设备2025年市场规模有望翻倍,叠加存储涨价,设备厂商扩张加速确定 [8] - AI应用端仍在成本投入期,下游公司现金流被购买算力卡挤压,爆发需等待芯片成本曲线下降 [8] - 手机等非AI终端需求平淡,明年承压 [8] - 电子、通信基金持仓处于历史高位,短期交易拥挤带来波动 [8]