Token经济
搜索文档
传媒行业周报系列2026年第12周:日均词元调用破140万亿,Sora退场OPC崛起
华西证券· 2026-03-30 18:30
报告行业投资评级 - 行业评级:推荐 [4] 报告核心观点 - **AI产业进入新阶段**:截至2025年3月,中国日均“词元”(Token)调用量已超过140万亿,相比2024年初的1000亿增长了逾1000倍,标志着中国AI产业正从“模型能力验证期”进入“算力消费规模化期” [2][22] - **词元成为数字经济新“电力单位”**:大模型已嵌入企业生产与个人日常场景,词元正在成为中国数字经济的新型“电力计量单位” [2][22] - **云计算商业模式重构**:中长期来看,词元经济的成熟将重构云计算商业模式——从“卖服务器”转向“卖算力消耗”,具备推理成本优势和垂直场景渗透能力的基础设施服务商将掌握新一轮定价权 [2][22] - **AI视频产业的中美路径分野**:OpenAI关停视频生成工具Sora(上线仅6个月),揭示了AI视频产业技术炫技与商业闭环之间的核心矛盾 [3][23] - **中国“OPC模式”崛起**:国内AI短片《霍去病》由3人团队、4天制作、获得百万播放量,同时2025年上半年新注册“一人公司”(OPC)同比激增47%,展现出以极低边际成本、极快交付周期和垂直场景深耕构建可持续现金流的中国路线 [3][23] - **下一代内容产业形态**:谁能将AI工具无缝嵌入内容生产、分发、变现全链条,谁就能定义下一代内容产业的组织形态,“OPC模式”的成熟将直接利好AI视频工具SaaS、算力租赁平台,以及具备IP储备和分发渠道的短剧平台 [3][23] 市场行情回顾 - **主要指数表现**:2026年第13周(2026.3.23-3.27),上证指数下跌1.09%,沪深300指数下跌1.41%,创业板指数下跌1.68% [1][11] - **港股指数表现**:恒生指数下跌1.29%,恒生互联网指数下跌2.42% [1][11] - **行业指数表现**:SW传媒指数下跌1.41%,跑赢创业板指数0.27个百分点,在申万一级31个行业中涨跌幅排名第20位 [11] - **子行业表现**:子行业中体育、游戏和广告营销位列前三位,涨跌幅分别为上涨3.54%、下跌0.42%和下跌0.91% [11][13] - **个股表现**:本周传媒行业个股涨幅前5为ST明诚(21.39%)、勤上股份(17.24%)、中南文化(13.27%)、粤传媒(8.77%)和琏升科技(8.63%) [14][15] - **港股互联网企业表现**:港股传媒互联网企业中,美团-W上涨8.53%,京东集团-SW上涨4.70%,阿里巴巴-W下跌0.89%,腾讯控股下跌2.87%,网易-S下跌5.10% [18][19][20] 投资建议与受益标的 - **关注港股互联网龙头**:促消费稳就业,凸显社会价值 [6][24] - **关注游戏行业**:政策激励提振内需,科技赋能强化产品竞争力,出海布局增长空间广阔 [6][24] - **关注电影及文旅产业**:消费政策促进院线复苏,刺激改善型消费需求释放 [6][24] - **受益标的**:包括腾讯、阿里、捷成股份、锋尚文化、名臣健康、大丰实业、奥拓电子、风语筑 [6][24] 子行业数据总结 - **电影行业**:本周票房冠军为《挽救计划》,票房6436.7万元,票房占比29.1%;《河狸变身计划》排名第二,票房3736.1万元,占比16.9%;《飞驰人生3》排名第三,票房2754.1万元,占比13.9% [25][26] - **游戏行业**: - iOS游戏畅销榜前三为《和平精英》、《洛克王国:世界》、《王者荣耀》 [27][28] - 安卓游戏热玩榜前三为《心动小镇》、《潜水员戴夫》、《鹅鸭杀》 [27][28] - **影视剧集行业**:播映指数前三名为《逐玉》(指数82.1)、《隐身的名字》(指数78.2)、《你是迟来的欢喜》(指数77.8) [29][30] - **综艺行业**:播映指数前三名为《魔力歌先生》(指数74.2)、《周五晚高疯》(指数68.9)、《最强大脑第十三季》(指数64.7) [31][32] - **动漫行业**:播放量指数前三名为《沧元图》(指数244.8)、《完美世界动漫》(指数159.3)、《开心锤锤》(指数158.6) [32][33]
“Token第一股”迅策上市后首份财报:2025年营收增103%并实现半年度盈利
IPO早知道· 2026-03-27 20:23
Token经济浪潮中的稀缺标的。 本文为IPO早知道原创 作者| Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,深圳迅策科技股份有限公司(以下简称"迅策科技",3317.HK)于3月27日发布 了截至2025年12月31日至全年业绩公告,这也是其2025年12月30日成为"Token第一股"以来发 布的首份财报。 财报显示, 迅策科技202 5年营收12 .85亿元(人民币,下同),较2024年大幅增长103.28%, 成功跨越"十亿营收"这一关键门槛,标志着其已从早期技术驱动的初创阶段正式迈入可规模化复制 的平台化发展新纪元。值得注意的是,迅策科技在2025年上半年实现营收1.98亿元,下半年营收跃 升至10.87亿元,环比激增449.32%,展现出强劲增长动能。 在盈利能力方面。2025年迅策科技综合毛利约为7.92亿元,同比大幅增加63.44%,综合毛利率达 61.66%。同时,2025年迅策科技经调整净亏损同比大幅收窄33.41%至0.54亿元。亏损收窄的背 后,是业务快速发展带来的规模效应逐步显现,人力资源效能大幅提升,经营质量持续优化的有力印 证。 需要指出的一点是 ...
黄仁勋深度访谈:“Token经济”爆发,AI计算占GDP比重将翻百倍,英伟达10万亿是必然
硬AI· 2026-03-25 23:18
计算本质与角色的根本性转变 - 计算本质从“存储系统”跃迁为具备上下文感知能力的“生成系统”[6] - 计算机在经济中的角色从“仓库”转变为“工厂”,从成本中心变为利润中心[6][8] - AI代工厂生产名为“Token”的商品,该商品已被细分和定价,例如有人愿意为每百万Token支付1000美元[7] 宏观经济与公司市值展望 - 生产力大幅提升将加速全球GDP增长,未来用于计算的GDP占比将是过去的100倍[9] - 公司迈向10万亿美元市值是极大概率事件,未来实现3万亿美元营收的体量并非不可能[10] 电力瓶颈与数据中心解决方案 - 电力是AI扩张的担忧之一,解决方案包括提升能效和获取更多电力[13] - 关键能效指标是“每瓦每秒token数”,通过“极致协同设计”每年可将token成本下降一个数量级[13] - 电网99%的时间未达到峰值负荷,存在大量闲置冗余电力[13] - 提议构建“优雅降级”的数据中心,在电网要求时降低计算速率或转移关键负载,以利用闲置电力[14] 供应链与内存战略 - 公司深刻改变基础设施制造模式,单个Vera Rubin机架包含约130万到150万个组件,汇聚200家供应商[16] - 将数据中心的“超算组装”前置到供应链的“超算制造”环节,机架以整机(重两三吨)发货[16] - 约三年前成功说服内存大厂CEO投资扩产HBM,使其成为未来数据中心主流内存[16] - 推动供应商将手机低功耗内存(LPDDR)改造并引入超算领域[17] AI缩放定律与算力需求 - AI扩张遵循四条“扩展规律”:预训练、后训练、测试时扩展、代理式扩展[19] - 训练不再受数据限制,数据将受限于算力,未来将大量使用合成数据[20] - 推理(即思考)是算力密集型的,包含推理、规划、搜索等,将推动推理算力需求上升[20] - 代理式扩展意味着AI可以快速衍生子智能体,组建庞大团队[72] 公司护城河与工程哲学 - 公司最深的护城河是CUDA庞大的装机量与信任生态,由43000名员工共同推动[22] - 公司管理采用“极限协同设计”哲学,管理团队庞大(直接汇报者约60人),跨学科专家共同攻克问题[36][37][43] - 工程哲学以“光速”为框架,从第一性原理出发,将一切逼近物理极限进行设计[119][120] - 追求“像必要时那样复杂,但又要尽可能简单”的设计原则[129] 对AI行业与劳动力的影响 - 善用AI将成为各行业(会计师、律师、销售、供应链经理、药剂师、电工、木匠等)的基本要求,能交付更高价值[25] - 全球“程序员”群体可能从3000万激增至10亿人,编程的定义将扩展为“描述规范让计算机去构建”[26] - 若将AGI定义为能自主开发应用并盈利的系统,那么AGI“已经实现”[26] 行业洞察与前沿探索 - 公司GPU已进入太空,但目前主要用于卫星图像的边缘端筛选,大规模太空数据中心面临辐射散热等物理痛点[22] - 高度评价马斯克的第一性原理思维与极简主义,其亲临现场和强烈紧迫感能推动项目高速完成(如xAI的Colossus超算)[23][114] - 中国是全球创新最快的国家之一,约50%的AI研究人员是华人,其内部激烈竞争和开源文化加速了创新[134]
GTC 2026|黄仁勋五层蛋糕重构AI价值体系,投资逻辑全解析 | 市场观察
私募排排网· 2026-03-25 17:49
AI五层蛋糕理论框架 - 核心观点:AI产业的繁荣是一个由五层环环相扣、相互强化的生态系统构成,从底层物理基础到顶层价值落地,任何一层的短板都可能成为整个产业的增长瓶颈[6] - 第一层:能源层是AI的第一性原理和物理根基,智能的本质是能源的转化,AI是“电力巨兽”,其能源供给效率与成本直接决定了智能的规模与落地边界[7] - 第二层:芯片层是算力转化的核心引擎,其性能、能效比与扩展性直接决定了AI的扩展速度与智能成本[8] - 第三层:基础设施层是AI工厂,作为算力集群的物理载体,承载从训练到推理的全流程算力调度,是人类历史上最大规模的基础设施建设之一[9] - 第四层:模型层是AI的大脑,是将算力转化为智能能力的核心载体,决定了AI的决策精度与场景适配性,正从语言模型向理解物理世界的AI跨越[10] - 第五层:应用层是价值最终出口和产业落地战场,是AI创造可衡量经济价值的终极界面,也是规模最大的环节[11] 能源层:AI的物理根基与电力需求 - 核心作用:作为五层蛋糕的最底层,是AI的物理根基,其下没有抽象层,直接支撑所有上层活动[7] - 需求规模:随着推理场景与智能体应用普及,Token消耗呈指数级增长,AI电力需求远超传统计算场景,预计2030年全球数据中心电力消耗将翻倍至945太瓦时,略高于日本全年总用电量[7] - 投资方向:能源缺口成为制约AI扩张的核心痛点,绿色能源转型、电网升级、储能技术突破成为刚需,绿电运营商、电网设备、储能系统成为AI基础设施建设的配套核心[7] 芯片层:算力转化核心与硬件竞赛 - 核心作用:是将能源高效转化为计算力的核心载体,其性能直接决定了AI的扩展速度与智能成本[8] - 技术进展:英伟达发布Vera Rubin AI工厂平台、Groq 3 LPU芯片,并披露下一代Feynman架构GPU研发进展,采用1.6nm A16工艺、硅光子光互连,推理性能将达Blackwell的5倍,单GPU算力达50 PFLOPS[8] - 产业格局:GPU、LPU、DPU、光模块、存储芯片成为全球科技巨头军备竞赛核心领域,英伟达通过“芯片+平台”全栈布局巩固算力硬件龙头地位,目标到2027年实现1万亿美元营收[8] 基础设施层:AI工厂与算力载体建设 - 核心定义:不同于传统数据中心,AI工厂是集成芯片、网络、冷却、土地的超级算力载体,承载全流程算力调度[9] - 建设规模:全球正大规模兴建芯片制造厂、超级计算机工厂及AI工厂,这是人类历史上最大规模的基础设施建设,且进程才刚刚起步[9] - 关键技术:光互联与硅光子是突破算力瓶颈的关键,液冷技术解决高密度算力集群散热难题,太空数据中心模块拓展了算力的应用场景边界[9] 模型层:智能核心与演进方向 - 核心作用:是将算力转化为智能能力的核心载体,决定了AI的决策精度与场景适配性[10] - 演进方向:AI正从语言模型向物理AI跨越,深入理解生物学、化学、物理规律,开源模型成为激活整个架构栈需求的关键杠杆[10] - 产业格局:呈现“开源与闭源并行、通用与垂直共生”格局,通用大模型构建基础智能能力,垂直领域模型深耕行业场景,成为连接底层算力与上层应用的核心桥梁[10] 应用层:价值落地与产业爆发 - 核心地位:是AI创造可衡量经济价值的终极界面,是五层蛋糕中离市场最近、规模最大的环节[11] - 范式转变:未来几年传统软件与APP形态或将逐渐式微,AI Agent(智能体)将成为主流范式,AI从“回答问题”进化为“自主执行复杂任务”[11] - 落地场景:正迎来爆发拐点,具身智能(自动驾驶、人形机器人)、行业AI(医疗、金融、工业)、企业服务、消费应用等场景全面开花,每个落地场景的繁荣都将反向拉动底层需求[11] AI产业核心投资逻辑 - 底层优先,层层传导:AI产业进入工业化建设期,能源、芯片、基础设施等重资产、高壁垒环节先行爆发,业绩确定性更高;上层模型与应用弹性更大,但需依托底层支撑[14] - Token经济驱动:推理与执行场景带来Token消耗指数级增长,“每Token成本”成为核心竞争指标,全栈效率优化环节(如芯片、光互联、液冷)将持续受益[14] - 重资产基建化:AI工厂、数据中心、芯片厂等基础设施建设是当前全球资本开支的核心方向,相当于新一轮“基建潮”,具备长期刚需属性[14] - 正循环共振:形成“应用→模型→基建→芯片→能源”的强正循环,各环节相互赋能,上层应用繁荣反向拉动底层算力、芯片与能源需求[14] 分层投资策略与主题基金 - 能源层投资逻辑:AI算力爆发催生“电力+电网”双重需求,绿电、电网设备、储能为核心受益方向,具备长期刚需与政策支持双重红利[16] - 芯片层投资逻辑:GPU、LPU、光模块、先进封装为算力军备竞赛核心,国产替代与技术迭代双轮驱动,业绩增长确定性强[18] - 基础设施层投资逻辑:全球AI工厂大规模兴建,数据中心、液冷、光互联、AI集群为核心赛道,资本开支持续投放,业绩兑现节奏快[20] - 模型层投资逻辑:通用大模型、开源生态、垂直模型具备高成长弹性,但竞争激烈,可优先布局技术领先、场景落地能力强的标的[22] - 应用层投资逻辑:具身智能、行业AI、消费应用等场景加速落地,商业化效率决定业绩弹性,优先布局壁垒高、盈利确定性较强的垂直领域[24] AI产业阶段与展望 - 当前阶段:AI产业处于工业化建设初期,正从“训练狂热”转向“推理爆发”,驱动全产业链价值传导[26] - 长期空间:长期成长空间明确,五层架构环环相扣、协同赋能,随着技术成熟与商业化推进,AI有望深度融入各领域,催生海量投资机遇[26] - 价值分布:底层的能源、芯片、基础设施释放长期价值,上层模型与应用加速落地[26]
早报|张雪峰因心源性猝死抢救无效去世;Token中文名定了:词元;汽车之家多个平台账号被禁止关注;OpenClaw升级现严重事故
虎嗅APP· 2026-03-25 08:32
AI行业与科技动态 - OpenAI完成了新AI模型的初步开发 公司联合创始人Sam Altman将不再直接负责OpenAI安全团队 其工作重点将转向数据中心建设、募资和供应链[4] - 苹果公司正在测试一款独立的Siri语音助手应用程序以及一项可在其各类软件中运行的“Ask Siri”新功能 这是其更广泛人工智能重大升级的一部分 新版Siri计划作为iOS 27和macOS 27操作系统的一部分 于6月8日在苹果全球开发者大会(WWDC)上发布[7] - 开源AI智能体OpenClaw在一场史上最大版本的更新后出现严重事故 因激进、无兼容层的破坏性重构导致大量用户反馈插件瘫痪、功能失效 例如微信、飞书等通讯插件无法加载 浏览器扩展Relay功能因路径移除而失效 MiniMax等国产模型配置异常[16][17] - 英伟达CEO黄仁勋提出“Token经济”概念 认为AI计算占GDP比重将翻百倍 他指出AI代工厂正在制造名为“Token”的商品 且这种商品已经被细分和定价 有人愿意为每一百万个Token支付1000美元 基于“Token工厂”模式 计算设备完成了从成本中心向利润中心的跨越[32] Token(词元)与AI商业模式 - 国家数据局局长刘烈宏在中国发展高层论坛2026年年会上为Token给出官方中文翻译“词元” 并指出Token是智能时代的价值锚点 是连接技术供给与商业需求的“结算单位”[8][9] - 中国日均Token调用量从2024年年初的1000亿 跃升至2025年底的100万亿 到2026年3月已突破140万亿 两年增长超千倍 今年1月底以来 有的模型企业创下20天收入超越2025年全年总收入的业绩纪录[9] - 这组数字背后 是一套以Token计费为基础的新型商业逻辑正在加速演进[10] 消费电子与硬件行业 - 小米集团负责人卢伟冰在业绩会上表示 这一轮内存上涨的速度、力度比公司原来想象得要高 对小米经营是一个很大挑战 内存成本占产品整体比例越低 对产品影响越小 同时手机越高端影响也会越小 随着小米高端化战略推进 可以比友商应对得更好 如果未来挺不住了 不排除小米也会涨价的可能[24] - 卢伟冰判断 内存涨价会加剧产业格局的重塑 一方面有些公司甚至会被淘汰 另一方面也会倒逼公司更多创新[24] 互联网与平台公司 - 汽车之家多个社交平台账号被禁止关注 其微博账号因违反相关法规被禁 拥有979万粉丝 抖音账号有651万粉丝 B站及快手账号也显示“禁止关注”或“账号异常” 今年1月 汽车之家曾因不规范测评被中央网信办点名批评 涉及误导公众认知[11] - 美团就安卓用户反映的图片和视频被异常删除问题致歉 该问题主要是安卓系统在极少数情况下 APP自动缓存清理时遇到第三方SDK冲突导致异常 累计有180多位用户进线客服咨询 预计潜在波及用户范围约在数百人 美团已成立专项技术支持小组协助受影响用户找回数据 并承担全部费用和赔偿相应损失[18][19] 美妆与消费品行业 - 市场传闻美国美妆巨头雅诗兰黛集团拟与西班牙美妆公司PUIG合并 雅诗兰黛集团回应称相关合并事宜“确实在讨论中” 但尚未达成任何协议[20] - 雅诗兰黛集团2025财年营收为143.26亿美元 当前市值约287亿美元[21] - PUIG旗下有香水品牌Byredo、潘海利根等 还掌握有Charlotte Tilbury等彩妆品牌和部分时尚品牌的香水业务 其在2025年营收首次突破50亿欧元 市场估值在100亿美元上下[22] 宏观经济与金融 - 2026中关村论坛年会在北京开幕 主题为“科技创新与产业创新深度融合” 将举办60余场平行论坛 发布《2025全球工程前沿》等重大成果[28][29] - 中国人民银行开展5000亿元1年期中期借贷便利操作 以保持银行体系流动性充裕 稳定市场预期[30] - 中国人民银行在香港发行600亿元中央银行票据 期限6个月 以丰富香港高信用等级人民币金融产品[31]
“烧Token”成KPI,有程序员一个月花掉15w
创业邦· 2026-03-25 08:10
Token消耗成为企业组织行为新信号 - 硅谷流行“Tokenmaxxing”概念,Meta和OpenAI内部工程师在AI使用排行榜上竞争,有工程师一周消耗2100亿个Token,相当于33个维基百科的文本量,有人每月AI账单高达15万美元 [6] - 企业将Token消耗与员工福利和绩效挂钩,例如爱立信工程师的公司账单超过其工资,Shopify CEO要求团队在申请新人力前需证明AI无法完成工作,并将AI使用纳入绩效考核,Meta宣布从2026年起将“AI驱动的影响力”纳入所有员工绩效评估 [6] Token被产业界提升为战略核心 - 英伟达CEO黄仁勋在GTC大会上将Token定义为“AI时代的基石”和“最值钱的大宗商品” [7] - 阿里巴巴宣布成立由CEO直接负责的“Alibaba Token Hub”事业群,定位为“创造Token、输送Token、应用Token” [7] - Token从技术计量单位转变为定义产品价值、重组事业群、员工福利和核心KPI的关键要素 [9] Token定价体系复杂化,成本结构发生根本变化 - 大模型定价从简单的输入/输出Token分层,以Anthropic Claude Opus 4.6为例,标准输入为每百万Token 5美元,输出为25美元,但启用Prompt Caching、Batch API、指定区域推理或Fast Mode等条件会导致价格出现数倍至十余倍差异 [13] - 模型调用之外的附加功能成为独立成本中心,例如OpenAI对Web Search、File Search、代码容器(Container)等单独计费,File Search为每千次调用2.50美元,向量存储每GB每天0.10美元 [13][14] - Google Vertex AI也对Agent Engine中的代码执行、会话和记忆库等按vCPU小时和GiB内存小时分别计价 [15] - 大模型厂商销售的是包含运行、存储、搜索、调用工具和持续执行的一整套AI基础能力 [15] Token单价下降与总成本上升并存,存在多重驱动机制 - 模型API单价大幅下降,例如Anthropic Opus从上一代15美元/百万Token降至5美元,降幅三分之二,DeepSeek V3.2低至0.28美元/百万Token,Google Gemini 2.5 Flash Lite约0.10美元/百万Token [18] - 中国模型价格优势明显,单价约为海外竞品的六分之一到十分之一,腾讯云混元HY2.0 Instruct涨价超过460%后折合约0.62美元/百万Token,仍低于Anthropic最便宜的模型 [18] - 总使用成本未降源于三个机制:1) 模型更智能但输出更长,推理模型平均输出Token使用量是非推理模型的5.5倍 [20];2) AI智能体(Agent)导致持续消耗,单个Agent算力消耗是传统Chatbot的100到1000倍,中国整体日均Token消耗从2025年中的30万亿跃升至2026年2月的180万亿级别 [20];3) 底层算力成本上涨,2026年3月阿里云和百度智能云AI算力与存储产品价格最高上调34%,AWS机器学习容量块提价约15% [20] 行业面临Token投入与产出衡量的核心缺陷 - 当前Token消耗量(如一周2100亿Token)只衡量投入,不衡量产出质量和任务完成有效性,这是Token经济的最大盲区 [9][23] - 企业将Token消耗纳入KPI可能引发“生产力表演”,而非真实生产力跃升,行业缺乏从Token消耗到任务完成的有效度量标准 [23] - 产生新型职业焦虑,高昂的Token消耗成为展示AI生产力的信号,但真实价值衡量被推迟,这与过去企业争相建网站、做App的逻辑类似 [23] - 高成本使“烧Token”与“用Token创造价值”的区别从哲学问题变为财务问题,未来的商业机会与成本陷阱在于高效地将Token转化为任务完成率 [24]
「烧Token」成KPI,有程序员一个月花掉15w
36氪· 2026-03-24 23:39
文章核心观点 - Token已从技术计量单位演变为AI时代的关键生产要素和商业价值度量衡 其消耗量正成为企业组织行为与工程师绩效的新信号 但行业存在一个核心盲区:当前对Token的度量仅关注投入(消耗量)而非产出(任务完成效率与价值) 这导致了Token单价下降与总成本上升并存的局面 以及潜在的“生产力表演”和成本陷阱 [6][8][9][10][26][29][30][32] Token消耗成为组织与个人新指标 - 硅谷科技公司内部兴起“Tokenmaxxing”现象 工程师在AI使用排行榜上竞争 例如有工程师一周消耗2100亿个Token 相当于33个维基百科的文本量 个人月度AI账单可高达15万美元 [4] - Token预算正成为一种新型工程师工作福利 如同过去的免费零食或午餐 公司为员工的高额AI使用账单买单 [4] - 企业将AI使用深度融入管理和考核 Shopify CEO在2025年4月要求团队在申请新增人力前需证明AI无法完成该项工作 并将AI使用纳入绩效考核 Meta则从2026年起将“AI驱动的影响力”纳入所有员工绩效评估 [5] - Token消耗量开始出现在KPI中 成为一种组织行为信号 [6] Token的战略地位与产业影响 - 英伟达CEO黄仁勋在GTC大会上将Token定义为“AI时代的基石” 并称其将成为“最值钱的大宗商品” [6] - 互联网巨头围绕Token进行战略重组 例如阿里巴巴宣布成立由CEO直接负责的“Alibaba Token Hub”事业群 定位为“创造Token、输送Token、应用Token” [6] - Token已成为芯片公司定义产品价值的语言 例如英伟达展示其Vera Rubin芯片相比Grace Blackwell能带来5倍的收入提升预测 [8] Token定价体系复杂化与成本结构演变 - Token并非标准品 同一模型在不同调用条件下价格差异巨大 以Anthropic Claude Opus 4.6为例 标准输入为每百万Token 5美元 输出为25美元 但启用Prompt Caching、Batch API、指定区域推理或Fast Mode等条件会导致价格出现数倍至十余倍的变化 [14][15] - 大模型厂商的计费逻辑已从简单的输入/输出Token扩展为一整套AI基础能力收费 包括Web Search、File Search、向量存储、代码容器(Container)等独立计费项 [15][16][18] - 例如 OpenAI对GPT-4.1等模型的Web Search收费为每千次10美元 对GPT-5等推理模型则为每千次25美元 File Search为每千次2.50美元 向量存储为每GB每天0.10美元 代码容器按规格或会话时长计费 [15] - Google Vertex AI的Agent Engine也对Code Execution、Sessions和Memory Bank按vCPU小时和GiB内存小时分别计价 [16] Token单价下降与总成本上升的悖论及驱动机制 - 模型API的Token牌面价格持续下降 Anthropic Opus从上一代的15美元/百万Token降至5美元 降幅达三分之二 DeepSeek V3.2低至0.28美元 Google Gemini 2.5 Flash Lite约0.10美元 [20] - 中国模型价格优势明显 单价约为海外竞品的六分之一到十分之一 例如腾讯云混元HY2.0 Instruct涨价后折合约0.62美元/百万Token 仍低于Anthropic最便宜的Haiku 4.5(1美元) [20] - 尽管单价下降 但AI总使用成本并未降低 主要由三个机制驱动 [21] - 机制一:模型能力增强导致单任务消耗Token量激增 推理模型的平均输出Token使用量是非推理模型的5.5倍 “深度思考”的Token按输出计费 使得完成同一任务的总Token量翻倍 [22] - 机制二:AI智能体(Agent)导致Token消耗从“一次性”变为“持续性” 单个Agent的算力消耗是传统Chatbot的100到1000倍 中国整体日均Token消耗从2025年中的30万亿跃升至2026年2月的180万亿级别 [23] - 机制三:生产Token的底层基础设施成本上涨 2026年3月阿里云和百度智能云上调AI算力和存储价格 涨幅最高达34% AWS机器学习容量块提价约15% 谷歌云也宣布上调AI基础设施费用 [23][24] Token经济的核心缺陷与未来焦点 - 当前Token经济存在结构性缺陷 行业缺乏从Token消耗到任务完成的有效度量标准 Token衡量的是投入而非产出 这可能导致效率低下的消耗在排行榜上反而排名更高 [9][29] - 企业将Token消耗纳入KPI可能催生“生产力表演” 员工可能通过高昂的Token消耗来展示AI使用程度 而非真正提升效率 形成一种新型职业焦虑 [29][30] - 高成本使得“烧Token”与“用Token创造价值”的区别从哲学问题变为财务问题 例如15万美元的月度账单和2100亿Token的周消耗 [30] - 未来的核心焦虑与机会在于“Token效率” 即如何最高效地将Token转化为任务完成率 衡量AI成本的关键不应是每百万Token的价格 而是完成一件事所值得花费的Token量 [31] - Token牌面价格与真实任务成本之间的差距 是智能时代下一阶段最大的商业机会与成本陷阱 [32]
黄仁勋深度访谈:“Token经济”爆发,AI计算占GDP比重将翻百倍,英伟达10万亿是必然
华尔街见闻· 2026-03-24 19:09
计算本质与经济的范式转变 - 计算的本质从“存储/检索系统”(仓库)转变为“生成系统”(工厂),直接与企业收入创造挂钩 [3] - AI代工厂生产名为“Token”的商品,该商品已被细分和定价,出现类似iPhone的免费、高级、中间层级的分层 [4] - 有人愿意为每一百万个Token支付1000美元,这在不远的将来将成为现实 [4] - 计算设备因此从成本中心转变为利润中心 [4] - 基于生产力提升,未来全球GDP中用于计算的占比将是过去的100倍 [5] 公司增长前景与市值展望 - 公司迈向10万亿美元市值是一个数字,但公司的增长极大概率会发生,被视为必然 [5][6] - 未来实现3万亿美元营收的体量并非不可能 [6] 电力瓶颈与解决方案 - AI扩张的瓶颈之一是电力,但并非唯一担忧 [8] - 提升能效的关键指标是“每瓦每秒token数”,通过“极致协同设计”,token成本每年下降一个数量级 [8] - 电网按极端峰值设计,99%的时间里未达到最坏情况,大多数时候可能只在峰值的60%左右运行,存在闲置电力 [8] - 解决方案是改变供电合同,放弃对“六个九”(99.9999%)绝对可用性的追求 [9] - 构建能够“优雅降级”的数据中心,当电网要求降低供电时,可转移关键负载或降低计算速率,轻微牺牲服务质量以换取能源消耗减少 [9] 供应链与内存战略 - 公司对ASML光刻机、台积电CoWoS先进封装等潜在产能制约环节并不焦虑,与供应商保持紧密合作 [10] - 系统工程深刻改变制造模式,例如一个Vera Rubin机架包含130万到150万个组件,汇聚200家供应商的技术 [11] - 高互联密度(如NVLink-72)要求将数据中心的“超算组装”前置到供应链的“超算制造”环节,机架以整机(重达两三吨)形式发货,供应链需具备吉瓦(GW)级电力储备进行出厂前测试 [11] - 大约三年前,公司成功说服多家内存大厂CEO,使其相信HBM(高带宽内存)将成为未来数据中心主流,并推动产业链投资扩产 [11] - 推动供应商将原本专属于手机的低功耗内存(LPDDR)改造并引入超算领域 [12] AI缩放定律与算力需求 - AI扩展规律包括:预训练、后训练、测试时扩展、代理式扩展 [13] - 训练数据将继续扩大,很多会是合成数据,训练不再受数据限制,数据将受限于算力 [14] - 推理就是思考,是算力密集型活动,测试时扩展(包含推理、规划、搜索等)将推动推理算力需求上升 [14] 公司护城河与前沿探索 - 公司最深的护城河是CUDA庞大的装机量与信任生态,由43000名员工共同推动,建立在数百万开发者对公司持续优化底层的信任之上,并拥有横向整合进入全球各类云厂商、OEM和边缘设备的广泛生态 [16][17] - 公司GPU已进入太空,但当前主要用于卫星高分辨率图像的边缘端筛选 [17] - 构建大规模太空数据中心存在核心物理痛点:太空中只能靠辐射散热,需要巨大的散热器,现阶段最务实的做法是先利用地球上的闲置电力 [17] - 评价马斯克旗下xAI仅用4个月建成拥有10万块GPU的超算中心,认为其成功源于第一性原理思维、极简主义、系统思考能力、亲自在一线行动并带来强烈紧迫感 [17] AI对劳动力市场的影响与未来展望 - 招聘时倾向于雇佣“AI专家”,这一准则涵盖所有职业和层级,包括会计师、律师、销售人员、供应链经理、药剂师、电工和木匠等 [18] - 工作本质是一系列“任务”的人可能被AI颠覆,而工作具有更深层“目标”的人可利用AI自动化处理常规琐事,从而从执行者转变为行业创新者 [19] - 使用AI的门槛已降至零,可向AI询问使用方法,唯一的障碍在于是否决定开始,等待的成本与日俱增 [20] - 公司软件工程师的数量将会增长而非减少,如果编程的定义是“描述规范让计算机去构建”,那么具备此能力的人数可能从3000万增长到10亿,未来每个木匠、水管工都可能成为程序员 [21] - 如果将AGI定义为一个能够自主开发应用并实现盈利的系统,那么AGI在当下已经实现,技术上已具备AI自主创建服务并获得数十亿用户及盈利的可行性 [21]
珀乐互动完成天使轮融资,以AI+IP重塑数字内容生态丨36氪首发
36氪· 2026-03-24 18:43
公司融资与战略定位 - 珀乐互动科技已完成数千万元人民币的天使轮融资,由星连资本领投、春华创投跟投,资金将用于技术研发、团队扩充与IP商业化开发 [6] - 公司成立于2025年,聚焦于“AI+IP”融合模式,通过自研技术中台将AI大模型能力深度应用于IP的开发、运营与衍生全链条 [6] - 公司的长期目标是探索以Token经济为代表的数字资产机制,并将其应用于全球化IP运营,为下一代互动娱乐体验提供技术基础与商业框架 [7][15] 核心技术能力与产品 - 公司核心能力建立在自持的大模型基础之上,沿着“模型-产品-平台”路径推进,将模型能力封装为面向垂直场景的产品 [9] - 已推出两款面向专业创作端的核心产品:服务于短剧创作的辅助工具「剧灵AI」,以及AIGC生产力平台「珀乐视界」 [9] - 在开放API接口给某头部平台后,单月已服务超万名创作者 [9] - 正在探索新的多模态叙事方式,即将推出“全模态互动叙事平台”,旨在以Token化机制重塑IP内容与数字形象资产的商业流转 [9] - 技术层面打破常规调用,通过将底层算力无缝转化为交互生产力,基于“技术底层+娱乐场景”融合模式,深度整合智谱、生数等头部模型底座 [6] IP生态合作与商业化验证 - 公司通过AI技术提升内容产能的逻辑已完成验证,例如2025年推出的自研AI动画短剧《明日周一》上线首月全网播放量超过1200万 [11] - 已与多个知名IP方达成合作,包括刘慈欣的《镜子》、开心麻花的《羞羞的铁拳》、腾讯光子工作室群的《和平精英》及八十八文化的《疯狂的钥匙》等,依托AI技术对经典IP进行轻量化焕新与数字资产沉淀 [11] - 构建了“线上+线下+衍生”的多元化营收体系:为腾讯、百度、字节跳动等头部平台提供深度技术服务;将IP体验落地至甘肃省博物馆、成都文旅、上海漕河泾等线下场景;在游戏化开发与角色授权等衍生领域进行探索 [11] 团队背景与行业合作 - 核心团队汇集了AI、影视创作、数字内容制作等多领域人才,创始人杨晟曾参与制作多部影视作品并监制Steam爆款互动影游,具备跨界打造成品经验 [6] - 已与智谱AI开展大模型、AI工具、内容生产等多领域的深度合作,有望成为人工智能科技企业在泛娱乐生态链上的重要成员 [6] 发展基础与未来规划 - 公司发展基于两大基础:技术与数据的协同迭代,以及版权合规的底层设计 [13] - 在技术侧,依托智谱AI技术底座,将前沿AI能力融入泛娱乐场景,并利用自持IP沉淀的优质内容形成高质量数据集,以“数据飞轮”效应驱动模型持续迭代 [13] - 在合规侧,坚守“有授权、有原创、可追溯”原则,核心数字资产采用“艺术家原创手绘+AI提效”模式,从源头规避版权风险 [13] - 未来将沿三个方向发力:持续迭代现有AI创作工具,加速“全模态互动叙事平台”的研发与上线,并启动出海计划 [15] 投资人观点与行业视角 - 投资人认为,AI图像/视频生成应用赛道本质是在争夺下一代IP的生产权、运营权和分发权,AI正在重塑内容产业的每一个环节,而“IP”是其中最具延展性和长期价值的数字资产 [16] - 投资人认可公司提出的“技术底层+娱乐场景”融合模式,认为其展现了高效、合规地将token转化为高价值IP资产的清晰路径 [16] - 投资人指出,在AI从技术突破走向规模化商业应用的关键阶段,公司展现了稀缺的“IP获取与运营”及“线上线下融合落地”能力,构建了完整且成熟的商业模式,其从工具到平台、从本土到全球的战略布局具有前瞻性 [16]
黄仁勋深度访谈:“Token经济”爆发 AI计算占GDP比重将翻百倍 英伟达(NVDA.US)10万亿是必然
智通财经· 2026-03-24 17:25
AI计算范式的根本性转变 - 计算的本质从“检索系统”转变为“生成系统”,计算机的角色从“仓库”变为直接创造收入的“工厂” [2] - AI代工厂正在制造名为“Token”的商品,该商品已被细分和定价,例如有人愿意为每一百万个Token支付1000美元 [2] - 基于“Token工厂”模式,计算设备完成了从成本中心向利润中心的跨越 [2] - 未来用于计算的GDP占比将是过去的100倍,全球GDP将因此加速增长 [2] 公司增长与市值前景 - 公司增长极大概率会发生,未来实现3万亿美元营收的体量并非不可能 [3] - 公司能否迈向10万亿美元市值是一个被讨论的话题,该数字“只是一个数字” [2][3] AI扩展的瓶颈与解决方案 - AI扩展的瓶颈之一是电力,解决方案包括提升能效和获取更多电力 [4] - 能效的关键指标是“每瓦每秒token数”,通过“极致协同设计”提升能效,使得token成本每年下降一个数量级 [4] - 电网按极端峰值设计,99%的时间里存在闲置电力,大多数时候可能只在峰值的60%左右运行 [4] - 需要构建能够“优雅降级”的数据中心,当电网要求降低电力供应时,数据中心可以转移关键负载或降低计算速率 [4][5] - 需要改变云厂商与电力公司之间严苛的供电合同,放弃对“六个九”绝对可用性的盲目追求 [5] 供应链与内存战略 - 公司不担心ASML光刻机、台积电CoWoS先进封装等环节的产能制约,与供应商保持紧密沟通 [5] - 系统工程深刻改变基础设施制造模式,一个Vera Rubin机架包含130万到150万个组件,背后汇聚了200家供应商 [5] - 为匹配极高的互联密度,将数据中心的“超算组装”前置到供应链的“超算制造”环节,机架以整机形式发货 [5][6] - 大约三年前成功说服多家内存大厂CEO,使其相信HBM将成为未来数据中心主流,并推动产业链投资扩产 [6] - 推动供应商将原本专属于手机的低功耗内存改造并引入超算领域 [7] AI缩放定律与算力需求 - AI扩张被拆分为四条“扩展规律”:预训练、后训练、测试时扩展、代理式扩展 [8] - 训练不再受数据限制,数据将受限于算力,未来会继续扩大训练数据,很多会是合成数据 [9] - 推理就是思考,是算力密集型的,测试时扩展包含推理、规划、搜索等,会推动推理算力需求上升 [9] 公司护城河与生态系统 - 公司最深的护城河是CUDA庞大的装机量与信任生态,由43000名员工共同推动,建立在数百万开发者的信任之上 [10] - 生态系统横向整合进入全球各类云厂商、OEM和边缘设备 [10][11] 前沿探索与工程执行力 - 公司GPU已经进入太空,但当前主要用于卫星高分辨率图像的边缘端筛选,大规模太空数据中心存在散热等物理痛点 [11] - 对马斯克旗下xAI仅用4个月建成拥有10万块GPU的Colossus超算中心给予极高评价,将其成功归结为第一性原理思维、极简主义、系统思考与亲临一线的执行力 [11][12] AI对劳动力市场的影响 - 招聘将倾向于雇佣“AI专家”,这一准则涵盖所有职业和层级,善用AI的人将展现出更高的交付价值 [12] - 如果工作本质是一系列“任务”,被AI颠覆几乎是必然的;如果工作具有更深层的“目标”,则可以利用AI自动化常规琐事,从而成为“创新者” [13] - 编程的定义是“描述规范让计算机去构建”,能做到这一点的人数可能从3000万增长到10亿 [13] - 如果AGI定义为一个能够自主开发应用并实现盈利的系统,那么AGI“就是现在”,技术可行性已经具备 [13] 公司管理、协同设计与战略决策 - 公司进行“极限协同设计”,对从架构、芯片、系统、系统软件到算法和应用程序的整个软件栈进行优化 [17][21] - 管理团队庞大,直接汇报人数超过60人,且大多数是工程专家,涵盖内存、CPU、光学、GPU、架构、算法等领域 [20][23][25][27] - 公司采用集体讨论模式,所有相关专家参与每次技术对话,确保极限协同设计 [28][29][30] - 公司从加速器公司转变为加速计算公司,关键战略决策包括发明可编程像素着色器、引入单精度浮点数、以及将CUDA引入GeForce GPU [32][33][34] - 将CUDA引入GeForce的决策曾极大增加成本并吞噬毛利润,市值一度跌至约15亿美元,但此举为CUDA建立了庞大的装机量基础 [35][36][37][40][41][46] - 领导力体现在通过持续沟通和“推理”来塑造公司内外(包括员工、董事会、客户、供应链伙伴)的信念系统,为重大决策铺平道路 [48][49][50][51][52] 行业洞察与供应链协同 - 公司通过GTC大会等行业活动,与上下游数百位CEO沟通,告知业务状况、增长驱动力和未来方向,以指导他们的投资决策 [86][87] - 公司的工作包括告知、塑造和启发供应链伙伴,例如成功说服DRAM行业CEO投资HBM和改造手机低功耗内存用于超算,使相关公司迎来创纪录的一年 [88][89] - 供应链需要为前置的超级计算机制造环节提供吉瓦级的庞大电力储备,以进行构建和测试 [98] - 公司不担心供应链瓶颈,因为已明确告知供应商需求,并相信他们会做到 [102][103][105] 工程哲学与系统设计 - 公司的工程哲学是“光速”,代表从第一性原理出发,将一切推向物理极限(如速度、功耗、成本),然后进行权衡 [120][121] - 反对“持续改进”方法,倾向于从零开始重新设计以逼近理论最优值,例如将可能需要74天的流程重新设计为可能只需6天 [122][123] - 设计原则是系统应“像必要时那样复杂,但又要尽可能简单”,挑战所有不必要的复杂性 [129] - 公司制造的是“世界上制造过的最复杂的计算机”,例如Vera Rubin计算舱包含7种芯片类型、5种专用机架类型、40个机架、近2万个英伟达裸片、超过1100个Rubin GPU [124][127][131] - 公司可能每周生产大约200个这样的计算舱 [128]