Token经济
搜索文档
三天涨,三天跌:“龙虾”概念股过山车,真正的确定性在哪?
和讯· 2026-03-13 17:04
OpenClaw(“龙虾”)的技术突破与产业意义 - 核心是开源AI智能体框架,实现了AI从“对话智能”到“执行智能”的跃迁,能够根据指令在多应用与在线服务中自主完成复杂任务,成为生产力工具[6][8] - 在GitHub上星标数已超28万,其发布后三周内达到的下载规模相当于Linux 30年才达到的水平[7] - “低代码”或“无代码”的交互特性打破了技术壁垒,具有技术平权效应,是其爆发式增长的核心驱动力[9] 科技巨头竞逐背后的商业模式 - 国内主流科技巨头如腾讯、字节跳动、MiniMax等在2026年3月9日前后几乎同步发布了相关产品或服务,引发“军备竞赛”[3] - 巨头竞逐源于OpenClaw作为本地部署的Agent是“Token黑洞”,其执行复杂任务时的Token消耗量是普通对话的百倍乃至千倍,能有效消耗并变现云厂商的庞大算力库存[11][12] - 参考数据,OpenClaw的Token消耗量占据了openrouter平台总消耗量的95%以上(例如2.05T/2.15T),云厂商借此从“单一模型的承销商”转变为“多模型的计费层”[12] - 对于深陷“烧钱”困境的大模型厂商而言,这带来了商业曙光[13] 地方政府政策支持与产业布局 - 深圳龙岗区、无锡高新区、合肥高新区等地政府迅速推出扶持政策,例如深圳龙岗区“龙虾十条”最高补贴400万元,合肥高新区最高扶持资金达1000万元[3][14] - 地方政府行动是对国家“培育智能经济新形态”、“深化拓展‘人工智能+’”战略的积极响应,旨在抓住AI落地应用关键环节,培育新兴产业生态和寻求新经济增长点[14][15] - 招商引资格局从“招商引资”向“生态培育”转变,通过补贴算力、数据等要素支持创业,营造产业氛围[15] 资本市场反应与产业链投资机遇 - 热度迅速传导至二级市场,A股与港股市场资金狂热追捧,例如优刻得、博睿数据在3月6日至10日连续3个交易日内区间涨幅均超40%,青云科技区间涨幅超26%[3][16] - “龙虾行情”是技术突破、政策催化与资金情绪三者共振的结果[17] - 确定性投资机会主要集中在三个领域:算力基础设施(Token消耗大幅提升利好云和国产芯片厂商)、云部署与生态服务(用户倾向使用云服务商的一键部署服务)、AI智能体应用(降低门槛,加速在办公、金融、投研等场景渗透)[18] 安全风险与商业化挑战 - 国家互联网应急中心指出OpenClaw存在提示词注入、功能插件投毒、安全漏洞等四类核心风险,多个插件为恶意插件,可致设备被控制[4][21] - 根据国家信息安全漏洞库统计,2026年1月至3月9日共采集到OpenClaw漏洞82个,其中超危漏洞12个,高危漏洞21个[4][22] - 部分上市公司发布公告澄清相关业务尚未形成稳定收入,占比极低,对公司经营业绩影响有限,例如优刻得、博睿数据[20][21] - 专家指出OpenClaw存在权限治理逻辑待完善、Token消耗成本偏高、工业级场景可靠性不足等问题,规模化商用面临挑战,投资者需区分情绪溢价与真实增长逻辑[22]
英伟达的“神秘芯片”背后:推理时代开启“四大算力新趋势”
华尔街见闻· 2026-03-01 21:53
行业趋势:AI算力竞争主战场从训练转向推理 - 英伟达计划发布整合Groq LPU技术的新推理芯片,OpenAI已同意成为其最大客户之一 [1] - OpenAI同时与初创公司Cerebras达成数十亿美元合作,表明AI巨头正从训练算力竞赛转向推理算力的多线布局 [1] - 申万宏源研究认为,2026年算力产业的核心关键词将是推理,Token消耗总量与技术范式将围绕此主题深度重构 [1] 推理算力发展的四大趋势 - 纯CPU部署场景增多,低成本推理需求加速算力下沉 [2] - LPU等专用架构崛起,挑战GPU在推理环节的主导地位 [2] - 国产算力芯片加速突破,供应链多元化趋势明确 [2] - 推理需求结构从“单次训练”向“海量Token消耗”转变,性价比成为核心竞争要素 [2] 推理需求爆发的驱动因素与数据表现 - 大模型货币化加速(如Claude发布行业插件)以及Agent落地提速(如openclaw、千问Agent),驱动推理需求扩张 [3] - 春节期间,国内头部大模型推理量大幅增长:豆包除夕当天推理吞吐量达633亿tokens,元宝月活跃用户达1.14亿,千问“春节大免单”活动参与人数超1.2亿 [3] - OpenRouter数据显示,2月9日至15日当周,中国模型调用量以4.12万亿Token首次超过美国模型的2.94万亿Token;16日至22日当周,中国模型调用量进一步冲高至5.16万亿Token,三周大涨127% [3] 技术架构演进:LPU崛起与芯片分工 - 英伟达斥资200亿美元获取Groq核心技术许可,标志着纯推理芯片的重要性获顶级玩家认可 [6] - LPU针对推理场景的延迟和内存带宽瓶颈优化,效率优势明显;英伟达新品可能涉及下一代Feynman架构或3D堆叠技术整合LPU [6] - 未来AI芯片将形成明确分工:训练端沿用GPU-HBM组合,推理端演进为ASIC+LPU-SRAM+SSD的组合方案 [6] 系统层面革新:三层网络架构 - 应用场景从chatbot转向Agent,推动算力系统架构向三层网络演进 [7] - 第一层快反应层由搭载SRAM的纯推理芯片提供低延迟反馈 [7] - 第二层慢思考层使用超大吞吐算力集群负责复杂逻辑推演,多核多线程CPU需求将显著增加 [7] - 第三层记忆层对应英伟达的ContextMemory System,通过DPU管理的SSD存储长期记忆 [7] - 英伟达与Meta完成首次大规模纯CPU部署,标志着公司正超越单一GPU销售模式 [7] 国产算力芯片的突破 - 新一代国产推理芯片在技术层面实现多项提升:支持FP8/MXFP8/MXFP4等低精度格式,算力达1P和2P;向量算力大幅提升;互联带宽相比前代提升2.5倍至2TB/s [9] - 芯片层面实现PD分离,推出面向Prefill的PR版本(采用低成本HBM)和面向Decode的DT版本,PR版本预计于2026年Q1推出 [9] - 供应链国产化进程加快:某头部封测企业2.5D封装业务收入从2022年的0.5亿元快速增长至2024年的18.2亿元,印证国产算力芯片供给能力提升 [9]
英伟达的“神秘芯片”背后--推理时代开启“四大算力新趋势”
华尔街见闻· 2026-03-01 19:33
行业趋势:AI算力竞争主战场从训练转向推理 - 英伟达计划在GTC开发者大会上发布整合Groq LPU技术的新推理芯片,OpenAI已同意成为该处理器的主要客户之一 [1] - OpenAI同时与初创公司Cerebras达成数十亿美元计算合作,表明AI巨头正从训练算力竞赛转向推理算力的多线布局 [1] - 申万宏源研究认为,2026年算力产业的核心关键词将是推理,Token消耗总量与技术范式将围绕推理主题深度重构 [1] 推理算力需求爆发与驱动力 - 大模型货币化加速及Agent落地提速是推理需求扩张的两大结构性驱动力 [3] - 春节期间国内头部大模型推理量大幅增长:豆包除夕当天推理吞吐量达633亿tokens,元宝月活跃用户达1.14亿,千问“春节大免单”活动参与人数超1.2亿 [3] - 根据OpenRouter数据,2月16日至22日当周,中国模型调用量冲高至5.16万亿Token,三周大涨127%,全球调用量前五的模型中中国占据四席 [3] 推理算力四大发展趋势 - 纯CPU部署场景增多,低成本推理需求加速算力下沉 [2] - LPU等专用架构崛起,挑战GPU在推理环节的主导地位 [2] - 国产算力芯片加速突破,供应链多元化趋势明确 [2] - 推理算力需求结构从“单次训练”向“海量Token消耗”转变,性价比成为核心竞争要素 [2] LPU技术崛起与芯片格局分化 - 英伟达斥资200亿美元获取Groq核心技术许可并吸纳其高管团队,标志着纯推理芯片的重要性获顶级玩家正式认可 [6] - LPU针对推理场景的延迟和内存带宽瓶颈进行专项优化,在解码阶段具备效率优势 [6] - AI芯片未来将形成明确分工:训练端沿用GPU-HBM组合,推理端演进为ASIC+LPU-SRAM+SSD的组合方案 [7] 推理系统架构革新 - 应用场景从chatbot转向Agent,推动算力系统架构向三层网络演进:快反应层、慢思考层、记忆层 [8] - 慢思考层对多核多线程CPU的需求将显著增加 [8] - 英伟达宣布扩大与Meta Platforms合作,完成首次大规模纯CPU部署以支持广告定向AI智能体,标志着公司正超越单一GPU销售模式 [8] 国产算力芯片技术突破 - 新一代国产推理芯片实现多项根本性提升:新增支持低精度数据格式,算力分别达到1P和2P;向量算力大幅提升;互联带宽相比前代提升2.5倍至2TB/s [10] - 芯片层面实现了PD分离,其中面向Prefill的PR版本采用低成本HBM,可大幅降低推理Prefill阶段的投资成本,预计于2026年Q1推出 [10] - 供应链国产化进程加快,某头部封测企业2.5D封装业务收入从2022年的0.5亿元快速增长至2024年的18.2亿元,印证国产算力芯片供给能力提升 [10]
日进22.6亿,英伟达营收暴涨73%再破纪录,盘后股价重返200美元
36氪· 2026-02-26 15:58
核心财务表现 - 2026财年第四季度营收达681亿美元,同比增长73%,环比增长20% [1][4] - 2026财年全年营收达2159亿美元,同比增长65% [1][6] - 第四季度净利润为429.6亿美元,同比增长94%,环比增长35% [15] - 全年净利润为1200.67亿美元,同比增长65% [17] - 第四季度毛利率为75%,环比增长1.6个百分点,同比上涨2个百分点 [12] - 全年毛利率为71.1%,同比下降3.9个百分点 [12] 分业务板块业绩 - 数据中心业务第四季度营收623亿美元,同比增长75%,环比增长22% [1][7] - 数据中心业务全年营收1937亿美元,同比增长68% [7] - 自2023财年以来,数据中心业务规模已增长近13倍 [10] - 游戏和AI PC业务第四季度营收37亿美元,同比增长47%,环比下滑13% [10] - 游戏和AI PC业务全年营收破纪录,达160亿美元,同比增长41% [10] - 专业可视化业务第四季度营收13亿美元,同比增长159% [10] - 汽车与机器人业务第四季度营收6亿美元,同比增长6% [10] - 专业可视化与汽车业务全年营收分别为32亿美元和23亿美元,双双破纪录 [10] 增长驱动与未来展望 - 数据中心业务增长由平台转型推动,Blackwell架构全面放量,推理算力需求呈指数级增长 [8] - 公司对2027财年第一季度营收预期为780亿美元(上下浮动2%),环比预计增长14%,同比预计增长77% [17] - 公司预计2026年(2027财年)全年营收将持续增长,超过去年基于Blackwell和Rubin预测的5000亿美元营收机会 [18] - 下一代平台Rubin已准备就绪,包含六款新芯片,推理Token成本预计比Blackwell再降10倍,已交付首批样品并计划下半年量产 [18] 行业趋势与公司战略 - Agentic AI兴起推动计算需求爆发性增长,公司认为“token经济”时代已到来 [20] - 公司观点认为,计算是生成token的基础,而token是实现收入增长的关键,因此“计算就是收入” [20] - GPT-5.3 Codex、Claude Code等系统能自主执行复杂任务,推动了推理token需求的指数级爆发 [20] - 公司预计Rubin平台需求强劲,现有大客户几乎都会订购,但产能爬坡和游戏业务供应紧张情况仍需观察 [18]
日进22.6亿!英伟达营收暴涨73%再破纪录,盘后股价重返200美元
新浪财经· 2026-02-26 10:48
核心观点 - 英伟达2026财年第四季度及全年业绩全面超越市场预期,多项财务指标创下纪录,强劲增长主要由数据中心业务驱动,公司对下一季度及新财年营收给出极为乐观的指引,并阐述了由Agentic AI驱动的“Token经济”将支撑其长期增长 [1][14][15][17] 财务业绩摘要 - 2026财年第四季度(即2025年第四季度)营业收入达681亿美元,同比增长73%,环比增长20% [3][4][22][23] - 2026财年全年营收达2159亿美元,同比增长65% [4][6][22][25] - 第四季度净利润为429.6亿美元,同比增长94%,环比增长35% [12][32] - 全年净利润为1200.67亿美元,同比增长65%,相当于日入22.6亿元人民币 [14][34] - 第四季度毛利率为75%,环比提升1.6个百分点,同比提升2个百分点;全年毛利率为71.1%,同比下降3.9个百分点 [10][30] 分业务表现 - **数据中心业务**:第四季度营收623亿美元,同比增长75%,环比增长22%;全年营收1937亿美元,同比增长68%,自2023财年以来该业务规模已增长近13倍,增长由Blackwell架构全面放量及推理算力需求指数级增长推动 [4][6][8][25][27] - **游戏和AI PC业务**:第四季度营收37亿美元,同比增长47%,环比因季节性因素下滑13%;全年营收创纪录达160亿美元,同比增长41% [8][27] - **专业可视化业务**:第四季度营收13亿美元,同比增长159%;全年营收32亿美元,创纪录 [8][28] - **汽车与机器人业务**:第四季度营收6亿美元,同比增长6%;全年营收23亿美元,创纪录 [8][28] 业绩展望与战略叙事 - 对2027财年第一季度营收给出乐观指引,预期达780亿美元(上下浮动2%),较本季度增长14%,同比预计增长77% [14][35] - 公司预计2026年(2027财年)全年营收将持续增长,超过去年基于Blackwell和Rubin平台预测的5000亿美元营收机会 [15][35] - 下一代平台Rubin已准备就绪,包含六款新芯片,其推理Token成本将比Blackwell再降10倍,已交付首批样品并计划下半年量产,公司预计现有大客户几乎都会订购,今年将同时销售Blackwell和Rubin两大平台 [15][36] - 首席执行官黄仁勋提出“Token经济”已至,认为Agentic AI的兴起(如GPT-5.3 Codex、Claude Code)导致推理token需求指数级爆发,并强调“计算就是收入”,Token生成将是计算的未来 [15][17][38][39][40] 市场反应 - 强劲财报发布后,英伟达盘后股价一度上涨超过3.7% [1][19]
5000家AI企业,都在疯狂试错|一线
吴晓波频道· 2026-02-06 08:30
文章核心观点 - 中国AI创业热潮涌动,企业数量激增,但行业普遍处于快速试错、探索商业化落地的早期阶段,面临真实需求匹配与高昂模型成本两大核心挑战,全球化发展成为普遍选择策略 [6][7][23][24][38] AI创业生态现状与参与者画像 - AI创业活动异常火爆,某全球AI创业社区组织的活动经常爆满,报名人数可达600-800人,远超200-300人的到场容量 [3] - 中国人工智能企业数量快速增长,截至2025年9月已超过5000家,是五年前1454家的3倍多 [7] - 草根创业者:典型代表如Eason,非技术背景连续创业者,采用小团队、多产品、快速验证MVP的模式,追求用户付费而非规模,单款产品月变现2万元以上即可盈利 [11][12][16][17] - 高校背景创业者:典型代表如计算美学,核心团队来自清华、北大、哈佛、耶鲁等名校,已完成近亿元融资,策略是快速试错调整,从C端转向B端实现稳定营收后,再杀回C端市场 [17][18][19] - 大厂背景创业者:普遍存在,但创业过程并不轻松 [17] - 服务商视角:将AI创业者分为两类,一类技术强但产品与商业闭环理解不足,另一类产品与商业能力强但低估AI工程化与成本复杂度 [20] 行业面临的核心挑战 - **需求痛点匹配(“痛不痛”)**:能否抓住真实、有长期需求的用户痛点是首要难题,业内对C端产品落地判断不一,竞争激烈但真正解决问题的产品不多 [25][26][28][29][30] - 当前主流商业模式是为企业提供定制化AI解决方案以降本增效,这是一个具有长期需求的市场 [26] - 智算中心GPU利用率不均,国内总数超280个,但平均利用率不到30% [27] - **模型成本压力(“贵不贵”)**:调用大模型产生的Token成本是创业公司的核心财务压力,催促企业快速商业化 [30][31] - 模型成本通常占AI初创企业总可变成本的40%-70%,对于月营收1万-10万美元的企业,该比例达50%-65% [32][33] - 成本随用户活跃度非线性飙升,例如一款AI Agent产品日活从500-1000升至1万时,月模型成本可能从1000-2000美元跃升至10000-50000美元,但收入并未同步增长10倍 [34] - 大模型厂商仍在提价,例如DeepSeek-V3.1输出定价较V3版上涨50%,OpenAI的GPT-5.2输入价格较GPT-5.1上涨40% [34] 全球化发展战略 - AI创业者普遍主动选择全球化团队布局与市场拓展,例如团队分布在新加坡、上海或北京、杭州、美国等地 [38][39] - **出海动因一:市场成熟度与付费意愿**:海外市场(尤其是美国)因ChatGPT更早教育市场,用户付费决策更直接、订阅意愿更强,商业化程度更高 [40][41] - ChatGPT付费用户占比约5%,OpenAI内部预测到2030年付费订阅用户将至少达2.2亿人 [42] - 相比之下,中国用户更谨慎、价格敏感,付费链路长,许多合作仍是项目制思维 [41] - **出海动因二:投融资环境与退出机会**:海外市场投融资机会多,更擅长造就年轻创业明星,且被大厂收购的可能性更高 [45][46] - 例如,硅谷出现多位20余岁创始人创办高估值AI公司的案例,而国内生态竞争激烈,被收购概率较小 [45][46] - 近期案例显示,Meta曾欲以数十亿美元收购国内AI初创企业Manus [47] - 全球化策略结合了海外高价值市场、投融资便利与国内工程师红利、高效产品迭代优势 [49] - 行业观察认为,中国更容易跑出性价比极致的产品,美国更容易跑出定义范式的公司,成功的团队需同时理解两种环境 [50][51] 行业动态与潜在风险 - 大模型技术快速迭代可能淘汰部分初创企业,例如DeepSeek-R1问世后,导致“百川智能”等公司原有客户转移,被迫进行战略调整 [48] - 行业存在矛盾心态:一方面为技术进展与潜在爆发式增长机会感到兴奋;另一方面又不得不面对现实痛点与成本压力,并因国内外市场差异做两手准备 [52][53][54] - 更深层困境在于AI技术发展速度远超专业用户的接受度和实际使用度,存在“产品多,专业用户少”的现象 [55][56]
Agentic-AI时代的新增长曲线
2026-02-03 10:05
关键要点总结 一、 行业与公司 * 纪要主要涉及**人工智能 Agent 技术**,特别是 **OpenCloud** 这一新兴的 AI Agent 形态,以及其发展对 **数据中心 (IDC)**、**云计算**、**算力**、**网络安全** 和 **物联网 (IoT)** 等产业链的影响 [1][2][4] * 纪要重点分析了 **数据中心行业** 在 **2026 年** 面临的机遇与前景 [9][10][11] 二、 核心观点与论据 1. OpenCloud 的技术特点与优势 * **架构逻辑**:采用“云大脑+本地手脚”的架构,用户通过即时通讯软件(如 WhatsApp 或 Telegram)发送指令,本地网关接收后传给云端大模型解析,再调用本地工具链执行任务并返回结果 [2] * **核心差异**: * **交互入口**:通过即时通讯软件交互,更贴近通讯录端的数字员工,便于事件触发和主动推送 [2] * **技能库**:采用动态加载机制,仅在触发特定场景时加载对应工具说明,优化了 Tokens 使用量以降低成本;其开源技能库能广泛汇集开发者力量 [4] * **私有化部署**:主要在本地硬件上运行,具备高操作权限,可直接操控本地文件和命令行;数据存储在本地,相较于云端部署更具数据主权和操作权限 [4] 2. AI Agent 发展带来的产业链机遇 * **算力与云服务需求激增**: * Agent 为完成复杂指令会进行多次任务拆解、长程搜索和自我修正,比单次对话消耗更多算力,推动基础大模型调用量提升 [5] * 各类云厂商快速推出一秒级部署 OpenCloth 将驱动云厂商 **API、算力及数据服务消费** 增加 [5] * 大模型公司的 API 使用量正在快速上升,例如 Anthropic 将 2026 年收入预测从 140-150 亿美元上调至 180 亿美元以上 [21] * 国内大厂(如字节跳动、阿里巴巴)对 2026 年云计算业务预期实现几倍增长,从卖算力转向输出模型能力 [21] * **基础设施需求变化**: * **端侧设备**:Agent 的 24 小时常驻运行属性提升了对 **迷你主机**(作为网关系统主体)和 **VPS 虚拟私有云主机** 的需求 [5] * **GPU 主机**:本地化推理比例上升,使具备 **大显存带宽的 GPU 主机** 成为私有数据安全及复杂指令集推理的重要物理底座 [5] * **数据中心 (IDC)**:AGI 爆发和 Agent 技术推动 **AI 训练和推理需求** 增加,以及 **Tokens 调用量快速上涨**,促进了一线及环一线核心数据中心资源需求增加 [3][15] * **流量与安全新需求**: * **流量特征变化**:过去是用户访问网页,现在是 Agent 读取文件并反馈给模型,带动了 **边缘高性能网关** 及 **内网负载均衡** 需求 [6] * **网络安全需求增长**:本地网关暴露在公网会增加 **DDOS 风险** 及 **沙箱隔离** 需求,推动网络安全从企业级向边缘节点扩展 [6] * **隐私计算**:自托管模式下的数据存储在本地,即使调用大模型 API 也仅进行推理任务,驱动隐私计算生态发展 [6] 3. 数据中心行业在2026年的机遇 * **业绩兑现支撑**:下游厂商招标到数据中心交付通常需 6-12 个月周期,2025 年是订单交付大年,因此 **2026 年是业绩兑现的重要时间节点** [10] * **产业链边际转好与推理需求起量**:随着 AI 应用普及与复杂度提高,对算力要求不断增加,将进一步推动产业链发展 [10] * **国内数据中心形态演进**:国内数据中心形态逐步向 **G 瓦级** 演进,这一趋势利好龙头厂商拿单,有助于其市场份额扩大 [1][10] * **资本开支有力支撑**: * 下游资本开支对数据中心行业景气度有重要支撑作用 [12] * 例如,阿里巴巴在 2025 年前三季度资本开支分别为 246 亿、387 亿和 314 亿元;腾讯则分别为 275 亿、190 亿和 130 亿元 [12] * 阿里计划未来三年将资本开支从 3,800 亿元提升至 4,800 亿元 [12] * 这些持续上行的资本开支有望推动数据中心板块订单超出预期 [12] * **芯片供应链改善**:受益于国内外芯片供应链边际改善(国产芯片需求增长加速适配,英伟达重启 H200 供应链等),数据中心行业有望获得更稳定的支持,有助于打通下游资本开支向 IDC 下单的传导路径 [13] 4. Agent 市场现状与发展前景 * **市场渗透率极低**:目前全球通用 Agent 用户数估计在千万量级,而传统 Chatbot(如 OpenAI 和 Gemini)月活跃用户已达 15 亿至 20 亿,因此 **Agent 渗透率仅为 0.5% 到 1%** [20] * **增长潜力巨大**:如果 2026 年能将渗透率提升至 2%,将带来显著增长,因为每提升一个百分点意味着 **Tokens 消耗可能翻倍** [20] * **Token 消耗量剧增**:Agent 需要完成更高质量的任务(如制作 PPT 或深度研究),推理链条和工作时长都大幅延长,相比于传统 Chatbot,**Agent 的单用户 Tokens 消耗可能增长几十倍甚至上百倍** [19][25] * **成为关键驱动力**:OpenCloud 有望像去年的 Deepseek 一样扮演鲶鱼角色,加速 Agent 领域发展,倒逼更多公司加码 Agent 投入,使 **2026 年成为 Agent AI 加速渗透的一年** [18] * **多 Agent 系统趋势**:多 Agent 系统的发展趋势越来越明显,将进一步增加 Token 消耗,提高整体应用效率 [3][18] 5. 深远影响与未来趋势 * **企业级 Agent 范式演变**:OpenCloud 模式通过强化沙箱隔离环境、审计日志追溯等措施,有望解决企业部署 Agent 面临的数据主权、权限划分及合规责任归属等阻碍,成为未来企业级 Agent 的一种范式 [7] * **推动物联网 (IoT) 渗透率提升**:Agent 的语义解析能力及 MCP 能力泛化接入,可解决物联网长期以来协议破碎、交互繁琐的问题,促进传统设备向物联网转型,加速全屋智能实现 [7][8] * **AI 与 AI 交互**:未来在完成复杂任务过程中可能形成多层交互网络(人-AI 交互、AI-AI 协作),这将进一步增加 Tokens 消耗,并推动整个推理端 Token 需求曲线的新一轮增长 [23] * **对传统软件行业的影响**:AI Agent 可能成为未来核心入口,侵蚀部分具有入口价值的软件,但垂直领域软件仍能保住入口价值或退居后台提供能力支持;中国软件公司因 SaaS 化不彻底,相较美国公司受到 AI 取代席位的影响较小 [26] 三、 其他重要内容 1. 中美数据中心建设模式差异 * **海外大厂**:倾向于通过高额资本投入自建 **G 瓦级超大规模数据中心**,以锁定能源自主权,例如 XAI 的数据中心 Clusters 一期在 122 天内完成 10 万张 GPU 部署 [16] * **国内大厂**:更偏好与第三方 IDC 厂商合作,利用其地方政府关系、电网协调等经验满足快速交付诉求,同时缓解芯片供应链不确定性带来的资本支出压力 [16] * 预计在 AI 算力驱动下,国内大厂对于 **G 瓦级别单体数据中心** 需求量将增加,有利于龙头厂商获得更多订单份额 [16] 2. 数据中心板块估值与风险 * **估值水平**:当前整个数据中心板块平均估值对应 **18 倍 2026 年的 EV/EBITDA**,处于历史估值水平 75% 分位 [17] * **上行催化**:随着下游资本开支继续上行、上游芯片供应链改善、大模型流量突破,有望推动板块估值中枢上移 [17] * **风险因素**:**下游资本开支、芯片供给情况及流量增长不及预期** 可能会短期影响板块估值波动 [17] 3. 安全与部署考量 * **安全挑战**:个人部署 OpenCloud 不具备成熟沙箱隔离环境,根据 1 月 25 日网络扫描显示,有上千个控制面板处于无保护状态 [6] * **企业部署建议**:企业在采用开源方案时,需要特别关注网络安全和防火墙配置,确保系统稳定和安全运行,尤其是在生产环境中 [24] 4. Token 经济与硬件影响 * **Token 经济增长**:2026 年 Token 数量可能增加几十倍甚至上百倍,其增长速度将超过算力优化速度,可能引发短期通胀 [25] * **硬件需求**:这一趋势将明显拉动整个算力产业链,包括 **存储、CPU** 等配套设施需求 [25];但大部分核心模型推理运算仍在云端完成,本地部署无需高性能硬件,一般消费级电脑即可满足执行需求 [25]
从一杯咖啡里的算力说起
华尔街见闻· 2026-01-27 17:56
行业前景与市场格局 - 中国通用GPU市场规模预计到2029年有望达到7153亿元,未来5年复合增长率高达29.5% [4] - 行业已进入去伪存真的兑现大考阶段,落地困难与生态割裂是现实难题 [5][8] - 多家国产GPU厂商已完成上市,以争夺未来市场 [4] 公司战略与产品路线图 - 公司公布了横跨2025至2027年的四代架构路线图,旨在逐步超越英伟达的Hopper、Blackwell及Rubin架构 [6][15] - 四代架构分别为天数天枢、天数天璇、天数天玑、天数天权 [6] - 第一阶段(2027年前)目标是对标并超越行业标杆,第二阶段将转向创新和定义超级计算芯片架构 [15] - 天数天枢架构的效率较行业平均水平提升60%,在DeepSeek V3场景性能平均比Hopper架构高约20% [13] 产品发布与性能 - 新发布“彤央”系列四款边端AI算力产品,覆盖100T至300T算力区间 [6] - 彤央TY1000在计算机视觉、自然语言处理、DeepSeek 32B大模型等多个场景实测性能全面优于英伟达AGX Orin [33] - 彤央系列产品形态多样,包括标准模组TY1000、集成ARM CPU的TY1100、大显存高性价比的TY1100_NX以及300TOPs算力终端TY1200 [34] 技术理念与算力标准 - 公司提出“回归算力本质”和“做越野车”思维,以应对复杂应用场景 [10][11] - 定义了“高质量算力”三大标准:高效率(优化客户TCO)、可预期(构建“算力仿真驾驶舱”实现所见即所得)、可持续(软件适配过去及未来算法) [12] 生态构建与客户迁移 - 致力于降低客户迁移门槛,承诺客户现有代码几乎一行不用改 [18][19] - 已支持400余种模型,国内新大模型发布当天可跑通,客户仅需1/3开发调优精力即可完成部署 [20] - 生态兼容性是赢得客户认可的关键因素之一 [21] 商业落地与应用案例 - 首次公布各行业应用情况,展示了规模化落地的真实样本 [23] - 在互联网领域实现单机性能翻倍、Token成本减半、人力节省1/3 [23] - 在金融领域研报生成效率提升70%,量化分析响应速度提升30% [23] - 在医疗领域结构化病历生成时间缩短至30秒/份,肠胃镜病灶精准定位能力提升30% [23] - 已累计服务超300家客户,完成超1000次行业部署 [25] 物理AI与边端算力布局 - 物理AI被视为下一场宏大战役,类似于4-5年前的生成式AI爆发前夜 [28] - 公司通过“彤央”系列产品卡位物理AI赛道,解决算力落地“最后一公里”难题 [36] - 边端产品是连接AI与物理世界的关键媒介,旨在为机器人等提供环境感知与交互能力 [29][30] - 已在具身智能、工业智能、商业智能、交通智能四大核心场景展示应用 [36][42] 增长引擎与市场机遇 - 未来两大核心增长引擎是推理侧的“Token经济”与边端侧的放量 [38] - AI计算重心正从训练端加速向推理端拓展,每次Token生成都消耗算力 [40] - 公司在“云+边+端”全方位覆盖,具备增长基础 [40] - 与格蓝若机器人、比依电器、瑞幸咖啡等达成深度合作,并在20个试点城市开展车路云一体化合作 [42] 公司定位与竞争优势 - 公司定位为中国智能社会底层不可替代的赋能者,提供高性能、低门槛、广生态的算力 [43] - 护城河在于基于通用架构的创新设计、七年全栈自研积累、超300家客户的真实使用以及全方位产品覆盖 [40] - 被视为观察中国硬科技从“模仿”走向“定义”的典型样本 [44]
Token消耗藏着财富密码|AI产品榜·网站榜2025年10月榜
36氪· 2025-11-11 21:35
文章核心观点 - Token消耗量是衡量AI产品影响力和商业潜力的关键指标,揭示了AI时代的财富密码[4][8] - 企业服务类AI应用在Token消耗榜中占据主导地位,15个产品占比达到50%[5] - 用户规模大的传统平台(如Canva、Indeed)即使AI功能不彻底,也能产生巨大的Token消耗量[6] - 电商平台通过客服机器人、商品描述自动化等应用成为重要的Token消耗场景[7] 全球AI产品Token消耗榜 - Canva以1185.58万用户规模位居Token消耗榜首位,属于消费级应用类别[9] - Indeed招聘平台以455.91万用户排名第二,是企业服务领域的代表[9] - 拉美电商平台Mercado Libre以288.13万用户位列第三,显示电商AI应用的活跃度[9] - 前10名产品用户规模均超过1000万,Perplexity答案引擎以264.01万用户排名第四[9] - 语言学习平台Duolingo以201.80万用户进入前五,消费级应用表现突出[9] 全球总榜TOP100网站访问量 - ChatGPT以63.7亿月访问量稳居第一,同比增长4.43%[13] - New Bing以13.7亿访问量排名第二,但出现0.27%的小幅下滑[13] - Gemini以12.2亿访问量位列第三,实现11.74%的显著增长[13] - 深度求索(DeepSeek)以3.56亿访问量排名第四,增长7.36%[13] - GitHub Copilot以3.02亿访问量位居第五,作为代码助手增长6.10%[13] 增速表现突出的AI产品 - meta.ai实现105.15%的惊人增长,月访问量达到2305万[15] - Sora视频生成工具增长93.90%,访问量达6858万[15] - Creati视频生成工具增长1475.58%,虽然基数较小但增速惊人[22] - 多个AI视频生成工具表现亮眼,Wan AI增长38.42%,Viggle增长39.48%[24] 国内AI产品表现 - 深度求索以3.56亿访问量位居国内榜首,增长7.36%[18] - 纳米AI搜索以2.60亿访问量排名第二,但出现12.10%的下滑[18] - 豆包(抖音)以8843万访问量排名第四,增长2.77%[18] - 百度AI搜索以4886万访问量进入前五,增长9.65%[18] - 文心一言访问量472万,大幅下滑20.47%,面临较大竞争压力[19] 垂直领域AI应用排名 - AI搜索领域New Bing以13.7亿访问量领先,但Perplexity以29.12%增速追赶[27] - AI聊天机器人ChatGPT绝对领先,Gemini、Grok、Claude等竞争激烈[28] - 图片生成工具SeaArt以3382万访问量领先,但Higgsfield以50.82%增速表现突出[31] - 视频生成领域Sora以6858万访问量和93.90%增速双领先[33] - 音乐生成Suno.com以5993万访问量位居第一,增长25.45%[35] 开发者工具与代码助手 - GitHub Copilot以3.02亿访问量遥遥领先,增长6.10%[13] - 代码助手领域竞争激烈,Hostinger、Airtable、Lovable.dev等产品访问量均超千万[36] - cursor代码助手以1749万访问量实现14.78%的较快增长[36] - 国内云服务商普遍面临访问量下滑,阿里云下滑12.97%,腾讯云下滑14.90%[38]
存力中国行北京站释放信号:AI推理进入存算协同深水区
搜狐财经· 2025-11-11 20:38
AI推理时代的发展趋势与挑战 - AI产业已从模型研发阶段进入规模化应用阶段,推理应用呈现爆发式增长,推动Token调用量呈指数级攀升[3] - 金融风控、医疗辅助诊断、电商推荐、投研分析等场景的深度渗透标志着“Token经济”时代到来[3] - 推理阶段的性能、效率与成本控制成为决定技术落地价值的“最后一公里”[1] AI推理规模化落地的核心痛点 - 数据层面:多模态数据爆发式增长使存储面临PB到EB级容量压力,数据格式异构导致高质量数据集构建成本高昂[3] - 性能层面:KV Cache技术广泛应用对存储的高带宽、低时延提出严苛要求,传统架构难以满足存算协同需求[3] - 成本层面:HBM等高端存储介质价格昂贵,叠加推理负载的潮汐性特征,导致中小企业智能化转型门槛居高不下[3] - 存储系统带宽和IOPS不足导致GPU等昂贵算力资源长时间空闲,阻碍AI应用落地[3] 存储架构的技术创新与突破 - 存储架构正经历从“被动存储”到“智算协同”的根本性转变,核心路径在于构建以KV Cache为中心的推理记忆数据湖[4] - 华为UCM统一缓存管理技术通过HBM-DRAM-SSD三级缓存架构,将非活跃KV Cache从显存动态卸载至高性能SSD[4] - UCM技术实现首Token时延最高降低90%、系统吞吐率提升22倍、上下文窗口扩展10倍以上的突破性效果[4] - UCM已于2025年9月在魔擎社区开源,向全行业开放接口,降低中小企业获取先进推理加速能力的门槛[4] 产业生态协同与标准化发展 - 中国信息通信研究院联合华为、中国移动、浪潮等企业成立“先进存力AI推理工作组”,围绕技术研究、标准制定、方案落地与生态构建四大任务[5] - 芯片厂商的3D堆叠技术、存储厂商的架构创新、云服务商的平台优化形成良性互动,实现软硬件协同增效[5] - 移动云探索以太网协议栈替代RDMA方案,为存量资源复用提供可行路径[5] 中国存力产业发展现状 - 截至2025年6月,全国存力总规模达1680EB,先进存储占比提升至28%[5] - 国产分布式存储产品、AI存储系统多次斩获国际权威测试冠军,232层三维闪存芯片达到业界先进水平[5][6] - 闪存主控芯片实现商用突破,产业链自主可控能力持续增强[5][6] 先进存力的战略价值与未来展望 - 先进存力已从“数据容器”转变为AI智算体系中的“协同中枢”,成为破解AI推理性能、成本与效率瓶颈的关键[7] - 通过破解内存墙、容量墙与成本墙,先进存力推动智能化转型从大企业的“奢侈品”转变为中小企业的“必需品”[7] - AI价值不再仅由参数规模定义,而取决于在真实业务场景中实现“快、准、省”的能力[7]