Token 消耗 - 财报，业绩电话会，研报，新闻

Token 消耗

搜索文档

硅基流动杨攀：2026 年最大的创业机会，是给 Agent「造基建」

Founder Park· 2026-02-06 09:01

站在年初，硅基流动联合创始人杨攀从 AI Infra 的角度，聊了聊他对于 AI 趋势变化背后的一些思考。以下文章来源于43 Talks ，作者言晏 43 Talks . 如果你厌倦了流于表面的信息，渴望一场智力上的"极限挑战"，43 Talks 将是你汲取养分、淬炼思想的绝佳场域。 2026 年 1 月，这一个月所发生的变化，相当于过去 25 年里任意半年的总和。这是一个大事件频发的时期，以至于像 Clawdbot 这样的产品，都能在一周之内三次更名。只有那些通过燃烧 Token 来解决核心问题的应用，才是真正的 AI Native 应用。 AI 在组织层面产生的效率提升倍数，其实远低于个人层面。 AI 在许多领域的生产力已经超越了人类。从现在开始，我们应该停止为人类开发软件。为 Agent 构建基础设施，是一个巨大的机会。每个 Agent 每天调用接口和访问数据的频率将远超人类使用手机的频率。在几乎所有人都能产出 80 分水平的产品，且生产成本趋近于零的时代，拥有品牌、流量、渠道将具备极大的优势。这也是为什么 KOL 等具备影响力的人群具有如此高的价值。以下是杨攀在 43 Talks 202 ...

深度讨论 OpenClaw：高价值 Agent 解锁 10x Token 消耗，Anthropic 超越微软之路开启

海外独角兽· 2026-02-05 20:18

文章核心观点高价值AI Agent在2026年初已展现出远超预期的效果，开始直接接管复杂任务并嵌入核心工作流，对现有SaaS形态与人机分工方式构成实质性冲击[3][4] 文章从底层视角探讨了Agent的价值边界、基础设施机会、Token消耗爆炸性增长及商业模式变化等重要问题[4] 一、高价值Agent的产品形态与市场影响 - **OpenClaw的核心巧思在于预装Claude Skills生态**，这类似于早期智能手机预装应用超市来降低用户门槛[4][10] 其设计实现了**个人化基础上的长程任务执行**，可7x24小时持续运行，并从工具变为主动Agent[8] 通过**IM Gateway嵌入用户日常沟通流**，实现了“移动指挥，本地执行”的混合场景[8][10] - **OpenClaw与Manus代表了两种发展路径**：OpenClaw是去中心化、高度可配置的路线，能利用分散硬件资源（如个人闲置的Mac Mini）[11] Manus是中心化、“交钥匙”体验的路线，已积累大量高价值用户场景数据，构成认知壁垒[11][12] 两者可能不是取代关系，而是动态演化[11] - **Anthropic的产品策略瞄准高价值场景**，其Claude Code Cowork和Claude in Excel可能打开“10倍微软”的市场[4][14] Claude Code的核心理念是“Code is everything，Bash is all you need”，直接利用命令行执行任务[15] Cowork是其自然延伸，依赖于Opus 4.5能力的飞跃[15] - **Excel是生产力的放大和延伸**，覆盖人群比Coding更广[16] Claude in Excel的核心逻辑是利用Agent通过代码直接操作数据，绕过传统软件复杂的UI交互[16][17] 这种模式可能对试图切分Excel数据分析功能的SaaS公司（如Airtable）构成比微软更大的冲击[20] 但标准传输格式（如.xls）和Human-in-the-loop的校验机制依然重要，这意味着Agent会以插件形式嵌入成熟生态[18] 二、商业模式与定价逻辑的转变 - **高价值Agent的定价逻辑脱离传统SaaS**，开始向“数字员工”价值靠拢[21] 市场已出现定价在**1000至2000美元/月**的高价值Agent服务，有团队人均Token消费已达到**500美元/月**[21] - **Agent的收入来源发生根本性转移**，从切分企业营销或IT预算，转向切分企业庞大的**工资（劳动力）预算**[22] - **高价值Agent必须由真正的行业专家主导**，因为他们具备极深的行业Know-how，能做好Context Engineering并评估AI产出质量[22] 三、Token消耗的爆炸性增长与行业影响 - **2026年Token消耗量预计将有10倍甚至更多的增长**[23] Long-horizon task、Proactive Agents以及多模态是主要驱动力[23] - **开源模型“下限达标”是Token消耗暴涨的重要动力**[24] 智谱GLM-4.7的发布标志着开源模型首次真正触达了在Coding和Agentic场景中的“可用下限”[25] 这将使厂商有机会通过开源模型建立独立的盈利闭环，并倒逼闭源厂商加速冲击能力上限[27] - **Token消耗量是衡量AI-native程度的核心指标**，使用Token的比例越大说明越AI Native[28][29] 传统Chat模式与Agentic模式消耗的Token量级差异巨大，后者是前者的**百倍甚至千倍**[31] 已有单用户Token日均消耗达到**十亿（billion）级别**的案例，未来单人控制的Agent消耗**100亿（10B）甚至更高量级Token**将不再是难事[31] - **Token价值开始出现分化**：模型“压缩”使得小参数模型的Token价值快速逼近大模型；专用推理芯片（如Cerebras）下的Token概念也与英伟达GPU场景不同[33] - **硬件供应可能成为制约瓶颈**，在Agent爆发的驱动下，预计未来一年内GPU将再次进入“买不到”的紧缺状态[37] 四、Agent基础设施的缺失与机会 - **现有互联网基础设施对Agent处于“敌对”状态**，因为数字世界原是为人类设计[38] Agent面临跨平台任务执行困难、网络安全产品未适配、执行长程任务脆弱等问题[38] - **Infra的缺失催生巨大确定性新机会**，包括“构建Agent的Infra”和“给Agent用的Infra”[40] 例如专门为Agent优化的浏览器环境（如BrowserUse）、专用网络和支付系统[40] - **高阶Infra需求是“主动对齐”**，即Agent能主动构建用户数字分身，理解其思维习惯和隐性知识[42] - **Agent沙盒（Sandbox）的演进推高了CPU使用量**，但因其进入门槛低、CPU供应充足且定价无溢价，并未构成高壁垒的独立机会[42][43] 五、隐私与安全范式的转移 - **用户正进入“隐私换效率”的时代**，为了让Agent更好地理解上下文并自动执行任务，愿意让渡极高权限[44] 例如让AI直接操作股票账户，或赋予Agent读取本地所有文件的权限[44] - **当前Agent生态处于类似互联网早期的“田园时代”**，用户为便利而“裸奔”，安全威胁（如恶意软件、钓鱼攻击）预计会大幅增加[47] 行业可能需要经历严重的安全事故才能真正重视安全[47] 六、软件行业的未来：被吞噬还是退化为工具？ - **激进派观点认为“软件将被吞噬”**：当Agent能直接操作数据和API时，为人类设计的复杂UI及中间业务逻辑封装将变得毫无意义[48] 传统软件开发中的精细化分工（前端、后端、测试、UI）将失去存在基础[48] 像腾讯TAPD这类项目管理工具或许将不再被需要[49] - **保守派观点认为“软件将退化为工具和数据库”**：软件具备100%准确性、绝对稳定性和流程固化能力，这是概率性Agent无法替代的[52] 在企业里，软件会更多地由Agent通过代码来驱动和操作[52] - **软件的未来壁垒在于“本体论”**：对于To B业务，需要定义清楚企业内部的组织逻辑、隐私边界和业务上下文；在To C领域，则是如何理解个人隐私[52] 七、实现Agent泛化的三种推演路径 - **思路1：人群分层渗透**，针对不同人群出现三种平行产品形态[54]：面向硬核技术人员的Claude Code[54]；面向知识工作者的Manus[54]；以及最具爆发潜力、以OpenClaw为代表的IM Bot，试图利用社交网络效应实现大众化破圈[55] - **思路2：关于普及形态的争论**：“电脑派”认为Agent普及是从精英向大众缓慢渗透的过程，用户需要学习[56]；“手机派”认为Agent必须像智能手机一样做到“零门槛”，可能需要等待科技巨头打造OS级别的深度封装Agent[57][58] - **思路3：屏幕只是过渡，实体机器人才是未来** 目前的屏幕内Agent是为不完美的数字基建“填坑”的临时方案[58] Agent的终极形态必须是进入物理世界，解决实际的交互与体力劳动问题[59]

Token 消耗

Agent

开源模型

Artificial Intelligence

Artificial Intelligence

OpenClaw

Claude Code