Token 消耗
搜索文档
硅基流动杨攀:2026 年最大的创业机会,是给 Agent「造基建」
Founder Park· 2026-02-06 09:01
文章核心观点 - 2026年1月标志着AI产业进入一个变革加速期,其一个月的变化相当于过去25年里任意半年的总和[4] - AI发展的核心趋势正从工具应用转向以Token消耗为衡量标准的原生应用和劳动力管理,并为Agent构建基础设施成为巨大机遇[6][11][16][22] - 在生产力极度富足、产品同质化的未来,品牌、流量、渠道以及交付结果的能力将构成核心竞争优势[6][26][28] AI Native 应用的定义与标准 - 判断AI原生应用的唯一明确标准是“Token燃烧”,即应用必须通过消耗Token来处理输入、生成输出或执行求解任务[6][11] - AI原生应用对Token的依赖程度越高,其属性就越纯粹[11] - AI时代的业务排行榜应以Token消耗量为核心排名依据,Token消耗量体现了一种权利和影响力[11] 2026年Token消耗与产业增长预期 - 2026年全年,Token消耗量预计将增长100倍,市场将呈现供不应求的态势[12] - 个体需要思考自身Token消耗能否实现100倍增长,否则将落后于整体发展水平[12] - Token消耗的真正瓶颈在于人类操作者,当AI能获得完整任务自主执行时,才能持续消耗Token并产出[12] AI在组织与个人层面的效能差异 - AI在个人层面(如AI Coding)能使生产效率提升十倍,但在组织层面产生的效率提升倍数远低于个人层面[6][14] - 组织层面效率提升受限的根本原因在于团队协作中的沟通速率、信息交换效率和认知对齐问题[15][17] - AI时代尚缺乏适合其特点的软件工程方法论[15] 为Agent构建基础设施的机遇 - AI在许多领域的生产力已经超越人类,例如2025年2月由Agent创建的Neon云端数据库数量已超过人类管理员[16] - 从2025年开始,行业应当停止为人类开发软件,转而直接为Agent构建基础设施[6][21] - 这是一个巨大的机会:如果每人拥有100或1000个Agent,每个Agent每天调用接口和访问数据的频率将远超人类使用手机的频率,产生指数级增长的乘数效应[6][22] - 2026年的最大发展机遇是为AI构建大规模的基础设施,包括运行环境、API接口和数据访问能力[22] AI认知的转变:从工具到劳动力 - 对AI的认知需要从“工具”转变为“劳动力”,AI可以被委托执行任务并交付具体结果[23] - AI时代的领导力体现在个人管理AI Work的数量、每日工作产出和Token消耗水平上,核心差异在于资源管理能力[25] - 有人一天能消耗上亿Token,而有人只能消耗百万Token[25] 生产力富足时代的竞争优势 - 在几乎所有人都能产出80分水平产品且生产成本趋近于零的时代,产品被发现变得极其困难[26] - 因此,拥有品牌、流量、渠道将具备极大的优势,这也是KOL等具备影响力的人群价值高的原因[6][26] - AI时代“交付结果”的重要性日益凸显,因为事物复杂性持续增加,购买结果比购买工具成为更优选择[27][28] - 提供的价值在于将复杂问题内化到服务、产品和能力中[28] 对开发者与从业者的建议 - 品味(Taste)是一种关键的筛选能力,能在同质化的产品环境中识别和突出优质作品[29] - 开发者应深度思考用AI来做什么,避免陷入缺乏商业价值的“程序员垃圾时间”[31][32] - 面对知识爆炸,应采取“有取有舍”的策略:构建个人知识图谱,聚焦核心概念,并对感兴趣领域深度实践[33][35] - 应“Follow builders not influencers”,深入理解事物发展的趋势和底层逻辑,而非仅仅关注技术细节[33]
深度讨论 OpenClaw:高价值 Agent 解锁 10x Token 消耗,Anthropic 超越微软之路开启
海外独角兽· 2026-02-05 20:18
文章核心观点 高价值AI Agent在2026年初已展现出远超预期的效果,开始直接接管复杂任务并嵌入核心工作流,对现有SaaS形态与人机分工方式构成实质性冲击[3][4] 文章从底层视角探讨了Agent的价值边界、基础设施机会、Token消耗爆炸性增长及商业模式变化等重要问题[4] 一、高价值Agent的产品形态与市场影响 - **OpenClaw的核心巧思在于预装Claude Skills生态**,这类似于早期智能手机预装应用超市来降低用户门槛[4][10] 其设计实现了**个人化基础上的长程任务执行**,可7x24小时持续运行,并从工具变为主动Agent[8] 通过**IM Gateway嵌入用户日常沟通流**,实现了“移动指挥,本地执行”的混合场景[8][10] - **OpenClaw与Manus代表了两种发展路径**:OpenClaw是去中心化、高度可配置的路线,能利用分散硬件资源(如个人闲置的Mac Mini)[11] Manus是中心化、“交钥匙”体验的路线,已积累大量高价值用户场景数据,构成认知壁垒[11][12] 两者可能不是取代关系,而是动态演化[11] - **Anthropic的产品策略瞄准高价值场景**,其Claude Code Cowork和Claude in Excel可能打开“10倍微软”的市场[4][14] Claude Code的核心理念是“Code is everything,Bash is all you need”,直接利用命令行执行任务[15] Cowork是其自然延伸,依赖于Opus 4.5能力的飞跃[15] - **Excel是生产力的放大和延伸**,覆盖人群比Coding更广[16] Claude in Excel的核心逻辑是利用Agent通过代码直接操作数据,绕过传统软件复杂的UI交互[16][17] 这种模式可能对试图切分Excel数据分析功能的SaaS公司(如Airtable)构成比微软更大的冲击[20] 但标准传输格式(如.xls)和Human-in-the-loop的校验机制依然重要,这意味着Agent会以插件形式嵌入成熟生态[18] 二、商业模式与定价逻辑的转变 - **高价值Agent的定价逻辑脱离传统SaaS**,开始向“数字员工”价值靠拢[21] 市场已出现定价在**1000至2000美元/月**的高价值Agent服务,有团队人均Token消费已达到**500美元/月**[21] - **Agent的收入来源发生根本性转移**,从切分企业营销或IT预算,转向切分企业庞大的**工资(劳动力)预算**[22] - **高价值Agent必须由真正的行业专家主导**,因为他们具备极深的行业Know-how,能做好Context Engineering并评估AI产出质量[22] 三、Token消耗的爆炸性增长与行业影响 - **2026年Token消耗量预计将有10倍甚至更多的增长**[23] Long-horizon task、Proactive Agents以及多模态是主要驱动力[23] - **开源模型“下限达标”是Token消耗暴涨的重要动力**[24] 智谱GLM-4.7的发布标志着开源模型首次真正触达了在Coding和Agentic场景中的“可用下限”[25] 这将使厂商有机会通过开源模型建立独立的盈利闭环,并倒逼闭源厂商加速冲击能力上限[27] - **Token消耗量是衡量AI-native程度的核心指标**,使用Token的比例越大说明越AI Native[28][29] 传统Chat模式与Agentic模式消耗的Token量级差异巨大,后者是前者的**百倍甚至千倍**[31] 已有单用户Token日均消耗达到**十亿(billion)级别**的案例,未来单人控制的Agent消耗**100亿(10B)甚至更高量级Token**将不再是难事[31] - **Token价值开始出现分化**:模型“压缩”使得小参数模型的Token价值快速逼近大模型;专用推理芯片(如Cerebras)下的Token概念也与英伟达GPU场景不同[33] - **硬件供应可能成为制约瓶颈**,在Agent爆发的驱动下,预计未来一年内GPU将再次进入“买不到”的紧缺状态[37] 四、Agent基础设施的缺失与机会 - **现有互联网基础设施对Agent处于“敌对”状态**,因为数字世界原是为人类设计[38] Agent面临跨平台任务执行困难、网络安全产品未适配、执行长程任务脆弱等问题[38] - **Infra的缺失催生巨大确定性新机会**,包括“构建Agent的Infra”和“给Agent用的Infra”[40] 例如专门为Agent优化的浏览器环境(如BrowserUse)、专用网络和支付系统[40] - **高阶Infra需求是“主动对齐”**,即Agent能主动构建用户数字分身,理解其思维习惯和隐性知识[42] - **Agent沙盒(Sandbox)的演进推高了CPU使用量**,但因其进入门槛低、CPU供应充足且定价无溢价,并未构成高壁垒的独立机会[42][43] 五、隐私与安全范式的转移 - **用户正进入“隐私换效率”的时代**,为了让Agent更好地理解上下文并自动执行任务,愿意让渡极高权限[44] 例如让AI直接操作股票账户,或赋予Agent读取本地所有文件的权限[44] - **当前Agent生态处于类似互联网早期的“田园时代”**,用户为便利而“裸奔”,安全威胁(如恶意软件、钓鱼攻击)预计会大幅增加[47] 行业可能需要经历严重的安全事故才能真正重视安全[47] 六、软件行业的未来:被吞噬还是退化为工具? - **激进派观点认为“软件将被吞噬”**:当Agent能直接操作数据和API时,为人类设计的复杂UI及中间业务逻辑封装将变得毫无意义[48] 传统软件开发中的精细化分工(前端、后端、测试、UI)将失去存在基础[48] 像腾讯TAPD这类项目管理工具或许将不再被需要[49] - **保守派观点认为“软件将退化为工具和数据库”**:软件具备100%准确性、绝对稳定性和流程固化能力,这是概率性Agent无法替代的[52] 在企业里,软件会更多地由Agent通过代码来驱动和操作[52] - **软件的未来壁垒在于“本体论”**:对于To B业务,需要定义清楚企业内部的组织逻辑、隐私边界和业务上下文;在To C领域,则是如何理解个人隐私[52] 七、实现Agent泛化的三种推演路径 - **思路1:人群分层渗透**,针对不同人群出现三种平行产品形态[54]:面向硬核技术人员的Claude Code[54];面向知识工作者的Manus[54];以及最具爆发潜力、以OpenClaw为代表的IM Bot,试图利用社交网络效应实现大众化破圈[55] - **思路2:关于普及形态的争论**:“电脑派”认为Agent普及是从精英向大众缓慢渗透的过程,用户需要学习[56];“手机派”认为Agent必须像智能手机一样做到“零门槛”,可能需要等待科技巨头打造OS级别的深度封装Agent[57][58] - **思路3:屏幕只是过渡,实体机器人才是未来** 目前的屏幕内Agent是为不完美的数字基建“填坑”的临时方案[58] Agent的终极形态必须是进入物理世界,解决实际的交互与体力劳动问题[59]