PPIO创始人姚欣:闲置率高达八成的国产GPU,如何盘活成「真算力」?丨智算想象力十人谈
雷峰网·2026-01-20 18:50

公司发展历程与战略选择 - 公司于2018年边缘算力与CDN市场竞争白热化时成立,毅然切入边缘云领域[3] - 创始团队拥有PPTV分布式平台的成功经验,其创业逻辑是将C端算力整合经验应用于B端[3] - 初期在“先找供给”与“先找需求”间徘徊,商业难以闭环,直至2020年疫情导致线上流量激增,才跑通增长曲线[3] - 2023年,在GPU贸易利润暴涨时,公司拒绝“稳赚不赔”的算力倒卖生意,选择聚焦AI推理市场[3] - 公司营收实现指数级增长,2024年营收已达5.58亿[4] - 2024年7月,公司在世界人工智能大会上成为国内首个推出兼容E2B的Agent沙箱的公司[4] 技术演进与业务布局 - 2022年进入GPU领域,最初服务于云游戏和云渲染的分布式GPU架构[9] - 2023年帮助国内头部模型厂商搭建了第一代推理平台服务,成为首个推理Infra客户[9] - 2024年重点聚焦出海,集成大量开源模型,推出一整套MaaS平台[10] - 2024年初,业务再向上延伸至PaaS层,推出为AI Agent场景设计的Agent沙箱[11] - 公司已从边缘云、GPU推理平台发展到Agent沙箱,成为具备全栈技术能力的AI云服务商[6] - 技术路线的核心挑战是“为看不见的需求做技术”,需为未来可能达十亿、百亿规模的市场提前进行技术储备和研发[5][12] 商业模式与核心能力 - 公司价值观强调“价值创造”,不做单纯的算力贸易,而是致力于做有技术附加值的东西[15] - 商业模式是整合汇聚大量闲置的分布式算力,并将其转化为云服务,技术附加值体现在将闲置算力token化[15] - 整合的算力资源包括:游戏显卡(如4090、3090)、上一代训练GPU(如被H100替换的A100)、以及利用率仅10%-20%的国产GPU智算中心[16] - 选择聚焦推理市场而非训练,因为推理追求极致的成本性价比,这与公司整合分布式闲置资源以降低算力使用门槛的能力相匹配[17] - 公司拥有独特的分布式云技术栈,建立在分散、碎片、异构的基础设施上,与传统云厂商基于集中式、标准化数据中心的架构完全不同[27] 市场定位与竞争策略 - 公司目标客户群体是AI初创公司和开发者,过去两年主要为此两类人群提供服务[24] - 观察到新的AI应用消耗量巨大,其token消耗可能比上一代应用直接提升10倍甚至100倍[25] - 以海外对标公司E2B为例,其在硅谷的用量一年内增长了400多倍,从4万多增长到1600多万[21] - 认为在Agent Infra层面,云大厂的影响力相比PC和移动时代已大幅削弱,原因在于:GPU Infra架构是近三年新兴领域,大厂先发优势不明显;AI成本高促使开发者追求跨云、多云架构,避免厂商锁定[22][23] - 竞争策略强调“不绑定+开源”,与国内四五十款主流开源框架对接合作,基于开源和可迁移性方便开发者,不将GPU与CPU捆绑销售[23] 运营现状与未来展望 - 公司平台拥有4000多个节点,这些节点多为零售型IDC,可在闲置期将机器托管至平台供调用[28] - 调度策略灵活,对延迟敏感的应用就近调用,对成本敏感的应用可调度至电价更低的地区(如新疆电费是北京的1/3)或利用全球时差进行跨区域调度[29] - 过去一年,公司平台上的token消耗增长了一百倍以上[35] - 未来的挑战在于需求侧,需等待大规模爆发的需求出现,尤其是对时延敏感的需求[32] - 公司战略判断领先,2023年即提出“聚焦推理、聚焦开源、海外优先”,这使其抓住了后续的DeepSeek等机会[37]

PPIO创始人姚欣:闲置率高达八成的国产GPU,如何盘活成「真算力」?丨智算想象力十人谈 - Reportify