核心观点 - 亚马逊与AI芯片初创公司Cerebras Systems达成合作,将在亚马逊云科技数据中心内结合双方芯片,提供旨在加速聊天机器人、编码工具等AI服务的新服务[1] - 合作采用“分而治之”策略,将AI推理任务拆分为“预填充”和“解码”两个步骤,分别由亚马逊Trainium3芯片和Cerebras芯片处理[1] - 公司预计其服务将在今年下半年上线,并相信其价格性能比将优于商用GPU,以此与英伟达等竞争对手展开较量[1] 合作细节 - 合作双方未披露交易规模[1] - Cerebras估值达231亿美元,是一家旨在通过构建不依赖昂贵高带宽内存的AI芯片来挑战英伟达的初创公司[1] - 今年早些时候,Cerebras与ChatGPT创建者OpenAI签署了一份价值100亿美元的芯片供应协议[1] - 新服务将使客户能够像点击一样轻松地使用Cerebras芯片[1] 技术架构与策略 - 在亚马逊云科技数据中心内,Cerebras芯片将与亚马逊自研的Trainium3定制AI芯片相连,并使用亚马逊的定制网络技术[1] - 亚马逊Trainium3芯片将负责处理“预填充”阶段,即将用户请求从人类语言转换为AI计算机使用的“令牌”语言[1] - Cerebras芯片将负责处理“解码”阶段,即AI计算机提供用户寻找的答案[1] - 该策略类似于分析师预计英伟达下周将公布的策略,即计划将其GPU与去年12月以170亿美元收购的初创公司Groq的芯片相结合[1] 市场竞争与时间线 - 亚马逊表示,其Trainium3项目距离运行生产工作负载仅剩数月时间,而英伟达与Groq配对的时间线尚不明确[1] - 公司相信其Trainium3以及未来的Trainium4在价格性能比上将继续领先于商用GPU[1] - 新服务预计将在2024年下半年上线[1]
Cerebras Systems, Amazon strike deal to offer Cerebras AI chips on Amazon's cloud