公司概况与市场定位 - 公司Rebellions AI是一家韩国人工智能推理芯片初创公司,成立于2020年9月,总部位于首尔[3][5] - 公司是韩国首家人工智能芯片独角兽企业,估值超过10亿美元,可能达到15亿美元或更高[8] - 公司将自己定位为“第二代”人工智能加速器,认为第一代产品因缺乏灵活性和适应性而未取得巨大成功,自身作为后起之秀更具优势[2][3] - 公司最初目标是为高频交易公司打造AI推理加速芯片,但计划已扩展至与英伟达、AMD等公司的数据中心级AI加速器竞争[3] 核心竞争优势与战略联盟 - 公司获得了韩国两大财阀的支持:SK集团旗下的SK Telecom和SK Hynix均为其投资者,三星集团旗下的三星风投也是其投资者,并且三星是其代工厂合作伙伴[1][8][9] - 公司是唯一一家获得三大HBM堆叠内存制造商中两家(三星和SK海力士)投资的公司,并得到韩国两家最大电信公司(KT Corp和SK Telecom)的支持[1][8] - 公司与Arm Holdings达成合作,成为其Arm Total Design生态系统的一部分,便于客户集成其AI加速器[10] - 公司与Marvell合作,利用其SerDes、芯片间互连和先进封装技术,为特定地区客户打造定制化AI加速器[10] - 公司从Alphawave Semi获得UCI-Express-A芯片间互连控制器授权[30] 融资历程与资本背景 - 公司在2020年和2022年完成A轮融资,共筹集6100万美元[8] - 2024年B轮融资由KT Corp(原韩国电信)领投,沙特阿美风险投资部门参与[8] - 2024年C轮融资由Arm Holdings领投,三星风投、和硕联合创投、韩国开发银行等机构参与[8] - 2024年12月,韩国电信旗下AI芯片初创公司Sapeon Korea与公司合并,SK Telecom因此成为投资者,Sapeon Korea此前曾获SK海力士投资[8] 创始团队与技术背景 - 公司由四位联合创始人创立,首席执行官朴成铉拥有麻省理工学院电气工程和计算机科学双硕士学位,曾在英特尔、三星移动、SpaceX星链部门和摩根士丹利工作[5] - 首席技术官吴镇旭曾在KAIST、微软、德州仪器和IBM研究院从事研究工作,主要方向为近似计算、粗粒度可重构阵列和神经网络加速器[7] - 首席产品官金孝恩曾在Maxwave、三星电子和医疗设备公司Lunit工作[7] - 首席商务官Marshall Choy曾是SambaNova的创始团队成员,此前在Sun Microsystems和Oracle有超过20年的工作经验[2][3] 产品技术与架构 - 公司产品线包括用于高频交易的Ion芯片(台积电7纳米)、Atom AI推理加速器(5纳米)以及数据中心级的Rebel系列芯片(三星4纳米)[10] - Rebel芯片采用粗粒度可配置阵列架构,其“神经核心”上任意两个处理单元之间的路由可编程,形成可扩展的网状互连[11][13] - 每个神经核心配备4 MB的L1 SRAM内存,支持FP16、FP8、FP4、NF4和MXFP4多种计算精度[16] - 单个神经核心在FP16精度下性能为16万亿次浮点运算/秒,在FP8精度下为32万亿次浮点运算/秒[16] - 公司通过将多个芯片互连形成更大计算复合体,例如Rebel Quad由四个Rebel Single芯片组成[25] 产品性能与规格 - Rebel Quad在FP16精度下可提供1 petaflops运算速度,在FP8精度下可提供2 petaflops运算速度[27][30] - Rebel Quad配备4组HBM3E内存,总容量144 GB,总带宽4.8 TB/秒[27] - Rebel Quad采用PCI-Express卡规格,功耗为600瓦[27][30] - 与竞争对手相比,Rebel Quad与英伟达H200性能相当(FP8性能高出3.4%),但每瓦性能高出20.7%;其性能约为英伟达B200的45%,但功耗仅为后者的60%[30] 生产制造与供应链 - 公司目前使用三星的4纳米工艺制造Rebel系列芯片,并正在推动三星的4纳米工艺升级[10] - 公司计划利用三星即将推出的2纳米工艺创建混合平台[10] - 公司采用三星的ICube-S中介层和封装技术,与台积电的CoWoS-S技术类似[27] - 公司同时使用三星和SK海力士的HBM3E堆叠内存[1][18] 软件生态与部署 - 公司软件栈基于PyTorch原生实现,采用Triton推理引擎和vLLM开源库管理推理键值缓存[32] - 公司开发了自己的集体通信库RBLN CCL,类似于英伟达的NCCL库[32] - 公司拥有名为Raise的推理服务层,类似于英伟达的Dynamo推理堆栈,并已接入Ray分布式推理框架[34] 市场进展与客户 - Rebel Single已于2024年11月完成流片,Rebel Quad正在向部分客户提供样品以进行验证[32] - 公司目标客户包括自主人工智能中心和区域性新云平台,特别是在亚洲、非洲或中东等可能需要不受美国出口管制限制的AI加速器的地区[10]
一家芯片新贵,组团对抗英伟达