Workflow
APU (Associative Processing Unit)
icon
搜索文档
GSI (NasdaqGS:GSIT) FY Conference Transcript
2026-01-16 01:02
公司概况 * 公司为GSI Technology,总部位于加州桑尼维尔,是一家拥有30年历史的半导体公司,于2007年上市 [3] * 公司最初是SRAM公司,后通过收购进入AI芯片领域,目前拥有SRAM和APU两大产品线 [4] * 公司采用无晶圆厂模式,自成立起就与台积电合作,关系紧密 [3] * 公司员工总数122人,大部分为工程师,将制造和封装等高人力需求环节外包以控制成本 [5] * 公司拥有144项专利,其中85项专门针对APU技术,并持续提交新申请以保护其技术 [5] 财务状况与融资 * 上一财年(截至3月31日)收入略高于2000万美元,本财年预计同比增长20% [5][27] * 截至9月底,公司拥有现金及现金等价物2500万美元,该数字未包含10月份完成的融资 [6] * 公司于10月份完成了一轮净融资4700万美元,用于支持Gemini 2和新产品Plato的研发 [4][27] * 公司市值约为2.7亿美元,内部人士持股比例为21% [6] * 公司已为APU的研发投入约1.75亿美元,资金主要来源于SRAM业务的利润 [4] SRAM业务 * SRAM业务是公司的传统和支柱业务,为APU的研发提供了资金支持 [4] * 公司拥有业内最高密度和最高性能的SRAM产品线,其中第三代和第四代产品为独家供应,无竞争对手 [6] * 由于独家供应,公司的平均销售价格和毛利率多年来持续增长 [7] * 公司利用其商业产品线开发了抗辐射SRAM,进军航空航天市场 [7] * 抗辐射SRAM的平均销售价格在1万至3万美元之间,毛利率均超过90% [9] * 航空航天SRAM市场正在增长,预计将从几年前的20亿美元增长至2032年的近50亿美元 [9] * SRAM市场整体增长平缓,并非高速增长市场 [44] * 公司历史上已制造和出货超过1亿颗SRAM芯片,拥有成熟的量产制造模型 [28] APU技术与产品路线图 * APU是公司的AI芯片,专注于边缘计算市场 [10] * 公司拥有真正的存内计算架构,与竞争对手的“近存计算”有本质区别,其数据在处理时无需在存储器和计算单元间搬运,消除了冯·诺依曼瓶颈,从而在功耗和延迟上具有优势 [10][33][34] * APU芯片上集成了数百万个位处理器,支持大规模并行处理,远超CPU和GPU的核心数量 [11] * APU的位宽分辨率灵活可变,可在1位到百万位之间任意配置,且每个周期都可改变,能精确匹配模型需求,避免资源浪费,尤其适合量化等低比特应用 [13][14] * 公司目前有两代APU产品:Gemini 1和Gemini 2 [15] * Gemini 1主要用于技术展示,需搭配FPGA板卡使用,适用于地面应用 [16] * 康奈尔大学的研究论文显示,在RAG应用中,Gemini 1架构相比英伟达GPU功耗降低98% [17] * Gemini 2可作为独立芯片销售,更贴近边缘,其硬件已完成并进入量产状态 [17][22] * 下一代产品名为Plato,主要针对边缘的大语言模型应用,通过大幅增加外部存储器带宽来应对庞大的数据库 [19][20] * Plato的设计已启动,计划在2027年初完成流片,2027年夏季获得首颗芯片,预计2028年投入量产 [22][29] * 已有合作伙伴与公司探讨Plato之后的下一代产品,希望采用更先进的制程节点 [23] 市场战略与机遇 * 公司战略聚焦于边缘AI市场,该市场预计将从今年的近70亿美元增长至五年后的超过160亿美元 [10] * 应用从云端向边缘转移的驱动力包括:降低云计算成本、满足军事国防等场景的数据本地化安全要求、以及需要实时决策的低延迟应用需求 [21] * 公司早期重点瞄准军事国防市场,视其为“低垂的果实” [22] * 公司强调自身虽是AI领域的新创公司,但拥有成熟的半导体制造经验和量产能力,这在与无人机等需要大批量生产的客户合作时是关键优势 [28] * 向量搜索是APU的核心应用之一,具体场景包括电子商务、人脸识别、物体检测、药物发现中的分子筛选等 [35][36] 客户进展与政府项目 * 公司已获得总额340万美元的“小企业创新研究”计划第二阶段奖项,合作方包括太空发展局和美国空军 [23] * 去年获得了美国陆军的SBIR第一阶段奖项,近期其中一个第二阶段项目获得了71.5万美元的额外扩展资金,用于对Gemini 2进行光束测试 [23][24] * 公司昨日宣布与G2 Tech合作,为美国国防部和另一家未具名的外国国防机构进行概念验证,该POC金额略高于100万美元 [25] * 该POC项目是一个多模态视觉语言模型自主安防响应系统,结合摄像头和无人机,旨在GPS拒止环境下实现自主运行 [37][38] * 在该POC中,Gemini 2的“首令牌时间”为2.5秒,显著优于GPU约6秒的最佳水平,这对于需要快速反应的场景至关重要 [39] * 公司已提交了价值约600万至1000万美元的SBIR提案,正在等待结果 [25] * 公司还提交了“广泛机构公告”提案,此类项目金额可能高达4000万美元 [26] * 公司正在推进一项“战略融资”计划,可能获得1000万至2000万美元的资金,资金来自私人方、政府机构并由AFWERX匹配 [26] * 公司正与主要国防承包商进行积极对话,旨在建立战略合作关系并共同开发产品,此类合作也可能带来研发资金 [26] 软件与生态建设 * 4700万美元融资的一部分将用于构建Gemini 2成功所需的软件 [29] * 软件工作包括开发更多功能库以及编译器工具链,使客户能够使用Python、PyTorch等高级语言编写自己的算法 [45] * POC项目中的算法由公司直接编写和优化,客户无需自行开发 [47] * 编译器工具链的开发是一个持续进行的项目,将随时间逐步发布不同部分 [48] 商业化预期与收入构成 * 在G2 Tech的POC应用中,公司的收入构成包括硬件和软件两部分:Gemini 2芯片的销售(平均售价约1000美元)以及软件算法的授权许可费和持续的订阅费 [41] * APU业务的增长关键在于将概念验证转化为订单,而软件支持是当前需要完善的重点 [44] * 假设夏季的POC演示顺利,原型机可能在年底前交付,量产预计在2027年 [47] * 除了当前的POC,公司通过SBIR项目也在为未来的其他设计获胜奠定基础 [48]
GSI Technology Defines Edge Strategy to Capture Growth in $2.7 Billion Drone Market
Globenewswire· 2025-11-06 19:00
公司战略与产品发布 - GSI Technology公司宣布其Gemini-II APU的边缘战略,专注于人工智能边缘处理器市场,该市场预计到2030年将达到27亿美元 [1] - 公司专注于无人机等高增长领域,其架构在性能和能效方面提供决定性优势 [1] - 公司近期完成5000万美元股权融资,以推进其路线图,抓住边缘市场机遇 [3] - 下一代APU产品Plato将定位公司参与更广泛的人工智能部署浪潮,进一步渗透嵌入式边缘人工智能应用 [4] 产品性能与技术优势 - Gemini-II APU提供超低功耗和行业领先的首令牌响应时间性能,适用于实时无人机工作负载 [1] - Gemini-II以15W功耗提供复杂的边缘人工智能能力,适用于无人机、国防系统、机器人技术和移动平台 [2] - 该产品在边缘计算环境中以一小部分功耗实现GPU级别的性能,实现实时响应 [3] - 康奈尔大学研究证实,公司的APU架构通过其内存中心设计,在实现GPU级别性能的同时,能耗降低超过98%,检索任务速度比传统CPU快数倍,总处理时间减少高达80% [4] - 在概念验证中,客户观察到首响应时间比替代解决方案快达三倍 [3] 市场定位与机遇 - 全球边缘人工智能处理器市场预计到2030年将达到96亿美元 [3] - 人工智能正从广泛的数据中心部署转向边缘的专用工作负载,为紧凑、高能效设备的需求开辟了新的增长前沿 [3] - 数据中心市场已被资本雄厚的大型现有企业饱和,每GPU功耗接近2kW,而边缘需要完全不同的计算架构 [2] - 公司利用其与国防机构和承包商的既定关系,以及其架构在这些领域人工智能应用的独特优势,优先在无人机和军用车辆市场进行早期边缘人工智能部署 [3] 公司背景 - GSI Technology公司是关联处理单元的发明者,提供真正的内存计算技术,是人工智能和高性能计算处理领域的范式转变 [1] - 公司成立于1995年,是半导体存储器解决方案的领先供应商,总部位于加利福尼亚州桑尼维尔 [5] - 公司资源专注于利用现有核心优势将新产品推向市场,包括用于极端环境的抗辐射存储器产品以及Gemini-I和Gemini-II APU [5]
Compute-In-Memory APU Achieves GPU-Class AI Performance at a Fraction of the Energy Cost
Globenewswire· 2025-10-20 21:00
公司技术突破 - 公司发明的关联处理单元是一种人工智能和高性能计算处理领域的范式转变技术,提供真正的内存计算技术 [1] - 康奈尔大学研究证实,公司的APU CIM架构在大型AI应用中可达到GPU级别的性能,同时因CIM架构的高密度和高带宽内存特性,能耗显著降低 [1] - 康奈尔大学研究团队对公司的Gemini-I APU与主流CPU和GPU进行了基准测试,重点关注在10GB至200GB数据集上的检索增强生成任务 [2] 性能与效率优势 - Gemini-I APU在RAG工作负载上提供了与NVIDIA A6000 GPU相当的吞吐量 [6] - APU的能耗比GPU低98%以上,突显其效率和可持续性优势 [6] - APU的独特设计使其执行检索任务的速度比标准CPU快数倍,总处理时间缩短高达80% [6] - 公司最新发布的第二代APU芯片Gemini-II,可为内存密集型AI工作负载提供约10倍吞吐量和更低延迟,同时进一步提高能效 [4] 市场机遇与应用领域 - 内存计算技术有潜力颠覆价值1000亿美元的AI推理市场 [2] - 技术优势为公司在边缘AI、数据中心、国防等能源效率是关键战略优势的高增长市场带来机遇 [4] - 具体应用场景包括功耗受限的机器人、无人机、物联网设备的边缘AI,以及能源和冷却条件受限的国防和航空航天领域 [3] 行业认可与未来发展 - 相关研究论文发表在ACM上,并在Micro '25会议上展示,这是对商用内存计算设备在现实工作负载下的首批全面评估之一 [2] - 康奈尔大学的研究还为通用内存计算设备引入了一个新的分析框架,提供了优化原则,强化了APU作为可扩展开发平台的定位 [4] - 公司未来的Plato产品将为嵌入式边缘应用提供更强计算能力和更低功耗 [4]