AI推理芯片
搜索文档
云天励飞:做AI推理算力的“加速器”
证券日报· 2025-10-21 00:41
公司业务与产品 - 公司是AI推理芯片领先企业,核心业务为创新算法与先进芯片[2] - 公司基于自研大模型和AI推理芯片技术,推出面向企业级、消费级、行业级三大应用场景的产品[3] - 企业级场景提供AI推理芯片、算力服务及IP授权,应用于SoC开发、大模型服务及服务机器人,近期完成近16亿元AI算力服务订单交付[4] - 消费级场景通过子品牌"噜咔博士"开发儿童智能硬件,并战略投资智能穿戴设备公司,消费级收入占比提升至42.5%[4][5] - 行业级场景收入占总收入比例为10.2%[5] - 公司推出国内首款量产AI智能眼镜,搭载自研大模型"云天天书",具备实时翻译功能[4] - 公司已开发AI耳机、AI手表、AI眼镜等可穿戴设备,并计划推出AI毛绒狗玩具[7][9] 技术实力与研发 - 公司三次获得"吴文俊人工智能科学技术奖"算法、芯片、应用三项大奖[6] - 2025年上半年研发投入为2.02亿元,研发费用占营业收入比例为31.36%[6] - 公司以1.8亿元收购智能穿戴方案设计公司深圳市岍丞技术有限公司,探索大模型与智能可穿戴深度融合[7] 行业前景与市场 - 中国AI推理芯片相关行业市场规模从2020年113亿元增至2024年1626亿元,复合年增长率94.9%,预计2025年达3106亿元[7] - AI技术发展正从训练阶段转向以应用落地为导向的推理阶段[6] - 全球AI玩具市场规模2024年突破110亿美元,预计2030年达580亿美元,年均增速超20%[10] - AI玩具赛道吸引字节跳动、联想创投、京东科技等头部投资方入局[10] 战略布局与发展方向 - 公司将端侧AI作为发力重点,推出子品牌"噜咔博士"及产品"AI拍学机",销量已突破5万部[8] - 公司认为AI推理芯片将贯穿端、边、云形成全域算力网络,未来五年AI将重塑所有终端硬件产品[7] - 公司布局AI玩具赛道旨在重新定义玩具为动态成长伙伴,并赋能亲子关系[10] - 公司探索与自然教育场景结合,如与深圳仙湖植物园合作让儿童识别自然万物[8]
云天励飞:公司长期专注于AI推理芯片的研发设计及商业化
证券日报网· 2025-10-20 20:13
公司技术定位与研发进展 - 公司长期专注于AI推理芯片的研发设计及商业化,是全球第一批提出NPU驱动的AI推理芯片概念并商业化落地的公司[1] - 公司已完成第四代NPU的研发,目前正在推进下一代高性能NPU的研发,将更适合AI推理应用[1] - 公司正在开发多款芯片以适配多样化应用场景,加速卡等推理芯片产品已经实现了市场应用[1] 核心产品DeepEdge10芯片系列 - DeepEdge10芯片系列是公司自主研发的高性能SoC芯片,采用国产14nm Chiplet工艺,内含国产RISC-V核[1] - 该芯片可支持包括Transformer模型、BEV模型、CV大模型、LLM大模型等各类不同架构的主流模型[1] - 芯片已在机器人、边缘网关、服务器等领域实现商业化应用,并为深空探测实验室的自主可控星载计算提供支撑[1]
联合展区重磅登场!半导体行业观察携手湾芯展共启芯时代
半导体行业观察· 2025-10-15 10:48
展会概况 - 人工智能正以前所未有的速度重塑各行各业,算力需求爆发引领半导体产业进入新一轮“万亿级”增长周期 [1] - 湾区半导体产业生态博览会(湾芯展)将于2025年10月15日至17日在深圳会展中心举办,汇聚600余家企业,展示面积达60,000平方米 [1] - 展会同期将举办超20场高峰论坛,深入剖析AI芯片、车规芯片、先进封装、EDA设计工具等多维度的机遇与挑战 [1] 半导体行业观察合作展区 - 半导体行业观察平台拥有微信粉丝91万以上及订阅用户超910,000人,覆盖芯片设计、制造、封测、EDA/IP、设备材料全链条,是3000多家半导体公司CEO的关注渠道 [3] - 联合展区聚焦“架构创新—测试验证—场景落地—车规应用”全核心链路,四家企业以“实物演示+方案解读”形式展示技术 [5][6] - 展区特别甄选15家标杆客户,展示其在芯片设计、制造、封测等关键领域的前沿成果 [6] 参展企业技术亮点 - 德氪微电子展示全球首颗基于毫米波超短距离通信的数字隔离芯片P2507M01/DKI6310E6,隔离通信速率高达5Gbps,延迟20ps级 [8][12] - 苏州国芯科技展示车载汽车安全气囊点火驱动芯片CCL1800B,支持汽车48V低压电源系统,宽供电电压28V~60V,功能安全达ISO26262 ASIL D级别 [13][16] - 华大半导体展出SALPHOENIX系列FPGA芯片,LVDS线速率达1.25Gbps以上,高速串行收发器线速率范围1.2Gbps-12.5Gbps [17][20] - 欧冶半导体展示龙泉560系列车规AI计算处理器,覆盖1-40Tops算力,推动智能汽车第三代E/E架构演进 [28][31] - 锐泰微电子展出M65Q68解串器芯片,传输速率高达12Gbps,Die面积是国际竞品的60% [31][33] - 为旌科技展示VS919H单芯片行泊一体SoC芯片,支持多摄像头及多雷达融合感知计算,提供40Tops@INT8算力的NPU [34][37] - 广东鸿翼芯展示国产首颗动力总成高度集成引擎控制系统芯片HE9788,功能安全达ASIL-D级别 [40][42] - 西安紫光国芯展出第四代低功耗同步动态随机存取存储器,数据传输速率提升至4266Mbps [43][45] - 知合计算展出首代阿基米德系列A210处理器,实现高性能通用计算与高性价比AI推理计算的高效融合 [51][53] 同期论坛与活动 - 展会设置“线上+现场+线下”三维对接体系,联合展区每日举办“细分领域技术沙龙”、“供需精准匹配会”及“技术方案定制咨询”三大互动环节 [57] - 半导体行业观察联合湾芯展举办边缘AI赋能硬件未来创新论坛,上午场聚焦全球算力格局及湾区算力网络建设,下午场探讨AI大模型算力调度及RISC-V商业化实践 [59][60] - 第九届国际先进光刻技术研讨会与湾芯展同期举办,汇聚全球顶尖专家探讨光刻技术最新突破 [61] 主题展区规划 - 展会规划IC设计、晶圆制造、先进封装、化合物半导体四大主题展区,全方位展示半导体产业链各环节前沿技术 [62][63] - IC设计展区展示EDA、芯片设计IP、存储芯片、AI芯片等核心技术,晶圆制造展区汇聚设备与材料供应商,先进封装展区支撑芯片集成度提升,化合物半导体展区聚焦SiC、GaN等第三代材料 [63]
英伟达挑战者,估值490亿
36氪· 2025-10-09 08:08
公司融资与估值 - AI芯片初创公司Groq宣布完成一笔7.5亿美元(约合人民币50亿元)的最新融资,融资后估值为69亿美元(约合人民币490亿元)[3] - 本次融资额超过了7月间的传闻,当时报道称融资额约为6亿美元,估值接近60亿美元[3] - 在短短一年多的时间里,公司估值从2024年8月D轮融资时的28亿美元翻了一倍多[3] - 本轮融资由Disruptive领投,并获得了贝莱德、Neuberger Berman集团有限责任公司和德国电信资本的"重大投资",以及包括三星电子、思科、D1 Capital和Altimeter在内的现有投资者的出资[3] - 据PitchBook估计,Groq迄今已融资超过30亿美元[11] 行业发展与市场趋势 - 全球AI芯片市场正处于高速增长期,2023年市场规模为231.9亿美元,预计至2029年将以31.05%的复合年增长率攀升至1175亿美元[4] - 随着大语言模型从研发走向应用,AI产业重心正从训练阶段转向推理环节[4] - 英伟达2024财年第四季度数据中心GPU收入的40%来自推理处理[4] - 英伟达仍占据全球AI云端训练市场80%的市场份额[18] 公司技术与产品 - Groq以生产优化预训练模型的AI推理芯片而闻名,所开发的芯片被称为语言处理单元(LPU),与通常用于AI系统的图形处理单元(GPU)有着显著区别[7] - 公司致力于打破英伟达的垄断,其产品面向开发者和企业,提供云服务或本地硬件集群两种形式,能够以比其他同类产品低得多的成本维持AI性能[8] - Groq宣称LPU能实现每秒数百token的生成速度,远超常规GPU的推理速度,芯片更强调低延迟和稳定响应,适合对话、搜索、Agent等交互式AI应用,能效比高[15] - 公司不是通用GPU,而是专门为transformer类推理计算设计的芯片,优势在于极高的吞吐和极快的推理速度[15] 公司业务与战略 - Groq由一群前谷歌工程师于2016年创立,创始人乔纳森·罗斯在谷歌工作期间负责开发TPU芯片[7] - 公司提供云服务或本地硬件集群两种形式,可以运行热门模型的开放版本,例如Meta、DeepSeek、Qwen、Mistral、Google和OpenAI的模型[8] - 2024年2月,Groq推出了开发者平台GroqCloud,吸引开发者使用Groq API并租用其芯片的访问权限[8] - 一个月后收购了Definitive Intelligence,以完善其云平台[8] - 9月,公司宣布和中东石油巨头阿美公司的数字和技术子公司签署了一份谅解备忘录,宣称要"在沙特阿拉伯王国建立世界上最大的推理数据中心"[8] - 在商业模式上,Groq自建数据中心,将LPU组成服务器集群,提供云端推理算力租用服务,使得客户无需采购硬件即可尝试服务[9] 公司成长与用户基础 - Groq为超过200万名开发人员的AI应用程序提供支持,而一年前这一数字为35万,用户增长速度迅猛[14] - 公司从2017年获得1000万美元的种子资金开始,经过多轮融资,在2021年4月的C轮融资中筹集了3亿美元,估值超过10亿美元,正式跻身独角兽行列[11][12] - 2024年8月,在由贝莱德私募股权合伙人领投的D轮融资中,Groq筹集了6.4亿美元,公司估值达到28亿美元[13] 竞争格局与挑战 - Groq需要从零建立工具链和开发者社区,而英伟达的CUDA生态是其巨大护城河[16] - 公司当前优势主要体现在中小规模模型推理,大规模模型支持能力仍待验证[16] - Groq的性能数据部分来自于在较旧工艺节点(如14nm)实现的高效设计,如果想在大规模商业化中与英伟达抗衡,必须进入更先进的制程(如4nm),这需要更大资本投入和代工厂资源[16] - 企业对英伟达软硬一体化方案有一定的依赖度,迁移成本不低[16] - 专注大模型训练的Cerebras已提交IPO申请,计划融资10亿美元,估值达80亿美元,共同构成对英伟达的差异化包围[17]
英伟达挑战者,估值490亿
虎嗅· 2025-10-07 18:34
Groq最新融资与估值 - 公司完成7.5亿美元最新融资,融资后估值达69亿美元 [1] - 本轮融资额与估值均超过7月传闻的6亿美元融资额和近60亿美元估值 [1] - 在一年多时间内,公司估值从28亿美元翻倍至69亿美元 [1] - 融资由Disruptive领投,并获得贝莱德、Neuberger Berman、德国电信资本等机构重大投资,以及三星电子、思科等现有投资者出资 [1] AI芯片市场增长与行业趋势 - 全球AI芯片市场2023年规模为231.9亿美元,预计至2029年将以31.05%的复合年增长率增长至1175亿美元 [1] - AI产业重心正从训练转向推理,英伟达2024财年第四季度数据中心GPU收入的40%来自推理处理 [1] - 推理正在定义人工智能时代,行业结构性调整为专注推理优化的芯片厂商提供战略窗口 [2] Groq公司背景与技术定位 - 公司由前谷歌工程师Jonathan Ross和Douglas Wightman于2016年创立,创始团队曾参与开发谷歌TPU芯片 [3] - 公司以生产优化预训练模型的AI推理芯片闻名,其开发芯片被称为语言处理单元(LPU),与GPU有显著区别 [4] - 公司致力于打破英伟达垄断,提供云服务或本地硬件集群,能运行Meta、DeepSeek、Qwen等热门模型的开放版本 [5][6] Groq商业模式与业务进展 - 商业模式为自建数据中心,将LPU组成服务器集群,提供云端推理算力租用服务,客户无需采购硬件 [6] - 2024年2月推出开发者平台GroqCloud,一个月后收购Definitive Intelligence以完善云平台 [6] - 2024年9月与中东石油巨头阿美公司的数字和技术子公司签署谅解备忘录,计划在沙特建立全球最大推理数据中心 [6] - 公司为超过200万名开发人员的AI应用程序提供支持,一年前该数字为35万,用户增长迅猛 [9] Groq竞争优势与挑战 - LPU芯片优势在于极高的吞吐和极快的推理速度,宣称能实现每秒数百token的生成速度,远超常规GPU,且能效比高,适合对话、搜索等交互式AI应用 [11] - 挑战在于需要从零建立工具链和开发者社区以对抗英伟达的CUDA生态,当前优势主要体现在中小规模模型推理,大规模模型支持能力仍待验证 [11] - 公司性能数据部分来自于较旧工艺节点(如14nm)的高效设计,要大规模商业化需进入更先进制程(如4nm),这需要更大资本投入和代工厂资源 [11] 竞争格局 - 专注大模型训练的Cerebras已提交IPO申请,计划融资10亿美元,估值达80亿美元,其策略也是先切细分市场 [12] - 类似竞争者构成对英伟达的差异化包围,但英伟达仍占据全球AI云端训练市场80%的份额,新公司尚未形成系统性威胁 [13]
英伟达挑战者,估值490亿
投中网· 2025-10-07 15:03
公司融资与估值 - Groq公司宣布完成7.5亿美元(约合人民币50亿元)的最新融资,融资后估值达到69亿美元(约合人民币490亿元)[3] - 公司在2024年8月曾以28亿美元的估值融资6.4亿美元,意味着在一年多的时间里其估值翻了一倍多[3] - 据PitchBook估计,Groq迄今已融资超过30亿美元[10] 行业市场趋势 - 全球AI芯片市场在2023年市场规模为231.9亿美元,预计至2029年将以31.05%的复合年增长率攀升至1175亿美元[4] - AI产业重心正从训练阶段转向推理环节,英伟达2024财年第四季度数据中心GPU收入的40%来自推理处理[4] - 英伟达仍占据全球AI云端训练市场80%的市场份额[16] 公司技术与产品 - Groq由前谷歌工程师于2016年创立,创始人乔纳森·罗斯曾负责开发谷歌的TPU芯片[6] - 公司开发的语言处理单元(LPU)是专为Transformer类推理计算设计的芯片,宣称能实现每秒数百token的生成速度,远超常规GPU[13] - 公司提供云服务或本地硬件集群两种形式,其产品能够以比其他同类产品低得多的成本维持AI性能[7] 商业模式与市场拓展 - Groq自建数据中心,将LPU组成服务器集群,提供云端推理算力租用服务,客户无需采购硬件即可尝试服务[8] - 2024年2月,公司推出开发者平台GroqCloud,吸引开发者使用其API并租用芯片访问权限[8] - 2024年9月,公司宣布与中东石油巨头阿美公司的子公司签署谅解备忘录,计划在沙特阿拉伯建立“世界上最大的推理数据中心”[8] 竞争格局与公司前景 - Groq的优势在于极高的吞吐和极快的推理速度,更强调低延迟和稳定响应,适合对话、搜索等交互式AI应用[13] - 公司面临的挑战是需要从零建立工具链和开发者社区以对抗英伟达的CUDA生态,且其大规模模型支持能力仍待验证[14] - 综合来看,Groq在细分市场可能胜出,但短期内仍然难以威胁英伟达的主导地位[15]
聚焦前沿产业:硬科技企业如何破局技术转化与商业价值跨越
第一财经· 2025-09-26 17:56
文章核心观点 - 硬科技前沿产业正成为驱动科技革命与产业跃迁的战略支点 包括推理芯片 存储芯片 AI算法 大模型 新材料和新能源等领域 [1] - 中国硬科技企业通过技术创新与清晰的商业化路径实现从技术领先到商业落地 并将具备核心竞争力的产品输送至全球 [4] - 硬科技企业通过积极开拓新兴市场和应用场景 挖掘全新产业机遇 为自身发展注入活力并反哺产业生态 [10] 从技术领先到商业落地 - 云天励飞是中国最早一批聚焦AI推理芯片赛道的企业之一 具备技术 资本和市场的先发优势 过去10年打造了面向边缘计算 云端大模型推理加速 具身智能三大类的AI推理芯片 [5] - 云天励飞通过国产工艺 安全供应链 上下游联合创新及"算力积木"架构 用5年多时间推出更大算力芯片 提升性价比 [6] - 凯众股份专注于功能性聚氨酯材料和氢化材料的开发与应用 公司正开发两大聚氨酯材料新应用 包括用于新能源电池 储存设备及消费电子领域的隔热减震产品 已有4条生产线于今年初量产供货 [6] - 开普云向AI领域转型 形成"AI算力+智能体+智慧应用"三层战略定位 在安全领域已形成相对成熟的内容安全技术体系及标准化产品和服务 [7] - 中证指数公司已构建覆盖人工智能基础设施 技术支持 末端应用的全产业链指数体系 为市场提供多元化投资标的 [8] 挖掘市场潜力 把握全新产业机遇 - 2025年将是人工智能应用大爆发的元年 AI大模型有望在5年内重新定义所有电子产品 使其成为超级个人助手 企业级AI应用变化更快 2-3年内全球80%的企业将有机会运行在大模型上 [11] - 云天励飞通过打造多个事业部 以消费级 企业级 行业级构建产业生态 帮助终端用户发挥AI推理芯片和大模型价值并转化为生产力 [11] - 开普云拟收购深圳金泰克半导体 源于对AI技术矛盾的预判 存储优化成为突破性价比的关键 存储软硬结合优化可大幅提升吞吐量 [12] - 凯众股份为开发海外市场已在美国 德国设立子公司 并在墨西哥 摩洛哥建厂 目前公司90%销售来自国内 未来海外收入占比有望达到50%左右 [12]
聚焦前沿产业:硬科技企业如何破局技术转化与商业价值跨越
第一财经· 2025-09-26 15:27
文章核心观点 - 硬科技前沿产业(如AI芯片、新材料、人工智能)是驱动中国新一轮科技革命和产业跃迁的战略支点,企业正通过技术创新和商业化落地实现价值跨越 [1] - 硬科技企业从技术领先向商业落地迈进,通过清晰的商业化路径将产品输送至全球,实现技术领跑和规则领跑 [3] - 资本市场通过指数工具(如ETF、股指期货)支撑硬科技产业发展,构建覆盖全产业链的指数体系,衔接产业与资本资源 [6][7] 推理芯片行业 - 云天励飞是中国最早聚焦AI推理芯片赛道的企业之一,具备技术、资本和市场的先发优势,赛道在AI技术发展下不断形成,高性价比国产AI推理芯片需求涌现 [4] - 公司通过国产工艺、安全供应链、上下游联合创新及"算力积木"架构,用5年多时间推出更大算力芯片,选择以芯片架构设计、系统级优化和产业协作搭建应用与技术双轮驱动路径 [4] - AI推理芯片是新赛道,需要市场推广和接受过程,公司通过打造多个事业部以消费级、企业级、行业级构建产业生态,帮助终端用户将芯片和大模型价值转化为生产力 [8] 新材料行业 - 凯众股份专注于功能性聚氨酯材料和氢化材料的开发与应用,主要用于汽车悬架减震系统和底盘制动系统,公司注重求新求变以适应市场变化 [4] - 公司正开发两大聚氨酯材料新应用:一种聚焦隔热、减震功能,用于新能源电池、储存设备及消费电子领域,4条生产线已于2025年初量产供货;另一种结合材料高承载、耐磨、低噪音特性,开发游乐设施、电动叉车、矿山机械等场景产品 [5] - 公司目前90%销售来自国内,为开发海外市场已在美国、德国设立子公司进行市场开发和技术服务,并在墨西哥、摩洛哥建厂面向欧美市场生产供货,未来海外收入占比有望达到50%左右 [9] 人工智能行业 - 开普云从政务AI、能源AI等应用层切入,后为提升通用化AI能力布局AI中台、智能体技术及通用AI算法,形成"AI算力+智能体+智慧应用"三层战略定位 [5] - 在AI技术场景适配方面,安全领域AI技术通用性强,已形成成熟的内容安全技术体系及标准化产品和服务;能源领域结合AI与传统大数据,通过虚拟电厂等场景提升AI渗透率;政务领域因服务个性化是目前AI渗透率最低的,但随着政务标准化提升、基础设施完善及智能体技术发展,为政务AI渗透奠定基础 [6] - 2025年是人工智能应用大爆发元年,AI大模型有望在5年内重新定义所有电子产品,使其成为超级个人助手;企业级AI应用变化更快,2-3年内全球80%的企业将有机会运行在大模型上 [8] 企业战略与并购 - 开普云于2025年8月宣布拟收购深圳市金泰克半导体有限公司,并购源于对AI技术矛盾的预判:在算力逐步国产化但与先进水平存在差距的背景下,存储优化成为突破性价比的关键 [9] - 存储技术的突破及存储与大模型推理的结合能大幅提升产业应用性价比;存储对长上下文对话缓存等很关键,存储软硬结合优化可大幅提升吞吐量;通过全栈式联合优化,公司能弥补产业链短板、发挥整合价值,为客户提供更高性价比的AI服务 [9] - 云天励飞通过国产工艺实现供应链安全,服务中国未来人工智能产业发展 [4] 资本市场支持 - 以ETF为代表的指数产品及股指期货等指数衍生品共同构成指数投资生态,指数功能从表征市场向风险管理工具深化,推动资本市场高质量发展与指数生态完善 [6] - 中证指数公司持续围绕科技创新、区域协调发展等方向布局指数化投资工具,助力社会资本多维度观察、理解资本市场各板块发展态势 [6] - 以人工智能领域为例,公司已构建覆盖基础设施、技术支持、末端应用的全产业链指数体系,通过多维度、全方位指数布局为市场提供多元化投资标的,衔接硬科技产业与资本市场资源 [7]
AI芯片独角兽一年估值翻番,放话“三年超英伟达”,最新融资53亿超预期
36氪· 2025-09-18 16:15
融资情况 - 公司完成7.5亿美元(约53亿人民币)融资,超出最初6亿美元预期目标[1][4] - 公司估值达到69亿美元(约490亿人民币),一年内估值从28亿美元(约199亿人民币)增长超过一倍[1][4][5][6] - 融资由Disruptive领投,贝莱德、路博迈、德国电信资本合伙公司进行重大投资,三星电子、思科系统等现有投资者参与[6] - 公司累计融资总额超过30亿美元(约213亿人民币)[6] 资金用途与业务扩张 - 融资将用于扩大数据中心容量,包括今年和明年的新选址计划[7] - 公司计划在今年宣布首个亚太地区数据中心选址[7] - 客户需求超出当前容量供给,存在未满足的高容量需求[8] 技术优势与产品特性 - 公司专注于AI推理芯片领域,自创全球首个LPU(语言处理单元)方案,硬件称为"推理引擎"[12] - 芯片推理速度较英伟达GPU提高10倍,成本降低至十分之一,测试速度达每秒478 Tokens[14] - 解决方案支持主流开源模型,包括Meta Llama系列、DeepSeek、通义千问、Mistral、谷歌Gemini及OpenAI模型[12] - 产品提供云端服务与本地部署两种模式,本地硬件采用服务器机架式集成设计[12] 团队背景与行业定位 - 创始团队包含谷歌TPU原班人马,CEO乔纳森·罗斯曾完成第一代TPU芯片20%的研发工作[9][10] - 领导层成员具备谷歌、英特尔等知名企业任职经历[9] - 公司定位为英伟达挑战者,目标三年内超越英伟达[12] 行业竞争与市场定位 - 公司致力于打破英伟达在AI芯片制造行业的垄断地位[12] - 创始人强调推理定义了AI当前时代,公司聚焦高速低成本推理基础设施构建[3]
AI芯片独角兽一年估值翻番!放话“三年超英伟达”,最新融资53亿超预期
量子位· 2025-09-18 12:20
融资与估值 - 公司完成新一轮融资,金额高达7.5亿美元(约53亿人民币),超出此前6亿美元的预期[2][6] - 公司当前估值达到69亿美元(约490亿人民币)[2][7] - 与去年8月28亿美元(约199亿人民币)的估值相比,公司在一年内估值翻倍有余[8][9] - 公司自成立以来累计筹集资金超过30亿美元(约213亿人民币)[12] 投资者与资金用途 - 本轮融资由Disruptive领投,贝莱德公司、路博迈集团和德国电信资本合伙公司进行了重大投资[10] - 三星电子株式会社、思科系统公司、D1和Altimeter等现有投资者也参与了本轮融资[10] - 公司计划利用融资扩大数据中心容量,包括今年和明年的新选址,并计划在今年宣布其首个亚太地区的数据中心选址[13][14] 公司背景与技术优势 - 公司成立于2016年,创始团队中很多成员来自谷歌TPU原班人马[16][17] - 公司自创全球首个LPU(语言处理单元)方案,其硬件称为推理引擎,专为快速高效运行AI模型而优化[19] - 公司产品推理速度相较于英伟达GPU提高10倍,成本降低到十分之一[24] - 公司产品支持运行主流开源模型,包括Meta的Llama系列、DeepSeek、通义千问、Mistral、谷歌的Gemini以及OpenAI的模型等[21] 市场定位与发展目标 - 公司以生产优化预训练模型的AI推理芯片闻名,产品主要面向开发团队和企业用户,提供云端服务与本地部署两种模式[16][21] - 公司目标是打破英伟达在AI芯片制造行业的垄断,并计划在三年内超越英伟达[20] - 公司强调其解决方案在大幅降低成本的同时,能保持模型性能,甚至在某些场景下实现效能提升[23]