Workflow
ASIC架构
icon
搜索文档
非GPU赛道,洗牌
半导体行业观察· 2025-12-20 10:22
文章核心观点 - 全球算力市场长期由英伟达GPU垄断的格局正在松动,非GPU芯片势力崛起已势不可挡 [1][2][6] - 全球算力产业正朝着打破单一架构、不同技术路径百花齐放的局面发展,GPU与非GPU路线将并行发展 [9][10][11] - 非GPU路线在成本、能效比、场景适配性上更契合当下AI主流应用场景,尤其在推理领域增长潜力强劲,中国市场渗透率领先全球 [15][16][21] - 在非GPU技术路线中,可重构计算路线因能兼顾灵活性与高能效比,发展势头迅猛,有望实现对国际主流芯片的弯道超车 [24][32][33] 全球算力产业格局变革 - 近期海内外算力产业密集事件频发,共同指向英伟达GPU垄断格局松动 [2] - 海外方面,谷歌TPU获得Anthropic价值约1486亿元人民币的订单,英特尔计划以约112.9亿元人民币收购SambaNova,Groq两年融资超213亿元人民币 [2][3][5] - 国内方面,沐曦股份科创板上市首日午盘大涨687.79%,总市值达3298.82亿元;清微智能获得超20亿元融资;国内AI芯片创企密集披露并购、上市计划 [1][2] - 2025年上半年,中国非GPU服务器市场占比已达30%,预计到2028年将接近50% [16] - 驱动变革的核心维度包括:需求端推理场景算力需求增加及行业需求多元化;技术端需突破传统架构瓶颈;生态层面需打破单一架构垄断 [8][9] 非GPU技术路线分析 - **ASIC路线**:代表企业包括谷歌、亚马逊云科技、寒武纪、昆仑芯 [5][30] - 核心优势在于性能、功耗及支持深度定制,例如寒武纪思元370算力达256TOPS,是前代产品2倍;昆仑芯R200性能可达主流GPU的1.5倍 [30] - 不足在于研发周期长、成本高,且硬件一旦固化难以适应算法快速迭代 [31] - **可重构计算路线**:代表企业包括清微智能、SambaNova、Groq [5][32] - 核心优势在于硬件架构可随算法需求动态适配,兼顾灵活性与高能效比 [36] - 相比行业同类型产品,可实现成本整体降低50%、能效比提升3倍 [32] - 清微智能可重构芯片累计出货量已超3000万颗,2025年算力卡订单累计超3万张,在全国十余座千卡规模智算中心落地 [32] - 其自研TSM-LINK算力网格技术支持多芯片点对点直连,能规避传统交换机的带宽瓶颈与延迟问题 [33] 技术路线对比与发展趋势 - **GPU路线**:优势在于通用性强、生态成熟,在通用大模型训练、图形渲染等场景地位稳固,但面临功耗高、成本高、算力利用率较低及“内存墙”限制等挑战 [11][36][39] - **非GPU路线**:优势在于能效比高、全生命周期成本低、场景适配性强,更契合AI推理、边缘计算等主流应用场景,但生态成熟度与软件工具链尚不及GPU [21][22][39] - 两条路线并非简单替代关系,而是各有优劣,将并行发展 [11][23] - 全球算力产业重心正从唯硬件性能论,转向软件、模型、场景适配的全栈协同布局,以实现算力效能最大化 [12] - 中国厂商在非GPU赛道竞争力提升,话语权正在增强 [13] 国内头部芯片企业布局 - 北京AI核心产业规模已达近3500亿元,占全国近一半,其芯片代表企业昆仑芯、寒武纪、摩尔线程、清微智能的发展是产业缩影 [25] - 四家企业中,摩尔线程为GPU阵营,寒武纪、昆仑芯主攻ASIC路线,清微智能发力可重构计算路线 [29] - 可重构计算路线发展势头更猛,因其解决了GPU低效和ASIC固化的痛点,更契合AI产业向场景细分转型的趋势 [32] - 清微智能下一代芯片有望带来大幅度性能跃升,实现对国际主流前沿AI芯片的弯道超车 [33]
36氪首发 | 从快手独立的AI芯片公司融资数亿元,视频压缩性能超英伟达
36氪· 2025-07-01 10:10
融资与公司背景 - 凌川科技完成数亿元A轮融资 由北京市人工智能产业投资基金和快手集团领投 亦庄产投 顺禧基金 九智资本等跟投 融资将用于下一代芯片研发 SL200量产扩产及海外市场拓展 [1] - 公司成立于2024年3月 由北京市人工智能基金与快手集团共同发起 前身为快手集团异构计算与芯片事业部 拆分独立源于SL200芯片在快手部署数万颗后节省超预期成本 [1] - 团队规模增长三倍 研发人员占比80%以上 70%为硕士学历 20%为博士学历 60%员工具有十年以上从业经验 累计申请中外专利超百项 [4] 产品与技术 - SL200芯片集成视频编码 AI推理 多核CPU功能 部署量近数万颗 服务7亿用户 获评2023世界互联网大会"创新发展典型案例" [1] - SL200为国内首款集成多功能ASIC芯片 支持万分之一超低故障率 视频压缩性能在MSU大赛超越英特尔 英伟达 单路处理成本降低40% [2] - 下一代芯片针对大模型训练推理场景设计 支持LLM 文生图 文生视频 推荐算法等高算力需求 重点适配快手可灵文生视频模型 [2] - Transtreams架构融合CPU与NPU协同运作 支持同一套代码在CPU与NPU间无缝切换 TC编译器可自动分配任务 提升资源利用率 [3] 市场与应用 - SL200芯片覆盖快手 阿里 百度等互联网数据中心 并应用于广播电视 智慧城市 智能巡检等场景 合作案例超20个 海外进入东南亚新加坡 巴西市场 [4] - 公司与华为 超聚变 浪潮等厂商形成行业解决方案 下一代芯片已与多家大模型公司完成适配测试 将拓展自动驾驶机器人 低空经济等边缘计算场景 [4] - 全球AI芯片市场由英伟达主导 但大模型推理场景催生ASIC架构需求 公司通过ASIC架构降低推理成本 单颗芯片处理36路视频任务 较传统方案节能30% [1] 竞争优势 - 互联网基因使公司能从应用反推芯片设计 客户需求直接定义产品 传统芯片公司难以复制这一优势 [1] - 开发类CUDA编程接口 适配PyTorch框架及主流大模型推理引擎 降低客户迁移成本 [2] - 团队核心成员深度参与NeurIPS'21等国际竞赛 主导多项北京市 上海市"卡脖子"技术攻关项目 [4]