HC1芯片
搜索文档
未知机构:华西计算机每日资讯0223169亿融资押注专用芯片Taalas要-20260224
未知机构· 2026-02-24 11:35
涉及的行业与公司 * **行业**:人工智能(AI)芯片、通用智能机器人(具身智能)、AI健康与支付应用、操作系统(Linux)、国际贸易 * **公司**:Taalas(AI芯片初创公司)、蚂蚁集团、智平方(通用智能机器人公司)、英伟达、台积电、英特尔、AMD、高通 核心观点与论据 * **AI芯片领域出现“去GPU化”新趋势**:初创公司Taalas获得1.69亿美元融资,押注为特定大模型深度优化的专用芯片,旨在挑战以英伟达GPU为主的现有AI算力格局[1][2] * **论据**:Taalas推出的首款演示芯片HC1专为开源大模型Llama 3.1 8B优化,采用台积电6nm工艺,宣称其生成速度比英伟达H200快73倍,功耗仅为后者的1/10[2] * **蚂蚁集团AI战略加速落地,聚焦健康与支付两大场景**:公司提出以“有钱花”(守护财富)和“有命花”(守护健康)为核心的“两朵花”AI战略,并在2026年春节期间取得显著进展[1] * **论据**:春节期间,支付宝“AI付”和蚂蚁阿福APP用户数双双突破1亿,AI健康业务切入数十万亿规模的大健康市场,AI支付旨在为Agent经济铺设基础设施[1] * **通用智能机器人(具身智能)领域融资活跃,头部公司估值快速攀升**:智平方在完成B轮系列超10亿元人民币融资后,公司估值正式超过百亿人民币[1] * **论据**:这是该公司继2025年半年内连续完成7轮数亿级融资后的又一笔大额融资,使其成为全球融资节奏最快的具身智能企业[1][2] * **全球AI需求强劲,支撑相关经济体出口**:韩国的出口增长势头显示,全球人工智能周期是其重要的支撑力量[3][4] * **论据**:韩国2月前20天经工作日调整后的出口同比增长47.3%,高于1月整月修正后的34%增幅,分析指出这缓冲了其他行业的疲软[3][4] 其他重要内容 * **Linux内核更新适配新一代硬件**:Linux 7.0-rc1系统更新发布,加强了对英特尔Nova Lake、Diamond Rapids以及AMD Zen 6等新一代处理器的适配,并增加了大量新硬件驱动支持[2] * **Linux内核技术进展**:Linux 7.0带来了文件系统改进、Apple USBType-C PHY支持、性能优化,并正式结束Rust实验,确认将长期支持Rust编程语言[3]
又一家AI芯片公司:另辟蹊径挑战英伟达
半导体行业观察· 2026-02-20 11:46
公司核心技术:硬编码推理架构 - 核心创新在于将训练完成的AI模型权重直接编码到芯片的晶体管中,从根本上消除计算与内存之间的壁垒,并简化AI设备架构 [2] - 具体架构结合了掩膜ROM召回结构(用于硬编码模型权重)和SRAM召回结构(用于KV缓存和适配功能),实现了计算和存储的超高密度 [10] - 在硬编码部分,其设计能够仅用一颗晶体管存储4比特数据并完成相关的乘法运算,从而获得惊人的密度 [10] - 该架构是纯数字电路,所有设计均从零开始,进行了大量的晶体管级设计和手动布局 [10] - 模型的每一次重大更新(如从Llama 3.1到Llama 4)都需要重新流片新一代HC芯片,但只需修改设计中的两层金属层,而非完全推翻重来 [10][11] 公司产品性能与规划 - 第一代HC1芯片采用台积电6纳米工艺制造,面积为815平方毫米,集成530亿个晶体管,单卡功耗约为200瓦 [12] - 一台搭载十张HC1卡的双路X86服务器整机功耗为2500瓦 [12] - 当前HC1芯片的硬编码部分支持80亿参数,下一代产品单颗芯片将能支持高达200亿参数 [10] - 对于万亿参数模型,仅需几十颗芯片即可支持,远少于市场其他方案 [10] - 公司计划在今年夏季推出硬编码200亿参数Llama 3.1模型的HC芯片,年底将推出通过多卡集群运行前沿大语言模型的HC2架构 [13] - 客户可以通过与台积电共同打造的“晶圆厂最优工作流”,在两个月内将模型权重转化为可部署的PCIe卡 [12] 性能与成本优势 - 根据公司自行测试,其HC1卡在运行Llama 3.1 8B和DeepSeek R1 671B模型时,相比英伟达B200 GPU,展现出显著更低的每Token成本和极低的延迟 [15][17][19] - 由于推理速度极快,无需对查询进行批处理,因此带宽压力很低,多卡组合运行大模型时PCIe总线即可满足需求 [13] - 训练一个模型的成本是从该公司批量定制一颗定制化HC芯片成本的100倍 [11] 公司背景与团队 - 公司成立已有两年半,通过三轮风险融资募集超过2亿美元,目前研发投入3000万美元,账上仍有超过1.7亿美元资金 [3][5] - 公司总部位于多伦多,目前拥有25名员工,大部分是来自AMD、苹果、谷歌、英伟达和Tenstorrent的资深工程师 [5] - 联合创始人兼首席执行官Ljubisa Bajic曾是Tenstorrent的创始人,并在AMD和英伟达有深厚的架构设计背景 [3] - 联合创始人兼首席运营官Lejla Bajic和联合创始人兼首席技术官Drago Ignjatovic也均拥有AMD和Tenstorrent的资深工程背景 [4][5] - 产品副总裁Paresh Kharya曾担任谷歌云AI基础设施产品管理总监,负责GPU和TPU硬件及软件栈 [5] 行业竞争格局 - AI推理加速领域存在多种技术路径,包括Cerebras Systems、SambaNova Systems、Groq(被英伟达以200亿美元收购)和Graphcore(被软银以6亿美元收购)等公司采用的大容量SRAM或晶圆级阵列方案 [2] - 传统GPU和AI XPU(如英伟达和AMD的产品)需要借助HBM堆叠DRAM来匹配计算带宽 [2] - 该公司的硬编码推理方案旨在挑战现有AI推理方案的极限,提供差异化的高性能、低成本解决方案 [2][17]