HC1芯片 - 财报，业绩电话会，研报，新闻

HC1芯片

搜索文档

未知机构：华西计算机每日资讯0223169亿融资押注专用芯片Taalas要-20260224

未知机构· 2026-02-24 11:35

涉及的行业与公司 * **行业**：人工智能（AI）芯片、通用智能机器人（具身智能）、AI健康与支付应用、操作系统（Linux）、国际贸易 * **公司**：Taalas（AI芯片初创公司）、蚂蚁集团、智平方（通用智能机器人公司）、英伟达、台积电、英特尔、AMD、高通核心观点与论据 * **AI芯片领域出现“去GPU化”新趋势**：初创公司Taalas获得1.69亿美元融资，押注为特定大模型深度优化的专用芯片，旨在挑战以英伟达GPU为主的现有AI算力格局[1][2] * **论据**：Taalas推出的首款演示芯片HC1专为开源大模型Llama 3.1 8B优化，采用台积电6nm工艺，宣称其生成速度比英伟达H200快73倍，功耗仅为后者的1/10[2] * **蚂蚁集团AI战略加速落地，聚焦健康与支付两大场景**：公司提出以“有钱花”（守护财富）和“有命花”（守护健康）为核心的“两朵花”AI战略，并在2026年春节期间取得显著进展[1] * **论据**：春节期间，支付宝“AI付”和蚂蚁阿福APP用户数双双突破1亿，AI健康业务切入数十万亿规模的大健康市场，AI支付旨在为Agent经济铺设基础设施[1] * **通用智能机器人（具身智能）领域融资活跃，头部公司估值快速攀升**：智平方在完成B轮系列超10亿元人民币融资后，公司估值正式超过百亿人民币[1] * **论据**：这是该公司继2025年半年内连续完成7轮数亿级融资后的又一笔大额融资，使其成为全球融资节奏最快的具身智能企业[1][2] * **全球AI需求强劲，支撑相关经济体出口**：韩国的出口增长势头显示，全球人工智能周期是其重要的支撑力量[3][4] * **论据**：韩国2月前20天经工作日调整后的出口同比增长47.3%，高于1月整月修正后的34%增幅，分析指出这缓冲了其他行业的疲软[3][4] 其他重要内容 * **Linux内核更新适配新一代硬件**：Linux 7.0-rc1系统更新发布，加强了对英特尔Nova Lake、Diamond Rapids以及AMD Zen 6等新一代处理器的适配，并增加了大量新硬件驱动支持[2] * **Linux内核技术进展**：Linux 7.0带来了文件系统改进、Apple USBType-C PHY支持、性能优化，并正式结束Rust实验，确认将长期支持Rust编程语言[3]

Artificial Intelligence

GPU

Embodied Intelligence

Artificial Intelligence

Semiconductor

Robotics

Artificial Intelligence

GPU

Embodied Intelligence

Artificial Intelligence

Semiconductor

Robotics

又一家AI芯片公司：另辟蹊径挑战英伟达

半导体行业观察· 2026-02-20 11:46

公司核心技术：硬编码推理架构 - 核心创新在于将训练完成的AI模型权重直接编码到芯片的晶体管中，从根本上消除计算与内存之间的壁垒，并简化AI设备架构 [2] - 具体架构结合了掩膜ROM召回结构（用于硬编码模型权重）和SRAM召回结构（用于KV缓存和适配功能），实现了计算和存储的超高密度 [10] - 在硬编码部分，其设计能够仅用一颗晶体管存储4比特数据并完成相关的乘法运算，从而获得惊人的密度 [10] - 该架构是纯数字电路，所有设计均从零开始，进行了大量的晶体管级设计和手动布局 [10] - 模型的每一次重大更新（如从Llama 3.1到Llama 4）都需要重新流片新一代HC芯片，但只需修改设计中的两层金属层，而非完全推翻重来 [10][11] 公司产品性能与规划 - 第一代HC1芯片采用台积电6纳米工艺制造，面积为815平方毫米，集成530亿个晶体管，单卡功耗约为200瓦 [12] - 一台搭载十张HC1卡的双路X86服务器整机功耗为2500瓦 [12] - 当前HC1芯片的硬编码部分支持80亿参数，下一代产品单颗芯片将能支持高达200亿参数 [10] - 对于万亿参数模型，仅需几十颗芯片即可支持，远少于市场其他方案 [10] - 公司计划在今年夏季推出硬编码200亿参数Llama 3.1模型的HC芯片，年底将推出通过多卡集群运行前沿大语言模型的HC2架构 [13] - 客户可以通过与台积电共同打造的“晶圆厂最优工作流”，在两个月内将模型权重转化为可部署的PCIe卡 [12] 性能与成本优势 - 根据公司自行测试，其HC1卡在运行Llama 3.1 8B和DeepSeek R1 671B模型时，相比英伟达B200 GPU，展现出显著更低的每Token成本和极低的延迟 [15][17][19] - 由于推理速度极快，无需对查询进行批处理，因此带宽压力很低，多卡组合运行大模型时PCIe总线即可满足需求 [13] - 训练一个模型的成本是从该公司批量定制一颗定制化HC芯片成本的100倍 [11] 公司背景与团队 - 公司成立已有两年半，通过三轮风险融资募集超过2亿美元，目前研发投入3000万美元，账上仍有超过1.7亿美元资金 [3][5] - 公司总部位于多伦多，目前拥有25名员工，大部分是来自AMD、苹果、谷歌、英伟达和Tenstorrent的资深工程师 [5] - 联合创始人兼首席执行官Ljubisa Bajic曾是Tenstorrent的创始人，并在AMD和英伟达有深厚的架构设计背景 [3] - 联合创始人兼首席运营官Lejla Bajic和联合创始人兼首席技术官Drago Ignjatovic也均拥有AMD和Tenstorrent的资深工程背景 [4][5] - 产品副总裁Paresh Kharya曾担任谷歌云AI基础设施产品管理总监，负责GPU和TPU硬件及软件栈 [5] 行业竞争格局 - AI推理加速领域存在多种技术路径，包括Cerebras Systems、SambaNova Systems、Groq（被英伟达以200亿美元收购）和Graphcore（被软银以6亿美元收购）等公司采用的大容量SRAM或晶圆级阵列方案 [2] - 传统GPU和AI XPU（如英伟达和AMD的产品）需要借助HBM堆叠DRAM来匹配计算带宽 [2] - 该公司的硬编码推理方案旨在挑战现有AI推理方案的极限，提供差异化的高性能、低成本解决方案 [2][17]