Workflow
TY1100
icon
搜索文档
从一杯咖啡里的算力说起
华尔街见闻· 2026-01-27 17:56
行业前景与市场格局 - 中国通用GPU市场规模预计到2029年有望达到7153亿元,未来5年复合增长率高达29.5% [4] - 行业已进入去伪存真的兑现大考阶段,落地困难与生态割裂是现实难题 [5][8] - 多家国产GPU厂商已完成上市,以争夺未来市场 [4] 公司战略与产品路线图 - 公司公布了横跨2025至2027年的四代架构路线图,旨在逐步超越英伟达的Hopper、Blackwell及Rubin架构 [6][15] - 四代架构分别为天数天枢、天数天璇、天数天玑、天数天权 [6] - 第一阶段(2027年前)目标是对标并超越行业标杆,第二阶段将转向创新和定义超级计算芯片架构 [15] - 天数天枢架构的效率较行业平均水平提升60%,在DeepSeek V3场景性能平均比Hopper架构高约20% [13] 产品发布与性能 - 新发布“彤央”系列四款边端AI算力产品,覆盖100T至300T算力区间 [6] - 彤央TY1000在计算机视觉、自然语言处理、DeepSeek 32B大模型等多个场景实测性能全面优于英伟达AGX Orin [33] - 彤央系列产品形态多样,包括标准模组TY1000、集成ARM CPU的TY1100、大显存高性价比的TY1100_NX以及300TOPs算力终端TY1200 [34] 技术理念与算力标准 - 公司提出“回归算力本质”和“做越野车”思维,以应对复杂应用场景 [10][11] - 定义了“高质量算力”三大标准:高效率(优化客户TCO)、可预期(构建“算力仿真驾驶舱”实现所见即所得)、可持续(软件适配过去及未来算法) [12] 生态构建与客户迁移 - 致力于降低客户迁移门槛,承诺客户现有代码几乎一行不用改 [18][19] - 已支持400余种模型,国内新大模型发布当天可跑通,客户仅需1/3开发调优精力即可完成部署 [20] - 生态兼容性是赢得客户认可的关键因素之一 [21] 商业落地与应用案例 - 首次公布各行业应用情况,展示了规模化落地的真实样本 [23] - 在互联网领域实现单机性能翻倍、Token成本减半、人力节省1/3 [23] - 在金融领域研报生成效率提升70%,量化分析响应速度提升30% [23] - 在医疗领域结构化病历生成时间缩短至30秒/份,肠胃镜病灶精准定位能力提升30% [23] - 已累计服务超300家客户,完成超1000次行业部署 [25] 物理AI与边端算力布局 - 物理AI被视为下一场宏大战役,类似于4-5年前的生成式AI爆发前夜 [28] - 公司通过“彤央”系列产品卡位物理AI赛道,解决算力落地“最后一公里”难题 [36] - 边端产品是连接AI与物理世界的关键媒介,旨在为机器人等提供环境感知与交互能力 [29][30] - 已在具身智能、工业智能、商业智能、交通智能四大核心场景展示应用 [36][42] 增长引擎与市场机遇 - 未来两大核心增长引擎是推理侧的“Token经济”与边端侧的放量 [38] - AI计算重心正从训练端加速向推理端拓展,每次Token生成都消耗算力 [40] - 公司在“云+边+端”全方位覆盖,具备增长基础 [40] - 与格蓝若机器人、比依电器、瑞幸咖啡等达成深度合作,并在20个试点城市开展车路云一体化合作 [42] 公司定位与竞争优势 - 公司定位为中国智能社会底层不可替代的赋能者,提供高性能、低门槛、广生态的算力 [43] - 护城河在于基于通用架构的创新设计、七年全栈自研积累、超300家客户的真实使用以及全方位产品覆盖 [40] - 被视为观察中国硬科技从“模仿”走向“定义”的典型样本 [44]
天数智芯发布四代架构路线图:预期于2027年超越英伟达Rubin架构
IPO早知道· 2026-01-27 13:49
公司战略与架构路线图 - 公司发布以“高效率、可预期、可持续”为核心的“高质量算力”设计目标,旨在打造AI++算力系统新范式,并预期于2027年超越英伟达Rubin架构 [2] - 公司公布四代架构路线图:2025年天枢架构超越Hopper;2026年天璇架构对标Blackwell、天玑架构超越Blackwell;2027年天权架构超越Rubin;2027年后转向突破性架构设计 [4][5] - 未来3年,公司将基于四代架构陆续发布多款产品,持续提升计算性能 [2][5] - 公司提出“高质量算力”三大核心特质:高效率(优化TCO)、可预期(部署前预判性能)、可持续(适配算法演进) [7] - 公司打造AI++算力系统新范式,统一芯片内与芯片外构建算力系统,建立软件驱动算力的全新模式 [9] 核心技术细节与性能 - 天枢架构支持从高精度科学计算到AI精度计算,在执行注意力机制相关计算时,算力实际有效利用效率达90%以上 [11] - 天枢架构通过TPC BroadCast、Instruction Co-Exec、Dynamic Warp Scheduling等多项核心技术创新,使其效率较当前行业平均水平提升60% [11] - 基于效率优势,天枢架构在DeepSeek V3场景的平均性能比英伟达Hopper架构高约20% [11] - 天璇架构新增ixFP4精度支持;天玑架构实现全场景AI与加速计算覆盖;天权架构融入更多精度支持与创新设计 [11] 新产品发布:“彤央”边端算力系列 - 公司发布“彤央”系列边端算力产品,完成“云+边+端”全场景算力布局 [13][14] - 彤央系列四款产品:TY1000算力模组(699pin接口,便携部署);TY1100算力模组(集成ARM v9 12核CPU与自研GPU);TY1100_NX算力终端(更大显存,高性价比);TY1200算力终端(300TOPs极致性能,面向AIPC、具身智能) [14] - 彤央全系列产品的标称算力均为实测稠密算力,覆盖100T到300T范围 [16] - 在计算机视觉、自然语言处理、DeepSeek 32B大模型、具身智能VLA模型及世界模型等多个场景实测中,彤央TY1000性能全面优于英伟达AGX Orin [16] - 公司目标是将彤央系列做到边端大算力国内第一,推动生成式AI向“会做事”的物理AI转型 [16] 多行业应用落地成果 - 公司产品已在互联网、金融、医疗、科研等领域规模化落地,并在具身、工业、商业、交通智能等领域拥有标杆案例 [19] - 天垓通用GPU已稳定运行400余种模型、数千个已有算子与100余种定制算子,国内新大模型发布当天便能跑通 [21] - 互联网AI领域:实现单机性能翻倍、Token成本减半;大模型适配达成95%算子复用 [21] - 科学探索领域:千卡集群稳定运行1000多天,已落地国内多家顶级学府 [21] - 金融领域:研报生成效率提升70%,量化分析响应速度提升30% [21] - 医疗领域:结构化病历生成时间缩至30秒/份 [21] - 彤央系列已落地应用:为格蓝若机器人提供算力支撑;推动工业产线自动化升级;在瑞幸咖啡数千家门店处理视频流数据;与“车路云一体化”20个头部试点城市合作验证车路协同方案 [23] - 公司产品已服务超300家客户、完成超1000次部署,商业化闭环进入放量增长阶段 [25] 生态合作与行业观点 - 公司与硬件厂商、解决方案提供商等多家生态伙伴签署战略合作协议,完善国产AI算力生态闭环 [27] - 中国工程院院士刘韵洁指出,AI算力需兼顾量与质,实现软硬件高效协同及全场景赋能,并肯定公司自主创新、生态共建的发展之路 [27] - 公司董事长兼CEO表示,AI算力需以全栈自研筑牢生态根基,以开放合作定义发展新范式 [29]
瑞幸背后的芯片,藏不住了
量子位· 2026-01-26 18:14
文章核心观点 - 瑞幸咖啡门店运营背后依赖的“眼睛”是边缘侧AI算力,其关键支撑是国产通用GPU公司天数智芯的“彤央”系列产品[1][3][4][6][7][8] - 天数智芯通过发布彤央系列边端算力产品,展示了其在边缘计算场景的落地能力,并披露了从云端到边缘的完整技术路线图,其长期目标是对标乃至超越英伟达等行业标杆[8][9][35][36][54] 彤央系列产品发布与特性 - 天数智芯在上市后不久即发布“彤央”系列四款边端算力产品,该系列名称寓意高能效计算与边端核心算力枢纽,专为真实业务现场设计[9][12][13][14] - **彤央TY1000**:标准699Pin接口模组,口袋大小,提供近200T稠密算力,在CV、NLP推理及32B参数的DeepSeek-R1模型推理等场景表现不弱于主流国际方案,多负载综合效率超过英伟达AGX Orin典型配置[16][17][18][20][21] - **彤央TY1100**:采用12核ARM v9架构CPU,系统级算力更充沛,面向多传感器融合、边缘数据预处理等复杂场景,定位为完整的边缘计算底座[22][23][24][25] - **彤央TY1100_NX**:针对显存容量和性价比敏感用户,配置更大显存,提升多模型并行、长序列推理的稳定性,保持即插即用部署[26][27] - **彤央TY1200**:定义为算力终端,算力规格达300 TOPS,是面向终端形态的整体方案,目标客户包括希望将AI能力直接集成进设备的行业客户[28] - 产品组合覆盖从算力模组到终端的不同部署需求,并在接口和形态上实现与主流产品的Pin-to-Pin兼容,降低客户迁移成本[29][31][32] 产品商业化落地与应用场景 - 彤央系列产品已在实际场景中应用,并非仅为发布[33] - 在**机器人领域**,与格蓝若机器人合作进入企业应用[33] - 在**工业侧**,比依电器等制造企业用于设备智能化升级[33] - 在**商业零售场景**,瑞幸咖啡是典型案例[10][33] - 在**交通领域**,已参与多个车路云一体化试点[33] - 公司通用GPU已稳定运行400余种主流模型,并强调Day 0适配能力,例如DeepSeek模型在其平台上的适配和推理已成为客户实际部署的一部分[46] - 公司累计交付芯片数量已超过5.2万片,服务客户超过300家[49] - 具体应用成效包括:互联网AI客服算力成本压缩一半且单机性能翻倍;金融行业研报生成效率提升约70%;千卡规模集群已实现超过1000天的稳定运行[49] 公司技术路线与长期战略 - 天数智芯不满足于国产替代,长期目标是对标乃至超越英伟达等行业标杆[36] - 公司披露了明确的架构路线图[37] - **2025年**:推出“天枢架构”,超越英伟达Hopper,支持高精度科学计算到AI精度计算,AI芯片执行注意力机制时算力有效利用效率达90%及以上,测试显示其效率较行业平均水平提升60%,在DeepSeek V3场景平均性能比Hopper架构高约20%[39][40] - **2026年**:推出“天璇架构”(新增ixFP4精度支持,对标Blackwell)和“天玑架构”(实现全场景AI与加速计算覆盖,超越Blackwell)[41] - **2027年**:规划“天权架构”,目标全面超越英伟达Rubin架构[42] - 技术路线图由TPC Broadcast、Instruction Co-Exec、Dynamic Warp Scheduling等底层技术能力支撑,这些技术构成了公司在指令级并行、资源调度和算力利用率上的核心优势[43][45] - 公司选择了一条更难的通用GPU全栈自研路线,涵盖架构、指令集、编译器到软件栈,与自研芯片或专用NPU路线形成差异[52]