Workflow
彤央TY1000
icon
搜索文档
算力通胀终结者!凭一招把大模型Token成本砍到1/2
创业邦· 2026-01-28 20:58
行业核心痛点:算力通胀与效率困局 - 行业面临“算力通胀”,企业为追赶GPT-4/5能力陷入参数竞赛,但大量算力被浪费,智能效益未线性增长[2] - 大规模训练集群中,算力有效利用率仅约40%,推理场景下利用率甚至不足20%[2] - 算法迭代快(约每六个月巨变)与硬件研发周期长(两年以上)严重错位,导致针对上一代模型优化的专用芯片交付即面临淘汰,加速算力折旧[2][3] 公司战略:聚焦高质量算力 - 天数智芯提出“高质量算力”新战略,核心定义为高效率、可预期、可持续,不再单纯强调芯片峰值参数[3][5] - 公司发布架构路线图,计划在2025年至2027年间,通过天枢、天璇、天玑、天权系列架构,实现对英伟达Hopper、Blackwell及下一代Rubin架构的对标与超越[8] - 2025年推出的天枢架构,通过自研核心技术,实现算力效率较行业平均提升60%,在DeepSeek V3场景性能比英伟达Hopper架构高20%[8] 技术解决方案:提升效率与控制成本 - 通过kv cache量化与无损反量化技术,将模型推理的实际内存占用削减50%以上,降低对昂贵DDR存储的依赖[10] - 利用自研IX-SIMU软件系统,实时追踪存储市场价格,为客户推算性价比最高的硬件组合[10] - 在头部互联网客户的Chatbot场景中,其单机性能比国际方案提升一倍以上,每Token成本下降二分之一[17] - 通过提供与主流框架兼容的接口,客户仅需花费其他产品1/3的精力即可完成开发调优,降低迁移门槛[17] 产品创新:端侧算力与形态下沉 - 推出“彤央TY1000”等系列算力模组,尺寸小巧但拥有媲美云端的大算力,推动算力形态从数据中心下沉至物理世界[12][14] - 彤央系列包括TY1100、TY1100_NX及算力高达300TOPS的TY1200,旨在为具身智能和工业机器人提供强大端侧算力[14] - 在DeepSeek 32B大模型及计算机视觉场景下,彤央TY1000实测性能全面优于英伟达AGX Orin,特别是在自然语言处理上表现突出[14] 商业化应用与市场验证 - 公司已拥有300多家行业客户与1000多次实际部署,数千卡集群稳定运行超1000天[19] - 具体应用案例包括:瑞幸数千家门店的智能运营、太平金科信贷风控提效、视源科技打造的数万间智慧课堂[19] - 在金融领域,帮助研报生成效率提升70%;在医疗领域,将结构化病历生成时间缩短至30秒[18] - 公司联手多家硬件厂商和解决方案提供商,建设算力生态,旨在实现算力普惠[21]
天数智芯公布四代架构路线图及边端产品“彤央”
中国经营报· 2026-01-26 23:07
公司战略与产品路线图 - 公司公布四代GPU架构路线图,全面对标并计划超越国际厂商 具体为:2025年推出的“天枢”架构已超越英伟达Hopper,2026年“天璇”和“天玑”架构将先后对标及超越英伟达Blackwell,2027年“天权”架构计划超越英伟达Rubin [2] - 公司推出“彤央”系列边端算力产品,包括TY1000、TY1100、TY1100_NX和TY1200,完成“云+边+端”全场景算力布局 [2] - “彤央”系列产品标称算力均为实测稠密算力,覆盖100T到300T范围,其中TY1200以300TOPs性能支撑AIPC等前沿领域,剑指国内边端大算力第一 [2] 产品性能与市场应用 - 在实测中,“彤央TY1000”在计算机视觉、DeepSeek 32B大语言模型、具身智能VLA模型及世界模型等多个场景的性能优于英伟达AGX Orin [2] - 公司产品与解决方案已服务超300家客户、完成超1000次部署,“彤央”系列已落地具身智能、工业自动化、瑞幸咖啡数千家门店、20个车路协同试点城市 [3] - “天枢”架构支持从高精度科学计算到AI精度计算,其AI芯片在执行注意力机制相关计算时,算力的实际有效利用效率达到90%以上 [3] 技术架构演进细节 - “天璇”架构新增ixFP4精度支持 [3] - “天玑”架构实现全场景AI与加速计算覆盖 [3] - “天权”架构融入更多精度支持与创新设计 [3] 公司愿景与生态建设 - 公司董事长兼CEO表示,AI算力需以全栈自研筑牢生态根基,以开放合作定义发展新范式,以长期主义共筑产业未来 [3] - 公司愿与伙伴携手让自主通用GPU成果惠及千行百业,共促国产算力生态繁荣 [3]