公司技术路线与架构突破 - 公司于2025年推出的天数天枢架构,在DeepSeek V3大模型场景下,实测性能领先英伟达Hopper约20%,成为首个实现对国际主流架构实质性超越的国产方案[4][32] - 公司公布了清晰的四代架构路线图,计划在2025至2027年间实现对英伟达Hopper、Blackwell乃至Rubin架构的超越,标志着国产算力从“对标追赶”转向“自主定义”[2][30][34][35] - 2025年落地的天数天枢架构在执行注意力机制计算时,算力实际有效利用率突破90%[5][35] - 2026年将开启“双线超越”,天璇架构对标Blackwell并新增ixFP4精度支持,天玑架构实现全面性能超越并覆盖AI计算到加速计算的全场景[7][37] - 2027年的天权架构将剑指英伟达Rubin,后续将彻底跳出对标框架,转向突破性计算芯片架构设计[8][38] - 公司技术突破由三大核心创新底层赋能:TPC BroadCast(计算组广播机制)、Instruction Co-Exec(多指令并行处理系统)和Dynamic Warp Scheduling(动态线程组调度机制)[10][39] - 公司研发逻辑以问题为导向,针对DeepSeek V3的FP8累加精度不足和矩阵转置开销大等痛点,提供定制化解决方案,在推理场景中带来约10%的性能提升[11][40] 产品性能与市场落地 - 公司产品已服务超300家客户,完成超1000次部署,数千卡集群稳定运行超过1000天[22][33][49] - 公司发布“彤央”系列边端产品,构建覆盖100T至300T实测稠密算力的产品矩阵,标志着其“云+边+端”全场景算力布局成型[18][46] - TY1000算力模组在计算机视觉、自然语言处理、DeepSeek 32B大模型等多个场景中,实测性能优于英伟达AGX Orin,剑指“边端大算力国内第一”地位[21][49] - 在互联网AI领域,公司通过架构优化实现了Token成本减半;在科学探索领域,产品成为多家顶级学府的科研支撑[22][49] - 产品已深入产业场景:在瑞幸咖啡数千家门店处理视频流并支持营销决策;与20个车路云一体化试点城市合作;赋能具身智能机器人[24][51] - 在金融领域将研报生成效率提升70%;在医疗领域将结构化病历生成时间压缩至30秒[24][51] 算力价值主张与软件生态 - 公司提出以高效率、可预期、可持续为核心的高质量算力三维特质,重构算力产业的价值坐标系[12][41] - “高效率”体现为通过全链路优化降低TCO,依托kv cache量化+无损反量化技术将模型推理实际内存使用量降低50%以上[14][43][44] - “可预期性”通过精准的仿真模拟技术实现,让企业在获取芯片前即可预判万卡集群在任意模型下的性能表现,大幅降低试错成本[16][44] - “可持续性”通过通用GPU架构支持全类型数学运算图谱,确保硬件能应对未来算法演进,延长硬件生命周期[16][44] - 公司构建了AI++算力系统新范式,形成从底层AI库、通讯库到上层AI生成式应用、科研探索的全栈支撑能力[18][46] - 软件层面保持与主流编程接口高度兼容,客户仅需投入原计划三分之一的精力即可完成开发调优[25][53] - 公司的天垓系列产品已稳定运行400余种模型及数千种算子,国内新发布大模型在发布当天即可在其平台上跑通[25][53] 行业定位与市场前景 - 公司宣告国产算力正在告别“对标式”的路径依赖,正式驶入自主定义的领航海域[4][32] - 当算力竞争从“量的堆砌”转向“质的较量”,公司证明国产算力不再是实验室备选方案,而是在千亿市场中以现有成果为未来承诺背书[4][33] - 中国通用GPU市场规模已迈入千亿级别,国产化替代需求持续释放,公司凭借技术、产品、生态三重优势站在行业爆发的关键风口[27][55] - 公司采取硬件筑基、软件适配、伙伴协同的三维生态策略,与合作伙伴打通从芯片到系统部署的全产业链,形成完整布局[25][53] - 公司不寻求成为第二个英伟达,而是通过深耕通用算力,确保产品在长达十年的周期内稳定发挥价值,成为具备行业定义能力的长期主义者[25][53]
核心AI场景首超英伟达,一场国产算力的“破局叙事”|甲子光年