Workflow
AGX Orin
icon
搜索文档
算力通胀终结者!凭一招把大模型Token成本砍到1/2
创业邦· 2026-01-28 20:58
行业核心痛点:算力通胀与效率困局 - 行业面临“算力通胀”,企业为追赶GPT-4/5能力陷入参数竞赛,但大量算力被浪费,智能效益未线性增长[2] - 大规模训练集群中,算力有效利用率仅约40%,推理场景下利用率甚至不足20%[2] - 算法迭代快(约每六个月巨变)与硬件研发周期长(两年以上)严重错位,导致针对上一代模型优化的专用芯片交付即面临淘汰,加速算力折旧[2][3] 公司战略:聚焦高质量算力 - 天数智芯提出“高质量算力”新战略,核心定义为高效率、可预期、可持续,不再单纯强调芯片峰值参数[3][5] - 公司发布架构路线图,计划在2025年至2027年间,通过天枢、天璇、天玑、天权系列架构,实现对英伟达Hopper、Blackwell及下一代Rubin架构的对标与超越[8] - 2025年推出的天枢架构,通过自研核心技术,实现算力效率较行业平均提升60%,在DeepSeek V3场景性能比英伟达Hopper架构高20%[8] 技术解决方案:提升效率与控制成本 - 通过kv cache量化与无损反量化技术,将模型推理的实际内存占用削减50%以上,降低对昂贵DDR存储的依赖[10] - 利用自研IX-SIMU软件系统,实时追踪存储市场价格,为客户推算性价比最高的硬件组合[10] - 在头部互联网客户的Chatbot场景中,其单机性能比国际方案提升一倍以上,每Token成本下降二分之一[17] - 通过提供与主流框架兼容的接口,客户仅需花费其他产品1/3的精力即可完成开发调优,降低迁移门槛[17] 产品创新:端侧算力与形态下沉 - 推出“彤央TY1000”等系列算力模组,尺寸小巧但拥有媲美云端的大算力,推动算力形态从数据中心下沉至物理世界[12][14] - 彤央系列包括TY1100、TY1100_NX及算力高达300TOPS的TY1200,旨在为具身智能和工业机器人提供强大端侧算力[14] - 在DeepSeek 32B大模型及计算机视觉场景下,彤央TY1000实测性能全面优于英伟达AGX Orin,特别是在自然语言处理上表现突出[14] 商业化应用与市场验证 - 公司已拥有300多家行业客户与1000多次实际部署,数千卡集群稳定运行超1000天[19] - 具体应用案例包括:瑞幸数千家门店的智能运营、太平金科信贷风控提效、视源科技打造的数万间智慧课堂[19] - 在金融领域,帮助研报生成效率提升70%;在医疗领域,将结构化病历生成时间缩短至30秒[18] - 公司联手多家硬件厂商和解决方案提供商,建设算力生态,旨在实现算力普惠[21]
研报 | 英伟达发布开源Isaac GR00T N1,预计2028年全球人形机器人市场产值达40亿美元
TrendForce集邦· 2025-03-19 16:41
文章核心观点 英伟达GTC 2025发表的Isaac GR00T N1通用人形机器人基础模型有望加速研发进度、缩短产品上市准备期,推升全球人形机器人市场产值于2028年接近40亿美元,且英伟达在人形机器人领域已完整布局产品技术,其建立的生态系将维持封闭,为公司构筑“护城河” [1][4] 分组1:行业趋势 - 英伟达GTC 2025发表的Isaac GR00T N1通用人形机器人基础模型具备完整资料集、多模式输入和开源特性,可加速研发进度、缩短产品上市准备期,预期该领域产品提前放量,2028年全球人形机器人市场产值接近40亿美元 [1] 分组2:模型对比 - Figure AI和Google分别推出的Helix和Gemini Robotics架构与GR00T N1皆整合动作与思考模型提升自主决策能力,但英伟达模型的数据完备度、部署弹性略胜一筹 [2] - 对比GROOT N1、Gemini Robotics、Helix三款模型,在推出厂商、日期、技术架构、功能特点、开源与否、主要应用方面存在差异 [3] 分组3:英伟达布局 - 英伟达创办人黄仁勋看好人形机器人发展,公司已在该领域完整布局产品技术,硬件端有适用于不同类型机器人的嵌入式AI运算系统 [3] - 英伟达Omniverse聚焦训练模拟与数字孪生,多家中国人形机器人大厂搭载其训练平台,加上发表的机器人开源物理引擎、生成合成数据技术及GR00T N1,打造出完整生态圈 [4] 分组4:商业模式 - 尽管GR00T N1开源,但训练参数与硬件配置有一定绑定,使用该模型的开发商预计仍采用英伟达硬件解决方案,其生态系将维持封闭,为公司构筑“护城河” [4]