行业趋势与瓶颈 - 现有计算体系在能耗和效率上面临巨大压力,未来需探索模拟计算、类脑芯片及基于类器官的计算等新形态[3] - 全球AI芯片产业规模到2030年有望达到约5万亿美元,其中训练芯片约占1万亿美元,推理/处理芯片有望达到4万亿美元,占比约80%[3] - 2025年是AI从训练时代全面迈入应用推理时代的元年,全球人工智能已进入应用大爆发阶段[5] 技术发展路径 - 未来AI处理芯片将被广泛嵌入眼镜、耳机、手机、笔记本、家电及各类企业设备中,实现无处不在的按需取用[3] - “推理异构化”成为行业趋势,单一芯片难以兼顾AI任务中高算力的需求理解阶段与高带宽的答案生成阶段[6] - 行业核心竞争力将聚焦于芯片架构的灵活适配能力,以应对多模型混合应用的常态[6] 公司战略与创新 - 公司以NPU为核心,推出GPNPU架构,走“推理优先架构”路线,目标实现推理效率百倍级提升[5] - 公司研发第五代GPNPU架构,核心是融合GPU通用性与NPU高能效,以“算力积木”设计和3D堆叠存储为核心创新[6] - 公司致力于通过全栈协同优化,为大模型组合应用与复合智能体部署提供核心算力支撑,实现“百万Token的极致性价比”[6] 公司竞争优势 - 公司自2005年参与并行计算指令集与芯片架构设计,掌握算法芯片化的第一性原理,可实现软硬结合的高性价比设计[7] - 公司沉淀了头部客户资源,具备资本与品牌优势,能吸引全球人才[7] - 公司地处粤港澳大湾区,可利用全球最完善的人工智能与机电一体化产业链,以及深圳的芯片设计、硬件制造、供应链与营销网络,以市场需求驱动研发[7] 行业生态与愿景 - 真正有意义的AI必须让更多人用得起、用得上,当AI使用成本接近水电气基础设施水平时,才能惠及偏远地区学生、基层医院和中小企业[4] - 公司呼吁建立全球统一的推理算力网络标准,以实现不同国家和地区在互联互通的推理网络上共享能力,尤其在医疗与教育领域[7]
云天励飞陈宁对话Hinton:推理时代来临 GPNPU架构如何破局?