算力效率
搜索文档
云天励飞董事长陈宁:以GPNPU架构推动算力效率大幅提升
中证网· 2025-12-04 18:37
核心观点 - AI行业竞争焦点正从追求“更聪明”转向追求“更高效、更安全、更普惠”的系统性竞争 [1] - 实现AI普惠未来的关键在于显著降低计算成本与能耗,并推动技术大规模落地应用 [1][2] AI行业发展趋势与瓶颈 - 现有计算体系在能耗和效率上面临巨大压力,算力成本急剧攀升成为AI发展的真正瓶颈 [1] - 模拟计算、类脑芯片及基于类器官的计算等新方向在理论上具备功耗和通信优势,但基于脑细胞类器官的计算研究仍处早期,不足以承担大规模AI负载 [1] - GPU本质是通用计算架构,并非为神经网络量身定制,在大模型时代面临效率挑战 [1] - 全球AI芯片产业规模到2030年有望达到约5万亿美元,其中训练芯片约占1万亿美元,面向终端与行业侧的推理/处理芯片有望达到4万亿美元,占比约80% [3] - 随着智能体能力下沉,AI处理芯片将被广泛嵌入眼镜、耳机、手机、笔记本、家电及各类企业设备 [3] 公司战略与技术路径 - 云天励飞将以NPU为核心,推出通用神经网络处理器架构,走“推理优先架构”路线 [1][2] - 公司目标是通过深度优化矩阵/向量单元、存储层级和带宽利用,将100万个token的生成成本从约1美元压到1美分,实现百倍级效率提升 [2] - 公司已向国际相关机构建议,推动建立统一的AI处理芯片与推理网络标准,以实现不同国家和地区在互联互通的推理网络上共享能力,尤其在医疗与教育领域实现“AI for All” [3] 区域产业生态与竞争力构建 - 中国长三角地区在算法与软件开发方面优势明显,粤港澳大湾区在硬件制造与应用落地上更具活力 [2] - 仅做基础研究不落地应用会变成“象牙塔”,仅追逐短期应用不推动底层架构演进则会透支未来竞争力 [2] - 真正具备全球影响力的AI生态,是“基础理论+专用算力+大规模场景”相互强化的结果 [2]
更聪明的AI还是更高效的AI?“AI教父”辛顿对话云天励飞陈宁
证券时报网· 2025-12-03 22:44
行业核心观点 - AI的未来竞争焦点从“更聪明”转向“更高效、更安全、更普惠”的系统性竞争 [1] - AI的关键瓶颈正从算法转向算力效率,下一阶段主战场是让AI成为像水电气一样的基础能力 [8] AI算力效率瓶颈与趋势 - 现有计算体系在能耗和效率上面临巨大压力,需探索模拟计算、类脑芯片等新计算形态以提升功耗和通信能力 [2] - GPU本质是通用计算架构,并非为神经网络量身定制,大模型时代需解决在多大能耗和成本下让多少人用得起的问题 [2] - 公司推出GPNPU架构,走推理优先路线,目标是将100万个token的生成成本从约1美元压到1美分,实现百倍级效率提升 [2] - 算力效率成为下一阶段关键瓶颈,基础理论、专用算力与大规模场景需相互强化 [3][6][7] AI向善与普惠未来 - AI发展需同步推进能力提升与安全边界、技术治理机制和社会共识的建立 [4] - 真正有意义的AI必须让更多人用得起、用得上,使用成本需接近水电气等基础设施水平 [5] - AI向善的底线是不仅要“不作恶”,更要“有益且可及”,需平衡风险可控与成本可负担 [5] 全球AI竞争格局与产业前景 - 普惠能力被视为下一阶段全球AI竞争的核心指标 [6] - 到2030年,全球AI芯片产业规模有望达到约5万亿美元,其中训练芯片占1万亿美元,推理/处理芯片占4万亿美元(占比80%) [7] - AI处理芯片将广泛嵌入各类终端设备,实现无处不在、按需取用,公司建议推动建立统一的AI芯片与推理网络标准以实现“AI for All” [7]
性能损耗压至1/3以下,立体密算破解“安全与算力两难”
21世纪经济报道· 2025-11-26 18:48
技术体系核心观点 - 立体密算体系通过融合国产芯片、国密算法与可信计算3.0,构建覆盖算力、网络、存储、数据与AI全流程的内生安全防护体系[1][2] - 该体系实现了从“单点防御”到“体系化内生安全”的范式跃迁,将防护范围扩展至数据处理全生命周期的每一个环节,实现“可用不可见”的安全目标[2] - 通过芯片底层的可信硬件加速、国密算法硬件化等机制,将安全方案带来的性能损耗降至传统加密方案的1/3以下[2] 技术架构与优势 - 体系采用五层架构,从底层的算力与密码能力层到顶层的可信AI计算层,依托国产芯片构建“信任根”,实现从硬件、操作系统到云平台的全域可信[2] - CPU内生安全技术在推广中基本处于免费状态,解决了成本难题;分布式密码资源池技术汇聚数据中心所有CPU的密码算力,数据在本地CPU直接加密,降低网络延迟并规避明文传输风险[3] - 该体系是业界首个将云、AI模型、算力与数据端到端安全融为一体的体系[3] 行业应用与落地 - 公司首先将技术应用于自身运营的50多个云计算中心,承载政府与大型国企关键业务,随后推向交通、公安政法、金融等高敏感数据行业[4] - 在交通领域,于西部某智慧高速项目规模化部署,以立体密电箱和超融合一体机本地化部署,在ETC支付场景中兼顾数据安全与通行效率,例如广州至深圳虎门路段通过匝道预交费提升通行能力[4] - 在公安与金融领域,通过分布式密码资源池技术解决跨区域数据传输安全难题,使每个CPU具备独立密码算力且与计算资源解耦,已在多个公安机房与金融跨数据中心场景落地[5] - 在医疗领域,与中国国新控股合作,在密态环境中开展医疗数据建模,实现数据全量计算无特征损失并可远程验证彻底销毁[5] 未来发展规划 - 2024至2026年,公司将重点推进立体密算在智慧高速、智慧路网、车路协同等交通场景的深化应用,并持续拓展公安、金融、医疗等领域的落地实践[5] 生态合作与战略 - 公司确立开放合作的生态战略,致力于联合产业链上下游构建标准化、可监督的安全基础框架,将自身定位为AI开放架构中的“安全操作系统”[6] - 通过开放可信的API接口与主流AI框架无缝对接,赋能算力供应商、算法开发者与应用方,并建立生态合伙人机制实现战略协同[6] - 计划联合科研机构与实验室,围绕大模型训练、智能体协作等方向推动行业标准制定,为我国人工智能产业建立长期安全护栏[7] - 生态合作模式为基于立体密算底座与伙伴共同研发行业解决方案,例如在金融领域实现政府数据与金融机构的安全对接,支撑快速放贷等业务[7][8]
联想集团召开2025创新科技大会 充分释放AI价值
经济观察网· 2025-05-09 09:57
算力效率升级 - 公司推出AI推理加速算法集,融合MLA多头潜在注意力机制与混合精度量化技术,推理性能较业界最优方案领先20% [1] - AI编译优化器通过自动化算子替换与路径优化,降低训练与推理成本各15%以上 [1] - 专家并行通信算法针对MoE架构通信瓶颈,推理延时降低3倍,网络带宽利用率达90% [1] - AI训推慢节点自愈系统首创故障预测技术,实现百卡秒级、万卡十分钟级故障自愈,集群稳定性行业领先 [1] - 万全异构智算3.0版本发布,已在国家级高质量AI集群、行业级与科研级智算等场景取得领先实践成果 [1] 绿色算力技术 - 单相浸没"飞鱼"仿生散热技术支持下一代600W芯片散热,最大功耗提升20% [2] - 双循环相变浸没系统散热能力较传统方案翻倍,系统PUE低至1.035,全球领先 [2] 算力服务优化 - 算力服务"成本-效能"双优运营系统包含智能调度引擎与FinOps引擎,提升集群资源利用率13%,精准识别58%无效实例 [2] 存储解决方案 - 推出全新存储组合包括Lenovo ThinkSystem DM/DG/DE系列及联想问天DXN分布式存储系列,覆盖AI、HPC、大数据分析等场景 [2] - 存储方案提供高性能、高可靠且可扩展的解决方案,打造跨边缘到核心云的统一数据基座 [2] 战略方向 - 公司通过构建强大、高效、稳定、绿色的混合式基础设施,助力混合式人工智能快速落地 [3] - 产品组合旨在助力行业客户在AI时代加速创新并释放AI价值 [3]