ONNX

搜索文档
华为能够挑战英伟达的 CUDA 吗?
傅里叶的猫· 2025-05-06 20:07
英伟达的软件护城河 - 英伟达的竞争优势核心在于CUDA生态系统,包括专有编程模型、丰富库和与PyTorch的深度整合 [2][5] - CUDA起源于2007年,通过免费提供和开发者社区建设解决了先有鸡还是先有蛋的问题,最终在2012年因AlexNet训练成功获得认可 [6][7] - CUDA的转换成本极高,开发者需重写代码并失去成熟库和社区支持,PyTorch等框架也依赖CUDA作为后端 [8][10] 华为的三管齐下战略 - 自主研发CANN软件栈和MindSpore框架,试图复制PyTorch+CUDA的全栈体验 [11][12] - 深化PyTorch兼容性,通过torch_npu适配器连接昇腾硬件,但存在版本兼容性和稳定性问题 [11][20][22] - 投入ONNX开放标准优化,实现跨硬件模型部署,允许英伟达训练模型在昇腾芯片上推理 [25][27] 华为软件生态的现状与挑战 - CANN 8.0版本被宣传为重要进展,但开发者反馈其使用困难且缺乏社区支持,昇腾910C推理性能仅为H100的60% [13][17] - 华为模仿英伟达早期策略,派驻工程师协助客户迁移代码,如百度、腾讯等 [16] - 开发者社区活跃度低,知乎用户抱怨文档杂乱且故障排查资源有限,与英伟达的成熟生态差距显著 [13][16][22] 华为与PyTorch的整合进展 - 华为2023年加入PyTorch基金会,通过torch_npu适配器实现昇腾支持,但代码未并入主库导致维护挑战 [19][21] - PyTorch基金会表态支持硬件多样性,华为的理事会席位可能推动其贡献被正式采纳 [23] - 开发者指出昇腾对PyTorch第三方扩展支持不足,部署大规模模型存在兼容性问题 [22] ONNX在华为战略中的角色 - ONNX作为模型"PDF格式",使英伟达训练模型可导出并在昇腾芯片部署,华为维护专用ONNX Runtime优化内核 [25][26] - 该方案适合中国市场,允许训练依赖英伟达硬件而推理转向华为,但部分PyTorch操作无法完美转换 [27] 长期竞争前景 - 华为需多年构建成熟生态,英伟达CUDA优势积累耗时18年,当前开发者不满可能随社区扩大转化为资源 [29] - 人工智能驱动的软件优化(如AI CUDA工程师技术)可能加速华为性能差距缩小 [18] - 模型部署是近期突破口,如DeepSeek R1案例显示英伟达训练模型可在昇腾运行,但全栈替代仍需时间 [28][29]
传贾扬清新公司被估价数亿美元,将“卖身”GPU巨头英伟达
搜狐财经· 2025-03-28 04:46
文章核心观点 3月27日消息称英伟达计划收购AI初创公司Lepton AI,估价数亿美元,若收购敲定贾扬清将进入新事业拐点 [1] 公司基本信息 - Lepton AI成立于2023年,致力于为企业提供高效、可扩展的AI应用平台,是完全托管的AI云,可用于开发、训练和部署AI模型,具有生产级性能、成本效益、全面的ML工具以及由企业SLA支持的灵活GPU选项 [1] - 公司创始人贾扬清本硕毕业于清华大学,后获加州大学伯克利分校计算机科学博士学位,开发过深度学习框架Caffe,曾在Google Brain、Facebook(现Meta)、阿里巴巴任职,2023年从阿里离职后创办Lepton AI [1] - 公司还有两位联合创始人,李响是Kubernetes生态中关键组件etcd的创始人,白俊杰开创了神经网络交换标准ONNX,曾在阿里巴巴领导过全栈AI工程团队 [2] 融资与收购情况 - 2023年5月Lepton AI成功完成天使轮融资,投资方包括硅谷知名风投CRV、红杉中国和Fusion Fund [3] - 3月27日有消息称英伟达计划收购Lepton AI,估价数亿美元,公司创始人贾扬清回应媒体称“无法评论” [1]