纪要涉及的行业或者公司 - 行业:智能驾驶、大语言模型相关行业 - 公司:大疆、小鹏、理想、华为、比亚迪、高通、TI、地平线、黑芝麻、英伟达等 纪要提到的核心观点和论据 1. DeepSeek对高阶智驾落地的推动作用 - 技术层面:采用开源生态,有专家系统、专家模型、多头注意力技术等核心技术,用更低算力就能实现与GPT4相当效果,是全球最强的大语言模型之一,还能提升算法性能和效率,降低算力成本[2] - 成本层面:可使用国内非顶级的低端GPU,如寒武纪、黑芝麻、华为昇腾等的产品;降低了做模型和智驾的成本,一些玩家无需大量万卡GPU储备也能参与[3] - 产业层面:促使智驾厂商尝试开源版本优化方案,加速智驾产业商业化落地,引发DeepSeek生态投资热潮[4] 2. 大疆应用DeepSeek的效果 - 算力利用:之前跑9B模型基本榨干100TB算力,换用DeepSeek版本后只占65TB,剩余35TB可用于其他事情[9][10] - 推理响应时间:之前约20毫秒,换用后在9 - 10毫秒之间,性能提升一倍多[11] - 实际效果:整体效果与之前基本持平,极端情况下多模态感应效果更好,全市NOA效果比之前版本好[13] 3. 芯片适配情况 - 适配进度:大疆内部适配芯片性能排序为高通平台、英伟达平台,地平线完成90%工作,TI平台因偏低端暂未适配[15] - 适配工作内容:包括算子开发、精度调优、性能调优等步骤[18] 4. 市场落地预期 - 时间:预计2025年大概率会大批量基于DeepSeek版本的模型方案落地,Q2或Q3都有可能[26] - 影响:对华为等方案冲击力较大,可能使智驾水平上升一个档次[27] 5. 云端训练成本:采用基于DeepSeek版本的模型训练,可省去六分之五的成本[28] 6. 产品体验 - 输出答案:给人感觉像非常老练的专家,比豆包、科米等更好[30] - 城市NOA体验:测试325个包含各种复杂路况的视频,准确率达97%,在断头路等场景理解和程式NOA引航能力上比之前模型更老练[31][32] 7. 技术架构优势:DeepSeek核心技术架构与其他模型不同,其他模型多模仿transformer架构,而DeepSeek性能和精度更好[36][37] 8. 比亚迪合作方案:2025年比亚迪20万以下车型基本采用三目方案,由大疆提供,可能选用地平线芯片[40][41] 其他重要但是可能被忽略的内容 1. 模型压缩技术:有支持针流压缩大模型技术,可控制模型压缩大小,但要考虑性能和精度,压缩倍数越大性能可能受影响[23] 2. 多模态迁移技术:大疆将DeepSeek核心骨架与之前多模态VR技术结合,训练数据包含文本、语音、视频、图像数据[33][34] 3. 梯队差距变化:若大家采用DeepSeek核心技术,梯队界限可能不明显,差距更多体现在数据规模效应和对大模型的微调策略上[50][51] 4. 算力需求变化:大疆之前100TB算力可做全场景,接入相关技术后70TB算力可能就够用[53]
玖龙纸业20250228