科大讯飞(002230) - 2025年2月13日投资者关系活动记录表

对 DeepSeek 的看法 - DeepSeek 发布 V3 和 R1 大模型，以低成本实现性能突破，其团队有技术信仰、现金支撑且人才密度高，打破西方刻板印象，提振中国科技创新信心 [3] - DeepSeek 模型基本理论框架是 Transformer 和强化学习等，训练算力基于英伟达 A800 和 H800，在工程优化上率先突破 [3] - DeepSeek R1 提出并实现 R1 - Zero 强化学习训练方案，不依赖有监督微调，减少训练对人工标注数据的需求，是大规模任务上首个成功发布成果 [4][5] 公司深度推理技术创新阶段 - 科大讯飞 2024 年 10 月实现蒙特卡洛树搜索等算法创新并跑通深度推理模型训练算法，花费 2 个月完成华为昇腾 910B 算力适配和优化，训练效率从 55%提升到 85% [6] - 今年 1 月 15 日发布星火深度推理模型 X1，虽仅 130 亿参数，但已达与 OpenAI o1 - preview 对标水平，未来有信心全面对标甚至超越 [6] 大模型训练和推理成本控制 - DeepSeek 围绕 V3 和 R1 训练和推理降本，实现 MLA、MTP、DualPipe、FP8 混合精度训练等软硬件结合深度工程优化创新，约 560 万美元可完成 V3 模型一次完整预训练 [7][8] - 科大讯飞选择全国产算力路线，联合华为攻克系列难题，将训练效率对标 A100 从 30% - 50%优化到 85% - 95%以上，万卡网络通信带宽利用率达 95%，单次训练成本与 DeepSeek V3 相当，未来成本还有下降空间 [9] - 大模型算力需求分训练和推理，训练难度大，仅讯飞星火训练和推理均在国产算力上进行，用 1 万张 910B 卡取得大模型研发成果并做了大量适配和效率优化 [10][11] DeepSeek 对公司业务的影响积极影响 - DeepSeek 普及人工智能教育，加快中国人工智能产业生态建设，其工程化探索和验证成果对公司有借鉴作用，公司会坚定走全国产化路线和面向行业刚需落地 [12][13] - 更多行业客户关注大模型技术和应用，教育、医疗等领域人工智能应用规模化落地加快，讯飞在这些领域有先发优势，未来会形成更稳固领先优势 [13][14] - 以教育为例，讯飞场景和专业积累明显，正在训练的星火 X1 新版本预计 3 月内完成，有信心对标甚至超越世界一流同行，还将发布教育专属大模型和创新应用 [15] - 长期来看，各地政府对国产智算中心等投入加大，对公司 G 端业务有好处；B 端企业激活 AI 应用和构建行业专属大模型需求，公司优势可能促进央国企业务合作收入增长 [17] 消极影响 - 部分 G 端客户关注和学习 DeepSeek 技术，短期内影响智算中心建设节奏；B 端企业因 DeepSeek 开源免费，在 AI 落地项目中大模型底座建设资金投入更谨慎 [16][17] 公司底座大模型研发长期策略 - 通用人工智能将迎来高潮，大模型国产化龙头企业优先受益，科大讯飞会保持“1 + N”战略投入定力，底座大模型对标国内外最高水平，构建重点行业大模型 [17][18] - 美国可能加强对中国算力获取限制，公司大模型全栈国产化技术有战略意义和先发优势，仅讯飞星火训练和推理均在国产算力上进行 [19] - 通用人工智能创新活力和发展潜力大，公司会持续投入大模型底座研发，星火 X1 新版本预计 3 月内完成，有信心对标世界一流水平甚至局部引领 [21] 讯飞开放平台上线 DeepSeek 产品的考虑 - 讯飞开放平台秉持开放共享理念，与优秀 AI 厂商及研究机构同盟，星辰 MaaS 平台拥抱开源生态，已接入 10 多家 AI 合作厂商 98 项能力，平台总能力达 806 项 [21] - 2 月 10 日上线 DeepSeek 全系大模型，支持公有云 API 调用和专属模型一键部署，而讯飞星火聚焦自主可控底座能力和重点应用赛道，做全栈自主可控的大模型国家队 [21][22]