Workflow
科大讯飞(002230) - 2025年2月13日投资者关系活动记录表
002230科大讯飞(002230)2025-02-13 21:08

对 DeepSeek 的看法 - DeepSeek 发布 V3 和 R1 大模型,以低成本实现性能突破,其团队有技术信仰、现金支撑且人才密度高,打破西方刻板印象,提振中国科技创新信心 [3] - DeepSeek 模型基本理论框架是 Transformer 和强化学习等,训练算力基于英伟达 A800 和 H800,在工程优化上率先突破 [3] - DeepSeek R1 提出并实现 R1 - Zero 强化学习训练方案,不依赖有监督微调,减少训练对人工标注数据的需求,是大规模任务上首个成功发布成果 [4][5] 公司深度推理技术创新阶段 - 科大讯飞 2024 年 10 月实现蒙特卡洛树搜索等算法创新并跑通深度推理模型训练算法,花费 2 个月完成华为昇腾 910B 算力适配和优化,训练效率从 55%提升到 85% [6] - 今年 1 月 15 日发布星火深度推理模型 X1,虽仅 130 亿参数,但已达与 OpenAI o1 - preview 对标水平,未来有信心全面对标甚至超越 [6] 大模型训练和推理成本控制 - DeepSeek 围绕 V3 和 R1 训练和推理降本,实现 MLA、MTP、DualPipe、FP8 混合精度训练等软硬件结合深度工程优化创新,约 560 万美元可完成 V3 模型一次完整预训练 [7][8] - 科大讯飞选择全国产算力路线,联合华为攻克系列难题,将训练效率对标 A100 从 30% - 50%优化到 85% - 95%以上,万卡网络通信带宽利用率达 95%,单次训练成本与 DeepSeek V3 相当,未来成本还有下降空间 [9] - 大模型算力需求分训练和推理,训练难度大,仅讯飞星火训练和推理均在国产算力上进行,用 1 万张 910B 卡取得大模型研发成果并做了大量适配和效率优化 [10][11] DeepSeek 对公司业务的影响 积极影响 - DeepSeek 普及人工智能教育,加快中国人工智能产业生态建设,其工程化探索和验证成果对公司有借鉴作用,公司会坚定走全国产化路线和面向行业刚需落地 [12][13] - 更多行业客户关注大模型技术和应用,教育、医疗等领域人工智能应用规模化落地加快,讯飞在这些领域有先发优势,未来会形成更稳固领先优势 [13][14] - 以教育为例,讯飞场景和专业积累明显,正在训练的星火 X1 新版本预计 3 月内完成,有信心对标甚至超越世界一流同行,还将发布教育专属大模型和创新应用 [15] - 长期来看,各地政府对国产智算中心等投入加大,对公司 G 端业务有好处;B 端企业激活 AI 应用和构建行业专属大模型需求,公司优势可能促进央国企业务合作收入增长 [17] 消极影响 - 部分 G 端客户关注和学习 DeepSeek 技术,短期内影响智算中心建设节奏;B 端企业因 DeepSeek 开源免费,在 AI 落地项目中大模型底座建设资金投入更谨慎 [16][17] 公司底座大模型研发长期策略 - 通用人工智能将迎来高潮,大模型国产化龙头企业优先受益,科大讯飞会保持“1 + N”战略投入定力,底座大模型对标国内外最高水平,构建重点行业大模型 [17][18] - 美国可能加强对中国算力获取限制,公司大模型全栈国产化技术有战略意义和先发优势,仅讯飞星火训练和推理均在国产算力上进行 [19] - 通用人工智能创新活力和发展潜力大,公司会持续投入大模型底座研发,星火 X1 新版本预计 3 月内完成,有信心对标世界一流水平甚至局部引领 [21] 讯飞开放平台上线 DeepSeek 产品的考虑 - 讯飞开放平台秉持开放共享理念,与优秀 AI 厂商及研究机构同盟,星辰 MaaS 平台拥抱开源生态,已接入 10 多家 AI 合作厂商 98 项能力,平台总能力达 806 项 [21] - 2 月 10 日上线 DeepSeek 全系大模型,支持公有云 API 调用和专属模型一键部署,而讯飞星火聚焦自主可控底座能力和重点应用赛道,做全栈自主可控的大模型国家队 [21][22]