大模型工程化 - 财报，业绩电话会，研报，新闻

大模型工程化

搜索文档

超760万元奖金悬赏，谁能徒手重构 DeepSeek 与 Kimi 的性能底层？

AI科技大本营· 2026-03-27 12:12

行业技术背景与挑战 - 大模型工程化存在“不可能三角”，即极致的推理延迟、极高的吞吐量和极大的模型规模难以同时实现[1] - 2025年DeepSeek-V3技术报告展示了新一代超大规模模型推理范式，通过MLA架构将KV Cache压缩93%，并利用MTP技术提升访存效率，实现了万亿参数模型在大规模并发下的“高吞吐、低延迟”突破[1] - 到2026年，仅依靠FP8精度和现有基础架构已难以满足爆发式的即时响应需求，大规模真实并发下每一毫秒的延迟缩减都直接关联数以亿计的算力成本与集群效能[1] 2026 AMD E2E Model Speedrun全球挑战赛概况 - AMD联手GPU MODE，豪掷110万美元总奖金发起全球竞速挑战赛，旨在寻找能深度优化底层逻辑、充分榨取AMD旗舰算力潜能的顶级开发者[2][3] - 大赛采用“预选赛+端到端决赛大考”双阶段赛制[8] - 预选赛前10名优胜者将各获得1万美金并晋级决赛[8] - 决赛晋级选手将共同瓜分100万美元现金大奖[11] 预选赛规则与任务 - 预选赛包含三大核心GPU内核极限性能调优任务，总分3750分[8] - 任务一：MXFP4 MoE，最高分值1500分[10] - 任务二：MLA Decode，最高分值1250分[10] - 任务三：MXFP4 GEMM，最高分值1000分[10] - 排名规则基于测试用例的绝对运行时间几何平均值，作品性能必须超越官方基线且排在前20名方可计分[10] - 单项得分计算公式：最大分值 × [1 - (排名分值/20)]，排名对应分值0至19[10] - 总分最高前十名需经主办方独立复现结果后确定决赛席位，若遇平局以提交时间最早的内核为准[10] 决赛大考详情 - 决赛分为两条赛道：DeepSeek-R1-0528 (FP4+MTP) 与 Kimi K2.5 1T (FP4)，参赛者可同时参与双线作战[12] - 赛道一：DeepSeek-R1-0528 (FP4+MTP) - 精度要求：GSM8K > 0.93，必须同时使用AMD ATOM或SGLang框架达标[13] - 性能硬门槛： - 128并发：单卡吞吐量 > 48 t/s，总吞吐量 > 6000 t/s，延迟 ≤ 22s[13] - 32并发：单卡吞吐量 > 50 t/s，总吞吐量 > 3900 t/s，延迟 ≤ 18s[13] - 4并发：单卡吞吐量 > 165 t/s，总吞吐量 > 1500 t/s，延迟 ≤ 5s[13] - 赛道二：Kimi K2.5 1T (FP4)，终极大奖65万美金[13] - 精度要求：GSM8K > 0.9325，必须同时使用AMD ATOM或VLLM框架达标[13] - 性能硬门槛： - 128并发：单卡吞吐量 > 35 t/s，总吞吐量 > 5300 t/s，延迟 ≤ 24.5s[13] - 32并发：单卡吞吐量 > 65 t/s，总吞吐量 > 4500 t/s，延迟 ≤ 14.0s[13] - 4并发：单卡吞吐量 > 150 t/s，总吞吐量 > 1350 t/s，延迟 ≤ 6.0s[13] - 决赛评估在Input 8K / Output 1K标准测试负载下进行，综合考量每GPU总Token吞吐量、交互性及端到端延迟[19] - 算力支持最大TP/EP = 8的8卡节点配置，开发者可自由调优[19] - 每个并发等级根据吞吐量（权重60%）与交互性（权重40%）排名赋分，三大并发等级得分之和为决赛总分[19] 大赛时间表 - 预选赛：北京时间3月7日08:00至4月7日14:59[16] - 报名通道即将在约12天后关闭，是通往110万美元奖金池的唯一入场券[16] - 总决赛冲刺：北京时间4月8日00:00至5月16日14:59[16] - 全球颁奖典礼：5月19日，代码将正式封榜合入开源主分支[17]

每日经济新闻· 2026-02-01 21:08

行业动态与市场表现 - 近期多家国产大模型厂商密集更新模型进展，包括阿里发布千问旗舰推理模型Qwen3-Max-Thinking，DeepSeek开源DeepSeek-OCR 2模型，Kimi发布并开源Kimi K2.5模型，以及MiniMax推出Music2.5音乐生成模型 [1] - MiniMax发布Music2.5模型引爆港股AI行情，其股价盘中一度涨超20%，智谱股价盘中也一度涨超10% [1] - 国内大模型市场竞争焦点已从单纯比拼参数与对话表现，转向更深层的工程化与系统级能力重塑，目标是从“科研成果”向“工业产品”跨越 [1] 行业演进阶段与核心挑战 - 国内大模型行业正迈入工程化阶段，面临三道主要挑战：成本与效能的平衡难题、稳定性与可解释性的工业级要求、以及与现有系统的融合之困 [2] - 第一道坎是成本与效能平衡，大模型训练与推理成本高昂，堪称“算力吞金兽”，企业自建或频繁调用顶尖模型财务压力巨大，规模化应用需大幅降低部署与使用门槛 [2] - 第二道坎是稳定性与可解释性，大模型存在“幻觉”和输出随机波动等问题，在金融风控、医疗诊断等严肃场景可能带来重大风险，市场需要可预期、可审计、可追溯的工业级方案 [2] - 第三道坎是与现有系统融合，涉及复杂的API对接、数据格式转换、工作流重组及安全体系适配，当前许多模型缺乏与企业核心业务系统深度集成的“中间件”与标准接口 [2] 技术路径与解决方案方向 - 技术路径需从“追求极致参数”转向“优化单位算力效能”，目标是让企业用得起、用得好，例如DeepSeek开源OCR模型即在特定任务上追求极致效能与成本优势 [3] - 在交付形态上，应从单纯提供模型向提供综合服务与解决方案转变，企业客户购买的是解决问题的稳定能力而非技术参数 [3] - 需通过提示词工程、检索增强生成等技术为关键应用场景构建“护栏”，以有效控制“幻觉”，提升结果可靠性与可解释性 [3] - 唯有跨过工程化深水区，国产大模型才能从“密集上新”走向“深度用上”，其创造的产业价值与市场回报方能坚实而持久 [3]

大模型工程化

人工智能

Artificial Intelligence

Music2.5音乐生成模型

千问旗舰推理模型Qwen3 - Max - Thinking

DeepSeek - OCR 2模型

大模型工程化

人工智能

Artificial Intelligence

Music2.5音乐生成模型

千问旗舰推理模型Qwen3 - Max - Thinking

DeepSeek - OCR 2模型

每经热评丨国产大模型密集上新工程化闯关还有三道坎

新浪财经· 2026-02-01 21:07

行业动态与核心观点 - 近期多家国产大模型厂商密集发布模型更新，包括阿里发布千问旗舰推理模型Qwen3-Max-Thinking，DeepSeek开源DeepSeek-OCR 2模型，Kimi发布并开源Kimi K2.5模型，MiniMax推出Music2.5音乐生成模型 [1] - 模型更新引爆港股AI行情，其中MiniMax股价盘中一度涨超20%，智谱股价盘中也一度涨超10% [1] - 行业竞争焦点已从单纯比拼参数与对话表现，转向更深层的工程化与系统级能力重塑，目标是让大模型完成从“科研成果”向“工业产品”的跨越 [1] 行业发展阶段与挑战 - 国内大模型发展迈入工程化阶段，面临三大核心挑战 [2] - 第一道坎是成本与效能的平衡难题，大模型训练与推理成本高昂，是“算力吞金兽”，企业自建或频繁调用顶尖模型财务压力巨大 [2] - 第二道坎是稳定性与可解释性的工业级要求，大模型存在“幻觉”和输出随机波动等问题，在金融风控、医疗诊断等严肃场景可能带来重大风险 [2] - 第三道坎是与现有系统的融合之困，涉及复杂的API对接、数据转换和工作流重组，当前许多模型缺乏与企业核心业务系统深度集成的“中间件”与标准接口 [2] 技术路径与解决方案 - 技术路径需从“追求极致参数”转向“优化单位算力效能”，目标是让企业用得起、用得好 [3] - DeepSeek开源OCR模型是在特定任务上追求极致效能与成本优势的体现，相比“全能但昂贵”的通用模型，在工程化初期更具吸引力 [3] - 交付形态应从单纯提供模型向提供综合服务与解决方案转变，并通过提示词工程、检索增强生成等技术为关键应用构建“护栏”，控制“幻觉”并提升可靠性 [3] - 只有跨过工程化深水区，国产大模型才能从“密集上新”走向“深度用上”，创造坚实的产业价值与市场回报 [3]

人工智能

大模型工程化

Artificial Intelligence

Music2.5音乐生成模型

千问旗舰推理模型Qwen3-Max-Thinking

DeepSeek-OCR 2模型

人工智能

大模型工程化

Artificial Intelligence

Music2.5音乐生成模型

千问旗舰推理模型Qwen3-Max-Thinking

DeepSeek-OCR 2模型

热评丨国产大模型密集上新工程化闯关还有三道坎

每日经济新闻· 2026-02-01 21:06

国内大模型行业近期动态 - 多家国产大模型厂商近期密集更新产品，包括阿里发布千问旗舰推理模型Qwen3-Max-Thinking，DeepSeek开源DeepSeek-OCR 2模型，Kimi发布并开源Kimi K2.5模型 [1] - MiniMax推出Music2.5音乐生成模型，宣布突破两大AI音乐技术难题，引爆港股AI行情，其股价盘中一度涨超20%，智谱股价盘中也一度涨超10% [1] - 行业竞争焦点已从单纯比拼参数与对话表现，转向更深层的工程化与系统级能力重塑，目标是让大模型完成从“科研成果”向“工业产品”的跨越 [1] 行业发展的核心挑战 - 第一道坎是成本与效能的平衡难题，大模型训练与推理成本高昂，如何在大幅降低部署与使用门槛的同时保持核心性能，是规模化应用的关键 [2] - 第二道坎是稳定性与可解释性的工业级要求，大模型存在“幻觉”和输出随机波动等问题，在金融、医疗等严肃场景可能带来重大风险，市场需要可预期、可审计、可追溯的工业级方案 [2] - 第三道坎是与现有系统的融合之困，涉及复杂的API对接、数据转换和工作流重组，当前许多模型缺乏与企业核心业务系统深度集成的“中间件”与标准接口 [2] 技术演进与市场方向 - 技术路径正从“追求极致参数”转向“优化单位算力效能”，目标是让企业用得起、用得好，例如DeepSeek开源OCR模型即在特定任务上追求极致效能与成本优势 [3] - 交付形态应从单纯提供模型向提供综合服务与解决方案转变，企业客户购买的是解决问题的稳定能力而非技术参数 [3] - 通过提示词工程、检索增强生成等技术为关键应用场景构建“护栏”，以有效控制“幻觉”并提升结果的可靠性与可解释性 [3] - 行业需跨过工程化深水区，才能从“密集上新”走向“深度用上”，实现坚实的产业价值与市场回报 [3]

大模型工程化

人工智能

Artificial Intelligence

Music2.5音乐生成模型

千问旗舰推理模型Qwen3-Max-Thinking

DeepSeek-OCR 2模型

大模型工程化

人工智能

Artificial Intelligence

Music2.5音乐生成模型

千问旗舰推理模型Qwen3-Max-Thinking

DeepSeek-OCR 2模型

千问、DeepSeek、Kimi齐出手，国产大模型密集上新，“工程化”闯关还有三道坎

每日经济新闻· 2026-01-29 22:52

国内大模型厂商近期动态 - 近期多家国产大模型厂商密集更新模型进展，包括阿里发布千问旗舰推理模型Qwen3-Max-Thinking，DeepSeek开源DeepSeek-OCR 2模型，Kimi发布并开源Kimi K2.5模型 [1] - 1月29日，MiniMax推出Music2.5音乐生成模型，宣布突破两大AI音乐技术难题，引爆港股AI行情，MiniMax股价盘中一度涨超20%，智谱股价盘中也一度涨超10% [1] - 行业更新方向显示，大模型能力进阶及市场竞争焦点已从比拼参数与对话表现，转向更深层的工程化与系统级能力重塑 [1] 行业发展的核心转变 - 行业发展目标是让大模型完成从“科研成果”向“工业产品”的跨越，使非AI专业的业务团队也能稳定安全、高可用、低成本地使用大模型 [1] - 与前期一味堆算力不同，当前阶段更考验大模型的综合能力，标志着国内大模型迈入工程化阶段 [1] 工程化阶段面临的主要挑战 - 第一道坎是成本与效能的平衡难题，大模型尤其是高参数模型的训练与推理成本高昂，堪称“算力吞金兽”，企业自建或频繁调用顶尖模型财务压力巨大，规模化应用需在保持核心性能的同时大幅降低部署与使用门槛 [2] - 第二道坎是稳定性与可解释性的工业级要求，大模型存在“幻觉”及输出结果随机波动等问题，在金融风控、医疗诊断等严肃场景可能带来重大风险，市场需要可预期、可审计、可追溯的工业级模型方案 [2] - 第三道坎是与现有系统的融合之困，大模型能力融入现有系统涉及复杂的API对接、数据格式转换、工作流重组及安全体系适配，当前许多模型仍缺乏与企业核心业务系统深度集成的“中间件”与标准接口 [2] 突破挑战的技术与商业路径 - 技术路径需从“追求极致参数”转向“优化单位算力效能”，目标是让企业用得起、用得好，例如DeepSeek开源OCR模型即在特定任务上追求极致效能与成本优势，在工程化初期比“全能但昂贵”的通用模型更具吸引力 [3] - 交付形态应从单纯提供模型向提供综合服务与解决方案转变，企业客户购买的是解决问题的稳定能力而非技术参数 [3] - 需通过提示词工程、检索增强生成等技术为关键应用场景构建“护栏”，以有效控制幻觉，提升结果可靠性与可解释性 [3] - 唯有跨过工程化深水区，国产大模型才能从“密集上新”走向“深度用上”，其创造的产业价值与市场回报方能坚实而持久 [3]

Seek .(US:SKLTY)

大模型工程化

人工智能

Artificial Intelligence

Music2.5音乐生成模型

千问旗舰推理模型Qwen3 - Max - Thinking

DeepSeek - OCR 2模型

大模型工程化

人工智能

Artificial Intelligence

Music2.5音乐生成模型

千问旗舰推理模型Qwen3 - Max - Thinking

DeepSeek - OCR 2模型

每经热评｜国产大模型密集上新 “工程化”闯关还有三道坎

每日经济新闻· 2026-01-29 20:04

国内大模型发展进入新阶段 - 多家国产大模型厂商近期密集更新模型进展，包括阿里发布千问旗舰推理模型Qwen3-Max-Thinking，DeepSeek开源DeepSeek-OCR 2模型，Kimi发布并开源Kimi K2.5模型 [1] - MiniMax推出Music2.5音乐生成模型，宣布突破两大AI音乐技术难题，引爆港股AI行情，其股价盘中一度涨超20%，智谱股价盘中也一度涨超10% [1] - 大模型能力进阶及市场竞争焦点已从单纯比拼参数与对话表现，转向更深层的工程化与系统级能力重塑，目标是完成从“科研成果”向“工业产品”的跨越 [1] 工程化阶段面临的核心挑战 - 第一道坎是成本与效能的平衡难题，大模型尤其是高参数模型的训练与推理成本高昂，企业自建或频繁调用顶尖模型财务压力巨大，需在保持核心性能的同时大幅降低部署与使用门槛 [2] - 第二道坎是稳定性与可解释性的工业级要求，大模型存在“幻觉”和输出结果随机波动等问题，在金融风控、医疗辅助诊断等严肃场景可能带来重大风险，市场需要可预期、可审计、可追溯的工业级模型方案 [2] - 第三道坎是与现有系统的融合之困，涉及复杂的API对接、数据格式转换、工作流重组及安全体系适配，当前许多模型缺乏与企业核心业务系统深度集成的“中间件”与标准接口 [2] 突破挑战的技术与交付路径 - 技术路径需从“追求极致参数”转向“优化单位算力效能”，目标是让企业用得起、用得好，例如DeepSeek开源OCR模型即在特定任务上追求极致效能与成本优势 [3] - 交付形态应从单纯提供模型向提供综合的服务与解决方案转变，企业客户购买的是解决问题的稳定能力而非技术参数 [3] - 需通过提示词工程、检索增强生成等技术为关键应用场景构建“护栏”，以有效控制幻觉，提升结果可靠性与可解释性 [3]

大模型工程化

人工智能

Artificial Intelligence

Music2.5音乐生成模型

千问旗舰推理模型Qwen3 - Max - Thinking

DeepSeek - OCR 2模型

大模型工程化

人工智能

Artificial Intelligence

Music2.5音乐生成模型

千问旗舰推理模型Qwen3 - Max - Thinking

DeepSeek - OCR 2模型

首都数字经济生态优化与智能化加速升级

中国经济网· 2025-04-30 10:59

北京市数字经济与人工智能发展 - 北京正加快数字经济与人工智能深度融合，夯实数字基础设施和智能算力体系，聚焦前沿技术推动首都数字经济生态优化与智能化升级 [1] - 北京推进"一区三中心"战略布局，深化数据要素市场化配置改革，聚焦智慧城市与数据治理，推动数据交易体系建设与政务数据授权运营 [1] 中国电信的战略布局与AI能力 - 中国电信北京公司依托"云+网+数+AI+应用"一体化优势，推进AI应用落地与数字基础设施建设，助力千行百业数智化转型 [1] - 中国电信在北京加速布局算力基础设施，搭建算力调度平台、大模型训练平台、智能体开发平台和标准化数据标注体系，帮助客户打通大模型落地"最后一公里" [2] - 中国电信打造完整AI能力体系，赋能央企战略性高价值场景落地，扩展高质量通用数据集和行业数据集，推进AI能力与终端、场景、行业融合 [2] 大模型产业与工程化发展 - 大模型产业从"百模大战"预训练竞赛向云端推理服务效能优化迁移，工程化作为产业化必要手段，需实现"硬件、软件、模型、应用+专业服务"五位一体协同 [2] - 中国信通院聚焦大模型工程化交付技术服务体系建设，助力大模型产业健康发展 [2] 校企合作与实验室建设 - 北京电信与北京邮电大学共建"行业数据智能标注联合实验室"，聚焦高质量数据集建设，攻克多模态数据标注关键技术 [3] - 北京电信携手中电信AI公司成立"行业应用智能创新研发实验室"，聚焦人工智能技术攻关与成果转化 [3] 中国电信的技术矩阵与服务体系 - 中国电信在北京构建以"息壤"算力平台、星河AI平台、星辰大模型体系与星海数据智能中台为核心的人工智能服务体系，为千行百业提供数字化转型"工具箱" [3]