金山云星流平台模型API服务
搜索文档
「观云」AI浪潮下“矿主”们如何掘金?金山云瞄准细分市场,智算平台战略再次升级
华夏时报· 2026-01-23 21:52
公司战略与产品升级 - 金山云宣布其智算平台“金山云星流”完成从资源管理平台向一站式AI训推全流程平台的战略升级,针对AI大模型推理、具身智能等场景提供技术保障 [2] - 升级后的平台构建了从异构资源调度、训练任务故障自愈到机器人行业应用支撑、模型API服务商业化落地的全链路闭环 [3] - 平台提供模型开发、训练到推理的完整生命周期管理,具备开发、训练、推理和数据处理四大模块能力,旨在实现“开箱即用”的AI开发体验 [3] - 公司进行场景细分的战略是从单纯提供通用算力向深度定制行业解决方案的关键升级,旨在提升算力资源利用率、优化成本并增强客户粘性 [4] 公司财务表现 - 2025年第三季度,金山云总收入为24.78亿元,同比增加31.4%,环比增加5.5% [5] - 同期毛利约为3.81亿元,同比增加25.6% [5] - 2025年第三季度净亏损为784.7万元,同比收窄99.26% [5] - 2025年第三季度非公认会计准则净利润为2870万元,同比扭亏为盈,调整后净利润为2873万元,调整后经营利润为1536万元 [5] - 作为收入主力的公有云业务,2025年第三季度实现收入17.52亿元,同比大幅增长49.1%,环比增长7.8% [6] - 公有云业务中,智算云业务账单收入达到7.82亿元,同比增长约120%,在公有云收入中占比高达45% [6] 行业背景与市场机遇 - 在AI浪潮下,云厂商作为“矿主”收获颇丰,行业算力红利预计至少能维持8年左右 [2] - 中国算力规模从2020年的136.2 EFLOPs增长至2024年的617 EFLOPs,期间年均复合增长率为45.9% [6] - 预计到2029年中国算力总规模将达到3442.89 EFLOPs,预测期年均复合增长率达40% [6] - 智能算力是引领增长的核心,其规模从2020年的59.2 EFLOPs增长至2024年的438.07 EFLOPs,期间年均复合增长率高达64.9% [6] - 预计2025年至2029年,智能算力将以45.3%的年均复合增长率增长至3035.91 EFLOPs [6] - 分析师预计算力市场的红利期仍有5至8年的发展机遇,主要因AI等新技术需求持续爆发,中期行业格局趋于集中 [7] 业务驱动因素与挑战 - 智算云业务的爆发式增长是公司盈利的最重要因素,其高附加值特性持续优化公司利润结构 [6] - 智算业务的大幅增长是盈利的关键,计算业务的高毛利率能快速拉升整体毛利水平 [5] - 云厂商盈利的可持续性取决于持续的技术创新、云服务规模扩张、成本结构优化及运营费用率控制等综合能力 [5] - 公司未来维持盈利并不容易,需关注客户群体需求,并围绕训练、推理和应用三大核心场景迭代技术和优化服务 [7]
金山云星流全面升级,副总裁刘涛:四大模块能力实现“开箱即用”的AI开发体验
新浪财经· 2026-01-21 20:42
金山云星流平台战略升级 - 金山云的智算平台“金山云星流”已完成从资源管理平台向一站式AI训推全流程平台的战略升级 [1][3] - 升级后的平台构建了从异构资源调度、训练任务故障自愈到机器人行业应用支撑、模型API服务商业化落地的全链路闭环 [1][3] 训推平台能力与效率 - 金山云星流训推平台提供从模型开发、训练到推理的完整生命周期管理,具备开发、训练、推理和数据处理四大模块能力 [1][3] - 平台通过降低多模块协同复杂度,能实现“开箱即用”的AI开发体验 [1][3] - 平台采用自研的GPU故障自愈技术结合任务可观测性设计,可实时监控硬件健康状态与任务进程,自动触发故障迁移与任务重调度 [1][3] - 该技术旨在降低算力中断风险,保障长周期训练任务稳定运行 [1][3] 机器人平台功能 - 金山云星流机器人平台是面向机器人开发与落地的全链路云原生平台 [2][4] - 平台深度融合数据采集、存储、标注、模型开发、训练、部署与仿真等核心环节 [2][4] - 平台旨在打造具身场景专属的数据、模型、仿真一体化引擎 [2][4] 模型API服务 - 金山云星流平台模型API服务面向大模型应用开发者和企业用户,提供高可用、易集成的模型调用与管理能力 [2][4] - 该服务覆盖模型调用的全生命周期,支持高并发推理与多模型管理,能够帮助用户高效接入多种模型资源 [2][4] - 目前,该模型API服务已积累诸多行业客户 [2][4] 平台模型生态 - 金山云星流平台的模型生态持续丰富,目前平台已支持近40种不同模型 [2][4] - 支持的模型包括DeepSeek、Xiaomi MiMo、Qwen3、Kimi等 [2][4] - 客户通过一站式访问即可高效接入多种模型,从而更加聚焦AI业务创新和价值创造 [2][4]
金山云(KC.US/3896.HK)荣获年度港股通卓越奖:AI战略驱动高增长,生态协同构筑护城河
格隆汇· 2025-12-22 16:54
公司获奖与市场认可 - 金山云在格隆汇主办的"金格奖"评选中荣获"年度港股通卓越奖" 反映了市场对其在人工智能时代下高质量增长路径的充分肯定 [1] 财务业绩表现 - 2025年第三季度营收达24.8亿元 同比增长31% 增速较上季度进一步提升 [2] - 调整后净利润首次实现盈利 达2,873万元 标志着公司正式进入规模化盈利新阶段 [2] - 公有云业务同比大幅增长49% [2] - 智算云业务账单收入同比暴涨近120% 达到7.8亿元 占公有云收入比例升至45% 成为拉动增长的核心引擎 [2] - 来自小米金山生态的收入达6.9亿元 同比增长84% 占总收入比例升至28% [4] - 高盛在报告中指出 公司第三季度经调整EBITDA超预期 并将目标价微调至13.8美元 认可其盈利能力的持续改善 [2] AI战略与业务发展 - 公司通过升级基础云设施和优化智算服务 全面支撑了互联网头部客户的大规模推理需求 并在政务、医疗、能源等领域实现AI解决方案落地 [2] - 智算云业务的突出表现得益于公司对AI算力需求的精准把握 [2] - 公司通过"星流平台"构建了开放的模型生态 近期上线了小米自研模型XiaomiMiMo-V2-Flash 该模型专为极致推理效率设计 [3] - 星流平台提供模型管理、数据标注、自动扩缩容等功能 帮助客户降低AI应用门槛 [3] - 公司已覆盖DeepSeek、文心一言、Kimi等国产主流大模型 [3] - 公司自研的金山政务AI一体机、算力调度平台等产品 在政企市场中形成差异化竞争力 [3] 生态协同与增长基础 - 作为小米金山生态内唯一的战略云平台 金山云持续获得生态内业务的强劲驱动 [4] - 随着小米智能制造布局深化 算力需求呈现指数级增长 金山云已成为生态核心受益者 [4] - 根据规划 金山云与小米金山的关联交易额度在2025-2027年高达113亿元 为未来增长提供坚实基础 [4] - 2025年9月 公司通过配售筹资28.02亿港元 其中80%将用于AI基础设施扩张 以强化应对生态内外部需求的能力 [4] 行业前景与机构观点 - IDC预测 2023-2028年中国智能算力规模年复合增长率超过46% 金山云有望持续受益于行业红利 [3] - 市场机构普遍认为 金山云已初步打通"AI需求+生态协同"的高质量增长路径 [5] - 瑞银、美银、摩根大通等多家机构均给出"买入"评级 [5] - 申万宏源指出 AI拉动与生态协同效应将在未来持续释放 [5] - 随着企业上云和AI应用落地加速 金山云有望在智算浪潮中实现价值重估 [5]
金山云(KC.US)盘前走高,据悉近期全新发布金山云星流平台模型API服务
智通财经网· 2025-10-27 17:58
产品发布与核心定位 - 金山云全新发布星流平台模型API服务,旨在为企业与开发者提供高效集成多模型服务的能力,以加速智能应用落地[1] - 该服务面向大模型应用开发者与企业用户,提供高可用、易集成的模型调用与管理能力,覆盖模型调用的全生命周期[1] - 平台核心优势概括为四点:模型调用即服务、企业级安全保障、多模型支持、灵活计费弹性可控[1] 平台功能与技术特性 - 平台支持多模型并行接入与版本管理,集成多种主流大模型,涵盖文本生成、代码生成等典型AI应用场景[4] - 基于KCE容器引擎构建,结合高性能GPU与RoCE网络,提供低延迟、高带宽的推理环境,并通过VLLM与SGLang等框架实现高效部署与弹性扩缩[5] - 支持多种加速优化方式,包括PD分离、KV Cache缓存复用、TP/DP/PP/EP并行与分布式执行,以提升大模型推理吞吐与响应性能[6] - 通过统一服务网关提供多模型管理、调用鉴权与限流保护,内置智能路由机制实现负载感知与动态流量调度,保障高可用服务访问[7][8] 生态集成与商业模式 - 支持主流大模型(如DeepSeek、Kimi-K2等)接入,用户可通过OpenAPI、SDK等方式快速对接业务系统,构建多场景智能应用[9] - 采用按实际Token调用用量计费的模式,结合免费额度管理与用量监控机制,帮助用户实现成本可视化与预算可控[4] 安全与合规保障 - 构建覆盖输入输出安全审查、用户行为审计、数据加密与权限管控的全链路安全体系[10] - 提供细粒度访问控制与多租户隔离机制,确保模型调用全流程安全可控,满足企业级合规与隐私要求[10] 目标客户与解决痛点 - 服务目标客户为在构建智能应用时面临自行部署维护模型服务成本高、周期长等挑战的企业或开发者[12][14] - 平台优势在于通过统一接口简化不同模型标准不一带来的集成复杂性,并通过智能路由保障高并发下的服务稳定性[14]