智谱GLM系列模型
搜索文档
首都在线(300846.SZ):与智谱联合打造的“硬件+软件+模型”一体化交付方案已完成核心技术适配与产品定型
格隆汇· 2026-01-27 22:22
公司与智谱AI的战略合作与产品进展 - 公司与智谱AI自2024年起正式建立全面战略合作关系,双方在智能算力集群建设、大模型商业化落地、国产GPU适配及地方智算中心打造等多方面开展深度协同 [1] - 作为智谱AI的核心算力供应商之一,公司为其GLM系列模型的训练与推理业务提供大规模高性能GPU算力集群支撑 [2] - 双方合作未来有望在海外市场拓展、行业深度赋能、技术迭代升级等方面实现新突破 [2] “硬件+软件+模型”一体化交付方案 - 公司与智谱AI联合打造的一体化交付方案已完成核心技术适配与产品定型,支持GPU异构资源动态调度 [1] - 该方案预装了智谱GLM系列满血版/蒸馏版模型,并集成了全套模型框架、工具链及智能调度引擎,可实现快速微调与低延迟推理 [1] - 目前该一体机方案已面向政府、金融、工业等B端客户开放应用,正推进标杆场景落地与商业规模化推广 [1] 算力基础设施与平台建设 - 公司在庆阳、宿迁及天津多地构建了大规模高性能GPU算力集群,以支撑智谱AI的业务 [2] - 公司搭建了MaaS服务平台,实现了对智谱GLM-Z1系列等推理模型的全面接入,并推动其在游戏、音视频、电商等行业的应用渗透 [2] - 公司依托“东数西算”核心节点资源储备,与智谱AI携手深度参与庆阳等地的智算集群建设,助力打造区域算力高地与AI应用示范基地 [2] 国产算力适配与技术协同 - 公司获得了智谱AI的“多元算力适配权益”,成为其国产算力适配核心伙伴 [2] - 公司重点完成了昇腾、燧原等国产GPU与智谱大模型的适配优化工作 [2]
首都在线:公司为智谱GLM系列模型提供稳定的训练与推理算力支撑
新浪财经· 2026-01-05 21:49
公司与智谱AI的战略合作 - 首都在线是智谱AI的核心算力供应商之一 [1] - 双方于2024年9月6日正式建立全面战略合作关系 [1] 公司提供的算力服务详情 - 公司在庆阳、宿迁、天津等多地区搭建了高性能GPU智算集群 [1] - 这些智算集群为智谱GLM系列模型提供稳定的训练与推理算力支撑 [1]
剑指“全球大模型第一股”,智谱将于2026年1月8日在港交所上市
搜狐财经· 2025-12-30 10:32
上市概况与募资计划 - 智谱华章科技股份有限公司计划于2025年12月30日至2026年1月5日招股,预期H股将于2026年1月8日在港交所上市,将成为“全球大模型第一股” [1] - 公司拟全球发售3741.95万股H股,发售价为每股116.20港元,每手100股,另有15%超额配股权 [1] - 若超额配股权未获行使,募资总额预计约为43.48亿港元,募资净额约为41.73亿港元,预计市值超过510亿港元 [1] - 募资净额用途:约70.0%用于增强通用AI大模型研发能力,约10.0%用于优化MaaS平台,约10.0%用于发展合作伙伴网络及战略投资,约10.0%用于营运资金及一般企业用途 [3] 基石投资者构成 - 本次上市引入11家基石投资者,合计认购约29.84亿港元发售股份 [3] - 主要基石投资者包括JSC International Investment Fund、高毅、泰康人寿、广发基金、雾凇等 [3] - 基石投资者认购股份占全球发售股份总数的概约百分比为68.63%,占发售完成后公司已发行股本总额的概约百分比为5.83% [4] - 其中,JSC International Investment Fund认购金额为1.79亿美元,占全球发售股份的32.03%,为最大基石投资者 [4] 公司业务与市场地位 - 公司是一家中国领先的人工智能公司,致力于开发通用大模型,为机构客户及个人用户提供服务 [4] - 截至2025年6月30日,公司的模型已为逾8000家机构客户提供支持 [5] - 按2024年收入计,公司在中国独立通用大模型开发商中位列第一,在所有通用大模型开发商中位列第二,市场份额为6.6% [5] 财务表现 - 营收高速增长:2022年、2023年、2024年营收分别约为5740.9万元、1.25亿元和3.12亿元,复合年增长率达133.3% [5] - 2025年上半年营收为1.91亿元,同比大幅增长325.0% [5] - 毛利率保持较高水平:2022年、2023年、2024年及2025年上半年毛利率分别为54.6%、64.6%、56.3%和50.0%,均高于50% [5] 研发投入与技术实力 - 研发投入巨大:2022年、2023年、2024年及2025年上半年研发投入分别达8437.7万元、5.29亿元、21.95亿元和15.95亿元,三年半累计研发费用超44亿元 [5] - 研发团队强大:截至2025年6月,研发团队由657名成员组成,占员工总人数约74% [6] - 核心科研团队和学术顾问团队发表500篇顶尖高影响力论文,累计引用次数超过5.8万余次 [6] - 技术迭代迅速:GLM系列模型每3至6个月完成一次基座迭代,在提升效率的同时有效降低了边际成本 [6] 行业影响与未来展望 - 此次上市将进一步提升公司的品牌影响力,并推动AI大模型行业从技术竞赛转向资本考验,为行业规范化发展树立标杆 [6] - 公司有望在AI赛道上持续发展 [6]
在这个开源「从夯到拉」榜单,我终于明白中国 AI 为什么能逆袭
新浪财经· 2025-12-17 22:25
文章核心观点 中国开源大模型在2024年至2025年间实现了全球范围内的领导地位,以DeepSeek、Qwen、Kimi、智谱和MiniMax为代表的国产模型,在性能、价格、生态和可用性等维度上快速逼近甚至超越闭源巨头,正在改变全球AI行业的格局和运行规则 [3][5][116] 全球开源模型排名与格局演变 - 根据AI研究员Nathan Lambert等人的排名,全球开源模型前五名均为中国公司:DeepSeek、Qwen、Kimi、智谱和MiniMax,而OpenAI仅位列第四梯队,Meta的Llama仅获荣誉提名 [3][114] - 2024年曾是Llama主导的天下,但到2025年,国产开源模型已成为全球开发者的默认选择,持续刷新行业选项 [5][116] - 在Hugging Face的热门模型趋势榜上,前四名均为国产开源模型 [86][89] 主要中国开源模型厂商及其技术亮点 - **DeepSeek**:通过混合注意力等机制显著降低成本,打开了高效推理的突破口 [29][98] - **Qwen(阿里巴巴)**:凭借庞大的生态规模,覆盖从4800亿参数到6亿参数的各种尺寸模型,以及视觉语言、代码编写等多领域,几乎渗透整个开源市场 [23][131] - **Kimi(Moonshot AI)**:2025年11月发布万亿参数的混合专家模型Kimi K2 Thinking,采用交错思考技术,一次性能执行300次工具调用,在多个榜单上超越GPT-5和Claude 4.5 [11][122][135] - **MiniMax**:2025年10月底发布MiniMax M2混合专家模型,在综合榜单排名第五,超越Gemini 2.5 Pro和Claude Opus 4.1,其API定价为每百万输入/输出token 0.3美元/1.2美元 [14][124][127][185] - **智谱(Zhipu AI)**:发布GLM系列模型,如GLM-4.5和GLM-4.6,丰富了国产开源生态 [9][10][120] 国产开源模型的竞争优势与市场反馈 - **性能与成本**:国产模型在保持高性能的同时,具备极具竞争力的价格,例如MiniMax M2的价格仅为Anthropic Sonnet模型的1/12 [127][185] - **开发者认可**:海外社交媒体上广泛认可国产模型“好用、便宜”,成为小公司和副业项目的开发首选 [14][124] - **企业应用**:爱彼迎CEO公开表示,中国的开源模型Qwen比OpenAI更适合其实际工作,且更便宜 [25][134] - **具体能力展示**:实测显示,MiniMax M2能一次性生成功能齐全的棋类应用或网站,在处理包含20714个岗位、大小10MB的Excel数据时也表现出色 [16][18][30][35][138][141] 技术路径选择:全注意力与高效注意力之争 - MiniMax M2选择了传统的“全注意力机制”,而非当前流行的稀疏或高效注意力机制,主要原因是全注意力在工业级系统中的性能和可靠性仍然更高 [38][75][144][181] - 高效注意力机制(如线性、稀疏注意力)的核心目标是节省有限的计算资源,但其在复杂推理任务中可能存在隐藏缺陷,且相关基础设施尚不成熟 [41][44][57][147][150][163] - 随着上下文长度需求增长和GPU算力增速放缓,高效注意力的优势未来可能显现,但当前阶段,在质量、速度、价格三角中寻求平衡是关键 [62][75][168][181] 国产开源崛起的驱动因素与行业影响 - **内部竞争与算力限制**:国内模型厂商众多、竞争激烈,且面临算力紧张、芯片受限的困境,开源成为共享算力、避免重复建设、吸引开发者的有效策略 [93] - **构建完整生态**:各厂商通过不同的技术路线(如DeepSeek的成本控制、Qwen的生态规模、MiniMax的智能体能力)共同构建了一个庞大而完整的开源系统,形成了合力 [29][84][97][98] - **改变全球格局**:国产开源模型已成为全球AI生态的底座,全球小团队使用Qwen微调、用DeepSeek做推理基座、用MiniMax做智能体验证已成为常态,导致全球开源生态中心向中国倾斜 [98][109] - **数据佐证**:a16z数据显示,国产开源模型的累计下载量已超过美国模型,且领先优势持续扩大;斯坦福大学2025年AI指数报告也预示国产开源性能将超过闭源和美国模型 [95][97]