大模型服务
搜索文档
腾讯云官宣:涨价
新华网财经· 2026-03-11 21:35
腾讯云AI模型计费策略调整 - 腾讯云于3月11日发布公告,为持续提供稳定优质的大模型服务,将对智能体开发平台部分模型的计费策略进行优化调整,调整主要涉及模型价格与公测模型结束免费两类变更[1] - 调整将于2026年3月13日00:00(北京时间)正式生效[3] 具体价格调整详情 - 三个模型将结束限时免费公测,转为正式商用并按量计费,包括GLM 5、MiniMax 2.5、Kimi 2.5[3] - 腾讯混元系列模型Tencent HY2.0 Instruct与Tencent HY2.0 Think服务价格大幅上调[3] - Tencent HY2.0 Instruct输入价格从0.0008元/千tokens调整为0.004505元/千tokens,涨幅超460%;输出价格从0.002元/千tokens调整至0.01113元/千tokens,涨幅超450%[3][4] - Tencent HY2.0 Think输入价格从0.001元/千tokens调整为0.0053元/千tokens;输出价格从0.004元/千tokens调整为0.0212元/千tokens[3][4] 行业背景与市场动态 - 此次AI模型涨价的背景,与开源AI“龙虾”OpenClaw的持续火热有关,其一个月间Token消耗量便翻4倍以上[4] - 公开数据显示,中国整体日均Token消耗于2025年中突破30万亿,至2026年2月主流大模型合计日均Token消耗已达180万亿级别[4] - 截至3月11日,包括华为、腾讯、小米、阿里巴巴、网易、智谱、MiniMax、Kimi等在内的多家科技厂商已加入“龙虾局”并推出类似OpenClaw的产品[5] 腾讯公司的相关布局与动作 - 在“养虾”热潮下,腾讯近期动作频频,正持续发力完善相关产品与服务生态[5] - 3月9日,腾讯旗下全场景AI智能体WorkBuddy正式上线[5] - 公司目前已初步形成覆盖个人、开发者及企业级部署的智能体“养虾”矩阵,产品包括自研龙虾、本地虾、云端虾、企业虾、云桌面虾,安全隔离虾房、云保安、知识库等,并有一批产品陆续赶来[5]
智谱再涨超10% GLM-5新模型发布在即 智谱本周累计涨幅已超七成
智通财经· 2026-02-11 10:25
公司股价表现 - 智谱股价再涨超10%,本周累计涨幅已超70% [1] - 截至发稿,股价涨6.99%,报340港元,成交额2.92亿港元 [1] 市场消息与催化剂 - 全球模型服务平台OpenRouter上线代号为“Pony Alpha”的匿名模型,引发全网关注 [1] - 据知情人士消息,该神秘模型是智谱即将发布的新一代模型GLM-5 [1] - 智谱首席科学家唐杰2月初明确表示公司最近将发布GLM-5 [1] 公司业务与前景 - 智谱是国内领先的大模型服务提供商,以自研GLM基座大模型为核心 [1] - 公司形成了包括多模态、Agent和Coding的完整模型矩阵 [1] - 公司为企业客户提供API服务、本地化部署与行业解决方案 [1] - 广发证券预计公司2025-2027年营收将保持高速增长 [1] - 预计公司规模效应将逐步显现,长期盈利具备较强确定性 [1]
从黄金到GPU:一条让你多花钱的隐秘供应链
搜狐财经· 2026-02-11 05:39
贵金属价格剧烈波动 - 现货黄金价格在2025年末至2026年初经历极端波动,一度逼近5600美元/盎司的历史高位,随后在1月30日创下40年来最大单日跌幅,跌至4400美元关口附近,一周内又反弹至5000美元/盎司 [2] - 现货白银价格波动更为剧烈,1月31日上演超过35%的史上最大单日跌幅,直接抹去年初全部涨幅,随后跟随黄金反弹 [4] - 2025年黄金价格累计涨幅超过70%,创下1979年以来最大年度涨幅 [12] 贵金属在半导体产业的关键作用 - 黄金因其极佳的导电性、抗氧化和耐腐蚀能力,是高端芯片“引线键合”工艺中键合金线的核心材料,单根键合线使用约20纳克黄金,单个芯片总用量约2-3毫克 [4][6] - 白银在所有金属中导电率位居榜首,是电路板、连接器、电源系统、芯片导电层及银浆印刷电路的核心材料,对信号传输损耗和电路精度至关重要 [6][8] - 白银在半导体封装中制成银浆导电胶,兼具黏合、导电和高效散热功能,其散热性能是铝或复合材料无法比拟的 [10] 光伏与汽车行业推高白银需求 - 光伏行业全面转向N型电池(TOPCon或异质结),其对白银的需求比老式电池几乎翻倍,光伏行业的白银消耗量已占据全球实物白银供应的近三成 [8] - 在新能源汽车电池系统中,银基导电浆料有助于提升电极性能,每辆电动汽车需要约20-30克白银,而传统燃油车仅需约1克 [10] 成本压力沿半导体产业链传导 - 贵金属价格上涨直接推高半导体封装测试成本,当黄金成本上涨20%时,封装成本可能上浮5%-8% [10] - 2025年贵金属价格飙升导致封测行业集体涨价,部分厂商涨幅直逼30% [12] - 晶圆代工厂与存储芯片巨头在利润被侵蚀后,通过调价函将成本压力向后传递 [10] 供需失衡加剧半导体行业通胀 - 2026年全球DRAM内存需求同比激增23%,其中数据中心需求增速高达28% [12] - 单台AI服务器的内存需求达到传统服务器的8-10倍,云厂商已签署覆盖2027年的长期协议,并提前预订2028年产能 [12] - 半导体产能扩张周期长,2026年全球三大存储原厂合计新增晶圆产能仅85万片,整体增幅约5%,远低于需求增速 [14] 产业链不同环节的差异化影响 - 原材料成本上涨为国产半导体设备商和材料商带来了“窗口期”,缓解了研发投入的财务压力,有利于对抗国际技术垄断 [15] - 中游的芯片设计与硬件制造商(如中微半导、国科微)陷入“夹心层”困境,向上无法对抗原材料涨价,向下面临客户流失风险,部分企业已上调芯片价格 [15] - 存储价格上涨导致服务器成本攀升,进而增加云厂商运营压力,最终压力将穿透B端直达C端消费者 [17] 消费电子行业掀起涨价风暴 - 全球五大PC厂商(联想、惠普、戴尔、华硕、宏碁)均已明确上调产品售价,以应对半导体元器件持续涨价 [19] - 市场一线反馈显示,联想、华硕、惠普等品牌PC全线涨价幅度在10%—30%,部分热门机型出现“下午报价、晚上调价”的情况 [21] - 智能手机行业开启新一轮涨价潮,小米17 Ultra起售价较上一代上涨500元,红米、iQOO、OPPO等厂商对中端及旗舰机型调价,部分机型涨幅最高达20% [22] 云计算行业打破长期降价铁律 - 亚马逊云科技(AWS)于2026年1月23日打响涨价“第一枪”,将其面向大模型训练的EC2机器学习容量块服务价格上调约15%,例如p5e.48xlarge实例每小时费用从34.61美元涨至39.80美元 [25] - 谷歌云于2026年1月27日宣布自5月1日起调整全球数据传输等服务价格,其中北美地区单价从0.04美元/GiB翻倍至0.08美元/GiB,涨幅高达100% [25][26] - 此次调价标志着云计算行业自2006年以来近二十年“价格只降不升”隐性规则的终结,是商业模式的重大转折 [28] AI算力成本驱动应用服务涨价 - AI算力需求爆发推高上游成本,AWS的H100云计算调用价格短期内平均上涨约22%,8卡H100服务器租赁价格相较两年前上涨近30% [29] - 企业为维持AI功能需投入巨额算力成本,导致软件厂商通过调整会员价格回收成本,国内软件会员费用平均涨幅达20%—30% [31][32] - 大模型服务商业化走向理性收费,2025年超过七成的厂商对API价格进行了上调或停止了降价 [32] - 以DeepSeek为例,其API服务价格在2025年9月后上调,每百万输出tokens价格由8元提高至12元 [32] 用户付费意愿与新模式涌现 - 毕马威报告显示,超过65%的用户认为只要AI功能能切实提升工作效率,他们愿意接受一定程度的价格上涨 [34] - 以ClawdBot(OpenClaw)为代表的通用智能体(Agent)应用走红,创造了海量的API Token消耗需求,催生了面向职场专业人士(To Professional)的新付费赛道 [35] - “基础免费+增值付费”的梯度策略成为主流大模型企业的选择,用户付费观念从“拒绝为软件付费”转向为“效率价值”付费 [32][34]
智谱午后涨幅扩大逾30% GLM-4.7-Flash开源14天突破百万下载
智通财经· 2026-02-09 13:53
公司股价表现 - 智谱(02513)午后涨幅扩大逾30%,截至发稿,股价上涨27.95%,报260港元,成交额达5.81亿港元 [1] 产品与市场动态 - 公司新发布的混合思考模型GLM-4.7-Flash在发布两周后,于Hugging Face平台的下载量突破了100万次 [1] - Open Router平台上线搜索排名第一的神秘匿名模型Pony Alpha引发市场热议,有分析猜测该模型可能是智谱GLM新模型 [1] 机构观点与公司前景 - 广发证券研报指出,公司作为国内领先的大模型服务提供商,以自研GLM基座大模型为核心,形成了包括多模态、Agent和Coding的完整模型矩阵 [1] - 公司为企业客户提供API服务、本地化部署与行业解决方案 [1] - 广发证券预计公司2025-2027年营收将保持高速增长,规模效应逐步显现,长期盈利具备较强确定性 [1]
PPIO首发上线DeepSeek-V3.2-Exp
证券日报网· 2025-09-30 14:17
模型技术更新 - DeepSeek发布新版本模型DeepSeek-V3-2-Exp 该模型在V3-1-Terminus基础上引入DeepSeek稀疏注意力机制 旨在优化长上下文场景下的训练和推理效率 [1] - 新模型架构在提升训练推理效率的同时 实现了API价格的大幅下降 [1] 产品定价与成本 - PPIO平台对DeepSeek-V3-2-Exp的定价为每百万输入tokens 2元 每百万输出tokens 3元 [1] - 新定价使开发者调用DeepSeek API的成本降低75% [1] 平台服务能力 - PPIO是致力于为企业及开发者提供高性能API的服务平台 拥有丰富的开源模型"超市" [2] - 平台已上线DeepSeek R1/V3、DeepSeek-Prover-V2-671B、MiniMax、Qwen等系列模型 支持仅需一行代码即可调用 [2] - 根据《2025大模型服务性能排行榜》 PPIO在DeepSeek-R1-0528的吞吐测试中排名第一 [2] - 公司通过2024年实践 已实现大模型推理的10倍以上降本 达成推理效率与资源使用的动态平衡 [2]