Workflow
Qwen 3模型
icon
搜索文档
Canalys:一季度中国内地在云基础设施服务上的支出达到116亿美元 同比增长16%
智通财经网· 2025-07-11 10:24
智通财经APP获悉,Canalys最新数据显示,2025年第一季度,中国内地在云基础设施服务上的支出达到116亿美元,同比增长16%。AI相 关需求已成为推动企业向云端迁移的主要动力。为把握这一增长机遇,云厂商正积极加大对AI基础设施和模型研发的投资。为弥合AI大 模型能力与实际业务需求之间的差距,厂商正采取多种战略路径,包括开源AI模型、拓展合作伙伴生态、推出AI智能体开发平台等。 在其最新发布的《企业AI合同数据库》中,Omdia记录了多项中国内地企业与云厂商之间的新合作案例,企业正通过部署预训练的即用 型模型及相关服务,加速其AI落地进程。2025年第一季度,阿里云在中国内地云服务市场中占据33%的份额,华为云为18%,腾讯云为 10%。 2025年第一季度,中国内地云基础设施服务市场持续加速发展。随着企业加快AI部署,云服务市场的潜力正不断释放。AI大模型对算力 的巨大需求,正在显著推动企业对基于云的GPU资源的依赖。 客户对AI的旺盛需求正在重塑云计算的应用方式。Canalys高级总监 Rachel Brindley 表示:"AI正在全方位推动企业加速上云。一方面, 原本依赖本地数据中心的组织,正将 ...
2025年第一季度,中国云基础设施市场加速增长,阿里云稳居第一,华为云与腾讯云加速AI布局
Canalys· 2025-07-11 09:52
中国大陆云基础设施服务市场概况 - 2025年第一季度中国大陆云基础设施服务支出达116亿美元,同比增长16%,AI相关需求成为企业上云主要动力[1] - 阿里云以33%市场份额保持第一,华为云(18%)和腾讯云(10%)分列二三位[1] - 合作伙伴驱动的云服务收入占比达25%,生态协作成为AI商业化核心推动力[1] AI驱动云服务发展 - AI大模型对算力需求显著提升企业对云GPU资源的依赖,推动IaaS及基础模型服务长期需求[1] - 企业AI工作负载呈现两类迁移模式:本地数据中心向云端迁移,以及现有云架构持续集成AI能力[1] - 阿里云AI工作负载连续七个季度实现三位数增长,成为其核心业务引擎[1] 云厂商战略路径 - 厂商采取双轨战略:通过模型开源构建生态(如阿里云全面开源Qwen3系列8个模型),同时开发智能体平台加速场景交付[1] - 华为云发布"盘古5.5"基础模型套件,覆盖五大领域且推理效率提升8倍,并推出ModelArts Versatile开发平台[2] - 腾讯云迭代混元大模型Turbo S(全球Chatbot Arena前八),推出TCADP智能体开发平台支持多模型接入[2] 头部厂商动态 - 阿里云: - 设立新加坡全球AI能力中心,在马来西亚启用第三座数据中心,计划10月前上线菲律宾新数据中心[1] - 启动"出海加速大会"系列活动推动国际化战略[1] - 华为云: - 推出1.5亿元生态激励计划聚焦昇腾AI等四大方向,云市场KooGallery年交易笔数破百万[2] - 营收同比增长18%,市场份额提升至18%[1] - 腾讯云: - 受GPU资源紧张影响短期增长,但在日本新增云区域强化亚太布局[2]
小红书开源1420亿参数大模型,部分性能与阿里Qwen3模型相当
钛媒体APP· 2025-06-10 09:07
小红书开源大模型dots.llm1 - 小红书hi lab团队开源首款文本大模型dots.llm1 包括base模型和instruct模型 并公开训练信息如超参数和中间训练checkpoint [2] - dots.llm1采用混合专家模型(MoE)架构 总参数量1420亿 推理时仅激活140亿参数 使用11.2万亿token高质量训练数据 [3] - 模型性能对标阿里Qwen系列 dots.llm1.inst在中英文通用场景、数学、代码、对齐任务上表现亮眼 部分性能与Qwen3-32B相当或更优 [6][7] 技术细节与性能表现 - 训练数据质量显著优于开源TxT360数据 经过两阶段SFT训练得到最终模型 [5] - 优化Grouped GEMM算子 在英伟达H800上前向计算平均提升14% 反向计算平均提升6.68% [5] - 中文任务表现突出 CLUEWSC得分92.6 C-Eval得分92.2 超越DeepSeek-V3等模型 [7] - 在MMLU、DROP等英文基准测试中表现接近主流大模型 代码生成能力与Qwen2.5-72B相当 [8] 公司战略与估值 - 小红书2023年起持续投入大模型研发 近期推出AI搜索应用"点点"和"问一问"功能 [9] - 公司估值从200亿美元跃升至260亿美元 一级市场老股报价达350亿美元 2024年净利润超10亿美元 [9] - 股东包括真格基金、金沙江创投、阿里、腾讯等20余家知名机构 [9] 未来发展方向 - 计划集成更高效架构设计如GQA、MLA和线性注意力 探索更稀疏MoE层提升计算效率 [10] - 将加深对训练数据的理解 探索更接近人类学习效率的方法 [11] - 技术文档显示团队计划贡献更多全模态大模型 可能发力多模态领域 [11]