华为云Tokens服务

搜索文档
慧科讯业出席华为全联接大会,共探企业AI降本增效新路径
搜狐财经· 2025-09-24 18:32
行业趋势与市场背景 - MaaS作为大模型规模化落地的关键途径 正重塑人工智能技术应用格局 [1] - 随着大模型服务需求加速释放 MaaS产业规模呈现出爆发式增长趋势 [1] - AI应用爆发导致Token调用量呈指数级增长 推理效率与体验成为核心竞争力 [4] 公司合作与技术应用 - 公司基于华为云Tokens服务实现可规模应用 可控制及持续创造业务价值的企业级AI生产力引擎 [1] - 公司采用基于华为云DeepSeek的双活LLM及自由蒸馏行业化模型(2+1)模式规模化服务客户 [3] - 公司基于华为云昇腾AI云服务及MaaS平台 在多模态能力 更低时延 Agent协议等方面应对挑战 [4] 技术优势与性能提升 - 基于华为云六大核心优势(高性价比 服务保障 性能稳定 算力澎湃 效果呈现 安全可靠)提升自研媒介大数据挖掘分析模型 [3] - 模型识别更精准 针对反讽 阴阳 暗喻等语义能够精准识别并捕获 同时可有效判别并过滤"吸睛" "注水"等内容 [3] - 预警时效更迅速 在高置信度前提下仅使用较少甚至无需人工进行二次研判 极大提升预警效率与时效性 [3] 业务功能与解决方案 - 一体化AI Agent从数据识别创建 知识图谱建立处理 分析与洞察 任务执行与保障四大层面针对整个业务流程全程把控 [4] - 信息维度更丰富 除了情感调性准确识别外 还能一并输出文章 话题及总结等信息 为企业公关部门决策提供全面参考 [4] - 具体业务功能包括新活动识别代理 新产品识别代理 知识图谱设置代理 商业分析代理 危机预警代理等 [5] 未来发展方向 - 公司将继续基于卓越的大数据技术实力与丰富的客户服务经验 构建AI驱动的智能数据平台和商业决策解决方案 [5] - 公司将携手行业各方共同推动AI在各领域更广泛 更深入地落地应用 [5] - 公司将以领先的AI能力深度赋能品牌数字化转型 助力企业持续释放增长潜能 [5]
华为携手伙伴共同发起第四届828 B2B企业节,Tokens服务助十万企业AI落
扬子晚报网· 2025-08-28 16:42
活动概况 - 第四届828 B2B企业节于8月27日在贵阳开幕 由华为联合中软国际 软通动力等17家头部企业共同发起 旨在通过技术普惠和生态协作加速千行百业企业AI应用落地 [1] - 贵州作为全国国产智算资源最多 能力最强的地区之一 已三次吸引该活动落地 [1] - 活动聚焦智算 大模型 人工智能 数据等前沿技术 并展示最新数字产品与解决方案 [1] 政策与生态支持 - 国家数据局将健全政策体系 推动企业数据开发利用 深化政企协同 培育数据产业 建设数据基础设施 引导数据企业出海 [1] - 华为与贵州合作打造全国算力高地 加强华为云与政企全生态链合作 构建开放协同的数字产业生态环境 [2] - 华为云升级大模型服务平台 支持中国最全最新大模型及多个主流Agent平台 提供基于CloudMatrix384超节点的Tokens服务 [2] 技术突破与性能 - 华为云Tokens服务全面接入CloudMatrix384超节点 通过xDeepServe架构实现单芯片最高2400TPS和50msTPOT的超高吞吐低时延性能 超过业界水平 [3] - 性能突破依托华为综合优势:全新计算架构突破性能瓶颈 CANN昇腾硬件优化算子与通信策略 EMS弹性内存存储打破AI内存墙 xDeepServe分布式推理框架实现高效算力释放 [3] 行业应用与合作 - 华为云Tokens服务已成为各领域企业加速AI应用落地的共同选择 多家企业代表分享基于华为云的AI创新实践 [4] - 开幕式签署2025全国智能企业算力合作意向 发布华为云GoCloud与GrowCloud结对子榜单 828精选AI企业应用方案 贵州特色行业大模型成果 [4] 活动规模与资源 - 本届企业节提供超过12000款新产品 推出近600款精选智能化产品与解决方案 覆盖企业数智化转型全阶段全场景 [5] - 未来一个月启动828全国行动月 包括企业AI应用加速 中企出海 企业快成长等专项行动 覆盖120余座城市 数亿补贴惠及超10万企业 [5]
华为云宣布Tokens服务全面接入384超节点,国产算力产业链有望加速渗透
选股宝· 2025-08-27 22:52
华为云Tokens服务与AI算力发展 - 华为云Tokens服务全面接入CloudMatrix384超节点 通过系统创新提升性能 单芯片最高实现2400TPS和50msTPOT的超高吞吐低时延表现 超过业界水平 [1] - 中国AI算力需求呈现指数级增长 日均Token消耗量从2024年初1000亿增至2024年6月底30万亿 18个月增长300多倍 反映人工智能应用规模快速扩张 [1] - CloudMatrix384超节点是革命性AI架构 具备高吞吐 低时延 高弹性特点 通过系统级创新解决传统算力瓶颈 加速AI商业化落地 [1] 相关产业链公司动态 - 盛科通信作为国内稀缺以太网交换芯片设计企业 面向大规模数据中心和云服务需求 其12.8Tbps及25.6Tbps高端旗舰芯片已进入客户市场推广和应用阶段 [1] - 欧陆通作为高功率服务器电源供应商 直接受益于AI产业增长和国产替代机遇 [2]
单芯片最高2400TPS,华为云Tokens服务全面接入384超节点
观察者网· 2025-08-27 21:10
AI算力需求增长 - 中国AI算力需求呈现指数级增长 日均Token消耗量从2024年初的1000亿增至2024年6月底的30万亿 18个月内增长300倍[2] - 算力基础设施面临更大挑战 反映人工智能应用规模快速扩张[2] 华为云Tokens服务性能突破 - Tokens服务接入CloudMatrix384超节点 通过xDeepServe架构实现单芯片最高2400TPS和50msTPOT 吞吐量较年初1920TPS提升25%[1][2] - 提供在线版 进线版 离线版和尊享版等多种服务规格 满足不同应用场景性能和时延要求[2] 全栈算力架构创新 - CloudMatrix384超节点采用全新计算架构 突破性能瓶颈[4] - CANN昇腾硬件使能优化算子与通信策略 实现高效算力调用组合[4] - EMS弹性内存存储打破AI内存墙 以存强算彻底释放芯片算力[4] - xDeepServe分布式推理框架采用极致分离架构Transfomerless 提升算力效率[4] xDeepServe技术实现 - 采用Transformerless架构将MoE大模型拆分为Attention FFN Expert三个可独立伸缩微模块[5] - 通过XCCL微秒级通信库与FlowServe推理引擎重组 形成超高速LLM服务平台[6] - 实现单卡吞吐从600tokens/s提升至2400tokens/s 达4倍性能提升[6] - FlowServe引擎将超节点切分为自治DP小组 支持千卡并发无拥堵[6] 未来技术规划 - 计划实现Attention MoE Decode全数据流自由流动[7] - 将拼图方法复制到多台超节点 目标实现推理吞吐线性延伸和更大突破[7] 模型生态与性能优化 - MaaS服务支持DeepSeek Kimi Qwen Pangu等主流大模型及Dify 扣子等Agent平台[8] - 文生图模型通过Int8量化和算子融合实现2倍于业界出图速度 支持2K×2K尺寸[8] - 文生视频模型通过量化和通算并行实现3.5倍性能提升 降低延迟与显存占用[8] 行业应用落地 - 与超过100家伙伴合作开发行业Agent 覆盖调研分析 内容创作 智慧办公 智能运维等领域[8][9] - 今日人才数智员工解决方案集成NLP和机器学习技术 提升服务效率与客户满意度[9] - 无忧智慧公文解决方案提升政企公文处理效能 推动办公智能化转型[9]