报告行业投资评级 未提及 报告的核心观点 随着金融业务数字化转型,金融机构采用云原生技术改造业务,核心业务上云使金融云平台重要性提升,对其稳定性和可靠性要求更高,强大的运维体系是保障云平台稳定性的有效手段。华为云基于自身经验和实践,积累主机上云场景的运维核心能力,沉淀构建现代化运维能力的路径和方法,助力金融企业实现主机业务全面云化 [7][8]。 根据相关目录分别进行总结 主机上云带来的运维新挑战 - 挑战1:核心应用上云后可用性管理面临成本、技术和管理三重挑战,需平衡高可用投入与产出,让现有技术发挥最大效能,并匹配管理手段与工具 [15][16] - 挑战2:云平台技术栈增厚,传统IT运维方式受冲击,需统一管理软硬件运维对象,汇聚和分析运维数据,构建全链路故障感知和全栈故障可视的运维体验 [17][18] - 挑战3:金融领域提出核心业务“1 - 5 - 10”目标,需解决少出问题、快速恢复故障和解决云网络问题等关键问题 [20] - 挑战4:主机上云过程中,应用与云平台运维受运维安全和租户安全双重挑战,运维安全存在意识不足、管控技术手段不足和权责不匹配等问题,租户安全面临攻击无法避免、防护难以全局统筹和威胁处置缓慢等挑战 [23][24][27] 主机上云运维现代化核心能力 平台运维现代化 - 全链路运维监控:构建从应用到云平台的全栈感知能力,包括终端、应用、PaaS实例和IaaS基础设施四层可观测体系,实现极简信息汇聚,提升运维体验和故障处理效率 [33][39][61] - 确定性故障恢复:基于云服务故障模式基线库对云服务实例进行全面诊断,通过云网一体化运维实现应用、虚拟链路、物理路由的一致性监控和运维 [64][79] - 预见性风险治理:分为运行态风险预防、变更风险控制和未知风险挖掘三部分,通过建立风险主动预防体系、变更模型和风险规则机制以及混沌工程来实现 [95] 应用运维现代化 - 运维规划前置到设计阶段:业务可靠性源于运维与设计融合,需进行业务容灾等级评估、选择容灾策略,并持续治理应用高可用 [131][132][135] - 借助运维数仓构建应用可用性监控管理体系:通过运维数仓汇聚运维数据、搭建业务指标体系和设计端边纵向可观测体系,实现业务故障实时感知定界 [136][138] 安全运维现代化 - 全视角运维安全体系设计:对运维过程进行无死角安全管控,包括事前权限规划和管理、事中运维操作管控以及事后运维操作审计与分析 [38] - 体系化、智能化安全运营:构建完整的安全防护体系,端到端保障云租户安全 [38]
践行深度用云:主机上云 运维现代化核心能力
华为·2025-02-20 15:51