随着金融行业云计算的发展,服务管理向着自动化、集中化方向转变,Redis作为一款简洁、高效的开源内存数据库已经在金融业务领域广为应用,光大科技“分布式缓存平台”以“金融行业云运维管理能力平台”为基础,打造集中管理、快速部署、弹性伸缩并满足高可用特性的统一交付平台,全面提高Redis的服务输出能力。金融行业云运维管理能力平台随着金融行业云计算、虚拟化技术的发展,IT基础架构的管理向自服务管理自动化、IT服务集中化、横向服务扩展、网络架构管理、集中监控告警以及对不同技术领域的统一管理的方向转变。金融行业IT业务需求广度、深度、应用规模、用户数据日益扩展,新一代的行业运维管理要求有:※降低管理成本※兼顾不同厂商物理、虚拟资源统一管理※提高基础架构设备利用率※监控关键业务指标及告警※简化运维※提供标准化及定制化管理界面※符合碳中和要求为适应新一代行业运维管理需求,光大科技致力于整合项目经验和开发资源,打造“金融行业云运维管理能力平台”,以提供:※端到端的自助服务管理※统一的业务运营和运维管理※自动化的流程编排及资源分配、应用部署※支持多种技术架构※支持多种硬件设备、软件的集成服务※服务器、网络、存储、数据库、中间件等的运维管理等分布式缓存平台即基于Redis的数据库管理平台。Redis作为一款简洁、高效的键值型开源内存数据库已经在各类行业广泛部署应用,为高频次、大并发业务提供有效的热点数据访问加速方案,尤其在金融行业广为应用。“分布式缓存平台”以“金融行业云运维管理能力平台”为基础,打造Redis集中管理、快速部署、弹性伸缩并满足高可用特性的统一交付平台,全面提高Redis的服务输出能力。分布式缓存平台建设理念服务目标“分布式缓存平台”以“平台+服务”为基础,为金融行业客户提供运维监控、纳管对接和深度定制化服务,并通过技术整合及定制开发相结合的方式,实现多种核心能力:※预警分析能力:实时采集、存储时序数据,实时感知系统状态,进行压力趋势分析,性能分析、故障快速定位、统计展示等※自动化运维能力:实现服务的快速、标准部署,保证服务高效交付,提供统一管控能力,实现全生命周期管理等※应用设计能力:工作流设计,功能设计,交互设计,报表及图表定制,聚合页面设计,用户体验评价及优化,知识产权共享等※服务保障能力:提供私有化部署、光大科技金融云部署方案,提供智能化安全运维,智能化安全运维,日常巡检,24小时保障服务,应用培训及线上反馈等分布式缓存平台建设目标应用场景“分布式缓存平台”定位服务全体业务用户,覆盖全职能,定制化用户权限及界面,同时打造运维服务闭环流程,保障运维工作空间与时间延续性。※面向高层领导:制定业务发展方向,监督业务发展态势,了解系统主要问题※面向业务主管:掌握项目总体情况,管理调配项目资源,参与关键问题处理※运维管理面向:保障系统稳健运行,监控分析重点参数,配置策略管理告警※面向开发团队:观察项目健康情况,保障系统运行效率,分析系统薄弱环节分布式缓存平台应用场景技术架构“分布式缓存平台”后端技术架构自下而上包括:※资源层:支持单节点、主从、哨兵、集群等架构的管理※运维及监控:提供采集监控和运维操作的功能※数据存储:提供大数据存储和处理分析能力※服务层:服务化设计,提供基础服务能力※业务应用层:完善的应用功能※展示层:统一的运维、监控、管理入口功能架构“分布式缓存平台”前端功能按照运维管理规定进行逻辑划分,按照互联网云管理平台架构进行聚合,实现系统架构从整体到局部,管理颗粒度由粗到细,信息展现由简略至详尽的功能整体架构。“分布式缓存平台”整合了“金融行业云运维管理平台”的基础能力以及客户定制需求,同时支持多系统纳管和跨系统操作,标准化部署快捷统一,差异化定制细致入微。分布式缓存平台功能架构项目健康度健康度展示方案可作为插件应用于分布式缓存平台页面中,用于展示以项目为维度宏观展示Redis系统运行状况,判断稳定程度。通过针对告警及监控数据的加权、拟合算法计算实例节点的健康度数据并计算项目数据,作为方案后台数据来源。首页健康度插件健康度详情统计健康度统计卡健康度标示方法重点监控用户根据自定义设置监控指标项配置首页展示的重点监控指标,根据选择的指标不同展示包括曲线、列表、饼图等多种chart,卡片显示包括监控类型名称,告警项目数(累积项目数),告警实例数(实例总数)以及告警总数等必要汇总信息,能够清楚的按照监控及告警类型了解整个系统的告警或监控数据总体概况。首页重点监控参数卡多种监控及告警展示工具监控指标配置工具项目详情按照项目角度查看项目,为用户提供多角度节点查看方式:※集群及哨兵模式下节点的逻辑架构※节点在主机上的分布情况※标明节点地址、容器属性等必要信息※通过颜色提示节点运行状态,实例卡片展示节点运行告警信息※节点详情列表可直接跳转实例详情集群及哨兵项目架构展示按主机展示节点架构节点运行状态提示实例详情实例是分布式缓存平台监控管理的基础:※实例监控项可自定义添加、删除和排序,支持用户高效、便捷、清晰的了解运行状况进行数据分析※实例告警汇总实例所有历史告警详情,支持差异化、个性化告警策略的制定※实例详情支持多种展示布局及风格,界面友好实例监控信息汇总显示实例告警信息汇总显示运维管理实例管理:针对实例节点进行增删改查编辑操作告警配置:针对告警配置策略进行配置调整主从切换:支持多集群的主从切换操作参数模板:支持参数模板的导入、修改以及配置操作其它功能审计和日志:支持日常平台使用情况统计以及操作统计日志的审计后台管理:平台通用设置,用户及数据管理,纳管系统配置及管理等技术支持:针对平台安全及稳健运行提供全方位的保障应用案例银行等金融企业缓存数据库数量快速增加,而运维团队规模有限,难以满足日益增长的业务管理复杂度与管理精细化需求。光大科技基于以上现状为某股份制商业银行定制开发并部署了分布式缓存平台,集中纳管了800+个缓存实例,横跨超百个业务项目,覆盖近千名业务用户;实现对缓存数据库进行全生命周期管理,实现了完全自主可控的缓存数据库自动化运维能力;为研发人员提供了自助式服务,研发人员可自行根据平台采集的性能指标对系统进行优化。“分布式缓存平台”助力传统运维到自动化运维的蜕变,通过规范化、高效、灵活、可扩展的自动化运维能力,让运维团队更加直观掌握系统运行,高效执行运维操作,轻松面对繁重的运维工作。 |