智能运维场景解析:一体化运维监控体系需求与建设

运维

    数字化不是请客吃饭,无法一蹴而就,需要逐步推进。对于传统企业来说,数据是数字化的基石,而打通数据孤岛,构建一体化监控体系,实现IT资源的统一管控是数字化转型成功的第一步。

     随着数字业务规模不断扩大,上线的业务系统日益增多,核心业务越来越依赖IT系统的稳定运行。这时,我们会发现应用性能、服务器性能、网络性能、大量接口调用性能、容器等微服务组件性能、云平台性能等诸多因素都会影响业务运转及用户体验

    而现有基础设施监控系统的监控范围和颗粒度无法满足目前的监控管理需求缺乏自动化技术手段对业务系统实时监控,存在故障无法预警的风险。在技术管理层面,业务系统的计算、网络、中间件及数据库存在大量数据孤岛,导致故障排查困难,不能快速定位故障根因,无法满足中大型企业的数字化转型需求。

     因此,企业需要一套涵盖基础架构、网络、系统应用性能和用户体验管理的统一监控平台提供故障预警和快速故障定位,并可快速跟踪分析应用性能问题至故障根源,为应用系统性能优化提供建议,从而提高IT系统运维工作的整体效率及服务水平,保障业务系统的持续稳定运行。

以某大型企业用户为例,有几百个业务系统支撑着该企业核心业务的日常运转,每天的工单、告警数量堪称海量,传统运维管理流程和相关工具暴露出严重不足。

主要体现在以下几点:

1.业务信息子系统众多,却缺乏统一管理平台

业务系统涉及众多的服务器、服务、应用、数据库和网络设备,缺乏统一的综合运维管控平台,运维难度大,成本高;缺乏统一的业务、应用、网络及基础设施性能监控可视化平台;

2.难以感知业务应用健康状况

无法实时了解核心系统的运行状况(网络、服务器、数据库、服务、应用及业务系统运行是否有性能问题、错误等);

无法实时了解不同业务系统进行业务数据交换和业务调用时的网络质量和性能状况;

 无法了解不同业务用户使用业务时的真实体验,无法知晓全国各地或海外终端客户使用产品或业务的真实体验

3.系统发现问题,无法快速定位根源

业务系统出现问题,无法第一时间进行准确定位,故障无法复现,无法准确定位原因;数据过于分散,无法有效整合,无法最大化挖掘数据价值,问题原因不清晰,协调人员困难;


一体化运维监控解决方案

一体化运维监控解决方案基于用户典型应用场景,利用海量运维大数据处理能力和机器学习等智能运维术手段,通过模块化监控工具和日志分析系统,实现竖井式系统的打通和数据的关联分析,通过业务调用链路实时监控与追踪,全面掌控各核心系统的服务状态及业务支撑能力,为业务和系统性能分析奠定了数据基础,并为IT运维管理决策提供有效的数据支持。

基于此解决方案,需要构建的一体化运维监控平台,帮助用户实现了IT资源可视化呈现,通过统一告警、大屏展现,实时掌控IT资源运行状况,提高信息化技术管理水平。

  一体化运维监控平台包括:

   统一监控管理平台:提供统一的界面,实现统一登录,包含:基础设施监控、应用性能监控、网络质量监控、业务监控、用户体验监控、统一告警和大屏可视化展示。

   基础设施监控:包括主机监控、Hyper-V监控、存储监控、网络监控、网络设备、机房管理、中间件、数据库监控。

   端到端应用系统性能管理:包括移动APP用户体验分析及行为分析、网站用户体验及行为分析、服务端应用系统性能分析、业务系统自动拓扑、端到端性能关联分析(实现从用户体验出发,涵盖移动APP、浏览器网站、后端代码、应用中间件在内的全环节性能问题追踪)以及智能化告警功能。

  帮助企业实现以下价值

1.打破数据孤岛,实现统一告警,构建立体化IT监控和运维管理体系。

2.从业务视角实时感知业务及系统运行状态,实现业务和IT的双向驱动,确保业务连续性,提升业务效能。

3.充分利用云端技术,构建智能化运维管控平台,快速定位业务问题,持续改善业务健康状况。


开发运维一体化


企业应用的开发运维模式是怎么个样子?

无论是基于应用开发平台开发好的业务应用(一般为java类应用,程序war包的形式),亦或是基于服务治理平台开发好的微服务应用,针对这些应用,我们该如何运维?

运维的条件:高配的物理机?虚拟化技术?Docker容器?持续构建?缩容扩容?自动化测试?监控预警?APM?KPI?。。。

我们现在讲开发运维一体化,是因为越来越多的项目要求CI/CD等可持续交付及持续运营的能力。

开发者中心为开发者提供了资源管理、持续集成、持续交付、容器服务、镜像仓库等应用基础服务,同时为应用的微服务架构落地提供完备的支撑,结合DevOps的理念,通过提供自动化运维、日志管理、中间件服务等功能,帮助开发及运维人员降低产品研发迭代过程中的负担。

核心功能:

1.资源管理:以资源池的方式进行计算节点管理,自由添加自有主机,进行智能化的资源调度与分配。

2.容器服务:以应用为中心,简化上云过程,为应用提供扩容、缩容、升级、回滚等功能,支持服务发现、负载均衡。

3.DevOps:以可视化的方式实现应用的集成、测试、发布自动化,并提供在线控制台及日志,进行故障分析与排查。

4.持续交付:以Docker镜像为应用交付载体,一次构建,到处运行,平台自动生成子域名,让应用自由接入。

5.镜像仓库:共享容器生态,尽情无限探索,镜像仓库中的应用开箱即用,按心情随需部署各类应用软件。

6.微服务:全面支持微服务架构,只要你敢拆,我就敢部署,结合服务发现、配置管理支撑大规模微服务的运行。

7.自动化运维:通过全面的监控报警、日志收集、健康检查、服务自愈、泛域名解析及应用链路管理等,减轻运维负担。

7.日志管理:平台能够解决海量日志处理难题,数据加密存储。上云应用,无需配置,即可随心查看各种业务日志。

8.运营分析:平台能够自动统计应用的访问量情况、访客地域分布、业务的响应时间,结合运营数据进行业务发展决策。

9.中间件服务:平台提供主流的缓存、数据库、消息等中间件,开发者可按需选用支撑服务,方便快速搭建开发测试环境。

产品优势

开发者中心提供了对应用开发态和运行态的全面支持,可以看成是开发者的云、运维人员的云、DevOps的云、行业领域的云、支持创新的云。 它是一个应用全生命周期管理的平台,底层基于容器技术(Docker),全新的技术模式正在快速改变着公司和用户创建、发布和运行分布式应用的方式。 DevOps的理念使得软件行业日益清晰地认识到:为了按时交付软件产品和服务,开发、运维和运营工作必须紧密合作。 开发者中心将DevOps理念融入其中,并致力于打造企业应用开发运维一站式服务。

应用场景

1.互联网应用可通过平台一键部署,应用的开发、测试、灰度、生产环境自由切换、统一管理。

2.加速互联网应用的持续交付、快速迭代,赋能企业应用交付能力、降低应用交付成本。

3.在镜像仓库发现你想要的应用,Jenkins、Sonar、WordPress等应有尽有,在云上畅快体验应用的各种功能。

4.传统企业服务多为单体架构,通过平台可轻松实现向微服务架构的平滑转换。

5.移动APP流量峰值随时产生,平台具备弹性计算能力,能够支撑高并发的访问。

6.研发过程中需要各种测试库,通过平台可选用所需中间件,快速搭建自己的测试环境。

7.助力IoT,基于平台构筑大数据系统,智能硬件数据可自由收集,让硬件更智能。

禁止转载,如需转载请通过简信或评论联系作者。