You need to enable JavaScript to run this app.
导航

私有化部署系统监控

最近更新时间2023.06.13 21:13:25

首次发布时间2021.02.23 10:42:04

1. 概述

系统监控,主要是指系统管理员需要承担日常的服务检查工作,检查与监控服务资源。智能数据洞察提供了系统管理员操作面板,方便管理员日常掌握系统健康情况,快速发现问题、定位问题。服务资源主要包括主机、应用服务和基础组件等,后文将为您分别进行介绍。

温馨提示:本文主要适用于智能数据洞察产品的私有化部署场景。

2. 汇总监控介绍

通过查看汇总监控,可以快速了解系统整体运行状态,发现系统的稳定性和性能问题,

链接:
http://${datawind-domain}/monitor

资源状态: 每个资源的状态分为三种状态
可用:该资源运行正常;
警告:该资源可以提供服务,但存在风险,比如压力较大,部分服务不可用等;
不可用:该资源不可提供服务;

管理员日常仅需关注这一部分,即可对系统的总体状态有个明确的了解,

对于“不可用”或“警告”的服务,可以再下拉到对应的部分进行详细的查看和分析。

  • 监控汇总:
    image.png
3. 主机监控介绍

主机监控能够监控各个宿主机的运行情况,比如内存、磁盘 IO 等。
image.png

  • 通过“监控”入口,可查看该主机的监控指标详情:

image.png

  • 主机发生异常时,将会向用户发送告警信息:

image.png

4. 应用服务监控介绍

智能数据洞察的应用服务监控能够每个 Kubernetes 中部署的服务状态,每1分钟刷新一次各服务状态。

服务的状态通过回调每个服务的健康检查接口获取,对于警告或不可用的服务,会在摘要信息里显示具体原因,并且可以查看详细信息。

  • 服务监控:

image.png

  • 服务监控指标详情:

image.png

  • 在应用服务发生异常时,将会向用户发送告警信息:

image.png

5. 基础组件监控介绍

基础组件监控用于监控各基础组件的运行情况,比如端口连通性、集群健康状态、主备状态等。

  • 基础组件监控:

image.png

  • 基础组件指标监控详情:

image.png

  • 在基础组件发生异常时,将会向用户发送告警信息:

image.png