关于收集的指标
Collectd 是一个守护程序,它定期收集系统性能统计信息,并采用多种方式存储它们。 对于 GitHub Enterprise Server,collectd 会从各种系统组件和服务中收集指标,从而深入了解系统的运行状况和性能。
关键组件
收集的监视堆栈包含以下组件:
-
**Collectd**:收集系统性能统计信息的主要守护程序 -
**Graphite**:用作仪表板可视化效果的数据源
指标收集
收集的指标来自各种源,包括:
-
**系统指标**:CPU 使用率、内存利用率、磁盘 I/O、网络统计信息 -
**应用程序指标**:HAProxy 统计信息、Resque 队列指标、数据库性能 -
**自定义指标**:通过自定义插件和脚本实现特定于服务的指标
Architecture
单一设备
在单个设备部署中,collectd 在本地运行,并将指标存储在 RRD(循环数据库)文件中。 管理控制台 读取这些文件以显示监视仪表板。
群集环境
在群集环境中,collectd 进行分布式运行。
-
**指标服务器**:从所有群集节点收集和存储指标的指定节点 -
**指标客户端**:将指标转发到指标服务器的其他所有节点 -
**冗余**:度量指标在多个指标服务器之间进行冗余复制,以支持故障转移
配置收集的指标
默认情况下,收集的指标在 GitHub Enterprise Server 实例上启用。
使用 collectd 进行外部监控
你可以设置外部监视系统,从 GitHub Enterprise Server 实例收集和分析收集的指标。 这可实现与现有监视基础结构的集成,并提供其他可视化和警报功能。
有关设置外部监视的详细信息,请参阅 使用collectd设置外部监控。
收集的指标参考
GitHub Enterprise Server 通过 collectd 收集各种指标,包括系统资源、应用程序性能和服务运行状况。 了解这些指标对于有效监视和故障排除至关重要。
有关可用指标的综合列表,请参阅 GitHub Enterprise Server 的 collectd 指标。
后续步骤
- 若要设置外部监视,请参阅 使用collectd设置外部监控。
- 若要了解可用的指标,请参阅 GitHub Enterprise Server 的 collectd 指标。