关于收集的指标

Collectd 是一个守护程序，它定期收集系统性能统计信息，并采用多种方式存储它们。对于 GitHub Enterprise Server，collectd 会从各种系统组件和服务中收集指标，从而深入了解系统的运行状况和性能。

收集的监视堆栈包含以下组件：

        **Collectd**：收集系统性能统计信息的主要守护程序

        **Graphite**：用作仪表板可视化效果的数据源

收集的指标来自各种源，包括：

        **系统指标**：CPU 使用率、内存利用率、磁盘 I/O、网络统计信息

        **应用程序指标**：HAProxy 统计信息、Resque 队列指标、数据库性能

        **自定义指标**：通过自定义插件和脚本实现特定于服务的指标

Architecture

在单个设备部署中，collectd 在本地运行，并将指标存储在 RRD（循环数据库）文件中。管理控制台读取这些文件以显示监视仪表板。

在群集环境中，collectd 进行分布式运行。

        **指标服务器**：从所有群集节点收集和存储指标的指定节点

        **指标客户端**：将指标转发到指标服务器的其他所有节点

        **冗余**：度量指标在多个指标服务器之间进行冗余复制，以支持故障转移

默认情况下，收集的指标在 GitHub Enterprise Server 实例上启用。

你可以设置外部监视系统，从 GitHub Enterprise Server 实例收集和分析收集的指标。这可实现与现有监视基础结构的集成，并提供其他可视化和警报功能。

有关设置外部监视的详细信息，请参阅使用collectd设置外部监控。

GitHub Enterprise Server 通过 collectd 收集各种指标，包括系统资源、应用程序性能和服务运行状况。了解这些指标对于有效监视和故障排除至关重要。

有关可用指标的综合列表，请参阅 GitHub Enterprise Server 的 collectd 指标。