如何在CentOS7上安装Nagios4并监控您的服务器

来自菜鸟教程
跳转至:导航、​搜索

介绍

在本教程中,我们将介绍在 CentOS 7 或 RHEL 7 上安装非常流行的开源监控系统 Nagios 4。 我们将介绍一些基本配置,因此您将能够通过 Web 界面监控主机资源。 我们还将利用 Nagios 远程插件执行器 (NRPE),它将作为代理安装在远程主机上,以监控其本地资源。

Nagios 可用于保存服务器清单,并确保您的关键服务正常运行。 使用像 Nagios 这样的监控系统对于任何生产服务器环境都是必不可少的工具。

先决条件

要学习本教程,您必须在将运行 Nagios 的 CentOS 7 服务器上拥有超级用户权限。 理想情况下,您将使用具有超级用户权限的非 root 用户。 如果您在设置方面需要帮助,请按照本教程中的步骤 1 到 3:使用 CentOS 7 进行初始服务器设置。

还需要 LAMP 堆栈。 如果您需要进行设置,请遵循本教程:如何在 CentOS 7 上安装 LAMP 堆栈。

本教程假设您的服务器启用了专用网络。 如果不是,只需将所有对私有 IP 地址的引用替换为公共 IP 地址。

现在我们已经整理好了先决条件,让我们继续安装 Nagios 4。

安装 Nagios 4

本节将介绍如何在监控服务器上安装 Nagios 4。 您只需完成此部分一次。

安装构建依赖项

因为我们是从源代码构建 Nagios Core,所以我们必须安装一些开发库来完成构建。

首先,安装所需的包:

sudo yum install gcc glibc glibc-common gd gd-devel make net-snmp openssl-devel xinetd unzip

创建 Nagios 用户和组

我们必须创建一个将运行 Nagios 进程的用户和组。 创建一个“nagios”用户和“nagcmd”组,然后使用以下命令将该用户添加到该组:

sudo useradd nagios
sudo groupadd nagcmd
sudo usermod -a -G nagcmd nagios

现在让我们安装 Nagios。

安装 Nagios 核心

下载最新稳定版 Nagios Core 的源代码。 进入Nagios下载页面,点击表格下方的跳过下载链接。 复制最新稳定版本的链接地址,以便将其下载到 Nagios 服务器。

在撰写本文时,最新的稳定版本是 Nagios 4.1.1。 使用 curl 将其下载到您的主目录:

cd ~
curl -L -O https://assets.nagios.com/downloads/nagioscore/releases/nagios-4.1.1.tar.gz

使用以下命令提取 Nagios 存档:

tar xvf nagios-*.tar.gz

然后切换到解压目录:

cd nagios-*

在构建 Nagios 之前,我们必须使用以下命令对其进行配置:

./configure --with-command-group=nagcmd 

现在使用以下命令编译 Nagios:

make all

现在我们可以运行这些 make 命令来安装 Nagios、初始化脚本和示例配置文件:

sudo make install
sudo make install-commandmode
sudo make install-init
sudo make install-config
sudo make install-webconf

为了通过 Web 界面向 Nagios 发出外部命令,我们必须将 Web 服务器用户 apache 添加到 nagcmd 组:

sudo usermod -G nagcmd apache

安装 Nagios 插件

在此处找到最新版本的 Nagios 插件:Nagios 插件下载。 复制最新版本的链接地址,并复制链接地址,以便您可以将其下载到您的 Nagios 服务器。

在撰写本文时,最新版本是 Nagios Plugins 2.1.1。 使用 curl 将其下载到您的主目录:

cd ~
curl -L -O http://nagios-plugins.org/download/nagios-plugins-2.1.1.tar.gz

使用以下命令提取 Nagios 插件存档:

tar xvf nagios-plugins-*.tar.gz

然后切换到解压目录:

cd nagios-plugins-*

在构建 Nagios 插件之前,我们必须对其进行配置。 使用这个命令:

./configure --with-nagios-user=nagios --with-nagios-group=nagios --with-openssl

现在使用以下命令编译 Nagios 插件:

make

然后使用以下命令安装它:

sudo make install

安装 NRPE

NRPE 下载页面 中找到 NRPE 最新稳定版本的源代码。 将最新版本下载到您的 Nagios 服务器。

在撰写本文时,最新版本是 2.15。 使用 curl 将其下载到您的主目录:

cd ~
curl -L -O http://downloads.sourceforge.net/project/nagios/nrpe-2.x/nrpe-2.15/nrpe-2.15.tar.gz

使用以下命令提取 NRPE 存档:

tar xvf nrpe-*.tar.gz

然后切换到解压目录:

cd nrpe-*

使用以下命令配置 NRPE:

./configure --enable-command-args --with-nagios-user=nagios --with-nagios-group=nagios --with-ssl=/usr/bin/openssl --with-ssl-lib=/usr/lib/x86_64-linux-gnu

现在使用以下命令构建和安装 NRPE 及其 xinetd 启动脚本:

make all
sudo make install
sudo make install-xinetd
sudo make install-daemon-config

在编辑器中打开 xinetd 启动脚本:

sudo vi /etc/xinetd.d/nrpe

修改 only_from 行,将您的 Nagios 服务器的私有 IP 地址添加到末尾(替换为您服务器的实际 IP 地址):

only_from = 127.0.0.1 10.132.224.168

保存并退出。 只有 Nagios 服务器将被允许与 NRPE 通信。

重启xinetd服务启动NRPE:

sudo service xinetd restart

现在已经安装了 Nagios 4,我们需要对其进行配置。

配置 Nagios

现在让我们执行初始 Nagios 配置。 您只需在 Nagios 服务器上执行此部分一次。

组织 Nagios 配置

在您喜欢的文本编辑器中打开主要的 Nagios 配置文件。 我们将使用 vi 来编辑文件:

sudo vi /usr/local/nagios/etc/nagios.cfg

现在通过删除 # 来取消注释这一行:

#cfg_dir=/usr/local/nagios/etc/servers

保存并退出。

现在创建一个目录来存储你要监控的每台服务器的配置文件:

sudo mkdir /usr/local/nagios/etc/servers

配置 Nagios 联系人

在您喜欢的文本编辑器中打开 Nagios 联系人配置。 我们将使用 vi 来编辑文件:

sudo vi /usr/local/nagios/etc/objects/contacts.cfg

找到 email 指令,并将其值(突出显示的部分)替换为您自己的电子邮件地址:

email                           nagios@localhost        ; <<***** CHANGE THIS TO YOUR EMAIL ADDRESS ******

保存并退出。

配置 check_nrpe 命令

让我们在 Nagios 配置中添加一个新命令:

sudo vi /usr/local/nagios/etc/objects/commands.cfg

将以下内容添加到文件末尾:

define command{
        command_name check_nrpe
        command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}

保存并退出。 这允许您在 Nagios 服务定义中使用 check_nrpe 命令。

配置阿帕奇

使用 htpasswd 创建一个名为“nagiosadmin”的管理员用户,该用户可以访问 Nagios Web 界面:

sudo htpasswd -c /usr/local/nagios/etc/htpasswd.users nagiosadmin

在提示符处输入密码。 请记住此登录名,因为您将需要它来访问 Nagios Web 界面。

注意: 如果您创建一个不名为“nagiosadmin”的用户,您需要编辑/usr/local/nagios/etc/cgi.cfg并将所有“nagiosadmin”引用更改为您创建的用户。


Nagios 已准备好启动。 让我们这样做,然后重新启动 Apache:

sudo systemctl daemon-reload
sudo systemctl start nagios.service
sudo systemctl restart httpd.service

要使 Nagios 在服务器启动时启动,请运行以下命令:

sudo chkconfig nagios on

可选:通过 IP 地址限制访问

如果要限制可以访问 Nagios Web 界面的 IP 地址,则需要编辑 Apache 配置文件:

sudo vi /etc/httpd/conf.d/nagios.conf

通过在它们前面添加 # 符号来查找并注释以下两行:

Order allow,deny
Allow from all

然后通过删除 # 符号取消注释以下行,并在 Allow from 行中添加您希望允许的 IP 地址或范围(空格分隔):

#  Order deny,allow
#  Deny from all
#  Allow from 127.0.0.1

由于这些行将在配置文件中出现两次,因此您需要再次执行这些步骤。

保存并退出。

现在启动 Nagios 并重新启动 Apache 以使更改生效:

sudo systemctl restart nagios.service
sudo systemctl restart httpd.service

Nagios 现在正在运行,所以让我们尝试登录。

访问 Nagios Web 界面

打开您喜欢的 Web 浏览器,然后转到您的 Nagios 服务器(用 IP 地址或主机名替换突出显示的部分):

http://nagios_server_public_ip/nagios

因为我们将 Apache 配置为使用 htpasswd,所以您必须输入您之前创建的登录凭据。 我们使用“nagiosadmin”作为用户名:

验证后,您将看到默认的 Nagios 主页。 点击左侧导航栏中的 Hosts 链接,查看 Nagios 正在监控哪些主机:

如您所见,Nagios 仅监控“localhost”或它自己。

让我们用 Nagios 监控另一台主机!

使用 NRPE 监控 CentOS 7 主机

在本节中,我们将向您展示如何将新主机添加到 Nagios,以便对其进行监控。 对您希望监控的每个 CentOS 或 RHEL 服务器重复此部分。

注意: 如果您想监控 Ubuntu 或 Debian 服务器,请按照以下链接中的说明进行操作:使用 NRPE 监控 Ubuntu 主机。

在要监控的服务器上,安装 EPEL 存储库:

sudo yum install epel-release

现在安装 Nagios 插件和 NRPE:

sudo yum install nrpe nagios-plugins-all

现在,让我们更新 NRPE 配置文件。 在您喜欢的编辑器中打开它(我们使用的是 vi):

sudo vi /etc/nagios/nrpe.cfg

找到 allowed_hosts 指令,并将 Nagios 服务器的私有 IP 地址添加到逗号分隔的列表中(用它代替突出显示的示例):

allowed_hosts=127.0.0.1,10.132.224.168

保存并退出。 这会将 NRPE 配置为通过其私有 IP 地址接受来自 Nagios 服务器的请求。

重新启动 NRPE 以使更改生效:

sudo systemctl start nrpe.service
sudo systemctl enable nrpe.service

在您要监控的主机上完成安装和配置 NRPE 后,您必须将这些主机添加到您的 Nagios 服务器配置中,然后它才会开始监控它们。

将主机添加到 Nagios 配置

在您的 Nagios 服务器上,为要在 /usr/local/nagios/etc/servers/ 中监视的每个远程主机创建一个新的配置文件。 将突出显示的单词“yourhost”替换为您的主机名:

sudo vi /usr/local/nagios/etc/servers/yourhost.cfg

添加以下主机定义,将 host_name 值替换为您的远程主机名(示例中为“web-1”),将 alias 值替换为主机描述,并将 [X180X ] 值与远程主机的私有 IP 地址:

define host {
        use                             linux-server
        host_name                       yourhost
        alias                           My first Apache server
        address                         10.132.234.52
        max_check_attempts              5
        check_period                    24x7
        notification_interval           30
        notification_period             24x7
}

使用上面的配置文件,Nagios 将只监控主机是启动还是关闭。 如果这对您来说足够了,请保存并退出,然后重新启动 Nagios。 如果您想监控特定服务,请继续阅读。

为您要监控的服务添加任何这些服务块。 请注意,check_command 的值决定了要监控的内容,包括状态阈值。 以下是一些可以添加到主机配置文件中的示例:

平:

define service {
        use                             generic-service
        host_name                       yourhost
        service_description             PING
        check_command                   check_ping!100.0,20%!500.0,60%
}

SSH(notifications_enabled 设置为 0 禁用服务通知):

define service {
        use                             generic-service
        host_name                       yourhost
        service_description             SSH
        check_command                   check_ssh
        notifications_enabled           0
}

如果您不确定 use generic-service 是什么意思,它只是继承了默认定义的名为“generic-service”的服务模板的值。

现在保存并退出。 重新加载您的 Nagios 配置以使任何更改生效:

sudo systemctl reload nagios.service

完成配置 Nagios 以监视所有远程主机后,您应该进行设置。 请务必访问您的 Nagios Web 界面,并查看 Services 页面以查看所有受监控的主机和服务:

结论

既然您监控了您的主机和它们的一些服务,您可能需要花一些时间来确定哪些服务对您至关重要,因此您可以开始监控这些服务。 您可能还需要设置通知,例如,当您的磁盘利用率达到警告或严重阈值或您的主网站关闭时,您会收到一封电子邮件,这样您就可以及时解决问题,甚至在问题发生之前解决问题。

祝你好运!