Nagios: различия между версиями
(Новая: =Nagios= Некоторые тонкости настройки ==SNMP v3== ==Мониторинг диапазонов значений==) |
Sirmax (обсуждение | вклад) |
||
| (не показано 11 промежуточных версий 2 участников) | |||
| Строка 1: | Строка 1: | ||
| + | [[Категория:Linux]] |
||
| + | [[Категория:Nagios]] |
||
=Nagios= |
=Nagios= |
||
Некоторые тонкости настройки |
Некоторые тонкости настройки |
||
==SNMP v3== |
==SNMP v3== |
||
| + | Пример использования snmp v3 |
||
| + | <PRE> |
||
| + | # |
||
| + | #./check_snmp -H <ip-address> -o sysUpTime.0 -L authNoPriv -U <username> -a MD5 -X <pass> -A <pass> -P 3 |
||
| + | |||
| + | |||
| + | define command{ |
||
| + | command_name check_snmp_v3 |
||
| + | command_line $USER1$/check_snmp -H $HOSTADDRESS$ -o sysUpTime.0 -L authNoPriv -U $ARG1$ a MD5 -X $ARG2$ -A $ARG2$ -P 3 |
||
| + | } |
||
| + | |||
| + | |||
| + | |||
| + | </PRE> |
||
| + | |||
==Мониторинг диапазонов значений== |
==Мониторинг диапазонов значений== |
||
| + | |||
| + | Для некоторых случаев нужно мониторить попадание значений в диапазон (а не просто больше или меньше чем порог) |
||
| + | (например, для напряжения или частоты на входе УПСа) |
||
| + | |||
| + | Нашел в каком-то листе рассылки |
||
| + | |||
| + | max:min - non-ok within range |
||
| + | min:max - ok within range. |
||
| + | |||
| + | |||
| + | |||
| + | Выдвать предупреждение если входное напряжение выходит за пределы 200-230 и критикал если выходит за пределы 180-240 |
||
| + | |||
| + | <PRE> |
||
| + | # /usr/nagios/libexec/check_snmp -H ups0.mycompany.net -o .1.3.6.1.4.1.318.1.1.1.3.2.1.0 -C public -P 2c -w 200:230 -c 180:240 |
||
| + | </PRE> |
||
| + | |||
| + | Насколько я могу судить, запись |
||
| + | min:max - выдать предупреждение если значение за пределами интервала |
||
| + | max:min - выдать предупреждение если значение в пределах интервала. |
||
| + | |||
| + | Cинтаксис позволяет комбинировать интервалы через запятую: 10:20,30:40 но я не проверял работает ли. |
||
| + | Cоответвенно описанеие сервиса выглядит например так |
||
| + | <PRE> |
||
| + | define service{ |
||
| + | use generic-service |
||
| + | host_name UPS0 |
||
| + | service_description IN_VOLTAGE |
||
| + | is_volatile 0 |
||
| + | check_period 24x7 |
||
| + | max_check_attempts 3 |
||
| + | normal_check_interval 5 |
||
| + | retry_check_interval 1 |
||
| + | contact_groups support |
||
| + | notification_interval 120 |
||
| + | notification_period 24x7 |
||
| + | notification_options w,u,c,r |
||
| + | check_command check_apc_in_voltage!my_community!180:240!170:250 |
||
| + | </PRE> |
||
| + | При выходе за диапазон 180:240 - предупреждение, при выходе за 170:250 - критическое сообщение. |
||
| + | |||
| + | |||
| + | Нагиос |
||
| + | <PRE> |
||
| + | net-analyzer/nagios-2.11 |
||
| + | </PRE> |
||
| + | ==Мониторинг нагрузки на интерфейсы== |
||
| + | Получить список - как-то так |
||
| + | <PRE> |
||
| + | /usr/lib64/nagios/plugins/check_snmp_netint.pl -g -2 -f -C public -H 172.31.0.254 -n "" -w10,10,0,0,0,0 -c100,100,0,0,0,0 -q -k -M -B -v |
||
| + | </PRE> |
||
| + | |||
| + | Пример конфига (для гигабитного интерфейса и для обычного): |
||
| + | <PRE> |
||
| + | # Net Check (iface overload etc) |
||
| + | define command{ |
||
| + | command_name check_gig_iface_load |
||
| + | command_line $USER1$/check_snmp_netint.pl -r -t 10 -g -H $HOSTADDRESS$ -C $ARG1$ -2 -f -n $ARG2$ -w$ARG3$ -c$ARG4$ -d $ARG5$ -q -k -M -B |
||
| + | } |
||
| + | |||
| + | define command{ |
||
| + | command_name check_iface_load |
||
| + | command_line $USER1$/check_snmp_netint.pl -r -t 10 -H $HOSTADDRESS$ -C $ARG1$ -2 -f -n $ARG2$ -w$ARG3$ -c$ARG4$ -d $ARG5$ -q -k -M -B |
||
| + | } |
||
| + | </PRE> |
||
| + | |||
| + | И сервис для проверки: |
||
| + | <PRE> |
||
| + | define service{ |
||
| + | use generic-net-interface-overload |
||
| + | host_name ES_4624-SFP__Core_ |
||
| + | service_description Port__01__Office_Switch_e1_28 |
||
| + | normal_check_interval 5 |
||
| + | retry_check_interval 5 |
||
| + | check_command check_gig_iface_load!public!"Ethernet1/1"!750,750,0,0,0,0!850,850,0,0,0,0!300 |
||
| + | } |
||
| + | |||
| + | </PRE> |
||
| + | |||
| + | |||
| + | http://www.nagiosexchange.org/cgi-bin/page.cgi?g=1475.html;d=1 |
||
Текущая версия на 09:31, 19 июля 2011
Nagios
Некоторые тонкости настройки
SNMP v3
Пример использования snmp v3
#
#./check_snmp -H <ip-address> -o sysUpTime.0 -L authNoPriv -U <username> -a MD5 -X <pass> -A <pass> -P 3
define command{
command_name check_snmp_v3
command_line $USER1$/check_snmp -H $HOSTADDRESS$ -o sysUpTime.0 -L authNoPriv -U $ARG1$ a MD5 -X $ARG2$ -A $ARG2$ -P 3
}
Мониторинг диапазонов значений
Для некоторых случаев нужно мониторить попадание значений в диапазон (а не просто больше или меньше чем порог) (например, для напряжения или частоты на входе УПСа)
Нашел в каком-то листе рассылки
max:min - non-ok within range min:max - ok within range.
Выдвать предупреждение если входное напряжение выходит за пределы 200-230 и критикал если выходит за пределы 180-240
# /usr/nagios/libexec/check_snmp -H ups0.mycompany.net -o .1.3.6.1.4.1.318.1.1.1.3.2.1.0 -C public -P 2c -w 200:230 -c 180:240
Насколько я могу судить, запись min:max - выдать предупреждение если значение за пределами интервала max:min - выдать предупреждение если значение в пределах интервала.
Cинтаксис позволяет комбинировать интервалы через запятую: 10:20,30:40 но я не проверял работает ли. Cоответвенно описанеие сервиса выглядит например так
define service{
use generic-service
host_name UPS0
service_description IN_VOLTAGE
is_volatile 0
check_period 24x7
max_check_attempts 3
normal_check_interval 5
retry_check_interval 1
contact_groups support
notification_interval 120
notification_period 24x7
notification_options w,u,c,r
check_command check_apc_in_voltage!my_community!180:240!170:250
При выходе за диапазон 180:240 - предупреждение, при выходе за 170:250 - критическое сообщение.
Нагиос
net-analyzer/nagios-2.11
Мониторинг нагрузки на интерфейсы
Получить список - как-то так
/usr/lib64/nagios/plugins/check_snmp_netint.pl -g -2 -f -C public -H 172.31.0.254 -n "" -w10,10,0,0,0,0 -c100,100,0,0,0,0 -q -k -M -B -v
Пример конфига (для гигабитного интерфейса и для обычного):
# Net Check (iface overload etc)
define command{
command_name check_gig_iface_load
command_line $USER1$/check_snmp_netint.pl -r -t 10 -g -H $HOSTADDRESS$ -C $ARG1$ -2 -f -n $ARG2$ -w$ARG3$ -c$ARG4$ -d $ARG5$ -q -k -M -B
}
define command{
command_name check_iface_load
command_line $USER1$/check_snmp_netint.pl -r -t 10 -H $HOSTADDRESS$ -C $ARG1$ -2 -f -n $ARG2$ -w$ARG3$ -c$ARG4$ -d $ARG5$ -q -k -M -B
}
И сервис для проверки:
define service{
use generic-net-interface-overload
host_name ES_4624-SFP__Core_
service_description Port__01__Office_Switch_e1_28
normal_check_interval 5
retry_check_interval 5
check_command check_gig_iface_load!public!"Ethernet1/1"!750,750,0,0,0,0!850,850,0,0,0,0!300
}
http://www.nagiosexchange.org/cgi-bin/page.cgi?g=1475.html;d=1