Nagios: различия между версиями
Sirmax (обсуждение | вклад) |
Sirmax (обсуждение | вклад) |
||
(не показано 7 промежуточных версий этого же участника) | |||
Строка 1: | Строка 1: | ||
+ | [[Категория:Linux]] |
||
+ | [[Категория:Nagios]] |
||
=Nagios= |
=Nagios= |
||
Некоторые тонкости настройки |
Некоторые тонкости настройки |
||
Строка 25: | Строка 27: | ||
Нашел в каком-то листе рассылки |
Нашел в каком-то листе рассылки |
||
⚫ | |||
⚫ | |||
− | # |
||
⚫ | |||
⚫ | |||
− | # |
||
Строка 42: | Строка 42: | ||
max:min - выдать предупреждение если значение в пределах интервала. |
max:min - выдать предупреждение если значение в пределах интервала. |
||
− | + | Cинтаксис позволяет комбинировать интервалы через запятую: 10:20,30:40 но я не проверял работает ли. |
|
+ | Cоответвенно описанеие сервиса выглядит например так |
||
+ | <PRE> |
||
+ | define service{ |
||
+ | use generic-service |
||
+ | host_name UPS0 |
||
+ | service_description IN_VOLTAGE |
||
+ | is_volatile 0 |
||
+ | check_period 24x7 |
||
+ | max_check_attempts 3 |
||
+ | normal_check_interval 5 |
||
+ | retry_check_interval 1 |
||
+ | contact_groups support |
||
+ | notification_interval 120 |
||
+ | notification_period 24x7 |
||
+ | notification_options w,u,c,r |
||
+ | check_command check_apc_in_voltage!my_community!180:240!170:250 |
||
+ | </PRE> |
||
+ | При выходе за диапазон 180:240 - предупреждение, при выходе за 170:250 - критическое сообщение. |
||
+ | |||
− | Нагиос |
+ | Нагиос |
<PRE> |
<PRE> |
||
+ | net-analyzer/nagios-2.11 |
||
+ | </PRE> |
||
+ | ==Мониторинг нагрузки на интерфейсы== |
||
+ | Получить список - как-то так |
||
+ | <PRE> |
||
+ | /usr/lib64/nagios/plugins/check_snmp_netint.pl -g -2 -f -C public -H 172.31.0.254 -n "" -w10,10,0,0,0,0 -c100,100,0,0,0,0 -q -k -M -B -v |
||
+ | </PRE> |
||
+ | Пример конфига (для гигабитного интерфейса и для обычного): |
||
+ | <PRE> |
||
+ | # Net Check (iface overload etc) |
||
+ | define command{ |
||
+ | command_name check_gig_iface_load |
||
+ | command_line $USER1$/check_snmp_netint.pl -r -t 10 -g -H $HOSTADDRESS$ -C $ARG1$ -2 -f -n $ARG2$ -w$ARG3$ -c$ARG4$ -d $ARG5$ -q -k -M -B |
||
+ | } |
||
+ | |||
+ | define command{ |
||
+ | command_name check_iface_load |
||
+ | command_line $USER1$/check_snmp_netint.pl -r -t 10 -H $HOSTADDRESS$ -C $ARG1$ -2 -f -n $ARG2$ -w$ARG3$ -c$ARG4$ -d $ARG5$ -q -k -M -B |
||
+ | } |
||
</PRE> |
</PRE> |
||
+ | |||
+ | И сервис для проверки: |
||
+ | <PRE> |
||
+ | define service{ |
||
+ | use generic-net-interface-overload |
||
+ | host_name ES_4624-SFP__Core_ |
||
+ | service_description Port__01__Office_Switch_e1_28 |
||
+ | normal_check_interval 5 |
||
+ | retry_check_interval 5 |
||
+ | check_command check_gig_iface_load!public!"Ethernet1/1"!750,750,0,0,0,0!850,850,0,0,0,0!300 |
||
+ | } |
||
+ | |||
+ | </PRE> |
||
+ | |||
+ | |||
+ | http://www.nagiosexchange.org/cgi-bin/page.cgi?g=1475.html;d=1 |
Текущая версия на 09:31, 19 июля 2011
Nagios
Некоторые тонкости настройки
SNMP v3
Пример использования snmp v3
# #./check_snmp -H <ip-address> -o sysUpTime.0 -L authNoPriv -U <username> -a MD5 -X <pass> -A <pass> -P 3 define command{ command_name check_snmp_v3 command_line $USER1$/check_snmp -H $HOSTADDRESS$ -o sysUpTime.0 -L authNoPriv -U $ARG1$ a MD5 -X $ARG2$ -A $ARG2$ -P 3 }
Мониторинг диапазонов значений
Для некоторых случаев нужно мониторить попадание значений в диапазон (а не просто больше или меньше чем порог) (например, для напряжения или частоты на входе УПСа)
Нашел в каком-то листе рассылки
max:min - non-ok within range min:max - ok within range.
Выдвать предупреждение если входное напряжение выходит за пределы 200-230 и критикал если выходит за пределы 180-240
# /usr/nagios/libexec/check_snmp -H ups0.mycompany.net -o .1.3.6.1.4.1.318.1.1.1.3.2.1.0 -C public -P 2c -w 200:230 -c 180:240
Насколько я могу судить, запись min:max - выдать предупреждение если значение за пределами интервала max:min - выдать предупреждение если значение в пределах интервала.
Cинтаксис позволяет комбинировать интервалы через запятую: 10:20,30:40 но я не проверял работает ли. Cоответвенно описанеие сервиса выглядит например так
define service{ use generic-service host_name UPS0 service_description IN_VOLTAGE is_volatile 0 check_period 24x7 max_check_attempts 3 normal_check_interval 5 retry_check_interval 1 contact_groups support notification_interval 120 notification_period 24x7 notification_options w,u,c,r check_command check_apc_in_voltage!my_community!180:240!170:250
При выходе за диапазон 180:240 - предупреждение, при выходе за 170:250 - критическое сообщение.
Нагиос
net-analyzer/nagios-2.11
Мониторинг нагрузки на интерфейсы
Получить список - как-то так
/usr/lib64/nagios/plugins/check_snmp_netint.pl -g -2 -f -C public -H 172.31.0.254 -n "" -w10,10,0,0,0,0 -c100,100,0,0,0,0 -q -k -M -B -v
Пример конфига (для гигабитного интерфейса и для обычного):
# Net Check (iface overload etc) define command{ command_name check_gig_iface_load command_line $USER1$/check_snmp_netint.pl -r -t 10 -g -H $HOSTADDRESS$ -C $ARG1$ -2 -f -n $ARG2$ -w$ARG3$ -c$ARG4$ -d $ARG5$ -q -k -M -B } define command{ command_name check_iface_load command_line $USER1$/check_snmp_netint.pl -r -t 10 -H $HOSTADDRESS$ -C $ARG1$ -2 -f -n $ARG2$ -w$ARG3$ -c$ARG4$ -d $ARG5$ -q -k -M -B }
И сервис для проверки:
define service{ use generic-net-interface-overload host_name ES_4624-SFP__Core_ service_description Port__01__Office_Switch_e1_28 normal_check_interval 5 retry_check_interval 5 check_command check_gig_iface_load!public!"Ethernet1/1"!750,750,0,0,0,0!850,850,0,0,0,0!300 }
http://www.nagiosexchange.org/cgi-bin/page.cgi?g=1475.html;d=1