Примеры применения
27.07.2014

Использование устройств NetPing с системой мониторинга NOC

1. Введение

Сегодня провайдеры, датацентры и компании со средней и крупной ИТ-инфраструктурой остро нуждаются в программном обеспечении для мониторинга, управления, инвентаризации их ИТ-объектов. Центр Управления Сетью (NOC) успешно справляется со всеми этими задачами.

Также необходимо отслеживать физические параметры среды, контролировать физический доступ и проблемы с питанием в местах работы ИТ-объектов. В этом может помочь серия оборудования для мониторинга ООО «Алентис Электроникс».

Пример совместной работы: мониторинг датчиков с помощью устройств NetPing, *UniPing* и обработка, вывод структурированных результатов в унифицированном web-интерфейсе программы NOC рассмотрим в следующем разделе.

2. Краткий обзор системы мониторинга и управления ошибками NOC

 Просмотреть структурированный список всех ошибок в сети можно в Fault Managment → Alarms, отсортировав вывод по Severity:

Использование устройств NetPing с системой мониторинга NOC

Возможности фильтрации ошибок: по объектам, классам, временным интервалам.

Схему сети со связями между объектами получим, перейдя в Inventory → Network Maps. В случае недоступности объекта значок объекта изменит цвет на красный: 

Использование устройств NetPing с системой мониторинга NOC

Кроме просмотра структурной схемы сети, объекты также можно привязать к геоинформационной системе и отображать на разных картах: OpenstreetMap, Google Maps, … При этом возможно учитывать уровни

  • детализации карты, например:
  • глобальный - отображает сеть на уровне городов;
  • агрегированный - отображает объекты на уровне районов города;
  • уровень доступа - отображает объекты по зданиям;
  • в здании - объекты размещаются в комнатах, офисах, подъездах в зависимости от их назначения;
  • в помещениях уже находятся стойки, коммуникационные ящики;
  • и наконец в стойках находятся сами объекты ИТ-инфраструктуры.

Объекты можно выбирать по их географическому расположению, открыв Inventory → Inventory:

Использование устройств NetPing с системой мониторинга NOC

Изображение стойки получим, выделив её название «Rack 1». В стойках уже видно расположение самих объектов:

Если два раза кликнуть на объекте в стойке, перейти на вкладку Managed Objects и нажать кнопку Alarms, то появится список ошибок по конкретному объекту:

3. Необходимые требования

Если вы заинтересовались данной связкой программы NOC и оборудованием NetPing, рассмотрим минимальные требования:

Необходимые системные требования для установки NOC. Установка NOC на Debian 7.0, Ubuntu 12.04 LTS, FreeBSD 9.2, установка на любой *NIX, VirtualBOX, Gentoo [оверлей | https://bugs.gentoo.org/show_bug.cgi?id=366051]. NOC есть свободным программным обеспечением и распространяется под BSD [лицензией | http://kb.nocproject.org/display/DOC/License].

Если вы планируете писать свои правила, о чём речь пойдёт дальше, вам также необходимы некоторые минимальные знания:

4. Регистрация объекта в системе NOC

Сначала надо завести сам объект в базу NOC. Для этого заходим в Service Activation → Managed Objects и нажимаем кнопку +Add.

В открывшееся окно (рис.ниже) необходимо прописать:

Name:

Имя объекта в NOC.

SA Profile:

Внутренний профиль объекта в NOC. Если подходящего нет, выбираем Generic.Host.

Scheme:

Тип управления устройством. Может быть telnet, ssh, HTTP.

Address:

IP адрес объекта.

Port:

Порт, на котором слушает управляющий сервис.

User:

Имя пользователя.

Password:

Его пароль.

Trap Source IP:

IP адрес объекта, с которого будут приходить SNMP сообщения.

Trap Community:

Пароль для SNMP сообщений.

RO Community:

Пароль для SNMP подключения.

 После ввода всех учётных данных объекта нажимаем кнопку Save.

5. Система управления ошибками (NOC FM)

Система управления ошибками (Fault Management FM) в NOC может сохранять все сетевые события, классифицировать их, выводить приоритезированные сообщения об ошибках и выполнять определённые действия при каком-либо событии. Настройка [ | http://kb.nocproject.org/display/SITE/FM+quick+setup] NOC для работы [ FM | http://kb.nocproject.org/display/SITE/FM+quick+setup].

Мы затронем только часть FM — как создать новое правило классификатора для распознания SNMP или SYSLOG сообщения от сетевого устройства. Чтобы просматривать сетевые события в NOC, откроем вкладку Fault Managment → Events, изображённую на рисунке ниже.

5.1 Пример с SNMP Trap

 Видим неклассифицированное событие, в поле «Class» которого стоит «Unknown | SNMP Trap». Войдем в него двойным кликом. Получим картинку изображённую на рисунке ниже:

Теперь перейдем на вкладку Data, показанную на следующем рисунке.

Обращаем внимание: передаваемые в SNMP Trap переменные можно извлечь из сообщения и использовать для его классификации. Они находятся в разделах Resolved Variables и Raw Variables. Теперь нажимаем Create Rule и получим форму для создания правила:

Сначала надо выбрать класс события NOC. Список всех классов также можно просмотреть в /opt/noc/fm/collections/eventclasses/.

Нас интересует влажность, она находится в каталоге Environment:

Теперь приступим к написанию регулярных выражений для классификации события.

Обязательная переменная  name: Humidity указывает на название сенсора. Мы её не извлекаем, а добавляем внизу. Остальные переменные measure, min, max извлекаем из данных SNMP Trap. Не забываем при этом заменить переменные цифровые значения на \d+

Список переменных для события можно найти в файле: /opt/noc/fm/collections/eventclasses/Environment/Humidity_Returned_to_Normal_Range.json

После написание правила нажимаем кнопку Test и переходим к окну:

В его поле ввода надо ввести идентификационный номер события. Он находится в первой колонке вкладки Fault Managment → Events и выделен в следующем примере:

При нажатии кнопки Test появится результат. Успешный результат теста приведён ниже.

Нажимаем кнопку Close и возвращаемся к нашему правилу.  Для сохранения правила необходимо нажать кнопку Save.

Открылась вкладка Fault Managment → Clasification Rules: здесь есть список всех правил класификации для всех устройств. Для фильтрации списка набираем производителя Alentis и видим наше правило. На нём не стоит метка Build in.

Двойным кликом открываем правило для редактирования. В открывшемся окне нажимаем кнопку JSON.

Копируем содержимое окна в файл Humidity_Returned_to_Normal_Range_1_SNMP_.json

Этот файл можно отослать на http://bt.nocproject.org/secure/Dashboard.jspa — таким образом база NOC будет поддерживать больше оборудования разных производителей.
Для подгрузки нового правила необходимо перезапустить NOC сервис. После перезагрузки входим в наше правило двойным кликом. И нажимаем кнопку Reclasify.

Возвращаемся назад, нажав кнопку Close. Видим, что наше сообщение теперь распозналось.

5.2 Пример с сообщением Syslog

Если не получилось с SNMP, можно попробовать Syslog. Как показывает опыт, для Syslog написать регулярное выражение зачастую бывает сложнее.

Итак, открываем такое же правило Sysylog, сообщение о нормализации влажности. Выбираем класс события Environment | Humidity Returned to Normal Range.

Меняем имя так, чтобы оно было уникально, добавив номер.

Смотрим, какие переменные надо извлечь в файле: /opt/noc/fm/collections/eventclasses/Environment/Humidity_Returned_to_Normal_Range.json

Нажимаем кнопку +Add, добавляем имя name и его значение Humidity:

Теперь создаём само регулярное выражение, по которому будет классифицироваться событие. Особое внимание необходимо обратить на экранирование спец символов «(», «)» и «.» с помощью «\». Также мы в этом случае оставим пробелы, которые обычно стоит заменять на «\s+» или «\s*». Дело в том, что конкретно в этом случае сообщения о выходе влажности за пределы нормы и возвращение влажности в пределы нормы различаются всего одним пробелом!


Нажимаем кнопку Test для проверки нашего регулярного выражения:

Копируем уникальный идентификационный номер нашего сообщения, как в примере с SNMP. Нажимаем кнопку Test для вывода результата проверки: Пример успешного тестирования:

Для закрытия нажимаем Close. Чтобы сохранить наше новое правило, нажимаем Save.

Открылась вкладка Fault Managment → Clasification Rules: здесь есть список всех правил классификации для всех устройств. Вводим производителя Alentis для фильтрации списка и видим наше правило. На нём не стоит метка Build in.

Двойным кликом открываем правило для редактирования.  В открывшемся окне нажимаем кнопку JSON.

Копируем содержимое окна в файл Humidity_Returned_to_Normal_Range_1_SYSLOG_.json Потом закрываем, нажав Close.


Подробное описание переменных и дополнительных функций для правил класификации событий. Этот файл желательно отослать на http://bt.nocproject.org/secure/Dashboard.jspa, так база NOC будет обогащаться поддержкой оборудования разных производителей. Для вступления правила в силу необходимо перезапустить NOC. 

6. Итоги

 Результат правильной классификации события:

  • будет создаваться или закрываться соответствующее уведомление об ошибке в Fault Managment → Alarms;
  • будут выполнятся соответствующие действия при наличии триггера, например, выполнение скриптов;
  • будет отсылаться уведомление при настройке системы уведомлений с помощью почты или SMS;
  • на карте объект с ошибками будет изменять цвет на красный Inventory → Network Map;
  • весь перечень ошибок по конкретному объекту можно просмотреть в свойствах объекта Service Activation → Managed Objects, нажав кнопку Alarms.

В данной статье не рассмотрен случай, когда нужного Event Class не нашлось (в /opt/noc/fm/collections/eventclasses/ он пока ещё не создан). Возможно для нового Event Class понадобится также создавать новый Alarm Class (в /opt/noc/fm/collections/alarmclasses/). Это можно сделать в Fault Managment → Event Classes и Fault Managment → Alarm Classes соответственно.


  • Все устройства

Основные теги


Каталог устойств мониторинг серверных комнат и шкафов
Все устройства
Устройство UniPing v3
Устройство NetPing 2/PWR-220 v1/SMS
Устройство NetPing 2/PWR-220 v3/ETH
Устройство NetPing /PWR-220 v3/ETH
Устройство UniPing server solution
Устройство UniPing server solution v3/SMS
Устройство NetPing IO v2
Устройства NetPing
Каталог датчиков для устройств NetPing
Устройство NetPing 8/PWR-220 v3/SMS
Устройство NetPing 2/PWR-220 v2/SMS
Устройство NetPing 4/PWR-220 v3/SMS
Устройство NetPing SMS
Адаптер WiFi VAP11N
Коммутатор PS104GT
Устройство NetPing Mini-UPS
Коммутатор NP-SM4
Сплиттер POE 12В (стандарта 802.3af)
IRC-TR v2 (ИК модуль расширения)
Каталог устройств удалённого управления и распределения электропитания NetPing
Устройство UniPing server solution v3
Датчик разбития стекла (Стекло-3 ИО 329-4), 2м
Переходник для NetPing IO v2
Устройство NetPing PWR68-01
Датчик мониторинга 220В 1-wire
Адаптер DKST910.8
Устройство NetPing DKST61-01
Блок питания 48В 1,5А (мод.HRS20005)
Датчик температуры TS, 1м
Датчик температуры, (T811), 2м
Датчик температуры WT, 1м
Датчик протечки, модель 2605, 2м
Датчик протечки H2О
Датчик температуры 1-wire, (THS), 2м
МАЯК-12-СТ
Датчик движения (PYRONIX COLT QUAD PI ПИК детектор), 2м
Датчик движения (SWAN-QUAD ИК детектор квадросенсор), (2м)
BM8070D Силовое реле 16А/250В на DIN-рейку
MP701 Исполнительный элемент (4 независимых канала по 2 кВт 10А)
Датчик дыма комбинированный (дым/тепло) ИП 212/101-2М-A10R с базой Е412NL
МОЛЛЮСК-12/1,5
Внешний ИБП SKAT-12DC-1.0 Li-ion
ИКС-1 извещатель охранный инфракрасный активный однолучевой
Готовое решение для мониторинга серверной комнаты на основе UniPing server solution v3/SMS
▼ Все теги
Новинки
Датчик воздушного потока LCF013
Датчик воздушного потока позволяет контролировать наличие или отсутствие напора воздушного потока. Содержит подробнее...

Цена: 2 587 руб.

ИКС-1 извещатель охранный инфракрасный активный однолучевой
Извещатель предназначен для регистрации пересечения нарушителями контролируемой зоны, образованной оптическим подробнее...

Цена: 3 854 руб.

Внешний ИБП SKAT-12DC-1.0 Li-ion
Малогабаритный источник бесперебойного питания (ИБП) со встроенной Li-Ion АКБ. Для питания устройств подробнее...

Цена: 3 200 руб.

МОЛЛЮСК-12/1,5
Малогабаритный блок питания с выходным напряженим 12 В. Имеет уникальный корпус, который позволяет осуществить подробнее...

Цена: 950 руб.

Датчик дыма комбинированный (дым/тепло) ИП 212/101-2М-A10R с базой Е412NL
Комбинированный извещатель предназначен для обнаружения возгораний в помещениях различных зданий и сооружений подробнее...

Цена: 2 098 руб.

MP701 Исполнительный элемент (4 независимых канала по 2 кВт 10А)
Силовой модуль коммутации предназначен для обеспечения управления при помощи устройств NetPing силовыми подробнее...

Цена: 1 400 руб.

BM8070D Силовое реле 16А/250В на DIN-рейку
Блок реле для удалённой коммутации мощной нагрузки при помощи устройств NetPing. Изготавливается в корпусе подробнее...

Цена: 1 350 руб.

Датчик движения (SWAN-QUAD ИК детектор квадросенсор), (2м)
Пассивный инфракрасный детектор движения позволяет регистрировать любое движение в зоне до 18 метров. подробнее...

Цена: 1 516 руб.

МАЯК-12-СТ
Оповещатель охранно-пожарный световой стробоскопический предназначен для выдачи световых стробоскопических подробнее...

Цена: 385 руб.

Датчик протечки H2О
Датчик протечки позволяет определить наличие воды в точке установки датчика. Устанавливается в нескольких подробнее...

Цена: 1 450 руб.

-+ руб. руб.
Итого руб.

Данные о заказе