Skip to content

Базовые термины

Узел сети

Суть узла сети (далее – хост) – группировка элементов данных (Item) вместе и задание общих для этих элементов данных параметров сбора информации.

Как правило, такая группировка делается по принципу один хост – одно устройство или один хост – один сервис или микросервис.

Выделение хостов на сервисы и микросервисы целесообразно при большом разнообразии метрик в рамках одного сервиса и различных административных зонах интереса по хостам.

Хостом может быть устройство, которое подключено к другим устройствам и является частью компьютерной сети. Примеры хостов: сервера, маршрутизаторы, коммутаторы и концентраторы и прочее коммутационное оборудование

Примеры сервисов, которые можно выделить в отдельные хосты:

  • Инстанс Nginx, отвечающий за приложение;
  • Инстанс Glaber – сервер, выполняющий мониторинг.

Хосты (контейнеры) – это объекты, которые нужны для группировки метрик. Самое популярное и понятное объединение – по одной аппаратной платформе (устройству), но при большом количестве элементов данных стоит рассмотреть деление по сервисам.

Рекомендация: стоит дробить хосты, если на них более 8-10 тысяч элементов данных.

Группа узлов сети

Группа узлов представляет собой логическую сущность, которая объединяет хосты. Группы узлов позволяют эффективно управлять ресурсами, применяя настройки и политики на уровне группы, а не на каждом отдельном узле. Это упрощает администрирование системы, поскольку вместо управления каждым узлом отдельно, администратор может работать с группой узлов как с единым целым.

Разрешения для групп узлов можно назначить ролям в системе мониторинга. Cуществуют права на чтение и изменение объектов узла сети в группе. Изменение позволяет настраивать объекты мониторинга и их параметры. Пользователям возможность просмативать собранные данные и различную визуализацию состояния хостов и других объектов в системе.

Оба права дают возможность просматривать результаты работы мониторинга, полученные значения (метрики), графики (исторические данные), состояния триггеров, события и данные по обработке событий (эскалации).

Использование групп узлов в Glaber помогает упростить управление сетью, повысить эффективность мониторинга и обеспечить более высокий уровень безопасности за счет применения политик на уровне группы.

Триггер

Триггер - это описание проблемы выраженное в формуле логического сравнения порогового значения с проходящими данными (метриками). При изменения состояния триггера может быть выполнено действие по оповещению или выполнению удаленной команды на проблемном узле сети для устранения проблемы.

Триггеры нужны для автоматизации процессов в организации. Это приводит к экономии времени и снижению количества ошибок из-за человеческого фактора.

Основа триггера – выражение, которое может быть простым или составной, иметь исторические, статистические и прочие функции для контроля данных. Триггер может вычисляться на основе нескольких элементов данных и быть в трех состояниях:

  • ОК – параметры в норме;
  • PROBLEM – параметры мониторинга превышают пороговые значения, требуется информирование или управляющее воздействие, то есть эскалация;
  • UNKNOWN – нет значения элемента данных для вычислении его в выражении.

В момент перехода триггера в состояние проблемы создается СОБЫТИЕ. По настроенным правилам событие может по-разному обрабатываться, то есть ЭСКАЛИРОВАТЬСЯ.

Примеры логики работы триггера:

Предположим, у вас есть сервер, который должен быть доступен 24/7. Вы можете создать триггер, который будет проверять доступность сервера каждые 5 минут. Если сервер недоступен, триггер отправит вам уведомление по электронной почте или SMS.

Пример триггера в системе Glaber может выглядеть следующим образом:

  1. Название: Проверка доступности сервера.

  2. Описание: Отправляет уведомление, если сервер недоступен.

  3. Условия: Сервер недоступен.

  4. Действия: Отправка уведомления.

Этот триггер будет автоматически проверять доступность сервера каждые 5 минут. Если сервер будет недоступен, вы получите уведомление. Это позволит вам оперативно реагировать на проблемы и обеспечивать непрерывную работу вашего сервера.

Элемент данных

Элемент данных — это базовая единица информации об объекте мониторинга, которая представляет собой одну из его характеристик. Каждый элемент данных имеет своё текущее значение или показание, которое может меняться со временем. При мониторинге параметров жесткого диска может быть настроено несколько элементов данных:

  • Температура диска;
  • Количество операций чтения / записи;
  • Количество неудачных операций записи;
  • Процент износа.