Стажировка по проекту
Компания: ПАО «СОВКОМБАНК»
разработка системы прогнозирования нагрузки на сервера с применением нейронных сетей
Суть проекта
Задача
Для чего
Вводные данные
Выходные данные
Прогнозирование нагрузки на сервер (CPU, RAM, HDD)
Система прогнозирования нужна для своевременного закупа оборудования серверов. Закуп оборудования процесс не быстрый, поэтому нужно знать возможности текущих ресурсов на несколько недель вперёд
Данные были только исторические. Нагрузка на сервера разных типов (всего 100 серверов) на каждый вид устройства отдельно - CPU, RAM, HDD в процентном соотношении. Исторических данных по каждому серверу было за 6 месяцев (ежеминутные отчёты)
Выходные данные так же временной ряд. Главной задачей было предсказать как можно точнее нагрузку на сервера хотя бы на 1 месяц вперёд
Участники команды проекта
  • Хабаров Иван
    Тимлид проекта
    Иван - руководитель группы разработчиков, отвечал за полную разработку проекта
  • Григорук Александр
    Инженер-программист в группе разработки ПО АСУ в филиале РФЯЦ-ВНИИЭФ НИИИС группы компаний Росатома
    • Модель на основе LightGBM;
    • Формирование итогового модуля
  • Егоров Антон
    Работал в сферах торговли и логистики
    • Модель на основе catboost
  • Чернышов Александр
    Работает в телекоммуникационной отрасли, технический отдел
    • Модель на основе catboost, LSTM
  • Комраков Алексей
    Инженер-программист промышленных контроллеров
    • Модель на основе XGBoost
  • Качмазов Александр
    IT-специалист
    • Модель на основе LSTM
  • Одегов Дмитрий
    Разработка корпоративной информационной системы (C#, MSSQL, Python)
    • Анализ данных
  • Пустовалов Леонид
    Инженер по продажам
    • Модель на основе XGBoost
  • Грабко Геннадий
    • Анализ данных;
    • Формализация задачи
Демонстрация проекта
После проведения экспериментов с разными моделями и архитектурами итоговая модель (LightGBM) может выполнить предсказания не более чем на 3 недели вперёд и только по CPU. Для более точного предсказания в больший период времени, а также по оборудованию RAM и HDD необходимо больше исторических данных и дополнительная информация (вторичные метрики)