Занятие 4
Библиотеки: табличные данные
и временные ряды
Подписывайтесь на наш Телеграм канал, чтобы не пропустить следующие бесплатные курсы по AI
Новости из мира AI
Разбор новых технологий
Мини-уроки
Кейсы внедрения AI в бизнес и др.
1
AI-алгоритмы широко используются для анализа и обработки структурированных данных, таких как таблицы, базы данных и временные ряды. Эти данные встречаются везде: от финансовых рынков до анализов продаж и прогнозов погоды.

В этом занятии мы рассмотрим четыре ключевые библиотеки для работы с табличными данными и временными рядами:
  • Pandas – основа работы с табличными данными в Python.
  • Dask – инструмент для обработки больших данных и распределённых вычислений.
  • tslearn – мощная библиотека для анализа временных рядов.
  • Prophet* – инструмент от Facebook для прогнозирования временных рядов.
Pandas – основа работы с табличными данными в Python
Pandas – главная библиотека для работы с табличными данными в Python. Она позволяет загружать, очищать, анализировать и визуализировать данные.

Что умеет Pandas?
  • Чтение данных из CSV, Excel, баз данных, JSON и других источников.
  • Обработка данных – фильтрация, сортировка, группировка, объединение.
  • Визуализация данных – базовая работа с графиками.
  • Статистический анализ – расчёт средних значений, медиан, стандартных отклонений.
Где используется?
  • Финансовый анализ – обработка данных о ценах на акции, прибыли и расходах.
  • Маркетинговая аналитика – анализ продаж и поведения клиентов.
  • Машинное обучение – подготовка данных перед обучением моделей.
Пример проекта:
Допустим, вам нужно анализировать покупки клиентов интернет-магазина. С помощью Pandas можно:
  • Загрузить таблицу с покупками.
  • Определить самые популярные товары.
  • Найти сезонные изменения в продажах.
Подписывайтесь на наш Телеграм канал, чтобы не пропустить следующие бесплатные курсы по AI
Новости из мира AI
Разбор новых технологий
Мини-уроки
Кейсы внедрения AI в бизнес и др.
1
оставьте заявку на курс по AI
Подберем программу под ваши цели
Продолжительность курса 6 месяцев
1
Не упустите возможность освоить востребованную профессию будущего
Стоимость от 4 719 руб. в месяц
Гарантия трудоустройства
Dask – обработка больших данных и распределённые вычисления
Pandas отлично подходит для работы с небольшими и средними таблицами, но когда данных слишком много (миллионы строк), нужен Dask.

Dask – это библиотека для обработки больших данных, которая может работать на кластерах и использовать сразу несколько процессоров или компьютеров.

Что умеет Dask?
  • Работает с огромными таблицами – в отличие от Pandas, не загружает все данные в память сразу.
  • Параллельные вычисления – использует все ядра процессора.
  • Интеграция с Pandas, NumPy и другими библиотеками.
Где используется?
  • Банковский анализ – обработка транзакций миллионов клиентов.
  • Анализ логов веб-сайтов – выявление поведения пользователей.
  • Наука и исследования – анализ больших наборов данных (например, ДНК-анализа).
Пример проекта:
Представьте, что у вас есть база данных с миллиардами покупок по всему миру. Pandas просто не сможет обработать такой объём данных, а Dask позволит разделить данные на части и обработать их параллельно.
tslearn – анализ временных рядов
Временные ряды – это последовательные данные, упорядоченные по времени (например, курс акций, температура, трафик на сайте).

tslearn – это библиотека, созданная специально для машинного обучения на временных рядах.

Что умеет tslearn?
  • Сравнение временных рядов – например, анализ схожести трендов.
  • Кластеризация временных данных – поиск похожих паттернов в разных наборах данных.
  • Обучение моделей на временных рядах – прогнозирование будущих значений.
Где используется?
  • Финансовый анализ – поиск закономерностей в изменении цен на бирже.
  • Медицинская диагностика – анализ ЭКГ, температуры и других показателей.
  • Прогнозирование спроса – анализ продаж и предсказание трендов.
Пример проекта:
Допустим, компания хочет проанализировать потребление электроэнергии и предсказать, когда оно будет расти. tslearn поможет найти паттерны в данных, что позволит оптимизировать энергопотребление.
Prophet* – прогнозирование временных рядов
Prophet* – это библиотека от Facebook*, созданная специально для прогнозирования временных рядов.
Она отличается простотой использования и позволяет легко делать предсказания без сложных настроек.

Что умеет Prophet*?
  • Прогнозирование продаж, трафика, спроса.
  • Автоматическое определение трендов и сезонности.
  • Анализ влияния внешних факторов (праздников, событий, рекламы).
Где используется?
  • Прогноз продаж – например, сколько смартфонов купят в следующем месяце.
  • Прогноз посещаемости сайта – сколько пользователей зайдёт через неделю.
  • Оптимизация логистики – предсказание нагрузки на склады.
Пример проекта:
Представьте, что авиакомпания хочет оптимизировать цены на билеты. Prophet* может проанализировать исторические данные, выявить сезонные тренды и подсказать, когда лучше снижать или повышать цены.

Сегодня мы разобрали четыре важные библиотеки для работы с табличными данными и временными рядами:
Pandas – основа для работы с таблицами.
Dask – инструмент для обработки больших данных.
tslearn – анализ временных рядов.
Prophet* – прогнозирование данных.

В следующем уроке мы поговорим о дополнительных библиотеках для AI, таких как Seaborn, Matplotlib и другие!

* принадлежит компании Meta, которая признана экстремистской организацией на территории Российской Федерации.
оставьте заявку на курс по AI
Подберем программу под ваши цели
Продолжительность курса 6 месяцев
Не упустите возможность освоить востребованную профессию будущего
Стоимость от 4 719 руб. в месяц
Гарантия трудоустройства
1
Занятие 5
Общие AI-библиотеки и полезные инструменты