Цель стажировки: Разработать прототип сервиса для автоматической обработки видео- и аудиофайлов на платформе Trafory с функциями транскрибации, извлечения текстовых и графических данных, а также структурирования информации в формате docx.
Задачи проекта:- Изучение технологий видеообработки и транскрибации: OpenCV, FFmpeg, Whisper.
- Разработка алгоритмов извлечения текста из видео и аудио: Whisper, Transformers.
- Создание системы идентификации ключевых кадров: OpenCV, PyTorch.
- Реализация алгоритма разделения информации по блокам: spaCy, NLTK.
- Интеграция решений в Trafory: FastAPI, Docker.
Польза проекта заказчику: Прототип станет основой AI-ассистента для автоматической обработки загружаемых пользователем образовательных материалов (видео, аудио, презентации). Это ускорит создание курсов, минимизирует ручную обработку контента, повысит вовлечённость пользователей и эффективность обучения. Ограничение файлов до 1 ГБ и 65 минут обеспечит оптимальную производительность системы.