Стажировка
АПРЕЛЬ2026
ДОПОЛНИТЕЛЬНЫЙ проект по AI
Разработка интеллектуального помощника «Элион» для навигации по олимпиадным школам и приёмной кампании

Результат проекта
Результат — работающий чат-виджет, встроенный на сайт https://school.biomed-mipt.ru/, с админ-панелью для управления источниками, файлами, кнопками и статистикой вопросов. Система пригодна для масштабирования на другие школы МФТИ.

Что студенты будут делать / Задачи проекта:
  • Сбор и анализ структуры целевых веб-источников (6 сайтов МФТИ: олимпиадные школы по биологии и химии, страницы проектов, правила приёма, бакалавриат Школы биомедицины). Выделение типовых блоков с датами, контактами, условиями возврата, документами
  • Разработка парсера (Python, BeautifulSoup, Scrapy, requests) для периодического сканирования указанных страниц и извлечения актуального текста с сохранением ссылок на конкретные URL
  • Реализация конвейера индексации: очистка текста, разбиение на смысловые фрагменты, загрузка в векторную базу данных (FAISS / Chroma / Qdrant) для последующего семантического поиска
  • Создание RAG-пайплайна (LangChain / LlamaIndex) с интеграцией LLM (GigaChat / YandexGPT / локальная модель) для генерации краткого ответа-выжимки на естественно-языковой вопрос пользователя
  • Разработка интерактивного формата ответа: формирование JSON-структуры, содержащей:

  1. Текстовый ответ
  2. Кликабельную ссылку «Подробнее на сайте»
  3. Опциональные кнопки («Скачать бланк», «Перейти к регистрации», «Открыть чат школы», «Посмотреть фотоальбом»)
  4. Ссылку на PDF-файл (управляемую через админку)

  • Реализация механики уточняющих вопросов (например: «Вам нужна информация о летней или зимней школе?») при неоднозначном запросе
  • Разработка админ-панели (веб-интерфейс, Flask/Django/FastAPI + React/Vue или шаблоны) с возможностью:

  1. Добавлять / обновлять источники для сканирования
  2. Загружать PDF/DOCX-файлы (бланки заявлений, справки для вычета)
  3. Редактировать URL кнопок действий (регистрация, чаты, фотоальбомы)
  4. Вручную добавлять пары «вопрос — ответ» для случаев, когда информации нет на сайтах
  5. Просматривать статистику: топ частых вопросов, вопросы без ответа (с логгированием неудачных запросов)

  • Интеграция чат-виджета (всплывающее окно) в тестовую версию сайта https://school.biomed-mipt.ru/ (JavaScript-виджет / iframe / API-вызовы)
  • Тестирование на реалистичных пользовательских сценариях: «Как вернуть деньги за школу?», «Какие сроки регистрации на олимпиаду по биологии?», «Где скачать заявление на возврат?», «Нужна ли справка для налогового вычета?» — с проверкой ссылок и кнопок
МФТИ
Цель стажировки: Разработать прототип чат-виджета («Элион»), который в реальном времени извлекает структурированную информацию из 6+ веб-источников МФТИ (сайты олимпиадных школ, правила приёма, страницы проектов) и выдаёт пользователю не сырой текст, а интерактивную карточку с ответом, действиями (кнопки, скачивание PDF) и ссылкой на источник.