Стажировка
январь 2026
Организационная информация


В январе по ai будет только 1 проект.

проект по AI
Создание конвейера компьютерного зрения по распознаванию договоров и актов с выгрузкой в 1С
описание проекта
Цель стажировки: Разработать полнофункциональный CV-OCR конвейер для классификации, транскрибации и структурирования документов с автоматической генерацией XML-файлов, совместимых с 1С.

Участники под руководством тимлида Дмитрия Кравченко:
  • Разработают модули CV-OCR для обработки PDF/DOCX/JPG/PNG с использованием OpenCV, Tesseract, PaddleOCR или EasyOCR, выполнят подготовку данных и улучшение качества распознавания.
  • Классифицируют типы документов (счёт, договор, накладная, акт) на основе PyTorch, TensorFlow/Keras, transformers и текстовых эмбеддингов Sentence-BERT.
  • Построят пайплайн извлечения ключевых полей (дата, сумма, реквизиты, табличные данные) с применением layout-парсинга, LayoutLM, PaddleLayout, spaCy, regex и pydantic-моделей.
  • Реализуют валидацию и нормализацию данных, обеспечат проверку целостности схемы и последующее формирование XML-файлов с использованием lxml, xmlschema и встроенных моделей данных.
  • Создадут интеграционное API или файловый шлюз для 1С на базе FastAPI, HTTP/SOAP/REST, механизмов внешних обработок или COM-соединения.
  • Реализуют полный технологический поток: «входящая директория → классификация → OCR → извлечение данных → XML → 1С → архивирование» с применением watchdog, cron, logging и Docker.
  • Протестируют работу конвейера, соберут метрики качества (precision/recall OCR, accuracy классификатора), оптимизируют пайплайн и подготовят демонстрационный сценарий.
Польза проекта заказчику:Проект позволит создать технологическое решение для автоматизации приёмки и структурирования документов, что значительно снизит количество ошибок ручного ввода, ускорит документооборот и повысит прозрачность и производительность работы с системой 1С. Это освободит сотрудников от рутинных операций, увеличит скорость обработки входящих файлов и создаст потенциал для масштабирования и коммерческого применения решения.

ООО «Алгофьюжн»
ООО «АлгоФьюжн» — компания, специализирующаяся на разработке AI- и CV-решений для промышленности и автоматизации бизнес-процессов. Реализует проекты с прямой интеграцией в производственные цепочки и ERP-системы (1С, MES), ориентируясь на прикладимые и масштабируемые AI-продукты (https://algofusion.by/).