Стажировка по проекту
Компания: ООО «ОТР 2000»
Система распознавания документов
Суть проекта
Задача
Для чего
Вводные данные
Выходные данные
Распознавание данных паспортов, СНИЛС, ИНН по фотографии
Повышение эффективности процесса найма сотрудников, сокращение времени и трудозатрат при кадровом делопроизводстве
База изображений заказчиком не предоставлялась, участники стажировки собирали ее самостоятельно
Паспорт - 300 шт
СНИЛС - 320 шт
ИНН - 150 шт
Достигнутая точность распознавания
Паспорт - 60%
СНИЛС - 85%
ИНН - 85%
Участники команды проекта
  • Хабаров Иван
    Тимлид проекта
    Иван - руководитель группы разработчиков, отвечал за полную разработку проекта
  • Глебов Павел
    Наладчик технологического оборудования
    • Обучение моделей YOLOV5;
    • Формирование синтетических данных;
    • Анализ данных/поиск материалов;
    • Разметка данных.
  • Ламыкина Анна
    Работала в сфере импорта и экспорта для проекта Газпрома
    • Обучение моделей YOLOV5;
    • Анализ данных/поиск материалов;
    • Разработка механизма автоматического поворота документов;
    • Разметка данных.
  • Белкина Эльвира
    Специалист биллинговых систем операторов связи
    • Обучение моделей YOLOV5;
    • Анализ данных/поиск материалов;
    • Разработка механизма автоматического поворота документов;
    • Разметка данных.
  • Ивченко Андрей
    Инженер АСУ ТП
    Работал в проектах на Северном потоке и в Сирии
    • Обучение моделей YOLOV5;
    • Анализ данных/поиск материалов;
    • Разработка механизма автоматического поворота документов;
    • Рразметка данных.
  • Носов Дмитрий
    Программист VBA (Excel)
    • Сборка итогового модуля;
    • Обучение моделей YOLOV5, EasyOCR;
    • Разработка механизма автоматического поворота документов;
    • Формирование синтетических данных;
    • Разметка данных.
  • Шубин Илья
    Инженер-комплектовщик в Спортмастере
    • Обучение моделей YOLOV5, EasyOCR;
    • Анализ данных/поиск материалов;
    • Разработка механизма автоматического поворота документов;
    • Разметка данных.
  • Макаров Алексей
    Руководитель направления по развитию ИИ в компании
    • Обучение моделей YOLOV5, EasyOCR;
    • Разработка механизма автоматического поворота документов;
    • Формирование синтетических данных;
    • Анализ данных/поиск материалов;
    • Разметка данных.
Демонстрация проекта
Принцип работы:
1. Поворот документа (на основе yolov5)
2. Детекция необходимых полей (на основе yolov5)
3. Распознавание данных внутри полей (текстовые данные и все поля паспорта распознаются при помощи фреймворка EasyOCR, а числовые данные снилс и инн распознаются при помощи yolov5)
Распознавание СНИЛС
Распознавание ИНН
Благодарность университета