Дмитрий Полещенко — преподаватель ВУЗа, решивший расширить свой кругозор в области современных нейронных сетей и получить практические навыки в их проектировании. Объектом дипломной работы стала важная задача для одного из переделов металлургического завода.
На металлургическом заводе города производится металлопродукция. Одним из промежуточных звеньев являются стальные заготовки сечением 300х360, на торец которых механическим способом (клеймовочной машиной) наносится девятизначное клеймо.
Одной из технологических операций является загрузка данных заготовок в печь для нагрева перед прокатом. Загрузкой занимается оператор в ручном режиме. Посад зависит от марки стали, который забит в коде. Также оператор должен сличать данный код с тем, что реализовано в его базе для каждой из четырех печей под конкретного потребителя. Если он вдруг ошибается и садит в печь не ту заготовку, то покупатель получит не ту заготовку и выставит предприятию штраф, который исчисляется десятком миллионов рублей.
Для помощи оператору с целью дублирующего контроля на данный момент создается система, обеспечивающая автоматическую идентификацию номера литой заготовки.
Первоначально задача распознавания решалась на сверточных нейронных сетях. Однако, с их помощью задачу решить не удалось, точность распознавания не поднималась выше 65%.
Во время обучения Дмитрий узнал о различных более мощных структурах нейронных сетей способных решать поставленную задачу. В рамках исследования, совместно с коллективом единомышленников для распараллеливания огромного объема работ, была решена задача по определению типа нейросети, которая наиболее точно распознавала цифры клейма. В исследовании прорабатывалось применение базовых архитектур сетей из библиотеки Segmentation models, а именно
Unet, FPN, Linknet,
PSPNet. В качестве backbones использовались сети resnet34, seresnet34. Также удалось разобраться с установкой, обучением и работой сети FasterRCNN.
Для создания датасета на заводе была установлена видеокамера с помощью которой удалось собрать базу для обучения сетей, состоящую из 10 000 изображений.
В результате исследования были выявлено, что наилучший результат из сетей библиотеки Segmentation models дает сочетание FPN c backbones seresnet34 и этот результат соизмерим по качеству с результатом сети FasterRCNN.
В результате на тестовой выборке из 1000 клейм FPN сеть дала 90 % точности, FRCNN — 92 %. Однако следует отметить, что сеть FasterRCNN работает быстрее. Для выдачи результата она тратит порядка 0,2 сек, а сеть FPN – 1 сек.
В планах — улучшить точность распознавания до 99 %. Есть гипотеза, что самый лучший результат получится на совмещении этих двух сетей.