На «Хабре» вышел материал нашего разработчика, который на реальном примере рассказал, как решать задачу классификации изображений документов в процессе автоматизации кредитного конвейера. Из статьи также можно узнать, какой вопрос объединяет машинное обучение с Библией :)
Перед коллективом была поставлена задача решить проблему классификации изображений документов.
Надо было добиться высоких значений метрик в разделении документов на 12 классов, таких как:

Поход по граблям в поисках оптимального решения начался с метода классификации распознанного текста, но этот подход оказался медленным и неэффективным. Затем мы перепробовали различные методы извлечения признаков из изображений, чтобы добиться лучших результатов.
В классическом подходе правильный выбор признаков, на основе которых строится модель — ключевой фактор успеха в ML. А в нейросетевом подходе — выбор архитектуры.
Но что делать, если ни один из выбранных признаков не дает заметного преимущества? В таких случаях на помощь приходит идея объединить различные признаки — конкатенация, которая позволяет совместить разные типы информации и повысить эффективность обучения.
В нашей работе мы использовали линейный классификатор на основе объединения классических признаков с нейросетевыми признаками.
В качестве классических признаков была выбрана пространственная пирамида (Spatial pyramid pooling), где в каждой ячейке пирамиды вычисляется сумка визуальных слов (Bag Of Visual Words).

В качестве нейросетевых признаков использовали признаки с предпоследнего слоя сети ResNet-50, предобученной на датасете ImageNet.

Мы считаем, что наш подход получился достаточно универсальным благодаря сочетанию большого количества признаков и комбинации нейросетевых методов с классическими.
Ожидаем, что его можно будет успешно применить и к другим наборам данных.
Подробности, нюансы, ключевые требования к выполнению задачи и поный текст статьи читайте на Хабре.
Работаем только с юридическими лицами
Работаем только с юридическими лицами.
Работаем только с юридическими лицами.
Ошибка: Контактная форма не найдена.
Ошибка: Контактная форма не найдена.