Smart Engines заработала 1 млн. евро на распознавании паспортов и научилась распознавать любые документы (+видео)

В 2017 году компания Smart Engines заработала на распознавании документов в России более 1 миллиона евро, что в 4 раза превышает показатели 2016 года.

Пользователями решений компании являются ведущие финансовые организации, а ее алгоритмы занимают первые места на международных научных соревнованиях. На Mobile World Congress 2018 в Барселоне Smart Engines показала технологию распознавания удостоверяющих документов всех стран мира и анонсировала выход на международный рынок.

Рост в 4 раза в 2017 году

Российский разработчик технологий распознавания компания Smart Engines подвела итоги 2017 года. За второй полный год работы компания заработала на распознавании документов в России более 1 миллиона евро, превысив показатели 2016 года в 4 раза. Основная часть дохода пришлась на флагманский продукт Smart IDReader, предназначенный для распознавания паспорта РФ, водительских удостоверений, банковских карт и других документов в мобильных приложениях и в интернет решениях.

Решения Smart Engines по распознаванию удостоверяющих документов востребованы прежде всего в сервисах, требующих удаленной идентификации и верификации клиентов. Это финтех-проекты, транспорт, банки, страхование и вся шеринговая экономика. Об использовании технологий Smart Engines заявили Аэрофлот, Тинькофф Банк, Альфа-Банк, Почта Банк, QIWI, Ренессанс Страхование и СКБ Контур.

Smart Engines разрабатывает системы распознавания для мобильных устройств и серверов на основе технологий машинного обучения и компьютерного зрения. Компания была основана ведущими учеными ряда институтов РАН и работает на российском рынке с 2015 года. Сегодня в штате компании работают более 45 человек, из них 16 имеют ученую степень. Ведущие сотрудники ведут преподавательскую деятельность в МФТИ на собственной базовой кафедре.

За прошедший год партнерами компании стали AT Consulting, компания LETA и разработчик операционной системы Sailfish Mobile OS RUS компания «Открытая Мобильная Платформа». Smart Engines продолжила активное сотрудничество с разработчиком микропроцессоров «ЭЛЬБРУС» компанией МЦСТ, системным интегратором «КОРУС Консалтинг» и разработчиком решений для удаленной идентификации Sum&Substance.

Из научных достижений можно отметить победу команды Smart Engines в международном конкурсе по бинаризации документов DIBCO 2017 (Document Image Binarization COmpetition), итоги которого были объявлены на ведущей научной конференции по распознаванию документов ICDAR (International Conference on Document Analysis and Recognition), прошедшей 9-15 ноября 2017 г. в городе Киото.

Распознавание ID документов всего мира

На Mobile World Congress 2018 в Барселоне Smart Engines представила свою новую разработку — систему искусственного интеллекта HIEROGLYPH, которая позволяет настроить распознавание любых используемых в мире удостоверяющих документов. Разработка технологической платформы HIEROGLYPH велась в течение 2017 года, и сегодня на ней реализовано распознавание паспортов, ID карт и водительских удостоверений для более чем 55 стран мира. Непосредственно на уровне платформы уже сейчас поддерживаются 38 языков, включая практически все европейские, даже такие визуально сложные, как армянский и грузинский.

По словам генерального директора Smart Engines к.т.н. Владимира Арлазарова с точки зрения мирового рынка распознавания наибольший интерес по-прежнему представляют страны западной Европы и США. Специалистам компании удалось локализовать продукт для работы с документами на английском, немецком, французском, испанском, португальском языках, что позволило расширить потенциальную географию решения до 1.5 миллиардов пользователей.

Алгоритмы распознавания в HIEROGLYPH оптимизированы для архитектур «Эльбрус», SPARC, ARM, x86 и совместимы с операционными системами iOS, Android, Sailfish Mobile OS RUS, «Эльбрус», Linux (включая Astra Linux и «Атликс»), Windows, macOS и Solaris. Качество распознавания не зависит от программно-аппаратного окружения, а быстродействие определяется доступными вычислительными ресурсами. Могут обрабатываться видео, фотографии, сканы документов и их копии, полученные с помощью телефонов, планшетов, веб-камер и сканеров.

В основе HIEROGLYPH лежат собственные научные разработки компании в области зрительного интеллекта.

Для решения задач детекции, классификации и распознавания большого количества типов документов в HIEROGLYPH применяются глубокие целочисленные нейронные сети. Ученым компании удалось решить известную проблему, связанную с большой вычислительной сложностью стандартных решений в области обучения машин. Для оптимизации быстродействия глубоких нейронных сетей была использована сепарированная архитектура сверточных слоев и 8-битная модель вычислений. Большинство программных функций новой платформы поддерживают обработку в 8-битной целочисленной арифметике, что позволяет вычислять ответ глубоких нейронных сверточных сетей в восьмибитном тракте.

Технология вычислительно эффективной зрительной памяти в HIEROGLYPH основана на построении для изображений компактных описаний, инвариантных к яркостным и пространственным искажениям (включая проективные) в виде векторов многомерного метрического пространства. Это особенно важно для получения высокого качества распознавания при работе с видеопотоком в мобильных приложениях при неизвестном освещении.

Реализованная в HIEROGLYPH технология синтеза выборок для обучения нейронных сетей позволяет добавлять распознавания новых типов документов, имея всего 2 изображения этого типа документа. Одно — для обучения системы, а второе — для проверки результата.

Первые значимые результаты продаж решений на базе HIEROGLYPH на международном рынке Smart Engines рассчитывает получить к концу 2019 года. Специфика работы с крупными европейскими и американскими заказчиками такова, что путь от первого контакта до заключения сделки занимает 1,5-2 года.

 

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *