На платформе Яндекс.Облако открылся сервис Yandex Vision для анализа изображений при помощи моделей машинного обучения.
Yandex Vision подходит, например, для создания электронного архива документов с возможностью поиска или для автоматизации бизнес-процессов. Для работы с сервисом можно использовать простые REST API или gRPC API.
Yandex Vision распознает текст на отсканированных страницах документов и возвращает найденные блоки текста, строки и слова с указанием их местоположения на изображении. Его также можно использовать для анализа фотографий, например находить дорожные знаки или номера машин.
Одна страница в среднем распознается за 1-2 секунды. Есть возможность отправлять в одном запросе сразу несколько изображений с текстами на одном или разных языках. Это позволит быстрее распознать текст на разных страницах одного документа или одновременно обработать несколько связанных фотографий.
С Yandex Vision можно решать следующие задачи:
- Поиск по архивам документов
- Перевод тестов на изображениях
- Автоматизация бизнес-процессов
- Модерация пользовательского контента
Начать пользоваться новым инструментом может любой пользователь платформы Яндекс.Облако — для подключения через API достаточно выполнить действия, описанные в руководстве.
На данный момент действуют следующие технические ограничения в работе:
- 10 запросов в секунду
- 5 распознаваний текста в секунду
- поддерживаемые форматы файлов: JPEG, PNG
- 1 Мб — максимальный размер файла
- 20 мегапикселей — максимальный размер изображения
Стоимость одной страницы текста, полученной с помощью сервиса Yandex.Vision составляет 10 копеек.
Напомним, Яндекс анонсировал платформу Яндекс.Облако в начале сентября 2018 года. Доступ к Облаку осуществлялся только по заявкам. В декабре этого же года платформа Яндекс.Облако стала доступна для всех пользователей в России.