Яндекс запустил Лабораторию Толоки — она автоматически решает популярные задачи по обработке данных. Лаборатория создана на базе Яндекс.Толоки и пригодится тем, кому важно быстро решить задачу и кто не готов тратить время на запуск проекта на этой платформе.
Для работы с Лабораторией не нужны никакие специальные знания. Заказчик только заполняет небольшую форму, дает ссылку на данные и объясняет, что с ними делать. Остальное — создание интерфейса, настройка проекта и поиск исполнителей — происходит с помощью автоматизированных процессов. Когда все будет готово, заказчик получит результаты разметки.
Сейчас Лаборатория выполняет три вида разметки данных — классификацию изображений, классификацию текста и выделение объектов на картинке. Размеченные данные помогают решать самые разные задачи в маркетинге, продажах, образовании, машинном обучении и других сферах. Например, с помощью классификации изображений можно определить эмоции человека на снимке — смеётся он, равнодушен или грустит. С помощью классификации текста — сгруппировать комментарии пользователей по тональности, скажем, разделить их на позитивные, негативные и нейтральные. А выделение областей изображений, помимо прочего, позволяет найти на фотографиях людей, которые выгуливают собаку. Позже появятся автоматические решения и для других видов задач.
Ольга Мегорская, руководитель Яндекс.Толоки:
«Мы стремимся, чтобы технологиями Толоки могли пользоваться как можно больше людей — и чтобы это было легко. Если у человека есть такая возможность, он самостоятельно разберется в Толоке и запустит проект. Если задача сложная, а разбираться времени нет — обратится к сертифицированным партнерам. А со стандартными и наиболее популярными типами разметки поможет Лаборатория».
Заполнить заявку на обработку данных можно в Лаборатории. Минимальный объем задачи — 500 текстов или изображений, цена начинается с 12 000 рублей и зависит от сложности разметки.
Напомним, платформа Яндекс.Толока была открыта в ноябре 2014 года, и сначала использовалась Яндексом для совершенствования поисковых алгоритмов и технологий машинного обучения на основе пользовательских оценок.
Сейчас это открытая краудсорсинговая платформа, где зарегистрировано более семи миллионов человек, которые выполняют задания по сбору и разметке данных для разных заказчиков. Каждый день исполнители выполняют больше 13 миллионов заданий по разметке данных, которые потом используются как эталонные данные для машинного обучения, а также помогают в задачах модерации и генерации контента.