Краудсорсинговая платформа Яндекса Толока переходит в статус открытой беты и отныне доступна всем внешним заказчикам. Об этом сообщается в официальном блоге Яндекса на Хабрахабре.
Платформа Толока вот уже полтора года используется Яндексом для совершенствования поисковых алгоритмов и технологий машинного интеллекта, которые в той или иной степени нуждаются в человеческих оценках.
Толока сейчас - это почти 270 тысяч исполнителей из пяти стран мира, 80 тысяч выполняемых заданий в день, 400 уже опробованных разных типов заданий, 1 миллиард собранных оценок.
В момент открытия Толока стартовала с тремя основными типами заданий: оценка качества поиска картинок, разметка контента для взрослых и попарное сравнение объектов (например, страниц в разном дизайне).
Использование краудсорсинга для сбора оценок в этих проектах позволило командам Яндекса существенно сократить время ожидания оценок для построения метрик. Где асессорам требуется несколько дней на оценку набора объектов, толокеры справляются за пару часов. За счет снижения стоимости оценки удалось заметно увеличить размеры обучающих наборов и повысить качество алгоритмов классификации. К примеру, после перехода на Толоку качество определения контента для взрослых выросло на 30%.
Заказчиками оценок в Толоке выступают десятки разных команд Яндекса. С помощью этого сервиса собираются данные для технологий компьютерного зрения и распознавания речи, совершенствуются рекомендательные технологии, пополняется база справочника организаций, решаются многие другие внутренние задачи. Но их все равно недостаточно для того, чтобы обеспечить всех толокеров заданиями. Нужно двигаться дальше.
Закрытое альфа-тестирование платформы подтвердило гипотезу о том, что Толока может быть полезна внешним заказчикам и должна быть открыта для всех. Поэтому, начиная с этой недели, Толока переходит в статус беты, и ее краудсорсинговые возможности доступны для всех желающих.
Подробнее о том, как добавить свое задание, можно прочитать здесь