Компания Perficient Digital опубликовала результаты исследования, посвящённого точности технологий распознавания речи.
Согласно отчёту, решение Google – Google Vision – превосходит по этому параметру конкурентные технологии, такие как Amazon AWS Rekognition, IBM Watson и Microsoft Azure Computer Vision.
В ходе исследования два сотрудника Perficient Digital в период с 30 ноября 2018 года по 8 января 2019 года собрали и пометили 2000 изображений в четырёх категориях: люди, ландшафты, диаграммы и товары. В каждой категории было около 500 изображений.
Оба сотрудника присвоили каждому изображению по пять меток. Затем все 2000 изображений были пропущены через API перечисленных выше систем. После этого эксперты сопоставили полученные результаты и проранжировали технологии. Эта работа была проведена с 12 апреля по 9 мая.
Интересно, что результаты автоматической пометки у большинства изученных в ходе исследования технологий приближаются к результатам ручного тегирования и находятся на уровне ~80%, что говорит о высокой точности этих решений.
Со всеми результатами исследования можно ознакомиться здесь.