Каптча будут приносить пользу?

Михаил Костриков
На сайте с 02.03.2007
Offline
101
333

выдержки из faito.ru/news/1221421099/ :)

"В старых книгах с выцветшей краской и пожелтевшими страницами программы распознавания текста (OCR) не могут расшифровать около 20% слов". Ученые из Карнеги-Меллона предлагают использовать для расшифровки слов, неправильно распознанных программой, пользователей интернета, которые каждый день вводят в формах авторизации намеренно искаженные слова на картинках, доказывая, что они люди, а не роботы.

По данным авторов статьи, люди по всему миру проходят каждый день более 100 миллионов тестов CAPTCHA, тратя в каждом случае несколько секунд на распознавание намеренно искаженных символов.

Созданная учеными технология reCAPTCHA позволяет получать полезный результат - оцифрованные книги. Программа в ходе эксперимента была размещена на 40 тысячах сайтов, которые нуждались в отделении людей от роботов. Каждый пользователь, проходивший тест, получал картинку со словом из книги, неверно распознанным программой, а также контрольное слово. Если пользователь верно распознавал контрольное слово, программа считала, что и слово из книги он распознал верно.

"Точность системы reCAPTCHA достигала 99,1% (216 ошибок на 24 тысячи 80 слов), в то время как точность программ распознавания текстов достигала лишь 83,5% (3 тысячи 976 ошибок)", - говорится в статье.

Авторы технологии отмечают, что созданная ими система выгодна для владельцев сайтов еще и более высоким уровнем безопасности, так как в тесте используются слова, заведомо неверно распознанные автоматическими средствами - следовательно и роботы их распознать не смогут."

Комментарий:

Но вместо нераспознаного слова робот может ввести что угодно.. :)

Бюро переводов "К Вашим услугам" Доставка нотариальных переводов по всему миру https://perevodperevod.ru
0
На сайте с 19.09.2007
Offline
55
#1
следовательно и роботы их распознать не смогут.

Весьма наивный вывод. ;)

сли пользователь верно распознавал контрольное слово, программа считала, что и слово из книги он распознал верно.

Я бы сделал так - если один и тот же фрагмент из книги одинаково распознают хотябы 2 пользователя - можно считать фрагмент верным. Иначе возможен существенный процент ошибок и опечаток.

MEK:
Но вместо нераспознаного слова робот может ввести что угодно..

Как я понял, предлагается 2 каптчи - одна для проверки, с известным результатом; и в случае верного распознавания первой, принимается результат второй, без заведомо-известного результата, т.е. фрагмента из книги.

PS: сама идея использования сёрферов в качестве каптча-распознавателей не нова. :) Слышл даже прикол на умаксе про монетизацию CH-трафа. :D

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий