Автораспознание капчи яндекса. Есть идеи

123 4
s91
На сайте с 13.04.2009
Offline
88
s91
3910

Решил вот занятся разработкой скрипта автораспознавания капч яндекса

Написал простенький скриптик вертикального выравнивания волн в капче:

Также было бы неплохо убрать горизонтальные волны.

Сейчас собираю базу уже распознанных капч для их анализа.

Самая основная сложность, как по мне - это разделение цифр между собой, т.к. они имеют разную ширину, и в некоторых местах сливаются между собой.

Есть какие-нибудь идеи? Возможна совместная разработка.

Не бывает белой и черной оптимизации. Бывает только обман и разные способы его реализации
B
На сайте с 27.12.2008
Offline
47
#1

Не знаю, насколько это поможет, но нельзя как-то заливать цифры разным цветом? Поидее будет нефиговый контраст для распознавания.

А на чем вообще пишется скрипт?

alexandr_nv
На сайте с 23.04.2009
Offline
39
#2

s91 а для чего тебе это?

Почему не воспользуешься существующими сервисами?

B
На сайте с 27.12.2008
Offline
47
#3

Хочется бесплатности) Ну и, наверное, с точки зрения программиста - интересно наконец раздербанить капчу)

mr. Evil
На сайте с 07.12.2007
Offline
77
#4
s91:
Также было бы неплохо убрать горизонтальные волны.

эти шумы не внесут значительных искажений при распознавании

AE
На сайте с 16.03.2009
Offline
19
#5
alexandr_nv:
s91 а для чего тебе это?
Почему не воспользуешься существующими сервисами?

как зачем? чтоб автоматом в адурилку закачивать дофига страниц)

euhenio
На сайте с 21.09.2001
Offline
357
#6

ТС, надо обучалку присобачить какуюнть!

s91:
Сейчас собираю базу уже распознанных капч для их анализа.

у меня есть примерно 40 тыс правильно распознанных капч аддурелки. Можно совокупить усилия :)

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
s91
На сайте с 13.04.2009
Offline
88
s91
#7

Вообщем, если кто-то сможет написать скриптик php-шный по разделению всей картинки на 6 картинок в каждой по одной цифре, пишите предложения сюда.

Скрипт должен срабатывать с >99% вероятностью. Т.е. одна цифра должна полностью присутствовать в одной картинке, и небыло кусочков других цифр.

Возможно 2 варианта:

1. Оплата за такой скрипт

2. Получение готового продукта

Пишите предложения

euhenio
На сайте с 21.09.2001
Offline
357
#8
s91:
Есть какие-нибудь идеи? Возможна совместная разработка.

-еще идеи: набрать кучу попарных координат черных точек по массиву капч (сдвигов) в базу, стереть те, что сильно пересекаются, остальные юзать как отпечатки пальцев.

CE
На сайте с 30.01.2008
Offline
73
#9

Короче вот тема - http://habrahabr.ru/blogs/artificial_intelligence/64535/#habracut

Я тут тоже заинтересовался, но математический аппарат пока подводит, засел за изучение теории)

s91
На сайте с 13.04.2009
Offline
88
s91
#10
-еще идеи: набрать кучу попарных координат черных точек по массиву капч (сдвигов) в базу, стереть те, что сильно пересекаются, остальные юзать как отпечатки пальцев.

да, такое можно попробовать. хорошая идея

CHEM_Eugene:
Короче вот тема - http://habrahabr.ru/blogs/artificial_intelligence/64535/#habracut
Я тут тоже заинтересовался, но математический аппарат пока подводит, засел за изучение теории)

Я видел эту тему. Нейронная сеть - это простейший способ. Можно конечно правильно загнать 1 000 000 капч на обучение. И наслаждаться 100% вероятностью разгадывания каждой капчи ожидая по часу это разгадывание. Но в полевых условиях это навряд ли представляет ценность

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий