php, Отпарсить captcha.yandex.net

123
[Удален]
#11
Bitman:
На file_get_contents долеко не уедешь

тут можно поспорить ....

ewg777
На сайте с 04.06.2007
Offline
225
#12
Bitman:
На file_get_contents долеко не уедешь :)
Для начала полностью забрать страничку...

Вопрос как стоял? Ответ решает данную проблему.

[umka]
На сайте с 25.05.2008
Offline
456
#13

Эх, было время, писал я распознавалки каптч на пхп :)

Ради академического интереса, конечно же.

Кстати, у Яндекса она весьма несложная.

Лог в помощь!
[Удален]
#14

[umka], и каков шанс пробива яндекс капчи? каким алгоритмом распознавали?

bigturtle
На сайте с 12.10.2008
Offline
75
#15

+1 интересно :)

[umka]
На сайте с 25.05.2008
Offline
456
#16

bearman, щас я еще раз на неё взгляну, а то давно не видел )

Вобщем, если специально заморочиться под яндекс, можно сделать распознавалку, которая будет распознавать с вероятностью сильно близкой к 1 :)

Я делал распознавалки каптч, где символы выводились на каком-нибудь "замусоренном" фоне и т.п., но символы не сливались друг с другом.

Т.е. делал фильтрацию шумов, выделение символов, последовательное сравнение с образцами из шрифта.

Всё силами GD.

У яндекса символы лишь касаются друг друга, поэтому это не создаёт дополнительной сложности.

Небольшое искажение и "волны" так же никак не влияют.

[Удален]
#17

[umka], ну да, я так же в свое время делал))

наложенные буквы - самое зло при распознавании ... остальное в принципе не так страшно, есть шанс :)

[umka]
На сайте с 25.05.2008
Offline
456
#18

И никаких заморочек с "нейроными сетями" и пр. тут не потребуются :)

Могу совершенно точно сказать, что отцы, которые пишут по распознаванию образов диссертации, могут создать такие алгоритмы (применительно к каптчам), что сначала символы перестанет различать человеческий глаз (и мосх), а только потом — алгоритм :)

Bitman
На сайте с 05.07.2009
Offline
112
#19

[umka], здается мне не так всё просто. Один умелец писал про Яндекс каптчу http://habrahabr.ru/blogs/artificial_intelligence/64535/

Северный лес (https://euro-vagonka.by) DREW (https://drew.by) AvtoDrive (https://avtodrive.by)
[umka]
На сайте с 25.05.2008
Offline
456
#20

Bitman, гляжу на картинку с разделёнными циферками.

Считаю, что их можно опознать с вероятностью гораздо большей, чем 1.5%

Беда тут в другом.

Если серьёзно этим заняться и таки сделать, то доблестные бойцы Яндекса быстро всё просекут поменяют алгоритм :)

И это будет трудней преодолеть, чем капчи ))

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий