Если серьезно заняться по распознаванию образов диссертации, то доблестные бойцы Яндекса быстро все просекут - Веб-строительство

[Удален]

17 января 2010, 13:45

#11

Bitman:
На file_get_contents долеко не уедешь

тут можно поспорить ....

225

ewg777

17 января 2010, 13:47

#12

Bitman:
На file_get_contents долеко не уедешь :)

Для начала полностью забрать страничку...

Вопрос как стоял? Ответ решает данную проблему.

456

[umka]

17 января 2010, 13:47

#13

Эх, было время, писал я распознавалки каптч на пхп :)

Ради академического интереса, конечно же.

Кстати, у Яндекса она весьма несложная.

Лог в помощь!

[Удален]

17 января 2010, 13:50

#14

[umka], и каков шанс пробива яндекс капчи? каким алгоритмом распознавали?

75

bigturtle

17 января 2010, 13:54

#15

+1 интересно :)

456

[umka]

17 января 2010, 13:59

#16

bearman, щас я еще раз на неё взгляну, а то давно не видел )

Вобщем, если специально заморочиться под яндекс, можно сделать распознавалку, которая будет распознавать с вероятностью сильно близкой к 1 :)

Я делал распознавалки каптч, где символы выводились на каком-нибудь "замусоренном" фоне и т.п., но символы не сливались друг с другом.

Т.е. делал фильтрацию шумов, выделение символов, последовательное сравнение с образцами из шрифта.

Всё силами GD.

У яндекса символы лишь касаются друг друга, поэтому это не создаёт дополнительной сложности.

Небольшое искажение и "волны" так же никак не влияют.

[Удален]

17 января 2010, 14:02

#17

[umka], ну да, я так же в свое время делал))

наложенные буквы - самое зло при распознавании ... остальное в принципе не так страшно, есть шанс :)

456

[umka]

17 января 2010, 14:02

#18

И никаких заморочек с "нейроными сетями" и пр. тут не потребуются :)

Могу совершенно точно сказать, что отцы, которые пишут по распознаванию образов диссертации, могут создать такие алгоритмы (применительно к каптчам), что сначала символы перестанет различать человеческий глаз (и мосх), а только потом — алгоритм :)

112

Bitman

17 января 2010, 14:09

#19

[umka], здается мне не так всё просто. Один умелец писал про Яндекс каптчу http://habrahabr.ru/blogs/artificial_intelligence/64535/

Северный лес (https://euro-vagonka.by) DREW (https://drew.by) AvtoDrive (https://avtodrive.by)

456

[umka]

17 января 2010, 14:16

#20

Bitman, гляжу на картинку с разделёнными циферками.

Считаю, что их можно опознать с вероятностью гораздо большей, чем 1.5%

Беда тут в другом.

Если серьёзно этим заняться и таки сделать, то доблестные бойцы Яндекса быстро всё просекут поменяют алгоритм :)

И это будет трудней преодолеть, чем капчи ))

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ

В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов

php, Отпарсить captcha.yandex.net