распознавание антиботовских картинок

response
На сайте с 01.12.2004
Offline
324
#131

аааа, впадлу связываться.

Однопоточный парсер ключевых слов Магадан (http://magadanparser.ru) (со свистелками) Многопоточный парсер ключевых слов Солнечный (http://sunnyparser.ru) (без свистелок)
kimberlit
На сайте с 13.03.2007
Offline
370
#132

От этого псевдоноватора сбегают последние оппоненты )))

Когда новая тема будет с новым отжЫгом?

[Удален]
#133
response:
аааа, впадлу связываться.

так вы же ничего не предлагаете, что с вами связываться то?

F3
На сайте с 22.01.2008
Offline
42
#134

Осилил 2 темы, получил невероятный заряд позитиффа :)

У меня к автору только один вопрос:

представим 2 картинки (ЧБ, размер 100 на 100).

На одной буква "К", а на другой та же самая буква "К", только сильно искаженная.

Для каждой буквы вы предполагаете хранить разные варианты матриц, или планируете приводить вторую букву к нормльному виду?

Да, еще... При разборе яндексовской капчи Вы решили, что линии нужно убирать, т.к. они периодические. А с чего вы решили, что шум будет периодический?

[Удален]
#135

"

Fly3110:
Осилил 2 темы, получил невероятный заряд позитиффа :)

У меня к автору только один вопрос:
представим 2 картинки (ЧБ, размер 100 на 100).

На одной буква "К", а на другой та же самая буква "К", только сильно искаженная.

Для каждой буквы вы предполагаете хранить разные варианты матриц, или планируете приводить вторую букву к нормльному виду?"

искажения бывают разные. в первую очередь выровнять нужно объект, чтобы он стоял горизонтально. эта тема и методика обсуждалась.
Если размер объекта сохраняется, применяем соответствующего размера матрицы.
если буква просто растянута, или линии слишком жирные или пропорции не соблюдены, все это решается сравнением с различными шрифтами.

"Да, еще... При разборе яндексовской капчи Вы решили, что линии нужно убирать, т.к. они периодические. А с чего вы решили, что шум будет периодический?
"

а вы решили, что проблема распознавания образов должна абстрагироваться от первоначальных критериев поиска?

Ну, тогда, я подсуну вам редкую картину Дали (если вы не исскусствовед, конечно) и попробуйте мне отыскать второй, третий, а иногда и четвертый образ, который в ней заложен.

Вы не найдете и второй, поскольку не будете знать, что перед вами Дали, потому что вы не знаете, что следует искать еще что-то, кроме того, что максимально по весам совпало с имеющимся шаблоном в вашей голове. Вы первый то смысл нашли только потому, что увидели картину и сразу поняли, что на ней должен быть какой то смысл, начали перебирать шаблоны мелких деталей, возможно, несколько сотен тысяч, после чего, нашли им соответствие и синтезировали из них смысл общей картины.

Если шум будет не периодический, то вы и сами его не выделите, если его много будет.

Тут рулят весовые коэффициенты, ведется поиск наиболее преемлемого результата. Шум в этом случае, мелкий, роли особой не сыграет, поскольку отбросится методом исключения по весовым показателям.

[Удален]
#136

мастер класс для ЮНИ.

"В качестве примера синтеза (а именно синтез информации лежит в основе новой системы обработки) можно взять такую неразрешимую ранее задачу, как умножение целых чисел. "

открываем учебник и убеждаемся, что умножение целых чисел не является неразрешимой задачей уже очень давно.

Т.е. Юни несет полный бред и называет это мастер классом, гы-гы-гы.

если Юни собрался изобрести что то эдакое, революционно-поллюционное, то хотя-бы проблему взял действительно ранее не решенную, как в моем случае.

Создается впечатление, что Юни готов предоставить решение задачи распознавания яндексовской каптчи с вероятностью 99,9 (как это сделал я заметьте. Т.е. я предоставил методику, которая способна обработать картинку и получить высокую, доселе никем не полученную даже теоретически, вероятность).

но самое смешное не в этом товарищи. Самое смешное в том, что сей бредовый текст под названием "мастер класс от Юни", рассматривается большинством из вас как аргумент, меня дискредетирующий. Чем, позвольте спросить? вот этим бредом?:"В качестве примера синтеза (а именно синтез информации лежит в основе новой системы обработки) можно взять такую неразрешимую ранее задачу, как умножение целых чисел. "

Впрочем, сие нисколько меня не печалит, скорее наоборот, крайне веселит... гы-гы

kimberlit
На сайте с 13.03.2007
Offline
370
#137

Гений вы наш ... Вы хотя бы научились бы тегом цитаты пользоваться ...

Иначе не поймёшь где вам люди пишут и где далее ваш бред идёт ... Всё в куче ...

Подсказка: в "быстром ответе" крайняя справа кнопка ...

:):):)

F3
На сайте с 22.01.2008
Offline
42
#138
tar729:
""

а вы решили, что проблема распознавания образов должна абстрагироваться от первоначальных критериев поиска?
Ну, тогда, я подсуну вам редкую картину Дали (если вы не исскусствовед, конечно) и попробуйте мне отыскать второй, третий, а иногда и четвертый образ, который в ней заложен.
Вы не найдете и второй, поскольку не будете знать, что перед вами Дали, потому что вы не знаете, что следует искать еще что-то, кроме того, что максимально по весам совпало с имеющимся шаблоном в вашей голове. Вы первый то смысл нашли только потому, что увидели картину и сразу поняли, что на ней должен быть какой то смысл, начали перебирать шаблоны мелких деталей, возможно, несколько сотен тысяч, после чего, нашли им соответствие и синтезировали из них смысл общей картины.

Если шум будет не периодический, то вы и сами его не выделите, если его много будет.
Тут рулят весовые коэффициенты, ведется поиск наиболее преемлемого результата. Шум в этом случае, мелкий, роли особой не сыграет, поскольку отбросится методом исключения по весовым показателям.

Не могли бы вы ответить четко и без ухода от ответа: на каждый вариант буквы будет своя матрица (фрагменты матриц), или же искаженная буква будет приводиться к нормальному виду?

[Удален]
#139

вопрос поставлен вами не вполне корректно. Следовательно, получаете такой же не корректный ответ.

Вам только кажется, что вы ставите вопрос корректно.

что такое "каждый вариант буквы"? надо выражаться конкретнее. Вы как нибудь проклассифицировали бы чтоли, ваши варианты, которые имеете в виду.

искажения бывают нескольких видов. В зависимости от этого и ответ на ваш вопрос должен быть. Почему я за вас должен их классифицировать?

1) повернутое изображение

2) уменьшенное или увеличенное изображение

3) неправильные соотношения

4) разный шрифт

5) разрывы, посторонние включения.

Для 1-го случая будет приводиться к нормальному виду.

Для 2-го случая будет сначала выбираться соответствующий размер матрицы

для 3,4,5, будут использованы матрицы соответствующих размеров, относящихся к разным шрифтам. Естесственно, что каждому кеглю, каждого шрифта будет соответствовать свой набор матриц.

Вообще, почему такой вопрос возник? Ведь предыдущие посты прямо указывают на это. Я могу понять, что вы их просто не читали, и даже если читали, то не поняли. Но вы хотя бы научитесь грамотно задавать вопросы, вашу папу.

Вопросы задавать корректно не умеете, а еще что то требуете...

[Удален]
#140
kimberlit:
Гений вы наш ... Вы хотя бы научились бы тегом цитаты пользоваться ...
Иначе не поймёшь где вам люди пишут и где далее ваш бред идёт ... Всё в куче ...

Подсказка: в "быстром ответе" крайняя справа кнопка ...
:):):)

вам это не поможет. Вы не понимаете смысла фраз, построенных грамотно с точки зрения семантического синтеза. Вы не считаете нужным пользоваться этими правилами при распознавании текста.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий