Попробуйте распознавать яндексовской каптчи с вероятностью 99,9 - Поисковые технологии

распознавание антиботовских картинок

tar729 · 2008-01-16T07:21:45.0000000Z

я решил проблему распознавания образов. причем в общем виде. она касается распознавания всех образов вообще. нужно структурировать шаблоны образов в дерево шаблонов. Наподобие семантического дерева, только в отличии от семантических координат, в этой древовидной структуре должны стоять не понятия с тегами связок с другими понятиями, а графические векторные объекты с графическими тегами, связующие графические понятия между собой. Графический тег-вот оно! Этот принцип позволяет не только со 100% вероятностью идентифицировать уже известные объекты (цифры, буквы, лица), но и создавать в автоматическом режиме самообучающегося алгоритма новые графические образы. Впрочем, это всего лишь дальнейшее логическое развитие предыдущего моего решения в семантике и алгоритма записи текстовых мыслеформ в виде стековой последовательности координат понятий в семантической древовидной структуре, все вместе образует навигационную систему поиска понятий. графические теги-это векторы-отрезки, имеющие координату начала, направление, и координату конца в графической матрице пикселов. Для работы с ними нужен макрос сканера по типу телевизионной построчной развертки. Теги-основа связок между пикселами и могут в идеале дать 100% идентификацию любого графического образа, но в случае с макрообъектами (буквами), делать теги попиксельно не нужно, можно загрубить векторный анализ и работать с квадратными (или кубическими) кластерами, разрешение можно настроить автоматически в зависимости от разрешения исходной картинки и соотношения пикселов, несущих полезный сигнал к шуму. могут быть и трехмерные теги (для распознавания трехмерных объектов), для них есть свой трехмерный сканер, алгоритм сканера есть и работает (он придуман мной около 2-х лет назад).

324

response

21 января 2008, 22:17

#131

аааа, впадлу связываться.

Однопоточный парсер ключевых слов Магадан (http://magadanparser.ru) (со свистелками) Многопоточный парсер ключевых слов Солнечный (http://sunnyparser.ru) (без свистелок)

370

kimberlit

22 января 2008, 03:51

#132

От этого псевдоноватора сбегают последние оппоненты )))

Когда новая тема будет с новым отжЫгом?

[Удален]

22 января 2008, 16:50

#133

response:
аааа, впадлу связываться.

так вы же ничего не предлагаете, что с вами связываться то?

F3

42

Fly3110

22 января 2008, 18:20

#134

Осилил 2 темы, получил невероятный заряд позитиффа :)

У меня к автору только один вопрос:

представим 2 картинки (ЧБ, размер 100 на 100).

На одной буква "К", а на другой та же самая буква "К", только сильно искаженная.

Для каждой буквы вы предполагаете хранить разные варианты матриц, или планируете приводить вторую букву к нормльному виду?

Да, еще... При разборе яндексовской капчи Вы решили, что линии нужно убирать, т.к. они периодические. А с чего вы решили, что шум будет периодический?

[Удален]

23 января 2008, 06:12

#135

"

Fly3110:
Осилил 2 темы, получил невероятный заряд позитиффа :)

У меня к автору только один вопрос:
представим 2 картинки (ЧБ, размер 100 на 100).

На одной буква "К", а на другой та же самая буква "К", только сильно искаженная.

Для каждой буквы вы предполагаете хранить разные варианты матриц, или планируете приводить вторую букву к нормльному виду?"

искажения бывают разные. в первую очередь выровнять нужно объект, чтобы он стоял горизонтально. эта тема и методика обсуждалась.
Если размер объекта сохраняется, применяем соответствующего размера матрицы.
если буква просто растянута, или линии слишком жирные или пропорции не соблюдены, все это решается сравнением с различными шрифтами.

"Да, еще... При разборе яндексовской капчи Вы решили, что линии нужно убирать, т.к. они периодические. А с чего вы решили, что шум будет периодический?

"

а вы решили, что проблема распознавания образов должна абстрагироваться от первоначальных критериев поиска?

Ну, тогда, я подсуну вам редкую картину Дали (если вы не исскусствовед, конечно) и попробуйте мне отыскать второй, третий, а иногда и четвертый образ, который в ней заложен.

Вы не найдете и второй, поскольку не будете знать, что перед вами Дали, потому что вы не знаете, что следует искать еще что-то, кроме того, что максимально по весам совпало с имеющимся шаблоном в вашей голове. Вы первый то смысл нашли только потому, что увидели картину и сразу поняли, что на ней должен быть какой то смысл, начали перебирать шаблоны мелких деталей, возможно, несколько сотен тысяч, после чего, нашли им соответствие и синтезировали из них смысл общей картины.

Если шум будет не периодический, то вы и сами его не выделите, если его много будет.

Тут рулят весовые коэффициенты, ведется поиск наиболее преемлемого результата. Шум в этом случае, мелкий, роли особой не сыграет, поскольку отбросится методом исключения по весовым показателям.

[Удален]

23 января 2008, 06:55

#136

мастер класс для ЮНИ.

"В качестве примера синтеза (а именно синтез информации лежит в основе новой системы обработки) можно взять такую неразрешимую ранее задачу, как умножение целых чисел. "

открываем учебник и убеждаемся, что умножение целых чисел не является неразрешимой задачей уже очень давно.

Т.е. Юни несет полный бред и называет это мастер классом, гы-гы-гы.

если Юни собрался изобрести что то эдакое, революционно-поллюционное, то хотя-бы проблему взял действительно ранее не решенную, как в моем случае.

Создается впечатление, что Юни готов предоставить решение задачи распознавания яндексовской каптчи с вероятностью 99,9 (как это сделал я заметьте. Т.е. я предоставил методику, которая способна обработать картинку и получить высокую, доселе никем не полученную даже теоретически, вероятность).

но самое смешное не в этом товарищи. Самое смешное в том, что сей бредовый текст под названием "мастер класс от Юни", рассматривается большинством из вас как аргумент, меня дискредетирующий. Чем, позвольте спросить? вот этим бредом?:"В качестве примера синтеза (а именно синтез информации лежит в основе новой системы обработки) можно взять такую неразрешимую ранее задачу, как умножение целых чисел. "

Впрочем, сие нисколько меня не печалит, скорее наоборот, крайне веселит... гы-гы

370

kimberlit

23 января 2008, 07:02

#137

Гений вы наш ... Вы хотя бы научились бы тегом цитаты пользоваться ...

Иначе не поймёшь где вам люди пишут и где далее ваш бред идёт ... Всё в куче ...

Подсказка: в "быстром ответе" крайняя справа кнопка ...

:):):)

Яндекс кобласит Новый поисковик от OpeAI Закат интернет магазинов

F3

42

Fly3110

23 января 2008, 07:42

#138

tar729:
""

а вы решили, что проблема распознавания образов должна абстрагироваться от первоначальных критериев поиска?
Ну, тогда, я подсуну вам редкую картину Дали (если вы не исскусствовед, конечно) и попробуйте мне отыскать второй, третий, а иногда и четвертый образ, который в ней заложен.
Вы не найдете и второй, поскольку не будете знать, что перед вами Дали, потому что вы не знаете, что следует искать еще что-то, кроме того, что максимально по весам совпало с имеющимся шаблоном в вашей голове. Вы первый то смысл нашли только потому, что увидели картину и сразу поняли, что на ней должен быть какой то смысл, начали перебирать шаблоны мелких деталей, возможно, несколько сотен тысяч, после чего, нашли им соответствие и синтезировали из них смысл общей картины.

Если шум будет не периодический, то вы и сами его не выделите, если его много будет.
Тут рулят весовые коэффициенты, ведется поиск наиболее преемлемого результата. Шум в этом случае, мелкий, роли особой не сыграет, поскольку отбросится методом исключения по весовым показателям.

Не могли бы вы ответить четко и без ухода от ответа: на каждый вариант буквы будет своя матрица (фрагменты матриц), или же искаженная буква будет приводиться к нормальному виду?

[Удален]

23 января 2008, 08:07

#139

вопрос поставлен вами не вполне корректно. Следовательно, получаете такой же не корректный ответ.

Вам только кажется, что вы ставите вопрос корректно.

что такое "каждый вариант буквы"? надо выражаться конкретнее. Вы как нибудь проклассифицировали бы чтоли, ваши варианты, которые имеете в виду.

искажения бывают нескольких видов. В зависимости от этого и ответ на ваш вопрос должен быть. Почему я за вас должен их классифицировать?

1) повернутое изображение

2) уменьшенное или увеличенное изображение

3) неправильные соотношения

4) разный шрифт

5) разрывы, посторонние включения.

Для 1-го случая будет приводиться к нормальному виду.

Для 2-го случая будет сначала выбираться соответствующий размер матрицы

для 3,4,5, будут использованы матрицы соответствующих размеров, относящихся к разным шрифтам. Естесственно, что каждому кеглю, каждого шрифта будет соответствовать свой набор матриц.

Вообще, почему такой вопрос возник? Ведь предыдущие посты прямо указывают на это. Я могу понять, что вы их просто не читали, и даже если читали, то не поняли. Но вы хотя бы научитесь грамотно задавать вопросы, вашу папу.

Вопросы задавать корректно не умеете, а еще что то требуете...

[Удален]

23 января 2008, 08:10

#140

kimberlit:
Гений вы наш ... Вы хотя бы научились бы тегом цитаты пользоваться ...
Иначе не поймёшь где вам люди пишут и где далее ваш бред идёт ... Всё в куче ...

Подсказка: в "быстром ответе" крайняя справа кнопка ...
:):):)

вам это не поможет. Вы не понимаете смысла фраз, построенных грамотно с точки зрения семантического синтеза. Вы не считаете нужным пользоваться этими правилами при распознавании текста.

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

Курс биткоина превысил $50 тысяч

распознавание антиботовских картинок