Попробуйте сделать алгоритм распознавания объектов на каком-нибудь машинном языке - Поисковые технологии

распознавание антиботовских картинок

tar729 · 2008-01-16T07:21:45.0000000Z

я решил проблему распознавания образов. причем в общем виде. она касается распознавания всех образов вообще. нужно структурировать шаблоны образов в дерево шаблонов. Наподобие семантического дерева, только в отличии от семантических координат, в этой древовидной структуре должны стоять не понятия с тегами связок с другими понятиями, а графические векторные объекты с графическими тегами, связующие графические понятия между собой. Графический тег-вот оно! Этот принцип позволяет не только со 100% вероятностью идентифицировать уже известные объекты (цифры, буквы, лица), но и создавать в автоматическом режиме самообучающегося алгоритма новые графические образы. Впрочем, это всего лишь дальнейшее логическое развитие предыдущего моего решения в семантике и алгоритма записи текстовых мыслеформ в виде стековой последовательности координат понятий в семантической древовидной структуре, все вместе образует навигационную систему поиска понятий. графические теги-это векторы-отрезки, имеющие координату начала, направление, и координату конца в графической матрице пикселов. Для работы с ними нужен макрос сканера по типу телевизионной построчной развертки. Теги-основа связок между пикселами и могут в идеале дать 100% идентификацию любого графического образа, но в случае с макрообъектами (буквами), делать теги попиксельно не нужно, можно загрубить векторный анализ и работать с квадратными (или кубическими) кластерами, разрешение можно настроить автоматически в зависимости от разрешения исходной картинки и соотношения пикселов, несущих полезный сигнал к шуму. могут быть и трехмерные теги (для распознавания трехмерных объектов), для них есть свой трехмерный сканер, алгоритм сканера есть и работает (он придуман мной около 2-х лет назад).

950

юни

24 января 2008, 18:56

#251

tar729:
написал же конкретно все.

Если множество человек говорят Вам о своём непонимании, то наверное, корректность всё же хромает?

Предположить всех за недоумков будет, конечно, лёгким объяснением - но гения, безусловно, недостойным. ;) Куда более конструктивен путь сближения позиций, через нахождение общего языка (что я и пытаюсь сделать, общаясь). Согласны?

tar729:
мы просто здесь определяем, что такое шум с нашей мысленной точки зрения.

Но как это алгоритмизировать? Готовы здесь выложить ТЗ кодеру?

tar729:
При низком коэффициенте соответствия, алгоритм перейдет к более детальному анализу и увеличению числа задействованных матриц.

ИМХО, это приведёт лишь к увеличению числа возможных вариантов распознавания, никак не повлияв на их процентную достоверность. Для этого просто нет предпосылок: подходов становится больше, но исходные данные-то - одни и те же.

Какая разница, исследовать муху под лупой, обычным, или электронным микроскопом? Крылев-то у неё, всё равно останется только два.

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит. Пишите в личку.

Вывод на Москоммерцбанк Яндекс кобласит Помощь в фильтрации ботов

[Удален]

24 января 2008, 19:10

#252

юни:
Если множество человек говорят Вам о своём непонимании, то наверное, корректность всё же хромает?

писал 2 раза и указывал конкретное число 10*2413 (на память)

"Предположить всех за недоумков будет, конечно, лёгким объяснением - но гения, безусловно, недостойным. ;)"

я не гений, я Евгений (дубль 3)

"Куда более конструктивен путь сближения позиций, через нахождение общего языка (что я и пытаюсь сделать, общаясь). Согласны?"

безусловно. на себе ответное увеличение конструктива с моей стороны не замечаете?

"Но как это алгоритмизировать? Готовы здесь выложить ТЗ кодеру?"

да, готов совместными усилиями создать ТЗ. один не смогу.

"ИМХО, это приведёт лишь к увеличению числа возможных вариантов распознавания, никак не повлияв на их процентную достоверность. Для этого просто нет предпосылок: подходов становится больше, но исходные данные-то - одни и те же."

не верно, достоверность от детализации растет, поскольку увеличивается соотношение сигнал/шум, да и подход один и тот же.

"Крылев-то у неё, всё равно останется только два."

у нас задача не крылья считать, а отличить одно крыло от другого с максимальной достоверностью. И чем лучше микроскоп, тем достоверность больше. пример не удачный. Между прочим, по крылу и всю муху можно идентифицировать как уникальную муху. Точно та же история с отпечатками пальцев при идентификации личности, при этом остальные части тела (шаблоны матриц) вообще не нужны оказываются. Работает методика прекрасно, и уже очень давно...

также и 1 от i по одному верхнему кластеру можно распознать с уже высокой точностью, и при этом отбросить массу шаблонов (при заданном классе точности), не прибегая к оценке по суммарным весам, или при качественных незашумленных данных изначально.

[Удален]

25 января 2008, 06:14

#253

поправка:

после выделения объекта в каптче, преобразовывать (поворачивать) объект и приводить его в горизонтальное положение в этой матрице НЕЛЬЗЯ. Следует только выяснить угол поворота и применить его к шаблону, т.е. крутить надо шаблон!

Интересно и выделение самих объектов:

Человек, прежде чем выделить объект, ЗНАЕТ, что нужно выделять в общих чертах.

Это легко можно подтвердить экспериментально, наблюдая за выделением простых, а затем и сложных объяетов: крест, звезда давида, более сложные симметричные фигуры из многогранников, наложенных друг на друга, где мозг выделяет сначала одну палку в иксе, потом один треугольник в звезде давида и т. далее.

Самый интересный опыт с шестеренкой. Попытайтесь найти симметрию и увидеть только часть зубцов, выделив весь объект как отдельную сложную шестеренку с выломанными симметричным образом зубъями. Хорош пример и с Дали, который показывает, как именно происходит выделение и с чего оно начинается. Оно начинается с выделения знакомых закономерностей для конкретного образа в общем виде, который ищем. Это вам не алгоритм оконтуривания в фотожопе по контрасту и апроксимации!!!

В этих опытах возникают достаточно интересные эффекты, позволяющие судить об алгоритме выделения объектов человеком. Связь между пониманием, что ищем, с алгоритмом выделения ОЧЕВИДНА. позже распишу более подробно.

Здесь следует сразу отметить, чтолюди с разными типами структурирования понятийного моножества (куст и дерево), ищут закономерности по разным алгоритмам, поэтому я буду делать методику, основываясь на структуре "дерево", что абсолютному большинству из вас априори будет недоступно для понимания. Ну тут уж звиняйте, для вас будет позже, сначала мой тип.

в подтверждение моих слов о бинарном пути этих алгоритмов, практические тесты психологов на распознавание разных рисунков (при помощи которых, классически как раз и определяется тип мышления специалистами в данной области).

"-Я вижу облака, травку, детишки играют....и кровишша, кровишша" (с) Убийца в бабочке. "трудный ребенок"

370

kimberlit

25 января 2008, 08:17

#254

/ru/forum/comment/2839663

Шизофреники вытесняют копирайтеров )))

[Удален]

25 января 2008, 08:51

#255

у меня появился бесплатный бот, рекламирующий мой контент.

спасибо.

скопируйте мои посты в этой теме на другие ресурсы, буду весьма признателен.

370

kimberlit

25 января 2008, 08:57

#256

tar729:
скопируйте мои посты в этой теме на другие ресурсы, буду весьма признателен.

Неее ... Вдруг вас переманят тогда на другие форумы?

Скучно будет без вас ... Кто веселить всех будет?

Вы редкий клоун, можно даже сказать "уникальный" )))

[Удален]

25 января 2008, 08:57

#257

Как продвигается дело с формализацией потока сознания на каком-нибудь машинном языке?

S

56

solnikolay

25 января 2008, 09:04

#258

shamuey:
Как продвигается дело с формализацией потока сознания на каком-нибудь машинном языке?

У ТС все уже давно формализовалось, осталось только язык какой-нибудь для описания придумать. Хотя можно и без языка обойтись - все равно все вокруг бараны, неучи и прочее и ничего не поймут ;)

[Удален]

25 января 2008, 10:15

#259

выделение объекта:

исходными данными следует считать цель поиска.

в катче мы ищем символы. Следовательно, нужно обозначить общие признаки текста:

размер объектов, толщина линий, количество объектов.

Все эти характеристики либо определяются с некоторой точностью, либо известны заранее с некоторой точностью. Четкие пределы увеличивают степень распознавания образа в целом.

Исходную матрицу каптчи следует просканировать попиксельно и выделить эти общие признаки из всех данных, кроме количества символов (мы его знаем точно. Рассмотрение варианта, когда это не известно, рассмотрим позже)

Определение толщины линии здесь уже описывалось. Рассмотрим определение размера объекта (кегля).

Для этого воспользуемся плавающим окном матрицы, превышающее размерность толщины линии на 10% и запустим скан уже не попиксельно, а покластерно, перемещая окно по диагонали с шагом, равным толщине линии, а затем по столбцам с тем же шагом.

После сканирования, по краям сетки пересечения с указанным шагом, имеем зоны перекрытия.

Эти зоны будут буферизироваться в памяти и участвовать в алгоритме распознавания границ объектов.

10% зона перекрытия нужна для выделения объектов каптчи, которые заходят друг за друга (каптча яндекс). По идее, каптча, выполненная в стиле графити, требует зону перекрытия до 40%, дальше уже графити с перекрытием 50% и человек хрен разберет.

Сканирование осуществляется методом последовательного приближения. Сначала вся матрица сканируется с шагом, равным толщине линии вдоль и поперек, а потом по итогам весов, относящихся к степени центровки окна на части символа, шаг сканирования уменьшается вдвое, затем еще вдвое и до предела (1 пиксел). Таким образом, окно четко фиксирует часть объекта в себе и фиксируются координаты этого кластера и размер окна.

Если объект не шрифт и у него нет такого понятия, как ширина линий, то по умолчанию, последовательное приближение начинается с максимального размера матриц из имеющихся в БД.

Далее, осуществляется поиск соответствия того, что находится в окне с соответствующими по размеру шаблонами. Если совпадений с достаточными весами не находится, осуществляется поворот шаблонных матриц также по методу обратного последовательного приближения, т.е. сначала не на 180, потом 90 град, потом на 45, потом на 24 и т.д, а в обратной последовательности. пока не отыщется наибольшее множество подходящих матриц соответствующего угла наклона. Это и есть весовой коэффициент наклона.

Все выделенные фрагменты с соответствующим углом поворота шаблонов взвешиваются и определяется среднее арифметическое этого угла по отношению к вертикальному. Таким образом, каждый выделенный целый объект (символ) имеет четкое значение угла поворота, которое примениться ко всем шаблонам при дальнейшем распознавании как описывалось в топике.

если угол поворота целого объекта по весам определить не удалось (т.е. веса при повороте оказываются одинаковыми), значит объект считается круглым и остается в исходном виде., при этом классе точности, при ЧБ и при бинарном контрасте. Цветные объекты значительно увеличивают сложность этого алгоритма, поскольку поворот пикселов будет менять веса, не совпадая или совпадая с шаблонными пикселами по цвету.

[Удален]

25 января 2008, 10:16

#260

все сводится к булевым операциям. ложки нет.

Перевести все это в код, вам понятный, сложно, но можно. Конечно, для этого подойдет далеко не каждый кодер, но опыт подобного перевода имеется, причем успешный. разногласий с программистом не было. И не скажу, что это уникальный программист. Я нашел таких 2 человека, которые понимают и с кем можно работать. С обоими положительный опыт.

"все, что нельзя запрограммировать, не может существовать физически" (с) Э. Фредкин

Вышел новый Яндекс Браузер с YandexGPT и YandexART

Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта

распознавание антиботовских картинок