- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
написал же конкретно все.
Если множество человек говорят Вам о своём непонимании, то наверное, корректность всё же хромает?
Предположить всех за недоумков будет, конечно, лёгким объяснением - но гения, безусловно, недостойным. ;) Куда более конструктивен путь сближения позиций, через нахождение общего языка (что я и пытаюсь сделать, общаясь). Согласны?
мы просто здесь определяем, что такое шум с нашей мысленной точки зрения.
Но как это алгоритмизировать? Готовы здесь выложить ТЗ кодеру?
При низком коэффициенте соответствия, алгоритм перейдет к более детальному анализу и увеличению числа задействованных матриц.
ИМХО, это приведёт лишь к увеличению числа возможных вариантов распознавания, никак не повлияв на их процентную достоверность. Для этого просто нет предпосылок: подходов становится больше, но исходные данные-то - одни и те же.
Какая разница, исследовать муху под лупой, обычным, или электронным микроскопом? Крылев-то у неё, всё равно останется только два.
Если множество человек говорят Вам о своём непонимании, то наверное, корректность всё же хромает?
писал 2 раза и указывал конкретное число 10*2413 (на память)
"Предположить всех за недоумков будет, конечно, лёгким объяснением - но гения, безусловно, недостойным. ;)"
я не гений, я Евгений (дубль 3)
"Куда более конструктивен путь сближения позиций, через нахождение общего языка (что я и пытаюсь сделать, общаясь). Согласны?"
безусловно. на себе ответное увеличение конструктива с моей стороны не замечаете?
"Но как это алгоритмизировать? Готовы здесь выложить ТЗ кодеру?"
да, готов совместными усилиями создать ТЗ. один не смогу.
"ИМХО, это приведёт лишь к увеличению числа возможных вариантов распознавания, никак не повлияв на их процентную достоверность. Для этого просто нет предпосылок: подходов становится больше, но исходные данные-то - одни и те же."
не верно, достоверность от детализации растет, поскольку увеличивается соотношение сигнал/шум, да и подход один и тот же.
"Крылев-то у неё, всё равно останется только два."
у нас задача не крылья считать, а отличить одно крыло от другого с максимальной достоверностью. И чем лучше микроскоп, тем достоверность больше. пример не удачный. Между прочим, по крылу и всю муху можно идентифицировать как уникальную муху. Точно та же история с отпечатками пальцев при идентификации личности, при этом остальные части тела (шаблоны матриц) вообще не нужны оказываются. Работает методика прекрасно, и уже очень давно...
также и 1 от i по одному верхнему кластеру можно распознать с уже высокой точностью, и при этом отбросить массу шаблонов (при заданном классе точности), не прибегая к оценке по суммарным весам, или при качественных незашумленных данных изначально.
поправка:
после выделения объекта в каптче, преобразовывать (поворачивать) объект и приводить его в горизонтальное положение в этой матрице НЕЛЬЗЯ. Следует только выяснить угол поворота и применить его к шаблону, т.е. крутить надо шаблон!
Интересно и выделение самих объектов:
Человек, прежде чем выделить объект, ЗНАЕТ, что нужно выделять в общих чертах.
Это легко можно подтвердить экспериментально, наблюдая за выделением простых, а затем и сложных объяетов: крест, звезда давида, более сложные симметричные фигуры из многогранников, наложенных друг на друга, где мозг выделяет сначала одну палку в иксе, потом один треугольник в звезде давида и т. далее.
Самый интересный опыт с шестеренкой. Попытайтесь найти симметрию и увидеть только часть зубцов, выделив весь объект как отдельную сложную шестеренку с выломанными симметричным образом зубъями. Хорош пример и с Дали, который показывает, как именно происходит выделение и с чего оно начинается. Оно начинается с выделения знакомых закономерностей для конкретного образа в общем виде, который ищем. Это вам не алгоритм оконтуривания в фотожопе по контрасту и апроксимации!!!
В этих опытах возникают достаточно интересные эффекты, позволяющие судить об алгоритме выделения объектов человеком. Связь между пониманием, что ищем, с алгоритмом выделения ОЧЕВИДНА. позже распишу более подробно.
Здесь следует сразу отметить, чтолюди с разными типами структурирования понятийного моножества (куст и дерево), ищут закономерности по разным алгоритмам, поэтому я буду делать методику, основываясь на структуре "дерево", что абсолютному большинству из вас априори будет недоступно для понимания. Ну тут уж звиняйте, для вас будет позже, сначала мой тип.
в подтверждение моих слов о бинарном пути этих алгоритмов, практические тесты психологов на распознавание разных рисунков (при помощи которых, классически как раз и определяется тип мышления специалистами в данной области).
"-Я вижу облака, травку, детишки играют....и кровишша, кровишша" (с) Убийца в бабочке. "трудный ребенок"
/ru/forum/comment/2839663
Шизофреники вытесняют копирайтеров )))
у меня появился бесплатный бот, рекламирующий мой контент.
спасибо.
скопируйте мои посты в этой теме на другие ресурсы, буду весьма признателен.
скопируйте мои посты в этой теме на другие ресурсы, буду весьма признателен.
Неее ... Вдруг вас переманят тогда на другие форумы?
Скучно будет без вас ... Кто веселить всех будет?
Вы редкий клоун, можно даже сказать "уникальный" )))
Как продвигается дело с формализацией потока сознания на каком-нибудь машинном языке?
Как продвигается дело с формализацией потока сознания на каком-нибудь машинном языке?
У ТС все уже давно формализовалось, осталось только язык какой-нибудь для описания придумать. Хотя можно и без языка обойтись - все равно все вокруг бараны, неучи и прочее и ничего не поймут ;)
выделение объекта:
исходными данными следует считать цель поиска.
в катче мы ищем символы. Следовательно, нужно обозначить общие признаки текста:
размер объектов, толщина линий, количество объектов.
Все эти характеристики либо определяются с некоторой точностью, либо известны заранее с некоторой точностью. Четкие пределы увеличивают степень распознавания образа в целом.
Исходную матрицу каптчи следует просканировать попиксельно и выделить эти общие признаки из всех данных, кроме количества символов (мы его знаем точно. Рассмотрение варианта, когда это не известно, рассмотрим позже)
Определение толщины линии здесь уже описывалось. Рассмотрим определение размера объекта (кегля).
Для этого воспользуемся плавающим окном матрицы, превышающее размерность толщины линии на 10% и запустим скан уже не попиксельно, а покластерно, перемещая окно по диагонали с шагом, равным толщине линии, а затем по столбцам с тем же шагом.
После сканирования, по краям сетки пересечения с указанным шагом, имеем зоны перекрытия.
Эти зоны будут буферизироваться в памяти и участвовать в алгоритме распознавания границ объектов.
10% зона перекрытия нужна для выделения объектов каптчи, которые заходят друг за друга (каптча яндекс). По идее, каптча, выполненная в стиле графити, требует зону перекрытия до 40%, дальше уже графити с перекрытием 50% и человек хрен разберет.
Сканирование осуществляется методом последовательного приближения. Сначала вся матрица сканируется с шагом, равным толщине линии вдоль и поперек, а потом по итогам весов, относящихся к степени центровки окна на части символа, шаг сканирования уменьшается вдвое, затем еще вдвое и до предела (1 пиксел). Таким образом, окно четко фиксирует часть объекта в себе и фиксируются координаты этого кластера и размер окна.
Если объект не шрифт и у него нет такого понятия, как ширина линий, то по умолчанию, последовательное приближение начинается с максимального размера матриц из имеющихся в БД.
Далее, осуществляется поиск соответствия того, что находится в окне с соответствующими по размеру шаблонами. Если совпадений с достаточными весами не находится, осуществляется поворот шаблонных матриц также по методу обратного последовательного приближения, т.е. сначала не на 180, потом 90 град, потом на 45, потом на 24 и т.д, а в обратной последовательности. пока не отыщется наибольшее множество подходящих матриц соответствующего угла наклона. Это и есть весовой коэффициент наклона.
Все выделенные фрагменты с соответствующим углом поворота шаблонов взвешиваются и определяется среднее арифметическое этого угла по отношению к вертикальному. Таким образом, каждый выделенный целый объект (символ) имеет четкое значение угла поворота, которое примениться ко всем шаблонам при дальнейшем распознавании как описывалось в топике.
если угол поворота целого объекта по весам определить не удалось (т.е. веса при повороте оказываются одинаковыми), значит объект считается круглым и остается в исходном виде., при этом классе точности, при ЧБ и при бинарном контрасте. Цветные объекты значительно увеличивают сложность этого алгоритма, поскольку поворот пикселов будет менять веса, не совпадая или совпадая с шаблонными пикселами по цвету.
все сводится к булевым операциям. ложки нет.
Перевести все это в код, вам понятный, сложно, но можно. Конечно, для этого подойдет далеко не каждый кодер, но опыт подобного перевода имеется, причем успешный. разногласий с программистом не было. И не скажу, что это уникальный программист. Я нашел таких 2 человека, которые понимают и с кем можно работать. С обоими положительный опыт.
"все, что нельзя запрограммировать, не может существовать физически" (с) Э. Фредкин