https://site.ru/razdel/post-1.html%0A
https://site.ru/razdel/post-2.html%0A
https://site.ru/razdel/post-3.html%0A
%0A - это URL кодировка символа перевода строки.
Возможно где-то в шаблоне генерируются адрес с подстановкой этого значения.
Попробуйте пройтись сканером (типа Frog-ом) по текущей адресации сайта, возможно встретите и обнаружите, где источник.
Вряд ли кто из спамеров будет этим заморачиваться. Им вполне достаточно массовых графических капч на которые они и направляют свои усилия.
А уж варианты ответов, да все возможные для отдельного сайта - это вряд ли, это им совершенно не нужно тратить на это ресурсы.
Здесь соглашусь. Любое неудобство - потенциальная точка отказа. А с ними по коммерческим проектам приходится работать очень плотно. Впрочем и не только по логическим капчам, но и по неразборчивым графическим капчам.
Здесь я не понял - какое кол-во вы решили сбрутить, если порядок элементов может меняться?
Думаю, до человеческого разгадывания в спам целях процесс не дойдет. Слишком дорого и неэффективно.
Это был гипотетический вариант, конечно важно продумать вопрос так (и дополнительно визуализировать), чтобы ответ на вопрос не вызывал затруднений.
Например?
Неприемлемо почему?
Да любая логическая цепочка, например.
"Ручка, карандаш, ластик, кусок торта" - укажите лишний элемент.
Угу. Поэтому для капчи лучше кастомное решение, связанное с логическим решением.
У меня параллельно вопрос - а в чём задумка часть информации выводить на русском, а часть на украинском?
По стартовом вопросу - у вас огромное кол-во неуникальных карточек с шаблонизированной информацией.
В частности, когда в описании товара вы выводите такое,
то зачем ПС индексировать явно вторичную информацию да ещё с отпиской о том, что вы не можете предоставить товару рабочее описание?
Вот и результат.
Воровство вы сможете зафиксировать только тогда, когда ваши статьи будут выдавать за свои причём в полном объёме.
Если пользователь зашёл на ваш сайт в обычном пользовательском режиме и просто позаимствовал абзац, вы об этом скорее всего не узнаете. Равно как и не узнаете, если технически ваши данные выборочно спарсили.
Спамеры, которые работают на потоке они не берутся за написание скриптов под отдельные сайты (если нет заказа на отдельный сайт).
Суть в том, чтобы не пользоваться ширпотреб решением на который спамеры и нацеливаются.
+ дополнительную нагрузку даёт на сайт.
Вы тут совершенно непричём, спамеры охотно занимаются обработкой всех наиболее распространённых капч и затем пишут под них решения. Это вечное противостояние меча и щита.
Неудивительно.
Лучше использовать самописную, но не с отображением результата, а с логикой сравнения (например).
Так в том-то и дело, что зависит от тех задач, которые определены проектом.
Если электронное СМИ (или другое авторитетное издание) имеет свой редакторский отдел и ещё несколько десятков пишущих внештатников, то контент от пользователей для них является лишь периферийным фитбэком - не более, чем реакция на заданную.
А вот пользователи Серча или какого-то другого нишевого комьюнити приходят ради общения, самовыражения и саморекламы. Доля экспертных (или редакторских) материалов (по отношений к общей массе пользовательских постов) может быть крайне мала и/или определяться лишь штучными публикациями на платной основе.
На Серче достаточно лишь одного вопроса и следом под этим вопросом масса пользователей цепляясь за ответы развернут внутри одной темы ещё с десяток других подтем :)
Зависит от специфики.