Как защитить данные сайта от распознавальщиков Captcha?

V1
На сайте с 14.03.2007
Offline
158
967

Здравствуйте.

Данные расчета с формы на моем сайте кем-то скачиваются. Поставил свою капчу и проверил - корректно ее проходят. (Сначала была выбор рисунка, потом ввод текста с рисунка и сейчас еще поставил на математические вычисления). Возможно это какие-то сервисы по разгадыванию капчи. Понятно, что если это так, то 100% защиты нет.

Что можно сделать, чтобы им было более затратно заниматься этим? (гугл и другие капчи не вариант. Посмотрел сервисы по разгадыванию капчи, так там по многим капчам есть услуги)

Наверное еще можно сделать доступ к расчетам на сайте после регистрации. Но это много посетителей отсеет. А также вопрос по регистрации: Боты или те кто занимается скачиванием наверное также смогут зарегистрироваться и скачивать под своим аккаунтом? Такое возможно? Как защититься в этом случае?

Кто в теме по защите данных, подскажите пожалуйста. Где есть актуальная информация по этому вопросу?

2 ай пи заблокировал - сегодня появилось с 3 (2 ip4, 1 - ip6)

2001:41d0:701:1000::229f - - [25/Sep/2023:14:57:46 +0300] "GET /captcha.php?r=705 HTTP/2.0" 200 22220 "https://....html" "Mozilla/5.0 (Linux; Android 10; K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Mobile Safari/537.36"
2001:41d0:701:1000::229f - - [25/Sep/2023:14:57:46 +0300] "POST /index_js.php HTTP/2.0" 200 1851 "https://....html" "Mozilla/5.0 (Linux; Android 10; K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Mobile Safari/537.36"
2001:41d0:701:1000::229f - - [25/Sep/2023:14:57:31 +0300] "GET /captcha.php?r=726 HTTP/2.0" 200 21537 "https://....html" "Mozilla/5.0 (Linux; Android 10; K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Mobile Safari/537.36"
2001:41d0:701:1000::229f - - [25/Sep/2023:14:57:31 +0300] "POST /index_js.php HTTP/2.0" 200 1850 "https://....html" "Mozilla/5.0 (Linux; Android 10; K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Mobile Safari/537.36"
2001:41d0:701:1000::229f - - [25/Sep/2023:14:57:11 +0300] "GET /captcha.php?r=951 HTTP/2.0" 200 22398 "https://....html" "Mozilla/5.0 (Linux; Android 10; K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Mobile Safari/537.36"
2001:41d0:701:1000::229f - - [25/Sep/2023:14:57:10 +0300] "POST /index_js.php HTTP/2.0" 200 1836 "https://....html" "Mozilla/5.0 (Linux; Android 10; K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Mobile Safari/537.36"

54.37.79.71 - - [25/Sep/2023:14:40:11 +0300] "GET /captcha.php?r=645 HTTP/2.0" 200 22910 "https://.....html" "Mozilla/5.0 (Linux; Android 10; K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Mobile Safari/537.36"
54.37.79.71 - - [25/Sep/2023:14:40:11 +0300] "POST /index_js.php HTTP/2.0" 200 1858 "https://....html" "Mozilla/5.0 (Linux; Android 10; K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Mobile Safari/537.36"
54.37.79.71 - - [25/Sep/2023:14:39:52 +0300] "GET /captcha.php?r=160 HTTP/2.0" 200 22717 "https://....html" "Mozilla/5.0 (Linux; Android 10; K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Mobile Safari/537.36"
54.37.79.71 - - [25/Sep/2023:14:39:51 +0300] "POST /index_js.php HTTP/2.0" 200 1862 "https://....html" "Mozilla/5.0 (Linux; Android 10; K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Mobile Safari/537.36"


Devvver
На сайте с 02.07.2008
Offline
673
#1
Не выкладывать информацию в интернет. Все что будет выложено - все будет выкачано. Борьба с ветряными мельницами.
Мой блог. Все о создании сайтов,Seo и СДЛ ( https://devvver.ru/ ) Мой SEO телеграм канал https://t.me/seobloggers
V1
На сайте с 14.03.2007
Offline
158
#2
Devvver #:
Не выкладывать информацию в интернет. Все что будет выложено - все будет выкачано. Борьба с ветряными мельницами.

Это понятно. Но как усложнить им задачу, чтобы обходилось дороже? Ведь по расценкам там на распознавание капчи около доллара за 1000 шт. Обидно когда просто берет расчеты с твоего сайта и использует на своем в реальном времени.

Вот результат математической капчи именно для этого ай пи:

Какая вообще у них логика работы? Встраивает такую же форму у себя на сайте, получает изображение капчи и отправляет по api на сервис распознавания, получает код и отправляет данные формы на мой сайт, а потом парсит выдачу моей страницы? В какой момент можно как-то прервать/заторможить и т.д. это?

OK_MC! /  16:27:43 / 3
OK_MC! /  16:28:33 / 4
OK_MC! /  16:28:52 / 9
OK_MC! /  16:29:13 / 10
OK_MC! /  16:29:40 / 3
Protection. Error. Invalid code.<br> 16:29:58 / 5
OK_MC! /  16:30:06 / 2
OK_MC! /  16:30:33 / 7
OK_MC! /  16:30:51 / 7
OK_MC! /  16:31:11 / 2
OK_MC! /  16:31:53 / 7
OK_MC! /  16:33:33 / 3
OK_MC! /  16:33:54 / 7
OK_MC! /  16:34:27 / 2
OK_MC! /  16:36:53 / 4
Protection. Error. Invalid code.<br> 16:37:36 / 10
Error. You're making a lot of requests. Repeat after some time. <span class="ts22 t-blue">(10 sec.)</span><br> 16:37:43 / 3
OK_MC! /  16:38:19 / 7
OK_MC! /  16:39:32 / 2
OK_MC! /  16:39:48 / 10
OK_MC! /  16:40:23 / 2
OK_MC! /  16:40:47 / 4
OK_MC! /  16:43:28 / 3
Vladimir
На сайте с 07.06.2004
Offline
563
#3
vitaliy11 #:

Какая вообще у них логика работы? Встраивает такую же форму у себя на сайте, получает изображение капчи и отправляет по api на сервис распознавания, получает код и отправляет данные формы на мой сайт, а потом парсит выдачу моей страницы? В какой момент можно как-то прервать/заторможить и т.д. это?

Зачем данные нужны? Развернуть такой же сервис на стороннем сайте?

Может простой iframe?  Ни  форму, ни данные не надо парсить, сами приходят и на чужом сайте показываются


Аэройога ( https://vk.com/aeroyogadom ) Йога в гамаках ( https://vk.com/aero_yoga ) Аэройога обучение ( https://aeroyoga.ru ) и просто фото ( https://weandworld.com )
Devvver
На сайте с 02.07.2008
Offline
673
#4
Vladimir #:
Может простой iframe? 

Кстати да, в таком случае капчу люди будут легко проходить.

vitaliy11 #:
Обидно когда просто берет расчеты с твоего сайта и использует на своем в реальном времени.

Что у вас там за расчеты? Примерно тематику.


V1
На сайте с 14.03.2007
Offline
158
#5
Vladimir #:
Может простой iframe?  Ни  форму, ни данные не надо парсить, сами приходят и на чужом сайте показываются

В .htaccess стоит <IfModule mod_headers.c>Header set X-Frame-Options "DENY"</IfModule>

Проверил, просто через iframe сайт не подгружается. Может через php (file_get_contents) ?

V1
На сайте с 14.03.2007
Offline
158
#6
Devvver #:
Кстати да, в таком случае капчу люди будут легко проходить.

Если все же через iframe, то можно что-то сделать?

Devvver #:
Что у вас там за расчеты? Примерно тематику.

Астрология (уникальный контент). Конкретно сейчас идут эти запросы на 1 страницу EN (запрос популярный, но я далеко не в топе.  Если подобный запрос в Яндексе, то где-то 130 тыс. запросов в месяц).

С 17-30 до 18-00 снова с одного ай пи 25 обращений. И математическую капчу уже без ошибок проходят )

V1
На сайте с 14.03.2007
Offline
158
#7

Проверил варианты:

1) Если загрузить через iframe, то отправка капчи не работает в таком варианте (форма не отправляется).

2) Если загрузить страницу сайта на другой домен через php file_get_contents , то даже рисунок капчи не показывается.

Возможно такой вариант:

1) Загружают captcha.php, где формируется рисунок с заданием и записывается в сессию. Отправляется на сервис для разгадывания капчи (автоматично или в ручном режиме). Пока пользователь заполняет данные формы, приходит ответ.

2) Вызывается файл обработчик index_js.php куда методом POST передаются данные и код из капчи.

SeVlad
На сайте с 03.11.2008
Offline
1609
#8
vitaliy11 :

Как защитить данные сайта от распознавальщиков Captcha?

Не использовать капчи. Ваш КЭП :)

Для защиты форм есть разные методы, человечные, а не это насилие и социнженерия.

Может посмотреть отсюда и чуть ниже.

Если это не целенаправленный спам, то пройдет антибот - Безопасность - Сайтостроение
Если это не целенаправленный спам, то пройдет антибот - Безопасность - Сайтостроение
  • 2023.09.25
  • searchengines.guru
Ну с тройной защитой я не пробовал А так вообще черт их разберет. При необходимости не сложно ж и добавить еще несколько уровней на js. Но пока плаг с этими 3мя уровнями на борту вполне справляется. Ресурсы и 3й уже могут сделать автоспам напрочь нецелесообразным
Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
TheVS
На сайте с 27.12.2006
Offline
445
#9
Посчитайте сколько примерно вычислений нужно обычному пользователю, после превышения этого порога выдавайте неверный результат без капчей и блоков.
🍄 Финансовая партнёрская программа для вебмастеров и блогеров: https://bit.ly/finance_pp
V1
На сайте с 14.03.2007
Offline
158
#10
SeVlad #:
Для защиты форм есть разные методы, человечные, а не это насилие и социнженерия.

Я так понял, что там дискуссия о ботах. Но у меня идет целенаправленное - человеком. Ботам это и нафиг не нужно ) Данные вообще без перезагрузки страницы через JS fetch() отправляются.

TheVS #:
Посчитайте сколько примерно вычислений нужно обычному пользователю, после превышения этого порога выдавайте неверный результат без капчей и блоков.

Ну так они просто передадут POST запросом данные на исполняющий файл и получат результат расчета (они же получают данные со своей формы по шаблону моей, которую заполняет пользователь, так что время заполнения - это не вариант).

Есть одна идея, но не знаю получится или нет. Если завтра допишу код, то попробую что будет

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий