vitaliy11

Рейтинг
174
Регистрация
14.03.2007
SeVlad #:
Это и есть бот. Вот от подобных ботов тебе и надо защищаться. А кто там на другом конце бота - дело десятое  и не твоя забота.

Конечно может и такое быть. Только не пойму зачем ему разгадывать капчу? Да еще и правильно )

Можно конечно добавить скрытое поле и посмотреть что будет.

SeVlad #:
Т.е. ты абсолютно уверен, что это реальный человек загружает страницу и там в браузере что-то делает, да так что тебя это напрягает? Я почти уверен, что  ты ошибаешься. Да и ты сам не уверен, тк в старпосте уже упомянул ботов.

Я не говорю что это 1 человек.

Предполагаю что это сделан какой-то сервис (куда могут заходить разные люди), пользователи заполняют форму на подобие моей и при отправке этот сервис идет на мой управляющий файл и передает туда данные пост для получения расчета (перед этим разгадывает капчу).

Не может 1 человек отправлять данные каждые 30-60 сек. на протяжении длительного времени (один и тот же ай пи).

Вот вчера вечером поставил сбор данных по 1 ай пи (как видите, почти все капчи разгаданы. да не почти, а все; просто пару раз сработала защита по времени):

Сегодня то же самое только с другого ай пи:

10:22:51   210.14.96.197 (Yangon) 

10:21:59   210.14.96.197 (Yangon) 

10:21:29   210.14.96.197 (Yangon)

10:20:54   210.14.96.197 (Yangon) и т.д.


OK_MC! /  19:02:21 / 2
OK_MC! /  19:02:44 / 3
OK_MC! /  19:03:41 / 2
OK_MC! /  19:04:29 / 13
OK_MC! /  19:05:12 / 2
OK_MC! /  19:05:49 / 11
OK_MC! /  19:13:42 / 5
OK_MC! /  19:14:46 / 3
OK_MC! /  19:15:01 / 3
OK_MC! /  19:18:18 / 2
OK_MC! /  19:18:30 / 12
OK_MC! /  19:19:41 / 3
OK_MC! /  19:19:58 / 8
OK_MC! /  19:20:23 / 13
OK_MC! /  19:22:34 / 3
OK_MC! /  19:22:48 / 6
OK_MC! /  19:23:38 / 5
OK_MC! /  19:25:53 / 5
OK_MC! /  19:27:00 / 12
OK_MC! /  19:27:37 / 3
OK_MC! /  19:29:04 / 13
OK_MC! /  19:30:00 / 3
OK_MC! /  19:30:36 / 6
Error. You're making a lot of requests. Repeat after some time. <span class="ts22 t-blue">(10 sec.)</span><br> 19:30:44 / 6
OK_MC! /  19:31:30 / 11
OK_MC! /  19:32:21 / 2
OK_MC! /  19:34:04 / 8
OK_MC! /  19:34:43 / 2
OK_MC! /  19:35:18 / 3
OK_MC! /  19:35:39 / 12
OK_MC! /  19:36:00 / 2
OK_MC! /  19:36:32 / 5
OK_MC! /  19:38:23 / 3
OK_MC! /  19:38:58 / 3
OK_MC! /  19:39:33 / 3
OK_MC! /  19:39:58 / 6
OK_MC! /  19:40:28 / 12
OK_MC! /  19:42:42 / 3
OK_MC! /  19:43:18 / 2
OK_MC! /  19:44:05 / 2
Error. You're making a lot of requests. Repeat after some time. <span class="ts22 t-blue">(10 sec.)</span><br> 19:44:13 / 11
OK_MC! /  19:48:45 / 13
OK_MC! /  19:49:24 / 11
OK_MC! /  19:50:04 / 2
OK_MC! /  19:50:27 / 3
OK_MC! /  19:51:54 / 5
OK_MC! /  19:52:37 / 13
OK_MC! /  19:53:42 / 3
OK_MC! /  19:54:14 / 2
OK_MC! /  19:54:34 / 3
OK_MC! /  20:01:27 / 3
OK_MC! /  20:01:43 / 2
OK_MC! /  20:02:24 / 2
OK_MC! /  20:02:54 / 2
OK_MC! /  20:03:40 / 3
OK_MC! /  20:03:56 / 3
OK_MC! /  20:05:46 / 2
OK_MC! /  20:06:09 / 6
OK_MC! /  20:09:45 / 6
OK_MC! /  20:10:11 / 3
OK_MC! /  20:10:31 / 13
OK_MC! /  20:11:02 / 5
OK_MC! /  20:12:16 / 3
OK_MC! /  20:14:26 / 3
OK_MC! /  20:14:47 / 6
OK_MC! /  20:16:17 / 8
OK_MC! /  20:16:42 / 8
OK_MC! /  20:44:47 / 5
OK_MC! /  20:45:59 / 12
OK_MC! /  20:46:31 / 3
OK_MC! /  20:47:08 / 2
OK_MC! /  20:47:51 / 2
OK_MC! /  20:58:23 / 2
OK_MC! /  20:59:48 / 3
OK_MC! /  21:00:08 / 13
OK_MC! /  21:00:26 / 3
OK_MC! /  21:00:52 / 13
OK_MC! /  21:01:04 / 8
Error. You're making a lot of requests. Repeat after some time. <span class="ts22 t-blue">(10 sec.)</span><br> 21:01:15 / 5
OK_MC! /  21:01:50 / 2
OK_MC! /  21:02:38 / 11
OK_MC! /  21:08:06 / 8
OK_MC! /  21:47:29 / 3
OK_MC! /  22:37:10 / 12
OK_MC! /  22:37:37 / 8
OK_MC! /  22:38:53 / 11
OK_MC! /  22:39:23 / 2
SeVlad #:
Для защиты форм есть разные методы, человечные, а не это насилие и социнженерия.

Я так понял, что там дискуссия о ботах. Но у меня идет целенаправленное - человеком. Ботам это и нафиг не нужно ) Данные вообще без перезагрузки страницы через JS fetch() отправляются.

TheVS #:
Посчитайте сколько примерно вычислений нужно обычному пользователю, после превышения этого порога выдавайте неверный результат без капчей и блоков.

Ну так они просто передадут POST запросом данные на исполняющий файл и получат результат расчета (они же получают данные со своей формы по шаблону моей, которую заполняет пользователь, так что время заполнения - это не вариант).

Есть одна идея, но не знаю получится или нет. Если завтра допишу код, то попробую что будет

Проверил варианты:

1) Если загрузить через iframe, то отправка капчи не работает в таком варианте (форма не отправляется).

2) Если загрузить страницу сайта на другой домен через php file_get_contents , то даже рисунок капчи не показывается.

Возможно такой вариант:

1) Загружают captcha.php, где формируется рисунок с заданием и записывается в сессию. Отправляется на сервис для разгадывания капчи (автоматично или в ручном режиме). Пока пользователь заполняет данные формы, приходит ответ.

2) Вызывается файл обработчик index_js.php куда методом POST передаются данные и код из капчи.

Devvver #:
Кстати да, в таком случае капчу люди будут легко проходить.

Если все же через iframe, то можно что-то сделать?

Devvver #:
Что у вас там за расчеты? Примерно тематику.

Астрология (уникальный контент). Конкретно сейчас идут эти запросы на 1 страницу EN (запрос популярный, но я далеко не в топе.  Если подобный запрос в Яндексе, то где-то 130 тыс. запросов в месяц).

С 17-30 до 18-00 снова с одного ай пи 25 обращений. И математическую капчу уже без ошибок проходят )

Vladimir #:
Может простой iframe?  Ни  форму, ни данные не надо парсить, сами приходят и на чужом сайте показываются

В .htaccess стоит <IfModule mod_headers.c>Header set X-Frame-Options "DENY"</IfModule>

Проверил, просто через iframe сайт не подгружается. Может через php (file_get_contents) ?

Devvver #:
Не выкладывать информацию в интернет. Все что будет выложено - все будет выкачано. Борьба с ветряными мельницами.

Это понятно. Но как усложнить им задачу, чтобы обходилось дороже? Ведь по расценкам там на распознавание капчи около доллара за 1000 шт. Обидно когда просто берет расчеты с твоего сайта и использует на своем в реальном времени.

Вот результат математической капчи именно для этого ай пи:

Какая вообще у них логика работы? Встраивает такую же форму у себя на сайте, получает изображение капчи и отправляет по api на сервис распознавания, получает код и отправляет данные формы на мой сайт, а потом парсит выдачу моей страницы? В какой момент можно как-то прервать/заторможить и т.д. это?

OK_MC! /  16:27:43 / 3
OK_MC! /  16:28:33 / 4
OK_MC! /  16:28:52 / 9
OK_MC! /  16:29:13 / 10
OK_MC! /  16:29:40 / 3
Protection. Error. Invalid code.<br> 16:29:58 / 5
OK_MC! /  16:30:06 / 2
OK_MC! /  16:30:33 / 7
OK_MC! /  16:30:51 / 7
OK_MC! /  16:31:11 / 2
OK_MC! /  16:31:53 / 7
OK_MC! /  16:33:33 / 3
OK_MC! /  16:33:54 / 7
OK_MC! /  16:34:27 / 2
OK_MC! /  16:36:53 / 4
Protection. Error. Invalid code.<br> 16:37:36 / 10
Error. You're making a lot of requests. Repeat after some time. <span class="ts22 t-blue">(10 sec.)</span><br> 16:37:43 / 3
OK_MC! /  16:38:19 / 7
OK_MC! /  16:39:32 / 2
OK_MC! /  16:39:48 / 10
OK_MC! /  16:40:23 / 2
OK_MC! /  16:40:47 / 4
OK_MC! /  16:43:28 / 3
bobolab #:
у меня один сайт под бурж на ру хостинге с клаудом... а второй в америке с клаудом...  один фик.... 

А Вы клауд платный тариф используете? На бесплатном будут проблемы с доступностью сайта?

KeicH2O #:
APO нужно подключить за 5 баксов, чтобы все пучком было.

А что это такое? Как расшифровывается?

KeicH2O #:
Тем более, если  CF-Cache-Status: HIT, то ответ уменьшается в разы, а HIT не бывает при первом заходе на страницу, когда будет генерироваться страница при первом заходе, она будет  отдаваться в CF кэша, после чего будет HIT.

Если же страница будет в кэше CF, то все равно для последующих пользователей она будет браться оттуда.

SeVlad #:
Неправда, ни про какую "первую страницу" речи не было. Про "быстрее загружалась" тоже.

Вот писал: " Плюс только в том что при первом заходе и тогда когда не проводятся расчеты сайт по идее должен быстрее открываться в разных частях планеты. "

Я не силен в администрировании серверов. Немного начал читать о AWS, но мне кажется что может быть больше проблем, чем профита ))

В принципе на текущем хостинге написано, что у них прямое подключение ко многим операторам связи в мире. Да и сайт сейчас быстро открывается.

Если сделать такое, то это даст какое-то преимущество в скорости или не нужно мучиться?

1) Сделать кэш страниц (физически разместить html страницы на сайте), чтобы сервер отдавал без пхп обработчика. (Ну и естественно настрой кэширования статики.  Сейчас сайт также работает через OPcache)

2) И такой интересный вопрос: Так как при расчетах УРЛ не меняется (результаты отображаются на том же УРЛ, что и форма), то при кэшировании нужно в .htaccess сделать проверки на POST запрос (если такой есть то отправляем на index.php иначе на кэш страницы). Или, хочу так попробовать сделать, отображать результат без перезагрузки страницы через JS. В таком случае будет меньше в статистике просмотров страниц. Это кажется не должно быть проблемой для Гугла. Или я ошибаюсь?

Всего: 663