nginx определение бота яндекса

1 23
юни
На сайте с 01.11.2005
Offline
925
#21
myhand:
А зачем вам адрес шлюза, за которым сидит ихняя секретутка?

Ну, та же трассировка, в некоторых чёрных схемах запутанных случаях, может существенно облегчить видение общей картины.

myhand:
Среди этих IP есть куча тех, которые ровно никакого отношения к ботам.

Кроме того, у Яндекса несколько автономок, организаций, роут- и mnt-объектов. Не говоря про нетнеймы с абузными ящиками (кстати, это будет вполне достоверным способом проверки - ручная переписка с NOC'ом по адресам @яндекс (доменов тоже с десяток где-то), дабы они подтвердили принадлежность сети им).

И да, подсети у них не только райповские (к примеру, одна из сеток).

Ladycharm:
Он совершенно не спасает от роботов, проверяющих на клоакинг

От них, подозреваю, вообще ничто не спасёт: первое решение для проверки на клоакинг, приходящее в голову - использовать чужие мощности вместо собственных.

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
Andron_buton
На сайте с 19.07.2007
Offline
270
#22

Самое правильное решение, это делать проверку по юзерагенту средствами нгинкс, а потом проверенный проверять бекрезолвом средствами пхп. В одном проекте так работает, проблем не возникает, и особоумные идут лесом.

L
На сайте с 07.12.2007
Offline
351
#23
myhand:
Поясните. Вы думаете, что реально подделать ptr у ip яндекса?!

Реально подделать prt у своих IP. У тех, которые зареганы на меня, я могу прописать любой ptr.

Классический пример "подделки" был с роботом Рамблера:

nslookup robot8.rambler.ru -> 81.222.64.10

nslookup 81.222.64.10 -> ds701-002.eltel.net

но сейчас DNS уже снят.

Большинство яндексовских IP(включая секретарш) находятся в корпоративном домене yandex (ru/net/com) и будут резолвиться так же как и боты - содержать слово yandex.

Навскидку, из логов:

95.108.137.131, 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_2) AppleWebKit/536.5 (KHTML, like Gecko) YaBrowser/1.1.1084.5409 Chrome/19.1.1084.5409 Safari/536.5'

93.158.155.137, 'Mozilla/5.0 (compatible; YandexMetrika/2.0; +http://yandex.com/bots)'

резолвятся одинаково -> yandex.net -> yandex.ru

А IP из примера юни - вообще не резолвятся и не трассируются на yandex.

Яндексовские проверяльщики на клоакинг ходят через анонимные прокси с IP Корбины и других провайдеров.

PS: Все методы имеют право на жизнь и имеют свои достоинства/недостатки.

А вот, что делать с IP V6??

М
На сайте с 08.09.2006
Offline
223
#24

Поясните, пожалуйста, незнающему.

Обратный резолв, это когда мы берем IP адрес и по этому адресу должен открыться нужный нам домен?

То есть, если все правильно настроено, то проверка на корректный обратный резолв такая:

Берем домен, определяем какой по нему отдается ИП адрес, далее если мы обращаемся к этому ИП адресу напрямую, то в ответе мы должны также получить этот же домен. Все верно? Если мы получаем другой домен, то проверку можем считать неудавшейся.

Не бойся неизбежного... Уже не продаю авто морды...
M
На сайте с 16.09.2009
Offline
278
#25
Ladycharm:
Реально подделать prt у своих IP. У тех, которые зареганы на меня, я могу прописать любой ptr.

Ну и зачем мне эта тупость? Да и это еще бабушка надвое сказала: если зону для ptr поддерживает ваш хостер/провайдер, то они могут и аккуратно относиться к тому, что пишут себе в зону. Если вам разрешали писать "что угодно" - поздравляю, вероятно вы работаете с долбоебами.

Вы расскажите как у яндекса ptr подделать, милейший.

Ladycharm:
Большинство яндексовских IP (включая секретарш) находятся в корпоративном домене yandex (ru/net/com) и будут резолвиться так же как и боты - содержать слово yandex.

Еще одна жертва развалившегося школьного образования? Ты не думай - ты верь! (ц)

А вот если вы *проверите* это утверждение (как список сетей вытащить в картинках рассказали выше) - вы обнаружите, что *большинство* ip не резолвится вовсе.

Маэстро:
Обратный резолв, это когда мы берем IP адрес и по этому адресу должен открыться нужный нам домен?

Грубо говоря, PTR-запись - связывает IP адрес с его каноническим доменным именем.

Абонементное сопровождение серверов (Debian) Отправить личное сообщение (), написать письмо ().
юни
На сайте с 01.11.2005
Offline
925
#26
Ladycharm:
проверяльщики на клоакинг ходят через анонимные прокси

Полагаю, там ручная проверка (либо максимально приближенная к таковой автоматическая), включающая реальный ip, "реальный" браузер с типичным окружением и т.п.

Ladycharm:
что делать с IP V6??

В России доступ к ПС по v6 появится тогда, когда появится безпроблемный пиринг с 50-80 процентами местных операторов (т.е. возрастёт относительная доля v6 в поисковых запросах). До этого момента внедрять поддержку не очень-то рационально.

К примеру, насколько я знаю, сейчас не будет работать та же персонализация, как и не все алгоритмы ранжирования - в Яндексе внутренняя сеть построена на v4 и только найти, какие нужные алгоритмам данные теряются при туннелировании v6/v4, уже потребует некоторого времени.

myhand:
Если вам разрешали писать "что угодно" - поздравляю

Пару лет назад нас знакомили с подобными фокусами (в конце темы даже пример с накруткой есть, кажись). Кроме того, райп тогда ещё не сильно лютовал и вполне можно было взять себе сети на данные, совпадающие с данными любой организации вплоть до закрывающих мантейнеров.

То бишь, если сильно захотеть, то можно прикинуться кем угодно. И распознать чужую сеть получится только после детального анализа маршрутов из разных точек, карты на RIS/робтексе и переписки с аплинками (на предмет объёма трафика, к примеру).

Andron_buton
На сайте с 19.07.2007
Offline
270
#27
myhand:
Ну и зачем мне эта тупость? Да и это еще бабушка надвое сказала: если зону для ptr поддерживает ваш хостер/провайдер, то они могут и аккуратно относиться к тому, что пишут себе в зону. Если вам разрешали писать "что угодно" - поздравляю, вероятно вы работаете с долбоебами.

А толку подделывать, если суть проверки заключается в том, что прямой резолв должен совпадать с обратным и быть в зонах yandex.(net|com|ru), которые принадлежат известно кому. Так что в PTR можно написать что хочешь, но вот как заставить Яндекс сделать парочку А-записей на свои айпи - вот в чем вопрос?

---------- Добавлено 24.12.2012 в 13:01 ----------

myhand:
Ну и зачем мне эта тупость? Да и это еще бабушка надвое сказала: если зону для ptr поддерживает ваш хостер/провайдер, то они могут и аккуратно относиться к тому, что пишут себе в зону. Если вам разрешали писать "что угодно" - поздравляю, вероятно вы работаете с долбоебами.

А толку подделывать, если суть проверки заключается в том, что прямой резолв должен совпадать с обратным и быть в зонах yandex.(net|com|ru), которые принадлежат известно кому. Так что в PTR можно написать что хочешь, но вот как заставить Яндекс сделать парочку А-записей на свои айпи - вот в чем вопрос?

---------- Добавлено 24.12.2012 в 13:08 ----------

Проверка выглядит так:


$config['general']['searchengine'] = false;
if (isset($_SERVER["HTTP_USER_AGENT"]) && preg_match('/Googlebot|YandexBot|Yahoo!\sSlurp/si',$_SERVER["HTTP_USER_AGENT"])) {
$name = gethostbyaddr(func_get_real_ip());
$host = gethostbyname($name);
if (preg_match('/(Googlebot\.com|yandex\.(ru|com|net)|yahoo\.com)$/si',$name)) {
if ($host == func_get_real_ip()){
$config['general']['searchengine'] = true;
}
}
}
M
На сайте с 16.09.2009
Offline
278
#28
Andron_buton:
А толку подделывать, если суть проверки заключается в том, что прямой резолв должен совпадать с обратным и быть в зонах yandex.(net|com|ru), которые принадлежат известно кому. Так что в PTR можно написать что хочешь, но вот как заставить Яндекс сделать парочку А-записей на свои айпи - вот в чем вопрос?

Это тоже, но я тут немного на другое указал: хороший провайдер, который поддерживает PTR для ваших IP - проверяет обратки, которые вы хотите создать.

1 23

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий