- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи
И выявили более 7 млн подозрительных пользователей
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
1) там есть список UA.
И что? Я разве писал что там его нет?
2) "по IP" проверять - вам потребуется тогда поддерживать список этих IP. Проверка PTR позволяет легко избежать такого гемороя. Для "быстро" - DNS умеет кешировать.
Зачем мне поддерживать? Этим занимается например ripe. Дело администратора один раз написать не самый сложный скрипт.
Кеш устаревает, а первый запрос всегда медленный. Кроме того, я дурак и не понял как силами nginx реализовать предложенную яндексом схему.
TC - вам пишут как делать правильно, вы должны знать что это 100% яша, раз задача такая, зачем вы противоречите.
И что? Я разве писал что там его нет?
Вы писали "по днс проверять медленно". Но по ссылке речь идет не только о проверке dns.
Зачем мне поддерживать?
Ну, вы же хотите достоверно определить робота? IP меняются и, что гораздо чаще - добавляются.
Этим занимается например ripe. Дело администратора один раз написать не самый сложный скрипт.
И вызывать его с неизвестной заранее периодичностью.
Кеш устаревает, а первый запрос всегда медленный.
Ну так это же не обязательно *ваш* запрос.
Кроме того, я дурак и не понял как силами nginx реализовать предложенную яндексом схему.
Вы сами и ответили на свой вопрос. А вообще - у nginx есть perl и lua. Так что отрезолвить $remote_addr не проблема.
У Яндекса не один IP адерс..
Все его подсети вычислить не трудно. Их не так уж и много.
Вы писали "по днс проверять медленно". Но по ссылке речь идет не только о проверке dns.
И что? Если это вы оправдываетесь за ссылку, то не стоит. Была бы она бесполезной - я бы так и написал.
Ну, вы же хотите достоверно определить робота? IP меняются и, что гораздо чаще - добавляются. И вызывать его с неизвестной заранее периодичностью.
Если совсем немного подумать, то периодичность станет известной. Тем более это не играет никакого значения, ибо даже если на каждого бота заново проверять список (что естественно абсолютно бесполезно) это будет сравнимо по скорости с проверкой по днс.
Ну так это же не обязательно *ваш* запрос.
Не обязательно, но в абсолютном большинстве случаев будет им.
А вообще - у nginx есть perl и lua. Так что отрезолвить $remote_addr не проблема.
Вы бы в самом деле использовали такие костыли?
И ведь яндекс больше любят быстрые сайтики.
---------- Добавлено 22.12.2012 в 00:12 ----------
Все его подсети вычислить не трудно. Их не так уж и много.
Я даже больше скажу - вычислить очень просто.
Вот вам и список. А то товарищ myhand похоже думает что нужно заносить именно адреса ботов, предварительно в поте лица разыскивая их в интернетах. Трудно иначе объяснить как столько простой метод стал геморроем.
Если совсем немного подумать, то периодичность станет известной.
Ну "подумайте", удачи. Кто знает, может вам администраторы яндекса на домашний телефон звонят каждый раз, когда приспичит сменить IP очередному боту.
Но для большинства - это тайна. Когда они будут что-то менять в своем пуле, даже когда просто изменят информацию в своем AS (напр., добавят подсеть) - остается только гадать. Странно что это гадание вы назвали "думать".
Не обязательно, но в абсолютном большинстве случаев будет им.
С чего вдруг? Давайте вы будете доказывать такие спорные утверждения. Я взял из логов достаточно случайного бота - и он оказался в ns.masterhost.ru. и ns.zenon.ru. ЧЯДНТ?
Вы бы в самом деле использовали такие костыли?
Проверка PTR - не "костыль". А необходимость использования - зависит от задачи. Хочет ТС очередную эвристику или точное решение.
И ведь яндекс больше любят быстрые сайтики.
Как вы думаете, сколько по порядку величины занимает времени запрос ptr (не попавший в кэш, конечно)?
Я даже больше скажу - вычислить очень просто.
Вот вам и список.
Наивный малыш. Среди этих IP есть куча тех, которые ровно никакого отношения к ботам. "Абсолютное большинство" (ц).
TC - вам пишут как делать правильно, вы должны знать что это 100% яша, раз задача такая, зачем вы противоречите.
Где я что противоречу?
---------- Добавлено 23.12.2012 в 15:49 ----------
;11234540']Юзер-агент — это не паспорт.
Если к вам подходит человек, а у него на бэйджике написано "Василий", то откуда вам знать правда ли это? :)
Ну только если кто то подделывает User-agent, а для таких пользователей блок также лишнем не будем.
---------- Добавлено 23.12.2012 в 15:50 ----------
.*Yandex.*
А первая точка для чего?
Ну "подумайте", удачи. Кто знает, может вам администраторы яндекса на домашний телефон звонят каждый раз, когда приспичит сменить IP очередному боту.
Мда, а товарищ myhand действительно думает что нужно заносить именно адреса ботов 😂
Давайте вы будете доказывать такие спорные утверждения. Я взял из логов достаточно случайного бота - и он оказался в ns.masterhost.ru. и ns.zenon.ru.
Давайте и вы будете. А то я взял из логов достаточно случайного бота - и его не оказалось в нс лизвеба и топнета.
Проверка PTR - не "костыль".
Там я писал больше про преложенную вами реализацию.
Как вы думаете, сколько по порядку величины занимает времени запрос ptr (не попавший в кэш, конечно)?
Такой большой, а не можешь сам узнать? Держи - http://ping-admin.ru/free_test/result/1356269927lhdx11zxnkb847c34ydfb.html
Наивный малыш. Среди этих IP есть куча тех, которые ровно никакого отношения к ботам. "Абсолютное большинство" (ц).
Я писал, что нужно проверять по юзер агенту и IP.
"Мораль: читай, что тебе пишут до конца, а потом комментируй." (ц)
Так что прекращай газировать лужу и веди себя нормально.
Проверка PTR - не "костыль".
Костыль. Он совершенно не спасает от роботов, проверяющих на клоакинг, поэтому ничем не лучше использования IP подсетей.
Наивный малыш. Среди этих IP есть куча тех, которые ровно никакого отношения к ботам. "Абсолютное большинство" (ц).
И чем это мешает решению задачи? Какая разница - бот это лезет, или модератор Яндекса?
И что, есть какая-то гарантия, что PTR у них не будет содержать слово yandex?
Мда, а товарищ myhand действительно думает что нужно заносить именно адреса ботов 😂
А зачем вам адрес шлюза, за которым сидит ихняя секретутка?
Давайте и вы будете. А то я взял из логов достаточно случайного бота - и его не оказалось в нс лизвеба и топнета.
Нет проблем, малыш (@dnscache.masterhost.ru):
...
;; Query time: 3 msec
...
$ dig -x 178.154.243.111
...
;; Query time: 3 msec
...
Жду ответа на заданный ранее вопрос.
Такой большой, а не можешь сам узнать?
Могу (и более того - знаю), но интересует меня - ваша оценка. Пожалуйста, выдайте ее. В абсолютных числах, в процентах - как сумеете, на многое от вас я не расчитываю. Статистику, а не результат отдельной проверки.
И лучше, конечно, в качестве примера брать более типовой сайт, нежели xml.yandex.ru. Надеюсь, сумеете сообразить почему?
Я писал, что нужно проверять по юзер агенту и IP.
Я прекрасно это помню.
Вся проблема - как вы реализуете эту проверку по IP. Я предлагаю - делать так, как написано в документации. Вы - собрать все подсети яндекса из ripe и не париться.
Костыль. Он совершенно не спасает от роботов, проверяющих на клоакинг, поэтому ничем не лучше использования IP подсетей.
Поясните. Вы думаете, что реально подделать ptr у ip яндекса?!
И чем это мешает решению задачи? Какая разница - бот это лезет, или модератор Яндекса?
А что, кроме модераторов и поисковых ботов - там нет и ничего быть не может?
И что, есть какая-то гарантия, что PTR у них не будет содержать слово yandex?
Есть, конечно. Документация.