Crawl-delay и Яндекс.

123 4
Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#11

Ага, а 1-й класс по чтению проходили? Где в вашем robots.txt 2 минуты?

S2
На сайте с 07.01.2008
Offline
611
#12
mimicunit:
что 21 секунда меньше 2 минут( 2*60=120 секунд )

Ну так, вы ж написали:

Crawl-delay: 2 # задает таймаут в 2 секунды

Вот если бы вы написали:

Crawl-delay: 120 # задает таймаут в 120 секунд.

А робот посещал бы вас раз в 20 секунд, это был бы непорядок, а реже посещать сайты он может.

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
S
На сайте с 28.10.2005
Offline
296
#13
di_max:
Да бы не возникало двойственности, уточню, что НЕ КОРРЕКТНОСТЬ может быть как в сторону уменьшения времени между запросами, так и в сторону увеличения

Нуу, приехали..

M
На сайте с 28.05.2008
Offline
35
#14
Gray:
Ага, а 1-й класс по чтению проходили? Где в вашем robots.txt 2 минуты?

аааааааааа!!!

как я ступил, аж стыдно 😂

s91 - сори 🍻

di_max
На сайте с 27.12.2006
Offline
262
#15

Кто тут логов хотел?

Вот чем занимается "Yandex/1.01.001 (compatible; Win16; I)"?

Это лог с одного сервера


77.88.xxx.yyy 0 [01:26:45] GET
77.88.xxx.yyy 0 [01:26:45] GET
77.88.xxx.yyy 0 [01:26:45] GET
77.88.xxx.yyy 0 [01:26:45] GET
77.88.xxx.yyy 0 [01:26:45] GET
77.88.xxx.yyy 0 [01:26:45] GET
77.88.xxx.yyy 0 [01:26:45] GET
77.88.xxx.yyy 0 [01:26:45] GET
77.88.xxx.yyy 0 [01:26:45] GET
77.88.xxx.yyy 0 [01:26:46] GET
77.88.xxx.yyy 0 [01:26:46] GET
77.88.xxx.yyy 0 [01:26:46] GET
77.88.xxx.yyy 0 [01:26:46] GET
77.88.xxx.yyy 0 [01:26:46] GET
77.88.xxx.yyy 0 [01:26:46] GET

и продолжение:


77.88.xxx.yyy 0 [01:44:50] GET
77.88.xxx.yyy 0 [01:44:50] GET
77.88.xxx.yyy 0 [01:44:51] GET
77.88.xxx.yyy 0 [01:44:51] GET
77.88.xxx.yyy 0 [01:44:52] GET
77.88.xxx.yyy 0 [01:44:53] GET
77.88.xxx.yyy 0 [01:44:53] GET
77.88.xxx.yyy 0 [01:44:54] GET
77.88.xxx.yyy 0 [01:44:54] GET
77.88.xxx.yyy 0 [01:44:55] GET
77.88.xxx.yyy 0 [01:44:55] GET
77.88.xxx.yyy 0 [01:44:56] GET
77.88.xxx.yyy 0 [01:44:56] GET
77.88.xxx.yyy 0 [01:44:57] GET
77.88.xxx.yyy 0 [01:44:57] GET
77.88.xxx.yyy 0 [01:44:58] GET
77.88.xxx.yyy 0 [01:44:58] GET
77.88.xxx.yyy 0 [01:44:59] GET
77.88.xxx.yyy 0 [01:44:59] GET
77.88.xxx.yyy 0 [01:45:00] GET
77.88.xxx.yyy 0 [01:45:00] GET
77.88.xxx.yyy 0 [01:45:01] GET
77.88.xxx.yyy 0 [01:45:01] GET
77.88.xxx.yyy 0 [01:45:02] GET
77.88.xxx.yyy 0 [01:45:02] GET
77.88.xxx.yyy 0 [01:45:03] GET
77.88.xxx.yyy 0 [01:45:03] GET
77.88.xxx.yyy 0 [01:45:04] GET
77.88.xxx.yyy 0 [01:45:04] GET

А чем этот красавец занимается на том же сервере?


213.180.xxx.yyy 0 [05:52:27] GET
213.180.xxx.yyy 0 [05:52:36] GET
213.180.xxx.yyy 0 [05:52:38] GET
213.180.xxx.yyy 0 [05:53:14] GET
213.180.xxx.yyy 0 [05:53:23] GET
213.180.xxx.yyy 0 [05:53:28] GET
213.180.xxx.yyy 0 [05:53:37] GET
213.180.xxx.yyy 0 [05:53:49] GET
213.180.xxx.yyy 0 [05:54:09] GET
213.180.xxx.yyy 0 [05:54:12] GET
213.180.xxx.yyy 0 [05:54:29] GET

Резюме:

Иногда работает, а в основном балду гоняет.;)

PS

25 ноября Гугля, редиска, вдул в 00:38:15 - 1004 запроса.

Сервер выдержал.

Гугля подумал и... решал обидитцо. Вдул в 01:27:28 - 2444 запроса.

Сервер хрипел, сипел...

С натуги сплевывал и

Желтый клык высовывал

(R)емейк

PSS-2

Я это к чему... А то скажут опять, что 6 мысля не видна из даля.

Информация о том сколько доменов на одном IP - информация открытая.

Есть комунальные квартиры и колхозы.

Есть коттед... выделенные сервера, где на 1 IP приходится 1 домен.

Которые способны выдержать хорошу нагрузку.

Почему бы не "прокачивать" по-быстренькому роботу такие и потом заниматься колхозами, свободив ресурсы и расширив паралельные потоки...

Понимаю, что колхозы душить нельзя (несушки сдохнут)

Но и держать в серпе по 2 недели 404 страницы - тож не дело.

А кто виноват, что обновление контента составляет 30-50% в месяц.

(З)аметка на полях.

// Все наши проблемы от нашего не знания...
Talisman13
На сайте с 20.01.2007
Offline
211
#16

di_max, а можно роботсы от всех этих сайтов в студию?

di_max
На сайте с 27.12.2006
Offline
262
#17
Talisman13:
di_max, а можно роботсы от всех этих сайтов в студию?

хм... Или я опять мысль спрятал, но домен (сайт) там один:

Crawl-delay: 0.1

Talisman13
На сайте с 20.01.2007
Offline
211
#18
di_max:
Crawl-delay: 0.1

Сколько в секунде таких 0.1? :)

di_max
На сайте с 27.12.2006
Offline
262
#19
Talisman13:
Сколько в секунде таких 0.1? :)

Это смотря у кого...

У меня - 10, а у Яндекса - 9.;)

А что?

Talisman13
На сайте с 20.01.2007
Offline
211
#20
di_max:
А что?

Как что? Значит обращений в секунду должно быть не более 10.

Где по вашим логам Яндекс делает более 10 запросов в секунду?

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий