Спутник игнорирует robots.txt

12
Сергей Кизим
На сайте с 05.03.2006
Offline
159
2357

Конструкция вида Disallow: /stranica.html? не помогает защититься от ползанья бота Спутника по страницам вида stranica.html?p=jhdfhfd. И что прикажете с ним делать? Банить по IP только?

---------- Добавлено 29.07.2014 в 09:34 ----------

И, кстати, такая вещь тоже не дает эффекта:

User-Agent: SputnikBot

Crawl-delay: 60

Запросы бота все равно валятся и валятся.

W1
На сайте с 26.07.2014
Offline
10
#1

Забаньте его. Толку от него, как от быка молока

C
На сайте с 18.03.2014
Offline
11
#2

А где логи?

Сергей Кизим
На сайте с 05.03.2006
Offline
159
#3
chelovekpauk:
А где логи?

Вы мне не верите? :D

Ingvarr
На сайте с 26.04.2009
Offline
452
#4

наверное он не знает о том, что такое robots.txt

L
На сайте с 02.11.2010
Offline
81
#5
siarzhuk:
Конструкция вида Disallow: /stranica.html? не помогает защититься от ползанья бота Спутника по страницам вида stranica.html?p=jhdfhfd. И что прикажете с ним делать? Банить по IP только?

---------- Добавлено 29.07.2014 в 09:34 ----------

И, кстати, такая вещь тоже не дает эффекта:
User-Agent: SputnikBot
Crawl-delay: 60

Запросы бота все равно валятся и валятся.

Может, потому что правило должно выглядеть так:

Disallow: /stranica.html?*

Спецсимвол '*' означает любую (в том числе пустую) последовательность символов.

C
На сайте с 18.03.2014
Offline
11
#6
siarzhuk:
Вы мне не верите? :D

А должны?

Вот тут http://corp.sputnik.ru/webmaster написано, что robots.txt учитывается. Ещё там написано, куда писать о проблемах.

Сергей Кизим
На сайте с 05.03.2006
Offline
159
#7
Lini:
Может, потому что правило должно выглядеть так:
Disallow: /stranica.html?*

Нет, все у меня правильно. Еще с тех пор, когда поисковики не знали, что такое звездочка.

Яндекс с Гуглом все прекрасно понимают, а вот Спутник невменяем.

---------- Добавлено 29.07.2014 в 18:56 ----------

chelovekpauk:
Ещё там написано, куда писать о проблемах.

А за это спасибо. Ранее страницу по диагонали просматривал и мыла не заметил.

D7
На сайте с 22.12.2010
Offline
272
#8
siarzhuk:
Спутник игнорирует robots.txt

от государственного поиска по идее никто прятаться не должен

vkusnoserver
На сайте с 30.04.2011
Offline
104
#9

По новым правилам robots.txt нужно регистрировать в Роскомнадзоре. С собой возьмите паспорт, копии паспорта (обязательно со страницей прописки), налоговую декларацию и объяснительную в двух экземплярах - что вам нужно скрыть от Спутника и почему. На вашем экземпляре поставят пометку о входящих и через месяц на адрес регистрации ждите ответ.

Скидки на хостинг (/ru/forum/629944) | Конфигуратор (http://www.vkusnoserver.ru/link.php?id=31) | Администрирование (/ru/forum/871196) CEO собственной персоной - skype: vkusnoandy
Сергей Кизим
На сайте с 05.03.2006
Offline
159
#10
vkusnoserver:
По новым правилам robots.txt нужно регистрировать в Роскомнадзоре.

Я нерезидент. Боюсь, вообще иностранным агентом объявят, в лучшем случае - зарегистрируют по двойному тарифу.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий