Robots & Google

12
I
На сайте с 03.05.2008
Offline
56
1007

Здравствуйте...

Есть сайт http://vpleer.ru

Имеется robots.txt с содержанием:

User-agent: *
Disallow: /get.php?

Но GooGleBot все равно както обращается к файлу get.php, тем самым портит статистику скачки файлов на сайте

BrokenBrake
На сайте с 03.03.2007
Offline
194
#1

А если вопросик убрать?

Unlock
На сайте с 01.08.2004
Offline
786
#2

А гуглу по барабану, он сам свои правила устанавливает в последнее время. Запросы автоматически в формы вставляет, robots.txt ему тоже уже не правило.

Есть желание, - тысяча способов; нет желания, - тысяча поводов! /Петр-I/.
BrokenBrake
На сайте с 03.03.2007
Offline
194
#3

Не согласен. Во-первых, приведенный пример не запрещает доступ, собственно, к /get.php. Во-вторых, если бы гуглу было по барабану, зачем он предоставлял бы в инструментах вебмастера генератор robots.txt?

Unlock
На сайте с 01.08.2004
Offline
786
#4

BrokenBrake, от вашего согласия, ничего не меняется. У меня в дополнительных ссылках сайта висит страница, которая закрыта в robots.txt и закрыта давно. То что бот шарится по сайту, в том числе и по закрытым страницам, для вас новость? Да, в индексе такие страницы скорее всего не появятся, но шарится он все равно будет.

BrokenBrake
На сайте с 03.03.2007
Offline
194
#5

Хм, насчет того, что шарится, вообще-то, не знаю. Не буду спорить. Логи смотреть лениво, а моя система статистики не предоставляет подробных данных по роботам.

S
На сайте с 28.10.2005
Offline
319
#6
Unlock:
BrokenBrake, от вашего согласия, ничего не меняется. У меня в дополнительных ссылках сайта висит страница, которая закрыта в robots.txt и закрыта давно. То что бот шарится по сайту, в том числе и по закрытым страницам, для вас новость? Да, в индексе такие страницы скорее всего не появятся, но шарится он все равно будет.

Дак и роботс никому не запрещает шарится по страницам

Unlock
На сайте с 01.08.2004
Offline
786
#7
semenov:
Дак и роботс никому не запрещает шарится по страницам

Ну почему же? Вот выдержка:

http://www.robotstxt.org/orig.html

This example indicates that no robots should visit this site further:
# go away
User-agent: *
Disallow: /

Я конечно не супер знаток английского, но слова visit и index имеют разные значения, и если верить упомянутой выше ссылки, то роботы не должны именно шариться, а не просто не вносить страницы в индекс. Поправьте если в чем-то не прав.

I
На сайте с 03.05.2008
Offline
56
#8

Чтож (

Придется в скрипте делать проверку...

if(!$_SERVER['HTTP_USER_AGENT'] ) ...
S
На сайте с 28.10.2005
Offline
319
#9
Unlock:
Н
Я конечно не супер знаток английского, но слова visit и index имеют разные значения, и если верить упомянутой выше ссылки, то роботы не должны именно шариться, а не просто не вносить страницы в индекс. Поправьте если в чем-то не прав.

Какбэ роботы и иные посетители сайта вам ничего не должны

Unlock
На сайте с 01.08.2004
Offline
786
#10

semenov, как бы стандарты так, ради прикола придумывают, ага?

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий