Robots & Google

I

56

Isis

3 мая 2008, 22:10

1024

Здравствуйте...

Есть сайт http://vpleer.ru

Имеется robots.txt с содержанием:

User-agent: *
Disallow: /get.php?

Но GooGleBot все равно както обращается к файлу get.php, тем самым портит статистику скачки файлов на сайте

194

BrokenBrake

4 мая 2008, 00:17

#1

А если вопросик убрать?

791

Unlock

4 мая 2008, 05:53

#2

А гуглу по барабану, он сам свои правила устанавливает в последнее время. Запросы автоматически в формы вставляет, robots.txt ему тоже уже не правило.

Есть желание, - тысяча способов; нет желания, - тысяча поводов! /Петр-I/.

194

BrokenBrake

4 мая 2008, 07:02

#3

Не согласен. Во-первых, приведенный пример не запрещает доступ, собственно, к /get.php. Во-вторых, если бы гуглу было по барабану, зачем он предоставлял бы в инструментах вебмастера генератор robots.txt?

791

Unlock

4 мая 2008, 07:10

#4

BrokenBrake, от вашего согласия, ничего не меняется. У меня в дополнительных ссылках сайта висит страница, которая закрыта в robots.txt и закрыта давно. То что бот шарится по сайту, в том числе и по закрытым страницам, для вас новость? Да, в индексе такие страницы скорее всего не появятся, но шарится он все равно будет.

194

BrokenBrake

4 мая 2008, 07:16

#5

Хм, насчет того, что шарится, вообще-то, не знаю. Не буду спорить. Логи смотреть лениво, а моя система статистики не предоставляет подробных данных по роботам.

S

323

semenov

4 мая 2008, 07:24

#6

Unlock:
BrokenBrake, от вашего согласия, ничего не меняется. У меня в дополнительных ссылках сайта висит страница, которая закрыта в robots.txt и закрыта давно. То что бот шарится по сайту, в том числе и по закрытым страницам, для вас новость? Да, в индексе такие страницы скорее всего не появятся, но шарится он все равно будет.

Дак и роботс никому не запрещает шарится по страницам

791

Unlock

4 мая 2008, 07:44

#7

semenov:
Дак и роботс никому не запрещает шарится по страницам

Ну почему же? Вот выдержка:

http://www.robotstxt.org/orig.html

This example indicates that no robots should visit this site further:
# go away
User-agent: *
Disallow: /

Я конечно не супер знаток английского, но слова visit и index имеют разные значения, и если верить упомянутой выше ссылки, то роботы не должны именно шариться, а не просто не вносить страницы в индекс. Поправьте если в чем-то не прав.

Закупаем ссылки уже 3,5 Js код изменяет размер Резкий всплеск прямых заходов.

I

56

Isis

4 мая 2008, 08:32

#8

Чтож (

Придется в скрипте делать проверку...

if(!$_SERVER['HTTP_USER_AGENT'] ) ...

S

323

semenov

4 мая 2008, 20:33

#9

Unlock:
Н
Я конечно не супер знаток английского, но слова visit и index имеют разные значения, и если верить упомянутой выше ссылки, то роботы не должны именно шариться, а не просто не вносить страницы в индекс. Поправьте если в чем-то не прав.

Какбэ роботы и иные посетители сайта вам ничего не должны

791

Unlock

4 мая 2008, 22:01

#10

semenov, как бы стандарты так, ради прикола придумывают, ага?

VK приобрела 70% в структуре компании-разработчика red_mad_robot

Зачем быть уникальным в мире, где все можно скопировать