ботики заблудились

12
S
На сайте с 10.05.2004
Offline
22
1169

'Googlebot/2.1 (+http://www.googlebot.com/bot.html)' Уже второй месяц непрерывно сканирует мой сайт (используя от 2 до 20 нитей). Теперь к нему присоеденился 'msnbot/0.11 (+http://search.msn.com/msnbot.htm)' - ведет себя также уже вторую неделю. Гнать их совсем понятно не хочется, но и так оставлять нельзя (от них получаются неприятные последствия). Что делать?

Каширин
На сайте с 03.01.2004
Offline
1030
#1

Какие непрятные последствия?? Кроме того, что вас будут находить в этих поисковиках. Если вы хотите, чтоб "ни ЦРУ, ни ФБР..." вас не нашли, тогда стоит запретить индексацию в файле robots.txt

S
На сайте с 10.05.2004
Offline
22
#2

Я специально написал, что гнать их не хочу. А хочу чтобы они не блудили. Яндекс то нормально мой сайт сканирует, а с этими проблема.

[Удален]
#3
Как писал saltykow
Я специально написал, что гнать их не хочу. А хочу чтобы они не блудили. Яндекс то нормально мой сайт сканирует, а с этими проблема.

Телепатов нет... В чем ненормальность ? Что значит "блудили" ?

S
На сайте с 10.05.2004
Offline
22
#4

Они каждой нитью по нескольку десятков раз в день просматривают каждую страницу моего сайта - очень сомневаюсь что это нормально.

(мне кажется достаточно один раз просмотреть каждую страницу и через какое-то количество дней это повторять, но зачем же сканировать непрерывно?)

[Удален]
#5

Сайт в студию.

p.s. Небось сессий до .... Яндекс посмотрел на это дело, скачал пару тысяч страниц за несколько заходов, и забил, а эти пашут, как проклятые... И виноваты в этом конечно гугль и мсн :(

S
На сайте с 10.05.2004
Offline
22
#6

www.gameclubsite.com

про количество сессий пожалуйста поподробнее - я не понял что это значит. (и можно ли с этим бороться)

S
На сайте с 03.05.2004
Offline
25
#7

А сесии тут при чем? У меня на старом движке сесий было достаточно много и все ок было!

Все для мобил (http://www.gsmsoft.ru) Помогите оптимизировать! Спасибо
K
На сайте с 31.01.2001
Offline
737
#8
www.gameclubsite.com
про количество сессий пожалуйста поподробнее - я не понял что это значит.

http://www.yandex.ru/yandsearch?serverurl=www.gameclubsite.com

Вы уверены, что у вас на сайте действительно 12000 страниц?

Это действительно до ..., как метко заметил Miha Kuzmin ;)

&tmppass=845407936 - это что за фигня? Зачем роботу Яндекса выдаются какие-то длинные непонятные цифири?

См. также http://www.yandex.ru/info/webmaster7.html

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
S
На сайте с 10.05.2004
Offline
22
#9

(нет на сайте примерно в 100 раз меньше страниц)

Движок сайта требует авторизациию

Тем кто нехочет(неможет) регистрироваться/авторизоваться присваиваются временные логин и пароль.

Логин пароль передаются через GET поэтому присутствуют ссылке Яндекса

(если кто-то зайдет по такой ссылке то получит другой логин и будет с ним пока не авторизуется или не уйдет) Яндекс при одном сканировании пользуется одним логином. Google, msn получают по одному логину на каждую нить, но все равно нить не получает новый логин и должна закончиться просмотрев сайт один раз.

Мне не понятно, как выдавать всем роботам один конкретный логин если многие роботы не отличимы от броузеров?

K
На сайте с 31.01.2001
Offline
737
#10
Мне не понятно, как выдавать всем роботам один конкретный логин если многие роботы не отличимы от броузеров

Это какие же неотличимы?

Основные можно пересчитать по пальцам одной руки, и придется с ними считаться. В первую очередь - это Яндекс. Спутать их с броузером сложно. А движок придется шлифовать, если поисковые машины вам нужны.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий