Яндекс I зациклился?

M
На сайте с 16.01.2003
Offline
129
1047

Сегодня посмотрел логи заходов роботов и обалдел: Яндекс I запросил одну и туже страницу 398 раз подряд. Правда, с разными ид сессий. Статус всегда 200. Зачем он нагенерил столько запросов? Кстати, в базе у него этой страницы нет.

K
На сайте с 31.01.2001
Offline
737
#1

А что за ID сессий? У меня такого нет. phpsessionid что-ли? Поисковики это очень не любят. Наверное проверяли, что содержимое не зависит от этого ID и скоро выкинут нафиг весь сайт за замусоривание поисковой базы и издевательство над Яндексом :D Такая процедура чистки у Яндекса есть.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
M
На сайте с 16.01.2003
Offline
129
#2
Как писал Kost
А что за ID сессий? У меня такого нет. phpsessionid что-ли?

Почти, только явский - jsessionid. По поводу выкинут - уже год сайт в сети, год его яндекс дрючит - не выкинули еще :). Так прикол-то в том, что я специально сделал так, чтобы при заходе яндекса и ему подобных они сессий не видели! Проверял, все работает. Так откуда же яндекс берет урлы с сессиями? Получается, что он их получает, обходя сайты как обычный пользователь...

wolf
На сайте с 13.03.2001
Offline
1183
#3
Так прикол-то в том, что я специально сделал так, чтобы при заходе яндекса и ему подобных они сессий не видели!

По юзер-агенту, что ли?

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
M
На сайте с 16.01.2003
Offline
129
#4
Как писал wolf


По юзер-агенту, что ли?

Конечно, и логи специальные веду только по роботам всяким.

F
На сайте с 15.11.2000
Offline
116
#5
Как писал mixb
я специально сделал так, чтобы при заходе яндекса и ему подобных они сессий не видели! Проверял, все работает.

Значит сделано с ошибкой. Что выдается роботу, когда он приходит по странице с ID сессии? Должна выдаваться ошибка 301 с редиректом на URL без ID, либо 404.

С уважением,

Александр Садовский.

M
На сайте с 16.01.2003
Offline
129
#6
Как писал funsad

Что выдается роботу, когда он приходит по странице с ID сессии?

Выдается 200. А задумывалось вот что: при заходе робота даже с ID сессии все другие внутренние ссылки сессии не содержат. Робот должен собрать их и проиндексировать нормально, без сессий в УРЛ.

M
На сайте с 22.11.2002
Offline
9
#7
Как писал mixb


Выдается 200.

здрасьте.

прошу прощения за грубость, но RTFM

предыдущий оратор совершенно правильно сказал, что что надо отдавать

M
На сайте с 16.01.2003
Offline
129
#8

Опять поиск не работает :(

А что такое RTFM?

А в robots.txt у меня запрет на индексацию всех страниц, УРЛ которых содержит сессию: Disallow: /имя_проги;jsessionid

Это ведь должно работать!

funnybunny
На сайте с 14.09.2002
Offline
348
#9

mixb,

А что такое RTFM?

Это сокращение так же как и ИМХО. Значит вот что: читайте мануал (нехорошие слова пропустил)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий