HTTP 404 - Файл не найден

@
На сайте с 09.12.2003
Offline
134
1037

Доброго времени суток.

Почитал тут на днях тему на форуме по поводу SID'ов.

Индекс в яндексе одного из сайтов порядочно ими замусорен. Причину уже устранил, теперь хотелось бы почистить индекс.

Думаю вот обработчик в .htaccess прописать, чтоб все .php перехватывал, проверял наличие в URI SID'ов, проверял юзерагента и вслучае прихода поискового робота выдавал 404 ошибку.

Никто ни счем подобным никогда не заморачивался?

Насколько это реально?

Как правильно выдать 404 ошибку?

Lenka
На сайте с 10.10.2003
Offline
139
#1

если страница, отдаваемая роботу, будет отличаться от страницы, выдаваемой обычному браузеру, то это может быть расценено, как обман поисковой машины и повлечь наказание...

wolf
На сайте с 13.03.2001
Offline
1183
#2
если страница, отдаваемая роботу, будет отличаться от страницы, выдаваемой обычному браузеру, то это может быть расценено, как обман поисковой машины и повлечь наказание...

Да, но только при условии, что эта страница будет доступна для индексации и содержаться в базе поисковой машины. Если же роботу выдавать 404, а обычному браузеру 200, то страницы в базе поисковика не будет, и поисковику должно быть по барабану всё, что касается этой страницы. Он ее просто не будет знать. Так что, никакого обмана поисковой машины в этом случае не будет.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
LM
На сайте с 30.11.2001
Offline
71
LiM
#3

Более того, это практически единственный нормальный способ почистить БД поисковика от ненужных адресов.

Хотя от себя рекомендую не 404-й код, а редирект (код 301) на адрес с идентичным содержимым.

С уважением, Андрей Хроленок. Загляни в FAQ по оптимизации и продвижению сайтов (http://www.seoman.ru/FAQ/) Анализатор страниц сайтов (http://www.seoman.ru/analizer/)
C
На сайте с 19.09.2001
Offline
120
#4

LiM, из собственного опыта не подскажете, как поисковики обрабатывают 301?

У меня, например, документы, которые выдавали 301 стабильно опрашивались поисковиками в течении полугода, после чего я стал выдавать 404, некоторые (Inktomi, Google, etc) до сих пор в эти URLы ломятся.

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)
@
На сайте с 09.12.2003
Offline
134
#5

По поводу правильности принятого решения ситуация более-менее понятна, но все же как правильно выдавать 404 ошибку?

C
На сайте с 19.09.2001
Offline
120
#6

header("HTTP/1.1 404 Not Found");

@
На сайте с 09.12.2003
Offline
134
#7

Спасибо за помощь.

Вроде все получилось, хотя, в прочем, время покажет.

LM
На сайте с 30.11.2001
Offline
71
LiM
#8

Cherny, из моего опыта перевода нескольких крупных разделов сайта на отдельные домены получается, что при встрече такого адреса робот про него забывает и заносит в очередь на индексацию новый адрес, который был ему сказан. Страница по старому адресу из индекса пропадает максимально быстро.

Возврат же на старые адреса возможен, если робот где-либо встретить ссылку на этот адрес - адрес теперь будет для робота новым и он пойдет посмотреть, чего там есть...

C
На сайте с 19.09.2001
Offline
120
#9

LiM, спасибо за информацию. Буду продолжать наблюдать за поведением роботов.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий