Удаление устаревших страниц

12 3
Kokh
На сайте с 24.05.2006
Offline
58
1952

Есть сайт, проиндексированных страниц около 90К. Часть страниц уже давно устарела, и выдает 404, но робот Яндекса упорно не заходит туда и соответственно не удаляет из индекса. Подскажите, пожалуйста, можно ли применить такой способ, автоматически вызывать

http://webmaster.yandex.ru/deletedurl.xml?url=http//site.ru/item1.html

...

http://webmaster.yandex.ru/deletedurl.xml?url=http//site.ru/itemN.html

Это в принципе не законный метод, но с другой стороны - эффективная очистка от мусора, и Яндексу хорошо, и у посетителя меньше шансов увидеть 404. А вручную удалять можно и день и два :) Или пусть все остается как есть?

Bor-ka
На сайте с 16.11.2004
Offline
256
#1
Kokh:
одскажите, пожалуйста, можно ли применить такой способ, автоматически вызывать

за очень частое обращения Ваш IP могут забанить.

Kokh
На сайте с 24.05.2006
Offline
58
#2
Bor-ka:
за очень частое обращения Ваш IP могут забанить.

Да, собственно, и нет желания заспамить эту форму. Вопрос в том, применят ли санкции за автоматическое обращение. Определить, что обращаются не из браузера, думаю, не составит труда.

K
На сайте с 31.01.2001
Offline
737
#3

Если у адресов страниц общее начало, для их удаления надо использовать robots.txt.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
Bor-ka
На сайте с 16.11.2004
Offline
256
#4

Kokh, при слишком частом - принимает. А браузер и подделать можно.

P
На сайте с 14.06.2005
Offline
14
#5

Kokh, если страницы нет на Вашем сайте - то проблемы яндекса, как их удалять из своей базы устаревший хлам. Вам то что с того? Чем это мешает жить?

ps запрещать надо в роботс.

Всё дело в позиции...
Kokh
На сайте с 24.05.2006
Offline
58
#6
Kost:
Если у адресов страниц общее начало, для их удаления надо использовать robots.txt.

Это было бы слишком просто, придется эмулировать браузер :) Спасибо.

U
На сайте с 17.12.2002
Offline
41
#7
patan:
Kokh, если страницы нет на Вашем сайте - то проблемы яндекса, как их удалять из своей базы устаревший хлам. Вам то что с того? Чем это мешает жить?
ps запрещать надо в роботс.

Например, мне мешает тем, что зачастую вместо новых страниц с тем же контентом, но другим адресом, Я не удаляет из индекса и выдает старые страницы с 404.

Григорий Селезнев
На сайте с 25.09.2001
Offline
298
#8

имхо, противозаконного в этом ничего нет ... и помочь Яндексу нужно

Kokh
На сайте с 24.05.2006
Offline
58
#9
patan:
Kokh, если страницы нет на Вашем сайте - то проблемы яндекса, как их удалять из своей базы устаревший хлам. Вам то что с того? Чем это мешает жить?
ps запрещать надо в роботс.

Дело в том, что Яндекс начал неохотно индексировать новые страницы, вот у меня и возникла мысль помочь ему "разгрузиться". Раньше он просто тысячами их глотал. Не знаю с чем это связано, есть какой-то лимит проиндексированных страниц, так сказать критическая масса для отдельно взятого сайта? В общем не знаю, насколько эта теория верна. Кроме того, ситуация когда пользователь видит 404, тоже не есть гут, хоть она (ошибка 404) и выдается правильно, с формой поиска по сайту.

Каширин
На сайте с 03.01.2004
Offline
1031
#10
Kokh:
Дело в том, что Яндекс начал неохотно индексировать новые страницы, вот у меня и возникла мысль помочь ему "разгрузится". Раньше он просто тысячами их глотал. Не знаю с чем это связано, есть какой-то лимит проиндексированных страниц, так сказать критическая масса для отдельно взятого сайта? В общем не знаю, насколько эта теория верна. Кроме того, ситуация когда пользователь видит 404, тоже не есть гут, хоть она (ошибка 404) и выдается правильно, с формой поиска по сайту.

Вы все правильно подметили. Есть лимит, и он как раз на уровне 100к страниц. Закрывайте не существующие страницы в robots.txt.

Тем не менее, скверно, что у вас образовалось такое кол-во несуществующих страниц. Когда вы переделывали сайт - надо было задуматься об этом до, а не после.

По хорошему надо переселять старые страницы на новые адреса с редиректом 301. И Яндекс постепенно будет их заменять на новые. И вам хорошо, и Яндексу зыко, и пользователю комфортно :)

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий