Старые страницы в индексе

Mikich
На сайте с 11.08.2006
Offline
123
1353

Час добрый.

В общем месяца три-четыре назад почистил базу и перевел сайт на другой скрипт. Естественно изменились адреса страниц. Гугл проиндексировал новый сайтмап, но и старые страницы остались у него в индексе. И в панеле вебмастера постоянно показываются ошибки сканирования, типа не найденно столько страниц и т.д.

Как можно удалить старые страницы из индекса вообще?

Только враги говорят друг другу правду. Друзья и возлюбленные, запутавшись в паутине взаимного долга, врут бесконечно… (с) Стивен Кинг "Dark Tower" Купи онлайн дешевле. Скидки, купоны и кэшбэк. ( http://got.by/46m8jj )
FreddyCruger
На сайте с 17.08.2012
Offline
108
#1
Mikich:
Час добрый.

В общем месяца три-четыре назад почистил базу и перевел сайт на другой скрипт. Естественно изменились адреса страниц. Гугл проиндексировал новый сайтмап, но и старые страницы остались у него в индексе. И в панеле вебмастера постоянно показываются ошибки сканирования, типа не найденно столько страниц и т.д.
Как можно удалить старые страницы из индекса вообще?

сделать, чтоб страницы отдавали 404 код, а потом удалить через панель вебмастера.

на вскидку - до месяца и страниц в индексе нет.

недостаток добра делает человека злым.
Mikich
На сайте с 11.08.2006
Offline
123
#2
FreddyCruger:
сделать, чтоб страницы отдавали 404 код, а потом удалить через панель вебмастера.

на вскидку - до месяца и страниц в индексе нет.

Да вроде код 404 отдается, но все равно в панели показывает восемь тысяч проиндексированных и больше двух тысяч ошибок. Хотя в сайтмапе показывает около 300 страниц.

FreddyCruger
На сайте с 17.08.2012
Offline
108
#3
Mikich:
Да вроде код 404 отдается, но все равно в панели показывает восемь тысяч проиндексированных и больше двух тысяч ошибок. Хотя в сайтмапе показывает около 300 страниц.

значит ждите и закройте доступ к роботс.

через неделю - две начнут отпадать


User-agent: *
Disallow: /тутссылка на документ или папку/
E
На сайте с 21.09.2009
Offline
283
#4
FreddyCruger:
Disallow: /тутссылка на документ или папку/

и бот не получит 404 так как запрет на сканирование стоит.

Mikich
На сайте с 11.08.2006
Offline
123
#5
easywind:
и бот не получит 404 так как запрет на сканирование стоит.

Ну бот получает 404, а страницы из индекса выбрасывать не хочет. По внутреннему статмодулю, гуглбот с упорством идиота каждый день ходит по по одним и тем же несуществующим страницам и его не волнует, что их давно нет.

C6
На сайте с 25.05.2012
Offline
6
#6
Mikich:
Ну бот получает 404, а страницы из индекса выбрасывать не хочет. По внутреннему статмодулю, гуглбот с упорством идиота каждый день ходит по по одним и тем же несуществующим страницам и его не волнует, что их давно нет.

Возвращайте 410.

Согласно стандартам - 404 это "страница почему-то не найдена", а 410 - "да, такая страница тут была, но ее больше нету и пожалуйста - забудьте об ее существовании, еслы вы бот".

В теории - Гугл утверждает, что его бот реагирует на 404 и 410 одинаково, но на практике 410-е удаляются из индекса раза в 3-4 быстрее.

E
На сайте с 21.09.2009
Offline
283
#7
Mikich:
гуглбот с упорством идиота

бот не идиот он нашел где-то ссылку и понять пытается, что Вы со страницей сделали? А вдруг Вы ее специально спрятали от него? Как вариант если страница выдает 200 вместо 404 вот и приехали.

Mikich
На сайте с 11.08.2006
Offline
123
#8
easywind:
бот не идиот он нашел где-то ссылку и понять пытается, что Вы со страницей сделали? А вдруг Вы ее специально спрятали от него? Как вариант если страница выдает 200 вместо 404 вот и приехали.

На эти страницы нет ссылок нигде и быть не может, большинство этих страничек страницы которые генерировал статмодуль старой ЦМСки. А в панели вебмастера в разделе ошибки сканирования код ответа этих страниц 404.

E
На сайте с 21.09.2009
Offline
283
#9

Mikich, урл сайта и урл удаленной страницы в ЛС плиз.

I
На сайте с 08.01.2013
Offline
16
#10

Подскажите как лучше, есть новый сайт http://www.optom.net.ua/, 3 недели как запустили, до этого был другой сайт !

Старый страницы отдают 404, но не хотят удалятся с индекса !

В robots запретил индексацию старых (несуществующих) страниц

Disallow: /index.php

Disallow: /index.php?

Теперь вопрос, может пока не нужно закрывать от индексации старые страницы с 404 ?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий