Как лучше удалить старые url из индекса

12
sozon
На сайте с 04.09.2006
Offline
90
6593

В общем такая проблема:

На сайте стояла joomla, из за криворукости одного товарища сайт на любой запрос отвечал 200 ok. В результате сейчас в индексе 10000+ страниц, должно быть примерно 1000 (остальное - мусор)

Щас переписал полностью движок. Теперь проблема как лучше переиндексировать сайт?

1. Просто добавить sitemap и ждать пока в индексе появятся новые страницы и удалятся старые

2. Запретить весь сайт к индексации, дождаться пока все страницы удалятся, а потом переиндексировать

У гугла например есть возможность дать команду роботу удалить весь сайт или его разделы из индекса.

А у яндекса только форма "Удалить URL", но сами понимаете удалять 10000 url по одному нереально.

Кто что посоветует ?

K
На сайте с 31.01.2001
Offline
737
#1

Надо урлы смотреть и придумать robots.txt .

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
sozon
На сайте с 04.09.2006
Offline
90
#2

Т.е.? Имеете ввиду запретить в robots.txt старые url? Какой в этом смысл? На них и так 404 выдается.

Хотя может вы и правы. При след обращении к сайту робот прочтет robots.txt и увидев запрет на индексацию старых url - выкинет их из базы, а иначе придется ждать пока он каждую из старых страниц посетит и получит 404.

Тоже вариант. Спасибо.

PS старая версия работала на джумле.

Lelly
На сайте с 01.02.2008
Offline
43
#3

Добрый день всем, похожая проблема.

Сайт был подвергнут XSS атаке и через форму поиска в индекс попало 350 лишних страниц со ссылками на другие ресурсы. Как быть? Если я запрещу весь этот раздел в robots.txt то они исчезнут из кеша ли нет? И как мне их удалить, чтобы они нпоисковиком больше не учитывались?

Буду признательна за совет.

Работа оптимизатора мне напоминает работу сапера, только он взрывается сразу, а ты недельки через три.
[Удален]
#4

Тоже нужно удалить страниц 300, через какое время они сами удалятся?

Timichlm
На сайте с 02.03.2007
Offline
74
#5

Можно ещё 301 редирект со старых страниц поставить.

[Удален]
#6
Timichlm:
Можно ещё 301 редирект со старых страниц поставить.

хм, жеско🚬

Timichlm
На сайте с 02.03.2007
Offline
74
#7
SOC-PROGON:
хм, жеско

Почему же? Нормальный способ)))

Lelly
На сайте с 01.02.2008
Offline
43
#8

Так я не могу редирект с этих страниц поставить - это результаты поиска страницы типа search/?query=... и куча страшных знаков . Они в нормальном виде на сайте не существуют - генерятся только при вводе слова в поиск.

Кот да Винчи
На сайте с 24.02.2007
Offline
54
#9
Kost:
Надо урлы смотреть и придумать robots.txt .

и встречный вопрос к участникам: запретил поддомен в роботс, но данную дериктиву воспринял только яндекс, а у гугля как закрыть?

пару недель наблюдаю запрещенный поддомен в индиксе..

Timichlm
На сайте с 02.03.2007
Offline
74
#10
Lelly:
Так я не могу редирект с этих страниц поставить - это результаты поиска страницы типа search/?query=... и куча страшных знаков . Они в нормальном виде на сайте не существуют - генерятся только при вводе слова в поиск.

Ну закрой тотда в роботсе по маске search

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий