Как вычистить из яндекса урлы с сессиями?

donRumata
На сайте с 21.11.2006
Offline
55
796

Яндекс проиндексировал страницы сайта с id сессии в урле. Это на сайте я уже поправил, теперь таких не будет в том количестве что раньше. Но как избавится в индексе от таких ссылок уже проиндексированных яндексом?

Мне мыслится так: Яндекс при последующей индексации будет проверять все страницы, которые у него есть в индексе(в этом я не уверен). На сайте отлавливать обращения к сайту по урлам с id сессии в стрке, и с 301 ошибкой отправлять на главную страницу. Мне кажется яндекс должен такую ссылку вычистить из своей базы, тем самым освободив место для других страниц.

Может кто-нибудь прокоменнтировать это или предложить что-нибудь более лучшее?

O
На сайте с 20.02.2006
Offline
139
#1
donRumata:
Яндекс проиндексировал страницы сайта с id сессии в урле. Это на сайте я уже поправил, теперь таких не будет в том количестве что раньше. Но как избавится в индексе от таких ссылок уже проиндексированных яндексом?
Мне мыслится так: Яндекс при последующей индексации будет проверять все страницы, которые у него есть в индексе(в этом я не уверен). На сайте отлавливать обращения к сайту по урлам с id сессии в стрке, и с 301 ошибкой отправлять на главную страницу. Мне кажется яндекс должен такую ссылку вычистить из своей базы, тем самым освободив место для других страниц.
Может кто-нибудь прокоменнтировать это или предложить что-нибудь более лучшее?

Имхо можно вручную, через "Удаление страниц" на Я, или придется ждать, пока Я проверит эти страницы.

kolobok74
На сайте с 29.01.2006
Offline
267
#2

Ждать следующего прихода робота, да и то не факт, что несуществующие страницы уйдут. У меня больше 100 страниц в индексе, хотя на самом деле их уже месяца 3, как нет. Все эти 3 месяца приходит робот, получает 404, а страницы не убирает.

Чтоб ускорить процесс прихода робота, поставьте средненький сквознячек на Ваш сайт с другого сайта.

donRumata
На сайте с 21.11.2006
Offline
55
#3
O1eg:
Имхо можно вручную, через "Удаление страниц" на Я, или придется ждать, пока Я проверит эти страницы.

Нет, вручную не получится, так как на всех страницах сайта передавалась сессия. Этот косяк был мною замечен к сожалению не сразу. Теперь в яндексе 8000 тысяч страниц и половина из них с сессиями. Удалить из яндекса придется весь сайт :)

donRumata
На сайте с 21.11.2006
Offline
55
#4
kolobok74:
Ждать следующего прихода робота, да и то не факт, что несуществующие страницы уйдут. У меня больше 100 страниц в индексе, хотя на самом деле их уже месяца 3, как нет. Все эти 3 месяца приходит робот, получает 404, а страницы не убирает.

Чтоб ускорить процесс прихода робота, поставьте средненький сквознячек на Ваш сайт с другого сайта.

Страницы-то существуют. только боюсь что яндекс хранит их излишнее количество, так как он за несколько индексов он заходил на одни и те же стрницы с разным id сессии и для него по сути это разные страницы, а для меня нет.

Действительно сквозная ссылка так может сработать?

Yaroslav_Adv
На сайте с 27.09.2005
Offline
199
#5

donRumata, все страницы должны отдавать 404 + запретить на всякий случай в robots.txt + если не лень - удалить страницы через delurl.

С уважением, Ярослав Деревягин Веб-агентство "Found (http://found-it.ru)"
donRumata
На сайте с 21.11.2006
Offline
55
#6
Yaroslav_Adv:
donRumata, все страницы должны отдавать 404 + запретить на всякий случай в robots.txt + если не лень - удалить страницы через delurl.

удалить ручками не реально

а 404 теоретически можно сделать через htaccess

malls
На сайте с 08.08.2005
Offline
255
#7

Не пойму в чем горе то? Т.е. ну наиндексил Яша больше чем нужно, Вы ему вместо этого редирект подсунули. Со временем (может и не быстро) он их из индекса похоронит - НО У ВАС ТО В ЧЕМ БЕДА? Вам дисковые ресурсы Яши жалко что-ли?

donRumata
На сайте с 21.11.2006
Offline
55
#8
malls:
Не пойму в чем горе то? Т.е. ну наиндексил Яша больше чем нужно, Вы ему вместо этого редирект подсунули. Со временем (может и не быстро) он их из индекса похоронит - НО У ВАС ТО В ЧЕМ БЕДА? Вам дисковые ресурсы Яши жалко что-ли?

Я пока ему(яндексу) ни чего не подсовывал, о чем и написал вначале, пока только думаю.

Во вторых читал в одной статье, что не надо забиывать индексную базу яндекса, так как при последующих заходах, яндекс во первых должен проверить старые ссылки, а во вторых индексировать новые, так вот если старых слишком много, то на на новые он затрачивает меньше ресурсов чем мог бы - он не резиновый.

Evgeny Smirnoff
На сайте с 12.01.2006
Offline
153
#9

Боюсь тут проблема не в роботах. Был у меня динамичный сайтик, так там предыдущие оптимизаторы скормили Яше статичную страничку индексную. И в роботсе запрещал, и 404 Яше подсовывал - все без толку.

Оказалось, в скрипте ошибка была. Проверьте, что отдает Ваш сервер в переменной "Last Modified"...

D
На сайте с 21.06.2006
Offline
168
#10

Я просто запретил неправильные урлы в robots.

Потихоньку вычищаются.

Appstorespy - платформа анализа мобильных сторов | Publa.io - готовая инфраструктура для приема платежей и оплаты рекламных кабинетов в бурже

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий