Как и чем массово проверить ссылки, которые не попали в индекс

TR
На сайте с 25.07.2009
Offline
69
TTR
1202

Вообщем, есть сайт - всего 70 тыс ссылок, в индексе яндекса - 50 тысРоботс настроен четко, индексируются только те страницы, которые нужны, Предполагаю 20тыс - это копипаст, который хочу удалить.

Проблема - как мне найти список этих страниц?

В вебмастере нет возможности же выгрузить список страниц целиком, утилит не нашел, которые бы проверяли по карте сайта статус индексации страниц.

Что делать, помогите пожалуйста.

HandMaker
На сайте с 22.05.2007
Offline
83
#1

Оригинального решения задачи не видел. Брал xenu или sitemap generator и полученный список урлов 2-3 суток медленно но уверенно чекались.

Иногда удавалось находить по какому-то признаку (части урла, разделу, элементу верстки) - но это скорее интуиция и опыт чем технология ))

Если кто-то знает не столь тривиальное решение, тоже буду рад услышать.

PS

Естественно интересует решение для 10к+ объемов.

335-девятьсот семьдесят-ноль34
TR
На сайте с 25.07.2009
Offline
69
TTR
#2
HandMaker:
Оригинального решения задачи не видел. Брал xenu или sitemap generator и полученный список урлов 2-3 суток медленно но уверенно чекались.
Иногда удавалось находить по какому-то признаку (части урла, разделу, элементу верстки) - но это скорее интуиция и опыт чем технология ))
Если кто-то знает не столь тривиальное решение, тоже буду рад услышать.
PS
Естественно интересует решение для 10к+ объемов.

Нашел более менее быстрый способ, через пейджвейт получил все ссылки сайта, используя robots.txt (xenu с моим роботсом не работает нормально), потом в экселе выбрал колонку ссылок, получилось 65к, больше не влезало

Далее, используя программу YCCY -копировал по 10тыс записей в столбце и прогонял через нее

HandMaker
На сайте с 22.05.2007
Offline
83
#3
TTR:
Нашел более менее быстрый способ, через пейджвейт получил все ссылки сайта, используя robots.txt (xenu с моим роботсом не работает нормально), потом в экселе выбрал колонку ссылок, получилось 65к, больше не влезало

Далее, используя программу YCCY -копировал по 10тыс записей в столбце и прогонял через нее

ну принцип тот же по большому счету

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий