Как быстро найти страницы не под фильтром?

T
На сайте с 29.03.2004
Offline
201
tav
1264

Есть сайт, большой. Больше 50К загружено роботом. Но! Очень много дублей и неуника. В поиске около 10К страниц. Есть ли какой-нибудь быстрый / автоматический способ нахождения страниц не под фильтром по неунику? Т.е. тех, что видны до нажатия на "Показать всё без исключения." при проверке по любой фразе.

Расширенный поиск по сайту и "Страниц в поиске" из ВМ дают все страницы, включая зафильтрованные.

Турфирмам - бесплатное размещение инфо о фирме и о турах. Всем - медийную рекламу и статьи на сайтах про города и страны. Пишите в личку
Arhivator-007
На сайте с 11.02.2010
Offline
39
#1

Можно пойти от обратного, методом исключения. В Яндексе, по каждому Вашему разделу, набрать (применимую с Вашей ситуацией) урл со звездочкой в конце: url:www.Ваш-домен.ru/forum/viewforum.php?f=120* - Увидите все что есть в поиске, т.к. в панели вэбмастера глюки и полно страниц которые НЕ в поиске, а указаны что они в поиске. Яндекс сам себя дурит, ну и нас до кучи :)

Потом сравните с Вашим "сайтмэпом" и просто исключите найденые страницы - останутся только те, что Яндекс выкинул из поиска.

Ну и соответственно наоборот, если требуется найти что в индексе.

"псевдо" оптимизаторы теоретики, могут идти ---> лесом! :)))))
T
На сайте с 29.03.2004
Offline
201
tav
#2

Arhivator-007, я говорил, это не работает. Страницы не "исключены", как при АГС, а просто показываются как "сопли" (в гуглевой терминологии).

mhz
На сайте с 16.05.2007
Offline
190
mhz
#3

tav, это называется "склейка по сниппетам" - из-за слишком похожих описаний. Прям все страницы, которые где-то с чем-то клеются вы не увидите. Можно только посмотреть, какого рода страницы обычно попадают под "показать все результаты" и попробовать отобрать их по маске урла.

А вообще, от задач зависит. Вам для чего эти страницы нужно увидеть?

Миниатюрный бультерьер Сахарок (http://www.bule4ka.ru/) — СДЛ о собачках. Вечные ссылки — безопасный способ продвижения и заработка. (http://miralinks.ru/users/registration/from:163)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий