В индекс попадают результаты фильтра

128

Moltisanti

8 декабря 2016, 19:52

1389

приветствую!

в яндекс.вебмастере среди загруженных страниц наблюдаю страницы с результатами фильтра. На такие урлы можно попасть только засабмитив форму. Откуда яндекс их может брать?

154

angel57

8 декабря 2016, 20:01

#1

бывает такое. может сслыка где-то есть. надо делать ноуиндекс)

B3

82

Byblick32

8 декабря 2016, 20:01

#2

Может Яндекс.Метрика отправлять страницы на индексацию.

Закройте раздел поиска в robots.txt

Но чем вам мешают эти страницы в индексе. Они же могут собирать НЧ трафик.

1

M

128

Moltisanti

8 декабря 2016, 20:19

#3

angel57:
бывает такое. может сслыка где-то есть. надо делать ноуиндекс)

если бы это были немногочисленные случаи, но это регулярно происходит.

Byblick32:
Может Яндекс.Метрика отправлять страницы на индексацию.

это запрещено в настройках кода счетчика

Byblick32:
Закройте раздел поиска в robots.txt
Но чем вам мешают эти страницы в индексе. Они же могут собирать НЧ трафик.

Они не попадают в выдачу, мне это не нужно. А мешают тем, что захламляют. В индексе и без того слишком много страниц, не хотелось бы, чтобы робот тратил силы на обход ненужных.

Стоит ли закрывать для Переадресация на внутреней странице Поэтапность индексации в Яндекс

325

Станислав Романенко

8 декабря 2016, 20:35

#4

Узнавать о них Яндекс может многими способами. Например, если страницу посетил пользователь с Яндекс.Браузером.

Если они закрыты в robots.txt, то они не должны загружаться. Проверьте в Яндекс.Вебмастере в разделе "Анализ robots.txt" какую-нибудь страницу фильтра.

1

Сайт не лезет в топ? Сделаю аудит без воды всего за 8000 рублей! Отзывы клиентов тут (https://searchengines.guru/ru/forum/939454), почта для связи: ingref@ya.ru Посмотрю, в чём проблема с вашим сайтом, за 100 рублей (https://searchengines.guru/ru/forum/comment/15662080).

M

128

Moltisanti

8 декабря 2016, 20:51

#5

Ingref:
Узнавать о них Яндекс может многими способами. Например, если страницу посетил пользователь с Яндекс.Браузером.

интересно, не знал.

Ingref:
Если они закрыты в robots.txt, то они не должны загружаться.

они не совсем закрыты, я использую директиву clean-param в роботсе + тег canonical.

[Удален]

8 декабря 2016, 21:32

#6

Их однозначно нужно убирать и закрывать, только что проводил аудит, где после добавления развернутых модулей фильтров на сайт - он поплыл...

ПС узнают о них из любых источников, которыми владеют - это давно не удивительно (метрики, бары, источники переходов... на самом деле их намного больше).

Выход из ситуации не сложный - оставить только голую структуру сайта, без левых страниц в индексе. Т.к. они на корню путают релевантность.

И чем больше их съедает поиск - тем со временем ситуация всё хуже и хуже. А при большом количество страниц и запросов - нереально отследить смену релевантности пар страниц \ запросов. Начинается всё, как правило с НЧ и СЧ...

Если страницы фильтров не уникализированы контентом \ заголовками - запрещать к индексации по маске в урл!

1

Нужен совет как оптимизировать Вопрос, закрывать ли страницы Яша сменил страницу в

777

богоносец

9 декабря 2016, 04:50

#7

Moltisanti:
В индексе и без того слишком много страниц, не хотелось бы, чтобы робот тратил силы на обход ненужных.

Ну так значит опоздали вы с закрыванием хлама.

Вообще не нужно задаваться вопросом Откуда яндекс их может брать?

Надо чтобы был запрет их индексации (любыми способами, хоть 404 в ответе). И давно уже надо.

1

Оптимизация блога как удалить страницы из борьба с Возрастом сайта

P

69

predm

9 декабря 2016, 07:42

#8

Profin:
Их однозначно нужно убирать и закрывать, только что проводил аудит, где после добавления развернутых модулей фильтров на сайт - он поплыл...

ПС узнают о них из любых источников, которыми владеют - это давно не удивительно (метрики, бары, источники переходов... на самом деле их намного больше).
Выход из ситуации не сложный - оставить только голую структуру сайта, без левых страниц в индексе. Т.к. они на корню путают релевантность.
И чем больше их съедает поиск - тем со временем ситуация всё хуже и хуже. А при большом количество страниц и запросов - нереально отследить смену релевантности пар страниц \ запросов. Начинается всё, как правило с НЧ и СЧ...

Если страницы фильтров не уникализированы контентом \ заголовками - запрещать к индексации по маске в урл!

Запрещать в роботе индексацию хорошо, но робот может все равно гулять по ним.

я в таком случае программистам даю задание - фильтры делать через аякс, вроде, так называется.

Суть в том, чтобы, результаты работы фильтра отображались без перезагрузки страницы, при любых параметрах поиска, урл остается исходным. И проблем нет.

Туризм, Отдых, Развлечения, Дети, Дом.

По поводу исходного кода Динамическая страница Поднять тИЦ+100 PR+1 -

686

donc

9 декабря 2016, 07:56

#9

Ingref:
Например, если страницу посетил пользователь с Яндекс.Браузером

Не только. Любой посетитель со Ятуркенженсирхивом от яндекса. Это и мозила может быть и даже пунто свитчер

Продвижение сайтов от 25 000 в мес, прозрачно, надежно https://searchengines.guru/ru/forum/818412 , но не быстро, отзывы

M

128

Moltisanti

9 декабря 2016, 08:19

#10

богоносец:
Вообще не нужно задаваться вопросом Откуда яндекс их может брать?
Надо чтобы был запрет их индексации (любыми способами, хоть 404 в ответе). И давно уже надо.

Profin:
Если страницы фильтров не уникализированы контентом \ заголовками - запрещать к индексации по маске в урл!

Как писал выше, у меня они запрещены через директиву clean-param. Плюс на таких страницах есть тег canonical, в котором url ссылается на полный список без фильтров. Хорош ли такой вариант или лучше запрещать по маске через роботс?

Яндекс выкинул весь сайт Вопрос по Clean-param Как лучше убрать дубли?

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи

Зачем быть уникальным в мире, где все можно скопировать