Как убрать с индекса ненужные страницы?

93

SergUA

7 апреля 2015, 21:07

1146

В общем ситуация в следующем, где то полгода назад, вместо карточек(сайт доска объявлений) в индекс полезли все редиректные ссылки на сайты указанные в объявлениях.

И в придачу в выдаче к этой ссылке подтягивает тайтлы сайта на который идет ссылка.

проверил роботс заметил, что нет запрета на индексацию этих ссылок(потому как до этого менял сам шаблон этих ссылок) - добавил запрет, проверил в вебмастерс все работает.

Но вот с индекса до сих пор страницы не ушли.

Как это исправить?

348

callidus

7 апреля 2015, 21:10

#1

еще немного подождать, если конечно правильно все в robots закрыли :)

Моментальный сбор семантического ядра и частотности за копейки https://clck.ru/3KYdWE.

SU

93

SergUA

7 апреля 2015, 21:20

#2

callidus:
еще немного подождать, если конечно правильно все в robots закрыли :)

закрыл точно правильно - проверил в вебмастерсе. Просто времени уже не мало прошло, а вот реакции пока никакой...

MW

136

MxWhite

7 апреля 2015, 21:27

#3

Webmaster Google - нужный вам сайт - пункт меню - Индекс Google - удалить URL-адреса, удаляет обычно в течение нескольких дней.

1

SU

93

SergUA

7 апреля 2015, 21:38

#4

MxWhite:
Webmaster Google - нужный вам сайт - пункт меню - Индекс Google - удалить URL-адреса, удаляет обычно в течение нескольких дней.

запрос постранично нужно добавлять, а у меня их не мало (

MW

136

MxWhite

7 апреля 2015, 22:21

#5

Можно указать как категорию /категория* - удалит все страницы категории, вроде как-то удалял именно таким способом, т.е. по определенной маске что ли, давно было( или /категория/* - точно не помню.

33

OsirisUA

8 апреля 2015, 08:09

#6

Гугл не сразу удаляет с индекса, но удаляет. Попробуйте заново дать на пересмотр роботс.тхт. У меня была страница выпала с индекса, после изменил роботс.тхт, дал на пересмотр. Ждал неделю, вернулась. Все еще зависит от ресурса, думаю, что популярные он быстрее обходит

1

Проводим водолазные работы (http://diving-ms.com.ua/ru/articles/100-diving-operations) в Украине

Как удалить /каталог/ из Удалить ненужные страницы из Пошел на отчаяный шаг

33

OsirisUA

8 апреля 2015, 10:39

#7

Чтобы не создавать темы левые, подскажите, пжл.

Заблокировал в роботс.тхт ссылку типу:

\article\odin-dwa-

а теперь гугл заблокировал ссылку \article\odin-dwa-tri-chet

Описание недоступно, причина в роботс.тхт.

Почему заблокирована ссылка, которую не запрещял. причина в частичном совпадении адреса? Но не использовал *.

Яндекс и дубли Запретить в роботс.тхт ФАК - как мне

C

27

Choice

8 апреля 2015, 11:45

#8

Вы попробуйте canonical прописать еще. Думаю ,что поможет.

1

42

vanred79

8 апреля 2015, 12:17

#9

SergUA:
В общем ситуация в следующем, где то полгода назад, вместо карточек(сайт доска объявлений) в индекс полезли все редиректные ссылки на сайты указанные в объявлениях.
И в придачу в выдаче к этой ссылке подтягивает тайтлы сайта на который идет ссылка.

проверил роботс заметил, что нет запрета на индексацию этих ссылок(потому как до этого менял сам шаблон этих ссылок) - добавил запрет, проверил в вебмастерс все работает.

Но вот с индекса до сих пор страницы не ушли.

Как это исправить?

Через метатеги попробуйте закрыть ссылки и тайтлы http://google.utk.edu/ut-help/googleongoogleoff/. На моем сайте это работает.

1

Большой выбор квартир в Алматы посуточно найдете на нашем сайте (https://nedvizhimostpro.kz/page/47)

107

Forza!

9 апреля 2015, 08:48

#10

SergUA:
проверил роботс заметил, что нет запрета на индексацию этих ссылок(потому как до этого менял сам шаблон этих ссылок) - добавил запрет, проверил в вебмастерс все работает.

Сколько уже было таких тем. Файл robots.txt запрещает сканирование, а не индексирование. Если все так, как написано, то они возможно никогда и не уйдут из индекса, т.к. они в индексе, а робот уже просто их не видит, ему запрещено. Тут 2 варианта:

1) Оставить запрет в robots.txt и в WMT вручную сделать запрос на удаление. За сутки должно все почистить.

2) Убрать запрет в файле, и прописать теги noindex.

OsirisUA:
Заблокировал в роботс.тхт ссылку типу:
\article\odin-dwa-

По умолчанию директива Disallow: /page равнозначна директиве Disallow: /page*, поэтому нужно как-то думать в сторону allow. Не помню, кстати, Google воспринимает в роботсе $ как окончание строки?

Правильный алгоритм раскрутки Не добавляется страница в Что нужно сделать чтобы

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

Open AI тестирует память для ChatGPT