как быстро убрать несуществующие страницы из индекса?

123

8 февраля 2017, 03:28

2658

Классический пример дублирования:

В индекс попадают страницы вида site.ru/?id=695,site.ru/?id=678,site.ru/?id=645.

Они дублируют не только главную страницу, но и некоторые внутренние страницы, но наибольшее количество дублей - на главной странице.

Таких страниц на сайте не было и нет, со всех адресов с GET-параметром id поставлены редиректы 301 на основные страницы. (На всякий случай уточняю, что 302 редирект вместо 301 никто не Поставил, эта ошибка исключена).

То есть страниц нет, а в индексе они есть.

Вопрос - как можно быстрее всего исключить такие страницы из индекса?

Не стремитесь сделать лучше - улучшайте!

396

Оптимизайка

8 февраля 2017, 03:34

#1

1. disable duplicates with your robots.txt

2. use <link rel="canonical" href="http://example.com/">

3. remove duplicate pages from yandex https://webmaster.yandex.com/tools/del-url/

4. remove duplicate pages from google https://support.google.com/webmasters/answer/1663419?hl=en

⭐ BotGuard (https://botguard.net) ⭐ — защита вашего сайта от вредоносных ботов, воровства контента, клонирования, спама и хакерских атак!

123

Павел Горбунов

8 февраля 2017, 03:36

#2

Оптимизайка, Thank your very much!

---------- Добавлено 08.02.2017 в 09:39 ----------

Оптимизайка:
1. disable duplicates with your robots.txt
2. use <link rel="canonical" href="http://example.com/">
3. remove duplicate pages from yandex https://webmaster.yandex.com/tools/del-url/
4. remove duplicate pages from google https://support.google.com/webmasters/answer/1663419?hl=en

It is possible only for the small number of pages.

In the case if there are thousands of such duplicated pages, it it impossible to submit every URL in del-url tools.

232

cblcg

8 февраля 2017, 06:05

#3

через панель вебмастера, но надо чтобы либо был запрет метатегами, либо 404, либо роботс.тхт - это касается яндекса

Есть программы которые позволяют массово отправлять на удаление, например такая программа как ComparseR способна... ну либо скрипт на imacros или зенке заказать

123

Павел Горбунов

8 февраля 2017, 07:07

#4

cblcg:
через панель вебмастера, но надо чтобы либо был запрет метатегами, либо 404, либо роботс.тхт - это касается яндекса
Есть программы которые позволяют массово отправлять на удаление, например такая программа как ComparseR способна... ну либо скрипт на imacros или зенке заказать

Вот это уже хорошая идея.

Зависит от количества таких страниц ,конечно.

А массовую отправку страниц на ПЕРЕиндексацию после смены урлов ComparseR может делать?

232

cblcg

8 февраля 2017, 07:23

#5

да, но сейчас в яндексе не более 10 в 1 день отправлять можно. Насчет гугла не знаю. демоверсии программы должно хватить для этого, т.е. покупать не надо ничего

---------- Добавлено 08.02.2017 в 11:24 ----------

важно чтобы потом они обратно не зашли, т.е. позаботится о закрытии их от индексации

123

Павел Горбунов

8 февраля 2017, 07:32

#6

cblcg:
да, но сейчас в яндексе не более 10 в 1 день отправлять можно. Насчет гугла не знаю. демоверсии программы должно хватить для этого, т.е. покупать не надо ничего

---------- Добавлено 08.02.2017 в 11:24 ----------

важно чтобы потом они обратно не зашли, т.е. позаботится о закрытии их от индексации

Но если их в robots.txt закрыть, то робот на них не сможет зайти. И не поймет, что их нужно удалить из индекса.

663

donc

8 февраля 2017, 07:43

#7

Павел Горбунов,

Только так

RewriteEngine On

Redirect 410 /страница 1 от корня

и так далее, все страницы

Если прям быстро надо. А потом эти строки убрать и поставить редерикт

Но так я делать не советую

Осуждаем применение нейросетей в SEO и не только ( https://webimho.ru/forum/148/ ) :) Продвижение сайтов от 25 000 в мес, прозрачно, надежно ( /ru/forum/818412 ), но не быстро, отзывы ( http://webimho.ru/topic/3225/ )

232

cblcg

8 февраля 2017, 07:47

#8

Павел Горбунов:
Но если их в robots.txt закрыть, то робот на них не сможет зайти. И не поймет, что их нужно удалить из индекса.

робот зайдет, просканирует и потом выплюнет запрещенные... но тут есть одно НО:

для яндекса правила в robots.txt железообетонны, а вот гугл может проигнорировать, поэтому для гугла чтоб на 100% надо использовать метатег robots почитать если не вкурсе

123

Павел Горбунов

9 февраля 2017, 02:24

#9

cblcg:
робот зайдет, просканирует и потом выплюнет запрещенные... но тут есть одно НО:
для яндекса правила в robots.txt железообетонны, а вот гугл может проигнорировать, поэтому для гугла чтоб на 100% надо использовать метатег robots почитать если не вкурсе

Мета-тег robots в данном случае лучше не использовать, чтобы избежать ошибок реализации.

Если настраивать его, и в случае поломки будет выводиться

на нужных страницах, ничего хорошего от этого не будет.

а вот link rel= canonical - здесь поможет, и ошибок не возникнет.

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах

Что такое Power BI и зачем это нужно бизнесу