В поисковике вбить и поискать, как зафильтровать твой тип страниц. Убирал с роботс правило Disallow index Html - Google

Дубли страниц

starokonka · 2012-08-28T08:21:26.0000000Z

Привет всем, никак не могу избавиться от этой проблемы, может кто что подскажет. Перепробовал уже все, поставил <meta name="robots" content="noindex,nofollow" >, указал в панели веб мастера какие страницы за что отвечают, прописал в robots.txt Disallow: *?filter* и Disallow: *?page* один хрен индексирует их, каждую неделю удаляю в панели эти страницы, так на второй день опять их загоняет. Уже думаю может установить на эти страницы rel="canonical".. Прикрепил файл.

186

Doroshev

29 августа 2012, 11:36

#11

Вот, что мне посоветовали на форуме webimho:

Закрыл URL-ы вот такого типа:

Disallow: /catalog/1/12/36.html

Disallow: /catalog/1/12/101.html

Disallow: /catalog/1/12/736.html

вот так:

RewriteCond %{QUERY_STRING} 1\/(.*)\/

RewriteRule ^.*$ - [G]

Если что - можно в поисковике вбить "htaccess rewritecond" и поискать, как зафильтровать твой тип страниц, чтобы они выдали 410.

Я вот все никак не доберусь до этого.

---------- Добавлено 29.08.2012 в 14:36 ----------

Сам толком еще не разобрался, но думаю изучить этот вопрос :)

Рекомендации по созданию ЧПУ О чем нужно помнить Как правильно сделать редирект,

S

18

starokonka

29 августа 2012, 16:21

#12

easywind:
Почему всем помогает а Вам нет? Может дело в руках?

)))) Если б мне помогло, я б не задавал бы этот вопрос )) Причем тут руки, если все сделано по правилам, но каким-то странным образом ничего не помогает )

Мой сайт (http://www.remstroy.od.ua)

T

298

Thanx

29 августа 2012, 17:13

#13

Прописывай canonical.

У меня на одном сайте в индексе оказалась тысяча страниц, которые взяты аж с технического адреса... Причём с этих страниц редиректит на правильные, но всё равно они в индексе, т.е. даже .htaccess не лечит. Прописал везде canonical. Жду.

Яндекс отключает поддержку rel="canonical" Google не поддерживает атрибут Джон Мюллер о завершающих

S

18

starokonka

29 августа 2012, 19:31

#14

Doroshev:
Вот, что мне посоветовали на форуме webimho:
вот так:
RewriteCond %{QUERY_STRING} 1\/(.*)\/
RewriteRule ^.*$ - [G]

А пользователь что тогда тоже будет видеть 410.

76

donty

29 августа 2012, 19:54

#15

Thanx:
Прописывай canonical.
У меня на одном сайте в индексе оказалась тысяча страниц, которые взяты аж с технического адреса... Причём с этих страниц редиректит на правильные, но всё равно они в индексе, т.е. даже .htaccess не лечит. Прописал везде canonical. Жду.

У меня везде прописано canonical - но... Гуглу все равно все равно :), кажется он вообще все игнорирует.

Тайны НЛО и бермудский треугольник ( http://tajny-nlo.ru/ )

E

283

easywind

29 августа 2012, 20:05

#16

starokonka, объяснить поечему не помогает? Думаю у Вас так бот проиндексировал страницу. Вы ему потом вставили в робот не сканировать и на страницу ноиндекс правильно? Вы недаете ему прочитать ноиндекс так как поставили не сканировать вот и вся проблема.

Google: расположение внутренних ссылок Google ответил на вопрос Как Google сканирует страницы

164

Straifer1

30 августа 2012, 07:28

#17

Проводил эксперимент по дублям, тоже гугл игнорировал и роботс и указания в WMT. Сделал копию сайта, только для гугла, хватило лишь роботс что бы проиндексировалось только то, что нужно. в яндексе почему то всё было впорядке когда я в роботс прописал рекомендации, достаточно оперативно весь мусор уплыл... Вывод - гугл в этом плане кривой, а не руки у вебмастеров.

Как лучше закрывать домен Апдейт поисковой базы 14.10.14 robots.txt для Wordpress?

E

283

easywind

30 августа 2012, 10:54

#18

Straifer1:
тоже гугл игнорировал и роботс и указания в WMT.

Этого не достаточно. Читайте посты выше про ноиндекс.

S

18

starokonka

30 августа 2012, 11:33

#19

easywind:
starokonka, объяснить поечему не помогает? Думаю у Вас так бот проиндексировал страницу. Вы ему потом вставили в робот не сканировать и на страницу ноиндекс правильно? Вы недаете ему прочитать ноиндекс так как поставили не сканировать вот и вся проблема.

Вы думаете что я так не делал? Убирал с роботс правило и оставлял только ноиндекс, понаблюдав за этим 2 месяца я вернул обратно в роботс данное правило так как в WMT каждый день появлялось до 100 ошибок....

Раньше также индексировались вот такие страницы: /products/*/*/*;*/index.html но прописав в роботс правило Disallow: /products/*/*/*;*/index.html он их перестал сканировать )))) но вот страницы такого вида Disallow: /products/*/index.html?filter=[] так и продолжает индексировать.....

по роботсу. Вопросик про роботс Заставить индексировать по-моему

164

Straifer1

30 августа 2012, 13:17

#20

easywind:
Этого не достаточно. Читайте посты выше про ноиндекс.

Читайте пост внимательно про копию сайта! К тому же он и хлебные крошки на всех страницах копии учел в отличие от оригинала, так что не надо умничать и пустоcловить, что на форуме гугла, что здесь вы только этим и занимаетесь:)

Google заменит URL-ы страниц Google тестирует показ URL Google тестирует новый формат

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах

Дубли страниц