Метки рекламных кампаний. Интересно зачем яндекс их индексирует?

Pavel Medvedev
На сайте с 27.01.2006
Offline
166
1622

Постоянно вижу у сайтов, которые крутят рекламу дубли с метками в выдаче яндекса.

типа

site.ru/page.php

site.ru/page.php?utm_campaign=roemlinks&utm_source=twitterfeed&utm_medium=twitter

site.ru/page.php?utm_source=NL&utm_campaign=NL_15_apr&utm_medium=NL

site.ru/page.php?utm_source=mail_ru&utm_medium=teaser&utm_campaign=mail_ru_left_column

site.ru/page.php?utm_source=odnoklassniki.ru&utm_medium=banner&utm_content=200x300&utm_campaign=major-nissan_realweb

site.ru/page.php?utm_source=newsletter&utm_medium=email&utm_campaign=Добро_пожаловать_в_мир_Бизнес-Молодости!

Страницы, естественно 100%-ные дубли /page.php

Назначение этих урлов абсолютно очевидно и непонятно зачем их включать в выдачу.

Помимо мусора, яндекс так же палит чужие кампании получается, можно посмотреть где сайт рекламируется, названия кампаний:

Например такие страницы у гугла

у рамблера

mail.ru

ну или у самого яндекса

Помимо utm есть еще openstat, gclid и др. Их яндекс тоже с радостью индексирует.

Нафига?

Закрывать все это в роботс? А почему яндекс и остальные приведенные сайты не закрыли ? :)

Причем ранжирует такие страницы почти всегда корректно, ставя исходную страницу выше.

Консультирую по SEO. Опыт c 2005: окна топ1,Ашан,Фишки,Спортс и др. Пишите в FB.
Fruit
На сайте с 15.07.2008
Offline
166
#1

Отсеять полные дубли автоматом технически сложно: вы будете сравнивать содержимое всех страниц на сайте?

По урлу дубли тоже нельзя отличать: кроме сайтов с ЧПУ, есть так же сайты с урлами, состоящими из параметров.

Поэтому эта задача ложится на плечи веб-мастеров. Можно закрыть в роботсе (есть даже специальная директива Clean-param), но удобнее как правило прописывать канонические урлы в мета-теге на странице.

Pavel Medvedev
На сайте с 27.01.2006
Offline
166
#2

Fruit, ну например конкретно наличие

utm_source=

utm_medium=

utm_campaign=

utm_term=

utm_content=

это стопроцентный признак дубля

Clean-param тут не совсем корректно сработает. Если яндекс с Clean-param utm_source первой увидит страницу

site.ru/page.php?utm_source=NL, то он примет ее за основную, а site.ru/page.php склеится с ней и она вылетит из выдачи.

Канонические - да, но придется их тогда указывать у каждой страницы сайтов.

Fruit
На сайте с 15.07.2008
Offline
166
#3
sni:

utm_source=
utm_medium=
utm_campaign=
utm_term=
utm_content=
это стопроцентный признак дубля

А теперь представьте, что какой-то вебмастер об этом не знал и сделал CMS, где урлы формируются, с использованием одного из параметров? :)

Кто в Яндексе будет отслеживать новые появляющиеся параметры?

Думаю, что если они давно не сделали, предложенного вами, есть причины.

Fruit добавил 22.07.2011 в 17:09

sni:

Clean-param тут не совсем корректно сработает. Если яндекс с Clean-param utm_source первой увидит страницу

Clean-param: utm_source&utm_medium&utm_campaign&utm_term&utm_content

Так должно работать. В хэлпе у Яндекса есть примеры.

C
На сайте с 28.01.2010
Offline
70
#4

У меня на одном из проектов из-за ошибки в коде главная страница продублировалась по адресам типа page_id=xxx (xxx - число). Теперь в индексе яндекса 37 тыс дублей главной страницы этого сайта 🤪

Это - личная подпись. Здесь обычно ставят ссылки на всякие кривые сайты, надеясь получить "жирный бек".
Pavel Medvedev
На сайте с 27.01.2006
Offline
166
#5
Fruit:
А теперь представьте, что какой-то вебмастер об этом не знал и сделал CMS, где урлы формируются, с использованием одного из параметров?

Ну с такой же вероятностью вебмастер может сделать cms, где в качестве разметки будут всякие noindex использоваться. Отсутствовать тайтлы и прочие нужные теги. Да и видит же яндекс что дубли. Например попробуйте разные сайты хостом склеить? Наличие меток может быть лишь как один из признаков.

Fruit:
Clean-param: utm_source&utm_medium&utm_campaign&utm_term&utm_content
Так должно работать. В хэлпе у Яндекса есть примеры.

Прочитал: да, похоже яндекс сменил логику работы Clean-param: В прошлый раз когда читал страницу хелпа про Clean-param, там было написано другое.

Кстати проверил на одном сайте - Clean-param работает по старому алгоритму или просто не переиндексировалось еще.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий