Изменения тега Canonical на пустое значение: вероятная причина - зеркало-дорвей

AlexGRR
На сайте с 23.12.2011
Offline
54
2488

Добрый день всем вебмастерам!

Если у вас в Яндекс.Вебмастере посыпались сообщения, что мета-тег Canonical изменился на пустое значение - пора бить тревогу! :idea: Вероятно, робот Яши считает, что у вашего сайта есть полное зеркало (вы об этом, конечно, ничего не знаете) и это зеркало - дорвей с обычным копипастом кода вашего сайта на левый домен (а вот об этом ничего не знает робот Яндекса)! Значит, тег Canonical в данном случае неуместен. Какие ещё может сделать выводы робот - неизвестно, но уж поверьте, это за гранью всякой логики…

Как я пришёл к такому выводу? Рассказываю. Однажды, я получил сообщения на почту от Яши, что у большинства важных страниц изменился тег Canonical. Открыв Вебмастер, заметил, что робот стал индексировать ссылки на почту вида:

<a href="mailto:*******@yandex.ru">

Как ссылки на страницы:

<a href="/mailto:*******@yandex.ru">

Естественно, таких страниц на сайте нет, посыпались 301 редиректы на главную.

Пишу 2 тикета в Платонам: один про тег Canonical, второй - про индексацию почтовых ссылок.

И получаю ожидаемые ответы (по тегу Canonical):

С Вашей стороны все в порядке, не беспокойтесь, пожалуйста. Мы проверим, почему пришло оповещение. Извините за неудобства.

А вот по индексации почтовых ссылок Платоны начинают писать ерунду (хотя это и ожидаемо):

Тег <a> служит для указания ссылки, а наш робот по умолчанию посещает каждую известную ему ссылку, поэтому может посещать также и такие адреса. К сожалению, затрудняемся сказать, почему эти ссылки не посещались ранее: возможно, что робот ещё не успел обнаружить такие ссылки или их посещение было запланировано только недавно, однако в самом по себе обращении к таким адресам нет ошибки.
Ограничить переход робота по ссылкам с такими адресами можно при помощи тега nofollow.
Если Вы не хотите, чтобы робот обращался к этим страницам, Вы можете запретить их индексирование в файле robots.txt, например, директивой вида:
Disallow: */mailto
В этом случае робот будет знать, что индексировать их не нужно и не будет к ним обращаться. Подробнее о файле robots.txt Вы можете прочитать на странице нашей Помощи: (ссылка на их бла-бла-бла). Рекомендую Вам также воспользоваться инструментом проверки файла robots.txt: (ссылка на их бла-бла-бла). Непосредственно в инструменте Вы можете корректировать указания и проверять, запрещены или разрешены необходимые Вам страницы к индексированию.

Естественно, такой ответ меня не устроил, и я начал "копать дальше". На этой странице задал вопрос Елене Першиной (сотрудник Яндекса, от которого можно иногда получить вразумительные ответы). Но ответ меня не порадовал:

Мне, к сожалению, к ответу нашего саппорта добавить нечего.

Короче, в этот раз Елена отморозилась. Тогда я опять написал в открытый тикет:

Объясните мне пожалуйста - директива mailto: игнорируется роботом?
Стандарты HTML для робота не указ?
И с какой стати робот самовольно изменяет код ссылки - добавляет
прямой слеш перед директивой mailto? Где в коде
<a class="email" href="mailto:*******@yandex.ru"> есть прямой слеш?

Уж не знаю, откуда у Платонов взялся вменяемый сотрудник, но он мне разъяснил ситуацию:

Мы проверили данный вопрос более подробно. Пожалуйста, примите извинения за некорректный ответ ранее. Атрибут mailto действительно не обрабатывается нашим роботом как отдельная ссылка.
Появление же таких ссылок в статистике обхода связано с тем, что в группу зеркал Вашего сайта https://avtoforex.ru/ входит также домен _ttp://cookem.ru, у которого в исходном коде есть ссылки по адресам вида <a class="email" href="_ttp://cookem.ru/mailto:*********@mail.ru">.
В случае, когда роботу известны ссылки на неглавном зеркале, робот может посещать аналогичные страницы и на главном зеркале, проверяя их на доступность. Если права на данный сайт принадлежат Вам, Вы можете удалить такие ссылки с сайта, чтобы робот не посещал их, либо ограничить их индексирование при помощи тега nofollow. На главном же зеркале ограничить запросы к таким ссылкам можно при помощи запрета в robots.txt.
Что же касается добавления слеша в адрес, в целом в таком поведении не будет ошибки. Если ссылка указана не по полному адресу, робот воспринимает её как относительную, поэтому полный адрес формируется относительно адреса домена site.ru/.

В группу зеркал моего сайта! Офигеть!!! А я об этом не знал! Иду по адресу _ttp://cookem.ru - открывается какая-то реклама. Смотрю код - обычный копипаст кода моего сайта, а в конце кода написано - ДОРВЕЙ!!! :madd:

Процитирую то, что я нашёл в коде:

Фиксированное плавающее окно заставка основного текста дора (ширина 100%, высота 100% закрывают экран полностью и смещаются, поэтому контент (содержание) окна должен быть адаптивным к экрану)

Вот так - робот Яндекса считает, что дорвеи - это зеркала моего сайта! :crazy:

Написал ответ Платонам и посоветовал посмотреть глазками, что их робот считает зеркалами - посмотрим, что они ответят.

А на тикет по поводу изменения Canonical ответа пока нет (прошло 5 дней) - видимо, не могут понять, почему робот смущается, когда есть одинаковый мета-тег Canonical на разных доменах…

На заметку: сколько можно зарабатывать на партнерках (http://avtoforex.ru/affiliate-program/439-skolko-mozhno-zarabotat-na-partnerkah-foreks.html)?
324 79
На сайте с 24.07.2012
Offline
188
#1

Тоже такуже срань заметил, че делать пок не шарю

Кто понял жизнь - бросил работу!
AlexGRR
На сайте с 23.12.2011
Offline
54
#2
324 79:
Тоже такуже срань заметил, че делать пок не шарю

Писать Платонам и объяснять им ситуацию. Надеюсь, если таких обращений будет много - примут меры.

324 79
На сайте с 24.07.2012
Offline
188
#3
AlexGRR:
Писать Платонам и объяснять им ситуацию. Надеюсь, если таких обращений будет много - примут меры.

Да мне особо оно нахер не надо, че там происходит — достал этот веб-мастер — шлёт и шлёт свою шляпу, контекст мне в помощь

Мне лично по барабану, я сморю только акк адсенс — остальное это бесы все))))

AlexGRR
На сайте с 23.12.2011
Offline
54
#4

Ну, если траф с Гугла - тогда да...

AlexGRR
На сайте с 23.12.2011
Offline
54
#5

Пришел ответ от Платонов. Отмазались, конечно, красиво:

Ранее сайт _ttp://cookem.ru (с http) выполнял редирект на домен https://avtoforex.ru , поэтому они были склеены в единую группу зеркал. Сейчас такого редиректа уже нет, контент сайтов действительно различается, поэтому в течение 2-3 недель они смогут расклеиться автоматически.

Что же касается атрибута rel="canonical", эти ситуации никак не связаны между собой. Наши специалисты сейчас разбираются, почему в Яндекс.Вебмастере появились такие уведомления.

И доказать им, что никакого редиректа не было - фактически невозможно...

Amigo_9876
На сайте с 01.04.2009
Offline
305
#6

Та же фигня, и я когда прочитал тему, аж присел.

Пойду напишу платонам на всякий

Меняюсь ссылками с украинских PBN (стройка, техника, грузоперевозки)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий