PDA

Просмотр полной версии : Дубли контента на https


ColdMAN
25.09.2012, 09:05
Как правильно решить проблему дублирования контента сайта на http и https протоколах.

Яндекс индексирует и там и там.

Как указать основное зеркало http://site ?

Кто-нибудь использовал присвоение предпочитительного (канонического) url для страниц на https

Атрибут rel="canonical" тега <link>.
help yandex (http://help.yandex.ru/webmaster/?id=1111858#canonical)
help google (http://support.google.com/webmasters/bin/answer.py?hl=ru&answer=139394) у гугла четко написано, что можно.


Ещё прочитал на форуме, что ТИЦ для сайта на https обнуляется и ссылки на https сайт, как-то криво учитываются?

ColdMAN
25.09.2012, 14:39
Кто-нибудь сталкивался с данной проблемой?

ColdMAN
25.09.2012, 19:25
Ну что. Получил официальный ответ яндекса. Надеюсь ещё кому-нибудь поможет.


На самом деле, все необходимое для решение этой задачи с Вашей стороны уже сделано. Так как при обращении к сайтам http://site.ru и https://site.ru отдается одинаковое содержимое, то со временем они будут склеены в единую группу зеркал (более подробную информацию о том, какие сайты Яндекс считает зеркалами, Вы сможете получить на странице http://help.yandex.ru/webmaster/?id=995297). После склейки индексироваться и участвовать в поиске будут только страницы главного зеркала, которое будет выбрано в соответствии с указаниями директивы Host в файлах robots.txt всех зеркал.

Если Вы захотите сделать главным зеркалом сайт с защищенный протоколом, то значение директивы Host должно содержать префикс https// . Если же главным зеркалом должен стать сайт с обычным протоколом, то никакого префикса указывать не нужно.(не знал, что так можно)

Обратите внимание, процесс склейки зеркал происходит автоматически и может занимать 4-6 недель, ускорить его, к сожалению, нельзя.

C4ACTbE
13.12.2012, 10:47
Роботс был с директивой HOST и все равно в индексе сайт с HTTP и HTTPS.
Сделал роботс для HTTPS отдельный и закрыл сайт от индексации. Посмотрим что получится.

Ladycharm
13.12.2012, 11:36
Ещё прочитал на форуме, что ТИЦ для сайта на https обнуляется ТИЦ рассчитывается для доменного имени, протокол доступа никакой роли не играет. Домен может вообще не быть делегирован и отвечать на http-запросы.

Ида, как вы сможете посмотреть ТИЦ, например, для http:google.ru и https:google.ru ?