Проверка индексации документа по HTTPS

GD
На сайте с 21.08.2006
Offline
71
1779

Всем привет.

Как проверить для любого сайта, в индексе ли его главная страница по HTTPS или нет?

Некоторые хостинги оставляют возможность открытия сайта по https (для пользователя идет редирект, для поисковика 200 ОК), а Яндекс иногда любит их индексировать.

К примеру:

Яндекс 1 и Яндекс 2

Во втором случае сайт виден по https, нет сохраненки, другое написание домена.

Операторами типа URL, domain, site вторая версия сайта с https не находится.

Есть ли способ находить такие нелепые дубли не вот таким случайным методом?

S
На сайте с 05.01.2013
Offline
40
#1
GolDen:
Всем привет.
Как проверить для любого сайта, в индексе ли его главная страница по HTTPS или нет?

Есть ли способ находить такие нелепые дубли не вот таким случайным методом?

поставьте нормальный сертификат и прекратите сеять панику. url:https://devaka.ru/articles/moving-to-https нормально находится яндексом.

UPD был не прав, вспылил, согласен. Интересная тема, яндекс похоже не разумеет разницу между протоколами.

UPD2 Так вы по https и не доступны, переадресация идет, недавно поменяли или всегда так было?

W
На сайте с 13.09.2013
Offline
122
#2

На самом деле, очень интересная тема. Недавно столкнулся с проектом, у которого из-за хостинга проиндексировались https-страницы. Проверить их индексацию не всегда получается ни через site: и url:, ни через вебмастер, а в выдаче они есть. Причем по одному запросу в выдаче страница с http, а по другому - с https.

Пока самый верный способ - это взять выдачу по запросам вида "site:site.ru", "url:site.ru*" и "%слово, стречающееся на всех страницах% site:site.ru" и уже в этой выдаче искать дубли.

S
На сайте с 05.01.2013
Offline
40
#3
Wiiseacre:

Пока самый верный способ - это взять выдачу по запросам вида "site:site.ru", "url:site.ru*" и "%слово, стречающееся на всех страницах% site:site.ru" и уже в этой выдаче искать дубли.

Пробовал вчера так, вручную можно, но алгоритма внятного нет что бы автоматизировать. На втором запросе топикстартера яндекс после пары запросов стал выдавать https версию на запрос любой длины (в сторону сокращения). После сброса кук все вернулось - то есть срабатывает персонализация, но только на посещенную страницу, не на предпочитаемый протокол, как того хотелось бы. Поигрался на госуслугах - доступен по обоим протоколам, яндекс https не дает в принципе, но можно выхватить https версии поддоменов. Сохраненки у https нет, даже если это единственная версия сайта (не доступен по http).

Пока так, продолжаю искать способ проверки индексации именно https в случае доступности сайта по обоим протоколам - удивительно, но на эту тему еще ни разу не натыкался и сам внимания не обращал.

W
На сайте с 13.09.2013
Offline
122
#4
seogearbox:
Пробовал вчера так, вручную можно, но алгоритма внятного нет что бы автоматизировать. На втором запросе топикстартера яндекс после пары запросов стал выдавать https версию на запрос любой длины (в сторону сокращения). После сброса кук все вернулось - то есть срабатывает персонализация, но только на посещенную страницу, не на предпочитаемый протокол, как того хотелось бы. Поигрался на госуслугах - доступен по обоим протоколам, яндекс https не дает в принципе, но можно выхватить https версии поддоменов. Сохраненки у https нет, даже если это единственная версия сайта (не доступен по http).
Пока так, продолжаю искать способ проверки индексации именно https в случае доступности сайта по обоим протоколам - удивительно, но на эту тему еще ни разу не натыкался и сам внимания не обращал.

Я снял топ 300 через XML по "%продвигаемый запрос"% site:%продвигаемый сайт%", а потом пробежался поиском. В принципе, если так https не нашелся, то я думаю, что никак не найдётся

По поводу автоматизации - у меня самописный скрипт снимает позиции и релевантные при каждом скане, настроил оповещение на https. Если снимаете через сервис или программу - пишите разработчикам, чтобы добавили такую фичу

S
На сайте с 05.01.2013
Offline
40
#5
Wiiseacre:
пишите разработчикам, чтобы добавили такую фичу

ну тут я сам немного разраб :)

Wiiseacre:
Я снял топ 300 через XML по "%продвигаемый запрос"% site:%продвигаемый сайт%", а потом пробежался поиском.

Вот в этом вся проблема - яндекс не смотрит на протокол при запросах, и то что страница не нашлась - не значит что ее нет в индексе. Но при этом совершенно непонятно - по каким критериям яндекс выбирает - какую страницу показать - на http или https. То есть по факту - если сайт доступен по обоим протоколам - не вижу пока возможности достоверно проверить индексацию https версии, а это досадно.

Wiiseacre:
В принципе, если так https не нашелся, то я думаю, что никак не найдётся

ТС показал запрос, по которому находится. Неочевидный, непонятно как работающий, но все же какой ни какой - но повторяемый кейс.*Очень хочется надеятся что логика какая то все же есть, а не привычный последнее время рандом.

W
На сайте с 13.09.2013
Offline
122
#6
seogearbox:

Вот в этом вся проблема - яндекс не смотрит на протокол при запросах, и то что страница не нашлась - не значит что ее нет в индексе. Но при этом совершенно непонятно - по каким критериям яндекс выбирает - какую страницу показать - на http или https. То есть по факту - если сайт доступен по обоим протоколам - не вижу пока возможности достоверно проверить индексацию https версии, а это досадно.


ТС показал запрос, по которому находится. Неочевидный, непонятно как работающий, но все же какой ни какой - но повторяемый кейс.*Очень хочется надеятся что логика какая то все же есть, а не привычный последнее время рандом.

Согласен, достоверно не посмотреть, поэтому я положился на теорию вероятности - ядро большое, поэтому скорее всего встретятся такие страницы в индексе.

Но по-хорошему - нужно сразу настраивать редиректы на нужную версию для каждого проекта.

W
На сайте с 13.09.2013
Offline
122
#7
Вафелька:
Что мешает делать редиркет через .htaccess?

Дебилы-админы у хостера, у которых запрос идёт через nginx в апач, и в итоге апач https вообще не видит. Ну и ещё кучу вариантов можно придумать.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий