Google склеил совершенно разные страницы

Руслан С
На сайте с 12.12.2015
Offline
9
1000

Всем привет, друзья мои.

Есть сайт, на котором нету главной страницы. При переходе на / идет 302 редирект на последнюю публикацию. На этой странице, естественно, указан canonical.

При добавлении страницы в Google через Fetch as google, Google проиндексировал ее в течение 5 минут.

На следующий день, страница уже была доступна не по своему адресу, который указан в canonical и по которому она собственно и доступна, а по /. Меня такой расклад соответственно не устроил. Ведь на момент перехода, последняя публикация может быть совершенно другой. Пользователь найдет главную по одному запросу, а редирект пойдет на другую страницу.

Я решился на 301 редирект. Несмотря на то, что этот редирект кешируется, адрес Google должен был бы показывать новый.

Однако, этого не произошло. Google игнорирует 301 редирект, игнорирует тег canonical, в котором указана https страница, и выдает главную по http протоколу.

Я подумал, мало ли, прошло мало времени. Однако сегодня, Google все 4 публикации показывает только по адресу /. И что самое интересное, заголовок выдает от первой публикации, описание от 3. Это при том, что это физически разные страницы!

Что делать?

1. Создать главную страницу, на которую нигде не оставлять ссылок, и выводить что-то типа "перейти к последним публикациям". Можно даже красиво оформить.

2. JS-редирект. Я слышал, он ведет себя, как 301.

3. Закрыть главную от индексации. В этом случае, временно выпадут все страницы, однако последующей склейки, как и передачи веса от ссылок на главную тоже не будет.

Похожая тема http://www.cy-pr.com/forum/f7/t61955/ .

Кстати, основное зеркало сайта https. Но естественно, я не могу указать canonical на главной, так как ее не существует, там редирект. Поэтому, мало того, что по всем запросам - главная, так еще и по http протоколу.

Редирект с http на https не очень хочу делать. Я использую HTTP/2 с fallback на SPDY. Все, что не поддерживает это получает страницы по http. Все, что поддерживает, получает страницу по https через HSTS preload.

E
На сайте с 21.09.2009
Offline
283
#1
Руслан С:
Что делать?

не мучить мозг, если он не понимает, для чего нужны редиректы. Сделать, по человечески, чтобы пользователь видел тоже самое что и бот. Иначе будет полная ерунда. Читать лично я, такой сайт не буду, который вместо одного, дает другое.

Руслан С:
Редирект с http на https не очень хочу делать.

и зря. Нужно использовать один и тоже протокол на всем сайте. Иначе вопросов "почему я хочу так а бот делает так" будет еще больше :)

Руслан С
На сайте с 12.12.2015
Offline
9
#2
easywind:
Сделать, по человечески, чтобы пользователь видел тоже самое что и бот.

Пользователь видит то же самое, что и бот. Просто главной страницы не существует, сразу идет редирект на последнюю публикацию. Я отказался от страниц рубрик, в том числе главной, чтобы не дублировать контент и уменьшить количество пустых кликов (UX).

Закрыл главную страницу в robots.txt. Отправил запрос на удаление страницы из индекса через Google My Removal-Tool. Главная страница пропала с индекса, но главное зеркало не появилось. Спустя сутки после удаления главной из индекса, она снова появилась в выдаче, несмотря на запрет в robots.txt, даже сниппет появился.

A
На сайте с 25.10.2014
Offline
99
#3
Закрыл главную страницу в robots.txt.

Смысл обрывать краулинг?

удаление страницы из индекса через Google My Removal-Tool

Внимательно прочитать об основном назначении инструмента. В консоли доступен весь хелп.

Про остальное сказать трудно, не видя сайта. Единственно, что видно - то, что ломаете сайт.

Руслан С
На сайте с 12.12.2015
Offline
9
#4
aldous:
Смысл обрывать краулинг?

Для crawl - sitemap.xml.

aldous:
Внимательно прочитать об основном назначении инструмента. В консоли доступен весь хелп.

Внимательно прочитайте тему. Мне не нужна главная страница в выдаче. Она динамическая. My Removal-Tool предназначен для удаления из выдачи удаленных страниц. В данном случае, главной вообще не существует физически. Но под этим адресом благополучно выводился контент со всех внутренних страниц. Наверное, через редирект на те самые страницы.

Друзья, вы когда нибудь пользовались Apple Mail? Там, как и в большинстве программ от Apple, нету главной страницы, как в Gmail. А открывается сразу последнее письмо и отдельная колонка для навигации. И это удобно! Вот таким способом у меня реализована структура сайта. Все для UX! А Google ломает мой сайт, через его современный формат.

[ATTACH]149768[/ATTACH]

jpg Problems-with-Mail-in-Mavericks.jpg
paveldvlip
На сайте с 16.01.2007
Offline
155
#5

У меня на сайте есть некоторое количество страниц-редиректов перехода на другие сайты. Что-то вроде "вы переходите на такой-то сайт, бла-бла-бла и все дела...". Эти страницы редиректят автоматом через 10 секунд на целевой сайт. Там не 301-й, но всё же.

Раньше они были закрыты для индексации, но недавно попробовал их открыть и увидел, что в индексе Гугла по запросу site:mysite.ru для этих страниц показывается заголовок и сниппет целевой страницы. Хотя адрес страницы мой, но контента там такого просто нет.

Я думаю логика Гугла такая: раз страница редиректит куда-то, то можно считать, что она эквивалентна целевой. Вот он и вытягивает оттуда контент, а показывает более трастовую, что ли, думая, что переход всё равно будет осуществлён.

Видимо, не любит динамические редиректы.

TopSite () - программа определения позиций сайта, массовой проверки всех видов частотности, сбора позиций конкурентов и кластеризации запросов. HTML-отчёты.
E
На сайте с 21.09.2009
Offline
283
#6

Руслан С, Вы сами себе портите жизнь. Зачем удалять то, что пересылается редиректом на другое? В некоторых подобных случаях, удаляется и страница, на которую редирект :) Структура сайта, гугл берет не только из сайтмапа, но и прямыми проходами по страница, хлебными крошками и т.д.

Руслан С
На сайте с 12.12.2015
Offline
9
#7

Сделал в качестве главной форму поиска плюс ссылки на пять последних публикаций. Естественно, нигде в навигации ссылку на главную не размещаю. Google сразу проиндексировал главную и вернул 3 из 4 выкинутых страниц в индекс.

За главной числилось пару ссылок, поэтому, решил, пускай вес лучше динамически будет новым публикациям переходить, чем застрянет в пустоте.

Сложно назвать это решением. Не думал, что отсутствие главной такая проблема. У того же Google, iCloud, и других крупных сайтов динамический редирект с главной.

E
На сайте с 21.09.2009
Offline
283
#8

Руслан С, у гугла имеется ввиду главная поиска? А она сама в поиске участвует? :) зайду я на сайт, прочитаю. Заинтересуюсь другим, а как мне другие то смотреть статьи, если нет нафигации в виде рубрик? Уходить? я так и сделаю.

Руслан С
На сайте с 12.12.2015
Offline
9
#9
easywind:
Заинтересуюсь другим, а как мне другие то смотреть статьи, если нет нафигации в виде рубрик? Уходить? я так и сделаю.

Справа навигация, как в Apple Mail App. По умолчанию, отображаются похожие публикации, но есть кнопка, чтобы показать последние, есть поиск, есть возможность нажать на метки или выбрать из всех. Просто вместо двух страниц, у меня левая и правая колонка. Быстрее и меньше дубликатов.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий