о роутинге и формировании урла

12
VK
На сайте с 13.04.2016
Offline
3
1006

Здравствуйте.

У меня накопилось несколько вопросов о роутинге и формировании урла.

1) Как Яндекс и Google кушают такие дубли:

site.ru/index.php

site.ru

2) Главная страница доступна по такому урлу:

site.ru/любая_чушь

Естественно я понимаю, что дубля не будет пока не будет где-нибудь проиндексированной ссылочки. Вопрос в том, понимает ли ПС, что это одна и та же страница?

antibiotiq
На сайте с 16.10.2012
Offline
28
#1
vitia_klip:
Здравствуйте.
У меня накопилось несколько вопросов о роутинге и формировании урла.

1) Как Яндекс и Google кушают такие дубли:
site.ru/index.php
site.ru

Гугл и Яша все понимают. Но 301 редирект на основное зеркало надо сделать . В вашем случае склеить site.ru и site.ru/index.php 301 серверным редиректом.

vitia_klip:

2) Главная страница доступна по такому урлу:
site.ru/любая_чушь

Вы указали site.ru/любая_чушь как основное зеркало в GSC и Яндекс Вебмастере, или что вы имеете ввиду?

VK
На сайте с 13.04.2016
Offline
3
#2
antibiotiq:
Вы указали site.ru/любая_чушь как основное зеркало в GSC и Яндекс Вебмастере, или что вы имеете ввиду?

Что значит GSC? Я имею ввиду, что если ввести вот так: site.ru/dasfdsdafsdf, то вас не бросит на страницу ошибки 404, а вас бросит на главную

antibiotiq
На сайте с 16.10.2012
Offline
28
#3
vitia_klip:
Что значит GSC? Я имею ввиду, что если ввести вот так: site.ru/dasfdsdafsdf, то вас не бросит на страницу ошибки 404, а вас бросит на главную

Google Search Console

Для несуществующих страниц правильнее будет настроить вывод специальной страницы 404 ошибки с верным ответом сервера 404 . Вот правильный пример реализации:

А редиректить все несуществующие страницы на главную - это не верное решение.

VK
На сайте с 13.04.2016
Offline
3
#4
antibiotiq:
Google Search Console
Для несуществующих страниц правильнее будет настроить вывод специальной страницы 404 ошибки с верным ответом сервера 404 . Вот правильный пример реализации:

А редиректить все несуществующие страницы на главную - это не верное решение.

Спасибо, но это все знаю)

Вопрос в том - как воспринимает ПС такие страницы? Они воспринимают такие страницы как новые страницы или все таки выкидывают их из поиска самостоятельно?

zveroangel
На сайте с 14.04.2011
Offline
182
#5

яндекс воспринимает их как дубли и на свое усмотрение выбирает одну из них и оставляет в поиске, а вторую выкидывает из поискового индекса. так вот усмотрение у него может быть очень размытое, захочет одну выберет, захочет другую, поэтому все дубли и все что на них похоже либо закрываются в роботсе, либо клеятся редиректом, либо каноникал. насчет того, что индексируются только если ссылка есть - то это не так. как минимум, может проиндекситься благодаря метрике. ну и вообще cms сами внутри могут такие ссылки содержать. насчет того, что у вас любая чушь открывается - возможно, неправильно настроена 404.

antibiotiq
На сайте с 16.10.2012
Offline
28
#6
vitia_klip:
Спасибо, но это все знаю)
Вопрос в том - как воспринимает ПС такие страницы? Они воспринимают такие страницы как новые страницы или все таки выкидывают их из поиска самостоятельно?

НУ если вы их склеиваете - редиректите на главную, ну как будет ПС воспринимать?!Логично же, что как главную, вы же ее склеили. ПС за это сильно не пессимизирует, но и не посчитает правильной оптимизацией веб-ресурса для пользователей и ПС. Поэтому надо для таких страниц реализовывать правильно решение:

Страница не существует - показать 404 страницу- показать правильный ответ сервера 404. Все ж логично. И так же воспринимают ПС. Прочитайте подробную информацию по кодам ответа сервера и применяйте эти решения в своих случаях.

N
На сайте с 07.03.2016
Offline
63
#7
vitia_klip:
Вопрос в том, понимает ли ПС, что это одна и та же страница?

Нет, к сожалению не понимает. Юзайте редирект с длинных урлов на site.ru

antibiotiq
На сайте с 16.10.2012
Offline
28
#8
zveroangel:
яндекс воспринимает их как дубли и на свое усмотрение выбирает одну из них и оставляет в поиске, а вторую выкидывает из поискового индекса. так вот усмотрение у него может быть очень размытое, захочет одну выберет, захочет другую, поэтому все дубли и все что на них похоже либо закрываются в роботсе, либо клеятся редиректом, либо каноникал. насчет того, что индексируются только если ссылка есть - то это не так. как минимум, может проиндекситься благодаря метрике. ну и вообще cms сами внутри могут такие ссылки содержать. насчет того, что у вас любая чушь открывается - возможно, неправильно настроена 404.

ПС не выкинет из индекса главную страницу и оставит не существующую, по следующим причинам:

1. ПС по коду понимает что главная страница это главная.

2. Редирект четко указан с какого урла на какой. Другое дело когда вы захотите сделать главную страницу типа site.ru/ru вместо site.ru . Он просто выкинет из индекса site.ru/ru и оставит site.ru, хотя в .htaccess настроен верно редирект с site.ru на site.ru/ru. Все логично. (могу в личку скинуть пример сайта)

3. Главная страница задана в gsc и яндекс вебмастере.

Посчитает неправильной оптимизацией сайта и предпочтительнее отнесется к сайту с правильным решением для несуществующей страницы.

богоносец
На сайте с 30.01.2007
Offline
774
#9

Ну хватит фантазировать. Что значит «понимают»?

www.yandex.ru/search/?text=url%3Awww.yandex.ru%2Fm*

www.google.ru/search?q=site%3Awww.yandex.ru%2Fm

vitia_klip:
Вопрос в том - как воспринимает ПС такие страницы? Они воспринимают такие страницы как новые страницы или все таки выкидывают их из поиска самостоятельно?

Это зависит от (одинаковости) их содержимого www.google.ru/search?q=site:searchengines.guru+inurl:hash

Могут и не выкинуть, а могут выкинуть ту, которую вы продвигаете.

ps Забавнее оказалось с

http://slash.500mb.net/w

http://slash.500mb.net/w/

http://slash.500mb.net/w//

http://slash.500mb.net/w///

таким мешает залазить в индекс способ проверки ПС перед индексацией, типа говорят «уже проиндексировано»... как бы в запросе / не чувствуют.

antibiotiq
На сайте с 16.10.2012
Offline
28
#10
богоносец:
Ну хватит фантазировать. Что значит «понимают»?

Почему фантазировать? Допустим движек джумла:

Просмотрев исходный код можно понять, где главная страница. Получается ПС не могут проанализировать весь код , понять где и как построена структура сайта и контент? Может впорос в том что неправильно оптимизирован, структурирован сайт и ПС выкидывает не ту страницу из индекса? То что зависит от одинаковости содержимого это очевидно, по этому я и написал "понимают". Поправьте меня плз, если я не верно понимаю.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий