Разные ли это страницы? О регистре и редиректах

1 234
богоносец
На сайте с 30.01.2007
Offline
771
#21

/ru/forum/701466

vagogrande:
и Яндекс и Гугл считали это разными страницами и дублями

А вот тут дубли есть?

С т.з. человека — это дубли, но с т.з. ботов — дублей тут нет, поэтому их и можно видеть. Если бы ПС сочли это дублями, то, скорее всего, просто не проиндексировали бы. И вот тут дублями (c т.з. бота) являются не все.

vagogrande
На сайте с 25.02.2012
Offline
110
#22
богоносец:
/ru/forum/701466

А вот тут дубли есть?
С т.з. человека — это дубли, но с т.з. ботов — дублей тут нет, поэтому их и можно видеть. Если бы ПС сочли это дублями, то, скорее всего, просто не проиндексировали бы. И вот тут дублями (c т.з. бота) являются не все.

Кто Вам сказал такую глупость, что дубли не индексируются? Дубли прекрасно могут быть проиндексированы это я наблюдал у себя, сейчас зачистил. Или Вы хотели сказать, что дубли не присутствуют в выдаче? Не проверял.

Совсем недавно чистил у гугла следующие дубли (это немножко в сторону от начального вопроса):

site1.ru/page/

site1.mainsite.ru/page/

И они были прекрасно проиндексированы. И серьезно влияли на ранжирование обеих сайтов.

site1.ru и mainsite.ru - это сайты абсолютно разной тематики.

PS. Мое мнение адреса:

site.ru/page1

site.ru/pAge1

Для поисковой системы являются абсолютно разными адресами.

И ответ вашего сайта на обращение по адресу site.ru/pAge1 может быть следующий (варианты) :

- Редирект 301 на один из адресов

- Ответ 404 по одному из вариантов (что менее желательно, так как существует вероятность, что на страницу site.ru/pAge1 имеются внешние или внутренние ссылки)

- Разное содержимое. Если в этом нет крайней необходимости, то такое решение нежелательно. Сложно контролировать внешние и внутренние ссылки, возможно изменение алгоритмов поисковых систем, ди и самому запутаться легко.

- Канонический адрес (самое простое и работающее решение)

Если у вас сайт отдает один и тот же контент по адресам:

site.ru/page1

site.ru/pAge1

То продвинуть такие страницы очень сложно. Если такая картина наблюдается по всему сайту, потеря трафика может составлять 15-20% (по моему опыту). Серьезных фильтров не наблюдал.

Блеск в его глазах был заревом праздничного салюта, которым его тараканы отметили окончательную победу над разумом
богоносец
На сайте с 30.01.2007
Offline
771
#23

Мне эти длинные пояснения не нужны.

Вернёмся от бурных эмоций по поводу того, что я не говорил... к вопросу: А вот тут дубли есть? А тут вот?

(для человека есть)

Ещё можете попробовать получить дубли в индексе

http://www.ashmanov.com/coMpanY

http://www.ashmanov.com/coMpAnY

http://www.ashmanov.com/coMpany

http://www.ashmanov.com/CoMpanY

http://www.ashmanov.com/coMpaNy

200 OK

Повторюсь:

Дублями их делает не регИстр урла, а одинаковый контент // но по этому признаку ПС научились тупо отфильтровывать.
Гораздо легче проиндексить дубль страницы с регулярно изменяющимся контентом:

http://www.ashmanov.com/company/nEws

http://www.ashmanov.com/company/neWs

http://www.ashmanov.com/company/News

http://www.ashmanov.com/company/news/разогнал-сеошников

http://www.ashmanov.com/company/news/забил-на-SEO☻

(как и на изменчивом www.yandex.ru/m?X боты... не видят дублирования)

vagogrande
На сайте с 25.02.2012
Offline
110
#24

Вынужден признать, что яндекс каким-то образом склеил страницы. Но нельзя утверждать, что он за это не штрафанул. Хотя, кто его знает и я не всеведущ.

Офтоп. Данная страница серьезно поколебала мои знания о работе с сайтами. Дмв метатега charset, 16 ошибок html.

sitemap 216 страниц

В индексе яндекса 527 (куча файлов ppt+ русские url) Из sitemap 46 страниц нет в индексе. Всего 109 url выкинутые из индекса, но отдающие 200.

Google

Файл robots.txt и sitemap.xml в индексе

В основном индексе, который по запросу с /& нет 109 страниц из sitemap.xml и еще куча интересных вещей.

Есть повод для размышления. :)

DiAksID
На сайте с 02.08.2008
Offline
236
#25
vagogrande:
... Google

Файл robots.txt и sitemap.xml в индексе...

в гугле это запросто: "посмотреть как бот" => "отправить в индекс". ловкость рук и никакого шаманства 😂 ... и профита ...

show must go on !!!...
богоносец
На сайте с 30.01.2007
Offline
771
#26
vagogrande:
Вынужден признать, что яндекс каким-то образом склеил страницы.

Вот по этому запросу несколько недель назад был дубль и в Яндексе, но вот уже находится раздел, приходится с + искать или так... т.е. обычно он их просто не показывает.

Дублирование тегов и кривой HTML ботам проблем обычно не создают.

Но вы уже дважды отвлеклись от моего вопроса про дули/не-дубли у yandex.ru/m

А если продолжить думать: а как бы я писал олгоритм, чтобы не засерать закрома... то дубли желательно отфильтровать до того, как они заняли место (почему мы их можем так никогда и не увидеть, не заподозрив никаких проблем).

Пример с ашманов/coMpanY не совсем правильный, там слегка меняется контент,

но таких дублей не получилось:

sealytics.ru/analitika/anomalii-v-podskazkah-Yandeks/

sealytics.ru/analitika/anomalii-v-podskazkaH-yandeks/

ДорвейСтрой давно пытается подобные тонкости использовать.

V
На сайте с 29.01.2014
Offline
0
#27

Может не в тему, но кто-нибудь надеюсь подскажет. Как отразится смена доменного имени сайта в поисковиках (конкретно Яндекс). Не воспримет ли он новый, недавно созданный домен как копию и не отбросит ли назад в поиске?

[Удален]
#28

богоносец, кстати достаточно интересный момент в обоих поисковиках, только гоша пошёл чуть дальше, title он всё-таки выдал в поиск

P.S. стоит одна единственная внешняя ссылка на морду с www. (ещё до того как домен делегировал), сайт сразу выкладывался с запретом в роботсе и редиректом с www на без

MC
На сайте с 03.05.2013
Offline
51
#29
богоносец:
Вот по этому запросу несколько недель назад был дубль и в Яндексе, но вот уже находится раздел, приходится с + искать или так... т.е. обычно он их просто не показывает.

Дублирование тегов и кривой HTML ботам проблем обычно не создают.

Но вы уже дважды отвлеклись от моего вопроса про дули/не-дубли у yandex.ru/m
А если продолжить думать: а как бы я писал олгоритм, чтобы не засерать закрома... то дубли желательно отфильтровать до того, как они заняли место (почему мы их можем так никогда и не увидеть, не заподозрив никаких проблем).

Пример с ашманов/coMpanY не совсем правильный, там слегка меняется контент,
но таких дублей не получилось:
sealytics.ru/analitika/anomalii-v-podskazkah-Yandeks/
sealytics.ru/analitika/anomalii-v-podskazkaH-yandeks/

ДорвейСтрой давно пытается подобные тонкости использовать.

Так и я о том же, для яндекса это одинаковые страницы

sealytics.ru/analitika/anomalii-v-podskazkah-Yandeks/

sealytics.ru/analitika/anomalii-v-podskazkaH-yandeks/

, гугл видит как разные.

bestseekers.com (https://bestseekers.com/)
богоносец
На сайте с 30.01.2007
Offline
771
#30
burunduk:
только гоша пошёл чуть дальше, title он всё-таки выдал в поиск

Это анкор с http://5.urlnik.info/ru/decor-site.ru/

Вот то же самое. И вот.

Кэша нету, это не индексация.

Matt Cutts:
Так и я о том же, для яндекса это одинаковые страницы
sealytics.ru/analitika/anomalii-v-podskazkah-Yandeks/
sealytics.ru/analitika/anomalii-v-podskazkaH-yandeks/

/ru/forum/comment/12573079 // там надо покликать.

vagiz:
Не воспримет ли он новый, недавно созданный домен как копию и не отбросит ли назад в поиске?

Правильно думаете. Лучше ничего не менять, если не хотите проблем /ru/forum/835284

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий