Всегда нужно использовать rel="canonical" ?

богоносец
На сайте с 30.01.2007
Offline
769
#31
SeVlad:
ПС, получив урл неканонической страницы с каноникалом на другую скачает (пару сотен кбайт) её первый раз. Во второй уже будет знать, что нефик её качать.
Так?

Нет.

Неканоническую страницу Гугл может показывать в выдаче, гуглоиды признавались...

SeVlad:
Да каноникал-то тут причём?! (наличие тега никак на скорость не повлияет)
Да каноникал-то тут причём?! (внешние ссылки-то кто отменит?)

Каноникал кажется вебмастерам хорошим костылём-обоснованием плодить лишние урлы... на которые ещё и внешние ссылки могут появиться.

Не надо использовать идеологически вредных решений. HTTP-траф надо минимизировать.

Вот хочется хз какие урлы, делай #якорь #другой и разбирай их JS.

SeVlad
На сайте с 03.11.2008
Offline
1609
#32
богоносец:
Неканоническую страницу Гугл может показывать в выдаче, гуглоиды признавались...

Да они этого вроде и не скрывали. Ломает искать, но по моему об этом даже в их мане бьло написано.

Но опять всё в куче. Мы же вроде говорим нагрузках, о повтором посещении ботами.

богоносец:
Каноникал кажется вебмастерам хорошим костылём-обоснованием плодить лишние урлы..

Не, ну это уже безусловно, неправильно. Однако

а) для небольших сайтов это не есть проблема

б) для случайных урлов (вручную придуманных, а не генерённых движком) - нормальное решение. (при возникновении проблемы типа целевой атаки на сайт - решать по мере возникновения проблемы)

в) для временной страницы с динамич. содержимым (выборка товаров напр) тоже нормально, когда каноникал будет показывать на дефлтную страницу. Точнее так: в таких случаях лучше иметь каноникал, чем не иметь его вовсе или решать другими путями.

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
IBakalov
На сайте с 05.10.2011
Offline
218
#33
burunduk:
нельзя просто обрезать параметры для получения канонического урл, каноникл надо брать только из таблицы, т.е. нельзя просто брать uri и работать с ним как со строкой

Если все остальные ссылки на сайте реализованы с ЧПУ, то можно.

burunduk:
роботс кстати от этой проблемы спасает

В Яшке может и спасает, а вот в Гугле нет.

+ на страницу с метками может быть входящая ссылка, через каноникал на основную страницу она будет учитываться, а если в роботс закроешь, то нет.

burunduk:

а что делать вот с таким url
site.ru/cat/produktразныйбред?разныйбред
каноникл на site.ru/cat/produktразныйбред который отдаёт 404 код ответа или 301-302???

В этом случае site.ru/cat/produktразныйбред отдает 404 и site.ru/cat/produktразныйбред?разныйбред тоже отдает 404.

burunduk:

а в кучи цмс ещё есть косяк с папками, когда можно всунуть любой код (и js в том числе после имени домена), главное чтобы путь после него был правильный ;)

Это уже за кривизну сайтов, а не самой идеи каноникала.

богоносец:
Так что, пока боту приходится выплёвывать обратно левые страницы, он проиндексит ваших конкурентов, которые не подсовывают боту левых сцылок и вместо rel="canonical" настроили 301.

Тогда ты не сможешь учитывать данные с utm-меток. Ну или может есть способ настроить редирект со страниц с метками так, чтобы метрика/аналитикс их все равно учитывали? Поделитесь, буду благодарен.

burunduk:
проблема в QUERY_STRING могут быть лишние параметры, как их отделить без дополнительной обработки?

Без доп обработки никак. Но можно просто на сайте не использовать URL с гет-параметрами.

---------- Добавлено 20.06.2016 в 13:29 ----------

И да, если траблы с индексацией в Яше, то можно прописать

User-agent: Yandex

Disallow: /*?

А для гугла использовать каноникал, т.к. если просто закрыть в роботс, то они все равно будут в индексе гугла с пометкой "закрыт в роботс"

[Удален]
#34
IBakalov:
Без доп обработки никак. Но можно просто на сайте не использовать URL с гет-параметрами.
IBakalov:
Тогда ты не сможешь учитывать данные с utm-меток

я как раз об этом и говорю постоянно - любые гет параметры зло ;)

IBakalov:
Если все остальные ссылки на сайте реализованы с ЧПУ, то можно.

это практически не реально в большом им, без полной его переделки, а вот этого ни кто не даст делать

IBakalov:
+ на страницу с метками может быть входящая ссылка, через каноникал на основную страницу она будет учитываться, а если в роботс закроешь, то нет.

и фиг с ней, как показывает практика, лучше бы таких ссылок не было вообще - 100% спам от партнёрок

SeVlad
На сайте с 03.11.2008
Offline
1609
#35
burunduk:
любые гет параметры зло

Лёх, пн - это понедельник, не пятница ж. 😂

Я, блин, чуть пузо не сорвал.

богоносец
На сайте с 30.01.2007
Offline
769
#36

Это зло в любой день.

IBakalov:
Тогда ты не сможешь учитывать данные с utm-меток. Ну или может есть способ настроить редирект со страниц с метками так, чтобы метрика/аналитикс их все равно учитывали?

По умолчанию в большинстве браузеров включены куки...

iLeg0
На сайте с 12.08.2010
Offline
59
#37

canonical - непонятно зачем нужная вещь, соглашусь с бурундуком.

Я вот не понимаю - почему бы не ввести подобную функциональность через HTTP-заголовки - ПС сами себе лишнюю нагрузку на серваки создают - ведь чтобы увидеть каноникал на странице нужно скачать ее (а это трафик + пожирание ресурсов серверов), в случае с HTTP-хедерами качать не придется - экономия трафика.

богоносец
На сайте с 30.01.2007
Offline
769
#38

Урлы с utm-метками можно закрыть в роботсе.

utm-метки можно обработать у себя на серваке, но ответить 301 — на страницу, которой надо быть в индексе.

Вебмастеры просто не пытаются смотреть на ситуацию глазами мэтов катсов, у которых уже этих дублей — в несколько раз больше, чем есть в закромах. А это дополнительные расходы на железо... хоть на хранение дублей, хоть на их фильтрацию. Так что они, экономя бабло... зафильтруют и некоторых ваших растрёпанных подопытных. Случайно.

Е
На сайте с 21.06.2016
Offline
27
#39
vseonet1:
Вопрос в том, что нужно ли внедрять данный тег на все страницы сайта?
При этом дубли закрыты от индексации, например, через robots.txt

Данный тег обязательно необходимо внедрять на все страницы.

Предположим есть страница

site.ru/page.html

после добавления коммента создается новый документ

site.ru/page.html#comment-2

т.е дубль. и закрыть от индексации через robots.txt довольно проблематично.

Если у вас статические страницы, то их немного и вручную проставить тег не составит труда

Если страницы формируются динамически, то еще проще - 1 -2 строчки кода

Заказать Landing Page (https://livemonet.ru/zakazat-prodayushhij-landing-page) книги по wordPress и др (https://livemonet.ru/moi-knigi/) Клиенты для вашего бизнеса под ключ (https://livemonet.ru/marketing-na-rezultat)
[Удален]
#40
египтолог:
site.ru/page.html
после добавления коммента создается новый документ
site.ru/page.html#comment-2

изучайте матчасть

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий