Всегда нужно использовать rel="canonical" ?

[Удален]
#11
SeVlad:
Если ?разныйбред - это параметры, от которых зависит контент (напр выборка товара) то конечно 200

ты не понимаешь проблемы, цпа сети пересылают пользователей по уникальным url, в которых зашито куча параметров самой сети, т.е. на один канонический url получается сотни, а то тысячи с ненужными параметрами и все робот будет скачивать, а если страница сама по себе имеет параметры (для вывода товара, что очень часто встречается), то как ставить каноникл?

надо проводить серверную обработку, а это затратное занятие

P.S. я вообще за то что бы в роботсе было прописано Disallow: /*?

SeVlad
На сайте с 03.11.2008
Offline
1609
#12
burunduk:
ты не понимаешь проблемы,

Ну вот и пытаюсь же понять.

burunduk:
цпа сети пересылают пользователей по уникальным url, в которых зашито куча параметров самой сети, т.е. на один канонический url получается сотни, а то тысячи с ненужными параметрами и все робот будет скачивать, а если страница сама по себе имеет параметры (для вывода товара, что очень часто встречается), то как ставить каноникл?
надо проводить серверную обработку, а это затратное занятие

Ну хорошо, давай возьмём этот частный случай. 301 тут не используем (раз речь о каноникале).

И что, при таких урлах робот не будет жрать страницы? Где профит?

Я как раз вижу профит в каноникале. ПС или такие уры может выкинуть(при каноникале на базовый урл) или же, если эти страницы реально нужные в выдаче (урлы от цпа с мусором -не этот случай) - канонизировать их. Иногда последнее тоже нужно.

burunduk:
то как ставить каноникл?

Ну в целом это воще не проблема. 'PHP_SELF/QUERY_STRING' :)

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
[Удален]
#13
SeVlad:
Ну в целом это воще не проблема. 'PHP_SELF/QUERY_STRING'

проблема в QUERY_STRING могут быть лишние параметры, как их отделить без дополнительной обработки?

SeVlad:
И что, при таких урлах робот не будет жрать страницы? Где профит?

я об этом и пишу - робота на них не нужно пускать, запретить полностью крол в роботсе для подобных страниц

SeVlad:
Я как раз вижу профит в каноникале. ПС или такие уры может выкинуть

мусорные url появляются с гораздо большей скоростью чем их сканирует робот!!!!

а заодно учти, что если новый url найден по внешнёй ссылки, то робот будет на него постоянно ломиться, пока ссылка стоит, то постоянно, после её удаления с достаточно большим промежутком, но будет!!!

и только запрет в роботсе может спасти от постоянного обращения к мусорным страницам

SeVlad
На сайте с 03.11.2008
Offline
1609
#14
burunduk:
проблема в QUERY_STRING могут быть лишние параметры, как их отделить без дополнительной обработки?

Конечно, если по урлу с мусором отдаётся 200, то надо с ним решать. Я об этом и говорил выше.

Вот только каноникал к этому... Если есть мусор - каноникал как раз должен указывать на не мусорную страницу.

Или же сервером/движком обрабатывать эти мусорные параметры. (это не всегда сложно, но всё же..)

Выходит что? От каноникала опять профит?

burunduk:
робота на них не нужно пускать, запретить полностью крол в роботсе для подобных страниц

Отсутствие каноникала на странице как этому способствует/поможет? ;)

А вот присутствие как раз таки может и помочь. В след. раз(ы) робот просто будет знать, что по этому мусорному урлу ему делать нечего - канонический урл же получен ранее.

burunduk:
и только запрет в роботсе может спасти от постоянного обращения к мусорным страницам

В роботсе поможет только не появится в выдаче (и то не всегда), а ботам до фени эти роботсы :)

T
На сайте с 01.07.2010
Offline
125
#15
IBakalov:
tippula, использовать для пагинации canonical - глупо.

например на авито используют canonical, глупые ли ребята там работают 😕

да и вообще от мусора только редиректы спасут, а каноникал как доп страховка если вдруг что левое пролезло

[Удален]
#16
SeVlad:
Если есть мусор - каноникал как раз должен указывать на не мусорную страницу

ещё раз, технически в подавляющем большинстве случаев это сделать нереально, я говорю про большие им, а не статичные сайты

SeVlad:
Выходит что? От каноникала опять профит?

нет только очень большие проблемы с его корректной простановкой

SeVlad:
Отсутствие каноникала на странице как этому способствует/поможет?

если страница закрыта в роботсе каноникл просто не нужен ;)

SeVlad:
А вот присутствие как раз таки может и помочь. В след. раз(ы) робот просто будет знать, что по этому мусорному урлу ему делать нечего - канонический урл же получен ранее.

а вот это как раз заблуждение, роботу до этого нет ни какого дела :(

SeVlad:
В роботсе поможет только не появится в выдаче (и то не всегда), а ботам до фени эти роботсы

роботы разные, я говорю про индексатора, он всегда сначала запрашивает роботс

SeVlad
На сайте с 03.11.2008
Offline
1609
#17
burunduk:
ещё раз, технически в подавляющем большинстве случаев это сделать нереально, я говорю про большие им, а не статичные сайты

Да легко ж! PHP_SELF (ну или что нужно). Без QUERY_STRING (если оно не нужно).

burunduk:
если страница закрыта в роботсе каноникл просто не нужен

Да! Но ёёё!

Ты мешаешь мух с котлетами. дисалов в роботсе и каноникал в хедере - разные по несущим функциям.

burunduk, ты вот всё время упираешь на роботс. Да никто не спорит, что роботс полезен. Но это НИКАК не говорит о том, то каноникал - костыль.

И нет особых проблем в его простановке. Вот хоть убей, не понимаю, почему он вызывает у тебя такой ужас.

богоносец
На сайте с 30.01.2007
Offline
769
#18

Каноникал — костыль.

Он вызывает не ужас, а затык в HTTP-трафике бота.

Или сделайте два почти одинаковых сайта на 1000 страниц.

В одном из них 15?дублей с каноникалами.

И сравните время индексации. У того, который с дублями, количество страниц в индексе будет стремиться к 1000, но долго.

SeVlad
На сайте с 03.11.2008
Offline
1609
#19
богоносец:
Каноникал — костыль.
Он вызывает не ужас, а затык в HTTP-трафике бота.

Да ёмоё ж.. Не понимать я, причём тут каноникал, какой откуда затык? Пс пойдёт по внешним кривым урлам ВНЕ зависимости от наличия на странице каноникала. Первый раз пойдёт. А вот остальные (в ближайшее время во всяком случае. А это может быть и месяцы) - уже не факт. Что наоборот, облегчит нагрузку на сайт.

Что не так-то?

богоносец:
Или сделайте два почти одинаковых сайта на 1000 страниц.
В одном из них 15?дублей с каноникалами.
И сравните время индексации

Опять мухи в котлетах. :(:

SeVlad:
2. Когда новый сайт.

Во втором случае - совершенно правильно использовать 301.

Ида, без каноникала - что, ускориться индексация 1000+15 страниц?

богоносец
На сайте с 30.01.2007
Offline
769
#20
SeVlad:
какой откуда затык?

Напишите любой скрипт, который чего-то скачивает по HTTP, обычно он работает медленно.

Пс пойдёт по внешним кривым урлам ВНЕ зависимости от наличия на странице каноникала.

Не надо создавать этой возможности. Лучше чтобы не ходила.

Если есть возможность (в robots.txt) запретить ПС скачивать, это лучше, чем сначала ПС скачает, а потом убедится... а ещё и не факт, что оставит в индексе именно то, чего надо.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий