SeVlad

SeVlad
Рейтинг
1609
Регистрация
03.11.2008
xVOVAx:
Опенкарт возьмите

А авианосец для рыбалки на Бусловке :)

Новости, надеюсь, закончились?

Продолжаем ранее поднятую проблему:

SeVlad:
Когда потерял жену в оживлённом месте

Всё дело в количестве очков! (ты же сразу это заметил, правда? ;) )

burunduk:
ещё раз, технически в подавляющем большинстве случаев это сделать нереально, я говорю про большие им, а не статичные сайты

Да легко ж! PHP_SELF (ну или что нужно). Без QUERY_STRING (если оно не нужно).

burunduk:
если страница закрыта в роботсе каноникл просто не нужен

Да! Но ёёё!

Ты мешаешь мух с котлетами. дисалов в роботсе и каноникал в хедере - разные по несущим функциям.

burunduk, ты вот всё время упираешь на роботс. Да никто не спорит, что роботс полезен. Но это НИКАК не говорит о том, то каноникал - костыль.

И нет особых проблем в его простановке. Вот хоть убей, не понимаю, почему он вызывает у тебя такой ужас.

Megasvf:
но качество этого функционала не всегда оправдывает мои ожидания.

Функционал-то тут причём? Научись отделять мух от котлет, возможности от наличия контента, краудмаркетолог-самоучка :)

burunduk:
проблема в QUERY_STRING могут быть лишние параметры, как их отделить без дополнительной обработки?

Конечно, если по урлу с мусором отдаётся 200, то надо с ним решать. Я об этом и говорил выше.

Вот только каноникал к этому... Если есть мусор - каноникал как раз должен указывать на не мусорную страницу.

Или же сервером/движком обрабатывать эти мусорные параметры. (это не всегда сложно, но всё же..)

Выходит что? От каноникала опять профит?

burunduk:
робота на них не нужно пускать, запретить полностью крол в роботсе для подобных страниц

Отсутствие каноникала на странице как этому способствует/поможет? ;)

А вот присутствие как раз таки может и помочь. В след. раз(ы) робот просто будет знать, что по этому мусорному урлу ему делать нечего - канонический урл же получен ранее.

burunduk:
и только запрет в роботсе может спасти от постоянного обращения к мусорным страницам

В роботсе поможет только не появится в выдаче (и то не всегда), а ботам до фени эти роботсы :)

burunduk:
ты не понимаешь проблемы,

Ну вот и пытаюсь же понять.

burunduk:
цпа сети пересылают пользователей по уникальным url, в которых зашито куча параметров самой сети, т.е. на один канонический url получается сотни, а то тысячи с ненужными параметрами и все робот будет скачивать, а если страница сама по себе имеет параметры (для вывода товара, что очень часто встречается), то как ставить каноникл?
надо проводить серверную обработку, а это затратное занятие

Ну хорошо, давай возьмём этот частный случай. 301 тут не используем (раз речь о каноникале).

И что, при таких урлах робот не будет жрать страницы? Где профит?

Я как раз вижу профит в каноникале. ПС или такие уры может выкинуть(при каноникале на базовый урл) или же, если эти страницы реально нужные в выдаче (урлы от цпа с мусором -не этот случай) - канонизировать их. Иногда последнее тоже нужно.

burunduk:
то как ставить каноникл?

Ну в целом это воще не проблема. 'PHP_SELF/QUERY_STRING' :)

burunduk:
а что делать вот с таким url
site.ru/cat/produktразныйбред?разныйбред
каноникл на site.ru/cat/produktразныйбред который отдаёт 404 код ответа или 301-302???

Если ?разныйбред - это параметры, от которых зависит контент (напр выборка товара) то конечно 200. Но каноникал уже на усмотрение. Равно как и записи в роботсе.

В др случаях - 404 или 301. Какноникл-то тут причём? ПС не получит же эти страницы.

Или же я тебя не понимать. ;)

burunduk:
нет, наоборот, для того что бы прочитать каноникл страницу необходимо скачать, вот здесь и закончиться квота на данный сайт, находит он эти страницы по внешним ссылкам, а цпа системы их генерируют в безумном количестве

Насчёт квоты - можно и согласится. В нек случаях.

А вот "ЗА" быстрее: из каноникала ПС узнает о нужнй странице (без него может не узнать ещё очень долго).

---------- Добавлено 16.06.2016 в 17:58 ----------

богоносец:
Если на сайте 1000 страниц, а боту подсунули 10 000 сцылок с правильным rel="canonical"
то боту надо скачать 90% левых страниц... а лимит обращения к сайту есть. И самое медленное у бота — HTTP траф.

Так что, пока боту приходится выплёвывать обратно левые страницы, он проиндексит ваших конкурентов, которые не подсовывают боту левых сцылок и вместо rel="canonical" настроили 301.

Тут рассматривает 2 разных случая

1. Когда замена аресов.

2. Когда новый сайт.

Во втором случае - совершенно правильно использовать 301. В первом же - каноникал (на первое время, до окончания переиндексации) будет уместнее. Потом уже 301.

Я так думаю (с) ;)

pspman43:
Но вот, не пойму зачем сначала делать каноникал, а потом редирект? Чем это лучше?

Я ж всё объяснил сразу. Во второй части поста.

Ок, расжую.

Потому что при получении 301 страница удаляется из индекса ПС, а новая проиндексится "в порядке очереди" :)

burunduk:

это потенциальная уязвимость и я с этим уже сталкивался - нельзя просто обрезать параметры для получения канонического урл, каноникл надо брать только из таблицы, т.е. нельзя просто брать uri и работать с ним как со строкой

... переведи :)

burunduk:
это уже практика любого крупного им, они все используют различные цпа системы, которые генерят безумное количество кривых url
и получается что при 15к+ реальных страниц робот сканирует 2600к+ в месяц, нужные страницы не индексируются/переиндексируются, роботс кстати от этой проблемы спасает, а вот каноникл её усугубляет

брр... Проблема кривых урлов - согласен, имеет место быть. Но даже не в урах дело, а в дублях. Да, согласен и это может быть и бывает не редко как в ИМ, так и нек др структурах. Но причём тут "каноникл её усугубляет"? Как раз наоборот же. С его помощью быстрее индексируются нужные страницы. Меньше мусора будет в выдаче. Снизится нагрузка на индексацию в конце-концов (ПС же выкинет эти урлы. Ну если не на всегда, то хотя бы на время). Или что не так?

Я не говорю, что в случаях подобных выборкам/фильтрам в ИМ, когда урлы отличаются только параметрами не нужно использовать роботс или даже реврайты. Я говорю, что каноникал - не зло и не костыль. И большинстве случаев очень даже полезен. А ты всех под одну гребёнку.. :)

Всего: 28523