Ну вы ещё расскажите, что клиентские сайты становятся своими. Отбросьте уж свои ехидные фантазии :)
Хотя, помнится мне, лет эдак 10 назад обратился один коммерс за продвижением и там оказалось, что его нанятый программист поставил Sape-у на внутренние страницы и так тихонько зарабатывал на ссылках. Я как увидел - прибалдел от такой наглости :)
Тоже видимости посчитал, что раз поработал какое-то время с клиентом, то сделанный им сайт стал "его".
Это вопрос определений. Для меня мои - в моей личной собственности.
Вы ещё спросить, зачем я занимаюсь продвижением чужих (клиентских) сайтов :)
Теперь отвечаю на ваш вопрос - я конечно могу парсить свои сайты, коих с каждым годом всё меньше, ибо избавляюсь за ненадобностью, но такова моя проф. специализация - я занимаюсь клиентским продвижением, поэтому по рабочим надобностям чаще всего занимаюсь парсингом чужих сайтов.
Но про меня лично не интересно, интересно про разнообразный опыт, хотя я по предложенной теме уже высказался.
Было бы интересно послушать кто ещё использует какие решения для рабочих задач.
Нет. Давайте, если вам так интересно про меня и про мою рабочую практику - пишите в личку я вам отвечу на ваши личные вопросы :)
Это не сложность, это рядовое решение задачи. Я эти задачи определяю и корпоративно решаю.
Вы либо невнимательны, либо упорно гнете свою линию от противного. Зачем - непонятно, ибо я не спрашиваю совета.
Я не ставлю задачу определять типы, я определяю задачу отделить сущность категории от сущности страницы. Это простейшая задача.
Про типы страниц я вам ответил выше с примером.
И да, я не заставляю программиста определять сущность по слэшу (а то тут уже набираются старатели исказить сказанное мною), понятно, что элементу присваивается признак (категория или страница) согласно представленной рабочей структуре, поэтому CMS-ке нет проблем понять, что это за сущность каталог или страница. Поэтому все условности со слэшем это лишь правила формирования URL адреса, а не наоборот. И в этом не должно быть никаких особых сложностей.
Вообще все равно какое у них слюноотделение. Есть задача, есть решение, есть позитивные результаты для бизнеса.
Есть позитивные результаты для бизнеса, клиент доволен - процесс идёт дальше. Сильно отстающие от непосильных задач проггеры отваливаются, остаются те, для кого подобные элементарные задачи в порядке вещей.
Или вы считаете, что я должен беречь проггеров и отказываться от своих типовых задач по аналитике?
Это даже не смешно :)
Вообще никакого гемора, годами ставлю задачу - программисты выполняют и всё работает.
Составить древо рабочих сущностей тоже никаких проблем, тем более, что по ним всё равно приходится работать.
Ещё раз, сложно/непонятно/ненужно - не используйте :) Я ж не заставляю :)
Это всё конечно очень мило и увлекательно, но когда в в топах стоят сайты с хорошими поведенческими и 2-3 сотнями ссылок (а иногда и без оных) большая часть которых просто из тематических справочников, то все эти доли триграмм заголовков в триграммах ссылок выглядят как анекдоты Омирбека.
Кто-то после этого списка серьёзно начнёт рассчитывать BM25 по точной фразе в текстах ссылок?
Для различия чего и для различия где? :)
Для различия категории и страницы - достаточно того, что я сказал.
Если же вы внутри общности разделов и общности страниц формируете дополнительные признаки, то конечно, придётся использовать доп. типы.
Например,
/blog/как-я-провёл-этим-летом
/info/контакт
при том, что самостоятельно уровни /blog/ и /info/ могут не использоваться, а указывать на типы страниц, чтобы не смешивать одну группу страниц с другими. Какую логику заложите, та и будет работать.
Более того, юзер чаще всего в адресную строку даже не смотрит :)
Выше я уже написал для чего это используется, повторяться смысла нет :)
Ед-но, добавлю (подробно не говорил, но момент проскочил) - к данной методике я добавляю ТЗ программисту редиректить лишний закрывающий слэш (либо его отсутствие, где он как раз нужен - в зависимости от признака сущности) и всё вопрос с дублированием адресов по лишним слэшам снимается.
Нужно ли это юзерам - нет конечно, нужно ли это SEO-шникам (как универсальное правило - да, очень удобно), нужно ли это бородатым дедам - всё зависит от рабочих задач :)
Так вот о том речь, что нет никакой нужды перед названием элемента структуры указывать тип /category/ или /page/ увеличивая тем самым уровень URL вложенности.
В моей логике вы просто используете,
/россия/ - как категория
и
/россия - как страница
Опять-таки, если вам надо учитывать принципиально эту разницу, а если не надо - то вольны делать как угодно, хоть вообще всё корень добавлять.
Я конкретно и указываю, что это не общее правило для всех, а лично моя рекомендация,
Я никого не убеждаю. Я отвечаю на заданные вопросы, объясняю и обосновываю, привожу пример, когда это может быть полезно. Сколько там страниц занимает обсуждение мне совершенно неважно :)
Кому покажется интересным/важным/полезным - прислушается, кому не надо - пропустит.
Значит вы не понимаете разницу, между общим правилом и используемым авторским методом, раз по второму определяете первое.
И насчёт "моей вселенной". Нет никакой моей вселенной, я зачастую имею дело с клиентскими сайтами, где URL адресация работает без закрывающегося слэша и мне приходится подстраиваться под эти реалии. Но там где я на старте сайта - я внедряю и пользуюсь вышеописанными преимуществами.
Еще раз - я никому ничего не навязываю и ни в чём не переубеждаю.