ладно... попробую пояснить свою мысль последний раз. Например, у меня есть http сервер. В области хранилища данных на нем вообще нет ни одного каталога или папки или директории или называйте как хотите... Однако мой сервер прекрасно отдает во внешний мир документы с урлами вида "..../aaa/bbb/ccc/...". А теперь к Вам вопрос: какой уровень вложения имеет мой URL вида: http://My_site/aaa/bbb/ccc/"?
Так вот, по жизни это достаточно частая ситуация и поисковики не рассматривают (вероятно :) ) кол-во слешей или еще чего-то в урле как признак чего-бы то ни было.
Ну если Вы полностью полагаетесь на опыт, то и обсуждать-то нечего (простите). А вот на счет элементарной теории я бы просил Вас указать ссылку. Где это сказано, что организация поисковика обязана подчиняться изучению каждого ээээ... сайта с его ээээ... головы. Где описаны сами эти понятия. А заодно и что такое первый проход - второй и пр. Ну не знаю я этого. А то, боюсь, может я с 96 года все не правильно делал :)
Я говорил о контексте, если Вас это обидело, приношу глубочайшие извинения.
Чем отличается "...&sid=abcdefgh..." от ".../sid=abcdef/..." или просто от ".../abcdef/..." - да вобщем то ничем - и то и другое является частью URI и может быть стрипнуто поисковиком.
Кто Вам это сказал... сестга имя... :) Способ построения очереди сканирования поисковика - это, можно сказать, его ноу-хау. Какое место по объемам и критериям включения в эту очередь занимает какой-то конкретный сайт - вешь для вас скрытая и вряд ли кто ее опубликует.
что в данном контексте одно и тоже. Я бы не стал публиковать такие алгоритмы, хотя бы из-за наличия в этой жизни SEO :)
Я только имел ввиду, что не следует в URL использовать что-то типа "...&sid=..." "...&sess=..." и пр. С высокой вероятностью такое большинством будет вырезано. Полный список у каждого свой, но можно предположить, что под нож может попасть и безобидное "...?id=..." если умельцы от мониторинга сессий будут такую конструкцию часто использовать. Это просто предполагаемое предостережение.
Что касается глубины прочтения - так оно может измеряться разными подходами. От банального ограничения по максимальному кол-ву урлов до алфавитного порядка. Как урлы поступят в "в общее знание поисковика" - Одному богу известно. Уровень вложения от т.н. головы может иметь значение, а может и не иметь. Т.е Вам следует изучать со стороны конкретно-интересующий Вас поисковик (скорее всего это Я) и только делать предположения.
Для поисковика _ВСЕ_ДОКУМЕНТЫ_ (в рамках его дозволенности :) ) являются одним большим сайтом, в вашем понимании. Ему в принципе, все равно, как описано дерево этого сайта. Другое дело, что у поисковика есть понимание, что дерево, это по своим объемам потенциально необъятно для него самого. Чтобы иметь хорошее рабочее представление о строении и содержании дерева, поисковик вводит эвристики, ограничивающие его изучение веток. Какие они - дело каждого конкретного поисковика и может сильно зависить от человека, в руках которого чемоданчик с кнопкой и от его настроения. Чемоданчик то - его личный. К тому же, сама жизнь заставляет эти эвристические подходы менять достаточно часто.
Так что, ответ на вопрос: как лучше сделать вид ссылок лично для меня проблематичен. Одно могу сказать точно, любой поисковик отслеживает горе-деятелей, которые запихивают в URL информацию о сессии, поисковик старается ее вырезать (опять же согласно своей эвристике и жизненному опыту). Конечно, это не есть хорошо, как любая отсебячина, но у поисковика нет выбора. Это в некоторых случаях может привести к тому, что он (SE) корежит правильный URL т.к. ему по большому счету наплевать, что он в этом случае потеряет сотню-другую документов, зато точно не будет делать лишней работы в больших объемах. Это относится и как к динамическим URI так и к путям :)
Сюда эт точно ни к чему :)
OFF: что касается дизайна, то у меня (как у человека реально глазами просматривающего очень много страниц) сложилось впечатление, что такой внешний вид является "корпоративным стандартом" оптимизатора. Прошу прощения, если кого-то обидел. Ничего личного.
Неа, с точки зрения разработчика - это нулевые затраты (ну близко к тому, он один фиг функциями и их параметрами сам играет). Вопрос в том, что это не понятно для большинства, это раз. Не факт, что даже когда понятно, что пользователь примет правильное решение. У меня есть дебаговая формочка, в которой десяток параметров, влияющих на результат. Но правильнее будет не отдать эту форму любому желающему, а, скажем, сотне добровольцев. Зафиксировать им задание запросов, и в этих рамках пусть крутят любые ручки. Потом зафиксируют оптимум для себя. Ну а общие результаты надо апроксимировать и прибить гвоздем для всех остальных :)
Как это узнать (узкоспециализированность)? По частотности во всей коллекции документов? По частотности в других запросах? По тезаурсу? Как еще? Короче, критерии в студию...
Да.. Конечно, в уважающем себя поисковике, исходный запрос обязан быть обнюханным с разных сторон и, в зависимости от его запаха, может приниматься решение о способе ранжирования. Но это не тема данного топика. Если хотите, давайте поговорим на эту тему - тоже очень интересно постороннее мнение и формулизованные идеи.
Опять не так уж и страшно пр детальном рассмотрении, чтобы наделоть очень много разных ссылочек существует ограниченное число способов.
1. Самый простой создать в "своем" домене кучу поддоменов с автоматическим изменением суммарного контента в зависимости от имени.
2. Регистрировать новые домены а) в публичных зонах б) в "хороших" зонах
Что еще забыл?
Б лоб не поддается анализу только пункт 2(б). Однако, опять же, во многих случаях, автору искусственного перераспределения нужен результат уже завтра ибо денюшка проплачена. Тогда надо куданьть сначала сами эти ссылки запихать (в форум, например), чтобы они заработали и заработали быстро
А уж у кого хватает терпения кропотливо поступать по пункту 2б - ну честь ему и хвала, не зря ест свой хлеб. Но в целом, я согласен, нужны новые метрики (и молчать о них как партизан)
Кстати сказать, вообще по жизни в этой области все плохо работает, что поддается алгоритмизации и опубликовано :) (как я завернул?)