богоносец

богоносец
Рейтинг
777
Регистрация
30.01.2007

У вас слишком человеческие предположения, что ПС якобы нужно некое единообразие урлов (со слешем или без, с www или без).

А если на каждую следующую скачанную сотню страниц ПС находит 76 дублей, то индексация продолжится?

И запросы бестолковые:

ПС в запросе не только / не чувствуют... и могут не показать то, чего у них есть в индексе.

Вот эта хрень в индексе нужна?:

www.google.ru/search?q=site:www.yandex.ru/m

www.yandex.ru/search/?text=url%3Awww.yandex.ru%2Fm*

это всего лишь иллюстрация неидеальности алгоритма фильтрации дублей.

Вот эта самая неидеальность может и по вашему подопечному прокатиться, а потом «развивайте, улучшайте». Вы же не хотите учесть, что видите индекс уже после фильтрации, а в процессе — “никто не видел”. А с www.yandex.ru/m бесконечный процесс (контент неудобный для фильтрации).

ПС определяют дубли не по урлу и не по / в конце.

Дубли — это одинаковый контент (но нет инфы о том, как ПС эту одинаковость проверяет).

(если с моего 50 страничного сайта в индекс залезет 378 страниц, то мне это было бы не важно — если бы ПС не начала чистить свои закрома от того, что сочтёт дублями. При этом нет бесконечного количества ресурсов на идеальность этого процесса, ну типа раз в неделю что-то сверит и дальше побежит)

Есть примеры, сайта индексируемого без (или с слешами), и что бы одна/две/пять страниц проиндексировались с слешами (или без)?

В данном случае я не настаиваю что подобного не бывает, но на практике тоже не видел.

Не воспринимайте в штыки, но просто, если и таких примеров никто привести не сможет, то на чем тогда держится уверенность что для ПС это разные страницы?

Вы не понимаете, что обычно вы видите результат уже после отфильтровывания дублей?

ццц.яндекс.ру/м

ццц.яндекс.ру/м/

таким примером долго был. Но там контент плывёт...

Для ПС любое изменение в урле (кроме регистра букв в домене) == другому адресу (это без вопросов, HTTP так устроен)... но фильтрация происходит по другим причинам.

И чтобы не создавать ПС даже минимальных проблем, контент должен быть доступен по единственному урлу. А то лечить дубли на 10000 страничном сайте ПС может слишком долго. Есть пределы количества обращений к сайту, хотя бы поэтому надо отдавать не-дубли.

Посмотрите на параноиков:

http://www.ashmanov.com/marketing/strategy/

HTTP/1.1 301 Moved Permanently

Location: http://www.ashmanov.com/marketing/strategy

https://www.yandex.ru/timeline/Жак_Ив_Кусто/ почему 302, а не 301?

Не понятно?:

Как правило вы видите результат уже после отфильтровывания дублей
и какие ваши риски от неидеальности алгоритмов — точно вы не знаете.

Но продолжайте настаивать чтобы вам показали дубли с / и без (строго на конце).

genjnat:
Нет там ни одного примера со слешем на конце, а обсуждаем именно его

Может ещё скажите, что остальные дубли — не дубли? Очень надо www.yandex.ru/m/?админ

Или есть какое-то принципиальное отличие этого мусора от / на конце?

Но вас никто не заставляет, верьте, что будет всё хорошо, и нигде внутри сайта вы по ошибке не сошлётесь куда не надо.

Какая разница какие задачи решает ПС, если они совпадают с моими

Ну-ну. Вы не из яндекса?

В запросе он не чувствует / (и таким запросом индексацию не проверяют)

и у него не та скорость, что у гугла

(и может быть вам понравился мусор в гугл.индексе).

genjnat:
Что технически страницы разные, и так понятно, не понятно считают ли ПС их таковыми.

У ПС есть задача сократить расход своего железа. Они решают свою задачу, а не вашу. Не понятно? Со своей задачей они справляются часто, а с вашей как получится. Правильно получается не в 100% случаев.

Как правило вы видите результат уже после отфильтровывания дублей (изредка это может сопровождаться вылетом всего сайта).

genjnat:
так как реализовано в Яндексе - т. е. - если по дефолту без www, внутренние ссылки без www, то только так он индексировать и будет.
Ну-ну.
genjnat:
И ни разу за все это время не видел в индексе дубля со слешем и без.

Возможно вы смотрели раньше, чем бот принял меры. Но подобные меры могли быть и не желательны для вебмастера. Ну пусть пишет боту щукину.

genjnat:
Так же как и описанную вами ситуацию, где со слешем и без разный контент.

Вы хотите чтобы я 7 минут поковырялся и сделал такое? Сделайте сами.

А то, как обычно настроены серваки — лишь один из возможных для ПС случаев.

genjnat:
Вот такие дубли
http://www.yandex.ru/m/
http://www.yandex.ru/m
В индексе можно найти?

Ну щас попостим, посмотрим..

А с параметрами там уже есть со слешем и без.

genjnat:
А так бывает?

Если сделать, то бывает.

Со слешем и без него — это разные урлы для ПС.

genjnat:
мифа, про дубли со слешем и без, коих в индексе никто не видел

Если вы чего не видели, то вполне возможно индексация того сцайта для ПС когда-то оказывалась под вопросом. И автоматическое решение проблемы случайно оказалось таким, как хотелось бы вебмастеру, но вероятность этого < 80%.

http://www.yandex.ru/m

http://www.yandex.ru/m?туфта

http://www.yandex.ru/m/?дубль

И со слешем, и без, и хернёй в параметрах http://www.google.ru/search?q=site:www.yandex.ru/m

просто подобные страницы олгоритму трудно счесть дулями — они попадают в индекс с разным контентом.

MeGGo:
Один и тот же урл со слешами или без - дубли

Нет, не так.

Если у вас со слешем и без него разный контен, то это не дубли.

www.google.ru/search?q=%E0%B8%AA%E0%B9%89%E0%B9%89%E0%B9%89

www.google.ru/search?q=%E2%98%9E

www.google.ru/search?q=%E0%BC%BC+%E0%BA%88%D9%84%CD%9C%E0%BA%88%E0%BC%BD

Просто эти символы считаются чем-то типа буков/иероглифов

(ПС вообще ищут ранжируют не слова, а наборы символов)

(при этом ТП многозначительно отвечала, что мол на хз каком языке мы не ищем, но это может быть проиндексировано).

www.google.ru/search?q=Text+faces

Попробуйте в форму запроса вбить что-то из ☻ ♫ ♥ и гугл вывалит вам подсказки с такой хренью, т.е. их ищут. Но именно эти символы не ищутся, типа это не буква... хотя ими можно чего-то в выдаче приукрашивать (но не в тайтлах).

А типа-буквами можно и в тайтлах www.google.ru/search?q=%DC%93+ресниц

Всунуть-то можно, но сразу в несколько.

.

<meta name="description" content="Wenn Sie Deutsch und Sie Porno gerne hier finden Sie die Röhre, die Sie suchen finden.
Free pornos XXX mobile video und HD ด้้้้้็็็็็้้้้้็็็็็้้้้้้้้็็็็็้้้้้็็็็็้้้้้้้้็็็็็้้้้้็็็็็้้้้้้้้็็็็็้้้้้็็็็็"/>
.

И надо разными браузерами посмотреть.

Вообще гуглоиды много чего из UTF не хотят показывать в выдаче, особенно жёстко в тайтлах фильтровали, не хотели показывать что-то типа ▼ ◆ ☻ ♫ ◊ ♥

А эту хрень показывают даже в тайтлах и урлах

Usatyi1986:
почему Путину, всем россиянам

Так кажется только т.н. всем россиянам.

Не всем.

Всего: 13677