Вот по этому запросу несколько недель назад был дубль и в Яндексе, но вот уже находится раздел, приходится с + искать или так... т.е. обычно он их просто не показывает.
Дублирование тегов и кривой HTML ботам проблем обычно не создают.
Но вы уже дважды отвлеклись от моего вопроса про дули/не-дубли у yandex.ru/m
А если продолжить думать: а как бы я писал олгоритм, чтобы не засерать закрома... то дубли желательно отфильтровать до того, как они заняли место (почему мы их можем так никогда и не увидеть, не заподозрив никаких проблем).
Пример с ашманов/coMpanY не совсем правильный, там слегка меняется контент,
но таких дублей не получилось:
sealytics.ru/analitika/anomalii-v-podskazkah-Yandeks/
sealytics.ru/analitika/anomalii-v-podskazkaH-yandeks/
ДорвейСтрой давно пытается подобные тонкости использовать.
Да они размазаны.
Ну изменилось что-то, но что — хз. По моим старым примерам так сразу не видно.
Но есть такое, где показывает описалово, и по более длинной фразе, присутствующей и в <body>, и в <meta>
Словоформу стал как-то жёстко чувствовать: 1 / 2
Но вот по запросу Кондиционеры показывает текст, хотя почему бы не показать описание. Странно. Но в этом примере оно повторяется на нескольких страницах.
Можно попытаться поискать по фразам, которые есть в тайтле, но их не видно в заголовке сниппета.
У этого форума описание показывается не всегда https://www.google.com/search?q=description+site:forum.searchengines.ru но и раньше не всегда показывалось. Но как-то бросается в глаза то, что сейчас показывается у страниц с коротким тайтлом (он же копируется в описание), а с длинным нет (раньше было скорее наоборот). Может изменился принцип по которому отфильтровывает описание, похожее на тайтл.
Мне эти длинные пояснения не нужны.
Вернёмся от бурных эмоций по поводу того, что я не говорил... к вопросу: А вот тут дубли есть? А тут вот?
(для человека есть)
Ещё можете попробовать получить дубли в индексе
http://www.ashmanov.com/coMpanY
http://www.ashmanov.com/coMpAnY
http://www.ashmanov.com/coMpany
http://www.ashmanov.com/CoMpanY
http://www.ashmanov.com/coMpaNy
200 OK
Повторюсь:
http://www.ashmanov.com/company/nEws
http://www.ashmanov.com/company/neWs
http://www.ashmanov.com/company/News
http://www.ashmanov.com/company/news/разогнал-сеошников
http://www.ashmanov.com/company/news/забил-на-SEO☻
(как и на изменчивом www.yandex.ru/m?X боты... не видят дублирования)
/ru/forum/701466
А вот тут дубли есть?
С т.з. человека — это дубли, но с т.з. ботов — дублей тут нет, поэтому их и можно видеть. Если бы ПС сочли это дублями, то, скорее всего, просто не проиндексировали бы. И вот тут дублями (c т.з. бота) являются не все.
/ru/forum/787928
/ru/forum/802851
/ru/forum/805997
Да какая разница, за какой год эти интервью. В них доля мифа примерно такая же.
Вообще-то сцылка была на смутные воспоминания Ашманова (формально Волож может подать в суд, потребовать подтверждений, которых не будет... но он не идиот). Иногда “воспоминания” о великом Яндексе похожи на бульдожью хватку http://roem.ru/2013/09/05/gleizer79937/#com180751
И часто эти самые “воспоминания” являются ответом на чей-то вопрос или недоумение. И по какому же принципу они вдруг выплёскиваются в буквы? Наверное покаявшийся дух Сегаловича стряхивает корпоративные заморочки... освобождая какие-то био-массы от невысказанных обязательств.
Только 404 (301) надо ответить по урлу, содержащему _escaped_fragment_=avto // cм хелпы
или по всем урлам с ? // если параметры не используются в новых урлах.
На этом форуме такие не запрещены, и вот http://www.google.com/search?q=site:searchengines.ru+inurl:hash&filter=0
Всё будет как и раньше: все продолжат делать вид, что держат ситуацию за яйца (и всем это удастся, как ни странно. Со сцылкоторговлей надо было бороться N лет назад, сейчас это скорее вредно, ибо отвлекает массы от мечты попасть с ТОП).
Соотношение пиар/технолии > 10 — не только у святаго Яндекса.
И пропаганда достаточно часто решает то, что не могут недотехнологии. Возникло привыкание (и у яндексоидов, и у спамеров).
Как будете решать? Думаете само пройдёт, и никакие конкуренты никогда не припомнят?
Вообще, этот Ашманов себе слишком много позволяет (и ведь знает тонны подобного говна, поэтому на него наезжать боятся). И его самого тоже использовали пиарщики других продуктов — примерно так же, как и 4 года назад Cognitive использовала Яндекс — обычно заранее пресекающий что-либо подобное.
И у них нет возможности просто отказаться от этого.
Да, Cognitive тогда жирно попиарилась за счёт вашего Любимого.
Но вот почему-то всякие ашмановы вспомнили подробности именно вчера. А у меня так давно возникали вопросы типа: ну чего там с этим анализатором? А он этому простому Яндексу и нужен-то не был.
ps Кого это волнует: у Яндекса ещё проблемы с таксистами (очень усердно опровергаемые) // т.е. проблемы у бренда в офлайне.
Взвесьте Ашманова с Садовским.
Дублями их делает не регИстр урла, а одинаковый контент // но по этому признаку ПС научились тупо отфильтровывать. Но на страницах с изменяющимся контентом можно наплодить дублей и регистром (если сервак 200 отвечает) http://www.yandex.ru/m//?adMiN
ТП скорее всего оветила не так, что это всё равно... скорее сказала, что умный бот разберётся сам.
В запросе регистр не чувствует.
UrL | uRl
Всех сразу можно посмотреть в Гугле с &filter=0
ps Тут показали в выдаче сцылку с #якорем
http://yandex.ru/yandsearch?text=mysql+date