богоносец

богоносец
Рейтинг
775
Регистрация
30.01.2007
vagogrande:
Вынужден признать, что яндекс каким-то образом склеил страницы.

Вот по этому запросу несколько недель назад был дубль и в Яндексе, но вот уже находится раздел, приходится с + искать или так... т.е. обычно он их просто не показывает.

Дублирование тегов и кривой HTML ботам проблем обычно не создают.

Но вы уже дважды отвлеклись от моего вопроса про дули/не-дубли у yandex.ru/m

А если продолжить думать: а как бы я писал олгоритм, чтобы не засерать закрома... то дубли желательно отфильтровать до того, как они заняли место (почему мы их можем так никогда и не увидеть, не заподозрив никаких проблем).

Пример с ашманов/coMpanY не совсем правильный, там слегка меняется контент,

но таких дублей не получилось:

sealytics.ru/analitika/anomalii-v-podskazkah-Yandeks/

sealytics.ru/analitika/anomalii-v-podskazkaH-yandeks/

ДорвейСтрой давно пытается подобные тонкости использовать.

symhome:
Можете подсказать ссылку на обсуждение?

Да они размазаны.

Ну изменилось что-то, но что — хз. По моим старым примерам так сразу не видно.

Но есть такое, где показывает описалово, и по более длинной фразе, присутствующей и в <body>, и в <meta>

Словоформу стал как-то жёстко чувствовать: 1 / 2

Но вот по запросу Кондиционеры показывает текст, хотя почему бы не показать описание. Странно. Но в этом примере оно повторяется на нескольких страницах.

Можно попытаться поискать по фразам, которые есть в тайтле, но их не видно в заголовке сниппета.

У этого форума описание показывается не всегда https://www.google.com/search?q=description+site:forum.searchengines.ru но и раньше не всегда показывалось. Но как-то бросается в глаза то, что сейчас показывается у страниц с коротким тайтлом (он же копируется в описание), а с длинным нет (раньше было скорее наоборот). Может изменился принцип по которому отфильтровывает описание, похожее на тайтл.

Мне эти длинные пояснения не нужны.

Вернёмся от бурных эмоций по поводу того, что я не говорил... к вопросу: А вот тут дубли есть? А тут вот?

(для человека есть)

Ещё можете попробовать получить дубли в индексе

http://www.ashmanov.com/coMpanY

http://www.ashmanov.com/coMpAnY

http://www.ashmanov.com/coMpany

http://www.ashmanov.com/CoMpanY

http://www.ashmanov.com/coMpaNy

200 OK

Повторюсь:

Дублями их делает не регИстр урла, а одинаковый контент // но по этому признаку ПС научились тупо отфильтровывать.
Гораздо легче проиндексить дубль страницы с регулярно изменяющимся контентом:

http://www.ashmanov.com/company/nEws

http://www.ashmanov.com/company/neWs

http://www.ashmanov.com/company/News

http://www.ashmanov.com/company/news/разогнал-сеошников

http://www.ashmanov.com/company/news/забил-на-SEO☻

(как и на изменчивом www.yandex.ru/m?X боты... не видят дублирования)

/ru/forum/701466

vagogrande:
и Яндекс и Гугл считали это разными страницами и дублями

А вот тут дубли есть?

С т.з. человека — это дубли, но с т.з. ботов — дублей тут нет, поэтому их и можно видеть. Если бы ПС сочли это дублями, то, скорее всего, просто не проиндексировали бы. И вот тут дублями (c т.з. бота) являются не все.

Cell:
притащит пару статеек из Роема 2005 года или интервью Садовского от 2007 года - тогда и поговорим :)

Да какая разница, за какой год эти интервью. В них доля мифа примерно такая же.

Вообще-то сцылка была на смутные воспоминания Ашманова (формально Волож может подать в суд, потребовать подтверждений, которых не будет... но он не идиот). Иногда “воспоминания” о великом Яндексе похожи на бульдожью хватку http://roem.ru/2013/09/05/gleizer79937/#com180751

И часто эти самые “воспоминания” являются ответом на чей-то вопрос или недоумение. И по какому же принципу они вдруг выплёскиваются в буквы? Наверное покаявшийся дух Сегаловича стряхивает корпоративные заморочки... освобождая какие-то био-массы от невысказанных обязательств.

Только 404 (301) надо ответить по урлу, содержащему _escaped_fragment_=avto // cм хелпы

или по всем урлам с ? // если параметры не используются в новых урлах.

На этом форуме такие не запрещены, и вот http://www.google.com/search?q=site:searchengines.ru+inurl:hash&filter=0

september:
Щимят ссылкоторговлю, разве этого мало?
АГС, обнуление ТИЦ, что дальше?

Всё будет как и раньше: все продолжат делать вид, что держат ситуацию за яйца (и всем это удастся, как ни странно. Со сцылкоторговлей надо было бороться N лет назад, сейчас это скорее вредно, ибо отвлекает массы от мечты попасть с ТОП).

Соотношение пиар/технолии > 10 — не только у святаго Яндекса.

И пропаганда достаточно часто решает то, что не могут недотехнологии. Возникло привыкание (и у яндексоидов, и у спамеров).

ValD:
В данном случае проблема не в подаче новости, а в том, что инфа уехала в сеть

Как будете решать? Думаете само пройдёт, и никакие конкуренты никогда не припомнят?

Вообще, этот Ашманов себе слишком много позволяет (и ведь знает тонны подобного говна, поэтому на него наезжать боятся). И его самого тоже использовали пиарщики других продуктов — примерно так же, как и 4 года назад Cognitive использовала Яндекс — обычно заранее пресекающий что-либо подобное.

slimm:
Я и Г пытаются стать чем-то вроде мировой корпорации

И у них нет возможности просто отказаться от этого.

ValD:
Что ж, каждый себя пиарит как может.

Да, Cognitive тогда жирно попиарилась за счёт вашего Любимого.

Но вот почему-то всякие ашмановы вспомнили подробности именно вчера. А у меня так давно возникали вопросы типа: ну чего там с этим анализатором? А он этому простому Яндексу и нужен-то не был.

ps Кого это волнует: у Яндекса ещё проблемы с таксистами (очень усердно опровергаемые) // т.е. проблемы у бренда в офлайне.

konfuji:
Для прямой аналогии, ИМХО, пресс-релизу маловато веса, чтобы со словами Садовского тягаться (хотя он тот ещё шутник).

Взвесьте Ашманова с Садовским.

Дублями их делает не регИстр урла, а одинаковый контент // но по этому признаку ПС научились тупо отфильтровывать. Но на страницах с изменяющимся контентом можно наплодить дублей и регистром (если сервак 200 отвечает) http://www.yandex.ru/m//?adMiN

ТП скорее всего оветила не так, что это всё равно... скорее сказала, что умный бот разберётся сам.

В запросе регистр не чувствует.

UrL | uRl

Всех сразу можно посмотреть в Гугле с &filter=0

ps Тут показали в выдаче сцылку с #якорем

http://yandex.ru/yandsearch?text=mysql+date

Всего: 13653