А что думает бот, когда получает такое?
А в сниппете:
Машина думать не может.
А этот форум за такой текст точно не зобанят. А хоть бы и...
Не так.
Сейчас под АГС (и уже бан) влетел ГС с тупой генерёнкой (лишь один из 5 подобных), хотя морда/ была приклеена к ТОП1 по некому НЧ... и после тоже.
Более двух лет назад под АГС оказался сайтик из десятков страниц с трафиком около 500. Потом пришлось его переклеивать на новый домен. Трафик начинался сразу после склейки.
Т.е. под АГС попадает не сайт...
ну вот гневные пользователи выложили
что-то разнообразия почти нету. И неповторимого текста мало.
И помните, что всё закрытое в роботсе, может успешно искаться, если кто-то вдруг поставит ссылку. Не нравится, не отвечайте 200
Те, по которым написано про регистрозависимость всего, что после Disallow: /
а то была уже тема Яндекс нашел MegaIndex.
Нет ли таблеток от совести?
Распознать могут не генерёнку, а её признаки.
Да и то, использовать это могут не само по себе, а в совокупности с чем-то другим:
А на прямое применение очень умных олгоритмов на мильярдах документов... может не хватать железа.
При каком объёме “обучающего” текста (1M или 2 абзаца) в генерёнке выше вероятность появления несуществующих в нормальном языке наборов слов? (во фразе/предложении/тексте)
Тема не о языке запросов.
Только не надо дежурных песен про персонализацию, и якобы кликнутые сцылки. Этому скрину уже месяца 3 http://roem.ru/2013/09/16/addednews80677/
http://yandex.ru/yandsearch?text=%D1%81%D0%B0%D0%B4%D0%BE%D0%B2%D1%81%D0%BA%D0%B8%D0%B9+%D1%80%D0%B2%D1%91%D1%82+%D0%B6%D0%BE%D0%BF%D1%83+%D1%81+%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%82%D0%BE%D1%80%D0%B0%D0%BC%D0%B8
На эту тему над яндексоидами проводился эксперимент...
А в какой реальности автор изречения:
ps Вопрос был проще: Что же такое «реальность» (в которой т.н. «все» {доносчики|стукачи|мрази})? Ну и как/кем она формируется? И зачем?
А что такое «все»?
И что такое «реальность»?
Вот Cell верует, что яндексоиды набожные...
Они как, в другой реальности?
Для ПС это разные урлы.
Создатели ПС вам не скажут реальных признаков, по которым они фильтруют дубли. Иногда они этого не умеют
http://yandex.ru/yandsearch?text=url:www.yandex.ru/m
или не умеют правильно
https://www.google.ru/search?q=site%3Awww.yandex.ru%2Fm
Вот и попробуйте догадаться про методы.
И ещё заранее угадайте — какую страницу они выкинут.
Дубли — это по одинаковому контенту, а не по урлу | урлу/
Можно сделать экзотичнее... но с разным контентом.
А если в 70 раз быстрее/выгоднее нагенерить уника... который не редко оказывается в ТОП20 по НК и даже выше? А идейности, как у пользователя Cell, на всех не хватает...
А по теме: у Яндекса нет каких-то денежных стимулов... вот он ничего и не делает.