И помните, что всё закрытое в роботсе, может успешно искаться, если кто-то вдруг поставит ссылку. Не нравится, не отвечайте 200
Те, по которым написано про регистрозависимость всего, что после Disallow: /
а то была уже тема Яндекс нашел MegaIndex.
Нет ли таблеток от совести?
Распознать могут не генерёнку, а её признаки.
Да и то, использовать это могут не само по себе, а в совокупности с чем-то другим:
А на прямое применение очень умных олгоритмов на мильярдах документов... может не хватать железа.
При каком объёме “обучающего” текста (1M или 2 абзаца) в генерёнке выше вероятность появления несуществующих в нормальном языке наборов слов? (во фразе/предложении/тексте)
Тема не о языке запросов.
Только не надо дежурных песен про персонализацию, и якобы кликнутые сцылки. Этому скрину уже месяца 3 http://roem.ru/2013/09/16/addednews80677/
http://yandex.ru/yandsearch?text=%D1%81%D0%B0%D0%B4%D0%BE%D0%B2%D1%81%D0%BA%D0%B8%D0%B9+%D1%80%D0%B2%D1%91%D1%82+%D0%B6%D0%BE%D0%BF%D1%83+%D1%81+%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%82%D0%BE%D1%80%D0%B0%D0%BC%D0%B8
На эту тему над яндексоидами проводился эксперимент...
А в какой реальности автор изречения:
ps Вопрос был проще: Что же такое «реальность» (в которой т.н. «все» {доносчики|стукачи|мрази})? Ну и как/кем она формируется? И зачем?
А что такое «все»?
И что такое «реальность»?
Вот Cell верует, что яндексоиды набожные...
Они как, в другой реальности?
Для ПС это разные урлы.
Создатели ПС вам не скажут реальных признаков, по которым они фильтруют дубли. Иногда они этого не умеют
http://yandex.ru/yandsearch?text=url:www.yandex.ru/m
или не умеют правильно
https://www.google.ru/search?q=site%3Awww.yandex.ru%2Fm
Вот и попробуйте догадаться про методы.
И ещё заранее угадайте — какую страницу они выкинут.
Дубли — это по одинаковому контенту, а не по урлу | урлу/
Можно сделать экзотичнее... но с разным контентом.
А если в 70 раз быстрее/выгоднее нагенерить уника... который не редко оказывается в ТОП20 по НК и даже выше? А идейности, как у пользователя Cell, на всех не хватает...
А по теме: у Яндекса нет каких-то денежных стимулов... вот он ничего и не делает.
Эта тема не про АГС.
(к сведению бесплатным защитникам святаго Яндекса)
Грязно там, где срать выгоднее. Ибо Яндекс...
( это ответ, если чего: )
Просто в большинстве случаев Яндекс хочет, чтобы ему просто не мешали загребать бабло, этим циникам откровенно насрать на последствия в окружающей среде.
интересы описаны последней фразой.
А чтобы отмазать засравшийся имидж... иногда пиарит свои недотехнологии. Тупой пиар просто выгоднее... а реальных технологий (на данной стадии недоразвитости человечества) и быть-то не может (ну или вложения в них не окупятся никогда).
Поэтому... предсказуемы/наблюдаемы печальные последствия наличия ПС/СКР.
Несколько лет назад озвучивалось что-то типа 100К оцененных запросов (это за всё время работы асессоров), это малая часть того количества, которое обрабатывается за день.
Да они вообще редко чего-то смотрят перед ответом.
Пример переписки с ботом /ru/forum/comment/8000024 (по нейтральной теме). В первом письме не было даже урла, а ссылки на поиск — только в Гугле.
Вот так плохо написан Бот Щукин... что уж говорить обо всём остальном и АГС в т.ч.