Этот текст — для людей... которым не объяснить причин невозможности обеспечения идеальной точности работы алгоритмов. Если же перевести это на совсем уж человеческий язык, то: сайты выкидываются из индекса по подозрению или их комбинации, ранжируются аналогично. Признаки могут быть слишком просты... и их не всегда можно будет выразить на человеческом языке.
Если кто хочет поупражняться: напишите алгоритм распознавания дорвея. Схемку накидайте, которую можно в код превратить. С учётом того, что проверять придётся очень много документов, а вычислительных мощностей не очень-то и много. А дорвеи бывают очень разные и появляются новые их виды.
Поэтому для яндексоидов может быть актуальным выбор: повысить точность | увеличить производительность?
Надо прикидывать адекватность (поставленным целям) используемых средств. Выше было отвечено про необходимость учёта конкурентности — совокупности усилий, затрачиваемых на присутствие в выдаче по ...
А вообще, мне такие темы кажутся воспоминаниями о том, чего уже не будет.
Вот ещё давно сказано:
Так вот они сказали оптимизаторам, но ... бессмысленно говорить о ТОПе, говоря об НЧ-траффе. Это надо мерить иначе.
Прошлым летом попытался собрать цитат из воспоминаний в конце поста, но это всё уже тогда было воспоминаниями, теряющими актуальность... с тех пор тем я и не завожу.
«Вы думаете как человек» ©
Про ботов так нельзя.
Любой пиарщик Яндекса вам заявит, что: Матрикснет ... улучшил ... на *% ... и у Матрикснета нету ... склонности к «переобучению»... как у других, менее совершенных алгоритмов машинного обучения. — Это если смотреть на массу результатов. Ну отдельные причуды стали странными и бесчеловечными, но типа их же стало меньше в целом, хотя и осталось столько, что всех руками не удалить. Ну нет у них в метриках чего-то типа коэффициента вредности конкретного вида причуд, дабы их как-то взвешивать типа.
Сами с собой они бороться не будут... наверное, глупо тратит внимание на неустранимое или потенциально бесконечное... проекту надо успеть пожить таким... какой он есть.
Стопсловей надо было напихать. И сразу пачку картинок с разными вариантами, включая реальный текст.
У меня бывало за 1 сцылку* с 30 страниц.
________
* в действительности, за некоторый набор неизвестных условий.
Если о качестве сказать больше нечего, то ...
Это фактически...
Они не стесняются выкидывать по минимальному автоматическому подозрению и не видят в этом чего-то плохого... для своих ползателей. Сайты для ботов не вылетают, чаще те, что реально для людей. Дело наверное в том, что ихняя фильтровалка настроилась так, что ... признаки того, что надо выкидывать из индекса, оказались и на вашем сайте. (всякий хлам часто прикидывается СДЛями, поэтому фильтровалка загребает и пушистых тоже)
Придётся просмотреть все страницы на предмет признаков нарушений, формально, как тупой бот. Счистить всё... и «5 тематических ссылок» тоже. Если за месяц в индекс не вернётся, а какие-то сцылки уже накопились и они ценны, попробуйте сделать зеркало (внимательно прочитав хелп). Как ни странно, на старом домене фильтр может сохраняться, а на новом может не быть условий его наложения, но это не правило, а случай. Если сцылок нет, удалите всё и сделаете новый сайт позже, пока контент не растащило.
Это ******!
На что гражданин начальник автоматически даёт стандартный ответ.
У этого форума их более 100.000/мес. БОльшая часть — с частотой ~1/мес*.
__________
* Когда говорим о таких значениях, следует помнить о большой неопределённости (1±1), т.е. почти неповторимые запросы. Вы ими хотите линковать?
Ну да ладно, хрен бы с ними, с совками из яндыкса...
... вот гуглоиды поступают заметно мякше: запихивают давнюю перелинковку вместо тайтлов или вместе с ними, или одни анкоры вместе с другими, вот и радуйтесь былым стараниям. Почему уже не первый год этого никто не замечает? На эти грабли надо наступать самому.
Подобное могу рассказывать...
Вопросов почти нет.
Качество (для людей) боты заранее определять не могут, как и уникальность не всегда, как и первоисточник... скорее только вероятность, что это копипаст / нечёткий дубль. У современных ПС возникают другие проблемы, если они начинают решать упомянутую выше. А сцылку не нашёл.
Рерайт может висеть выше первоисточника даже тогда, когда к первоисточнику чувствуется очень хорошее отношение ПС.
Но эта тема — про качество контента. Любой рерайт — не добавляет ничего нового. А желающих «так же как у них», но дешевле — и без ТС слишком много. ПС об этом всём знают, признают, но ...
Ну и ТС не учёл, что мне это явление чисто конкретно не нравится.
Значит условия показа описалова... могут так и остаться невыполненными.
Самым самым тормозом для работы со сниппетом являются именно предрассудки ВМ. Все привыкли к определённому распределению слов по документу и про другое — запрещают себе думать, хотя не столь уж и редко можно существенно подправить текстовый фрагмент в выдаче минимальным изменением... тайтла. Там просто уже начинают играть роль типа замыслы создателей аннотирования.
И замыслы эти бывают непонятны: зачем скомканы три тайтла? Заменены / дополнены анкорами. Их читабельность ухудшилась. Ну да, доперелинковывался давеча, а ПС вдруг изменилась. Тут-то не проблема, а скорее её индикатор, коллекция подобных глюков, но на реальной странице такой случайности не хотелось бы.
Так что ПС сами вас вынудят что-то менять.
Скорее оно навредит, если эти слова окажутся видны... и будут ну совсем не по теме запроса.
Смотрим википедию. Там нету описаний, но текста полно.
Ну и ещё скрипт с какого-нибудь дора... пусть даже не работающий, но чтоб был.
Это же может произойти и по косвенным причинам...
Представители ПС давно признались: Им не нужны в выдаче ссылки на документы, по которым подозрительно мало кликов:
+ чистосердечное признание для сцылкоспамеров.
Страшно?
Типа о естественных ПФ не забывайте.
Точно можно сказать, что прямо не влияет.
Основная проблема, что никто не задумывается об условиях показа имеено описалова. А эти условия не только в нём самом. В пояснениях к коду древней демки когда-то написал:
может быть ещё чего-то работает так же.
Кроме того, и это значимее, бэки и перелинковка может заменить тайтл. И так хитро, что такая цитата не ищется, только кусок до дефиса.
Ну совсем не так. Просто такими иногда оказываются последствия типичной оптимизации по упрощённым учебникам, но это лечится.
А он часто стал заменяться текстом сцылок, например. Так что, уже достаточно часто и не тайтл важен, а то, что оказывается в выдаче на его месте.