Ну вы и скажите. Это же вы настаиваете, что УГ страницы в индексе потому что... ПФ. Или вы просто штампуете комменты?)
Спасибо, за третье объяснение, что и как называется. Без вас ведь этого никто не знал...Но что бы были какие-то ПФ на выдаче, надо что бы страница как минимум в этой выдаче присутствовала. ПФ может иметь значение для индексации, но только как вторичный фактор. Первичные, все таки какие-то другие, правильно?У меня по рабочему сайту, например, сейчас в индексе остается 30к, из которых хоть какой-то трафик (и соответственно ПФ) имеют от силы 3. Среди остальных 27, есть качественные, есть и откровенно мусорные. Но они по каким-то причинам в индексе.Лично мне видится, как одна из причин - банальный дефицит документов отвечающих на запрос. Если запросы есть, а показывать по ним особо нечего, то держат в индексе и всякое УГ. Безотносительно их ПФ.
я же говорю это и есть пф - пользовательские факторы ))) а вы "нет"
Сам по себе перехода из поиска. А не поведение на сайте, или возвраты в него. Речь ведь о полных клонах, поведение пользователей на которых ровно такое же как на основном. Плюс сокращение индекса на основном. Для которого поведенческие никак не менялись. А просто увеличилось количество конкурентов в поисковом индексе.Переход, с любыми метриками - тоже ПФ. Но тут наверно не о них, а о поисковой базе и количестве документов отвечающих на запрос.
Нет. Или не совсем.Тут достаточно любых переходов из поиска. С какими угодно поведенческими параметрами и возвратами. Если страниц отвечающих на запрос недостаточно, ваша будет сидеть в индексе. кажется как-то так.
Недостаточный объем контента лишь одна из причин. Например, если в индекс зайдет технический дубль, любой, даже самой расконтентной страницы - основная запросто полетит в "недостаточно качественные". И каноникал это лечит лишь отчасти, потому как яндекс считает что он умнее, и может решать на свое усмотрение, что тут каноническое а что дубли.Дубли не обязательно должны быть техническими или вообще внутренними. Летят страницы с минимальными отличиями (цвет, вес, объем, размер...). Или такой пример - жил себе ИМ со 100 к стр, 80% из которых стабильно сидели в индексе. Расклонировали на десяток региональных поддоменов, нормально расклонировали, у каждого свои маски тайтлов/описаний, реквизиты, каждый отдельно занесен в я-панельку, присвоен регион, добавлен в справочник, имеет реальное представительство... По ним в "недостаточно качественные" от 60 до 99% стр. При этом и на основном индекс просел.Что характерно, в крупных регионах которые дают наибольшее количество кликов (СПб например) у поддоменов в индексе по 40%, а у какого-то Южносахалинска, который дает 5 переходов/день - 1%.Еще пример, чистил из индекса фильтры, которые владелец сайта разрешил к индексации. Около 50 к, из которых в индексе сидело обычно не более 5. Через метрику отобрал дающие хотя бы 3 перехода/месяц. Их оставил, все остальные снес. И вот эти (с хотя бы 3 переходами из поиска за месяц), как оказалось в индексе сидят вполне надежно. Хотя ровно такие же некачественные, по всем критериям.Проще говоря: объем контента + уникальность (внутренняя и внешняя) + настройки индекса (никаких технических дублей), и + востребованность страницы в поиске. Последний пункт заруливет все остальные.Сайты у которых все, и/или большинство страниц отвечают этим условиям - ничего не потеряли. Индекс как был 100%, так и остался.
Тот самый, который не востребован в поиске, и без всяких "аварий" перманентно вылетал из индекса.Так совпало.
Мне кажется вопрос не только в низкочастотности, а именно в избыточных низкочастотниках в поисковой базе.Такие даже и не особо то НЧ, но которые используют очень многие - порезало сильнее.А такие, почти совсем нулевички, живут и не кашляют.Это в общем и целом, потому как порезало и тех и других, но конкурентные низкочастотники больше.
Эта история наверно не про отжать трафик. А разгрузить сервера.А из того, что по трафику никто не плачет, минусуют, кажется, не столько мусорные страницы (в контентной части), сколько - не востребованные в поиске. По крайней мере для сайтов, у которых они до трафиковой зоны не дотягивают.