Откуда эти бредоцифры. Все кто надо уже до этого сидели в рся. Кого до этого не брали - либо совсем мелкосайты либо пиратки, зарабатывающие на тизерах. Первые погоды не делают, вторые в массе своей так и доживают свой век на тизерах.
Еще раз. Рекл слился в дзен. То что вы там ловите вордстатом, просто яндекс еще туда не добрался. Это вопрос времени. Сайты, зарабатывающие на товарках (спа), уже начинают ловить фильтры от яндекса.
Поэтому говорю. Работаете лопатой в поте лица. Всегда придется искать дыру, где яндекс еще не освоил.
Это не сравниться с тем, чтобы развивать один добротный сайт. Но для этого он должен успешно монетизироваться.
Очевидна и не решаема. Зарабатывать на текстовом контенте будет теперь яндекс через дзен, знатоков, которых прибьет к топу. И главное платит же копирайтерам, хотя бы пока. Потом может и не будет. Дело хозяйское. Владельцы сайтов, которые заказывали статьи у копирайтеров, тоже тем платили одноразово. Так что копирайтеры не в обиде останутся, а так называемые вебмастера в массе своей дохне.
Так у вас активный доход, а мы тут все привыкли к пассивному. Запилили по сайту несколько лет назад, теперь сидим на пятой точке и ноем, что мало капает. Мы типа инвесторы, а не лопатой махать.
У меня не везде.
Вы заметили, что количество лайков в стате и статьях не совпадает. Теперь можно вычислить количество дизлайков.
Проблема работы с дзеном в том, что вы не распоряжаетесь своим контентом, а полностью зависите от яндекса и его желания вам платить. Завтра он продолжит гнать много трафа на ваш контент, а платить грош.
Написать алго, который вычисляет каналы с высоким стр, легко. Алго, который определяет так называемый контентный спам, почти нереально. Так что КС должен определяться по косвенным признакам. Т. е. стр и много комментариев, да еще с матом. Если уж кто гонит бытовуху, разбавляете заумными статьями, которые в дзене никто кликать не будет, но из поиска может че когда и наплывет.
Только анализ и свой стиль изложения не позволит писать пачками. Писать же в стиле "что вижу, то пою" может каждый второй. И это не драматургия.
Логика.
Какое именно. Что 10% - это на грани кликбейта или что робот такое сечет, когда у одного канала все по 10?
А какой у вас стр в ленте. У меня статья на статью не приходится, от 1 до 10%. У большинства статей около 3%. Просто если все статьи имеют 10%, это признак кликбейта/хайпа, что сечет робот и передает на проверку в ТП.
Опишите алгоритм проверки схожести сюжетов. Робот Дзена - это ТП, которая скорее всего реагирует как только статья переваливает за энное колво показов или жалобы.
Можно вычислить последовательность употребления ключевых слов. Если она в одной статье такая же как другая, то статьи подобны.