Примитивный алгоритм Яндекс.Дзен

S
На сайте с 24.01.2009
Offline
73
1691

На днях решил провести небольшой эксперимент со своим каналом в Яндекс.Дзен. Связано это с тупейшим алгоритмом Дзена, который накладывал на несколько моих каналов ограничения за якобы неуникальный контент (хотя контент уникальный), а в тех поддержке Дзена мне говорили, что их алгоритм "идеальный" и ошибиться не может. Вот решил поверхностно доказать обратное.

В общем, создал два поста: сначала "Почему после секса болит низ живота?", а на следующий день "Почему вреден секс?". Хотел проверить попадут ли эти посты в категорию 18+ или нет, ограничат ли их в показах или нет. Так вот, в итоге первый пост получил около 18000 показов (2100 дочитываний), а второй пост был ограничен в показах и получил 2 показа (подписчики судя по всему). Решил в тех поддержки спросить какая разница в этих постах и за что ограничения. Получил ответ:

Семён, здравствуйте!

Публикация Почему после секса болит низ живота? действительно была воспринята системой положительно, а Почему вреден секс? была ограничена в показах из-за контента категории 18+

Сложно сказать почему системой были сделаны именно такие отметки на публикациях. Проверка материалов работает по определенному алгоритму, постоянно обучаясь на примерах новых публикаций, тщательно анализируя их.

Алгоритм опирается не только на слова, написанные в статье, но и на другие факторы: изображения (в вашем случае всё допустимо), реакции пользователей на другие статьи подобного содержания. В совокупности у системы складывается своя картина допустимого содержания и контента для взрослых.

Публикации такого типа ограничены в показах и становятся доступны только вашей собственной аудитории - подписчикам.

От себя добавлю, что такая фраза вполне могла бы смутить систему, но это лишь моё личное мнение. К сожалению, иногда бывает трудно понять логику системы.
"Кроме того, наиболее вредными считаются для женщин в положении куннилингус (есть риск возникновения эмболии), и коитус с мужчиной, который болеет ЗППП."

С уважением, Елизавета

Я давно убежден, что алгоритм в 90% случаев обращает внимание исключительно на заголовок поста, поэтому решил в пессимизированном посте заменить слово "секс" на "половые отношения", то есть в итоге "Почему вредны половые отношения?". И о чудо, пост сразу получил около 2100 показов, то есть он уже подходит для читателей младше 18 лет, из-за одного слова в заголовке. Все это свидетельствует о том, что алгоритм Дзена очень примитивен.

Далее написал в ответе на их письмо следующее:

Я продолжил экспериментировать с этими двумя постами. И тот пост Почему вреден секс? , который был ограничен в показах из-за контента категории 18+ (как вы написали), я изменил всего одного слово в заголовке. Теперь пост называется "Почему вредны половые отношения?", слово секс я заменил на половые отношения, только в заголовке. Ни одного слова внутри поста я не менял. И что в итоге? 2130 показов, больше 200 дочитываний, и это только сейчас, на момент прочтения вами письма будет больше. Что доказывает что ваш алгоритм очень примитивен (о чем я писал раньше) и никакой он не идеальный (о чем мне писала ваша тех поддержка раньше, когда были ограничены 2 моих канала за неуникальный контент, которого вообще не было, ибо все посты пишу сам и проверяю по 10 раз).

Ответа еще не получил, да и вряд ли там будет что-то интересное. В любом случае ответ ниже размещу.

P.S. Не используйте спорные слова в заголовках. Надеюсь кому-то информация поможет.

respekto
На сайте с 15.01.2011
Offline
286
#1

Забанят .

Нужны аки адсенс - грузия, молдова, ирландия, литва, британия, стучите в скайп у кого есть на продажу. Bul li ku ta одним словом
GRAFLEKX
На сайте с 05.11.2010
Offline
200
#2

У них там вообще всё очень интересно устроено.

Алгоритм обучается на человеческой реакции, следовательно, алгоритм, как и человек, часто ошибается.

Но, если человек может пересмотреть своё решение и признать ошибку, то алгоритм этого не умеет.

А проверить ваш канал вручную и выявить ошибку, это значит - создать прецедент.

Представляете, сколько народу ломанется с претензиями, если СП признает ошибку алгоритма?

Да и не любят сотрудники Яши работать ручками, не для того они создавали эту шайтан-машину.

Кроме того, система тиккетов у них тоже странная.

На первые два-три тиккета вам отвечают: Маши, Феди, Васи, сидящие на удаленке.

Они на самом деле ничего не могут и не будут делать, кроме отчета от системы и шаблона, соответствующего ситуации.

И если им не удается решить проблему, убедив автора в его неправоте, то они передают тиккет реальному сотруднику СП, который работает в штате.

Вот уже этот сотрудник, может оторвать свою пятую точку от стула, и проверить ваш канал вручную.

Но и он ничего не сможет сделать, даже если увидит, что алгоритм действительно ошибся.

Иначе - прецедент...

В общем, о чем, я )))

Если встает дилемма: ошибка алгоритма и ваш канал - ваш канал пускают в расход, без каких-либо сожалений.

По поводу копипаста, уже много раз обсуждали, что копипаст проверяется не по тексту, а по ключевой идее самого текста.

Если подобного материала мало в Дзене, то алгоритм пропустит даже галимый копипаст.

А если такого материала уже валом, то алгоритм пришьет копипаст даже уникальному тексту.

И ничего вы с этим не сделаете... вот так вот они странно борются с "чистотой" кач. контента...

Мы поможем в поиске работы: стабильная работа для вас ( https://www.rabota.ru ), вакансии и резюме.
NR
На сайте с 01.12.2008
Offline
150
#3
GRAFLEKX:
Иначе - прецедент...

Но вот парадокс - на прецедентах и должен обучаться робот ) Ему руками должны указать на ошибку, а он учесть ее. В Дзене на такие "мелочи" вероятно не смотрят. Когда двумя руками держишь горсть золотых монет, то особо не заморачиваешься, если одна-две выскользнут сквозь пальцы.

Апокалипсис
На сайте с 02.11.2008
Offline
391
#4

Кол-во показов в ленте зависит строго от:

- уникальности инфы внутри дзена (на уник контент вообще все равно).

- количество дочиток на первом выстреле (500-100) показов

- количество лайков на первом выстреле

- комментарии добавляют еще несколько % к показам

Записки нищего (http://zapiskinishego.ru) - мой личный блог Услуги php программиста. Очень нужна любая работа. Не покупают? Поведенческий аудит интернет-магазина за 5000 руб. (/ru/forum/990312)
GRAFLEKX
На сайте с 05.11.2010
Offline
200
#5
NewReiter:
Но вот парадокс - на прецедентах и должен обучаться робот ) Ему руками должны указать на ошибку, а он учесть ее.

Ручаюсь, что всё именно так и происходит.

Сотрудник, который отвечает за логические цепочки и фильтры, подстраивает алгоритм, обучая его на вашей ошибке.

Но, признавать, что ошибка на самом деле произошла - никто не обещал )))

Грубо говоря, вы помогаете развивать алгоритм, отправляя свои каналы в бан. 🤪

---------- Добавлено 22.09.2018 в 17:10 ----------

Апокалипсис:
Кол-во показов в ленте зависит строго от:
- уникальности инфы внутри дзена (на уник контент вообще все равно).
- количество дочиток на первом выстреле (500-100) показов
- количество лайков на первом выстреле
- комментарии добавляют еще несколько % к показам

Совершенно верно.

Добавлю еще, на личном анализе...

Если в первый момент, когда алгоритм подбирает аудиторию для показа, со статьи подпишется N человек с жирным профилем интересов, то млн. показов статье обеспечено.

И этот жирный профиль должен быть составлен именно в Дзене, а не в поиске...

Короче, вывод: создавайте ботов, раскачивайте им профиль, читая каналы Дзен, а потом подписывайтесь под ними на ваш канал = )))

htexture
На сайте с 29.05.2017
Offline
194
#6
GRAFLEKX:

По поводу копипаста, уже много раз обсуждали, что копипаст проверяется не по тексту, а по ключевой идее самого текста.
Если подобного материала мало в Дзене, то алгоритм пропустит даже галимый копипаст.
А если такого материала уже валом, то алгоритм пришьет копипаст даже уникальному тексту.
И ничего вы с этим не сделаете... вот так вот они странно борются с "чистотой" кач. контента...

Если бы я такое делал, то исключительно для того чтобы засрать первые места в выдаче поисковика. А значит если такого конента мало в выдаче, добро пожаловать, если даже это копипаст, а если этого контента было много, делаем в расход и не платим больше. Хитро, подло и по яндексовски.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий