Команда Дзена сообщила об изменении алгоритма рекомендаций. Эта версия алгоритма называется Альфа Центавра – как ближайшая к Земле тройная звездная система. Потому что основных изменений в новом алгоритме – три.
Всю работу рекомендательного алгоритма можно условно разделить на два больших этапа:
- Первичный отбор кандидатов. Когда из миллионов публикаций Дзена отбирается для пользователя 10 000 для более тщательного анализа.
- Ранжирование. Когда из этих 10 000 формируются финальные рекомендации, которые и попадают в ленту пользователя.
В алгоритме Альфа Центавра реализованы три новых технологических решения, каждое из которых работает на разных этапах этого процесса.
На этапе отбора применена новая технология, основанная на методе поиска «ближайших соседей» (k-NN). Она позволяет уже на этапе первичного отбора работать с содержанием каждой публикации. Она умеет очень быстро сравнивать интересы пользователя и содержание материала, находя ближайшие по содержанию публикации среди всего множества материалов Дзена. А также она может анализировать намного больше публикаций за раз, значительно расширяя «воронку отбора». Теперь авторам небольших качественных каналов станет проще получить аудиторию, даже не будучи популярными.
На этапе ранжирования тех публикаций, которые уже прошли первичный отбор, алгоритм в качестве одного из параметров учитывает реакцию пользователей. Обновленная система углубляет этот анализ. Теперь в Дзене используется алгоритм матричных разложений (matrix factorization), который обычно используется для рекомендаций «долго живущего» контента — например, музыки или фильмов.
Эта технология смотрит на оценки контента разными людьми, и это помогает системе точно рекомендовать его другим пользователям с похожим профилем.
Третье улучшение направлено на то, чтобы новостная повестка меньше оттягивала внимание от интересных, но не таких актуальных материалов. Технология continuous exploration увеличивает время, за которое алгоритм собирает реакции на опубликованный контент. Поэтому любой материал получает шанс снова попасть в ленты пользователей, а авторы «вечнозеленого контента» в Дзене теперь имеют больше возможностей получать аудиторию независимо от новостной повестки.
По словам представителей Дзена, теперь у каждой версии алгоритма будет свое имя – в честь одной из звезд. Такие обновления будут происходить регулярно и планомерно.
Напомним, последние изменения в алгоритме рекомендаций Яндекс.Дзена произошли в ноябре прошлого года.
В сентябре того же года Дзен запустил партнерскую программу приоритетного ранжирования качественных медиа и авторов под названием «Нирвана».