В текущем году Яндекс уже во второй раз нас порадовал внедрением нового официального «именного» алгоритма ранжирования. И если февральский «Владивосток» касался только мобильной выдачи, то ноябрьский «Палех» был анонсирован для общей формулы.
Вкратце: алгоритм «Палех» предназначен для поиска таких ответов на запросы, которые не содержат ключевых слов, входящих в запрос, но тем не менее релевантны ему. Это особенно актуально для длинного хвоста низкочастотных запросов, когда пользователь формулирует запрос достаточно нечетко, не сумев подобрать «правильных» ключевых слов, по которым поисковая система может выдать ему релевантный ответ. Поэтому поисковику приходится подбирать некоторые «ассоциации» к исходному запросу.
Впрочем, проблема с подбором расширенных результатов поиска не нова, и Яндекс уже давно пытается ее решить. Первой ласточкой было внедрение в 2008-м году в алгоритме «Магадан» первых вариантов синонимов ключевых слов – перевода и транслитерации. Затем синонимы сильно расширились за счет создания специального словаря. Также было внедрение в 2010-м году в алгоритме «Краснодар» технологии «Спектр» – попытки расширить выдачу за счет учета возможных вариантов расширения потребностей пользователя, заданных в общем, достаточно неоднозначно сформулированном, запросе.
Но все эти нововведения не решали проблему релевантной выдачи для «длинного хвоста», и вот появился «Палех». И сразу же стала весьма интересной задача определения, какие именно результаты выдачи сформированы конкретно этим алгоритмом.
Об идентификации различных уже известных примесей к органической выдаче Яндекса, в том числе, и сформированной технологией «Спектр», я писал в своей статье «Примеси к органической выдачи Яндекса».
Примерно месяц назад (еще до анонса «Палеха») мне показали один любопытный запрос, отдельные результаты в выдаче по которому заставили задуматься о том, что в ней могло появиться что-то новое. Выдача по запросу по названию русскоязычной школы «Адриатик Колледж», находящейся в черногорском городе Будва, содержит ссылки на документы, касающиеся других русскоязычных школ Черногории и не имеющие подсветки ключевых слов из запроса в сниппетах:

Оказывается, что эти страницы вообще не содержат слов запроса ни в контенте, ни в текстах входящих ссылок:



Дальнейшее исследование показало, что документы, ведущие себя в выдаче по базовому запросу [адриатик колледж] как найденные с помощью «атипичной синонимии», достаточно хорошо находятся с помощью следующего запроса (по крайней мере, такими свойствами обладают четыре документа из топ-5):


Еще один пример «атипичной синонимии» я обнаружил у запросов, представляющих собой некоторые достаточно редко употребляемые русскоязычные варианты корейского бренда «Hyunday»:

Другие же (более распространенные?) русскоязычные варианты бренда, такие как [хендай] ведут себя, как «типичные» синонимы:
К ним также относятся запросы [хюндэй], [хюндай], [хюндаи] и др.
Я буду очень признателен, если кто-то из читателей найдет в выдаче подобные примеры «атипичной синонимии» и пришлет мне на е-мейл ludkiewicz@yandex.ru для исследования. А вдруг это действительно реальный способ идентифицировать примесь к органике, сформированную «Палехом».