Похоже Яндекс перестал правильно отображать переколдовку.

12 3
ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
6372

Готовил следующую порцию данных экспериментов для темы:

Релевантность контента страниц запросу для Яндекса Эксперимент по Mинычу

и одним из слов у меня был берлин (и в запросе и на странице)

Запрос типа (берлин::задаваемыйвесдляберлина | хрен...::весдляхрена)

Потом для альтернативной проверки беру другое слово вместо берлина (а именно книг) и фактически оказывается, что вклад в релевантность страницы слова "берлин" примерно вдвое превышает вклад от "книг". Чешу репу, посоветовался с друзьями и проверил относительный вклад берлина относительно других слов на странице уже не тестовой, а взятой из жизни:

http://hghltd.yandex.com/yandbtm?url=http%3A%2F%2Fabe.com.ua%2Fprint%2Faction%2F74&text=%E1%E5%F0%EB%E8%ED%7C%E8%E4%E5%FF&dsn=431&d=1577207&sh=3&sg=9&isu=1

Прошу ссылку прямую на эту страницу не ставить нигде и никогда!

И на этой странице вклад берлина практически вдвое превышает вклад от "идеи" или вклад от "угрозы".

Мы тут посовещались, вспомнили недавнюю историю с пессимизацией числительных

и решили, что скорее всего Яндекс продолжает переколдовывать некоторые запросы с оператором процента и нулевым расстоянием (если ему это надо), только теперь не показывает в "найденные слова" точную переколдовку, как раньше, например для Часы была раньше переколдовка:

reqtext=Часы::весчасовобычный /+0 !%Часы::весчасовособый

Аргумент в пользу этого еще такой, что на подсветку неполного кворума убранный оператор процента не влияет. С числительными надо еще поразбираться, что это за новое веяние Яндекса и как его на пользу обратить.

:smoke:

Дайте мне рюмку опоры и мир засветится всеми цветами радуги.
Alden
На сайте с 04.04.2005
Offline
76
#1

ХренРедькиНеСлаще, спасибо за то, что поделились мыслями. На эту тему тоже есть некоторые мысли, в т.ч., что Яндекс изменил в алгоритме. Будем думать ;)

Sape.Ru (http://www.sape.ru/r.7d765d2f01.php) - наше всё! С уважением, Алимкин Денис (http://www.alimkin.ru/).
ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
#2

Версия о непоказе правильной переколдовки получила дальнейшее подтверждение.

Заменил тестовый запрос:

(берлин::весберлина | хрен::весхрена) на

(берлину::весберлина | хрен::весхрена) а потом на

(берлине::весберлина | хрен::весхрена)

и оказалоссь, что Яндекс учитывает падежи в запросе и на странице и дает примерно вдвое больше влияния для запросов "берлин" или "берлину", если на странице есть точная форма слова "берлин". При этом для запроса "берлин" влияния дается немного больше, чем для запроса "берлину".

Для запроса "берлине" наличие точной формы слова "берлин" на странице не дает никакого преимущества.

Все это наводит на мысль, что Яндекс сейчас проводит очередную компанию по перетряхиванию тех запросов, которые по мнению Яндекса должны учитывать падежи и заглавные/строчные первые буквы слов (аналогично прежним компаниям, если вспомнить много таких уже было "качелей": часы, домофоны, ногинск, официальный сайт и т.д.).

Сейчас проверю для запроса "великобритания", где вроде такая же пертрушка.

Yahoo!
На сайте с 20.12.2005
Offline
43
#3

ХренРедькиНеСлаще, Я вас правильно понял?

Похоже с Великобританией тоже самое ...

[ATTACH]2705[/ATTACH]

jpg Untitled-1.jpg
ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
#4

Yahoo!, у Вас позиция 3 очень хорошо смотрится.

Да, можно легко увидеть, что выдача по берлину и великобритании резко меняется, если падеж в запросе изменить (жалко мы не можем менять падежи сразу в индексе Яндекса).

Тут еще одно доказательство переколдовки, которая не показывается - это "зашкаливание", т.е. когда не удается добиться изменения позиций как веса не меняй для запроса типа:

(берлин<<"предложение со стр 1" | берлине <<"предложение со стр 2")

так как там предполагается переколдовка с процентом и "всегда" (почти :) ) при такой переколдовке преимущество получит запрос с процентом в переколдовке (этот запрос ВСЕГДА получает дополнительные баллы, если на странице есть слово в точной форме типа "берлин").

AiK
На сайте с 27.10.2000
Offline
257
AiK
#5

ХренРедькиНеСлаще, вообще-то разница в учёте морфологии заметна и без весов, т.е. по более примитивным запросам. Только зачем же об этом на всю деревню кричать? :)

ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
#6
AiK:
ХренРедькиНеСлаще, вообще-то разница в учёте морфологии заметна и без весов, т.е. по более примитивным запросам. Только зачем же об этом на всю деревню кричать?

AiK, обратите внимание на название темы.

И кроме этого, разницу в выдаче видно, никто с фактом этим не спорит, однако как я успел заметить, на форуме что только не пишут О ПРИЧИНАХ этого, а ДОСТОВЕРНОГО ответа никто вроде не давал (или я что-то упустил?).

Смотрите, например этот пост: /ru/forum/comment/1647991

pro-maker
На сайте с 08.12.2003
Offline
281
#7
ХренРедькиНеСлаще:
как я успел заметить, на форуме что только не пишут О ПРИЧИНАХ этого, а ДОСТОВЕРНОГО ответа никто вроде не давал (или я что-то упустил?).

Косвенно ответил Садовский:

Садовский:
32. Правда ли, что при учете анкоров ссылок при ссылочном ранжировании текст ссылки приводится сначала к первичным словоформам (леммам), отбрасываются стоп-слова, и только после этого проводятся расчеты?
Совсем не так. Мы стараемся угадать, насколько запрос соответствует странице. Текст ссылок анализируется с этой точки зрения.
AiK
На сайте с 27.10.2000
Offline
257
AiK
#8

ХренРедькиНеСлаще, во-первых, у меня есть основания полагать, что ЭТО ещё толком не началось, так что достоверные причины ещё долго искать придётся. Во-вторых, дело не только в более скурпулёзном отношении к точным вхождениям словоформы (похоже ещё требуется и некая вариативность в текстах страницы отсюда ощущение, что контент рулит), но и некоторые другие факторы, о которых покамест говорить рано. А в-третьих, изменения в запросах с указанием веса слова лично мне ни о чём не говорят. Просто потому, что я допускаю возможность того, что слофоформы стали по-другому учитываться именно для этих запросов.

pro-maker
На сайте с 08.12.2003
Offline
281
#9
AiK:
во-первых, у меня есть основания полагать, что ЭТО ещё толком не началось

AiK, пожайлуста, уточните, что имеете ввиду под "ЭТО ещё толком не началось"?

AiK
На сайте с 27.10.2000
Offline
257
AiK
#10

Назову ЭТО так: выкат на публику новой версии индекса. Мне представляется разумным осуществление этого процесса в таком порядке: всестороннее тестирование нового индекса локально, а потом в несколько порций подмешивание нового индекса к старому. Это даёт возможность откатить всё малой кровью, ежели что-то пойдёт не так, как планировалось. Соответственно между впрыскиваниями новых порций необходимы паузы для сбора feed-back'ов.

В общем, ближайший апдейт подвтердит или опровергнет моё предположение завершился ли этот процесс или нет, и осмысленно искать новые правила игры можно будет только после этого апдейта. Если правда ещё подождать не придётся :)

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий