Яндекс на RCDL 2010. Поведенческие факторы и разнообразие выдачи.

wolf
На сайте с 13.03.2001
Offline
1183
#21
G00DMAN:
В докладе "Яндекс на РОМИП-2010. Тестирование простой ранжирующей формулы", который был прочитан, как и первые два, на той же неделе в той же Казани, описан один из факторов ранжирования - YMV. Который обратно зависит от величины MV(документ, запрос) - размера минимального (в словах) окна в тексте документа, в которое входят все слова запроса. Такое окно по традиции назовем "трастовым окном". Т.е., чем меньше размер окна, тем больше значение фактора.

Дык, это насколько я понял, для документов, в которые входят не все слова запроса:

Суть модификации состоит в добавлении в формулу множителя, масштабирующего значение фактора для документов, в которые входят не все слова запроса.

Много таких продвигается в топы? ;)

P.S. Упс, протормозил спросонья, про модификацию ведь речь :)

А вообще, похоже, нечто подобное сейчас используется в портяночном фильтре. Как забдят "окошко", напичканное ключевиками, да еще если оно и далеко от начала страницы - так сразу за Можай.

P.P.S. И всё равно, максимум этого фактора, на беглый взгляд, достигается на точном вхождении фразы (в этом случае mw(d,n), находящееся в знаменателе, будет минимально). А оно у всех есть, кто в топ лезет. Так что выигрыша по сему фактору не получить.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
Step40
На сайте с 12.02.2009
Offline
245
#22
G00DMAN:
Наверняка не все быстро найдут в сети, поэтому подскажу пару ссылок. В трудах RCDL 2010 можно обратить внимание на 2 доклада от Яндекса (pdf):

"Оценка разнообразия результатов веб-поиска с помощью материалов Wikipedia" - о том, как можно подмешивать выдачу при разнообразии ответов на запрос.

"Экономия времени как мера качества поисковой системы" - о некоторых поведенческих факторах, которые умеет считать Яндекс.

Удачного чтения. ;)

Там море любопытного ...второй день сижу как привязанный...

Вот Вам и первоисточник и воровство контента Вот

А вот Вам сео ссылки Вот...

inseonight
На сайте с 10.10.2008
Offline
170
#23

Я думаю, что скоро ещё больше будет цениться размещение ссылок навсегда. Яндекс идет по пути развития Гугла. Скоро будем продвигать только статьями...

Занимаюсь разработкой и продвижением интернет магазинов. Внедряю аналитику и консультирую по seo.
6uoncuxo3
На сайте с 05.11.2008
Offline
202
#24
Step40:
А вот Вам сео ссылки

Они какбэ предупреждают:

Таким образом, несмотря на свою показательность, тематическая близость не может являться средством для выявления спам-ссылок
Тем не менее, указанный показатель может применяться именно для комплексного отсева спам-ссылок.

В общем-то есть что почитать.

We all live in a sick world, where hatred is a weapon, and freedom - a dream. © На небе — Бог, на земле — Россия. © Сербская поговорка.
john2007
На сайте с 26.03.2007
Offline
173
#25
aalexeev:
john2007, "отказ" (человек ничего не нашел) как правило сопровождается длительной сессией и множеством кликов, затем переход на гугл\рамблер, а если кликов 1-2 и потом уход то это я полагаю трактуется как "положительный результат".

Вот у меня частенько наоборот.

Если кликов 1-2 и потом уход, то это я ничего не нашел на Яндексе :)

А длительная сессия и множество кликов у меня говорит, что полезной информации много и я ее изучаю.

А на счет YMV - браво Яндекс!

Теперь документы с точным вхождением или как можно более близким к точному будут цениться выше.

Ну и позднова-то же их осенило :)

Совершая ошибки, мы не только учимся их не повторять, но и учимся прощать такие же ошибки другим... (с)
G00DMAN
На сайте с 19.04.2008
Offline
122
#26
john2007:
А "Экономия времени как мера качества поисковой системы..."
Вот я так и не понял, как время, затраченное на поиск коррелирует с качеством выдачи?

Ну там же в заголовке написано - мера качества. Сама с собой она отлично коррелирует. А с качеством в Вашем понимании не обязана. :)

Фича экспериментальная, на саму меру можно забить, достаточно посмотреть на то, какие данные Яндекс снимает с выдачи.

wolf:
И всё равно, максимум этого фактора, на беглый взгляд, достигается на точном вхождении фразы (в этом случае mw(d,n), находящееся в знаменателе, будет минимально). А оно у всех есть, кто в топ лезет. Так что выигрыша по сему фактору не получить.

Все не совсем так. В случае малого количества запросов на страницу - не получить, потому что не сложно залить в текст все прямые вхождения. А вот в случае, когда вместе с ВЧ/СЧ на странице продвигается длинный хвост НЧ - можно и посчитать. Ну например - возьмем от балды первую попавшуюся метрику, сумму YMV*(кол-во показов запроса) по всем выбранным НЧ. Если текст можно разбить на несколько блоков (например абзацев), которые можно как угодно переставить между собой, то получаем простую оптимизационную задачку для студента. :)

Step40:
Вот Вам и первоисточник и воровство контента Вот

Не, ну это не интересно.

Если пошариться по сайту RCDL, то по контенту можно и более интересные работы найти. Например в работах прошлого года:

"Поиск неестественных текстов"

"Метод обнаружения поискового спама, порожденного с помощью цепей Маркова"

Полезные статьи, особенно для дорвейщиков. :)

Step40:
А вот Вам сео ссылки Вот...

Ржачная работа. :D

inseonight:
Я думаю, что скоро ещё больше будет цениться размещение ссылок навсегда. Яндекс идет по пути развития Гугла. Скоро будем продвигать только статьями...

А что мешает размещать на Сапе навсегда? Оплачивайте регулярно, всего и делов. Продажные ссылки из статей "навсегда" также легко определяются, как и ссылки с ежедневной оплатой. И отношение к ним ничуть не лучше, а со временем может стать даже хуже. :)

john2007:
А на счет YMV - браво Яндекс!
Теперь документы с точным вхождением или как можно более близким к точному будут цениться выше.
Ну и позднова-то же их осенило :)

Точные вхождения ценились всегда, если Вы не в курсе. YMV не определяет "как можно более близкое к точному", оно находит наименьшую "кучку" из слов запроса. Близость к точному в такой "кучке" может быть минимальна.

P.S. Вообще эта осень была богата на разнообразные доклады. Можно упомянуть еще доклад Яндекса на RuSSIR:

Query expansion based on linguistic evidence, на английском.

Илья Зябрев, AlterTrader Research Ltd. Последние статьи: Об отмене ссылок в Яндексе. (www.altertrader.com/publications38.html)|Поведенческие факторы (формулы) (www.altertrader.com/publications36.html) Жадные алгоритмы Яндекса. (www.altertrader.com/publications20.html)|MatrixNet для «чайников». (www.altertrader.com/publications19.html)
wolf
На сайте с 13.03.2001
Offline
1183
#27
G00DMAN:
А вот в случае, когда вместе с ВЧ/СЧ на странице продвигается длинный хвост НЧ - можно и посчитать.

Лучше изначально морду двигать по одному-двум-трех суровым ВЧ, а длинный хвост НЧ размазывать по внутряку.

john2007:
А на счет YMV - браво Яндекс!
Теперь документы с точным вхождением или как можно более близким к точному будут цениться выше.
Ну и позднова-то же их осенило

Вообще-то факторы за точное вхождение и до этого были :)

di_max
На сайте с 27.12.2006
Offline
262
#28
john2007:
Если кликов 1-2 и потом уход, то это я ничего не нашел на Яндексе :)
А длительная сессия и множество кликов у меня говорит, что полезной информации много и я ее изучаю.

Тошь да-алеко не факт.

Если я искал описание на конкретный товар (конкретную модель спиннинга), то мне все остальное - глубоко фиолетово.

И кликабельность по сайту зависит не от меня (юзверя), а от... Яндекса.:)

Бо тут вступает в силу то, что я называю "точностью привода".

То есть конкретную страницу, на которую идет ссылка из Серпа.

Если это список спиннингов - кликабельность одна, если ТОЧНОЕ соответствие моим интересам - она, кликабельность, падает по сравнению с первым вариантом.

Но, ИМХО опущу, ни в том, ни в другом случае поведение юзверя ни есть мера, отражающая ТЕКУЩИЕ интересы ползателя.

Они, Яндекс, на поведенческом таргетенге в РСЯ еще, видимо, не наелись. ИМХО.:)

// Все наши проблемы от нашего не знания...
юни
На сайте с 01.11.2005
Offline
929
#29
john2007:
Вот я так и не понял, как время, затраченное на поиск коррелирует с качеством выдачи?

Угу. Вот так из неверных предпосылок создают математические модели...

G00DMAN:
Сама с собой она отлично коррелирует.

:) Это как?

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
john2007
На сайте с 26.03.2007
Offline
173
#30
G00DMAN:
Точные вхождения ценились всегда, если Вы не в курсе. YMV не определяет "как можно более близкое к точному", оно находит наименьшую "кучку" из слов запроса. Близость к точному в такой "кучке" может быть минимальна.

Ну, естественно, я сейчас не про соответствие словоформ, а про расстояния между словами из запроса в тексте документа.

Вообще, это такие азы поиска.

Видимо, просто другим фиговеньким методом это учитывалось в Яндексе, раз метод "кадра" дал улучшение качества на основном поиске.

Я бы еще на их месте проработал вариант не только учета фактора минимальной кучки, но и фактора учета некоторого количества минимальных кучек.

У кого кучка кучек минимальнее :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий