Формула расчета кворума от Дена Расковалова

mikes
На сайте с 20.02.2006
Offline
106
9357

Ден Расковалов прочитал цикл интересных лекций по информационному поиску, измерению и улучшению качества/производительности. В частности, Ден привел конкретную формулу фильтрации по кворуму, которая использовалась в Яндексе продолжительное время:

, где:

Q – запрос

qi – i-ое слово запроса

w(qi) – функция веса слова

D – документ

Помимо этого seo-шникам наверняка будет интересно узнать о подходах Яндекса к ранжированию по текстам ссылок: как и предполагалось, используются обычный bm25 и вариации. Ден отлично рассказал о метриках качества поиска. Вообще, изложение получилось вполне несложным для восприятия.

В общем, рекомендую к просмотру и прочтению :)

Михаил Сливинский, руководитель службы по работе с вебмастерами, Яндекс
G00DMAN
На сайте с 19.04.2008
Offline
122
#1
mikes:
В частности, Ден привел конкретную формулу фильтрации по кворуму, которая использовалась в Яндексе продолжительное время

Точнее - формула известна ровно семь лет в обед, еще со статьи Яндекс на РОМИП-2004. Некоторые аспекты полнотекстового поиска и ранжирования в Яндекс Сегаловича и Маслова. Только в то время обычно применяли мягкость (Softness) 0.06, а не 0.01. Может и сейчас так, Ден просто запутал следы. :)

mikes:
Помимо этого seo-шникам наверняка будет интересно узнать о подходах Яндекса к ранжированию по текстам ссылок: как и предполагалось, используются обычный bm25 и вариации.

На этапе фастранка - да, там и корреляция будет сильной. На этапе матрикснета все немного не так. :)

mikes:
Ден отлично рассказал о метриках качества поиска. Вообще, изложение получилось вполне несложным для восприятия.

В общем, рекомендую к просмотру и прочтению :)

Посмотреть обязательно нужно, все же Расковалов один из идеологов текущего поиска Яндекса, но каких-то откровений для СЕО там нет.

Илья Зябрев, AlterTrader Research Ltd. Последние статьи: Об отмене ссылок в Яндексе. (www.altertrader.com/publications38.html)|Поведенческие факторы (формулы) (www.altertrader.com/publications36.html) Жадные алгоритмы Яндекса. (www.altertrader.com/publications20.html)|MatrixNet для «чайников». (www.altertrader.com/publications19.html)
seolink74
На сайте с 02.06.2006
Offline
396
#2

Все это очень интересно но..на 80% клиентский сайтах страдает маркетинговая подача и юзабилити.

Часто клиент приходит от других компаний с сайтами "как есть" И в течении первого месяца приходится переделывать как сами сайты и так саму смысловую подачу под потребности клиента(посетителя).

После работ конверсия увеличивается даже если основной трафик по НЧ запросам и клиент ощущает результат уже в первый месяц.. но не от продвижения(закупки ссылок и накачивания входных страниц ключами) а от качественно подготовленной структурированной информации.

Пока у меня есть огромный запас перед большинством конкурентов не работая с такими формулами. Но такое показывать клиентом очень прикольно :) Пусть дрожат от сложности процесса.

Вторая проблема это количество качественных доноров..

Вот последняя работа по улучшению информационной подачи..в кеше еще старая версия.. С шириной так и не смог уговорить

PS: не в формулах счастье.

Продвижение в ТОП3 Яндекс с оплатой по факту(писать в личку/Москва)
tuborg
На сайте с 24.08.2011
Offline
3
#3
mikes:

Помимо этого seo-шникам наверняка будет интересно узнать о подходах Яндекса к ранжированию по текстам ссылок: как и предполагалось, используются обычный bm25 и вариации. Ден отлично рассказал о метриках качества поиска. Вообще, изложение получилось вполне несложным для восприятия.

а есть ссылка на bm25 для чайников?

[Удален]
#4
Cell
На сайте с 09.10.2007
Offline
552
#5
tuborg:
а есть ссылка на bm25 для чайников?

Только, когда будете читать про bm25, не забывайте о том, что когда эта функция была разработана, еще не существовало понятия "говносайт".

Короче, не принимайте близко к сердцу :)

The Piper at the Gates of Dawn.
seolink74
На сайте с 02.06.2006
Offline
396
#6
Cell:
Только, когда будете читать про bm25, не забывайте о том, что когда эта функция была разработана, еще не существовало понятия "говносайт".

Короче, не принимайте близко к сердцу :)

теперь чтоб не выражаться при клиенте о его созданном сайте можно говорить- У Вас сайт с плохо(отсутствующим) отработанным поведенческим фактором 😂

Cell
На сайте с 09.10.2007
Offline
552
#7

seolink74, нет, все гораздо проще. Нужно клиенту сказать "ваш сайт не набрал кворум" ))))))))))))))

seolink74
На сайте с 02.06.2006
Offline
396
#8
Cell:
seolink74, нет, все гораздо проще. Нужно клиенту сказать "ваш сайт не набрал кворум" ))))))))))))))

ИДЕЯ!! Нужно создать сервис по наращиванию КВОРУМА ! ☝(коль уже его не хватает)

Берем эталонные документы из топа рассчитываем 100 кворума и...Это будет бомба

mikes
На сайте с 20.02.2006
Offline
106
#9
G00DMAN:
Точнее - формула известна ровно семь лет в обед, еще со статьи Яндекс на РОМИП-2004. Некоторые аспекты полнотекстового поиска и ранжирования в Яндекс Сегаловича и Маслова.

Точно. Спасибо за ссылку :)

mikes добавил 10.10.2011 в 11:48

seolink74:
После работ конверсия увеличивается даже если основной трафик по НЧ запросам и клиент ощущает результат уже в первый месяц.. но не от продвижения(закупки ссылок и накачивания входных страниц ключами) а от качественно подготовленной структурированной информации.

Что же, это отличный пример хорошего seo :)

seolink74:
PS: не в формулах счастье.

Одно не отменяет другое. Отличная конверсия в отсутствие трафика, полагаю, тоже мало кому интересна ;)

G00DMAN
На сайте с 19.04.2008
Offline
122
#10

Кстати - а ведь мягкость (softness) вполне могла уменьшиться с 0.06 до 0.01. Поиск стал умнее, количество документов выросло, как и средняя длина запроса, поэтому условия кворума ужесточили. И с такой мягкостью хорошо находится, что есть гуд. Налицо значительный прогресс качества. :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий