Формула расчета кворума от Дена Расковалова

Адепт
На сайте с 15.06.2004
Offline
247
#11
После работ конверсия увеличивается даже если основной трафик по НЧ запросам и клиент ощущает результат уже в первый месяц.. но не от продвижения(закупки ссылок и накачивания входных страниц ключами) а от качественно подготовленной структурированной информации.

К сожалению, не всегда эффект виден в первые три месяца, потому как до этого с сайтом творили уже то, чего бы не стоило изначально делать :) Если клиентам говорить про формулы, это конечно придает важности и значимости работе, но на деле формулы их мало интересуют.

Кстати - а ведь мягкость (softness) вполне могла уменьшиться с 0.06 до 0.01. Поиск стал умнее, количество документов выросло, как и средняя длина запроса, поэтому условия кворума ужесточили. И с такой мягкостью хорошо находится, что есть гуд. Налицо значительный прогресс качества.

G00DMAN, вполне логично, да и зачем изобретать велосипеды, когда можно заниматься их усовершенствование и тюнингом :)

Эффективное комплексное продвижение для интересных проектов. ( /ru/forum/577451 ) Делюсь опытом.
mikes
На сайте с 20.02.2006
Offline
106
#12
G00DMAN:
Кстати - а ведь мягкость (softness) вполне могла уменьшиться с 0.06 до 0.01. Поиск стал умнее, количество документов выросло, как и средняя длина запроса, поэтому условия кворума ужесточили. И с такой мягкостью хорошо находится, что есть гуд. Налицо значительный прогресс качества. :)

Не уверен, что поиск стал сильно умнее. Скорее, это заслуга контента, который генерится с неимоверной скоростью и обеспечивает лучшее покрытие все удлиняющихся запросов.

Михаил Сливинский, руководитель службы по работе с вебмастерами, Яндекс
G00DMAN
На сайте с 19.04.2008
Offline
122
#13
mikes:
Не уверен, что поиск стал сильно умнее.

Поиск стал сильно умнее, но не за счет понимания смысла документа, а из-за добавления всяких сложных фичей, типа переколдовщиков запроса например. Понимание смысла пока остается на уровне прошлого века, копать в глубь никто не хочет, т.к. BM25 уверенно въелась в моск. :)

Илья Зябрев, AlterTrader Research Ltd. Последние статьи: Об отмене ссылок в Яндексе. (www.altertrader.com/publications38.html)|Поведенческие факторы (формулы) (www.altertrader.com/publications36.html) Жадные алгоритмы Яндекса. (www.altertrader.com/publications20.html)|MatrixNet для «чайников». (www.altertrader.com/publications19.html)
[Удален]
#14
G00DMAN:
а из-за добавления всяких сложных фичей, типа переколдовщиков запроса например.

косячит переколдовщик со страшной силой

_S_
На сайте с 12.01.2006
Offline
109
_S_
#15
как и предполагалось, используются обычный bm25 и вариации

А какие еще были варианты?

Читаешь блог? () Сайт о холодном оружии (http://bladeist.ru)
G00DMAN
На сайте с 19.04.2008
Offline
122
#16
burunduk:
косячит переколдовщик со страшной силой

Иногда - да. Но в среднем он крут. :)

mikes
На сайте с 20.02.2006
Offline
106
#17
G00DMAN:
Поиск стал сильно умнее, но не за счет понимания смысла документа, а из-за добавления всяких сложных фичей, типа переколдовщиков запроса например. Понимание смысла пока остается на уровне прошлого века, копать в глубь никто не хочет, т.к. BM25 уверенно въелась в моск. :)

Я не совсем об этом. Конечно, команда сильная и поиск умный. Без дураков. И несть числа классным идеям и технологическим решениям.

Но огорчают принципиальные ограничения MatrixNet'а. Например, жесткая зависимость качества от количества и глубины оценок, что приводит к плохому ранжированию по длинным НЧ (а это половина трафика, на минуточку). По сути, MatrixNet хорошо справляется с переранжированием уже неплохой выдачи. Но что делать, если хороший ответ на запрос остался вне поля внимания асессора? Насколько я понял, задач вида "найти лучший ответ на запрос" у асессоров сейчас нет.

богоносец
На сайте с 30.01.2007
Offline
775
#18
G00DMAN:
Понимание смысла пока остается на уровне прошлого века, копать в глубь никто не хочет

Не «не хочет», а не может... нечем это делать, это как уму поставить задачу: понять как функционирует сам ум, как понимает, как различает... справляясь легко. Пришлось бы решать проблему, от решения которой человеки давно и дружно убегают. Вот и приходится создателям ПС шаманить по косвенным признакам — порождая неизбежные последствия (и добавляя смысла существованию сеошников, т.е. спамеров).

Проблема общая: в вашем мире не бывает т.н. Бога без неизбежной (и множественной) тени в виде Сатаны & K° (чему и посвящён этот форум).

mikes:
жесткая зависимость качества от количества и глубины оценок

Скорее, неизбежный шум разрушает переобучение (если чёрт нам мешает, то пусть он нам поможет, по вроде бы правильным тенденциям)...

mikes:
по длинным НЧ (а это половина трафика, на минуточку)

Скорее четверть... на длинном временнОм отрезке. Но и это скоро понадобится уточнить и расклассифицировать.

mikes:
Но что делать, если хороший ответ на запрос остался вне поля внимания асессора?

А если бы и попался, то им не удалось бы его адекватно оценить (они же не специалисты по любой теме, скорее только по общеизвестным, типа ёжик в тумане скачать).

Сегалович это признал в последнем интервью echo.msk.ru

... у них просто нет задачи найти реально лучший ответ, скорее тот, который будет лучшим для большинства.

Так что проблема сводится к: Что если попса вытеснит истину?.. это обычное явление.

Асессор — не для оценки качества, а для настройки на большинство.

(хотя они уверены начальством, что оценивают качество... так лучше выполняется их реальная задача)

mikes
На сайте с 20.02.2006
Offline
106
#19
богоносец:
Не «не хочет», а не может... нечем это делать, это как уму поставить задачу: понять как функционирует сам ум, как понимает, как различает... справляясь легко. Пришлось бы решать проблему, от решения которой человеки давно и дружно убегают....

Ну, есть безусловно сильные решения. Например, переход от pagerank к browserank. Не все так плохо ;)

богоносец:
Скорее четверть... на длинном временнОм отрезке. Но и это скоро понадобится уточнить и расклассифицировать.

Больше. Половина запросов - под планкой 30 в вордстате: Основной поток запросов к Яндексу — уникальные, то есть такие запросы, которые в течение дня задали только один раз. В городах, где пользователей много, доля уникальных запросов обычно ниже — чем больше людей, тем скорее кто-то задаст запрос, который в этот день уже задавали. Например, в Хабаровске доля уникальных запросов — 60%, а в Москве — всего 43%. Взято из отчета Поиск в интернете: региональные особенности (лето 2010).

богоносец:
... у них просто нет задачи найти реально лучший ответ, скорее тот, который будет лучшим для большинства.

Даже так постановленная задача решается со скрипом ввиду приведенных выше обстоятельств.

di_max
На сайте с 27.12.2006
Offline
262
#20
mikes:
Больше. Половина запросов - под планкой 30 в вордстате:

А про "подсказки" и их влияние - ни гугу..

В городах, где пользователей много, доля уникальных запросов обычно ниже — чем больше людей, тем скорее кто-то задаст запрос, который в этот день уже задавали.

Москву да Питер задолбали... обе стороны. Яндекс и СЕО. По этому и приходится выкручиваться.

Да "отчетом", то есть документу содержащему 100% достоверные данные, можно назвать с натяжкой. ИМХО, ессно...

// Все наши проблемы от нашего не знания...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий