ru_roll

Рейтинг
25
Регистрация
09.05.2009

юни, по второму пункту погорячился. Не знаю, честно говоря, не мой профиль. Сказал интуитивно)

А по поводу алгоритмов - распределение кликов как этакий массовый асессор я имею ввиду. Если эта статистика используется так, то и накликать можно только влияние определенных факторов, а не вес конкретного сайта.

А когда это произошло? Не 21 мая?

Нет, я понимаю о чем речь. Но я в том смысле, что распределение кликов в выдаче, если следовать логике матрикснет, логичней было бы использовать как показатель качества поиска, а не конкретного сайта. Тем более проблемы накликивания все равно полностью нерешаемы.

А как можно накликать что-то вообще напрямую? Ведь скорее накликать можно только "правильность результатов конкретной выдачи", а к каким последствиям для конкретного сайта это приведет еще неизвестно.

Ну то, что это был не фильтр, по-моему было очевидно по входным условиям. Раз вышедшая вперед страница не переспамлена - значит и не уменьшение релевантности. Может быть вообще эхо недавнего глюка Яндекса? У меня, например, еще вчера были запросы с выдачей без некоторых конкурентов (сейчас кстати уже норма). Т.е. банальное выпадение урла из-за сбоя.

Еще неплохо бы (причем для начала) проанализировать частоту вхождения ключевика в вышедших вперед страницах - это может дать неожиданные результаты.

ТИЦ шире, чем входные данные для запрос-документ. А самое главное встречный вопрос - зачем использовать входные данные (которые и так используются в других компонентах), если можно использовать уже посчитанную интегральную оценку?

Да ну, какое ужесточение - все наоборот.

Pokerist:
пока народ не увидит линейную коррелляцию тица с выдачей процентов этак на 30-40, все впустую, не бейтесь головой об стенку

Спор изначально чисто теоретический. Речь о том, что этот параметр учитывается в формуле. Из этого утверждения никак не вытекает то, что он влияет(а не только может влиять) на релевантность в ту или иную сторону.

ПОС)

SAlex:
то есть при определении релевантности сравниваются не страницы, а сайты. а затем уже на сайте определяется релевантная страница. Либо как вариант - сначала определяется значимый топ30 сайтов, а затем уже среди страниц сайтов из топ30 происходит ранжирование. Это уменьшает потребные мощности на вычисление. Второстепенное - что потом не будет востребовано - то и не вычисляется.

Да ну.. Нет конечно)

Всего: 389