Опять копает про текстовую релевантность

123
Тимон
На сайте с 08.06.2007
Offline
74
#11
_S_:
Ну, скажем, сейчас там много чего накручено - например мягкость, расстояния, цитаты и тд. Кворум есть, но как уже было сказано выше - не для всех запросов.

А как думаешь (не против на "ты"?), схож ли текущий алго с тем, что был представлен на Ромипе'06? Там же тоже были бонусы за наличие всех слов, за точное вхождение вроде...

На счет расстояния - это обязательно должно быть - хотя и не так, как раньше...

П.с. На счет кворума - уж не знаю, сколько таких запросов, где учитывается кворум, в общей массе, но я их не встречал. Тем более при поиске на отдельно взятой странице.

Даже если они есть, то скорее всего, это проделки колдунщика, а не алгоритмический учет.

Тимон добавил 05.02.2009 в 01:55

Dryoma:
как раз расстояния уже не важны (т. е. сайты с большими расстояниями между словами из запроса не выпадают. Как большие расстояния отражаются на релевантности --- не знаю, но скорее всего плохо)

Про расстояния еще Трофименко говорил - нет их уже, && рулит

Все, завтра еще напишу что-нть, а то поздно как-то...

«Я слышу - и забываю, я вижу - и помню, я чувствую - и понимаю» (с) Конфуций Теперь я занимаюсь продвижением сайтов здесь (http://www.i-vi.ru/) :) SEO фтоппку! Учим правила фотосъема! (http://www.fotonotes.ru/) - мои заметки о фото
upyrj
На сайте с 17.09.2005
Offline
140
#12
Тимон:
значит в первом случае он среди всех сайтов нашел 2 сайта, на которых не было слово "сайт"? Т.е. каким-то образом эти два сайта вылезли только за счет трех слов... Хм...

Не знаю, что вы там вчера видели, но сегодня там натурально быстроробот. 8/

Денис Иванов Важно: обменом валют я не занимаюсь.
Тимон
На сайте с 08.06.2007
Offline
74
#13
upyrj:
Не знаю, что вы там вчера видели, но сегодня там натурально быстроробот. 8/

Там одна страница была быстророботовская и одна страница обычная, но на 7 мб. Был без пометки "* часов назад" и я что-то не проверил даже ее на быстророботовость :)

Сейчас похоже все быстророботовское в выдаче по этому запросу.

Кстати прикольная темка:

(продажа продовольствие голод люди) ~~люди

страница www.evreimir.com/article.php?id=4862&res=1 вылезает за счет слова "человечки"

Переходы, однако

The end
На сайте с 23.11.2004
Offline
138
#14
Тимон:
Например сейчас, чтобы текст был релевантен, должны входить все слова запроса, без всяких кворумов. Исключение - быстророботовская выдача, вроде там еще даже кворум работает.

;)

http://yandex.ru/yandsearch?text=%d0%bf%d0%be%d1%80%d0%bd%d0%be%20%d0%b4%d1%83%d0%b4%d0%b0%d1%80%d0%b8%d0%ba&yasoft=barie&clid=21975

Singular Advertising (http://www.singular.by/).
Тимон
На сайте с 08.06.2007
Offline
74
#15

и что?

или быстроробот или оба слова есть...

Нашли какой-то конкретный сайт?

wolf
На сайте с 13.03.2001
Offline
1183
#16
Тимон:
б) в текстовой релевантности учитываются веса слов (IDF)

Поразительный вывод. А в tf*idf второй множитель, по-Вашему - это что? :)

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
Тимон
На сайте с 08.06.2007
Offline
74
#17
wolf:
Поразительный вывод. А в tf*idf второй множитель, по-Вашему - это что? :)

Ну он самый. Просто раньше этот IDF не сильно влиял на релевантность. Были контекстные ограничения, релевантные пассажи и прочее...

А, вспомнил - проверял я в свое время влияние IDF

брал два сайта, грубо - в одном 10 слов А и одно Б, во втором - 1 А и 10 Б.

Сравнивал их релевантность, меняя веса первого и второго слова соответственно - и ничего не происходило (хотя если бы вес учитывался, то выше вылезал бы сайт, где 10 раз упортребляется самое весомое слово). Кворум - да, он четко реагировал на изменение веса, а в остальном IDF не проявлял себя.

Видимо, в новой модели IDF сильнее влияет на итоговый показатель.

A
На сайте с 07.11.2006
Offline
87
#18

а, кстати, когда был последний пересчет коллекции весов слов?

MR
На сайте с 21.11.2007
Offline
33
#19
Dryoma:
Таким образом, среди страниц, найденных по запросу

левкипп демокрит анаксимен сайт

есть те, которые содержат "левкипп", "демокрит", "анаксимен", но не содержат слово "сайт"

Но также в эту пачку сайтов в выдачу Яша вкидывает страницы где есть слово site :)

wolf
На сайте с 13.03.2001
Offline
1183
#20

Тем более, что запрос

левкипп демокрит анаксимен

дает большее кол-во документов ;)

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий