Опять копает про текстовую релевантность

12 3
Тимон
На сайте с 08.06.2007
Offline
74
4722

Собственно, понятно о чем речь.

Есть различные наблюдения, связанные с принципами учета текстового содержимого сайта Яндексом после всех иземенений за прошедший год.

Например сейчас, чтобы текст был релевантен, должны входить все слова запроса, без всяких кворумов. Исключение - быстророботовская выдача, вроде там еще даже кворум работает.

Если кворума нет - веса слов вообще не должны нигде всплывать. Однако вот сравните

хочу всякие разные матрешки помидоры ересь короче

хочу всякие разные матрешки помидоры::465412121323 ересь короче

Выдача поменялась, да еще и оператор :: вроде как-то работает.

Вопросов много, интересных моментов - тоже. На форуме об этом мало говорили, я вообще мало нашел про это.

Кто хочет - давайте обсуждать. По мере развития темы выложу что-нть еще.

«Я слышу - и забываю, я вижу - и помню, я чувствую - и понимаю» (с) Конфуций Теперь я занимаюсь продвижением сайтов здесь (http://www.i-vi.ru/) :) SEO фтоппку! Учим правила фотосъема! (http://www.fotonotes.ru/) - мои заметки о фото
G
На сайте с 04.02.2009
Offline
0
#1
Тимон:
Вопросов много, интересных моментов - тоже.

Я думаю ответы на эти вопросы можно будет на конференции, которая будет в марте.

_S_
На сайте с 12.01.2006
Offline
109
_S_
#2
Тимон:
Например сейчас, чтобы текст был релевантен, должны входить все слова запроса, без всяких кворумов.

С чего это вдруг? Это на чем такой вывод основывается?

Читаешь блог? () Сайт о холодном оружии (http://bladeist.ru)
Dryoma
На сайте с 24.12.2007
Offline
12
#3

а что такое быстророботовская выдача?

По поводу кворума --- он есть, но срабатывает очень редко, в особенности на "естественных" запросах.

Дрозофила
На сайте с 01.08.2007
Offline
200
#4

Тимон, А в чем вопрос то?

По-моему выдача при первом и втором запросе вполне адекватная, и объяснимая

1. Понимание СЕО приходит после пива. 2. Незнакомый мальчик жестами объяснил, что его зовут Хулио. 3. Причина по которой я на этом форуме https://pressair.ru (https://pressair.ru)
Тимон
На сайте с 08.06.2007
Offline
74
#5
_S_:
С чего это вдруг? Это на чем такой вывод основывается?

пробовал различные запросы при поиске по сайту, например,

(большинства людей добиваемся Возможно продвижение раскрутка seo система детали)<<url="www.bdbd.ru"

когда все слова есть в тексте - все ок, когда нет одного слова - страница не найдена

(большинства людей добиваемся Возможно продвижение раскрутка seo система детали лыжи)<<url="www.bdbd.ru"

был бы кворум - прошел бы в легкую

ставил эксперименты на многих сайтах

Можно попробовать что-то типа

большинства людей добиваемся Возможно продвижение раскрутка seo система детали который тапир

Вылезают странички быстроробота, на которых не все слова из запроса.

Правда, вылезают и непонятные страницы, типа webmassmedia.ru/root присутствие которых в выдаче я не могу объяснить.

Тимон добавил 04.02.2009 в 17:10

Дрозофила:
Тимон, А в чем вопрос то?
По-моему выдача при первом и втором запросе вполне адекватная, и объяснимая

Ну если предположить, что

а) :: работает

б) в текстовой релевантности учитываются веса слов (IDF)

то тогда все логично

Тимон добавил 04.02.2009 в 17:11

gparkov:
Я думаю ответы на эти вопросы можно будет на конференции, которая будет в марте.

Задайте за меня этот вопрос, плиз

Я вряд ли попаду туда :(

Dryoma
На сайте с 24.12.2007
Offline
12
#6

вбейте

(левкипп демокрит анаксимен сайт)~~сайт

2 страницы найдено, значит "сайт" выпадает

Тимон
На сайте с 08.06.2007
Offline
74
#7
Dryoma:
а что такое быстророботовская выдача?

По поводу кворума --- он есть, но срабатывает очень редко, в особенности на "естественных" запросах.

Чуть выше отписался.

Я имел в виду, что в выдачу попадают сайты с пометкой типа "17 часов назад"

Раньше кворум работал абсолютно четко и при запросе из 7-8 слов документ попадал в выдачу, если в тексте содержал хотя бы 6 слов. Это если грубо. А вообще формула ромипа 2004 (с исправленной правой частью) работала четко

Тимон добавил 04.02.2009 в 17:29

Dryoma:
вбейте

(левкипп демокрит анаксимен сайт)~~сайт

2 страницы найдено, значит "сайт" выпадает

Поясните, плиз, вашу логику...

что значит данный запрос?

первая часть - найди 4 слова на сайтах

вторая часть - исключи сайты, содержащие слово "сайт".

значит в первом случае он среди всех сайтов нашел 2 сайта, на которых не было слово "сайт"? Т.е. каким-то образом эти два сайта вылезли только за счет трех слов... Хм...

Dryoma
На сайте с 24.12.2007
Offline
12
#8

именно. Запрос означает, что из множества сайтов найденных по запросу

левкипп демокрит анаксимен сайт

надо вычесть те сайты на которых есть слово "сайт" (про ранжирование молчу, так как все операторы, в т ч и "~~" его меняют). Таким образом, среди страниц, найденных по запросу

левкипп демокрит анаксимен сайт

есть те, которые содержат "левкипп", "демокрит", "анаксимен", но не содержат слово "сайт"

_S_
На сайте с 12.01.2006
Offline
109
_S_
#9
Тимон:
пробовал различные запросы при поиске по сайту,

Ну, скажем, сейчас там много чего накручено - например мягкость, расстояния, цитаты и тд. Кврорум есть, но как уже было сказано выше - не для всех запросов.

Dryoma
На сайте с 24.12.2007
Offline
12
#10
_S_:
Ну, скажем, сейчас там много чего накручено - например мягкость, расстояния, цитаты и тд. Кврорум есть, но как уже было сказано выше - не для всех запросов.

как раз расстояния уже не важны (т. е. сайты с большими расстояниями между словами из запроса не выпадают. Как большие расстояния отражаются на релевантности --- не знаю, но скорее всего плохо)

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий