Особенности сортировки host=""||host=...

Фриман
На сайте с 11.11.2005
Offline
50
1000

Всегда любопытствовал к какому виду сортировки прибегает ПС когда не задано явных предпочтений. Например при запросе:

host="www.rambler.ru" || host="www.yandex.ru"

На случайный порядок такие сортировки совсем не похожи, напомню:

host="www*"

На форуме блуждала версия что это ВИЦ, ХРНС, помнится, говорил что и тошнота участвует.

Ну, собственно, что это не чистый ВИЦ ясно и без опытов, не буду на этом останавливаться.

Итак, предполагаем, что порядок сортировки при таком запросе определяется значением:

R=f(ВИЦ, TFmax)

значит, зафиксировав один из параметров можно наблюдать монотонное возрастание второго.

Создано 16 сайтов с одинаковым текстом и с линейно возрастающим TFmax (от 1 до 16). Сайты проиндексированы через addURL, ссылок на них нет.

Запрос:

host="site1"||host="site2"....

Результат выдачи:

1-2-3-4-5-6-8-7-9-10-11-12-17-13-15-16

(Индекс равен TFmax).

Результаты опыта подтверждают предположение.

На подходе данные при фиксированном TFmax и монотонно возрастающим ВИЦ.

upyrj
На сайте с 17.09.2005
Offline
140
#1

Странно, что при малых TFmax нет «шума».

По ХРНС там должна быть одна и та же тошнота (в его версии при TFmax<7: тошнота=sqrt(7)).

Не дадите ли в личку — повертеть? (Если нет — понимаю. 8))

Денис Иванов Важно: обменом валют я не занимаюсь.
Фриман
На сайте с 11.11.2005
Offline
50
#2

upyrj если бы сайты были только для этого опыта - дал бы, не впадлу. Но на них пока есть другие планы.

Насчет шума, я тоже был удивлен. Но не будем забывать о размерах выборки.

Результаты немного на другую тему, но думаю, будет интересно:

1.

запрос::1

Порядок такой: 1-2-3-4-5-X7-7-9-6-10-11-8-12-18-13-14-16

Очевидно, тошнота в знаменателе, текстовая релевантность подавлена.

2.

запрос::1 || %gsgrejhjhksgtоgrrthr

Порядок такой: X7-1-2-3-4-5-7-9-11-6-10-18-9-12-13-14-16

Да, чуть не забыл, X7 - копия сайта с 7 повторениями но с увеличенным в 1,5 раза контентом, соответственно частота ключевика снизилась с 10% до 7,4

upyrj
На сайте с 17.09.2005
Offline
140
#3

запрос::1 — это то, чем «тошним»?

А что с аналогами запроса host (rhost, domain, url...)?

Фриман
На сайте с 11.11.2005
Offline
50
#4

да, естественно

_S_
На сайте с 12.01.2006
Offline
109
_S_
#5
Фриман:
На форуме блуждала версия что это ВИЦ, ХРНС, помнится, говорил что и тошнота участву

Виц + текст, само собой.

Фриман:
запрос::1 || %gsgrejhjhksgtgrrthr

А вес "%gsgrejhjhksgtgrrthr" - не присваиваете?

Читаешь блог? () Сайт о холодном оружии (http://bladeist.ru)
Фриман
На сайте с 11.11.2005
Offline
50
#6
_S_:
А вес "%gsgrejhjhksgtgrrthr" - не присваиваете?

Можно присвоить, ничего не меняется (% нивелирует)

_S_
На сайте с 12.01.2006
Offline
109
_S_
#7

Фриман, Попробовал пару запросов, заметил весьма странные результаты при использовании <<.

Проверьте на этих сайтах запрос - запрос::1 << host="*"

Фриман
На сайте с 11.11.2005
Offline
50
#8

_S_ X7-1-2-3-4-5-7-9-11-6-10-8-12-13-14-16

аналогичен || %зюзик

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий