Различия в статистике слов при изменении порядка слов.

I
На сайте с 13.09.2001
Offline
79
Iva
1684

Берем запрос, например,

русская филология , а потом меняем порядок слов:

филология русская .

Видим, что статистика слов различается. Я правильно понимаю, что данное различие вызвано тем, что эта статистика дается только по релевантной данному запросу части индекса, а не по всему индексу?

Удачи! Iva feel the power
dimok
На сайте с 08.11.2002
Offline
291
#1

Вероятно, что Яндекс, как и Гугл, делает поиск до глубины в N страниц. И тогда можно предположить, что, делая поиск слов по индексу в разном порядке, Яндекс всегда находит одно и то же количество страниц, но страницы различаются, а соответственно и количество слов на них может быть различно.

CLICKBAZA: есть траф - будут и деньги (https://clickbaza.com/)
I
На сайте с 13.09.2001
Offline
79
Iva
#2
Как писал dimok
И тогда можно предположить, что, делая поиск слов по индексу в разном порядке, Яндекс всегда находит одно и то же количество страниц, но страницы различаются, а соответственно и количество слов на них может быть различно.

Да нет, количество страниц будет разным при изменении порядка слов. При этом похоже, что Яндекс сразу показывает правильное найденное число страниц (в отличие от числа серверов).

dimok
На сайте с 08.11.2002
Offline
291
#3

Iva3000, а разве я не это же самое сказал? И количество серверов и количество страниц будет разным именно по той причине, что я написал, если она имеет место быть (думаю, что имеет).

I
На сайте с 13.09.2001
Offline
79
Iva
#4

Я, может, чего-то не понимаю, но в одном случае яндекс находит 11712 страниц (русская филология), а в другом - 15792 релевантных данному запросу страницы (филология русская). Разве 11712=15792? :)

Получается, что он находит не одно и то же число страниц, а два разных подмножества. Ну и соответственно, если разные страницы, то и статистика тоже будет разная - то есть она выдается не по просмотренной части индекса в целом, которая и в том, и в другом случае допустим, будет одинаковая, а только по той части, которая считается релевантной данному запросу - то есть подсчитывается число вхождений по 11712 страницам и по 15792 страницам соответственно.

I
На сайте с 13.09.2001
Offline
79
Iva
#5

Вот! Кажется, поняла в чем тут дело. Статистика слов выдается не в найденных релевантных страницах. Она выдается по просмотренной части индекса. Но если менять порядок слов, то просматриваемая часть меняется. Соответственно и статистика меняется.

I
На сайте с 15.12.2000
Offline
80
#6

Всем филологам и вообще любителям точных цифр!

Спрашивайте такие вещи ночью в воскресенье.

Данная просьба относится ко всем без исключения поисковым системам.

С уважением,

Илья

ссылки по теме:

http://citeseer.nj.nec.com/selberg00instability.html

(дальше раскрутите сами, ок?)

I
На сайте с 13.09.2001
Offline
79
Iva
#7

Спасибо за ссылку.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий