Что за циферки

12
[Удален]
1655

Если в Яндексе набрать какой-нибудь запрос, ну например "мебель"

в выдаче ниже снипета надпись "Найденные слова" на неё и нажать правой кнопкой, потом свойства будет url вида:

http://hghltd.yandex.com/yandbtm?url=http%3A//www.zetta.ru/&text=%EC%E5%E1%E5%EB%FC&reqtext=%EC%E5%E1%E5%EB%FC%3A%3A1975+%26/%280+0%29+!%25%EC%E5%E1%E5%EB%FC%3A%3A2736&dsn=386&d=2091891

что значат последние цифры 2091891 ???

harlot
На сайте с 21.10.2004
Offline
116
#1

это к Минычу:)

Vive como si fueras a morir mañana y Aprende como si fueras a vivir para Siempre.
IndexSa
На сайте с 23.12.2005
Offline
205
#2

Полезная ссылка, а что точно это за цифры -я не знаю :)

мозг находится в мире, а мир находится в мозгу
OL
На сайте с 17.04.2006
Offline
63
#3

Я, конечно не Миныч, но это номер документа на сервере Яшки.

K. Ermakov
На сайте с 10.12.2004
Offline
328
#4
oiL-k:
это номер документа на сервере Яшки

Вы уверены? Что имеется в виду под словом "документ"?

С уважением, Константин Ермаков, absite.ru: онлайн кроссворды (http://absite.ru/); searchsuggest.ru: поисковые подсказки доставляют (http://searchsuggest.ru/).
OL
На сайте с 17.04.2006
Offline
63
#5
K. Ermakov:
Вы уверены? Что имеется в виду под словом "документ"?

на 150%. Это номер проиндексированной копии документа. Копии же тоже хранить надо как-то:)

K. Ermakov
На сайте с 10.12.2004
Offline
328
#6

oiL-k, а источник знаний не приведёте?

Bor-ka
На сайте с 16.11.2004
Offline
256
#7

Видимо действительно это номер документа.

Проведем эксперимент:

на ссылке http://hghltd.yandex.com/yandbtm?url=http%3A//www.zetta.ru/&text=%EC%E5%E1%E5%EB%FC&reqtext=%EC%E5%E1%E5%EB%FC%3A%3A1975+%26/%280+0%29+!%25%EC%E5%E1%E5%EB%FC%3A%3A2736&dsn=386&d=2091891 выберем "Сохраненная копия" - видим копию данной страницы

Теперь модифицируем ID документа:

http://hghltd.yandex.com/yandbtm?url=http%3A//www.zetta.ru/&text=%EC%E5%E1%E5%EB%FC&reqtext=%EC%E5%E1%E5%EB%FC%3A%3A1975+%26/%280+0%29+!%25%EC%E5%E1%E5%EB%FC%3A%3A2736&dsn=386&d=2091 и снова жмем "Сохраненная копия" - видим совсем другой документ.

еще эксперимент:

http://hghltd.yandex.com/yandbtm?url=http%3A//www.zetta.ru/&text=%EC%E5%E1%E5%EB%FC&reqtext=%EC%E5%E1%E5%EB%FC%3A%3A1975+%26/%280+0%29+!%25%EC%E5%E1%E5%EB%FC%3A%3A2736&dsn=386&d=20918&isu=1

и снова жмем "Сохраненная копия"

ну и несуществующий документ:

http://hghltd.yandex.com/yandbtm?url=http%3A//www.zetta.ru/&text=%EC%E5%E1%E5%EB%FC&reqtext=%EC%E5%E1%E5%EB%FC%3A%3A1975+%26/%280+0%29+!%25%EC%E5%E1%E5%EB%FC%3A%3A2736&dsn=386&d=2091890&isu=1

и снова жмем "Сохраненная копия"

видим "Broken url"

Bor-ka
На сайте с 16.11.2004
Offline
256
#8

Продолжим эксперимент:

Возьмем другой сайт и подставим ему те же идентифакторы:

Обычная сохраненная копия:

http://hghltd.yandex.com/yandbtm?url=http%3A//www.feli.ru/&text=%EC%E5%E1%E5%EB%FC&reqtext=%EC%E5%E1%E5%EB%FC%3A%3A1975+%26/%280+0%29+!%25%EC%E5%E1%E5%EB%FC%3A%3A2736&dsn=410&d=2563637

Теперь заменяем на d=2091891

http://hghltd.yandex.com/yandbtm?url=http%3A//www.feli.ru/&text=%EC%E5%E1%E5%EB%FC&reqtext=%EC%E5%E1%E5%EB%FC%3A%3A1975+%26/%280+0%29+!%25%EC%E5%E1%E5%EB%FC%3A%3A2736&dsn=410&d=2091891&isu=1

видим другую страницу, но она не совпадает со страницей с этим же параметром из первого эксперимента

теперь заменим параметр dsn на 386

получили то, что нужно.

мораль - значение имеют параметры dsn и d

Учитывая, что DSN относительно мало, можно предположить, что это какой либо идентификатор сервера, на котором лежит копия.

с DSN 600 он еще отдает копии, а вот с DSN 700 удается получить страницу "Broken url" с большой задержкой, видимо сервер, распределяющий задачи долго ломится к указанному по ID и по таймауту возвращает ошибку.

Можно предположить, что у Яндекса от 600 до 700 серверов для хранения документов, по сравнению с Гуглом относительно мало - http://www.webplanet.ru/news/reading-room/2005/12/5/archit.html

P.S. Всё исключительно предположения

Bor-ka
На сайте с 16.11.2004
Offline
256
#9

ну и часть 3, заключительная :)

посчитаем сколько на каждом сервере документов, эмпирическим путем выясняем, сколько документов на одном сервер.

получается, что чуть больше 890 000.

Возьмем общее количество документов по данным Яндекса - 852 643 995, разделим на 900 тыс. и получим 947 серверов, грубо (сервера могут быть разные), но в принципе вроде верно.

p.s. исправил очепятки

nickspring
На сайте с 29.03.2006
Offline
228
#10
Учитывая, что DSN относительно мало, можно предположить, что это какой либо идентификатор сервера, на котором лежит копия.

DSN - стандартная аббревиатура - Data Source Name. Думаю переводить не имеет смысла. Так что Вы правы, по всей видимости.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий