Tryerty

Tryerty
Рейтинг
68
Регистрация
04.12.2007
Должность
Intelsib
Чуркин Игорь Владимирович
Pall:
Вариант "то, что есть, трогать не будем, а за новые ссылки уже не ручаемся..." не подойдет для расшифровки? ;)

Или еще вариант: Ссылки летние начнут работать только ...

Боюсь, что удельный вес "выражаемого согласованного мнения всех участников данного ресурса" в данном случае Вами сильно преувеличен.

Да и в "согласованности" этого мнения имею большие сомнения.

Совершенно нет сведений о реципиентах, а, следовательно, и выводы весьма спорны. Может сайты тупо по статвесу так разместились. Скорее всего у старых сайтов он по боле будет.

А нельзя ли предположить, что при стандартном запросе (без указания весов и расстояний) алгоритм отбора документов другой?

Вы не нашли << url="www.ya.ru*" - серп пуст;

Вы::40 не::40 нашли::40 << url="www.ya.ru*" - НПС.

Тогда все эти замечательные рассуждения теряют всю свою привлекательность.

psylosss:
Никакое это нафиг не прилагательное :)

"Раз пошла такая пьянка", то что такое это замечательное словообразование: "нафиг"? Какая часть речи? И пишется вместе или раздельно?

Просто для общего развития дилетанта в языкознании.

alexalinks:
Интересное наблюдение: при разном задаваемом весе, находятся при НПС разные пассажи из анкор-файла, причём во всех пассажах есть запрашиваемые слова.
((слово1::вес1 & слово2)//6)<<url="www"
найдены пассажы1 слово1 .... ... ... ... ... слово2
пассаж2 не находится
((слово1::вес2 & слово2)//6)<<url="www"
найдены пассажы2 слово1 .... слово2
в конце идёт пассаж1
получается в формуле кворума для пассажей анкор-файла ещё присутствует фактор расстояния между словами...

Раз документ вообще находится значит кворум пройден. Расстояние между словами здесь роли не играет, а вот для определения наиболее релевантных пассажей это расстояние естественно важно. Их вы и видите в найденных текстах ссылок.

Да и сам термин "кворум для пассажей анкор-файла" требует пояснения.

По конкретному сайту

... ну его на..?
ибо в индексе его нет и вообще
Адрес www.aboutus.org не был внесен в базу Яндекса, так как сайт www.aboutus.org находится вне доменов стран СНГ, при этом наш робот не смог распознать в нем русский текст.

А сама методика имеет уже какое-то название. Или я ошибаюсь?

Kolyaj:
Tryerty, процитированный вами текст был написан до введения прюнинга.

Если не очень трудно будет, сообщите дату "введения прюнинга", а то я почему-то подумал, что он является частью "Магадана"...

Мне всеже хочется как-то поколебать уверенность всех в том, что кворумная фильтрация происходит до этапа прюнинга.

из "Подлетая к Магадану":
Изменили технологию поиска так, что мы можем быстро выбрать наиболее релевантные документы в первую очередь и не ждать поиска по остальным страницам. Мы смягчили фильтрацию отбора документов для ранжирования, что привело к улучшению ранжирования по запросам, для которых релевантные документы содержат слова запроса далеко друг от друга

Исходя из цитаты можно предположить, что отбор документов для выдачи производится после обрезки индекса.

Парочка неаргументированных наблюдений:

1. То что кворум работает иначе, чем раньше, мне кажется, показывать не нужно. При отказе от пассажного кворума число найденных документов должно возрастать.

2. Число найденных страниц действительно стало значительно большим (в среднем в полтора раза), а вот число сайтов существенно уменьшилось (иногда более чем в два раза).

Сравнивались данные за январь и май.

Мой максимум не на много больше.

Результат поиска: страниц — 2 806 010 101, сайтов — не менее 891 246, в каталоге — 50 555
Всего: 173