cymax

cymax
Рейтинг
16
Регистрация
28.08.2007

А кто сказал, что переколдовка оттуда должна быть транслирована в поиск? Ведь свежие записи не заменяют выдачу, а добавляются, т.е. ранжироваться могут тоже по особому. Пример - их текстовый корпус, он не блоговский.

ri0n, секрет Полишинеля :) Эту "спалили" еще в прошлом году. В ней с тех пор ничего и не менялось. А у нас тут текстовый корпус уже 3 раза поменяли, не говоря про about author.

ri0n, ну и какова переколдовка для

пластиковые — 38 037 723, окна — 126 085 859, !окна — 457, !about — 53 327, !author — 58 766

?

Меняются

Результат поиска: страниц — 63 684 673, сайтов — не менее 206 517, в каталоге — 362

Статистика слов: окна — 193 185 734

Результат поиска: страниц — 63 833 971, сайтов — не менее 206 557, в каталоге — 362

Статистика слов: окна — 193 768 990

samolet, обратите внимание, что при этом кол-во найденных страниц тоже меняется. Больше страниц - больше частота. Это нормально, кластер так работает.

В предыдущем топике высказывалась мысль, что эти хвосты переколдовки могут быть связаны с подмешиванием свежих записей из блогов. Вполне может быть, ведь у этих свежих записей свой текстовый корпус, к тому же небольшой.

pervius:
Например для слова Москва, вообще не показывает !Москва
И такое не только с Москвой, есть еще достаточно большое количество слов, к которым не показывается данный коэффициент.

Поиграв с запросом можно для Москвы и для других слов получить !

pervius:
nickspring, вообще считает, что это полные частоты слов по всему индексу без оглядки на документы.

Для больших первых частот - да, а вот маленькие явно на частоту по индексу не тянут.

pervius:
При поиске ru появляется еще один показатель !qq — 15 560 076
что это тогда?

Кто бы знал. Но если брать ту "полную частоту по индексу", то ru — 4 998 749 840

Это давно было замечено. Правда раньше показывалось только при поиске по сайту, теперь везде.

Чуть ли не самые "частотные" слова, которые я нашел, www - 392106 и ru - 1111400.

thebuilder:
cymax:

На двух кластерах из выдачи полностью исчез быстроробот. Остался только на 3-м. Наблюдал на фронтах

sfront2-027.yandex.ru - нет БР
sfront3-015.yandex.ru - есть
sfront4-015.yandex.ru - нет

И что это значит?

Что на двух кластерах в выдаче нет страниц, проиндексированных быстророботом. До сих пор так.

Или вас интересует, почему отключили базу быстроробота? Так это не ко мне вопрос.

На двух кластерах из выдачи полностью исчез быстроробот. Остался только на 3-м. Наблюдал на фронтах

sfront2-027.yandex.ru - нет БР

sfront3-015.yandex.ru - есть

sfront4-015.yandex.ru - нет

nickspring, если с оглядкой на документы, то DF рулит. В текстовом. Но вы на цифры внимательно посмотрите.

Всего: 123