Тему нашёл, но, почему-то, только в кэше Яндекс.Блогов. На форуме её уже удалили :(
Посмотрите на актуальность страницы. Думаю, что этот сайт один из самых быстроиндексируемых. А теперь делайте выводы, какая работа учлась
Сегодня робот (Useragent: Yandex/1.01.001 (compatible; Win16; I)) сайт 8 часов мучал забрал 8000 страниц. До этого не был на сайте почти неделю. Видимо, оживает
Запросы? Тематики? В расширенной или обычной? Как дети малые!
В топе появились словоформы слова2, точные вхождения, исчезли. Вообщем, как я понимаю "слово2::19765 &/(0 0) !!%слово2::1819103916" - эквивалент логического оператора "или" (найти или это слово2 или то слово2), операнды которого не эквивалентны по весу
Вероятно, есть предел редкости слова, начиная с которого, всем словам назначается такой вес
Может, это некий аналог оператора "|" (или), т.е. найти "слово2|!!слово2", но документ содержащий "!!слово2" (по-этому у вес передается этому слову соответствующий, на несколько порядков больше) намного релевантнее чем документ, просто содержащий "слово2"
Разве не так?
Ведь, на сколько я понимаю, цифры это это параметр idf. Значит они должны меняться после каждого апдейта, ведь количество документов в базе меняется, значит и количество слов в коллекции меняется? Или эти цифры обсчитываются на статичной коллекции документов, которую обновляют значительно реже, чем проводятся апдейты?
Зачем же Вы раньше времени его хороните? :)