Действительно очень странно.
Вы намекаете на некий параметр dsn, значения которого различаются для этих запросов?
Это для точного вхожения повышается вес слова. Сравните:
anchor#link="www.okna-magnit.ru"[окна]
anchor#link="www.okna-magnit.ru"::1819103916[окна::5689]
anchor#link="www.okna-magnit.ru"["окна"] оно же
anchor#link="www.okna-magnit.ru"[!окна]
anchor#link="www.okna-magnit.ru"::1819103916[!окна::13950]
ХРНС, а можно ли немного подробнее о спецпереколдовке запроса для ссылок?
Я например обратил внимание на такую вещь. Если мы задаем поисковый запрос типа
anchor#link="www.site.ru"[поисковый запрос], то колдуется он как
anchor#link="www.site.ru"::111111111[поисковый::222222222 & запрос::33333333]
так вот число 11111111 иногда меняет свой вес для разных сайтов. Раньше такое наблюдалось или нет?
Понял, по-вашему тошнота - это "tf max" - частота самого частого слова, правильно? Надо где-нибудь сделать "словарик терминов Миныча" :)
Возвращаясь к двух- и более словным запросам. Вы считаете, что для того, чтобы страница была максимально релевантна запросу, допустим, "селедка Матье", то оба слова должны встречаться в документе максимальное кол-во раз, несмотря на то, что они имеют разные веса?
какие требования к страничке, кроме присутствия h1?
Да, это подразумевалось.
Попробовал воспроизвести ваш эксперимент. Все сходится. Точность до 9 знака впечатляет. Осталось еще раз осмыслить полученные данные, и доказать теорию практикой. :)
Правда иногда при смене весов в результатах поиска выдаются не обе страницы, а только одна из них - у вас тоже так бывает?
И что вы думаете про двухсловные запросы? Тошноты ключевиков должны быть завязаны на отношение корней ln весов слов?
Уважаемый ХРНС, позвольте в очередной раз поблагодарить вас за ваши опыты. И за то, что с каждым разом описание ваших экспериментов становится все более доступным для восприятия :)
Вопрос по сути. Другими словами, как я понял, вы утверждаете, что нормировка tf (тошноты) осуществляется по самому частотному слову в документе, и что теперь Яндексом стали учитываться стоп-слова.
Таким образом, если мы имеем две практически одинаковые страницы с общим количеством 300 слов, из них 10 слов - "ключевик", но на одной странице 20 союзов "и", а на другой их 16, то вторая страница будет более релевантна по запросу "ключевик".
И отношение релевантностей будет равно sqrt ((10/16) / (10/20)) ?
Именно это я и имел ввиду, приводя пример с х.А.
Мне в свое время очень помогла вот эта статья:
http://list.optimization.ru/132.html#art
У вас немного другая ситуация, но почитать ее вам очень кстати будет.
На второй вопрос ответить не берусь :)
Lisa, аналогичная ситуация, причем тоже по двусловному запросу. :)