Хотя бы определиться, у яндекса метод машинного обучения или метод, основанный на знаниях. Оба метода используют yaca.yandex.ru :)
да ну ? :)
Что-то у яндекса подобного не замечено
а вес такой ссылки не меньше будет, чем если бы при точном вхождение? В колдунщик же не заглянешь и не посмотришь, как переколдовывается запрос транслитом. Например раньше для такси было
(такси::вес1 &/(0 0) !%такси::вес2). Причём вес2>вес1.
Если (pornushka::вес1 &/(0 0) !%порнушка::вес2) , то надо смотреть на веса слов.
Вы так говорите, как будто знайте тонкости алгоритмов автоматической классификации документов в большом Яндексе :)
Ну вот здесь методы есть: http://www.cir.ru/docs/ips/publications/2004_mmconf_ageev_tc.pdf
http://www.cir.ru/docs/ips/publications/2003_rcdl_metod.pdf
а ВИЦы сайтов меряли на тот момент ?
тема постепенно вылилась в обсуждение как хорошо было раньше, и скоро нам ...ц. :)
(купить & кондиционер & !в & москве)//100 - вот так уже лучше смотрится
З.Ы. Всё-равно выводятся документы, где слова не встречаются в одном предложении, и мягкость ни на что не влияет-> кворум другой, запросы с операторами работают по-другому
Boris Baydenko, кажется не значит существуют. Вы запросами типа ИЛИ (оператор |) яндекс мучали?
А если так (купить & кондиционер & в & москве)//100 или
(купить::5 & кондиционер::5 & в::5 & москве::5)//100
наблюдается странное действие некоторых операторов. Например, для запросов с условием (<<) сайт найден по НПС, в обычной выдаче не НПС.
и если мы задаём Ключ::1 , то весовая составляющая учитывается, ведь логарифм числа 1 по любому основания всегда равен 0 ?
если учесть, то яндекс умеет определять тематику документа на лету (!!), а в последнее время много мненией, что рулит тематика, то статьи могу внести свой вклад. А вес на статью всё-равно "перетекает", хотя бы с главной.
удалено сообщение....