Потому, что в Москву наконец-то пришел Арзамас. 1.2 или сколько там уже. Яндексоиды долго готовились, теперь рискнули. Изменения приличные, но вроде все красиво в целом. ;)
Нам-то теперь проще - разных алгоритмов стало меньше. Наверное. :D
+1.
mexboy, Вы выдернули наугад формулу в одной из статей, а куча народа повелась, хотя повода пока нет. Для того, чтобы что-то утверждать про текущие нормировки нужно достаточно затратные эксперименты ставить, понятно какие, но Вы же этого не делали. ;)
Я анализировал достаточно большое количество коммерческих топ-3 на спамность анкор-файла, результата не получилось, четкие закономерности пока не обнаружены. При этом относительная спамность плавает в очень широких пределах. Абсолютная спамность вроде есть, безумное увеличение анкор-листа иногда до добра не доводит. :)
Нет, такого не может быть. Небольшое изменение весов приводит как правило к большим и не всегда предсказуемым изменениям в выдаче, в худшую сторону. Мы проводили достаточно масштабные исследования на эту тему.
Нечего тут арифметику Пупкина алгеброй называть. :D
Проверить можно, да, и так и этак. Ответ вроде однозначный - есть кластеризация.
perfectsky, не понятно, к чему Ваш пост. Очевидно же, что препроцессинг приведет изначально разные запросы в разные. Сейчас это вроде однозначно, хотя во времена, когда активно писал на форуме упомянутый Вами Миныч, это было не так. :)
Запросы разные, но выдача, по логике ТС, должна совпадать. В этом есть здравый смысл, но реальность его опровергает. Я думаю, что дело не в коэффициентах, дело в фишках от отдела антиреверсинжиниринга Яндекса.
Ну, во-первых, то, что я выше написал - это все же гипотеза. :)
Во-вторых, я же писал: "документы из такого интервала выдаются не по возрастанию Ф(), а более хитро, слегка закашивая под рандом, но не рандомом". Т.е. перемешивание (если оно есть) скорее всего жестко завязано на запрос, или еще на что-то, поэтому и выдача статичная. Хотя и выглядит достаточно рандомно при некоторых экспериментах. :)
Если брать разное число слов из одинакового фрагмента, то выдача может отличаться и без перемешивания, от алгоритма ранжирования зависит.
Нет, в Вашем случае это кто-то так "креативно" разбавил анкоры. :D
Вы еще поищите в разных регионах, например с lr=213 и lr2=225. С большой вероятностью тоже получите разные выдачи.
Самый простой вариант объяснялки - если значения функции ранжирования Ф(документ,запрос) лежат для группы документов в определенном узком интервале, то документы из такого интервала выдаются не по возрастанию Ф(), а более хитро, слегка закашивая под рандом, но не рандомом. :D
Запросы имен собственных (с большой буквы которые) могут обрабатываться по другому алгоритму, соответственно получаете другую выдачу.
Запрос с однословной абракадаброй также может обсчитываться по иному. А может и нет, но релевантность изменится, зависит от алгоритма и от окружающих букв. :)
З.Ы. Есть маниакальное подозрение, что интервал для Ф(), о котором я выше нацарапал, сильно расширяется для нестандартных запросов, начиная уже от "" и +. Типа спецом, для любителей непотов и прочей байды. :(
Поздравляю, Леха. Расти большой, с пивом тока поаккуратнее. :)