Константин, ваша претензия преждевременная. Никаких операторов еще не отменили, даже НПС "жаждущим" уже возвращен. Новый алгоритм по-другому стал относиться к некоторым словам. Это косвенно отметили форумчане в нескольких топиках. А сервис Михаила - просто "зеркало" ситуации.
garry_chem, может быть, проблема просто в модели? Я в топике это озвучил, странные "веса" - модель поломалась? Не секрет, что все эти веса оцениваются некоторыми косвенными "измерениями". Если по вольтметру вдарить кулаком, то стрелка отклонится до 220, а, может, и до 380 вольт. Но это не значит, что мы зафиксировали такой перепад напряжения.
Сомнительно это. Текстовый вес гидромассаж::495265 был и пока остается. А анкорный отличатеся на 3-4 порядка, а не на один.
Нет такого множителя, анкорный корпус совсем-совсем другой. В контексте топика я говорил о множителе между текстовым весом в текстовом ранжировании и текстовым весом в анкорном ранжировании, которые измеряются данным методом. И этот коэффициент совсем не константа даже в таком варианте.
Но умение их определять не будет лишним ☝ Надо будет заняться их ранжированием.
Михаил, он не новый. Он расчитан по вашему запросу, который чудесным образом выполнен по анкор-файлам, а не по текстовому. А там несколько иные правила кворума, и наша модель расчета просто не выполняется. Если вы их учтете, то сможете найти масштабирующий множитель, который не равен 1, и тогда "кажущийся" вес недвижимости пересчитается в нормальный старый вес. Но уже будет вилка погрешности.
Инструмент "поломался", не верите? Для большей убедительности вот новые "веса" бывших потолочных слов: everest::251, technics::251, zanussi::251. И вес > 251 для избранных слов вы уже не получите. Вам кажется нормальным сосуществование слов мебель::5046, mercedes::43780370 и недвижимость::143, zanussi::251?
Веса-то как раз не поменялись, я это отметил. Инструмент перестал правильно работать. Поэтому лучше ничего не пересчитывать ;)
А дождаться завершения Родео-2 я тоже хочу. Пока имеем разные версии алгоритмов на разных серверах, и выводы делать рано.
+1, я уже напомнил про историю с часами. Пока не пытался ее точно воспроизвести, но в результате аналитег-запросы работают не по текcтовому, а по анкор-файлу. А там совсем другие правила, что и приводит к масштабированию результата на некоторый коэффицинт сильно <1.
"Часы" иногда возвращаются, но в ином обличии ;)
hero, в сервисе Михаила веса этих слов правильные. У него же база давно собирается, а эти изменения наблюдаются всего лишь 2 дня.
Вот если он решит сделать пересчет, тады ой ;)
Еще несколько примеров слов с подозрительно малыми весами: дизайн::144, интернет::125, недвижимость::143, продажа::132, производство::142, ремонт::146, стоимость::144.
Есть и диагноз. На самом деле веса этих слов не изменились, это просто сбой аналитег-инструмента ;) Яндекс действительно по-иному стал относиться к этим словам, но выражается это вовсе не в изменении веса.
В помощь Михаилу. Если сервис теперь будет фиксировать вес <=251, то это слово - верный кандидат на пересчет другим методом. По такому малому весу можно приблизительно оценить вес правильный, но будет большая погрешность.
Сергей, у меня тоже 3 кластер был. Все равно непонятно, почему мебель осталась точь-в-точь, а другие слова попадали. А некоторые миллионники подвинулись, но очень скромно.
Закралась непроверенная идея ... но, думаю, лучше мы пока понаблюдаем ;)