cymax

cymax
Рейтинг
16
Регистрация
28.08.2007
Каширин:
Ну что и требовалось доказать. А теперь, Миша, ответь, плиз еще раз - стоило оно того? И как тебе собранная коллекция весов - сильно помогает сейчас?

Константин, ваша претензия преждевременная. Никаких операторов еще не отменили, даже НПС "жаждущим" уже возвращен. Новый алгоритм по-другому стал относиться к некоторым словам. Это косвенно отметили форумчане в нескольких топиках. А сервис Михаила - просто "зеркало" ситуации.

garry_chem:
Аналогичная ситуация по текстовым весам, множество редких слов стали иметь фиксированный вес, который на глазок на несколько порядков меньше старого. Подобное творится и на анкорных весах и тоже наблюдается уменьшение веса на несколько порядков.

garry_chem, может быть, проблема просто в модели? Я в топике это озвучил, странные "веса" - модель поломалась? Не секрет, что все эти веса оцениваются некоторыми косвенными "измерениями". Если по вольтметру вдарить кулаком, то стрелка отклонится до 220, а, может, и до 380 вольт. Но это не значит, что мы зафиксировали такой перепад напряжения.

garry_chem:
На порядок у меня отличаются для слова "гидромассаж" а у вас?

Сомнительно это. Текстовый вес гидромассаж::495265 был и пока остается. А анкорный отличатеся на 3-4 порядка, а не на один.

apigon:
предполагалось что анкорные весы неизвестны, но зато известен коэффициент соотношения текстового веса к анкорному
mexboy:
apigon, действительно, непонятно что за коэффициент такой и как вообще он может существовать, если текстовый корпус и анкорный две разные вещи

Нет такого множителя, анкорный корпус совсем-совсем другой. В контексте топика я говорил о множителе между текстовым весом в текстовом ранжировании и текстовым весом в анкорном ранжировании, которые измеряются данным методом. И этот коэффициент совсем не константа даже в таком варианте.

MiRaj:
пока непонятно почему и по какому критерию выбрали слова

Но умение их определять не будет лишним ☝ Надо будет заняться их ранжированием.

MiRaj:
В случае однословного запроса - нет.
А для многословных - вес новый.

Михаил, он не новый. Он расчитан по вашему запросу, который чудесным образом выполнен по анкор-файлам, а не по текстовому. А там несколько иные правила кворума, и наша модель расчета просто не выполняется. Если вы их учтете, то сможете найти масштабирующий множитель, который не равен 1, и тогда "кажущийся" вес недвижимости пересчитается в нормальный старый вес. Но уже будет вилка погрешности.

Инструмент "поломался", не верите? Для большей убедительности вот новые "веса" бывших потолочных слов: everest::251, technics::251, zanussi::251. И вес > 251 для избранных слов вы уже не получите. Вам кажется нормальным сосуществование слов мебель::5046, mercedes::43780370 и недвижимость::143, zanussi::251?

MiRaj:
действительно, веса поменялись, сервис это определил.

Вопрос в том, стоит ли обновлять данные сейчас или дождаться пока Яндекс успокоится.

Веса-то как раз не поменялись, я это отметил. Инструмент перестал правильно работать. Поэтому лучше ничего не пересчитывать ;)

А дождаться завершения Родео-2 я тоже хочу. Пока имеем разные версии алгоритмов на разных серверах, и выводы делать рано.

wolf:
Возможно, во фразах, куда входят такие "особые" термины теперь и "особая" переколдовка.

+1, я уже напомнил про историю с часами. Пока не пытался ее точно воспроизвести, но в результате аналитег-запросы работают не по текcтовому, а по анкор-файлу. А там совсем другие правила, что и приводит к масштабированию результата на некоторый коэффицинт сильно <1.

_S_:
Операторчеги добавились?

"Часы" иногда возвращаются, но в ином обличии ;)

hero, в сервисе Михаила веса этих слов правильные. У него же база давно собирается, а эти изменения наблюдаются всего лишь 2 дня.

Вот если он решит сделать пересчет, тады ой ;)

Еще несколько примеров слов с подозрительно малыми весами: дизайн::144, интернет::125, недвижимость::143, продажа::132, производство::142, ремонт::146, стоимость::144.

Есть и диагноз. На самом деле веса этих слов не изменились, это просто сбой аналитег-инструмента ;) Яндекс действительно по-иному стал относиться к этим словам, но выражается это вовсе не в изменении веса.

В помощь Михаилу. Если сервис теперь будет фиксировать вес <=251, то это слово - верный кандидат на пересчет другим методом. По такому малому весу можно приблизительно оценить вес правильный, но будет большая погрешность.

Сергей, у меня тоже 3 кластер был. Все равно непонятно, почему мебель осталась точь-в-точь, а другие слова попадали. А некоторые миллионники подвинулись, но очень скромно.

Закралась непроверенная идея ... но, думаю, лучше мы пока понаблюдаем ;)

Всего: 123