garry_chem

Рейтинг
66
Регистрация
05.08.2005
baltic13:
поспешил с мнением.. все как раз наоборот :) чем больше idf у слова в тексте ссылки, тем больше ему должно передаваться.
у слова "кондиционеры" вес сущесвенно выше, чем у слов "купить" и "Panasonic", поэтому эти два варианта не сильно будут отличаться.

По миражу (текстовый вес)

кондиционеры 16760

купить 820

Panasonic 7000+- (ленивый для точности)

То что вы написали, возможно, трактуется так - большой idf - более редкое слово в коллекции документов, значит можно придать ему больше веса, поскольку менее редкие слова встречаются чаще и вес можно дать меньший, за счет распространненности.

Согласен, что для кондиционеров обе ссылки будут схожи по передаваемому весу, если исходить из текстовых весов. А вот из анкорных...?

Еще интересен вопрос о количестве слов в ссылке и передаваемого веса для первого, второго, ..., n-го (при условии схожих весов слов из анкора).

wolf:
Тэ-э-экс, что тут понимается под "анкорным весом", давайте выясним для начала... А?

Могу лишь процитировать cymax, поскольку именно это имел ввиду

"анкорный вес" - текстовый вес в анкорном ранжировании

cymax:
garry_chem, может быть, проблема просто в модели? Я в топике это озвучил, странные "веса" - модель поломалась? Не секрет, что все эти веса оцениваются некоторыми косвенными "измерениями". Если по вольтметру вдарить кулаком, то стрелка отклонится до 220, а, может, и до 380 вольт. Но это не значит, что мы зафиксировали такой перепад напряжения.

Сомнительно это. Текстовый вес гидромассаж::495265 был и пока остается. А анкорный отличатеся на 3-4 порядка, а не на один.

Спасибо, дело в том что до изменения отношения яндекса к напряжению измеряемого "вольтметром" все как вы и говорите, разница в 3 порядка была, а вот сейчас моделька (вольтметр если изволите :-)) дала сбой.

подбираем альтернативную модельку...

Рад что не у всех инструменты испортились.

mexboy:
garry_chem, а как Вы рассчитываете анкорный вес если не секрет:)

Извините секрет.

apigon:
предполагалось что анкорные весы неизвестны, но зато известен коэффициент соотношения текстового веса к анкорному

На порядок у меня отличаются для слова "гидромассаж" а у вас?

cymax:
Михаил, он не новый. Он расчитан по вашему запросу, который чудесным образом выполнен по анкор-файлам, а не по текстовому. А там несколько иные правила кворума, и наша модель расчета просто не выполняется. Если вы их учтете, то сможете найти масштабирующий множитель, который не равен 1, и тогда "кажущийся" вес недвижимости пересчитается в нормальный старый вес. Но уже будет вилка погрешности.

Аналогичная ситуация по текстовым весам, множество редких слов стали иметь фиксированный вес, который на глазок на несколько порядков меньше старого.

Подобное творится и на анкорных весах и тоже наблюдается уменьшение веса на несколько порядков.

Возможно уменьшили в несколько раз размер корпуса или выдают муляж, или еще что-то.

Очень интересна тема масштабирующегося множителя. Идею с ним не понял в принципе.

Что именно предлагаете масштабировать, если есть четкая граница частот/весов?

Dmitry-1:

кто знает, почему так?
заранее всем спасибо.
Дмитрий

Скорее всего, Вам отвечает другой сервер яндекса, поэтому изменяются сайты в выдаче.

На части серверов выдача новая, на части - старая.

sfront2-049.yandex.ru - отдает уже новую послеапдейтную.

sfront3-048.yandex.ru - выдача новая

sfront2-042.yandex.ru - уже тоже новая

LEOnidUKG:
парсим парсим парсим?)))))

Всё работает.

Работает, да не у всех, цивилизованно ручками по 2 запроса пробую проверять и фиг что проверяется. Пробовал с 2 разных провайдеров и та же штука.

Может рамблер на Харьков обиделся😕

wolf:
Точно посчитать теоретически можно. По крайней мере, мне известен один метод. Но это очень трудоемко. Просто фантастически. И метод очень нетривиален. Я не уверен, что кто-то еще им владеет.

Приблизительно можно было посчитать до отмены оператора anchor. Если приближенно положить количество употреблений термина в корпусе анкор файлов как результат поиска по нему с ипользованием этого оператора (погрешность, в зависимости от конкретного термина, впрочем, может быть довольно значимтельной). Но тоже нужно обладать кое-какими знаниями, а именно - точным характером зависимости обратной частоты от количества употребления слов в корпусе анкор-файлов. Тоже не уверен, знает ли ее кто-нибудь еще, т.к. выведена мною она была в результате использования первого метода.

В общем, очень хотел бы услышать подтверждение слов

Спасибо за разъяснения.

Сергей, а можно хотя бы один посчитанный по вашей методе обратный вес для ссылочного корпуса, если уже считали и метод опробован на практике.

Буду благодарен даже за старое значение, до отмены оператора анкор.

Всего: 167