wolf

wolf
Рейтинг
1183
Регистрация
13.03.2001
Должность
интернет-маркетинг, SEO
Оленька:
Сергей, будут ли рассматриваться в рамках семинара вопросы нового алгоритма - Находки, и как с ним бороться)

Естественно, вопросы текущего состояний дел не могут быть обойдены стороной.

Miha Kuzmin (KMY):
wolf, что-то похоже на совсем фантастическое обьяснение, не поддающееся логике. Не проще предположить, что таки не берется идф из справочника?

Некий резон в твои словах есть, надо покумекать на досуге над усовершенствованием гипотезы :)

Miha Kuzmin (KMY):
Не находишь, что тогда теоретически не было бы разницы между

окна::100
окна::100000

Теоретически она бы была, если б колдунщик варьировал переколдовку в зависимости от весов слов, входящих в запрос ;)

А горячим парням настоятельно рекомендую вопросы офтальмологии и прочей клиники развивать в Курилке.

Miha Kuzmin (KMY):
Да нет тут палева.

Ну, это смотря для кого. ;)

Абрашка:
опять же, вполне воможно, что на данный момент по формуле кворума даже нулевого веса слов в запросе достаточно для того, что он был пройден

Кворум кворумом, а нулевая IDF давала в итоге нулевую релевантность. Кстати, раньше нулевой вес использовался для того, чтобы исключить из расчета кворума незначащие термины типа того же url="..." или link="...", только, если мне не изменяет память, через оператор всё таки :, а не ::. Возможно, 0 как значение оператора :: сейчас неактуально при переколдовке или имеет уже совсем другое значение.

Kolyaj:
Что оператор :: уже не тот видно по запросам вида [яндекс::0]. Раньше по таким запросам выдавалось вполне очевидное "Задан пустой поисковый запрос", а ща библиотека

Я еще в начаде дискуссии предположил, что оператор :: сейчас используется только для колдунщика. При ранжировании IDF берется из справочника. Анкорную IDF же никто не задавал оператором, а она таки использовалась при ранжировании ;)

Абрашка:
в том-то и дело, что этих граней лично у меня получается не 2, а много больше

Дайте пример запроса, у которого много граней. Погонял несколько - пока вижу четкие две.

Кстати, подозреваю загвоздка может быть в том, какой термин выбран в качестве слово2 и нашей милой гипотезе о более тесной дружбе контента с анкор-файлом ;-)

Чё-то палево пошло нешутошное :) Секреты Полишинеля, конечно, но подозреваю, что очень многие их еще не знают.

Абрашка:
раньше-то можно было так
(слово1 слово2::X)//50

Ну да, именно этот способ и выводится за пару минут из формулы из "... на РОМИП 2004".

Абрашка:
меняем X - по разрядам 1,10,100,1000, при резком изменении кол-ва найденных документов понимаем что кворум вместо слова1 стало проходить слово2 (ну или наоборот)
находим точно эту грань - и тогда Х - вес слова1

А сейчас что не так? Грань находится, вернее две - для основной выдачи и быстроботовской.

Miha Kuzmin (KMY):
Да ни о чем они не говорят, потому что оператор :: хз как работает счас.

Я бы сказал, он непонятно как работает сейчас на сверхмалых своих значениях :) Такое впечатление, сверхмалый диапазон (единицы, десятки, и, может быть, сколько-то из начала сотен) отдан для каких пока нам неизвестных целей.

Miha Kuzmin (KMY):
Ну учитывая, что && работает, можно просто сделать конструкцию вида

"текст проиндексированного ссылко" && "текст сохраненки" << url=""

Если связаны - должно находить.

Тут один маленький нюанс - в анкор-файле нет понятия расстояния между предложениями. Поэтому оператор && там не работает ;) Возможно, теперь есть какой-нибудь новый оператор (ДСП, так сказать :)), который связывает контент и анкор-файл.

Всего: 24501