cymax

cymax
Рейтинг
16
Регистрация
28.08.2007

Я полагаю, на вопрос sansaralove ответили. Да, "стоп-слова" вполне себе легковесы. Есть, конечно, и исключения, типа чему 70188 или которою 3254065.

DrJeans:
Обратите внимание на то как колдуются:

DrJeans, так и я про это толкую. А то у нас так: если предлог, значит, стоп-слово. Далеко не всегда, и ваши примеры это показывают.

!+ это да, его наличие в переколдовке можно и сейчас без подбора определить. А насчет !% я не уверен, имхо не осталось их сейчас. Или почти не осталось. Ваши примеры ведь из архива.

UPD. Хотя сейчас проверил, все-таки !%у розовых слонов. Значит, ошибся насчет %.

Тимон:
Обычно, он не обнуляет веса стоп-словам, когда они встречаются в крылатых выражениях, например, "ни рыба ни мясо"

Ну, предлоги/союзы встречаются во многих запросах, не только в крылатых выражениях. А ваш пример не очень удачный, "ни" здесь не стоп-слово, ни в рыбе, ни в мясе ;)

sansaralove:
А Вы не могли бы пояснить?
Как вес вообще может быть равен нулю? Не могу догнать.

Назначение нулевого веса - это искусственно. Колдунщик так делает, когда решает, что стоп-слово следует игнорировать. Но он не всегда так делает - все зависит от запроса.

_S_:
Вероятно потому, что их вес равен нулю...

В широком смысле это совершенно обычные слова. Вес 0 колдунщик назначает им лишь в некоторых запросах. Иначе в 53, и 56, на 91 и т.д.

dnx, честно говоря, не очень понял ваше решение. Может, по диагонали? ;)

У вас тут неопределенность 0/0 - правило Лопиталя в чистом виде. Берете производные по x отдельно для числителя и знаменателя, делите, упрощаете (если надо), подставляете x=1/3.

Получится lim = -(2/3)^(3/2) = -0.544331+

MiRaj:
Интересно только почему она возникла только на англоязычных терминах с очень большими весами

MiRaj, трудно сказать. Начиная с 10.11 процент ошибок в выдаче слегка вырос. Прочекаете, возможно, найдется не только латинница. Ошибки миллионников хорошо графически ловятся, но только в случае небольших отклонений.

MiRaj:
cymax, есть такое - на словах с большими весами (больше десятка млн.) возникают разногласия. Пофиксим.

Небольшие разногласия на весах > 2 млн. появились в первый же день проблем с оператором <<url. Но тут несколько иная ситуация: zanussi::307667 против zanussi::800379231. Письмом отослал, надеюсь, пригодится.

ПС. Странно, я думал, что у нас одна метода ;)

MiRaj, что-то мой "любимый" mercedes не бьет ни со старым корпусом, ни с новым, ни с альтернативной.

attack:
Частотность слов меняется гораздо реже, чем тот же тИЦ.
Поэтому период около года (ИМХО)

Гипотезу о том, что не чаще, чем раз в год еще Миныч высказывал. Но это было 1.5 года назад /ru/forum/comment/1249975;postcount=8

cymax:
Если не ошибаюсь (поправьте), то предыдущая смена корпуса была в ап "счастливых билетов". Там еще и алгоритм крутили, но результаты все помнят - это не +-1 у отдельных наблюдадетей.

Никто не зафиксировал, была смена корпуса 26.07.07? Если все-таки была, то теперь прошло всего 4 месяца.

Всего: 123