-Наташа уже скопировала кеши по всей массе запросов :)
-ты имеешь в виду выкачивание весов отдельных слов? Очень удачно, что мы как раз недавно веса 100 тыс самых частотных слов распарсили :)
А мне больше жалко операторы между словами во фразах.
Срочнонах. Так, если что - сохраняем свои архивы скачанных с яндекса запросов. Потом обменяемся.
-дык, это если ты сам в урле ректекст набираешь? :) Дак его угадать надо сначала :)
PS тысяча чиртей! Канальи! :)
Недавно были траблы с подсветкой. Т.е., подсвечивалось неправильно. Может, действительно, что тестят. :)
А так - будем втыкать в архивы скачанных запросов и в источники статей Сегаловича и его литературы. :) Конечно, новичам это затруднит жизнь :)
Что-то палители тем не жгут.
Замочу тему, пожалуй.
-сами себе противоречите. Глупо.
Кстати, несмотря на то, что я уточнил свой вопрос с цитатой - сэр Калинин на него не ответил. :)
-с одной стороны, кажется, что желательно, и я об этом написал (с :)) С другой стороны, простота рулит. И должна использоваться.
-я же 2 раза написал: это я предположил. Давайте встречные предположения! :)
-в смысле, какие сложности? Не вижу сложностей.
Я не думаю, что есть пересекающиеся пассажи, тупо по причине:
1. Если есть переколдовка по документу - будет КУЧА вариантов пассажей, и при этом каждому слову надо учитывать, в какие пасссажи он входит, и что-то как-то уменьшать. Это и по расчетам геморройно.
-примерно согласен
-Ну как же. Чтобы все было одинаково у всех. Баннер с текстом "голый Гарри поттер" разве аналогичен баннеру "Крем от морщин"? По заказам.
А и осмысленные целевые тексты баннера могут разную аудиторию цеплять.
-вообще да, думаю, одинаковые. Но я бы все равно при оптимизации написал побольше слова aa - на всякий случай. :) Да и бб добавил бы. :)
-Идею понял лучше. Веса считаются после прохождения кворума. Но ммм... как бы так сказать... Ну, например.
Есть 2 пассажа во фразе А Б А по запросу А & Б.
Будем предполагать (думаю, разумно), что вес двусовных пассажей пропорционален произведению веса А на вес Б. Плюс учет расстояния.
1. Wab=вес пассажа А Б=K1*Wa*Wb
2. Wba=вес пассажа Б А=K2*Wa*Wb
K2<K1 (обратный порядок слов)
Если мы для перекрывающихся пассажей уменьшили вес слова b вдвое, вместо Wb используем Wb/2:
Есть 2 пассажа, перекрываются с весом второго слова Wb/2:
W2=Сумма весов пассажей=Wab+Wba=(K1/2+K2/2)*Wa*Wb
Если бы в документе был учтен один пассаж А Б, а второй не учтен:
W1=вес документа Wab=K1*Wa*Wb
Теперь сравниваем W1 и W2. Теоретически должно быть W2 > W1, чтобы сумм вес перекрывающихся пассажей был выше, чем одного, мы ведь для этого все затеяли, иначе нет смысла извращаться с перекрыванием весов. Тогда:
K1/2+K2/2 > K1
=>
K2>K1
Т.е. вес пассажа с "обратным расстоянием" д.б. выше, чем вес пассажа с прямым расстоянием. Я думаю, это было бы нелогично.
Конечно, здесь есть предположение, что вес двусловного пассажа пропорционален произведению весов слов - считаю его разумным.