euhenio

euhenio
Рейтинг
357
Регистрация
21.09.2001
Должность
ИП: продвижение и создание сайтов, увеличение конверсии
Miha Kuzmin (KMY):
euhenio, ты срочнонахом сохрани с расстояниями по предложениям. Остальные и так понятны на вид запроса.

-Наташа уже скопировала кеши по всей массе запросов :)

XPraptor:
Оттуда пока есть возможность нужно вытянуть все слова необходимые. Тока по одному слову нужно вводить

-ты имеешь в виду выкачивание весов отдельных слов? Очень удачно, что мы как раз недавно веса 100 тыс самых частотных слов распарсили :)

А мне больше жалко операторы между словами во фразах.

Срочнонах.
Так, если что - сохраняем свои архивы скачанных с яндекса запросов. Потом обменяемся.

Miha Kuzmin (KMY):
euhenio, при прямом вводе работает. А так алес (((

-дык, это если ты сам в урле ректекст набираешь? :) Дак его угадать надо сначала :)

PS тысяча чиртей! Канальи! :)

Недавно были траблы с подсветкой. Т.е., подсвечивалось неправильно. Может, действительно, что тестят. :)

А так - будем втыкать в архивы скачанных запросов и в источники статей Сегаловича и его литературы. :) Конечно, новичам это затруднит жизнь :)

Что-то палители тем не жгут.

Замочу тему, пожалуй.

Kostya:
2. Христос никого не прощал и не прощает, если человек не испытывает покаяния. Та женщина явно осуждала себя за содеянное.
3. Встреча с Иисусом изменило женщину, она стала прощенной.

-сами себе противоречите. Глупо.

Кстати, несмотря на то, что я уточнил свой вопрос с цитатой - сэр Калинин на него не ответил. :)

Кот:
интуитивно, не кажется ли Вам, что документ [aa aa bb cc dd] желательно поместить в СЕРПе выше документа [aa bb cc dd] по запросу [aa bb] (при прочих равных)?

-с одной стороны, кажется, что желательно, и я об этом написал (с :)) С другой стороны, простота рулит. И должна использоваться.

Кот:
Стоп! А откуда взялось произведение? Я с этим, как бы, не совсем согласен. Прошу пояснить, по возможности.

-я же 2 раза написал: это я предположил. Давайте встречные предположения! :)

Кот:
Но возникнут сложности с "табулированным набором коэффициентов" - он же не резиновый

-в смысле, какие сложности? Не вижу сложностей.

Я не думаю, что есть пересекающиеся пассажи, тупо по причине:

1. Если есть переколдовка по документу - будет КУЧА вариантов пассажей, и при этом каждому слову надо учитывать, в какие пасссажи он входит, и что-то как-то уменьшать. Это и по расчетам геморройно.

wolf:
Мне кажется логичным, что каждый термин должен учитываться один раз, независимо от того, сколько раз он встречается в запросе или пассаже.

-примерно согласен

ТВЭЛ:
Дело в том, что баннеры тоже текстовые

-Ну как же. Чтобы все было одинаково у всех. Баннер с текстом "голый Гарри поттер" разве аналогичен баннеру "Крем от морщин"? По заказам.

А и осмысленные целевые тексты баннера могут разную аудиторию цеплять.

Кот:
Ну так, веса у этих документов-предложений одинаковые будут или нет

-вообще да, думаю, одинаковые. Но я бы все равно при оптимизации написал побольше слова aa - на всякий случай. :) Да и бб добавил бы. :)

Кот:
После того, как отработал механизм кворума, никакой вес у пассажей еще не возник. Вес у пассажей возникает позже, на этапе ранжирования

-Идею понял лучше. Веса считаются после прохождения кворума. Но ммм... как бы так сказать... Ну, например.

Есть 2 пассажа во фразе А Б А по запросу А & Б.

Будем предполагать (думаю, разумно), что вес двусовных пассажей пропорционален произведению веса А на вес Б. Плюс учет расстояния.

1. Wab=вес пассажа А Б=K1*Wa*Wb

2. Wba=вес пассажа Б А=K2*Wa*Wb

K2<K1 (обратный порядок слов)

Если мы для перекрывающихся пассажей уменьшили вес слова b вдвое, вместо Wb используем Wb/2:

Есть 2 пассажа, перекрываются с весом второго слова Wb/2:

W2=Сумма весов пассажей=Wab+Wba=(K1/2+K2/2)*Wa*Wb

Если бы в документе был учтен один пассаж А Б, а второй не учтен:

W1=вес документа Wab=K1*Wa*Wb

Теперь сравниваем W1 и W2. Теоретически должно быть W2 > W1, чтобы сумм вес перекрывающихся пассажей был выше, чем одного, мы ведь для этого все затеяли, иначе нет смысла извращаться с перекрыванием весов. Тогда:

K1/2+K2/2 > K1

=>

K2>K1

Т.е. вес пассажа с "обратным расстоянием" д.б. выше, чем вес пассажа с прямым расстоянием. Я думаю, это было бы нелогично.

Конечно, здесь есть предположение, что вес двусловного пассажа пропорционален произведению весов слов - считаю его разумным.

Всего: 4720