draal

Рейтинг
9
Регистрация
20.10.2003
Должность
Bigmir System Developer
Интересы
SE programming

Но в поиске ИМХО редко тратят просто 50$, обычно есть некий бюджет в месяц и важен (особенно по редким словам) охват все аудитории...

Как писал Spam Killer

Это ты про "антивирус" ? :D 76 запросов в месяц...
А представь, что делать людям, которые сумками торгуют или ещё чём-то... 🙄

Но с другой стороны, если положить небольшой баланс (как дополнение к yandex, etc), и за долгое время, но открутится, а цены на многие слова пока очень низкие, получается достаточно эффективно в комплексе?

Именно так я эту проблему и решил (это описано в начале топика - наверно не совсем понятно :D )

А может есть какие-то специализированные алгоритмы для решения данной задачи?

Как писал Vyacheslav Tikhonov

Читать форум. Этот вопрос уже
обсуждался и не раз.

Указанные вами ссылки я читал и до того... но вопрос в другом (не в том как выбрать пересечение 2 ссылка, и не в том как подсветить слова с учетом словоформы)

а как найти оптимально слова находящиеся рядом анализируя только координатный индекс:

например слова из запроса "работа в киеве"

работа на странице встречается на 2 5 10 11 22 33 позиции

а киеве на 3 12 ....

и нужно как можно более оптимально найти место работа 11 - киев 12 - что указывает на то что в документе слова рядом..

Привожу пример как работает сейчас:

Например запрос 3 слова:

Для всех страниц, где встречаются 3 слова:

1) формируем начальный массив (из координатного индекса каждого слова)

первое слово - координата 1

второе слово - координата 4

третье слово - координата 5

Считаем вес...

2) Первое слово минимум

смотрим следующую координату например 2 (ну в индексе +1)

первое слово - координата 2

второе слово - координата 4

третье слово - координата 5

Считаем вес

И т.д.

PS: Перефразирую вопрос: Как найти наиболее близко лежащие слова используя координатный индекс?