Но в поиске ИМХО редко тратят просто 50$, обычно есть некий бюджет в месяц и важен (особенно по редким словам) охват все аудитории...
Но с другой стороны, если положить небольшой баланс (как дополнение к yandex, etc), и за долгое время, но открутится, а цены на многие слова пока очень низкие, получается достаточно эффективно в комплексе?
Именно так я эту проблему и решил (это описано в начале топика - наверно не совсем понятно :D )
А может есть какие-то специализированные алгоритмы для решения данной задачи?
Указанные вами ссылки я читал и до того... но вопрос в другом (не в том как выбрать пересечение 2 ссылка, и не в том как подсветить слова с учетом словоформы)
а как найти оптимально слова находящиеся рядом анализируя только координатный индекс:
например слова из запроса "работа в киеве"
работа на странице встречается на 2 5 10 11 22 33 позиции
а киеве на 3 12 ....
и нужно как можно более оптимально найти место работа 11 - киев 12 - что указывает на то что в документе слова рядом..
Привожу пример как работает сейчас:
Например запрос 3 слова:
Для всех страниц, где встречаются 3 слова:
1) формируем начальный массив (из координатного индекса каждого слова)
первое слово - координата 1
второе слово - координата 4
третье слово - координата 5
Считаем вес...
2) Первое слово минимум
смотрим следующую координату например 2 (ну в индексе +1)
первое слово - координата 2
Считаем вес
И т.д.
PS: Перефразирую вопрос: Как найти наиболее близко лежащие слова используя координатный индекс?