Игрушка хорошая, очень интересно. Но даже подсказчик правильного написания (нужен <1% случаев) сделать на этой основе непросто. Автомат будет то и дело врать, а неавтомат сложноват, на мой взгляд.
не понравилось: запрос ЕДА,
отклик СРЕДА,ПЕДАГОГИКА.
понравилось: запрос РАБОТА,
отклик РАБОТА ЗА РУБЕЖОМ, РАБОТА В ПИТЕРЕ.
ошибка-1 понятная и для начала простимая, со вторым случаем сложнее. что будете делать, когда таких рубрик появится тысяч 5-10?
да... а ларчик (Рамблер) просто открывался.
видна явная недоработка по отсечению спама в виде искусственного документа.
Значит, надо разбросать ключевые слова по нескольким документам и перемешать их (а вдруг анализируют еще и повторы)?
Вроде этого:
Поиск, Поисковик, Поисковый, Каталог, Запрос, Сервис, Релевантность, Посетитель, Посещаемость, Доступ, Рунет, Ссылка, Аудитория, Рейтинг...
Главное, чтобы частотность за 3-4% не вылезла?
Слова-то отнюдь не случайные. Шуму (словарного) - много, но подход правильный.
Можете взглянуть на нашу разработку.
Идея: Поиск + Анализ.
http://zoom.galaktika.ru
Есть также PCBirs(http://birs.chat.ru), Артефакт (www.integrum.ru/artefact), SSSgroup (сходу из тех, что не на слуху)