Гммм, а нужные кеи для конкретной тематики вы откуда возьмете?
И по какому принципу собрались отбирать?
Возьмите 1К кеев и определите у них тематику, потом повторите это же на 10К кеев, 100К кеев и т.д. - тогда поймете БЕЗ раздумий.
Предлагают идти от обратного: выбирать не конкретный кей и определять тематику, а выбрать тематику и вытащить все кеи.
А например для двухсловника "авто gps" какая тематика будет? Вы там с количеством тематик не запутаетесь?
Дор - это в большенстве своем текстовая информация, не противоречащая законодательству РФ (исключая прямое копирование).
Так что не тем копаете ;)
Тоже думал над этим. Вот только признаков нема. Есть ведь общетематические кеи (например "купить"), есть более узкие (например, "купить авто". Вот только его можно отнести и к авто тематике, и к бизнес тематике).
Хотя сервис полезный. :)
Что-то типа...
SEOGENDEMO поищите на форуме - связь не позволяет перекинуть прогу.
Главное не компоновка (в базе хранятся счетчики взаимного расположения слов, следовательно переходя от слова к слову вы будете получать цепочку более-менее связанных слов), а предел, когда надо заканчивать предложение.
Информация берется из уже имеющихся статей (точно также обучается и человек - читает и общается с другими).
Сложно, не спорю. Но пример, приведенный выше, больше похож на уже имеющийся СЕОгенератор статей.
Зато в экономике есть - расход называется ;)
Математик ;)
А насчет идеи: что-то наподобии гугловского алгоритма расшифровки сокращений - вычеленяются слова, которые наиболее часто встречаются в окружении сокращения и таким образом составляется описание (что-то в этом роде).