A_I_F, планирую. Стоимость программы еще поднимется.
Бывает глюк с повторением некоторых слов и хоть это ни в коем случае отрицательно не влияет на индексацию, но все равно я его обязательно исправлю.
griff92, поправим. Вообще это пока только первая версия доргена, так сказать пилотная, он претерпит еще множество исправлений и дополнений.
wolfston, в том то и дело, что опробован :)
А если вы настолько уверены, что текст палится по связкам слов, то очень скоро добавится поддержка n-грамм, что будет делать текст тематическим
Вот такой текст сгенерировал генератор по цепям Маркова из ваших слов.
Я могу из своего опыта сказать, что морфологически правильный текст, пусть и полный бред хорошо сидит в индексе.
Он превосходит марковку на голову а то и две.
Я вас понял прекрасно, похоже это вы не разу не генерировали ничего, а так, просто рассуждаете. Вот скажите, при генерации по цепям Маркова, вы что используете текстовку из одного предложения, что у вас эти "два стоящих рядом слова" всегда будут встречаться в живом языке? Это одно, а второе, это то, что чтобы по настоящему определить смысл текста это как минимум нужен ИИ, а вы говорите фильтр...
Каким местом она будет выглядеть лучше?
Вы сами себе противоречите, говоря, что генерация по цепям Маркова читабельнее. Т.е. если взять любые пару слов из текста сгенерированного по цепям Маркова, то это будут часто употребляемые в речи обороты?
Ключевик пеленгатор в каждом 2-м предложении:
Немного приоткрою завесу над тем что планируется добавить в ближайших обновлениях доргена. Во первых будут добавлены n-граммы, что позволит генерировать текст на определенную тематику, также будут генерироваться различные предложения, сейчас пока только сложные повествовательные, появятся вопросительные, восклицательные. Что касается вставки ключевиков, то тут планируется провести большую работу, чтобы можно было перефразировать ключевики, менять падежи и т.д. Также будет добавлен синонимайзер и другие методы генерации и граббинга. Ну и конечно же будут добавлены другие языки!
Все это ожидайте в последующих версиях, работа идет постоянно, добавляются новые фичи, исправляются старые глюки. Enjoy!
Ключевик — схемы оптических локаторов
Rus356, все верно, пофиксил
Вышло очередное обновление. На этот раз исправлена часть найденных глюков. Обновляемся!
Работа идет полным ходом!