Да зафигачиваешь по маркову не слово, а слово+часть речи и уже гуд. Если текст собираешь по тематике, то на выходе получишь подобный уникальный тематический бредо-текст.
А множество флагов это на усмотрение, но это уже пост обработка готового текста.
Если хочешь генерить "осмысленную" статью, то анализ и обучение должен быть "статья" -> "абзац" -> "предложение" -> "слова" или еще сложнее.
Или типа как генератор сказок ))
У тебя как процесс обучения сети проходит?