Вот в таких вещах вроде способов измерения уникальности текста я не разобрался еще.
Если правильно понимаю, то при текущем объеме данных сеть может сгенерировать 25000 уникальных текстов по 1000 знаков.
При этом не полностью уникальный текст может появиться случайным образом на любом этапе, потому что генерация происходит случайно.
Также количество потенциально уникальных текстов быстро снижается с ростом длины и количества заданных ключей.
Примерный ответ - около 500 текстов для одной ключевой фразы из двух слов.
Кек-кек, Lifemaster
Я изучал алмазы мудрости великого гуру в режиме многолетнего ритрита в горах Тибета. Те слова от меня не ускользнули и стало понятно, что нужно быть больше, чем программистом. Я же не писал, что я программист по жизни. Просто есть такие навыки.---------- Добавлено 12.04.2017 в 23:05 ----------
Сначала работал с многогигабайтными архивами библиотек. Ждал по нескольку дней, пока пройдет обучение и на выходе получался ужасный мусор.
Сейчас обучение проводится в основном на статьях из блогов прилично пишущих людей. Получается современнее и более человечно, чем по литературе.
Объем обучающих материалов около 20Мб, сейчас. Их точно не посчитать. Используется несколько видов обучения разными материалами.
Размер после обучения на базовых материалах без дополнительных тематик примерно 49Мб.
Форматы хранения данных делал сам, чтобы возможна была работа без сервера с 64Gb RAM. В перспективе планирую выложить часть на гитхаб, но само-собой не все.
Скажу лишь, что сделать даже основу системы было адским трудом. Заново это я не хотел бы проходить. Теперь думаю что делать дальше с тем, что получилось.
А ты, как вижу, недоиграл, но осадочек остался 🤪
Не в моих интересах это.
Понятно, что работающие направления никто писать не будет. Но лучше спросить, чем не спросить.
Поверил на слово Халифу НумНуму 😎
И не нашел, где еще можно применить программистские знания при отсутствии знаний по остальным разделам вроде SEO. Очень уж на работу не хочется выходить.
А есть альтернатива в похожем направлении?
Пока не накоплю на дорах денег :2cents: на 4-ядерный Core-i7, видимо придется так и делать 😆
Сейчас работа зашла в тупик, потому что объем того, что нужно сделать выглядит на два-три месяца труда, а сфера применения непонятна.
Может быть действительно будет правильнее запустить что-то конкретное, а потом допиливать техническую часть по мере необходимости.
Это базово обученная сеть.
Поверх ее снимка может проводиться дополнительное обучение по любой тематике.
Также нужно будет делать внедрение конкретных для каждого текста ключевых фраз на одной из стадий постпроцессинга.
Продвинуться дальше можно только когда будет отлажена базовая нейтральная генерация.
Система сейчас очень сырая.
4-5-6-граммы это вещь. Благодарю.
У ТС, как я понял, с производительностью все в порядке.
Медленно работает моя система генерации, пример текста которой я публиковал выше.---------- Добавлено 12.04.2017 в 16:02 ----------Очередное творение.
Точно, время генерации получается слишком большим. От 15 секунд до двух минут на текст.
Плюс время если ставить переобучать веса.