Согласен. Классическая установка: "Где находимся? и Куда наступать?".
Особенно если добавить морозовское "Стратегический подход – это выделение главного в ущерб второстепенному".
Поэтому, Lastwarrior, появляется вопрос. Что главнее в генерации текста?
- читаемость,
- соответствие неким метрикам или
- индексируемость и хорошая ранжируемость ПС?
Или, может быть что-то другое?
Встречается такая статья
http://machinelearningmastery.com/text-generation-lstm-recurrent-neural-networks-python-keras/
возможно, это работающий вариант. И на хабре на днях была статья про Keras. Инструмент в тренде.
Разворачивать нет смысла - конкретно этот алгоритм, с примером из статьи, очень слабый.
У этого автора есть новые статьи по теме, но хорошего готового решения я не нашел.
http://machinelearningmastery.com/author/jasonb/
Даже если бы у меня была проблема, о [наличии которой из-за отсутствия (логика 80lvl)] которой вы упоминали, то не о ней ли эта цитата?
Это вполне хороший вариант для того, кто хочет зарабатывать и ищет для этого способ. На 200 в месяц при грамотной реализации потянет.
Так не дрогни, kakos007! :D
Тоже слышал о ней и тоже не видел лично. Было бы интересно посмотреть.
Как обычно. Есть вариант забросить и есть вариант решать проблемы по мере их поступления. Второй выглядит лучше, потому что первый - чистый декаданс.
На деньги от этого занятия надежд нет. Достаточно того, что улучшать генерацию мне временами бывает интереснее, чем смотреть какой-нибудь сериал или даже читать книгу. Преимуществ этих текстов в плане SEO тоже не предвидится, именно так.
Значит нужно уменьшить количество лотерей и действовать наверняка (ТРИЗ☝)
Как это сделать - отдельная тема.
Благодарю за консультацию, Халиф.
Вы многое прояснили.
Для этого есть такие вещи, как A/B тесты и селекция.
1. Генерируем два сайта с разными параметрами.
2. Смотрим результат.
3. Берем снимок состояния сети, которой был сгенерирован более успешный сайт и дообучаем ее двумя разными способами.
4. Повторяем, начиная с пункта 1.
Процесс долгий. Но если цели исследовательские, то спешить некуда.
А если есть куда спешить, то можно увеличить количество вариантов в итерации до 10-20.
Поисковики не так часто меняют фундаментальные критерии оценки, чтобы опередить этот метод.
Да и ради борьбы с несколькими дорами делать это не будет смысла.
Как я понял, изучая ваше учение, Гуру, лучше просветляться, чем грустить.
Поэтому взглянем на вещи в меру позитивно.
Значит, пришло время сформулировать желания/цели:
1. Сделать белый блог с генерированными текстами. Да такой, чтобы его было интересно читать, а люди говорили: "Вау! Вот так хрень, завернул интересно, что там еще понаписал...". Может быть книгу издать, всякое бывает. Даже книжки с Котом Саймона одно время были популярны.
2. Сделать пару дорвеев, чтобы посмотреть как это вообще работает. Если получится на этом заработать, отлично. Если нет, то тоже норм.
3. В хорошем случае сделать качественный продукт и продать его какому-нибудь стартапу. Не дешевле ПоршКайена, что вполне нормально для сумм корпоративных сделок.
Но может ли тот же Матрикснет правильно взвесить качество текстов
- от кожаного писателя и
- от хорошо оптимизированного генератора ?
Есть ли вероятность, что проще экпериментальным путем подобрать параметры, которые ценят ПС,
чем сочинять тексты традиционным способом?
Вот, совершенно другой kakos007, будто подменили. Грамотно и по существу.
При попытках повышения качества текста вычислительная сложность растет быстро.
Когда время генерации 1000 символов подойдет к минуте, если текст будет того стоить, можно внимательно пройтись по алгоритму и оптимизировать по максимуму. Но этого предела я пока не достиг. Еще есть небольшое пространство для экспериментов.
В любом случае спасибо за ответ, обращу большее внимание на эффективность вычислений.
Кто-то собирает корабли в бутылке, кто-то бегает с GoPro, кто-то играет в MMORPG.
Чем только не занимаются люди в свободное время, даже нейросетями для генерации текста.
А что тогда, 5 лет назад, стало основным препятствием, которое не позволило улучшить генерацию?
Твои слова и акцент на "гавне" показывают, что ты застрял где-то на анальной стадии развития по Фрейду.
Это не плохо лично для тебя, но все же тебе лучше уйти подальше от моей темы.
Кто знает, какими анальными вещами ты еще интересуешься.
Тебе здесь не рады, kakos007, уходи.
Это верные слова.
Как посмотреть. Это не литературный текст, но уже и не Марков.
В этом плане у Маркова есть преимущество - он сразу выдает достаточно согласованные и читаемые предложения.
Но сущность эксперимента в том, чтобы перейти на что-то новое. Логично, что многим первые результаты не понравятся.
Первый же сгенерированный текст.
Система еще не обучена по конкретной тематике.
Время генерации 12 секунд. 1702 буквы без пробелов и символов.