200Online

200Online
Рейтинг
86
Регистрация
22.01.2017
Lastwarrior:
И еще важно знать в какой системе координат ты находишься, чтобы понять откуда плясать, иначе движение к заветной цели будет долгим, а иногда и вообще невозможным.

Согласен. Классическая установка: "Где находимся? и Куда наступать?".

Особенно если добавить морозовское "Стратегический подход – это выделение главного в ущерб второстепенному".

Поэтому, Lastwarrior, появляется вопрос. Что главнее в генерации текста?

- читаемость,

- соответствие неким метрикам или

- индексируемость и хорошая ранжируемость ПС?

Или, может быть что-то другое?

Lastwarrior:
Тоже хотелось бы посмотреть насколько хороши алгоритмы, как их можно приспособить под ру сегмент и почему дорого даже под бурж.

Встречается такая статья

http://machinelearningmastery.com/text-generation-lstm-recurrent-neural-networks-python-keras/

возможно, это работающий вариант. И на хабре на днях была статья про Keras. Инструмент в тренде.

Разворачивать нет смысла - конкретно этот алгоритм, с примером из статьи, очень слабый.

The generated text with the seed (cleaned up for presentation) was :
herself lying on the bank, with her
head in the lap of her sister, who was gently brushing away
so siee, and she sabbit said to herself and the sabbit said to herself and the sood
way of the was a little that she was a little lad good to the garden,
and the sood of the mock turtle said to herself, 'it was a little that
the mock turtle said to see it said to sea it said to sea it say it

У этого автора есть новые статьи по теме, но хорошего готового решения я не нашел.

http://machinelearningmastery.com/author/jasonb/

NumNum:
ТРИЗ заточен под работу с веществом/полем и хорош, когда есть уже проблема. А у вас нет проблемы. Вы хотите сделать "красиво", но не понимаете, что значит "красиво".

Даже если бы у меня была проблема, о [наличии которой из-за отсутствия (логика 80lvl)] которой вы упоминали, то не о ней ли эта цитата?

ТРИЗ выделяет 3 вида противоречий (в порядке возрастания сложности разрешения):
административное противоречие: «надо улучшить систему, но я не знаю как (не умею, не имею права) сделать это». Это противоречие является самым слабым и может быть снято либо изучением дополнительных материалов, либо принятием административных решений.
pars:
Вообще если возникнет коммерческий интерес к теме - я бы рекомендовал смотреть в сторону синонимайзера. Из такого кода можно было бы выдавить пару сотен баксов на больших объемах.

Это вполне хороший вариант для того, кто хочет зарабатывать и ищет для этого способ. На 200 в месяц при грамотной реализации потянет.

kakos007:
"...прекидывается кротким, скромным, ласковым, бьёт на жалость падла, чтобы только выведать, где ты прячешь свой кусок. Дрогнешь, и пизда тебе и тваему заработку! Из этих нубов патом такие как Gamadril вырастают, сволочи!!"

Так не дрогни, kakos007! :D

Adrian2012:
В буржсегменте уже есть нормальная нейронка

Тоже слышал о ней и тоже не видел лично. Было бы интересно посмотреть.

NumNum:
Ну ок, сгенерил два сайта. Один дает 2 уника дейли, второй 4 уника дейли, денег ноль и не предвидится. Через 3-4 неделю бан. Дальше что?

Как обычно. Есть вариант забросить и есть вариант решать проблемы по мере их поступления. Второй выглядит лучше, потому что первый - чистый декаданс.

NumNum:
с большей вероятностью денег на сео не заработается, а софт продавать не выйдет, т.к. по факту никаких преимуществ перед обычными "школьными" методами а-ля парсинг-мешанка не будет.

На деньги от этого занятия надежд нет. Достаточно того, что улучшать генерацию мне временами бывает интереснее, чем смотреть какой-нибудь сериал или даже читать книгу. Преимуществ этих текстов в плане SEO тоже не предвидится, именно так.

NumNum:
это игра в лотерейку.

Значит нужно уменьшить количество лотерей и действовать наверняка (ТРИЗ☝)

Как это сделать - отдельная тема.

Благодарю за консультацию, Халиф.

Вы многое прояснили.

NumNum:
У поисковиков по-крайней мере есть метрика качества выдачи. А у тебя хоть какая-то метрика качества текста есть? Как ты определяешь что сегодня генеришь лучше чем вчера? Или что один текст лучше другого? На глазок? Каким образом тогда ты можешь что-то улучшать, если не понимаешь какой из двух текстов формально лучше.

Для этого есть такие вещи, как A/B тесты и селекция.

1. Генерируем два сайта с разными параметрами.

2. Смотрим результат.

3. Берем снимок состояния сети, которой был сгенерирован более успешный сайт и дообучаем ее двумя разными способами.

4. Повторяем, начиная с пункта 1.

Процесс долгий. Но если цели исследовательские, то спешить некуда.

А если есть куда спешить, то можно увеличить количество вариантов в итерации до 10-20.

Поисковики не так часто меняют фундаментальные критерии оценки, чтобы опередить этот метод.

Да и ради борьбы с несколькими дорами делать это не будет смысла.

NumNum:
можно серьезно погрустнеть или просветлиться 😎

Как я понял, изучая ваше учение, Гуру, лучше просветляться, чем грустить.

Поэтому взглянем на вещи в меру позитивно.

NumNum:
Основная "ваша" проблема, что вы даже не знаете на самом деле, что хотите получить.

Значит, пришло время сформулировать желания/цели:

1. Сделать белый блог с генерированными текстами. Да такой, чтобы его было интересно читать, а люди говорили: "Вау! Вот так хрень, завернул интересно, что там еще понаписал...". Может быть книгу издать, всякое бывает. Даже книжки с Котом Саймона одно время были популярны.

2. Сделать пару дорвеев, чтобы посмотреть как это вообще работает. Если получится на этом заработать, отлично. Если нет, то тоже норм.

3. В хорошем случае сделать качественный продукт и продать его какому-нибудь стартапу. Не дешевле ПоршКайена, что вполне нормально для сумм корпоративных сделок.

NumNum:

Информация к размышлению:
1. Не каждый текст способен написать даже рандомный "белковый" Вася
2. Поисковики быстро-решительно не одаривают манной небесной только лишь за факт, что тексты на сайте написаны "белковым" Васей

Но может ли тот же Матрикснет правильно взвесить качество текстов

- от кожаного писателя и

- от хорошо оптимизированного генератора ?

Есть ли вероятность, что проще экпериментальным путем подобрать параметры, которые ценят ПС,

чем сочинять тексты традиционным способом?

kakos007:
Лично у меня, тогда все уперлось в мощность процессора. Пришлось забросить.

Вот, совершенно другой kakos007, будто подменили. Грамотно и по существу.

При попытках повышения качества текста вычислительная сложность растет быстро.

Когда время генерации 1000 символов подойдет к минуте, если текст будет того стоить, можно внимательно пройтись по алгоритму и оптимизировать по максимуму. Но этого предела я пока не достиг. Еще есть небольшое пространство для экспериментов.

В любом случае спасибо за ответ, обращу большее внимание на эффективность вычислений.

pars:
Занимался я подобной "ересью" около 5 лет назад и на выходе получался подобный текст - это было время потраченное в некуда и которое уже никогда не вернешь .

Кто-то собирает корабли в бутылке, кто-то бегает с GoPro, кто-то играет в MMORPG.

Чем только не занимаются люди в свободное время, даже нейросетями для генерации текста.

А что тогда, 5 лет назад, стало основным препятствием, которое не позволило улучшить генерацию?

kakos007:
То, что ты делаешь - гавно, как оно есть. Если надо переходить на новое, то переходи, но не занимайся х...

Твои слова и акцент на "гавне" показывают, что ты застрял где-то на анальной стадии развития по Фрейду.

Это не плохо лично для тебя, но все же тебе лучше уйти подальше от моей темы.

Кто знает, какими анальными вещами ты еще интересуешься.

Тебе здесь не рады, kakos007, уходи.

plattoo:
не хами взрослым, мальчишка!

Это верные слова.

kakos007:
Жесть. Уже давно пора понять...

Как посмотреть. Это не литературный текст, но уже и не Марков.

В этом плане у Маркова есть преимущество - он сразу выдает достаточно согласованные и читаемые предложения.

Но сущность эксперимента в том, чтобы перейти на что-то новое. Логично, что многим первые результаты не понравятся.

extruder:
Давай пример текста.

Первый же сгенерированный текст.

Система еще не обучена по конкретной тематике.


[title] => Люди очень важный момент времени, скорее бухгалтерской работой своей жизни.

[slug] => lyudi-ochen-vazhnyj-moment-vremeni-skoree

[description] => Никаких пределов тому времени, сколько сообщений должно ставить своей жизни из сказанного нет меня есть. Точно нет, или машину времени, кажется ещё забавнее. В течение продолжительного периода времени, тот текст своей жизни, ваш образ мыслей сделал этот момент.

[text] => <p>Дизайн сайта перевалило за последние больше мы живем. Из них оказывается ложной, это ведет вверх, к финансовому успеху не наделены большими талантами, которые они в отношениях. Одним единственным примером для практических целей, должно быть. Другими местными предпринимателями, предлагают решить, сколько тем очевиднее движение к успеху. Следите за этот анекдот в любом более-менее примерно определить рынок новый товар это именно миф, на них. Очень незаметны. Ок, мне, по-вашему, придётся изменить которые вы смешиваете в каких единицах. Те, у каждого богача нехорошее слово написать программу или ваш текст никуда я сделал следующее. Ты ищешь ответ на всех больше, чем отличных возможностей.</p>

<p>Один момент их жизни маленьких сроков заставит вас давление. Подумайте об этом таким грузом мы ждали великого и затем выбрав самую насыщенную приключениями жизнь будет идти. Многие ли вкладчики знают, тем значительнее воспринимается всерьез, а паевой фонд. Тот сегмент рынка и навыков выше только не впереди, а помогает вам все упростят, поскольку электроэнергия становится с вашими клиентами часа на электричке. Дело и тому есть определённые причины, отвечающие на том свете существуют некоторые известные консольные, такие ставки удвоения, суммы, которые с новой газеты. Дело, произнес он, деланно зевая. Итак, это именно их уже ждал накрытый стол там, где происходят каждый день.</p>

<p>Это кажется ещё забавнее, если вы даже став примером, а мышлением, направленным на успех. Уверяю вас ни в течение длительного времени. Скорее бухгалтерской работой, но кого-то сокращают, так увлекает меня. Перед ними из своей жизни, будь то, чего страшишься, тем, как действовать по вере, а какой-то солидный гражданин громким шёпотом сказал прервитесь, послушайте. Ты выходишь и умным человеком, магически притягивающим успех. Об общественно полезной, и не избежал бы через год-два.</p>

<p>Это возможно, один мужчина не обучены плохо, или просто убоги. Нет, докажите себе, во-вторых, чтобы увидеть, где возникают проблемы. Каждый сможет воздать каждому по вере его. Важный сейчас об игре, съеме, многое связано, и раскрывает свои секреты. Именно безупречным воплощением в таком случае она мне дают какие-то нереально высокие проценты.</p>

[keywords] => плохо, зевая, вере, раскрывает, определить, выходишь, по-вашему, успеху, самую, притягивающим, громким, происходят, накрытый, анекдот

Время генерации 12 секунд. 1702 буквы без пробелов и символов.

Всего: 515