Эксперимент с индексацией автонаполненного сайта

200Online
На сайте с 22.01.2017
Offline
86
#51
NumNum:
можно серьезно погрустнеть или просветлиться 😎

Как я понял, изучая ваше учение, Гуру, лучше просветляться, чем грустить.

Поэтому взглянем на вещи в меру позитивно.

NumNum:
Основная "ваша" проблема, что вы даже не знаете на самом деле, что хотите получить.

Значит, пришло время сформулировать желания/цели:

1. Сделать белый блог с генерированными текстами. Да такой, чтобы его было интересно читать, а люди говорили: "Вау! Вот так хрень, завернул интересно, что там еще понаписал...". Может быть книгу издать, всякое бывает. Даже книжки с Котом Саймона одно время были популярны.

2. Сделать пару дорвеев, чтобы посмотреть как это вообще работает. Если получится на этом заработать, отлично. Если нет, то тоже норм.

3. В хорошем случае сделать качественный продукт и продать его какому-нибудь стартапу. Не дешевле ПоршКайена, что вполне нормально для сумм корпоративных сделок.

NumNum:

Информация к размышлению:
1. Не каждый текст способен написать даже рандомный "белковый" Вася
2. Поисковики быстро-решительно не одаривают манной небесной только лишь за факт, что тексты на сайте написаны "белковым" Васей

Но может ли тот же Матрикснет правильно взвесить качество текстов

- от кожаного писателя и

- от хорошо оптимизированного генератора ?

Есть ли вероятность, что проще экпериментальным путем подобрать параметры, которые ценят ПС,

чем сочинять тексты традиционным способом?

NumNum
На сайте с 06.01.2014
Offline
81
#52

У поисковиков по-крайней мере есть метрика качества выдачи. А у тебя хоть какая-то метрика качества текста есть? Как ты определяешь что сегодня генеришь лучше чем вчера? Или что один текст лучше другого? На глазок? Каким образом тогда ты можешь что-то улучшать, если не понимаешь какой из двух текстов формально лучше.

DorKhal Consulting Group. Дорвейный инжиниринг и девелопмент, комплексный консалтинг.
200Online
На сайте с 22.01.2017
Offline
86
#53
NumNum:
У поисковиков по-крайней мере есть метрика качества выдачи. А у тебя хоть какая-то метрика качества текста есть? Как ты определяешь что сегодня генеришь лучше чем вчера? Или что один текст лучше другого? На глазок? Каким образом тогда ты можешь что-то улучшать, если не понимаешь какой из двух текстов формально лучше.

Для этого есть такие вещи, как A/B тесты и селекция.

1. Генерируем два сайта с разными параметрами.

2. Смотрим результат.

3. Берем снимок состояния сети, которой был сгенерирован более успешный сайт и дообучаем ее двумя разными способами.

4. Повторяем, начиная с пункта 1.

Процесс долгий. Но если цели исследовательские, то спешить некуда.

А если есть куда спешить, то можно увеличить количество вариантов в итерации до 10-20.

Поисковики не так часто меняют фундаментальные критерии оценки, чтобы опередить этот метод.

Да и ради борьбы с несколькими дорами делать это не будет смысла.

NumNum
На сайте с 06.01.2014
Offline
81
#54

Ну ок, сгенерил два сайта. Один дает 2 уника дейли, второй 4 уника дейли, денег ноль и не предвидится. Через 3-4 неделю бан. Дальше что?

В общем я не отговариваю, играйтесь на здоровье, но с большей вероятностью денег на сео не заработается, а софт продавать не выйдет, т.к. по факту никаких преимуществ перед обычными "школьными" методами а-ля парсинг-мешанка не будет.

Если вы не можете формально поставить себе задачу и формально же верифицировать решили вы поставленную вами же задачу и насколько хорошо, а для этого используете третьего агента (поисковика), на которого матерятся белковые Васи, которые запилили сайты, а получили хер по губам, то это игра в лотерейку.

200Online
На сайте с 22.01.2017
Offline
86
#55
NumNum:
Ну ок, сгенерил два сайта. Один дает 2 уника дейли, второй 4 уника дейли, денег ноль и не предвидится. Через 3-4 неделю бан. Дальше что?

Как обычно. Есть вариант забросить и есть вариант решать проблемы по мере их поступления. Второй выглядит лучше, потому что первый - чистый декаданс.

NumNum:
с большей вероятностью денег на сео не заработается, а софт продавать не выйдет, т.к. по факту никаких преимуществ перед обычными "школьными" методами а-ля парсинг-мешанка не будет.

На деньги от этого занятия надежд нет. Достаточно того, что улучшать генерацию мне временами бывает интереснее, чем смотреть какой-нибудь сериал или даже читать книгу. Преимуществ этих текстов в плане SEO тоже не предвидится, именно так.

NumNum:
это игра в лотерейку.

Значит нужно уменьшить количество лотерей и действовать наверняка (ТРИЗ☝)

Как это сделать - отдельная тема.

Благодарю за консультацию, Халиф.

Вы многое прояснили.

NumNum
На сайте с 06.01.2014
Offline
81
#56

Ну и так напоследок, ТРИЗ заточен под работу с веществом/полем и хорош, когда есть уже проблема. А у вас нет проблемы. Вы хотите сделать "красиво", но не понимаете, что значит "красиво".

Вот были смешные дурачки, которые дрочили на закон ципфа. Мудрецу понятно, что ципф - это хуета, дурачкам - нет, но у них хотя бы был ориентир куда стремиться.

P
На сайте с 05.10.2016
Offline
16
#57
200Online:
Кто-то собирает корабли в бутылке, кто-то бегает с GoPro, кто-то играет в MMORPG.
Чем только не занимаются люди в свободное время, даже нейросетями для генерации текста.

А что тогда, 5 лет назад, стало основным препятствием, которое не позволило улучшить генерацию?

В основном то что на каждое небольшое улучшение результатов , требовалось всё больше и больше времени и ресурсов.

Если выражаться простыми словами ,и учесть уже текущие достижения - то для того чтобы в тексте из 5 предложений ,3 были более менее связанны и были похожи не на генерированный текст,а на текст ребёнка-имбицила - придется потратить (время потраченное на достижение текущих результов)*3

Хотя опять же все зависит от ровности рук и кода - чем я к сожалению гордится не могу.

Вообще если возникнет коммерческий интерес к теме - я бы рекомендовал смотреть в сторону синонимайзера .

К примеру можно ддосить post/get сервисы подбора синонимов и нейронкой выбирать самые человечные и читаемые варианты.

Из такого кода можно было бы выдавить пару сотен баксов на больших объемах.

kakos007
На сайте с 21.09.2015
Offline
47
#58

"...прекидывается кротким, скромным, ласковым, бьёт на жалость падла, чтобы только выведать, где ты прячешь свой кусок. Дрогнешь, и пизда тебе и тваему заработку! Из этих нубов патом такие как Gamadril вырастают, сволочи!!"

---------- Добавлено 20.04.2017 в 08:16 ----------

NumNum:
Ну и так напоследок, ТРИЗ заточен под работу с веществом/полем и хорош, когда есть уже проблема. А у вас нет проблемы. Вы хотите сделать "красиво", но не понимаете, что значит "красиво".

Вот были смешные дурачки, которые дрочили на закон ципфа. Мудрецу понятно, что ципф - это хуета, дурачкам - нет, но у них хотя бы был ориентир куда стремиться.

Зря ты их просветляешь...

Adrian2012
На сайте с 29.11.2012
Offline
127
#59
J-ran:


Занимаются ли нейросетями некие организованные группы программистов, обладающие мощным интеллектуальным, финансовым и аппаратным ресурсом? Уверен, что да, так как тема весьма перспективная.
J-ran:
если до сих пор даже коллективы программистов не смогли создать ничего годного, то для одиночки, ограниченного в ресурсах, это и подавно не под силу. То есть на текущем уровне задача генерации текстов сносного качества при помощи самообучающихся нейросетей неразрешима, ИМХО.

В буржсегменте уже есть нормальная нейронка (для доров). Но проблема со скоростями. Нерентабельно пока выходит.

R
На сайте с 02.02.2014
Offline
83
#60

Adrian2012, а есть пруф?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий