- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
можно серьезно погрустнеть или просветлиться 😎
Как я понял, изучая ваше учение, Гуру, лучше просветляться, чем грустить.
Поэтому взглянем на вещи в меру позитивно.
Основная "ваша" проблема, что вы даже не знаете на самом деле, что хотите получить.
Значит, пришло время сформулировать желания/цели:
1. Сделать белый блог с генерированными текстами. Да такой, чтобы его было интересно читать, а люди говорили: "Вау! Вот так хрень, завернул интересно, что там еще понаписал...". Может быть книгу издать, всякое бывает. Даже книжки с Котом Саймона одно время были популярны.
2. Сделать пару дорвеев, чтобы посмотреть как это вообще работает. Если получится на этом заработать, отлично. Если нет, то тоже норм.
3. В хорошем случае сделать качественный продукт и продать его какому-нибудь стартапу. Не дешевле ПоршКайена, что вполне нормально для сумм корпоративных сделок.
Информация к размышлению:
1. Не каждый текст способен написать даже рандомный "белковый" Вася
2. Поисковики быстро-решительно не одаривают манной небесной только лишь за факт, что тексты на сайте написаны "белковым" Васей
Но может ли тот же Матрикснет правильно взвесить качество текстов
- от кожаного писателя и
- от хорошо оптимизированного генератора ?
Есть ли вероятность, что проще экпериментальным путем подобрать параметры, которые ценят ПС,
чем сочинять тексты традиционным способом?
У поисковиков по-крайней мере есть метрика качества выдачи. А у тебя хоть какая-то метрика качества текста есть? Как ты определяешь что сегодня генеришь лучше чем вчера? Или что один текст лучше другого? На глазок? Каким образом тогда ты можешь что-то улучшать, если не понимаешь какой из двух текстов формально лучше.
У поисковиков по-крайней мере есть метрика качества выдачи. А у тебя хоть какая-то метрика качества текста есть? Как ты определяешь что сегодня генеришь лучше чем вчера? Или что один текст лучше другого? На глазок? Каким образом тогда ты можешь что-то улучшать, если не понимаешь какой из двух текстов формально лучше.
Для этого есть такие вещи, как A/B тесты и селекция.
1. Генерируем два сайта с разными параметрами.
2. Смотрим результат.
3. Берем снимок состояния сети, которой был сгенерирован более успешный сайт и дообучаем ее двумя разными способами.
4. Повторяем, начиная с пункта 1.
Процесс долгий. Но если цели исследовательские, то спешить некуда.
А если есть куда спешить, то можно увеличить количество вариантов в итерации до 10-20.
Поисковики не так часто меняют фундаментальные критерии оценки, чтобы опередить этот метод.
Да и ради борьбы с несколькими дорами делать это не будет смысла.
Ну ок, сгенерил два сайта. Один дает 2 уника дейли, второй 4 уника дейли, денег ноль и не предвидится. Через 3-4 неделю бан. Дальше что?
В общем я не отговариваю, играйтесь на здоровье, но с большей вероятностью денег на сео не заработается, а софт продавать не выйдет, т.к. по факту никаких преимуществ перед обычными "школьными" методами а-ля парсинг-мешанка не будет.
Если вы не можете формально поставить себе задачу и формально же верифицировать решили вы поставленную вами же задачу и насколько хорошо, а для этого используете третьего агента (поисковика), на которого матерятся белковые Васи, которые запилили сайты, а получили хер по губам, то это игра в лотерейку.
Ну ок, сгенерил два сайта. Один дает 2 уника дейли, второй 4 уника дейли, денег ноль и не предвидится. Через 3-4 неделю бан. Дальше что?
Как обычно. Есть вариант забросить и есть вариант решать проблемы по мере их поступления. Второй выглядит лучше, потому что первый - чистый декаданс.
с большей вероятностью денег на сео не заработается, а софт продавать не выйдет, т.к. по факту никаких преимуществ перед обычными "школьными" методами а-ля парсинг-мешанка не будет.
На деньги от этого занятия надежд нет. Достаточно того, что улучшать генерацию мне временами бывает интереснее, чем смотреть какой-нибудь сериал или даже читать книгу. Преимуществ этих текстов в плане SEO тоже не предвидится, именно так.
это игра в лотерейку.
Значит нужно уменьшить количество лотерей и действовать наверняка (ТРИЗ☝)
Как это сделать - отдельная тема.
Благодарю за консультацию, Халиф.
Вы многое прояснили.
Ну и так напоследок, ТРИЗ заточен под работу с веществом/полем и хорош, когда есть уже проблема. А у вас нет проблемы. Вы хотите сделать "красиво", но не понимаете, что значит "красиво".
Вот были смешные дурачки, которые дрочили на закон ципфа. Мудрецу понятно, что ципф - это хуета, дурачкам - нет, но у них хотя бы был ориентир куда стремиться.
Кто-то собирает корабли в бутылке, кто-то бегает с GoPro, кто-то играет в MMORPG.
Чем только не занимаются люди в свободное время, даже нейросетями для генерации текста.
А что тогда, 5 лет назад, стало основным препятствием, которое не позволило улучшить генерацию?
В основном то что на каждое небольшое улучшение результатов , требовалось всё больше и больше времени и ресурсов.
Если выражаться простыми словами ,и учесть уже текущие достижения - то для того чтобы в тексте из 5 предложений ,3 были более менее связанны и были похожи не на генерированный текст,а на текст ребёнка-имбицила - придется потратить (время потраченное на достижение текущих результов)*3
Хотя опять же все зависит от ровности рук и кода - чем я к сожалению гордится не могу.
Вообще если возникнет коммерческий интерес к теме - я бы рекомендовал смотреть в сторону синонимайзера .
К примеру можно ддосить post/get сервисы подбора синонимов и нейронкой выбирать самые человечные и читаемые варианты.
Из такого кода можно было бы выдавить пару сотен баксов на больших объемах.
"...прекидывается кротким, скромным, ласковым, бьёт на жалость падла, чтобы только выведать, где ты прячешь свой кусок. Дрогнешь, и пизда тебе и тваему заработку! Из этих нубов патом такие как Gamadril вырастают, сволочи!!"
---------- Добавлено 20.04.2017 в 08:16 ----------
Ну и так напоследок, ТРИЗ заточен под работу с веществом/полем и хорош, когда есть уже проблема. А у вас нет проблемы. Вы хотите сделать "красиво", но не понимаете, что значит "красиво".
Вот были смешные дурачки, которые дрочили на закон ципфа. Мудрецу понятно, что ципф - это хуета, дурачкам - нет, но у них хотя бы был ориентир куда стремиться.
Зря ты их просветляешь...
Занимаются ли нейросетями некие организованные группы программистов, обладающие мощным интеллектуальным, финансовым и аппаратным ресурсом? Уверен, что да, так как тема весьма перспективная.
если до сих пор даже коллективы программистов не смогли создать ничего годного, то для одиночки, ограниченного в ресурсах, это и подавно не под силу. То есть на текущем уровне задача генерации текстов сносного качества при помощи самообучающихся нейросетей неразрешима, ИМХО.
В буржсегменте уже есть нормальная нейронка (для доров). Но проблема со скоростями. Нерентабельно пока выходит.
Adrian2012, а есть пруф?