Небольшой опрос. Идеальный дорген/генератор сайтов/лендингов etc

Adrian2012
На сайте с 29.11.2012
Offline
127
#91
J-ran:
Вряд ли эта задача пока реализуема. Ровно полторы секунды нужно, чтобы отличить генерёнку от текста, написанного человеком, пусть даже и не мастером слова.

Может лучше тебе посмотреть в сторону качественного онлайн-сервиса размножения текстов? Типа зашел, заплатил за 1000 копий с уникальностью 96% при шингле 4, закинул исходник, скачал файлик с готовыми текстами.

Если на выходе будет получаться вменяемый текст, хоть слегка соответствующий уровню школьного сочинения 7-8 класса, то спрос будет дикий. Но здесь нужно в команде работать, конечно. У людей есть годами отобранные библиотеки адекватных синонимов, нужно их подключать. Самому собирать и отсеивать фекалии - годы уйдут.

для организации такого сервиса достаточно внятного словаря синонимов.

А такого словаря, несмотря на модность фриланса, копирайтинга, дорвееводства, в рунете до сих пор еще не выродили. Хотя пытались еще лет 10 назад...

какая там нейросеть...окститесь....

З/Ы. О чем я собсвтенно говорю - даже в Буржнете такого нет.

AESCBC192
На сайте с 11.06.2016
Offline
51
#92

Синонимы не подходят для решения этой задачи, проверено уже не раз. Попробую свой вариант, если получится что-либо толковое покажу результат.

Нейросеть для получения и организации данных уже давно используется, и каждый хотябы раз сталкивался с результатами такой обработки, правда это используется на довольно высоком уровне.

bolyk
На сайте с 16.02.2006
Offline
175
#93
Adrian2012:
для организации такого сервиса достаточно внятного словаря синонимов.
А такого словаря, несмотря на модность фриланса, копирайтинга, дорвееводства, в рунете до сих пор еще не выродили. Хотя пытались еще лет 10 назад...

какая там нейросеть...окститесь....


З/Ы. О чем я собсвтенно говорю - даже в Буржнете такого нет.

Просто поверьте на слово, даже самого толкового словаря не хватит 😂 Морфология(по Церберу) тоже, легко определяется. Сниппеты, мешанина ключевых слов, Марков и стыковки по запятым... Все это определяется довольно успешно.

Прошу не принимать как конкуренцию, просто самому интересны эти темы.

Thunder v3. Дорген (http://ifirestarter.ru/product/10) | MassSiteProxy. Скрипт клонирования сайтов (http://ifirestarter.ru/product/12) | CPAgen CPA дорген (http://ifirestarter.ru/product/14) | (http://fast-index.ru/article)
AESCBC192
На сайте с 11.06.2016
Offline
51
#94
bolyk:
Сниппеты, мешанина ключевых слов, Марков и стыковки по запятым

Марков - третье лишнее, модель дерева фазовых состояний, близок к нейронкам по концепции, но не во всех вариантах реализации и менее гибкий алгоритм, частный случай нейронки.

Сниппет - второй лишний)) зависит от того каким алго генерирует поисковик сниппет, но чаще - да, обычный копипаст тайтл+часть 1го предложения.

Adrian2012
На сайте с 29.11.2012
Offline
127
#95
bolyk:
Просто поверьте на слово, даже самого толкового словаря не хватит 😂 Морфология(по Церберу) тоже, легко определяется. Сниппеты, мешанина ключевых слов, Марков и стыковки по запятым... Все это определяется довольно успешно.

Прошу не принимать как конкуренцию, просто самому интересны эти темы.

Ну допустим...чисто теоретически...взять одну узкую тематику. Посадить два десятка филологов на зарплату. За годик они что-нибудь да навояют...чисто теоретически🙄

AESCBC192
На сайте с 11.06.2016
Offline
51
#96
Adrian2012:
два десятка филологов на зарплату

в команде с матаналитиками составят морфограматический корпус языка - 3-10% решения задачи.

J-ran
На сайте с 24.06.2012
Offline
262
#97
AESCBC192:
Вот как раз размножение и синонимайз палится алгоритмами, даже знаю как и по какому признаку, можно годами собирать базу, спалит все равно.

Х-м-м, вот сейчас я закину тебе в личку четыре ссылки из Гугл-Ньюс. Там четыре новости об одном событии на разных сайтах. Имеет место быть и размножение, и щадящий синонимайз. Это всё ветви одного дерева. Такие сайты живут годами, а это Гугл-Ньюс - не хухры-мухры...

Adrian2012
На сайте с 29.11.2012
Offline
127
#98

потертопотертопотертопотертосиськипотертопотерто

AESCBC192
На сайте с 11.06.2016
Offline
51
#99
J-ran:
четыре ссылки из Гугл-Ньюс

на новостях другие алго у поисковика, синонимайз частный случай рерайта, рерайт - это морфосемантическая замена, это разные уровни одной нейронки, но приимер будет полезен.

Тот же алго может работать на однотипных описаниях товаров.

---------- Добавлено 06.09.2016 в 22:19 ----------

Второй момент, техновости - очень низкоабстрактный текст, его алгоритмику можно формализовать практически линейными описаниями вида замена A->B.

В сложной текстовке, где что-либо описывается или идет рассказ про что-то относительно новое такой алгоритмикой генерировать не получится.

J-ran
На сайте с 24.06.2012
Offline
262
#100
AESCBC192:
техновости - очень низкоабстрактный текст

Это был просто пример. А вообще там на ура размножаются новости от культуры и до политики.

AESCBC192:
идет рассказ про что-то относительно новое такой алгоритмикой генерировать не получится

Это и не всякий человек-то сможет написать 😂

По моему скромному мнению, добротное размножение на голову выше любой генерации, всех этих цепей Маркова, стыковки по запятым, мешанки из предложений и пр. У меня сотни доров на размноженных текстах, некоторые ушли жить на второй год. Дропаю не из-за бана, а из-за потери актуальности, так как они очень узконишевые. Да, они не банятся, а медленно умирают (постепенное выщёлкивание страниц из индекса) из-за никудышних ПФ. Но мне не выгодны хорошие ПФ внутри сайта, так как они снижают конверсию 🙄

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий