Не пойму в чем кидалово

AX
На сайте с 17.02.2008
Offline
32
642

Товаресчи, кто и что знает про сцылко?

Кому лень смотреть, это про генерацию тыщи тыщ статей из одной сиротинушки:) за 25-40$

Там и отзывы вроде хорошие, но как-то непонятно, что мешает добрым самаритянам нагенерить мильйон мильйонов статей и сливать их в биржу статей какую нить.

По простым подсчетам, продавая 100 статей на 5к символов за 0,5$ (чтоб раскупалась быстрее) можно получить 50$, а тут продается 1000 за 40.

В чем прикол?

[Удален]
#1

Так тут именно генерация статей. Т.е. человек может по стилистике написания статьи отличить кем написана статья: человеком или программой. А на биржах люди покупают более или менее нормальные читабельные статьи, несущие хоть какую-то информацию.

Даже если сгенерированную статью редактировать, приводить в "человеческий вид", то эта процедура будет занимать время. Да и ощущение, что статья программой написана всё равно будет оставаться. И владельцы бирж, скорее всего заботятся о качестве материала, который у них выставляется на бирже. Но я могу и ошибаться.

Слава Шевцов
На сайте с 23.07.2005
Offline
370
#2

AntraX, а Вы попробуйте...

Неизменность точки зрения неизменно порождает иллюзию понимания.
AX
На сайте с 17.02.2008
Offline
32
#3
человек может по стилистике написания статьи отличить кем написана статья: человеком или программой. А на биржах люди покупают более или менее нормальные читабельные статьи, несущие хоть какую-то информацию.

На вид полученные статьи конечно не шик-модерн, но очень даже ничего. Расширить базу синонимов, улучшить алгоритм, и дело в шляпе.

AntraX, а Вы попробуйте...

Я бы и попробовал, но, во-первых, не я владелец этой программы, а во-вторых, банально не хватит опыта:(

JK
На сайте с 03.02.2008
Offline
46
#4

Ответ:"Робот" пока не переплёвывает человека / по крайней мере в русском/

Сам , вроде с 2 высшими + ещё ,столкнулся с обьяснениями товарищам рерайтам, но согласен с следующими утверждениями:

Собственно, по итогам собственных изысканий у меня сложилось четкое впечатление, что разработка «хоть как-то работающей и делающей свое дело, пусть не идеально» системы, обеспечивающей анализ неструктурированной текстовой базы не предполагает особой квалификации, поскольку не содержит никаких особенных алгоритмов.

Когда заходит речь о том, что ммм… назовем это «корректность обработки» (да, я знаю, совсем ненаучно) должна быть на уровне 60-70%. А это значит, операций сложнее арифметики, можно сказать и нет (ага, это камень в огород старых нейросетевых систем).

Даже морфология не нужна (хватает стемминга или даже подобия на основе чисто формального сходства слов, «дешевой морфологии»). Когда требуется качество обработки на уровне 70--80% — там уже принципиально важна нормальная морфология (как минимум — нормализация).

А вот после 90% начинаются специальные алгоритмы, особенно на «незнакомой» системе текстовой базе, после 96-98% — это уже уровень докторских диссертаций, если не Нобелевских премий (если таковые выдаются за достижения в области анализа естественного языка).

С Уважением Олег /на 3000 рерайтовских статьях слоников поднаел/🚬

Майнинг.
freedz
На сайте с 16.04.2007
Offline
115
#5

JORK, Мало чего понял из написанного вами:) Какой-то уж очень сложный язык, видимо у вас 2 технических образования:)

Что значит "статьи сходны на 50%"? По какому алгоритму определяется сходство?

Vestalka
На сайте с 24.07.2007
Offline
74
#6

Статья может быть либо "сходная", либо уникальная.

Фраза "статья уникальна на 50 процентов" меня улыбает.

как осетрина второй свежести.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий