Сдлген

strukoff
На сайте с 13.03.2008
Offline
101
#11
TopperHarley:
нынче доргены и такое умеют. нужны макросы вероятной вставки и макросы гармошки {||||}

Ну это тоже верно, но опять же под каждый дор придется делать кучу ксс для различного вида случайных объектов, таких как цитаты, полезная информация, термины, ну и прочая лабуда, которая уникализирует структуры (я хочу чтоб это действительно выглядело хорошо). Грубо говоря подобную фиху можно уже сразу вставить в генератор, а пользоваться только гармошками и рандомом это через чур геморно. Кагюэ вот это действие надо автоматизировать.

Bartezz
На сайте с 20.08.2009
Offline
69
#12
TopperHarley:
Сразу при этом программа должна отсеивать генерируемые тексты. Отличить генерируемый текст от нормального можно, если учесть статистические показатели нормального текста. Для этого нужно прогнать 1000 образцовых документов или десяток разных художественных книжек через простую программу, которая соберет статистику трехсловников. Это всего лишь 1 критерий, но их можно взять, например, десяток. Этот алогритм можно протестить и собранную статистику применять, чтобы отличать генерируемый текст от человеческого.

отличить генерируемы текст от рукописного простой программой? эх лихо то как, вы случаем не Циолковский? Или может Тесла? Или все куда проще, вы скромный Эйнштейн?

TopperHarley:
я ж почти ТЗ написал.

где-то года 3 назад на фрилансе столкнулся я с одним ТЗ. Там предлагалось написать простую программу, которая умеет думать, что именно она должна была делать кроме как думать, я честно сказать не вспомню, но вот фразы из ТЗ я запомнил:

"даешь программе тексты, картинки, фотки, программа сначала смотрит на них, потом думает, размышляет, рассчитывает возможные варианты, потом начинает работать...".

Solo_by
На сайте с 19.06.2009
Offline
220
#13
Bartezz:
простой

ну это ж кому как, вам показалась сложной?)

..грубую генерацию вычислить не так уж и сложно

akaplenko
На сайте с 09.09.2009
Offline
48
#14
Bartezz:
отличить генерируемы текст от рукописного простой программой? эх лихо то как, вы случаем не Циолковский? Или может Тесла? Или все куда проще, вы скромный Эйнштейн?

+1

10 символов

S
На сайте с 29.01.2006
Offline
404
#15
Но как сделать парсенный копипаст полезным для людей?

В буржуазии есть как минимум 2 организации, которые продают книги из парсенного копипаста. Но там на английском языке, т.е. гораздо меньше проблем с формами слов. Книжки, собранные из Википедии, стоят бешеных денег, а их "авторы" называют себя крупнейшим академическим издательством.

Solo_by
На сайте с 19.06.2009
Offline
220
#16

Парсенный контент сделать полезным для людей, и безопастным для ПС очень просто. Нужно правильно его структурировать.

akaplenko
На сайте с 09.09.2009
Offline
48
#17
strukoff:
У меня вообще была когда то идея собрать (но к сожалению нет рук, а если есть то они всегда заняты чем то другим) генератор который бы делал сайт (доры, СДЛы, как хотите вообще называйте) не однородные по структуре. Т.е. со встроенным генератором шаблонов и т.п., и так чтобы 1 страница 3-го уровня могла отличаться от другой по структуре. Короче имитацию СДЛов в плане верстки.
П.С. человек тоже своего рода машина, и человеки в 99% случаев работают по аналогии, этому всему можно и робота научить, но каши надо съесть немало.

Ничего сложного в этом нет. Вот пример: http://sclub.call-gerls.ru/ :-)

Bartezz
На сайте с 20.08.2009
Offline
69
#18
Solo_by:
ну это ж кому как, вам показалась сложной?)
..грубую генерацию вычислить не так уж и сложно

я даже не представляю насколько грубую генерацию простой программой можно отличить, вы, как мне кажется, даже не представляете сколько мелких ньюансов всплывет при попытке написать даже простую программу.

akaplenko
На сайте с 09.09.2009
Offline
48
#19
Bartezz:
вы, как мне кажется, даже не представляете сколько мелких ньюансов всплывет при попытке написать даже простую программу.

еще раз +1 получается :-)

L!mur
На сайте с 26.06.2006
Offline
176
#20
akaplenko:
Ничего сложного в этом нет. Вот пример: http://sclub.call-gerls.ru/ :-)

ты чего такие примеры доров палишь?

у парнишки из этого топика инфаркт случится от того до чего дошли доргены 😂

10'000 руб/сутки на SEDv4 «MobyDick»! (/ru/forum/comment/12653555) Нужен трафик? Купи «SED» (http://www.sedv4.ru) 5'000 руб/сутки на SEDv3 (/ru/forum/comment/11641425) Для работы с Twitter только TwiFarmv3! (/ru/forum/839117)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий