Каким пользуетесь методом генерации текста?

alexandr_nv
На сайте с 23.04.2009
Offline
39
1851

Решил создать флеймо-тему... Для тех, кто юзает RedButton.

Собственно, в RedButton есть 2 варианта генерации текста: маркса (в поле "Алгоритм генерации текста" он называется "Офигенный") и маркова ("стандартный"). Алгоритмы совсем разные. Если коротко, то маркс - генерирует новое предложение путем склеивания частей других (исходных) предложений.

Марков - каждое слово в новом предложении вставляется по вероятности его нахождения перед предыдущим вставленным словом в исходном тексте.

По идее, алгоритм маркова должен быть лучше. Я раньше всегда использовал "офигенный" (маркса) алгоритм, т.к. не вдавался в детали, как этот алгоритм работает. А сейчас стало интересно, чем пользуются другие.

По субъективной оценке, в РБ маркс генерирует более читаемый текст. (т.к. подряд идут 4 слова из одного предложения, затем 4 слова из другого и т.д. - то есть "несвязка" ("бредосмысл") происходит на стыке этих частей).

Чем пользуетесь вы?

blek+++
На сайте с 16.01.2009
Offline
72
#1

Тема интересная, тоже бы хотел посмотреть что скажут другие, я использовал "офигенную" генерацию текста, а читабельность ставил среднюю. Кстати хотелось бы узнать как работает читабельность, и какую лучше ставить.

Бесплатно или в благотворительных целях (/ru/forum/comment/6094606) прогоню ваш сайт по соц. закладкам. 70 сервисов соц. закладок. 700+ ссылок на ваш сайт.
alexandr_nv
На сайте с 23.04.2009
Offline
39
#2
blek+++:
Кстати хотелось бы узнать как работает читабельность, и какую лучше ставить.

Читабельность в марксе - это количество слов, которые берутся из исходного предложения.

"Зато уникальный текст" - 1 слово

"Хм... Ну не плохая" - 2 слова

"Хорошая" - 3 слова

"Отличная" - 4 слова

"Офигенная" - 5 слов.

К примеру, есть исходное предложение "Сегодня очень солнечная и теплая погода". Если стоит "офигенная" - то берется 5 слов (Сегодня очень солнечная и теплая) и дальше склеивается с пятью словами другого предложения (только уже начиная не с первого, а со второго слова).

Если "отличная" - то берется 4 слова (Сегодня очень солнечная и) и также склеивается со следующим.

То есть, чем больше слов - тем выше читабельность текста, но уникальность текста меньше. Чем меньше слов - тем бредовей получается текст, т.к. слова будут не связаны между собой, но зато уникальный.

Что лучше - сказать не могу, не знаю. Раньше пробовал и "Зато уникальный текст" и "Офигенная" - субъективно, разницы не заметил (но и эксперементировал не много)

alexandr_nv добавил 19.12.2009 в 12:18

Люди, не молчим. Высказываемся по теме.

ciber
На сайте с 04.01.2008
Offline
215
#3

да пофигу вообще. Яша кушает(если не автобанит) любой текст.

В этот ап я сделал экперемент и он завершился полным успехом. Текст во всех дорвеях был сгенерен по разному. Марков, мешалка, син и копипаст с подменой. Совершенно одинаковый процент попавших в индекс доров.

alexandr_nv
На сайте с 23.04.2009
Offline
39
#4
ciber:
да пофигу вообще. Яша кушает(если не автобанит) любой текст.

А у меня за последние 20 дней ни одного нового дора не вылезло. Пробовал менять текстовку, шаблоны - не помогло. А раньше лезли хорошо... Вот поэтому занялся изучением этого вопроса, хочу выяснить в чем же дело. Буду эксперементировать.

P
На сайте с 15.06.2009
Offline
61
#5
alexandr_nv:
А у меня за последние 20 дней ни одного нового дора не вылезло. Пробовал менять текстовку, шаблоны - не помогло. А раньше лезли хорошо... Вот поэтому занялся изучением этого вопроса, хочу выяснить в чем же дело. Буду эксперементировать.

Может в том, что быстробот не заходил на доры? У меня на пачке из 8 доров быстробот пришел на первый через 12 дней, на последний через 15. (только аддурилка) По логам, что видно? Приходил?

После захода i-бота вылезли морды на всех, а за два апа по 150-200 страниц в индексе на каждом доре.

Если I-бот был - скинь ссылку на пару доров, даже интересно, что не так

Solo_by
На сайте с 19.06.2009
Offline
220
#6
pori:
Может в том, что быстробот не заходил на доры? У меня на пачке из 8 доров быстробот пришел на первый через 12 дней, на последний через 15. (только аддурилка)

Какой у вас медленный быстробот ;) Это обычный бот-индексатор.

S8
На сайте с 26.09.2008
Offline
45
#7

Solo_by, так может он под эстонский яндекс работает :)

satrau
На сайте с 08.11.2009
Offline
12
#8
Бредогенератор:
Копипаст с пятью 150200 страниц в индекс доров. К примеру, есть исходное предложение и путем склеивания частей других исходных предложений. Марков каждое слово в RedButton. Есть 2 варианта генерации текста. Меньше слов, тем выше читабельность текста, а читабельность ставил среднюю. Кстати хотелось бы узнать, как работает. А сейчас стало предложении вставляется по вероятности совсем разные.

Хм, только из этого топика узнал, что мой бредогенератор работает по алгоритму маркова... Эх, а я думал супер алгоритм придумал, хотел уже тысячи сайтов наделать...

Собственно думаю надо смотреть в сторону распознавания речи - думаю это лучше будет читаться, чем-то, что выдал мой бредогенератор (да и все остальные) на основе этого топика.

Россошь (http://www.flash9.ru)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий