Еще один генератор уникального текста.

T
На сайте с 23.10.2005
Offline
60
#51

-Mouse-, если в вашем генераторе, действительно случайная выборка, ее и сравнивать нет необходимости, все будет уникальным с погрешностью, которую дает генератор псевдослучайных чисел.

Для описаний сгодится, но большие тексты в таком формате писать очень сложно.

ПС может вичислить сгенерированный текст по числу употребляемых слов. Прикиньте, на сайте из 1000 страниц, всего 1000-2000 уникальных слов.

-Mouse-
На сайте с 26.03.2007
Offline
108
#52
topol:
, если в вашем генераторе, действительно случайная выборка, ее и сравнивать нет необходимости, все будет уникальным с погрешностью, которую дает генератор псевдослучайных чисел.

Не случайная выборка а полный перебор всех вариантов и определение N самый наилучших. ;) Случайную выборку реализовать легко, а толку от нее мало. Покрайней мере я толк в ней не вижу. 🚬

topol:

Для описаний сгодится, но большие тексты в таком формате писать очень сложно.
ПС может вичислить сгенерированный текст по числу употребляемых слов. Прикиньте, на сайте из 1000 страниц, всего 1000-2000 уникальных слов.

Если вы в тексте из 2к символов будете менять слова на синонимы, то конечно для многих поисковиков толку будет не очень много.

Варианта 2:

1. Менять не слова, а "куски фраз" или предложений...

2. Увеличивать кол-во возможных "выборок".

Второй вариант упирается в огромные сложности когда начинаем выбирать лучшие генерации. Поэтому, в любом случае, надо оптимизировать алгоритм, чтобы работал на порядок быстрее. 🚬

T
На сайте с 23.10.2005
Offline
60
#53

Mouse,

>Не случайная выборка а полный перебор всех вариантов и определение N самый наилучших.

Как же выбираете самый наилучшый?

На входе у вас связный человеческий текст с вариантами для смысловой связки.

Если случайно будете переставлять, то и будет необходимое количество вариантов. Если абсолютно уникальные тексты хотите получить, то просто их надо написать и не заморачиваться с генератором.

>Если вы в тексте из 2к символов будете менять слова на синонимы, то конечно для многих поисковиков толку будет не очень много.

На страницах сайта будет ровно столько уникальных слов, сколько их в исходном тексте.

P
На сайте с 11.12.2006
Offline
107
#54
-Mouse-:
Собственно вы изначально режете текст на блоки, в результате получаете "склеенные куски".

понял через 2 минуты после того, как отписал пост:)

но это получается ооочень медленно, жду варианта побыстрее

еще такой вопрос - если ставишь минимум уникальности, к примеру, 15% - прога будет отталкиваться чисто от этой цифры и не будет пытаться делать, допустим, сначала 50%, потом 45 и тд? (в идеале конечно от 99 должна начинать)

просто несколько кусков сделал - получилось что некоторые переборы {|} даже не были задействованны или использовались всего пару раз. хотя я уверен:) , что если бы там производилась замена, тексты на выходе были бы более уникальны

R
На сайте с 22.06.2007
Offline
174
#55

Сделай скролинг в окошке.

Вообще идея мне не совсем нравится. Если создавать список альтернатив, то непонятно почему бы сразу не писать.

Идея должна заключаться в ометки конкретных мест, к которым прорамма подберет синонимические фразы из своей базы.

[Удален]
#56
Reise:
Сделай скролинг в окошке.
Вообще идея мне не совсем нравится. Если создавать список альтернатив, то непонятно почему бы сразу не писать.
Идея должна заключаться в ометки конкретных мест, к которым прорамма подберет синонимические фразы из своей базы.

Пожалуй, соглашусь с последним постом.

Тексты у всех есть, надо просто сделать их другими.

Зачем генерировать несколько похожих?

На входе один текст,

на выходе тоже один текст, но совершенно не похожий при

похожей смысловой нагрузке.

Evgen1973
На сайте с 20.11.2006
Offline
154
#57
-Mouse-:

Статьи добавлены с ссылками на сайт, на котором нету прочих работ уже в течении 3-х месяцев. Если важен результат - при очередном АП-е ТИЦ-а я могу сообщить "как сколько и насколько". ;)

Как успехи с ТИЦ :)

Как подопытные? Есть преценденты склейки Яндексом статей? Имеется ввиду фильтрация нечётких дублей.

Ещё раз спасибо за прогу.

nik-shumilin.narod.ru (http://nik-shumilin.narod.ru)
lamer@
На сайте с 04.01.2007
Offline
118
#58
-Mouse-:
Сделал новую версию. Поисправлял старые недочеты и добавил возможность просмотра отчетов, заполнение вашими ссылками, загрузка и сохранение проектов и тд. GUI слегка не доработанное, но те недочеты, что есть - пока что неважны. В настройках блоков работает максимальное кол-во ссылок, но не работает временно частный анализ уникальности среди всех блоков данного индекса во всем сгенерированных текстах. Поэтому пользуйтесь пока что только общим анализом на уникальность. Для генерации текстов (2-3к символов) лучше использовать не более 10 выборок ({}). Хотя на практике зависит от длинны текста, производительности машины и прочих ваших пожеланий. Помните, что каждая новая генерация сравнивается со всеми успешными до этого момента и если вам надо уникальность не мене 5%, то новая генерация будет уникальна от всех до этого успешных не менее указанного предела.

Качаем отсюда: http://webfile.ru/1393501

Хотелось бы от вас услышать еще возможные области применения, чтобы знать под что затачиваться. Если комуто интересно, и есть какието пожелания, то пишите. Дальше будет видно ... ;)

P.S. По лицу (репе) не бить. Я знаю, что есть коммерческие продукты которые получше работают, но помните, что не каждый может (хочет) покупать его. А как бесплатный - считаю что у этого генератора есть шансы на существование. ;)

Уважаемый ТС, пробовал прогу, но как-то не до конца что ли понял ситуацию с генерацией, вставил статью, заключил в скобки 4-5 слов с синонимами и запустил, где смотреть выход? как его регулировать, в смысле по количеству?

Как и откуда потом его достать (имеется ввиду сгенерированные статьи)?

До ночи сидел, разбирался, но в силу слабого интуитивного мышления не смог разобраться, привык к мануалам, может сделать хелп (кнопку с вопросиком в проге) с описанием пошаговой генерации, от начала до конца, хоть почитал вроде всем понятно, но жутко не удобно чувствовать себя одним из не умных людей🤣

Natata
На сайте с 19.02.2007
Offline
148
#59

Не разобралась ни в чём ... да уж ... действительно девки отплясали ...

P.S. Может это не для блондинок :)

NikBatman
На сайте с 24.02.2006
Offline
140
#60

Отличная программа автору +

немного учесть разумные замечания, и будет отлично!

У носорога плохое зрение, но при его весе это не его проблема.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий