vladway

Рейтинг
21
Регистрация
06.03.2007

Респект. Штука стоящая.

Не смотря на уже полученную критику от автора программы, выскажу мнение:

Основная фича твоей прогнраммы - выбор максимально уникльных вариантов текста и/или ранжирование по ним

предполагаю что существует алгоритм по которому сгенерированный текст будет отсортирован в порядке уникальности еще на процессе генерации

как я пониммаю у автора основное время занимает как раз проверка уникальности - вот ее можно было бы убрать вообще если такой алгорим создать и использовать

в итоге

вводим текст и вместо параметра "мин уникальность" вводим только кол-во требуемых копий . Генерируем, потом проверяем уникальность одного (последнего) варианта

получаем мин уникальность текстов и сообщаем пользователю.

PS

Даешь критику в топике вместо ударов по репе? ☝

-Mouse-:
Чтобы не создавать новую тему, хочу также спросить:
Как узнать уникальная статья или нет методом замены конструкциями {}?
Как именно генерировать ее уникальной, не переписывая ее полностью с нуля?

Вот например есть у меня статья на 3 тысячи знаков .... в ней 5 абзацев.
Если пользоваться обычным сабмитером для генерации, то каждый раз при генерации он меняет только 1 слово в конструкции {}. Сгенерированную таким образом статью уникальной конечно считать нельзя. Я вижу вариант - генерировать каждый из 5 абзацев отдельно а потом склеивать. Но думаю, что и это не совсем будет правильно.

Может кто-то обьяснить технологию правильной генерации или подсказать софт для этого дела?

Заранее спасибо.

Вот написал небольшой сервис скрипт

он генерирует отделько каждое предложение а потом "склеивает".

Буду очень благодарен если отпишитесь в ветке его обсуждения.

Wonder:
Из такого: {sdf|dsf}
можно сделать 100 вариантов :)

к сожелению нет :-)

просто предварительно оценивать сколько вариантов можно сделать из текста пока не умеет скрипт.

Wonder:

Почему использованы именно фигурные скобки, а не квадратные как в сабмитере?

хм.. странно у меня в сабмиттере фигурные %)

Версия 3.3

hi4:
Идеальный вариант за который я бы платил это:
Закачиваю текст, получаю синонимически измененный.

Чем это хорошо, текст синонимически измененный будет считатся поисковиком уникальным. Алгоритм несложный, нужно всеволишь обработать базу из 6000 слов, выбрать каждому слову наиболее подходящий синоним, добавить падежи...
Т.е. итого нужно вручную обработать 72000 слов.

Но в итоге созданный сервис имел бы хорошую популярность...

Буду делать

Базу синонимо уже нашел

Arhangel66:
Удивительно, как раз пару недель назад писал что-то подобное... вот только е ругайтесь, я не програмист и написал за пару часов... Идею также взял у allsubmiter :)

Мельком просмотрел страницу резуьтатов.

Понравилась идея изменения порядка слов в блоках.

..... выступает инвестором, заказчиком, генеральным подрядчиком и застройщиком ....

Думаю стоит добавить как отдельную фичу.

response:
вообще, вы бы с брутфорсом не парились, а использовали дармовые источники, сконцентрировавшись на последующей перереботке)

Например весна яндекса. Я пока только материал коплю (уже почти двадцать метров неспешными запросами), но уже на нем заметно, что повторяющихся предложений не так много, как могло бы быть. Я, правда, не прогонял калькулятором, а просто вручную пару раз потыкался, но вроде ничего себе так контентиг ;)

Вот ее бы взять, да сфаршировать хорошенько.

Приношу извинения но е совсем понимаю о чем идет речь.

Можно немного подробнее?

response:
я бы начал с "шинглов сегаловича" )
/ru/forum/21794

Буду курить

response:
критерий уникальности нужно подгонять в первую очередь под поисковики, а не брать с потолка константы ☝

Согласен.

Но реально не знаю где взять эти данные.

Если ктото подкинет ссылки или инфу поробую реализовать.

CrazyJohn:
Согласен на 100%.

Тогда наверное нужно установить критерий уникальности.

если в тексте слов 150 и один текст от другого будет отличаться только одним словом - это уникальный текст?

Если рассматривать унимкальность с точки зрения уникальности каждого предложения в тексте - возникает возможность описанной ситуации - За лимит будет выбрано предложение в котором меньше всего вариантов генерации.

1 234 5
Всего: 42