Проверка на уникальность с помощью шинглов

[Удален]
714

Есть текст длиной в 2000 символов.

Каждой слово в данном тексте синонимизировано! (в том числе и частицы, хотя при просчете по шинглам они не учитываются)

Генерю из исходного текста другие статьи, при этом ставлю настройку (в олсабмитере):

- максимальное количество фраз 5;

- % схожести - 1%

- шинглы - 3;

При этом получается, почему-то, всего 2 размноженных текста.

А при проверке этих текстов на уникальность, получается что размноженные статьи не уникальны:

- при длине 1 шингл = совпадение 50%

- при длине 2 шингла = совпадение 7%

- при длине 3 шингла = совпадение 2%

- при длине 4 шингла = совпадение 1%

- при длине 5 шинглов = совпадение 0%

Как добиться более лучшей уникальности и хотя бы 3-5 статей?

Ведь у меня каждое слово в исходном тексте размножено....

mhz
На сайте с 16.05.2007
Offline
190
mhz
#1

Синонимизируйте не только слова, но и фразы, предложения. Меняйте саму структуру текста.

Миниатюрный бультерьер Сахарок (http://www.bule4ka.ru/) — СДЛ о собачках. Вечные ссылки — безопасный способ продвижения и заработка. (http://miralinks.ru/users/registration/from:163)
[Удален]
#2

Но почему всего 2 статьи получается при данных условиях?

И ещё - может проверять на совпадение именно по той длине шингла, по которой генерилась статья?

_
На сайте с 24.07.2002
Offline
299
_Ad
#3
mhz:
Синонимизируйте не только слова, но и фразы, предложения. Меняйте саму структуру текста.

может проще с нуля написать?

В школе по русскому раньше так тренировали копирайтеров.. и называли это "Изложение".

[Удален]
#4

Это время.

Чтобы написать 2000 символов уникального контента мне надо минут 20-30.

Умножить это хотя бы на 10 статей - получается 3 часа.

Поэтому и хочется их размножить с сохранением уникальности.

mhz
На сайте с 16.05.2007
Offline
190
mhz
#5

_Ad, ну пишите 1000 раз с нуля свои изложения, если вам так проще. :)

Я лишь написал, как можно добиться результата.

FirstWeb:
Но почему всего 2 статьи получается при данных условиях?

Не знаю, смотрите в настройках. Я размножал статьи уже очень давно - не помню всех тонкостей настройки. Да и оллсабом я не пользовался.

PS: Почему-то мне показалось, что вы по одному синониму к каждому слову подобрали. Если так, то этого мало, если хотите уникальности - придумывайте как минимум по 3-5.

[Удален]
#6
mhz:
_Ad, ну пишите 1000 раз с нуля свои изложения, если вам так проще. :)

Я лишь написал, как можно добиться результата.


Не знаю, смотрите в настройках. Я размножал статьи уже очень давно - не помню всех тонкостей настройки. Да и оллсабом я не пользовался.

PS: Почему-то мне показалось, что вы по одному синониму к каждому слову подобрали. Если так, то этого мало, если хотите уникальности - придумывайте как минимум по 3-5.

Да с настройками уже замудохался разбираться)

Для каждого слова минимум 3 синонима. Максимум - 5. Среднее - 4.

_
На сайте с 24.07.2002
Offline
299
_Ad
#7
mhz:
_Ad, ну пишите 1000 раз с нуля свои изложения, если вам так проще. :)

автору нужно 3-5 статей.. я их быстрее напишу, чем вы будете слова переставлять..

mhz
На сайте с 16.05.2007
Offline
190
mhz
#8
_Ad:
автору нужно 3-5 статей.

Я так понял, что это образное выражение.

Но если нет, то вы, конечно, правы. :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий