Проверка текстов на уникальность

1 234
E
На сайте с 28.04.2009
Offline
2
#31

Ясно ))) Спасибо за ответ. Вероятно вы правы.

Кто ищет, тот находит.
E
На сайте с 28.04.2009
Offline
2
#32

Все еще доступно бесплатное тестирование услуги!!!

E
На сайте с 28.04.2009
Offline
2
#33

Предлагаю услугу сбора статистики по повторениям n-словников. Моя услуга не имеет отношения к алгоритму шинглов, а является альтернативным методом контроля и корректировки качества статей. Пригодится мой метод, скорее всего, размножителям и тем кто пользуется их услугами.

Принцип работы:

Я принимаю исследуемые статьи за единый текст и ищу в нем повторения. Однословные, двусловные, трехсловные и так далее, из результатов сравнения исключаются пересекающиеся повторения, например если в тексте повторяется словосочетание "мама пошла" то не будет показано, что повторяются слова "мама" и "пошла", а будет показано, что повторяется фраза "мама пошла".

В чем новизна:

1) не использует алгоритм шинглов и не показывает количество совпадений в процентах, а показываются сами повторения

2) анализировать можно много статей, общим объемом до 85000 символов (с пробелами)

3) в отличие от других методов контроля качества позволяет увидеть, чтобы в последующем исправить, слабые места размноженных статей.

Достойных аналогов пока не найдено (читайте тему сначала)

Привожу пример

допустим у нас есть короткие тексты 10шт:

моя знакомая вышла подышать свежим воздухом, но отправилась в Сочи.
мама пошла подышать свежим воздухом, но отправилась в магазин.
Маша вышла погулять, но отправилась в магазин.
мама решила подышать свежим воздухом, но уехала в магазин.
тетя пошла погулять, но отправилась на Карибы.
бабушка обещала прогуляться, но уехала в Сочи.
мама решила прогуляться, но улетела на Карибы.
мама хотела прогуляться, но улетела в Сочи.
бабушка хотела подышать свежим воздухом, но отправилась в магазин.
тетя пошла прогуляться, но отправилась в казино.

заявлено проверить на 10-ти словные совпадения, вот результат моей работы

повторы1:
вышла
бабушка
хотела
повторы2:
в Сочи.
мама решила
тетя пошла
на Карибы.
повторы3:
но уехала в
погулять, но отправилась
прогуляться, но улетела
повторы4:
повторы5:
повторы6:
повторы7:

подышать свежим воздухом, но отправилась в магазин.
повторы8:
нет повторов
повторы9:
нет повторов
повторы10:
нет повторов
всего повторов10: 0

Первым трем заказавшим сделаю за отзыв, остальным за 0.5wmz.

Связаться со мной можно через icq 416тринадцать0996

Еще проверяю русские тексты на наличие символов заменителей (латинские символы которые внешне выглядят как русские, но машинами они понимаются по-другому).

мама пошла - с русскими а
мaмa пошлa - латинскими a
попробуйте поискать латинскую a на этой странице (Ctrl+F)

Как это может навредить. Поисковые машины какими бы они продвинутыми не были, все равно стараются показать то, что вбил пользователь, а он всяко слово "мама" будет печатать только русскими буквами, и на запрос с русскими буквами ваша страничка (если на ней это слово с латинскими символами) показано не будет

Для чего в вашем тексте могли заменить символы. Скорее всего манипулируя заменой символов можно обмануть программы для проверки уникальности (добиться высоких показателей).

Почему стоит попросить меня. Вы можете в принципе и сами прокликать в поиске браузера (или ворда, или блокнота) весь английский алфавит, но я это сделаю автоматически быстро и четко. Вот пример

текст: мoя знакомая вышла подышать свежим воздухом, но отправилась в Сочи. мама пошла подышать свежим воздухом, но отправилась в магазин. Маша вышла пoгулять, но oтправилась в магазин. мама решила подышать свежим воздухом, но уехала в магазин. тетя пошла погулять, но отправилась на Карибы. бабушка обещала прогуляться, но уехала в Сочи. мама решила прогуляться, но улетeла на Каpибы. мама хотeла прогуляться, но улетела в Сочи. бaбyшка хотела подышать свежим воздухом, но отправилась в магазин. тетя пoшла прогуляться, но отправилась в казино.
количество символов c пробелами: 528
количество символов без пробелов: 459
символы латиницы встречаются в:
мoя
пoгулять,
oтправилась
улетeла
Каpибы. мама
хотeла
Сочи. бaбyшка
пoшла

Стоимость проверки 0,3wmz

Связаться со мной можно через icq 416тринадцать0996

D
На сайте с 14.09.2008
Offline
79
#34

Ну, вообще-то было бы бы замечательно, если б Вы выпустили программу, которой можно было бы анализировать размноженные тексты у себя на компьютере - зачем же кому-то передавать свои тексты для проверки?!

Мое мнение, что как услуга это может быть востребовано только в виде веб-сервиса, да и то бесплатного - в довесок к чему-то более интересному.

Универсальный копирайтинг (http://unicopy.ru). Биржи копирайтинга в рунете (http://copywriter.ucoz.ru).
E
На сайте с 28.04.2009
Offline
2
#35

Программу, пока выпустить не могу, знаний не хватает, и потом скрипт на питоне и переписывать его на компилируемый язык... потратить еще кучу времени, не хочется... , для сервиса к сожалению слишком ресурсоемкая вещь, так что видно так и останется не восстребованной, хотя я теперь с успехом использую сам повышая и контролируя качество размножаемых мною статей.

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий