- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
2. Метод обнаружения рерайта основан на обнаружении локальной близости одних и тех же слов в проверяемом тексте и текстах из интернета. "Под одними и теми же словами" следует понимать слова с одной и той же основой, то есть, например, слово "чемодан" и "чемоданами" будут считаться одинаковыми.
3. "Локальная проверка" - это проверка на уникальность текста не в интернете, а среди документов, которые находятся у вас в компьютере. Есть требование - они должны находиться в проиндексированной системой папке.
2. Извините меня такую непонятливую, но рерайт проверяется без учета шингла в N-ое кол-во слов, так? Просто любое совпадение слов, верно? Хорошо, пусть с одинаковой основой, но по моим наблюдениям предлоги, а также знаки препинания и прочие символы тоже учитываются? В смысле, канонизация здесь тоже не применяется?
Кстати, а почему проверки на уник и рерайт запускаются только по отдельности? Я сейчас не хотела бы приводить в пример аналогичные программы, но кое у кого сразу вместе они и происходят...
3. все равно не поняла:( То есть 2 локальных документа можно сравнить между собой? И для этого обязательно должна работать служба индексирования Windows?
Estelle, да, рерайт проверяется без учета шингла в N-ое кол-во слов. Предлоги и знаки препинания не учитываются, канонизация здесь также применяется как и в методе шинглов.
Насчет локальной проверки на примере - у вас есть 100 текстов в папке, а есть еще 1 документ, который вы хотите проверить на совпадения по отношению к этим 100. Вот в чем смысл. Служба индексирования Windows обязательно должна быть включена, без нее локальная проверка не будет работать.
...Метод обнаружения рерайта основан на обнаружении локальной близости одних и тех же слов...
Еще раз извините, но вновь не все понятно😕. Насколько близко они могут соседствовать друг с другом? Может быть, что текст, к примеру, на 10к збп, а одно слово найдено в его начале, а другое в самом конце? Хотя по моему опыту (единичному пока что) программа нашла наибольший процент совпадений по рерайту аккурат в источнике и там эти схожие фразы находятся в разных, значительно отдаленных по времени постах на форуме (это форум forum.searchengines.ru, между прочим).
---------- Добавлено 25.10.2013 в 22:12 ----------
Предлоги и знаки препинания не учитываются...
А почему тогда проверка на рерайт у меня обнаружила (выделила цветом), например такое – "? Издержки профессии" (здесь вопросительным знаком завершается предыдущее предложение).
---------- Добавлено 25.10.2013 в 22:14 ----------
Насчет локальной проверки на примере - у вас есть 100 текстов в папке, а есть еще 1 документ, который вы хотите проверить на совпадения по отношению к этим 100.
И здесь не все до конца понятно😕. Документы с какими расширениями поддерживаются? Doc, txt или еще какие? И можно ли txt сравнить с doc, например?
ЗЫ. Напишите, пожалуйста, хотя бы тоооонюююсенький мануалчик, а то ведь по крохам да по всему интернету приходится выискивать информацию, и к тому же часто из некомпетентных источников.
А можно добавить добавить Пакетную, уникальную проверку?
И пакетную уникальную для изображений?
Еще раз извините, но вновь не все понятно😕. Насколько близко они могут соседствовать друг с другом?
Чем ближе, тем лучше.
---------- Добавлено 28.10.2013 в 20:44 ----------
А почему тогда проверка на рерайт у меня обнаружила (выделила цветом), например такое – "? Издержки профессии"
Выделить-то выделилось, но это при подсчете не учитывается. В методе шинглов то же самое - так же выделяются запятые и прочее, но это не учитывается при итоговом подсчете уникальности.
---------- Добавлено 28.10.2013 в 20:48 ----------
Документы с какими расширениями поддерживаются? Doc, txt или еще какие? И можно ли txt сравнить с doc, например?
Поддерживаются txt, doc(docx), pdf. Да, можно.
---------- Добавлено 28.10.2013 в 20:50 ----------
А можно добавить добавить Пакетную, уникальную проверку?
И пакетную уникальную для изображений?
Не понял насчет пакетной уникальной проверки. Есть пакетная проверка - в Настройки / Операции / пакетная проверка...
Насчет пакетной проверки изображений - это не планируется.
Не понял насчет пакетной уникальной проверки. Есть пакетная проверка - в Настройки / Операции / пакетная проверка...
Насчет пакетной проверки изображений - это не планируется.
Есть папка с новыми файлами, и есть папка со старыми), ок?)
bestdeal, все равно не понял, но что-то наверно специфическое, что вряд ли будет реализовано.
Чем ближе, тем лучше.
Ох! Ну извините меня, тАрмАзную блАндинку! Все равно не понимаю! Кому лучше? Мне? или для уникальности лучше? Хотя, как я смотрю, все работает четко и не так уж страшен этот черт как его малюют.
Кстати, почему фраза "Уникальность текста N%" в конце отчета о проверке оформлена в виде ссылки на какой-то непонятный и недоступный сайт http://www.sel_res.ru/???history=0&f=1. Это что, наши уникальные (и не очень:)) тексты в какой-то архив помещаются?
Вот еще скромный вопросик: нельзя ли сделать проверку тошноты текста, как на неком популярном онлайн сервисе? Как я понимаю, для этого и к инету ведь даже подключаться не надо? А то выходит так, что текст может оригинальный написан, а с ключами непреднамеренно переборщила.
Кому лучше?
Имелось ввиду, что совпадения находятся, если поблизости находятся те же слова, что и в проверяемом документе. В таком методе, в отличие от метода шинглов, простая перестановка слов или изменение окончаний не повысят уникальность.
---------- Добавлено 05.11.2013 в 23:18 ----------
почему фраза "Уникальность текста N%" в конце отчета о проверке оформлена в виде ссылки
Просто баг, это служебная ссылка, которая удаляется перед созданием отчета.
---------- Добавлено 05.11.2013 в 23:20 ----------
нельзя ли сделать проверку тошноты текста, как на неком популярном онлайн сервисе?
Для этого уже вроде есть соответствующие программы, не требующие выхода в интернет.
Классная программка - в отличии от аналогичного продукта от Адвего выводит страницы сайтов, где есть копии!