- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Dtachkov, действительно, пример показал недостаточную уникальность по Content Watch (http://content-watch.ru/text/)
Что ж, давайте разбираться.
Во-первых, весь контент проверен по нескольку раз на Advego Plagiatus, по глубокой проверке уникальность от 95% на всех 90 статьях. Уникальность копирайта (10 обзоров) 98-100%.
Контент сайта не был проверен по Content Watch. Объясню почему:
Как вы можете видеть, и у меня, и у моей команды достаточно большой и многолетний опыт продажи сайтов на этом форуме. К тому же, у меня богатый опыт создания программных систем, работающих с русским языком. Я долго изучал методы проверки текста на уникальность и придерживаюсь простого метода шинглов как наиболее распространенного и надежного.
Как работает метод шинглов?
Допустим, у нас есть текст, например "Белоснежный мерседес мчался по скользкой трассе, рассекая темноту ночи"
При проверке уникальности методом шинглов из текста сначала удаляются все знаки и прочее:
"белоснежный мерседес мчался по скользкой трассе рассекая темноту ночи"
Затем из всего текста берутся случайные фразы длиной 4-5 слов (шинглы) и ищутся цитатой в поисковиках, например:
"мчался по скользкой трассе рассекая"
Затем ищутся все сайты с совпадением и текст на них сравнивается с искомым текстом по методу шинглов (из обоих текстов берутся всевозможные фразы из 4 (или 5) слов и сравниваются, % точного совпадения фраз и есть процент уникальности текста)
Этот способ простой и надежный, так как если где-то есть скопированный фрагмент текста из 4-5 слов или более, он с очень большой вероятностью обнаружится.
Этот способ железно зарекомендовал себя в SEO, с его использованием работают:
Advego Plagiatus
Etxt антиплагиат
CopyScape.com
и сотни других менее известных сервисов.
Также необходимо напомнить о "мусоре" - совпадении общих фраз, фраз, свойственных для конкретной тематики, устоявшихся оборотов и проч.
Почему я выбрал Advego Plagiatus для проверки текстов на сайты:
1) У него самая жесткая проверка при самом точном результате (минимум "мусора")
2) Он standalone. Поисковые системы банят за частые запросы => онлайн сервисы экономят на количестве проверяемых шинглов. У меня есть специальное решение для плагиатуса, позволяющее не ограничивать себя в запросах (смена IP через надежный VPN).
3) Он зарекомендовал себя в течение многих лет и является официальным инструментом крупнейшей биржи контента в рунете.
Признаюсь, я был немало удивлен результатом от Content Watch. Покопавшись в нем, я понял, что он использует другой алгоритм проверки на уникальность - метод нечеткого совпадения. То есть он пытается сравнивать фразы не только по прямому совпадению, но и различные другие комбинации, например:
"Белоснежный мерседес мчался по скользкой трассе, рассекая темноту ночи"
будет признано как почти полное нечеткое совпадение с фразой, например, такой:
"Владимир стоял на трассе, в ночи водитель мчался от грабителей в темноту. Все знают, что идти по скользкой дорожке чревато лишением свободы согласно УК РФ. Но новый Мерседес очень хотелось, ведь он такой белоснежный. "
Оставим на совести авторов сервиса мудреные правила этого сравнения (могу привести массу предположений, как это делается, и могу сказать точно, что надежного способа нет), скажу только, что есть похожий способ определения уникальности контента - просто прогнать фразу из текста по гуглу. Кто часто так делает, наверняка знают, насколько ненадежен этот метод:
Например, я беру первую попавшуюся статью о кредитах:
http://creditnn.info/about-credit/kredit-dlya-pensionerov-poluchitneslozhno/
Беру фразу "МФО и банки не случайно заинтересовались пенсионерами. Во-первых, все они имеют пусть небольшой, но гарантированный доход – саму пенсию" и ищу ее в гугле. Все ок, первый результат - источник статьи: http://take.ms/lFs9i
Меняю "не случайно" на "уже давно" - и результатов уже нет: http://take.ms/YOOlhw
В общем-то напрашивается 3 вывода:
1) Гугл часто не умеет искать нечеткие совпадения
2) Гугл часто не хочет искать нечеткие совпадения
3) Гуглу пофиг, что вы там вводите, покликайте лучше на рекламу.
Наиболее подходяший вывод, я думаю, каждый выберет самостоятельно.
Однако создатели content-watch.ru, видимо, решили бросить вызов текущему состоянию дел в мире и, создав уникальный искусственный интеллект (такой крутой, у парней из Гугла отвисла челюсть и они решили сменить работу), они дали всему миру бесплатный сервис, который может выискивать даже глубокий рерайт ваших (или, наоборот, чужих) текстов.
Конечно же, я не говорю, что content watch неадекватен, скажем так, с связи со всем изложенным выше - он недостаточно надежен.
Тем не менее, весь контент сайта уже проверяется по content-watch.ru и в случае необходимости (при выявлении неуникальности) будет изменен. Покупателю будет предоставлен подробный отчет.
Спасибо. Аукцион продолжается.
Очень симпатичный сайт! Удачи в продаже!
Получен шаг от GlZZZ ($440) через ЛС
DeFunes, спасибо за теплые слова!
P.S. Я лично проверил еще раз все статьи по глубокой проверке Advego Plagiatus и Content Watch, результат:
По Advego Plagiatus все статьи уникальны на 95% и более
По Content Watch 6 статей (рерайт) показали недостаточную уникальность и были доведены до нужного уровня уникальности.
Теперь по Content Watch также все статьи уникальны на 95% и более.
При желании покупатель сможет ознакомиться с отчетом о проверке ПЕРЕД покупкой.
Блиц будет объявлен сегодня вечером-завтра в первой половине дня.
Шаг 460 ...
шаг .. 480
Шаг - 500 долларов.
Шаг на 520 через ЛС от GlZZZ
Объявляется блиц $640
Дам Блиц 640.....
6 минут аукцион длился )))
(До объявления блица не считается)
Надо дополнить правила проведения аукционов. Чтобы блиц объявляли в рабочее для большинства жителей страны время - с 9.00 до 18.00. Я пока с офиса до дома добирался, уже аукцион закончился.