Как я поборол воровство контента с сайта.

Links Forever
На сайте с 20.08.2006
Offline
329
26265

Одним прекрасным июньским днем я решил проверить, кто и в каком количестве копирует контент с моего сайта. Сайт хороший, ему шесть лет, ЯК, ДМОЗ, Яндекс Новости, Гугл новости, Рамблер Новости и т.д. Копипастили с сайта всегда, но в довольно ограниченных количествах и особо не напрягали, да еще и ссылку на меня иногда ставили, так что я особо внимания не обращал. Все равно всегда по запросам выше выходил. Так вот. Проверил я себя просто. Копировал часть текста и вставлял в Яндекс запрос в кавычках и смотрел результат. И что же я обнаружил…

Во-первых, какой-то faggot тупо меня зазеркалил, видимо сделал на своем домене c-name запись на мой и вышел как зеркало. В результате какой-то полугодичный говнодомен по всем запросам в кавычках был на первом месте, мой же домен был внизу списка копипастеров, а зачастую вообще в соплях Яндекса типа «показать все похожие результаты».

Во-вторых, оказалось, что количество копипастеров превышает десяток (а то и два десятка!). Среди них есть как обычные грабберы, так и те, кто копипастит вручную, полностью переделывая статью под свой сайт.

И такой результат выдачи, что они в ТОПе, а я в попе, не смотря на то, что я свои статьи запихиваю в сервис веб-мастера «Оригинальные тексты» и как партнер Яндекс Новостей, мои статьи индексируются минут за 10. А их только на следующий день в лучшем случае.

Пришлось озаботиться данной проблемой.

И так.

Первое, что я сделал, это отрубил всех грабберов, в том числе и зазеркалившего меня. Сделал просто, домены и их IPшники занес в фаерволл сервера. Да, муторно, да вручную, но на тот момент мне был важен результат как можно скорей. Если найдутся люди у которых руки попрямей, чем у меня, смогут написать простой серверный скрипт, который будет грабберов заносить в фаерволл автоматом. Например, можно сделать так, в конце статьи ставится уникальный код IDDQD1 и далее раз в сутки парсится выдача на наличие этого уникального кода. Те кто копируют вслепую граббером, скопируют и код в конце статьи, следовательно всех их в фаерволл. Можете предложить более красивый вариант. Суть данной моей статьи не в описании сугубо конкретных мер и решений, а описать проделанную мной работу в общем, и достигнутый результат.

Второе, что я сделал. Нарезал статьи на длинные предложения (5-6 слов) и купил на эти длинные анкоры ссылок в сапе, самых дешевых, штук по 20-30 на статью.

Сейчас я стараюсь забивать статьи на сайт заранее, за неделю до публикации, но сразу, как только заношу статью в базу сайта и узнаю ее URL при публикации, иду в сапу и накупаю таких ссылок на еще неопубликованную статью. Да, метод не самый окупаемый для новостных сайтов, поэтому со старых статей 3-4х месячной давности, я ссылки снимаю, при условии, что эти ссылки не участвуют в раскрутке НЧ этих статей. Ведь можно соединить полезное с еще полезным!

Третье. Я это делал и ранее и сейчас продолжаю делать, я все статьи загоняю в сервис веб-мастера «Оригинальные тексты». На первый взгляд вещь бесполезная, но на самом деле оказалась нужно при следующем моем действии.

Последним действием было письмо в Яндекс. В котором я помимо прочего, упомянул, что использую сервис «Оригинальные тексты» и дескать мол, я все ж автор, а не кто-то другой. Конечно, Яндекс на прямую не признал это, но учёл. Вот такое письмо я им накатал:

В последние несколько месяцев складывается парадоксальная ситуация с ранжированием моего сайта *****.ru. Сайт описан в Яндекс каталоге, Является партнером Яндекс Новости и Яндекс Директ. Например, на сайте опубликована статья "*******". Если набрать этот запрос в ПС Яндекс, то с удивлением можно увидеть, что во-первых, мой сайт не на первом месте по этому запросу, во-вторых, по этому запросу от него показывается совсем другая страница. К слову сказать, на первом месте совершенно странный сайт, который эту статью к себе скопировал. Я конечно понимаю, что Яндекс зеркало Рунета и не намерен учить Яндекс определять кто у кого скопировал статью, но во-первых, мой сайт партнер Яндекс Новостей, и как только на сайте публикуется статья, она в течение 10 минут попадает в индекс ПС. А во-вторых, все статьи добавляемые на сайт (кроме новостей) заносятся через Яндекс Вебмастер в список оригинальных текстов. К сожалению, никакие методы не позволяют помочь Яндексу правильно и достойно отранжировать мой сайт, как первоисточник статей. И такая ситуация наблюдается практически со всеми статьями. Для примера могу привести следующее [..........].

И еще один момент, заметил, что после быстрой индексации, статьи через пару дней из индекса пропадают и появляются через 7-10 дней снова, при этом эти же статьи скопированные другими сайтами из индекса не пропадают.

Пожалуйста, помогите разобраться с этой ситуацией.

Получил следующий ответ:

1. Поисковая система Яндекс лишь индексирует общедоступную информацию и показывает её по запросам пользователей. Мы ни в коем случае не являемся цензорами сети и не присваиваем авторство той или иной статьи какому-либо сайту. Также мы не выделяем среди сайтов сайты-первоисточники. Результаты поиска формируются с учетом множества факторов, иными словами, с учетом релевантности сайтов запросам пользователей.
Пример с запросом ["*******"] передан в поисковый отдел, он поможет нам в работе над алгоритмами ранжирования.

2. Такое возможно из-за специфики работы быстроробота при задержках в обновлении основной поисковой базы. Это не значит, что страница индексируется по новой, то есть информация о времени ее первоначального индексирования закрепляется за документом и не меняется, просто некоторое время она может не показываться в результатах поиска.

Через пару недель после проделанной работы, заметил, что fag который меня зазеркалил отвалился из выдачи. Резко уменьшилось число копипастеров через грабберы. Мало кто из них вообще заметил, что я их зафаероллил.

Прошло два месяца. Траффик, несмотря на августовский спад, вырос процентов на 20%, новые статьи, если их искать в кавычках всегда выводятся в SERPе теперь первыми. Из автограбберов лишь только news.liveinternet.ru и то потому что я сам туда подписался, в любом случае он берет только заголовок и пару предложений описания статьи.

Я не пытаюсь данной статьей доказать кому-то что-либо или дать универсальный рецепт. Кто-то может сделать лучше, кому-то может она показаться полезной. Может это вообще случайное совпадение с одним отдельно взятым сайтом. Рассматривайте этоу статью как информацию к размышлению.

Как говорится, comments are welcome!

Я очень люблю вкусные рецепты (https://povar24.info) квашеной капусты (https://kvashenaya-kapusta.ru/) и салат оливье (https://salatolive.ru/).
Dreammaker
На сайте с 20.04.2006
Offline
570
#1
_alk0g0lik_:
Нарезал статьи на длинные предложения (5-6 слов) и купил на эти длинные анкоры ссылок в сапе, самых дешевых, штук по 20-30 на статью.

Если я правильно помню, то этот метод когда-то называли "метод бурундука" - по нику серчанина, который его продавал. Потом кажется так же и тиц наращивали. Правда, это уже давно было как сейчас и что не знаю.

Links Forever
На сайте с 20.08.2006
Offline
329
#2
Dreammaker:
Если я правильно помню, то этот метод когда-то называли "метод бурундука" - по нику серчанина, который его продавал. Потом кажется так же и тиц наращивали. Правда, это уже давно было как сейчас и что не знаю.

Возможно. Но я его использовал для других целей - разбавка анкор листа, продвижение по НЧ.

A1
На сайте с 10.08.2012
Offline
19
#3

Спасибо за полезную статью. У меня блог молодой, но т.к. я уверен в качестве своих статей, то, думается, что рано или поздно проблема воровства контента возникнет. И Ваш опыт пригодится.

Кузница аналитического копирайтинга (http://alexcopy.ru).
G
На сайте с 20.08.2012
Offline
3
#4

полностью защитить свой контент нереально, к сожалению...

Links Forever
На сайте с 20.08.2006
Offline
329
#5
grantgaranto:
полностью защитить свой контент нереально, к сожалению...

Бесспорно! Даже если его как интеллектуальную собственность зарегистрировать.

alexxxx1984:
Спасибо за полезную статью. У меня блог молодой, но т.к. я уверен в качестве своих статей, то, думается, что рано или поздно проблема воровства контента возникнет. И Ваш опыт пригодится.

Начинайте об этом заботиться заранее. Хотя бы в вебмастер загоняйте.лучше и ссылочек прикупите, заодно по НЧ трафф пойдет.

Digdug
На сайте с 11.07.2012
Offline
119
#6

Сегодня обнаружил два зеркала моего сайта. Если у вас сайт на DLE, можете вставить этот простой код:

if (!in_array(strtolower($_SERVER['HTTP_HOST']), array('site.ru', 'www.site.ru')))
die('.');

Код необходимо вставить в начало файла index.php. После этого, ваш сайт будет работать только на доменах site.ru и www.site.ru. На чужих сайтах будет отображаться точка.

Впрочем, это не только сайтам на DLE поможет. Но за другие CMS не отвечаю.

The WishMaster
На сайте с 29.09.2005
Offline
2543
#7

ЗАДОЛБАЛИ копирование называть воровством!!!

Если у тебя возьмут деньги и отксерят, это не будет воровством.

Пешу текста дешыго! Тематики - туризм, СЕО, творчество, кулинария, шизотерика :)
Links Forever
На сайте с 20.08.2006
Offline
329
#8
The WishMaster:
ЗАДОЛБАЛИ копирование называть воровством!!!
Если у тебя возьмут деньги и отксерят, это не будет воровством.

Я не против копирования, если на меня индексируемую ссылку ставят, как на источник. В противном случае это воровство т.к. за каждую статью я плачу переводчикам, копирайтерам и прочее. А потом всякие муды выдают их за свои и это уже воровство.

The WishMaster
На сайте с 29.09.2005
Offline
2543
#9
_alk0g0lik_:
В противном случае это воровство т.к. за каждую статью я плачу переводчикам, копирайтерам и прочее. А потом всякие муды выдают их за свои и это уже воровство.

Бредятина. Это копирование. Пусть и незаконное. Воровство - если б влезли на сервер, всё забрали и удалили все копии.

komdir
На сайте с 14.10.2009
Offline
430
#10
The WishMaster:
Бредятина. Это копирование. Пусть и незаконное. Воровство - если б влезли на сервер, всё забрали и удалили все копии.

Как не называй, а конца и края этой мутомодине не видно(

И приходится тратить против таких хитрожопых силы, время и деньги. А ччччто делать?)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий