Weblady

Weblady
Рейтинг
161
Регистрация
26.07.2011
Vladimirus #:

Да, Яша любит доры. С этим ничего не поделать. А что самое смешное, даже после всех жалоб тут, и обещаний проверить, ничего не происходит, на дорах как была реклама, так и есть.

В этой теме можете указать ссылки на сайты,  многие уже заблокированы в РСЯ

https://searchengines.guru/ru/forum/1028036/page344#comment_16953143

Роман, отправляю вам информацию о массовом копировании сайтов на домены, которые не имеют отношения к этим сайтам. Предположительно причина такого копирования, чтобы сайт приняли в РСЯ.

С помощью сервиса copyscape я нашла полностью скопированный мой сайт на другом домене. Страницы были спарсены в обычном html-формате полностью с дизайном сайта и всей структурой, а также с логотипами, названием, текстами и изображениями, ссылками на страницы в социальных сетях. После жалобы хостеру и предоставления доказательств на авторство сайта сайт с парсингом был заблокирован хостинг-провайдером.

Но после блокировки того аккаунта мой спарсенный сайт "переехал" на новый домен и к новому хостеру. IP-адрес сайта  45.88.106.25

Также на этом сервере находится более 200 доменов с контентом, спарсенных с других сайтов и не имеющих отношение к этим доменам.

https://2ip.ru/domain-list-by-ip/45.88.106.25/?pageId=1&orderBy=domain&itemPerPage=50&direction=1

К примеру, домен mitsubishi--heavy.ru - на нем размещен сайт с кинофильмами.

на домене okna-v-belgorode.ru - сайт с аудиокнигами и так далее

Прошу вас обратить внимание на эту ситуацию с массовым парсингом сайтов, предположительно, для прохода в РСЯ и дальнейшего заработка.

chaturanga #:

Поймите, готового рецепта нет. Это всё зависит от настроек вашего веб-сервера, ос и т.п. Наймите разово админа, для такой задачи работы немного.

Спасибо большое, надо попытаться хотя бы усложнить задачу парсинга.

chaturanga #:

Для начала проанализируйте частотность запросов per IP, выделите тех, кто обращается к динамике сайта чаще N запросов в час/минуту.

Спасибо, как это можно сделать? 

chaturanga #:

Также бывает, что страницы не парсятся, а просто используется реверс-прокси, то есть сайт-паразит просто транслирует контент с сайта донора, даже без хранения его у себя. В таком случае достаточно просто в режиме tail-инга отследить запрос в логе.

В моем случае сайт именно парсится, а не отображается на чужом домене. Заменяются некоторые ссылки, рекламные блоки. Страниц на сайте более 50 тысяч, то есть парсят огромное количество, как можно это отследить?

chaturanga #:

ищите откуда идёт парсинг (пул адресов, user-агенты и т.п.). 

Как найти, откуда идет парсинг?

Вполне ожидаемо, после блокировки того аккаунта мой сайт "переехал" на новый домен и к новому хостеру, на этот раз zomro.

Серверы находятся в Нидерландах и тут уже с жалобами наверняка всё сложнее (если это вообще не абузоустойчивый хостинг).

Также на данном сервере находится более 200 доменов с контентом, спарсенных с других сайтов и не имеющих отношение к этим доменам:

От парсинга они не спасут.

-= Serafim =- #:

Ну так это совсем другое дело, а не просто на словах, как говорилось ранее. Нормальный подход хостера.

Ранее говорили о регистрации авторских прав. Здесь в качестве доказательства авторства использовались исходники, договоры, переписка.

-= Serafim =- #:

Никто из владельцев сайтов не регистрирует прав и ни один суд не вынесет решение просто со слов "это мое".

Со слов ни один хостер ничего не сделает. Из юридического отдела хостинга мне прислали большой список, по которым можно предоставить доказательства авторства (договор на разработку, логотипы, исходники, переписка с исполнителями). Ко всему еще приложила ссылки на вебархив. Мой сайт как был 15 лет под одним названием, концепцией, схожим логотипом, так и остался. А тут сайт магазина автозапчастей три месяца назад размещает у себя спарсенный сайт на совершенно другую тематику. 

Да, и после получения доказательств хостер "выделил владельцу сайта срок на предоставление подтверждений правомерности использования заявленного спорного контента либо его самостоятельное удаление". 

Конечно, можно спарсенные сайты размещать на абузоустойчивых хостингах. Но и тут стоит бороться за свои сайты.

Всего: 482