Воруют новые сайты - заметил такую тенденцию недели 2 назад

Cuys
На сайте с 05.12.2016
Offline
182
1128

Всем привет, в общем сразу к делу, что имеем:

1. Запущены около 3-4 недель назад два разных сайта - разной тематики;

2. Сайты состоят из главной страницы - хорошо отрисованная, прописаны чёткие метатэги и прочее прочее;

3. Тематика сайтов 100% коммерция;

4. Сайты не относятся друг к другу ни в плане тематики - ни в плане размещенного хостинга (хост у всех разный - так же как и соответственно iP адрес);

5. Установил на каждую главную - Яметрику, подключил Явебмастер, так же и с Гуглом;

6. Неделю назад (прошло после загрузки на FTP главной страницы около 2-х недель на каждом сайте) - начал анализировать процесс индексации в Яндексе и Гугле;

7. Обратил внимание что главные все проиндексированы - НО!

8. По запросам которые заточены главные страницы этих 2-х сайтов - по самым микро НЧ запросам - на 1 месте стоит сайт-сборщик/парсер с дубликатом первого сайта по запросу - и второго сайта по запросу. 

Страницы генерируются автоматически я так понимаю и выводятся в отдельную категорию.

А так как этот сайт-парсер имеет ИКС 380 (проверил) - то соответственно все мои 2 сайта с главных страниц считаются дубликатами - этого сайта-парсера.

По запросам их нет в ТОП 100 Яндекса.

Но есть этот сайт-парсер и отдельной страницей - аля слепка главной на 1 месте по всем микро НЧ запросам.

Пока сам пытаюсь разобраться что это такое новенькое появилось - но судя по домену он был зарегистрирован буквально 2 месяца назад.

Есть подозрение что это какой-то бот пробегает по новым зарегистрированным доменам и автоматически создает страницы дубли - которые вытесняют официальные сайты. Так же в виде эксперимента загрузил 1 статью - то есть на одном сайте кроме главной ещё 1 статью добавил - подождал пару дней и она появилась в данном сайте-парсере...

То есть по сути - кто-то создал целый механизм-зеркало, который ворует и создает автоматически дубликаты новых страниц появляющихся в интернете, которые проиндексированные в том же Яндексе....

Вопрос к знатокам - что это такое? Пруфы чуть позже скину со всеми скринами - не буду сейчас палить и свои новые сайты и эту непонятную пока тему.

UPD. Забыл добавить - в Яндекс метрике за эту неделю было 7 переходов с органики, но данные доступны как переходы с этого сайта-сборщика, и ключевые слова не видны..

ლ⎝◣⎠‿⎛◢⎞┌つ┐ Часть №1. Как я заработал 1 243 118$ (обновлено 19.09.2023) за 6.2 года на скликивание без бана Google ADSense (всё так же работает в 2023 году) 👉 https://clck.ru/sQcrv 👈 Бесплатный пошаговый метод удаления сайта / страницы конкурента в Яндексе 👉 https://clck.ru/344wP7 👈 Реклама на 1 год за 350 руб: https://cuys.ru/banner.php?id=2 👈👉 Реклама на 3000 сайтах за 70 руб: https://cuys.ru/platnaya-reklama/
K
На сайте с 14.05.2022
Offline
11
#1
Cuys :
Есть подозрение что это какой-то бот пробегает по новым зарегистрированным доменам и автоматически создает страницы дубли - которые вытесняют официальные сайты. Так же в виде эксперимента загрузил 1 статью - то есть на одном сайте кроме главной ещё 1 статью добавил - подождал пару дней и она появилась в данном сайте-парсере...
Схеме с таким парсингом уже лет 10-15. Популярные сайты тоже клонируют, но в силу их траста клоны не вытесняют сайт из ПС
Cuys
На сайте с 05.12.2016
Offline
182
#2
Kupidonov #:
Схеме с таким парсингом уже лет 10-15. Популярные сайты тоже клонируют, но в силу их траста клоны не вытесняют сайт из ПС

Хз - честно вижу такую схему впервые, так как главная страница этого сервиса-зеркальщика имеет не хилую массу и наращивается автоматически ежесекундно (как так за 2 месяц кочнуть ИКС до значений 380 в полном автоматическом режиме - это нужно постараться). Кстати этот сервис-зеркальщик закрыт от всех систем анализаторов. Ни pr-cy / ни даже ahrefs нельзя проверить сколько в реальности проиндексировано страниц - кроме как только вручную ввести данных в том же Яндексе или Гугле. Что тоже наводит на мысли..

Да и страницы выполнены в формате отдельных URL - название которых идет точное название доменного имени + TITLE. То есть создается по единому шаблону формата <Название URL> + <Название компании> + <Title>

Возможно раньше какае-то схема была по этой части - но не настолько продуманной как сейчас, такой ещё вопрос как эти кто там создавал данный механизм зеркальщика умудрился получить доступ к базе новых зарегистрированных доменных имен? Ведь этой информации нет в открытом доступе? А значит где-то дырка с данными?

K6
На сайте с 28.02.2022
Offline
95
#3
Cuys #:

вижу такую схему впервые 

поздно Вы проснулись, в Яше давно  котируются от слова "кот" сайты-парсеры, которые рефератят несколько страниц с разных сайтов ручками или парсером и создают франкенштейновский лонгрид на 20 кило с оглавлением-навигацией и картинками с лого сворованных сайтов. Так создаются ценные с точки зрения яндексоидов страницы. Все они в РСЯ. Все законно - стоит текстовая ссылка на источник. Если подавать в суд - владелец внезапно окажется бомж или глубокий инвалид. 

У меня даже мои рекламные баннеры воруют. 

дешевые VIP VPS: https://clck.ru/324vy9
Cuys
На сайте с 05.12.2016
Offline
182
#4
katz666 #:

поздно Вы проснулись, в Яше давно  котируются от слова "кот" сайты-парсеры, которые рефератят несколько страниц с разных сайтов ручками или парсером и создают франкенштейновский лонгрид на 20 кило с оглавлением-навигацией и картинками с лого сворованных сайтов. Так создаются ценные с точки зрения яндексоидов страницы. Все они в РСЯ. Все законно - стоит текстовая ссылка на источник. Если подавать в суд - владелец внезапно окажется бомж или глубокий инвалид. 

У меня даже мои рекламные баннеры воруют. 

Вы путаете - я знаю что такое связка-завязка +100500 статей в одну через прогу и прочее.

Здесь же тупо зеркало которое индексируется и у которого есть данные к новым сайтам. Возможно только тестят технологию - но как за 2 месяца ИКС нарастить до 380 с посещалкой на не свои сайты. 

Тут другой формат - такого который ещё не встречал.  

p.s. В общем без пруфов так и будут все гадать на кофейной гуще. Придет время и скину все примеры...

МА
На сайте с 02.11.2018
Offline
161
#5
Cuys #:

но как за 2 месяца ИКС нарастить до 380 с посещалкой на не свои сайты...

Почему именно нарастить? Может перехваченный дроп.

Nokia x71 (https://x71.ru/) - хороший смартфон, и отзывы интересные
EN
На сайте с 05.12.2004
Offline
245
#6
Махмуд Аббас #:

Почему именно нарастить? Может перехваченный дроп.

Или купить сайт схожей тематики и постить на нем.
Доступные Бурж ссылки ( https://www.gofuckbiz.com/showthread.php?t=58214 )
grafoman
На сайте с 02.04.2010
Offline
127
#7
Дроп
neutomim30
На сайте с 10.06.2008
Offline
157
#8

Ну что значит "воруют"😀?

Ваше же на месте осталось? Ну вот, получается, копируют, а не воруют.

Romulez
На сайте с 24.03.2006
Offline
175
#9

парсят все подряд? хм, по описанию похоже на альтернативу archive.org 😎

B
На сайте с 22.07.2007
Offline
248
#10

Я сейчас в гугле все новые страницы засовываю вручную в вебмастер для индексации сразу после публикации.

+ два сайтмапа + перелинковка

Иначе твой контент скопируют и раньше засунут в гугл, целые отрасли на этом живут. И некоторые сайты годами пишут контент в никуда. Они не понимают, почему они три года пишут новости, а посещаемости нет.

Парсеры автоматические надо банить по мере выявления по IP. И отправлять жалобы на удаление контента в гугл.


Насчет яндекса сложнее, но есть способы и там. 

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий