Полная копия моего сайта

123 4
Д
На сайте с 01.04.2012
Offline
166
#11
SSL-Decision:
Дадуда, предложение через "IP и htaccess" и javascript - дал один и тот же человек.
А причина javascript кода - была ответом на решение через php.

P.S. Вы собираетесь вырезать именно ту часть, что относится к document.location?

Полностью что ему мешает может вырезать.

Думаю для начала структуру сайта поменять нужно, что-то добавить, что-то убрать и посмореть будет ли парсится у него. Если нет, то делать уже другие манипуляции, определяния IP и т.д.

PS. Сайт грузит очень менделенно, судя по всему даже проверок нет на том сайте никаких были ли изменения/новое что-то на сайте донора

SD
На сайте с 20.07.2014
Offline
4
#12

Дадуда,

Мне интересно как вы регуляркой будете вырезать все, что ему мешает?

По теме - пока автор не посмотрит access.log - не будет ясно, какие шаги предпринимать.

Нужно понимать - как уводят контент.

W
На сайте с 28.05.2011
Offline
54
#13

Вот чисто из любопытства... ТС, а подключение к БД сайта идет локально или удаленно? второй момент, может все же вы покажите, есть ли у вас в логах домен фишера?

SD
На сайте с 20.07.2014
Offline
4
#14

winstrool, даже если удаленно - изображения хранятся не в базе, поэтому парсер по сайту работает (в доступ по фтп не верится) и в логах это 99% есть.

W
На сайте с 28.05.2011
Offline
54
#15
SSL-Decision:
winstrool, даже если удаленно - изображения хранятся не в базе, поэтому парсер по сайту работает (в доступ по фтп не верится) и в логах это 99% есть.

Ну да, изображения хранятся не там))), а урлы к изображениям откуда берутся?

P.S: Все же бы хотелось увидеть ответ ТС!

R
На сайте с 28.05.2010
Offline
65
#16

В логах обнаружил подозрительный IP - 5.45.124.107

Line 632: 5.45.124.107 - - [20/Jul/2014:18:57:50 +0400] "GET /2014/01/ HTTP/1.1" 200 15978 "-" "Mozilla/5.0 (compatible; Linux x86_64; Mail.RU_Bot/2.0; +http://go.mail.ru/help/robots)"

Line 857: 5.45.124.107 - - [20/Jul/2014:18:58:15 +0400] "GET /java/web/336-ipb-3-forum-dlya-sajta.html HTTP/1.1" 200 14972 "-" "Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)"
Line 1671: 5.45.124.107 - - [20/Jul/2014:19:01:29 +0400] "GET /2013/09/ HTTP/1.1" 200 16028 "-" "Mozilla/5.0 (compatible; YandexBot/3.0; +http://yandex.com/bots)"
Line 1672: 5.45.124.107 - - [20/Jul/2014:19:01:32 +0400] "GET / HTTP/1.1" 200 16702 "-" "Mozilla/5.0 (compatible; YandexMetrika/2.0; +http://yandex.com/bots DEV)"
Line 2250: 5.45.124.107 - - [20/Jul/2014:19:04:52 +0400] "GET /lineage2/news/3470-ogranichenie-ajtemov-po-urovnyu.html HTTP/1.1" 200 16210 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:22.0) Gecko/20100101 Firefox/22.0"
Line 2285: 5.45.124.107 - - [20/Jul/2014:19:05:09 +0400] "GET /favicon.ico HTTP/1.1" 200 894 "http://kekedie.tistory.com/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)"
Line 3090: 5.45.124.107 - - [20/Jul/2014:19:09:11 +0400] "GET / HTTP/1.1" 200 16702 "https://www.google.ru/" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.153 Safari/537.36 OPR/22.0.1471.70"
Line 3092: 5.45.124.107 - - [20/Jul/2014:19:09:13 +0400] "GET /engine/classes/min/index.php?charset=windows-1251&g=general&12 HTTP/1.1" 200 63916 "http://music-create.ru/" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.153 Safari/537.36 OPR/22.0.1471.70"
Line 3093: 5.45.124.107 - - [20/Jul/2014:19:09:13 +0400] "GET /uploads/posts/2014-07/sample-tools-bry-cr2-melbourne-bounce.jpg HTTP/1.1" 200 53653 "http://music-create.ru/" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.153 Safari/537.36 OPR/22.0.1471.70"
Line 3094: 5.45.124.107 - - [20/Jul/2014:19:09:13 +0400] "GET /uploads/posts/2014-07/samplephonics-warped-beats.jpg HTTP/1.1" 200 46586 "http://music-create.ru/" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.153 Safari/537.36 OPR/22.0.1471.70"
Line 3095: 5.45.124.107 - - [20/Jul/2014:19:09:14 +0400] "GET /templates/Gemini/fonts/pfsquare-webfont.woff HTTP/1.1" 200 29176 "http://music-create.ru/" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.153 Safari/537.36 OPR/22.0.1471.70"
Line 3096: 5.45.124.107 - - [20/Jul/2014:19:09:14 +0400] "GET /uploads/posts/2014-07/equinox-sounds-midi-and-one-shots-classic-and-ambient-trance.jpg HTTP/1.1" 200 38655 "http://music-create.ru/" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.153 Safari/537.36 OPR/22.0.1471.70"
Line 3097: 5.45.124.107 - - [20/Jul/2014:19:09:14 +0400] "GET /uploads/posts/2014-07/output-uk-deep-house.jpg HTTP/1.1" 200 32713 "http://music-create.ru/" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.153 Safari/537.36 OPR/22.0.1471.70"

...........................

Запретил доступ к сайту данному IP. Теперь посмотрел, на том домене иллюстрируется сайт БУРАТИНА.нет

Всем спасибо за помощь!

W
На сайте с 28.05.2011
Offline
54
#17

Сори, может я видать, что то не понимаю, а что в нем подозрительного?

R
На сайте с 28.05.2010
Offline
65
#18
winstrool:
Сори, может я видать, что то не понимаю, а что в нем подозрительного?

Обычно в логах ссылки на файлы сайта, страницы, а здесь кроме этого ссылки на сторонние сайты, вот например:

/java/web/336-ipb-3-forum-dlya-sajta.html

/lineage2/news/3470-ogranichenie-ajtemov-po-urovnyu.html

и при чём очень часто с этого адреса заходили на сайт, за 2 дня более 4-х тысяч логов (с остальных 50-150)

SD
На сайте с 20.07.2014
Offline
4
#19

А вы читали вообще мое сообщение?

Я сразу сказал проверять на этот IP адрес вам, ибо это адрес зоны А сайта teplolidoma.ru. И они парсят прямо с него.

SSL-Decision:
По факту - жалуйтесь хостеру. И попробуйте посмотреть файлы логов вашего сервера на наличие запросов от роботов, которые копируют информацию. Конкретно попробуйте отследить запросы от ip адреса 5.45.124.107 и если они есть и их полно, то запретить данному IP доступ к сайту (.htaccess > Deny from 5.45.124.107) - это в качестве дополнительных мер.
БОЧ рВФ 260602
На сайте с 27.01.2010
Offline
202
#20

А собственно с какой целью "клонируют" таким образом сайты?

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий