Почему??? И что делать???

123
R
На сайте с 21.12.2010
Offline
138
#11
zhitov:
Это легко делается регулярными выражениями в скрипте.
С xml брать ваш прайс автоматом - это еще и очень удобно вору.

P.S. Вы, видимо не знакомы близко с парсерами. Я и пытаюсь Вам помочь :)

Сделайте так:
1. Определите ip сайта вора здесь.
2. Посмотрите логи сервера на предмет этого ip. Если найдете совпадения - 100% парсер вора установлен у него же на сайте.

Хорошие советы, но к сожалению более-менее серьезный подход к парсингу подразумевает наличие не одного десятка прокси. Вариант десктопной программы почему не рассматриваете?

Лучший хостинг для MODX Все просто ЛЕТАЕТ! (https://modhost.pro/?msfrom=bd6e3e1124cb4cdd93779563b690f3fe)
H
На сайте с 18.01.2013
Offline
18
#12

Я так понимаю меня никто не слушает и слушать не собирается. Тот безрукий тюлень который тырит контент не может даже ссылки убрать, не говоря уже о парсинге и тому подобный вещах. Интересует позиция яндекса, почему ГС на шаблоне с ворованным контентом с 9 месячной историей ранжируется выше 5 летнего СДЛа.

Dreammaker
На сайте с 20.04.2006
Offline
569
#13

Hecatonchires, раз вы все так хорошо знаете и ваш не нужны советы с форума, зачем вы тогда просите их?

H
На сайте с 18.01.2013
Offline
18
#14

Я думал, что кто, возможно знает как бороться с ворами. Кроме того, ответы скорее из области фантастических рассуждений и к предметной области не имеют отношения, ведь даже когда я сказал, что сайт не парсят а тупо копируют, все рано получил несколько действенных советов по борьбе с парсерами.

---------- Добавлено 11.07.2013 в 16:37 ----------

Ведь суть проблемы не в том, что бы закрыть сайт от парсера, что в принципе не возможно (можно поменять Ip, vnp туннели и еще куча всего). А как заставить яндекс считать меня первоисточником. С гуглом проблем нет, сайт хапнул фильтр и лежит за 3ей сотней.

zhitov
На сайте с 30.01.2005
Offline
219
#15

Hecatonchires, так Вам шашечки, а не ехать?

Надо было тему называть тогда просто Почему???

Строительные калькуляторы ( https://www.zhitov.com/ )
H
На сайте с 18.01.2013
Offline
18
#16

Надо было назвать тему "Постарайтесь дать самый дебильный ответ не соответствующий вопросу". Я так понимаю из предметной области вы только с парсингом знакомы. Напоминает анекдот "если бы у рыбы была шесть, то там бы жили блохи". Сидеть и отлавливать ip это глупое занятие, а вопрос был к оптимизаторам, наверняка есть люди которые сталкивались с подобной ситуацией и решали ее не методом замены русских букв на "сказочно английские", а другими более реальными способами.

G5
На сайте с 07.03.2008
Offline
122
#17

если сайт молодой, то может попробовать прогнать его по миллиону всяких порнушных форумов, сайтов с какими-нибудь турецкими пахабными анкорами?

Может, конечно, он от этого только выиграет, но стоит подумать.

P.S. А его хостеру вы не писали о нарушении авторских прав?

---------- Добавлено 11.07.2013 в 23:10 ----------

P.P.S. кстати, ваш прайс не подходит под яндекс острова? может хотя бы ради этого яндекс наконец-то поставит вас повыше?

Bodgo
На сайте с 30.11.2005
Offline
153
#18

Как составляется прайс? ручками с обновлением "отелей, цен, дат" - т.е на одной странице имеем обновления контента постоянно.

Похоже что "угнанный" прайс уже отличается от того что у Вас. Из-за этого яндекс "не фильтрует по плагиату".

Подумайте над тем что бы при существенном обновлении прайса хранить на сайте архив за прошлые даты.

ВЕБШТЕЙН
H
На сайте с 18.01.2013
Offline
18
#19

Ну наконец-то здравые мысли. Спасибо комрады, архив это интересно.

---------- Добавлено 12.07.2013 в 08:41 ----------

P.S. хостеру писать смысла нет, ведь все цены - это открытая информация от отелей, с юридической точки зрения нельзя потребовать удалить информацию, которая тебе не принадлежит, были бы это тексты, а не циферки и даты.

SmileP
На сайте с 18.02.2010
Offline
386
#20
Hecatonchires:
тырит контент не может даже ссылки убрат

Заходит скрипт, жрет весь html, заливает на сайт. Чем не парсинг?

Hecatonchires:
Напоминает анекдот

Вот именно, но только роли у действующих лиц иные.

Как вариант- прописать абсолютные ссылки, а не относительные, тогда с того сайта будут ссылки на внутряк Вашего сайта.

Hecatonchires:
как заставить яндекс считать меня первоисточником

Как ранжироватся выше копии.

Поищите тему- защита контента по методу Бурундука. Формулировка примерная.

На этом форуме где-то была тема.

Hecatonchires:
Ведь суть проблемы не в том, что бы закрыть сайт от парсера

Закроете доступ к копированию- не будет копии, яндекс сам копий не создает, проблема отпадет.

Да, есть вариант, что не удастся заблочить копипастера.

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий