Просто у господина Гаттарова ГСы под Пингвина попали, и он как добропорядочный гражданин решил гайки прикрутить Гуглу. Я за обеими руками!!!
ГСы на месте, один СДЛ тематика туризм капитально просел.
Ну наконец-то здравые мысли. Спасибо комрады, архив это интересно.---------- Добавлено 12.07.2013 в 08:41 ----------P.S. хостеру писать смысла нет, ведь все цены - это открытая информация от отелей, с юридической точки зрения нельзя потребовать удалить информацию, которая тебе не принадлежит, были бы это тексты, а не циферки и даты.
Была похожая борода, 2 сайта одновременно не выпадали по одному запросу. Первый сайт - сайт гостиницы, второй сайт - сайт туркомпании, одна из страниц посвящена была это самой гостинце. Вышел из под фильтра за месяц: 1. сменил контактные данные 2. владельца сайта и ip. 3. на сайте туркомпании изменили описание по гостинице. Сейчас выпадают оба сайта в пределах 10-ки.
Надо было назвать тему "Постарайтесь дать самый дебильный ответ не соответствующий вопросу". Я так понимаю из предметной области вы только с парсингом знакомы. Напоминает анекдот "если бы у рыбы была шесть, то там бы жили блохи". Сидеть и отлавливать ip это глупое занятие, а вопрос был к оптимизаторам, наверняка есть люди которые сталкивались с подобной ситуацией и решали ее не методом замены русских букв на "сказочно английские", а другими более реальными способами.
Я думал, что кто, возможно знает как бороться с ворами. Кроме того, ответы скорее из области фантастических рассуждений и к предметной области не имеют отношения, ведь даже когда я сказал, что сайт не парсят а тупо копируют, все рано получил несколько действенных советов по борьбе с парсерами.---------- Добавлено 11.07.2013 в 16:37 ----------Ведь суть проблемы не в том, что бы закрыть сайт от парсера, что в принципе не возможно (можно поменять Ip, vnp туннели и еще куча всего). А как заставить яндекс считать меня первоисточником. С гуглом проблем нет, сайт хапнул фильтр и лежит за 3ей сотней.
Я так понимаю меня никто не слушает и слушать не собирается. Тот безрукий тюлень который тырит контент не может даже ссылки убрать, не говоря уже о парсинге и тому подобный вещах. Интересует позиция яндекса, почему ГС на шаблоне с ворованным контентом с 9 месячной историей ранжируется выше 5 летнего СДЛа.
В день 5000 посетителей. 30% постоянные посетители - партнеры. Копируют тупо ctrl+c ctrl+v, а затем ctrl+a и ctrl+f заменить "Эльдорадо.ru" на "siteгавно.ru", поэтому на сайте siteгавно.ru 5000 ссылок которые ведут на 404 ошибку. ip домена 100% не соответствует ip вора, т.к. сайт находится на стороннем хостинге. Сам прайс в 3 вариантах .php xml и pdf.
Допустим есть сайт Эльдорадо.ru, там 5000 наименований товара, в том числе допустим 500 телевизоров самсунг. Каждый день 2 чела обновляют цены, добавляют товары, описание и все такое. И в один прекрасный некий siteгавно.ru начинает копировать прайс-лист Эльдорадо.ru и по запросу "монитор самсунг цена" выпадает сворованным прайсом выше сайта Эльдорадо.ru. Вот как вы себе представляете установить сказочные цены? 5000 товаров перебрать что б потом обратно все вернуть, когда вору нужно всего лишь ctrl+c ctrl+v. Кроме того, как потом клиентам объяснять что на сайте "сказка" завеслась. Или заменить все на на английский, что это даст? Яндекс сразу решит мы первоисточник?
Я так понимаю всем ТЗ сложно почитать. Сайт туристической компании, там 500 гостиниц. Никому не интересны копеешная продажа ссылок когда можно продать туда путевку, поэтому и бесит ситуация когда по запросу: "Гостиница Пупкинго цена" выпадает сайт вора с нашим прайс-листом, который даже украсть не может нормально.