- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Господа, будет ли рабочий следующий вариант защиты:
1. Ставим в настройках Гугла и Яндекса скорость сканирования сайта, если быстрее - 1-й звоночек
2. Ставим невидимую ссылку на всех страницах и запрещаем ее в роботс.тхт - если кто-то перешел по ней - второй звоночек.
3. Если первые два условия выполнены можно либо сразу бан по IP либо + проверка по whois, ежели не Поисковик - бан навсегда.
Прошу мастеров парсинга высказаться, сложно ли обойти такую защиту?
Ну я не мастер пока, "я пока только учусь" ;), но постараюсь ответить/обосновать.
"скорость сканирования сайта, если быстрее - 1-й звоночек" - неплохо
"невидимую ссылку на всех страницах" - смотря какая ссылка, и как грабить сайт. Я, к примеру, "пауков" практически не пишу, если парсю, то именно те ссылки по которым мне нужна инфа. Хотя могу заглянуть и по скрытой ссылке, но не факт.
"бан по IP + проверка по whois" - возможно нубский ответ, но разве все это не измениться при применении проксей?
В целом, как раз планирую заняться проксями так что после этого стану более компетентным. Но по крайней мере, если прокся действительно анонимная, как в таком случае распознать - 100 страниц в минуту открыто с одного компа или со 100 разных ?
При парсинге использую ТОР, так что такие решения не помогут. Подумаю как защититься, и тогда отпишусь.
Видел когда-то прикольную защиту. Там на каждой странице была невидимая картинка 1*1. Браузер честного юзверя её тащил, а тупые боты же не тащат. На основании этого айпишники ботов быстро улетали в бан на пару суток. Можно то же самое прикрепить к джаваскриптам. Конечно, при таком подходе будут страдать люди, у которых отключены картинки/джавоскрипты, но таких довольно мало. Но если кто-то уж целенаправленно взялся сграбить ваш сайтик - то этого не избежать.
Проблема по клиенту не решаема?
Если клиент не гугль и не яндекс (а они подписываются) и запросов много, то IP заносится в базу...
если клиент не понятный, то банится... можно по большому счету и сразу, но не всегда надо...
Можно легко имитировать подпись Яндекса и Гугла
сейчас это уже не проблема, яндекс научился распознавать первоисточник!
сейчас это уже не проблема, яндекс научился распознавать первоисточник!
Нифига он не научился еще толком.
сейчас это уже не проблема, яндекс научился распознавать первоисточник!
О! новость, гы-гы
как неумел так и не умеет, это пока нереально
А вообще захотят спарсить, так спарсят, ни чего не спасет