- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
НетуШ. Сюда выложите список всех IP ваших ботов.
Инфраструктура постоянно масштабируется и даже если мы предоставим текущий пулл IP адресов - это не даст гарантий что завтра робот не начнет ходить с другого адреса.
p.s. Если вы не можете выкладывать адреса своих сайтов в паблик - вы всегда можете прислать мне их на vladislav.komissarov@interfax.ru
useragent вашего бота тоже меняется? Он хоть как-то себя помечает или прикидывается обычным пользователем?
---------- Добавлено 29.11.2013 в 17:28 ----------
Я лично не собираюсь каждому кто парсит у меня новости, писать письма. Заняться мне больше нечем.
Белые боты всегда ходят под своими именами. Если бот шифруется юзером - это вредоносный бот.
Это не так. Ваш бот на протяжении длительного времени воровал контент с сайта нашего информ.агенства (как было указано, мне известны еще два ресурса, с которых до недавнего времени также шло выкачивание статей). Никто и никаких договоров не присылал и не спрашивал разрешения.
Опять ваши слова не согласуются с действительностью. У меня имеется текст договора, который вы предлагаете к заключению. Вот выдержки из него:
предоставляет ЗАО «Интерфакс» (далее «Интерфакс») следующие права по использованию Издания в рамках своей деятельности
- неисключительное право на включение Издания и его частей, в ИБД «СКАН»
- неисключительное право на сообщение, распространение и использование Издания или его частей посредством базы данных «СКАН» с обязательной ссылкой на Издание и его Правообладателя;
- размещать в составе базы данных «СКАН» Издания и его части в том виде, в котором они опубликованы на сайте Правообладателя;
2. Предоставление указанных прав и Издания осуществляется на безвозмездной основе.
Начнем с того, что в вашем договоре нет и слова про «источник получает партнерские отчисление». Вы хотите получать контент (не часть, а именно полный текст, согласно пунктам договора «на включение Издания и его частей») на безвозмездной основе, при этом получая выгоду с продажи платного доступа к базе.
Это ваша документация. В ней четко указано на то, что вы агрегируете и предоставляете полный текст статей. К тому же, вы сами подтвердили, что «После заключения договора наши клиенты получают полный текст публикации».
В большинстве случаев, вы не утруждаете себя «заключением» договора, а проста начинаете брать объекты авторского права.
Благодарю за отзывчивость… Проще заблокировать все ваши подсети.
И почему это только сейчас вы начали говорить о законности? На протяжении длительного времени вы не стеснялись нарушать закон.
Вот именно. Как было указано, бот интерфакса не имеет какого-либо описания, не имеет user-agent и, соответственно, не читает robots.txt. Т.е. все сделано так, чтобы любому системному администратору было сложно выследить и заблокировать его. Благо есть люди, которые дотошно анализируют логии серверов и выявляют подобных вредителей.
Ну, придется вычислять все адреса вашего бота (скрывающего свое существование) и блокировать их.
P.S. Цель данной темы не поиск ответственных или виновных за данное положение вещей. Цель: предупредить держателей любых новостных ресурсов (блогов тоже) и найти наиболее оптимальный вариант пресечения подобной деятельности.
macrobo, а почему Вы думаете, что с ip "Plusinfo Isp" тоже работает сканирующий бот?
Разве я указываю где-либо на это? Мной был приведен список ip адресов, принадлежащих или используемых сервисами интерфакса.
Бот скан-интерфакса работает с ip 46.28.16.248-46.28.16.249. Но, как указал уважаемый Владислав, совсем не обязательно, что робот и впредь будет иметь данный адрес.
принадлежащих или используемых
Дело в том, что не все эти ip принадлежат Интерфаксу - соответственно, и использование под вопросом.
Спасибо, учтём. Было бы хорошо составить полный список ip, с которых может ходить их бот
Как заактивничали-то :) Небось предчувствие массовых негодований, которые гипотетически могут превратиться в иски.
Было бы хорошо составить полный список
В этом и проблема. При отсутствии юзер-агента бот может ходить с, теоретически, любых сетей, и тогда даже полнотекстовый скан адресного пространства по ключу "interfax" мало что даст.
В этом случае остаются только общие методы защиты от парсинга (таймауты на запросы, динамическая вёрстка с переименованием тегов и полей, переход по контрольным ссылкам, видимым только для ботов, скриптовые методы и пр.).