- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
macrobo: Вы воспользовались предоставленной Владиславом возможностью убедиться в том что SCAN не предоставляет доступ своим пользователям к публикациям, загруженным без подписания договора? СКАН в данном случае ничем не отличается от Yandex и Google, предоставляя только поиск без доступа к полным текстам публикаций. Полный текст публикаций доступен только из тех источников, с которыми у Интерфакс заключены соответствующие договора.
EvM, яндекс и гугл понимают и выполняют рекомендации в роботс, а эта ерунда даже юзер агента не имеет. + от яндекса и гугла есть траф.
То что бот никак не представляется - это была наша техническая недоработка.
Теперь бот в User-Agent будет отдавать: "Mozilla/5.0 (compatible; InterfaxScanBot/1.0; http://scan-interfax.ru)" (обновление планируется сегодня вечером)
В будущих релизах сервиса бот будет обращать внимание на robots.txt и считывать оттуда стандартные правила для поисковиков, например, частоту обращений к серверу, чтобы его не грузить.
О том как заблокировать нежелательных ботов можно почитать тут: http://www.thesitewizard.com/apache/block-bots-with-htaccess.shtml
Например, вот такая конструкция в .htaccess подойдет (не проверял):
Еще раз просим прощения, кому наш робот доставил какие-то неудобства.
EvM,вы чей клон?
Отличается. Он НЕ Яндекс и он НЕ Гугл.
Интересно, а юридически чем этот "интерфакс" отличается от яндекса и гугла? Как вытекает из ГК-4, ничем. Все трое нарушают законы в промышленных масштабах, и зарабатывают на этом. Просто от гугла и яши мы имеем траф, потому и закрываем глаза на их граббинг, который именуем словом "индексация" :)
Тот самый случай, когда законы сильно отстали от реалий сегодняшнего дня и современных технологий.
Интересно, а юридически чем этот "интерфакс" отличается от яндекса и гугла? Как вытекает из ГК-4, ничем. Все трое нарушают законы в промышленных масштабах, и зарабатывают на этом. Просто от гугла и яши мы имеем траф, потому и закрываем глаза на их граббинг, который именуем словом "индексация" :)
Тот самый случай, когда законы сильно отстали от реалий сегодняшнего дня и современных технологий.
Я могу приказать яндексу или гуглу не индексировать мой сайт. Этому чуду не возможно было пока не появился этот топик. Так же мы ещё не знаем, как это будет в реальности.
Еще раз просим прощения, кому наш робот доставил какие-то неудобства.
Какой процент Вы отчисляете за использование материалов?
Готовы Вы компенсировать мне за использование моих?
Нашлись-таки ip адреса этих любителей жить за чужой счёт:
На данный момент я отправил в бан 46.28.16.248, 46.28.16.249
Но для пущей убедительности, можно обе подсети дропнуть.
Для интересующихся. Я спросил двух администраторов, которые обслуживают сервера нескольких новостных порталов, и они тоже подтвердили, что без какого-либо договора или предупреждения, бот интерфакса полностью высасывает их контент. Вначале ломится на рсс ленту, потом идет по всем новым ссылкам. Бот не имеет user-agent’а.
P.S. Лучше использовать определение не «новость», а «статья» или «материал», так будет меньше путаницы.
Господа, вновь поднимаю тему))
К нам бот ходит с 46.28.16.247
Соответственно, блокировка по IP не гарантирует, что он не начнет ходить потом и с других айпишников.
Поделитесь, кто как решил вопрос?
Господа, вновь поднимаю тему))
К нам бот ходит с 46.28.16.247
Соответственно, блокировка по IP не гарантирует, что он не начнет ходить потом и с других айпишников.
Поделитесь, кто как решил вопрос?
Выдать банан на диапазон.
Отличается. Он НЕ Яндекс и он НЕ Гугл.
На самом деле вопрос серьезный. Мне, честно говоря, по барабану сабжевый новостной поисковик. Но если он действительно занимается лишь поиском, как Гуггл и Яндекс, то встает вопрос о правомерности вообще любых поисковых систем.
Поясните пожалуйста в чем заключается правовая претензия? Именно правовая, не техническая.
Аналогичный наезд на Гугл, помню, был в Европе (в Голландии вроде). Тамошние СМИ наехали на Гугловский новостной сервис (где публиковались анонсы новостей). Местный суд пошел на встречу новостным агенствам и запретил Гуглу использовать инфу с их сайтов. Гугл буквально исполнил решение суда и выкинул все эти СМИ не только из новостного сервиса, но и и из основного индекса. Далее был вопль великий, обвинение Гугла в мести и пр... опять побежали в суд...
В итоге я так и не понял, насколько правомерно работают поисковые системы. Логика: "Что положено Юпитеру, не положено быку" меня не убеждает.