- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи
И выявили более 7 млн подозрительных пользователей
Оксана Мамчуева
Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы
Для интернет-магазина инженерных систем
Мария Лосева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Здравствуйте.
Справедливо ли утверждение, что роботы Яндекса всегда представляются именами типа:
Yandex/1.03.000 (compatible; Win16; I),
Yandex/1.01.001 (compatible; Win16; H),
Yandex/1.03.000 (compatible; Win16; M)
Yandex/2.01.000 (compatible; Win16; Dyatel; C) и тому подобное ?
То есть всегда ли строка "user agent" содержит в себе подстроку "Yandex"? Или у вас есть сведения, что роботы Яндекса могут шифроваться и отдавать какую-нибудь другую, безобидную строку типа Mozilla ?
Ruslay, интересно, с чего бы это роботам представляться чужими именами? И как это технически реализовать?
Или у вас есть сведения, что роботы Яндекса могут шифроваться
Конечно, таких сведений нет
Ruslay, интересно, с чего бы это роботам представляться чужими именами? И как это технически реализовать?
Конечно, таких сведений нет
Просто насколько я понимаю, значение переменной user agent формируется со стороны клиента (робота, браузера) и, в общем-то, может быть каким угодно (как заложит программер). Я собираю в кучу всех юзер агентов, заходящих на мой сайт, и иногда там появляются всякие прикольные строки типа "Hi, It's me, WebCat, I'm cheking my links".
Видимо, программер сам решает что ему передать в качестве user agent. Иногда эта строка бывает пустой.
Конечно, оффициально Яндекс представляется вышеупомянутыми именами, но, кто знает, может, он иногда заходит на сайты ингокнито. Вот об этом и хотел узнать.
Ruslay, не заходит инкогнито
Пробегал где-то в интернете слух, что Яndex ходит иногда под другими именами - дабы определить дорвеев.
Видимо, программер сам решает что ему передать в качестве user agent
А теперь представьте себе программиста Яндекса, который вместо того, чтобы делом заниматься, пишет алгоритм отправки нестандартных user-agent некоторым сайтам... С заимствованием текста, скажем, из яндекс-весны... Вам кажется, я брежу? Мне тоже :)
А теперь представьте себе программиста Яндекса, который вместо того, чтобы делом заниматься, пишет алгоритм отправки нестандартных user-agent некоторым сайтам...
Да запросто... Технических сложностей абсолютно никаких нет. Ну и вспомним еще про "ХитроРобот"...
Технических сложностей абсолютно никаких нет
Конечно нет. Но зачем?
Ну и вспомним еще про "ХитроРобот"
Это что за зверь? В соответствующей теме как-то ответа не показали ещё...
А теперь представьте себе программиста Яндекса, который вместо того, чтобы делом заниматься, пишет алгоритм отправки нестандартных user-agent некоторым сайтам... С заимствованием текста, скажем, из яндекс-весны... Вам кажется, я брежу? Мне тоже :)
Писать алгоритмы тут и не нужно, достаточно один раз прописать строку, соответствующую любому поп-браузеру и далее гонять робота под этим ником. И тогда просто так и не узнаешь, что за этим безобидным клиентом скрывался Яндекс. Это можно использовать, чтобы вычислять те сайты, которые отдают разный контент для простых посетителей и для роботов. Я бы на месте Яндекса так и делал, а то слишком просто подсунуть ему правильные странички.
Во-первых, кроме юзер-агента есть еще ip. Во-вторых, очень хорошо что вы не на месте яндекса. В-третьих, уже была такая тема, где подробно разьяснили, почему нельзя таким образом найти клоакинг.
Я бы на месте Яндекса так и делал
флаг в руки
http://company.yandex.ru/inside/job/index.xml