- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Хочу в лог файле Apache найти запросы от поисковых роботов.
Предполагаю, что у поисковых роботов что то написано в поле User-agent, запроса HTTP.
По этому полю User-agent предполагаю идентифицировать запросы от поисковых роботов.
Вопросы.
1. Что передают в поле User-agent наиболее известные поисковики?
2. Бывает ли что роботы поисковиков маскируются под пользователей и в поле User-agent передают что то типа "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1;"
Интересуют наиболее известные поискови: Яндекс, рамблер, гугл и т.д.
Accoona Accoona-AI-Agent/1.1.2 (aicrawler at accoonabot dot com)
Alexa ia_archiver
antabot (private) antabot(http://www.anta.net/spider/)/1.0
Ask.com/Teoma Mozilla/2.0 (compatible; Ask Jeeves/Teoma)
Baidu Spider Baiduspider (+http://www.baidu.com/search/spider.htm)
cURL на Mac OS X для PowerPC (public) curl/7.13.1 (powerpc-apple-darwin8.0) libcurl/7.13.1 OpenSSL/0.9.7b zlib/1.2.2
EltaIndexer EltaIndexer
Feedfetcher-Google (Feedfetcher-Google) Feedfetcher-Google; (+http://www.google.com/feedfetcher.html; X subscribers; feed-id=XXXXXXXXXXXXXXXXXXXX)
GameSpy HTTP (GameSpy) GameSpyHTTP/1.0
Gigabot (Gigablast) Gigabot/2.0
Googlebot (Google) Googlebot/2.1 (+http://www.google.com/bot.html)
Googlebot alternate Mozilla/5.0 (compatible; googlebot/2.1; +http://www.google.com/bot.html)
Googlebot-Image (Google) Googlebot-Image/1.0
Google Search Appliance (Google) gsa-crawler
Grub (usage: public) (owner: LookSmart) Mozilla/4.0 (compatible; grub-client-1.4.3; Crawl your own stuff with http://grub.org) Mozilla/4.0 (compatible; grub-client-2.3)
Gulper Web Bot Gulper Web Bot/0.2.4 (www.ecsl.cs.sunysb.edu/~maxim/cgi-bin/Link/GulperBot)
Inktomi Slurp
(superseded by Yahoo! Slurp) Mozilla/3.0 (Slurp/si; slurp@inktomi.com; http://www.inktomi.com/slurp.html)
Mihalism Bot MihalismBot/1.1 (+http://www.mihalism.com/)
Msnbot
(Microsoft’s MSN Search) Msnbot/1.0 (+http://search.msn.com/msnbot.htm)
OmniExplorer_Bot
(Feeds Vast.com) OmniExplorer_Bot/6.70 (+http://www.omni-explorer.com) WorldIndexer
PageBull Pagebull http://www.pagebull.com/
Scooter (AltaVista) Scooter-3.2.EX
W3C Validator W3C_Validator/1.432.2.22
W3C CSS Validator Jigsaw/2.2.5 W3C_CSS_Validator_JFouffa/2.0
WebAlta Crawler WebAlta Crawler/1.3.25 (http://www.webalta.net/ru/about_webmaster.html) (Windows; U; Windows NT 5.1; ru-RU)
wget
(public) Wget/1.9
YahooFeedSeeker YahooFeedSeeker/2.0 (compatible; Mozilla 4.0; MSIE 5.5; http://publisher.yahoo.com/rssguide; users X; views X)
Yahoo! Slurp
(Yahoo!) Mozilla/5.0 (compatible; Yahoo! Slurp;http://help.yahoo.com/help/us/ysearch/slurp)
Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)
Yahoo!-MMCrawler
(Yahoo!) Yahoo!-MMCrawler/3.x (mms dash mmcrawler dash support at yahoo dash inc dot com)
YandexBlog YandexBlog/0.99.101 (compatible; DOS3.30; Mozilla/5.0; B; robot) X readers
YandexSomething YandexSomething/1.0
Yandex Yandex/1.01.001 (compatible; Win16; I)
рамблера забыли
StackRambler/2.0 (MSIE incompatible)
обновляемый список агентов для browscap.ini
http://browsers.garykeith.com/downloads.asp