Можно ли определить кто запрашивает фаил/скрипт: поисковый робот или посетитель!?

12 3
W
На сайте с 06.07.2003
Offline
14
1689

см сабж.

wolf
На сайте с 13.03.2001
Offline
1183
#1
Можно ли определить кто запрашивает фаил/скрипт: поисковый робот или посетитель!?

Анализируйте логи

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
W
На сайте с 06.07.2003
Offline
14
#2

Не. не вообще, а при выполнении скажем скрипта. Я тут в форме порыл примерно выяснил: user_agent и ip. Ток теперь другой вопрос: вот народ пишет что посиковики под браузеры маскируются и.т.д. А как же тогда robots.txt? Ведь там правила для определнный user_agent'ов пишутся! А если поисковик передал что он браузер то как дальше?

[Удален]
#3
Как писал wDevil
Не. не вообще, а при выполнении скажем скрипта. Я тут в форме порыл примерно выяснил: user_agent и ip. Ток теперь другой вопрос: вот народ пишет что посиковики под браузеры маскируются и.т.д. А как же тогда robots.txt? Ведь там правила для определнный user_agent'ов пишутся! А если поисковик передал что он браузер то как дальше?

Сам то понял, что спросил ? ;)

K
На сайте с 31.01.2001
Offline
737
#4

wDevil, почитайте статьи и раздел форума про клоакинг. Это как раз оно. Кроме User-Agent есть IP-адрес. Имея базу данных IP-адресов роботов можно с большей вероятностью определить, кто пришел. Можно привлекать и косвенные сведения, например заход на документы, закрытые через robots.txt.

Собираетесь показывать людям одно, а роботам - другое? Будьте осторожны!

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
W
На сайте с 06.07.2003
Offline
14
#5

Вообщем система такая: есть правило мод реврайт, оно все ссылки на сайте вида: www.example.ru/trace.php?html=index.html переделывает в

www.example.ru/index.html. При етом фаил index.html существует. Просто он сначала обрабатывается скриптом а потом отдается посетителю. Т.е если отсеивать посетительей по user_agent таким образом: если робот, то отправлять без мод реврайта на Index.html если человек, то выдавть обработанную страницу скрптом. И в том и в этом случае ссылка одна и таже:www.example.ru/index.html, разное ток содержание, т.е одна оптимизирована другая нет. Дело в том что я не совсем понимаю механизм того как паук заходит на сайт, то ли он сразу заходит с user_agent=имя поисковика, потом по каким то причинам или для пробы под браузером, то ли сразу под браузер маскируется.

[Удален]
#6
Как писал wDevil
И в том и в этом случае ссылка одна и таже:www.example.ru/index.html, разное ток содержание, т.е одна оптимизирована другая нет.

А давайте введем новый раздел: "Спаммерам посвящается" :)

V1
На сайте с 07.07.2002
Offline
119
#7
Дело в том что я не совсем понимаю механизм того как паук заходит на сайт, то ли он сразу заходит с user_agent=имя поисковика, потом по каким то причинам или для пробы под браузером, то ли сразу под браузер маскируется.

Бред. Что ему - делать нечего, только на Ваш сайт под разными user_agentами заходить 😂

Шпарил парень, парил парик (скороговорка)
W
На сайте с 06.07.2003
Offline
14
#8

Miha Kuzmin, а при чем здесь спам?

[Удален]
#9
Как писал wDevil
Miha Kuzmin, а при чем здесь спам?

Дословно:


И в том и в этом случае ссылка одна и таже:www.example.ru/index.html, разное ток содержание, т.е одна оптимизирована другая нет

А что это по вашему ? :)

euhenio
На сайте с 21.09.2001
Offline
357
#10
Можно ли определить кто запрашивает фаил/скрипт: поисковый робот или посетитель

-только если этого захочет владелец скрипта. В общем случае нет.

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий